火山引擎-你的AI云

智能媒体处理，打造视频处理一站式服务

一站式汇聚各类视频相关 AI 技术的开放生态平台，支持 API 或 SDK 接入前沿视频 AI 能力，助力企业提效。

智能媒体处理

打造视频处理一站式服务

AI 应用

AI 工具箱

一键实现字幕、配音、人物口型翻译，让视频内容轻松跨国传播。

#精准翻译

#多角色声音复刻

#自然虚拟口型

智能提取短剧正片里最精彩的高光片段，一键批量生成爆款高光视频。

#精准提取高光内容

#规模化生产

无痕擦除视频中的字幕等文本,适用于短剧出海、视频翻译、视频二创等业务场景。

#无痕擦除字幕

#低漏擦率

AI智能捕捉"高光时刻"并生成精彩混剪，让直播内容"秒变"爆款素材。

#"抖音同款"最佳实践

#多模态精准识别

#高光内容打标

结合豆包大模型，为直播合规场景提供全流程质检工具。

#智能大模型审核

#灵活配置业务规则

#支持高并发

将直播实时转换成各种语言播放，从语言不通到"全球通"。

#直播同传

#全球语言

#逼真口型

带有 AI 插件 UI 的点直播播放器。

#AI播放器

通过创意流配置，实现生成图等功能，为电商平台、垂直品牌厂商及电商平台工具提供专业级商品创作能力。

#抖音商城同款

#智能生成商品图

#大模型生图能力（智能场景图）

#前处理能力（画质增强）

一句话处理和剪辑视频，轻松驾驭视频处理全流程，让视频智能处理更简单更高效。

#自然语言交互

#调用多种AI工具

视频处理

剧情故事线分析API

智能解析影视剧剧情，提取故事线，生成标题、描述等信息，服务于搜索、推荐等场景。

申请体验

API 接入

场景切分API

智能识别视频场景变化，自动进行场景切分，为视频编辑和内容分析提供基础。

申请体验

API 接入

人声背景音分离API

将视频的音频分离输出为人声和背景音两个音频。

申请体验

API 接入

OCR 提取字幕API

精准识别视频中的压制字幕内容，自动提取并生成字幕文件。

申请体验

API 接入

场景式画质增强

针对不同场景自适应画质增强，提升视频清晰度和观看体验。

申请体验

介绍文档

大模型视频分段摘要API

利用大语言模型能力，智能生成视频分段摘要，快速了解视频内容。

立即使用

API 接入

超轻数字人

只需要一段20秒说话视频和文案，「轻」松批量生成数字人口播视频。

立即使用

大模型视频理解

基于多模态大模型的视频内容深度理解，支持场景识别、物体检测等能力。

立即使用

介绍文档

图片处理

AIGC大模型超分辨率

在保障原图一致性的基础上，精准补全丢失细节、可去噪去伪影，同时增强纹理与清晰度

立即使用

ImageX-豆包AIGC生图

借助豆包智能生图与veImageX的处理、压缩、存储、分发功能，构建便捷高效的图片解决方案

立即使用

智能裁剪

含人脸、贴边两种识别模型，自动定位并保留画面最佳区域，精准适配所需尺寸和场景

立即使用

智能背景移除

保留图像主体、抠除复杂背景生成透明底图；提供多类处理模型，高效降本

立即使用

AIGC智能图像扩展

支持原图上下左右四向扩展，算法自动补充相似内容，确保结果贴合原图纹理与内容

立即使用

画质增强

针对颜色失真、模糊与压缩损伤，智能补全与重塑细节，输出高清结果

立即使用

文字识别 OCR

将图中文字转为可编辑文本，支持各种场景识别需求，提供文字框坐标及中英文内容，替代人工

立即使用

图像修复

一键擦除指定内容（图标、字幕等），AI自动补全背景，精准选区，修复无痕

立即使用

画质评估

模拟人眼视觉，从美学、噪声、纹理、色调等多维度定义图像质量，输出客观评分

立即使用

智能审核

为图/音/视频提供一站式智能审核，全面扫描十余类违规内容，实现高效风险封堵

立即使用

实时对话式 AI ，让人机交互更流畅、更自然、更具真人感

实时对话式 AI

让人机交互更流畅、更自然、更具真人感

智能硬件

AI 教育

情感陪伴

儿童百科

智能硬件

AI 教育

情感陪伴

儿童百科

智能硬件

灵活智能体编排

支持豆包大模型/第三方大模型/自部署模型/扣子

支持接入视觉多模态能力和各类传感器数据

完备设备管理和设备控制

支持设备状态、事件管理及设备维度的智能体/用量管理

支持基于 FC 或 MCP 实现灵活的单/多设备控制

低门槛接入，兼容各类硬件终端

兼容主流芯片与模组，涵盖WiFi、Cat.1、蓝牙、ISP等通信技术

极低负载传输方案，可适配各类低功耗硬件

Mobile Use ，OS Agent 解决方案

Mobile Use

OS Agent 解决方案

Mobile Use

云手机视觉大模型AI AgentMCP

查看详情

基于「火山引擎云手机」与「豆包视觉大模型」能力，通过自然语言指令完成移动端应用自动化任务的 OS Agent 解决方案

Github MCP

说明文档

免费体验

面向 AI 时代的智能视频云

智能视频云产品全景

火山引擎视频云依托豆包大模型，凭借在AI领域的积极探索与广泛实践，在“智能媒体生产”领域，位列行业Top1，彰显了火山引擎在“AI+视频云”融合创新赛道的技术实力。

技术优势

“0”首帧播放体验，8k 3D 演唱会+XR 体验

国际顶级赛事认证，超高画质体验

抖音同款互动体验，RTM超低延时直播

自研编码器带来更高性能和更低成本

立即咨询

“AI + 媒体生产”领域，位列行业 Top 1

智能视频云一站式解决方案

在“AI + 媒体生产”领域，位列行业 Top 1

IDC《中国视频云市场跟踪（2024下半年）》，在“AI + 媒体生产”领域，火山引擎视频云位列行业 Top1

创新

一站式服务创新先锋

业内首探大模型 / 生成式 AI 与视频处理全链路从生产端 - 交互端 - 消费端的融合探索和实践落地

技术

亿级 DAU 打造硬核技术

亿级 DAU 技术沉淀，国际前沿的多媒体技术能力支撑，参与众多国际标准制定，获得数项国际技术赛事冠军，持续优化播放、画质、互动和性能体验

实践

真实场景打造最佳实践

通过行业深入理解和大规模应用实践，基于云端一体的一站式产品/技术能力，不断沉淀基于业务场景的音视频解决方案

生态

内外部生态联动

对内联动抖音小程序、巨量引擎等内容分发平台助力企业用户增长；对外联合行业伙伴共同制定协议标准，推动行业技术共建

更多视频云能力体验，请去旧版体验中心查看

复制链接在电脑中打开，3分钟跑通能力

电脑查看

AI 视频翻译

短剧高光智剪

精细化字幕擦除

直播高光智剪

直播质检

声影同传

Aideo web player

电商万创

Aideo Agent

视频处理

剧情故事线分析API

场景切分API

人声背景音分离API

OCR 提取字幕API

场景式画质增强

大模型视频分段摘要API

超轻数字人

大模型视频理解

图片处理

AIGC大模型超分辨率

ImageX-豆包AIGC生图

盲水印

智能裁剪

智能背景移除

AIGC智能图像扩展

画质增强

文字识别 OCR

图像修复

画质评估

智能审核