StartExecution 是视频点播面向 AI 媒体处理场景推出的通用异步任务提交入口。该接口通过标准化的请求架构,整合了从基础转码、画质修复到大语言模型视频理解、内容生成等全量媒体处理能力。
根据业务的复杂度和参数复用性需求,该接口支持以下三种提交方式:
| 提交方式 | 参数路径 | 核心特征 | 适用场景 |
|---|---|---|---|
| 单任务 | Operation.Task | 动态定义:无需预设模板,处理参数在调用接口时实时传入。 | 适用于一次性的、参数相对简单的媒体处理操作。 |
| 单模板任务 | Operation.Template | 配置复用:引用您在视频点播控制台预设的模板,确保输出规格的一致性。 | 适用于可复用的、标准化的媒体处理操作。 |
| 工作流任务 | Operation.Workflow | 自动化串联:支持多个处理节点串行及节点间数据传递。 | 适用于需要将多个处理节点串联起来的复杂、自动化的处理流水线。 |
按功能属性与实现方式,StartExecution 承载的能力主要分为以下三类:
该类功能主要通过单任务 (Operation.Task) 提交,利用多模态算法将音视频转化为结构化数据,支撑业务决策或内容索引。产物通常为 JSON 或文本。
| 功能名称 | 能力核心 | 产物形式 |
|---|---|---|
| 长视频理解 | 多模态语义提取与逻辑归纳 | 结构化文本摘要 |
| 故事线分析 | 剧集维度的结构化剧情识别 | 剧情片段索引、关键情节描述 |
| ASR 提取字幕/OCR 提取字幕字幕 | 音轨与画面字符转写 | 带时间戳的结构化文本 (JSON) |
| 视频分段摘要 | 结合 ASR 识别的内容提炼 | 分段式标题与大纲数据 |
| 巨量广告预审 | 投放合规性风险前置识别 | 审核结论与风险建议 |
该类功能支持通过单任务实时配置,或通过单模板任务引用预设模板,对音视频流进行转换、修复或剪辑。产物通常为新的音视频文件(部分任务支持同步输出分析数据)。
| 功能名称 | 提交方式 | 能力核心 | 产物形式 |
|---|---|---|---|
| 画质增强 | 单任务/单模板 | 自适应场景匹配与像素级增强 | 高清晰度、高帧率的视频文件 |
| 标准视频转码 | 单模板 | 格式转换与兼容性处理 | 指定规格的视频文件 |
| 极智超清转码 | 单模板 | 视觉主观优化与码率节省 | 高清低码的视频文件 |
| 标准音频转码 | 单模板 | 音频编码优化 | 指定规格的音频文件 |
| 精细化字幕擦除 | 单任务 | AIGC 图像背景填充与修复 | 背景无痕还原的视频文件 |
| 高光智剪 | 单任务 | 基于视觉冲突的爆点提取 | 高光片段或混剪视频 |
| 人声背景音分离 | 单任务 | 音频模态解耦 | 独立的人声与背景音频 |
| 场景切分 | 单任务 | 视觉转场智能检测 | 物理分割的视频切片 |
| 智能抠图 | 单任务 | AI 人像/绿幕分割技术 | 带 Alpha 透明通道的视频素材 |
该类功能目前通过单任务提交。
| 功能名称 | 能力核心 | 产物形式 |
|---|---|---|
| 视频生成 | 接入 Doubao-Seedance 基础模型 | 文本或图像驱动的生成视频 |
StartExecution 接口采用异步执行:
任务提交:调用 StartExecution 接口,任务提交后返回 RunId(任务执行唯一标识)。
异步处理:系统根据任务类型分配算子资源并进入异步队列。
结果获取: