You need to enable JavaScript to run this app.
视频点播

视频点播

复制全文
翻译项目与工作流管理
SubmitAITranslationWorkflow - 提交 AI 翻译任务
复制全文
SubmitAITranslationWorkflow - 提交 AI 翻译任务

调用 SubmitAITranslationWorkflow 接口为指定视频提交 AI 翻译任务。您可以配置源/目标语言、翻译类型(文本、语音、面容)、字幕来源及样式、以及工作流控制(如中途暂停)等。

使用说明

本接口为异步接口。您可通过以下方式获取任务结果:

注意事项

  • 费用说明:AI 翻译任务会产生视频 AI 费用,具体参见视频 AI 应用计费
  • QPS 限制:本接口的单用户 QPS 限制为 1 次/秒。超过限制,API 调用会被限流,这可能会影响您的业务,请合理调用。更多信息,请参见 QPS 限制

请求说明

  • 请求方式:POST
  • 请求地址:https://vod.volcengineapi.com?Action=SubmitAITranslationWorkflow&Version=2025-01-01

调试

请求参数

下表仅列出该接口特有的请求参数和部分公共参数。更多信息请见公共请求参数

Query

参数类型是否必选示例值描述
ActionStringSubmitAITranslationWorkflow接口名称。当前 API 的名称为 SubmitAITranslationWorkflow
VersionString2025-01-01接口版本。当前 API 的版本为 2025-01-01

Body

参数类型是否必选示例值描述

SpaceName

String

test

点播空间名。您可通过以下方式获取空间名称:

  • 在视频点播控制台空间管理页面查看当前账号下所有空间的名称。
  • 调用 ListSpace 接口获取当前账号下所有空间的名称。
VidStringv0ccfeg7007acsg***fog65ubr7niqng视频 ID。音视频上传至视频点播服务后,您可通过媒资上传完成事件获取 Vid
TranslationConfigObject of TranslationConfig-AI 翻译配置
OperatorConfigObject of AITranslationOperatorConfig-操作配置
SubtitleConfigObject of AITranslationSubtitleConfig-字幕配置。
ProcessConfigObject of AITranslationProcessConfig-执行配置。

TranslationConfig

参数类型是否必选示例值描述

SourceLanguage

String

zh

源语言,取值如下:

  • zh:中文
  • en:英文

TargetLanguage

String

ja

目标语言,取值如下:

  • zh:中文
  • en:英文
  • ja:日语
  • ko:韩语
  • de:德语
  • fr:法语
  • ru:俄语
  • es:西班牙语
  • pt:葡萄牙语
  • it:意大利语
  • id:印尼语
  • vi:越南语
  • th:泰语
  • ar:阿拉伯语
  • tr:土耳其语

TranslationTypeList

Array of String

["SubtitleTranslation","VoiceTranslation"]

需要执行的翻译类型组合。仅支持以下组合:

  • ["SubtitleTranslation"]:仅文本翻译。
  • ["SubtitleTranslation","VoiceTranslation"]:文本和语音翻译。
  • ["SubtitleTranslation","VoiceTranslation", "FacialTranslation"]:文本、语音和面容翻译。

说明

翻译类型详细介绍请见声影智译

TermbaseConfigObject of AITranslationTermbaseConfig-术语库配置,用于在翻译过程中应用您自定义的术语表,以确保特定词汇(如品牌名、产品名、专有名词等)的翻译准确性和一致性。

AITranslationOperatorConfig

参数类型是否必选示例值描述
SubtitleRecognitionConfigObject of AITranslationSubtitleRecognitionConfig-字幕识别配置。字幕来源默认为 OCR。
VoiceCloneConfigObject of AITranslationVoiceCloneConfig-声音克隆与合成配置。当翻译类型 TranslationTypeList 包含 VoiceTranslation 时,您可以通过此参数对最终合成的音频进行精细化控制。

AITranslationSubtitleConfig

参数类型是否必选示例值描述

FontSize

Integer

24

硬字幕的字体大小,单位为像素。取值范围为 [1, 80]。

注意

IsHardSubtitletrue 时,此参数必填。

MarginL

Double

0.1

硬字幕距离视频左侧的距离比例,取值范围为 [0, 1)。

注意

IsHardSubtitletrue 时,此参数必填。

MarginR

Double

0

硬字幕距离视频右侧的距离比例,取值范围为 [0, 1)。

注意

IsHardSubtitletrue 时,此参数必填。

MarginV

Double

0

硬字幕距离视频底部的距离比例,取值范围为 [0, 1)。

注意

IsHardSubtitletrue 时,此参数必填。

ShowLines

Integer

2

硬字幕最多显示的行数。取值为 0 时表示不限制行数。

注意

IsHardSubtitletrue 时,此参数必填。

IsHardSubtitle

Boolean

false

是否为硬字幕。开启后,字幕将直接嵌入视频画面中,不可关闭或调整。

注意

当开启硬字幕时,以下参数必填:

  • MarginL
  • MarginR
  • MarginV
  • FontSize
  • ShowLines

IsEraseSource

Boolean

true

是否擦除视频中的原有字幕。开启后,系统将在生成新字幕前擦除视频中的原有字幕。

说明

字幕擦除为收费功能,按实际输出视频时长计费,具体价格请参考视频 AI 应用计费

AITranslationProcessConfig

参数类型是否必选示例值描述

SuspensionStageList

Array of String

["SubtitleRecognition"]

执行过程中需要暂停的阶段列表。设置后,任务将在指定阶段完成后暂停,等待人工干预。取值如下:

  • SubtitleRecognition:识别字幕后暂停。
  • SubtitleTranslation:翻译字幕后暂停。

注意

目前仅支持暂停单一阶段。

DisableCloneVoiceByScene

Boolean

true

是否禁用分场景音色复刻。此参数决定了系统如何处理和组织从视频中复刻出的说话人音色。

  • true合并音色。系统会为视频中的每一个说话人(Speaker)生成一个统一的音色(例如 Speaker 1)。后续该说话人的所有配音都将使用这个统一音色。
  • false(默认)分场景保留音色。系统会保留同一说话人在不同场景(或对话片段)下的音色差异,为其生成多个独立的音色版本(例如 Speaker 1-0、Speaker 1-1 等)。后续系统会保持该片段原有的场景音色。在手动更换音色时,您也需要指定到具体的场景音色版本(如 Speaker 1-1)。

说明

如果您追求音色保真度和场景还原度,请设置为 false。如果希望音色管理更简单统一,请使用 true

DisableSubtitlePunctSplit

Boolean

true

是否禁用字幕断句优化(字幕打轴)。

  • false(默认):系统会自动根据标点符号将过长的字幕分割成更易于阅读的短句,以优化显示效果。
  • true:禁用此功能。系统将严格按照原始识别或文件中的时间轴进行断句,不再根据标点进行二次分割。

DisableSmartSubtitleRewrite

Boolean

true

是否禁用智能字幕改写。

  • false(默认):系统会利用大模型能力,对翻译后的字幕进行智能优化,例如修正语法错误、调整语序、润色表达,使其更流畅、更地道。
  • true:禁用此功能。系统将输出机器翻译的原始结果,不进行任何智能改写。适用于需要完全保留翻译原始内容的场景。

AITranslationTermbaseConfig

参数类型是否必选示例值描述
TranslationTermbaseIdsArray of String["xxx","xxx"]要应用的术语库 ID 列表。您可传入一个或多个已创建的术语库 ID。单次翻译任务最多支持应用 10 个术语库。系统将按照您指定的术语进行翻译干预。详细使用方式请见通过 OpenAPI 应用术语库

AITranslationSubtitleRecognitionConfig

参数类型是否必选示例值描述

RecognitionType

String

OCR

字幕来源,取值如下:

  • OCR:从视频的画面中识别文字并生成字幕。
  • ASR:从视频的音轨中识别文字并生成字幕。
  • SourceSubtitleFile:使用您提供的源语言字幕文件。选择此项时,必须配置 SourceSubtitleFileName 参数。
  • SourceAndTargetSubtitleFile:使用您提供的源语言和目标语言字幕文件。选择此项时,必须同时配置 SourceSubtitleFileNameTargetSubtitleFileName 参数。
  • BilingualSubtitleFile:使用您提供的双语字幕文件。选择此项时,必须配置 BilingualSubtitleFileName 参数。
  • SubtitleFile:(已废弃)行为等同于 SourceSubtitleFile

说明

使用您自行提供的字幕文件作为来源时,您必须:

  1. 预先将字幕文件作为素材上传至项目所在的点播空间。字幕文件可以是源语言字幕文件、目标语言字幕文件或双语字幕文件,支持 WebVTT、SRT 格式。
  2. 获取该字幕文件的 FileName
  3. 配置 SourceSubtitleFileNameTargetSubtitleFileNameBilingualSubtitleFileName 中的一个或多个参数。
SourceSubtitleFileNameStringsource_subtitle.vtt源语言字幕文件的 FileName。当 RecognitionTypeSourceSubtitleFileSourceAndTargetSubtitleFile 时必填。
TargetSubtitleFileNameStringtarget_subtitle.vtt目标语言字幕文件的 FileName。当 RecognitionTypeSourceAndTargetSubtitleFile 时必填。
BilingualSubtitleFileNameStringdual_subtitle.vtt双语字幕文件的 FileName。当 RecognitionTypeBilingualSubtitleFile 时必填。

SubtitleFileName

String

subtitle.vtt

(已废弃)字幕文件的 FileName。当字幕来源 RecognitionTypeSubtitleFile 时必填。

注意

此参数已被 SourceSubtitleFileNameTargetSubtitleFileNameBilingualSubtitleFileName 替代,建议您在后续开发中使用新参数。为保证兼容,该参数仍然有效,其行为等同于 SourceSubtitleFileName

IsVisionBooleantrue是否开启视频理解。开启后,系统将综合理解视频画面和语音内容来生成字幕,识别结果更精准但耗时较长。默认值为 false。此模式需提交工单联系火山引擎技术支持团队申请加入白名单后方可使用。

AITranslationVoiceCloneConfig

参数类型是否必选示例值描述
BackgroundVolumeInteger100背景音音量。用于调节最终合成视频中背景音的音量大小。默认值为 100,表示保持原始背景音音量不变。取值范围为 [0, 100]。设置为 0 表示背景音完全静音。

返回参数

下表仅列出本接口特有的返回参数。更多信息请见公共返回参数

参数类型示例值描述
ProjectBaseInfoObject of AITranslationProjectBaseInfo-项目基础信息

AITranslationProjectBaseInfo

参数类型示例值描述
ProjectIdString684038d6***c9005b266fefe项目 ID
ProjectVersionString01c4fa5da***48a588a46f81e282b100项目版本

#{.custom-md-table-4}#

请求示例

POST https://vod.volcengineapi.com?Action=SubmitAITranslationWorkflow&Version=2025-01-01
{
  "SpaceName": "test",
  "Vid": "v0ccfeg7007acsg***fog65ubr7niqng",
  "TranslationConfig": {
    "SourceLanguage": "zh",
    "TargetLanguage": "ja",
    "TranslationTypeList": [
      "SubtitleTranslation",
      "VoiceTranslation"
    ]
  },
  "OperatorConfig": {}
}

返回示例

{
  "ResponseMetadata": {
    "RequestId": "20230604110420****100232280022D31",
    "Action": "SubmitAITranslationWorkflow",
    "Version": "2025-01-01",
    "Service": "vod",
    "Region": "cn-north-1"
  },
  "Result": {
    "ProjectBaseInfo": {
      "ProjectId": "684038d6***c9005b266fefe",
      "ProjectVersion": "01c4fa5da***48a588a46f81e282b100"
    }
  }
}

错误码

本接口无特有的错误码。更多信息请见公共错误码

SDK

视频点播为 OpenAPI 提供了配套的服务端 SDK,支持多种编程语言,帮助您实现快速开发。建议使用服务端 SDK 来调用 API。本接口仅 VOD SDK 2.0 支持,详见 V2.0 SDK 介绍与迁移说明

最近更新时间:2026.01.09 16:56:34
这个页面对您有帮助吗?
有用
有用
无用
无用