调用 CreateSpeechTask 接口,创建声影同传任务。从任务开始到任务结束,当直播源开始推流时,同传任务会自动拉取该直播流进行同传处理,并将经过同传处理的新直播流推送到指定的转推地址,从而实现在转推地址上直播同传处理后的内容。例如,您可以使用 OBS 开播,创建同传任务后,在抖音上直播同传处理后的内容。
请求频率:单用户请求频率限制为 10 次/秒。
下表仅列出该接口特有的请求参数和部分公共参数。更多信息请见公共参数。
| 参数 | 类型 | 是否必选 | 示例值 | 描述 |
|---|---|---|---|---|
| Action | String | 是 | CreateSpeechTask | 接口名称。当前 API 的名称为 CreateSpeechTask。 |
| Version | String | 是 | 2023-01-01 | 接口版本。当前 API 的版本为 2023-01-01。 |
| 参数 | 类型 | 是否必选 | 示例值 | 描述 |
|---|---|---|---|---|
Name | String | 是 |
| 任务名称。该名称在所有运行中的任务中必须唯一。长度为 1-64 个字节。可包含以下字符:
|
| Rule | Object of Rule | 是 | - | 任务规则。 |
| 参数 | 类型 | 是否必选 | 示例值 | 描述 |
|---|---|---|---|---|
Pipe | String | 是 |
| 任务类型。取值如下:
|
Delay | Integer | 否 |
| 播出延迟时长,用于保证同传声音和字幕的翻译处理完成。取值范围为
|
| Source | Object of Source | 是 | - | 源流配置。 |
StartTime | String | 否 |
| 任务开始时间。遵循 RFC3339 格式的东八区(UTC+8)时间,精度为秒。 |
EndTime | String | 否 |
| 任务结束时间,必须晚于任务开始时间( 说明 当任务结束或拉流失败时,停止向转推地址推流。 |
| Output | Object of Output | 是 | - | 转推配置。 |
SI | Object of SI | 否 |
| 声影同传模式配置。 说明 仅在 |
RealTime | Object of RealTime | 否 |
| 实时同传模式配置。 说明 仅在 |
| Extra | Object of Extra | 否 | - | 额外配置。 |
| Subtitle | Object of Subtitle | 否 | - | 字幕配置。 |
| GlossaryMap | JSON Map | 否 | {"字节跳动":"ByteDance","视频直播":"MediaLive"} | 关键词库。格式为 "Key":"Value",每个 "Key":"Value" 之间用英文逗号(,)隔开。其中,"Key" 为原文,"Value" 为译文。配置关键词库后,同传任务会严格按照词库进行翻译。 |
| 参数 | 类型 | 是否必选 | 示例值 | 描述 |
|---|---|---|---|---|
Url | String | 是 |
| 源流地址,即需要拉取的原始流地址。支持 RTMP 或 FLV 格式。 说明
|
| 参数 | 类型 | 是否必选 | 示例值 | 描述 |
|---|---|---|---|---|
Url | Array of String | 是 |
| 转推地址,同传任务会将经过同传处理的新直播流推送到该地址。 说明
|
| 参数 | 类型 | 是否必选 | 示例值 | 描述 |
|---|---|---|---|---|
LipSync | Boolean | 否 |
| 是否开启数字人口型功能。默认值为
|
| 参数 | 类型 | 是否必选 | 示例值 | 描述 |
|---|---|---|---|---|
VoiceShow | Boolean | 否 |
| 是否开启同传声音功能。默认值为
|
| 参数 | 类型 | 是否必选 | 示例值 | 描述 |
|---|---|---|---|---|
| AMix | Object of AMix | 否 | - | 混音配置。 |
| 参数 | 类型 | 是否必选 | 示例值 | 描述 |
|---|---|---|---|---|
| Position | Object of Position | 否 | - | 字幕位置。 |
| Original | Object of Original | 是 | - | 原文字幕配置。 |
| Translation | Array of Translation | 是 | - | 译文字幕配置。目前仅支持传入一个译文语种。 |
| 参数 | 类型 | 是否必选 | 示例值 | 描述 |
|---|---|---|---|---|
BGVolume | Float | 否 |
| 原声音量,用于实现同传声音与原声的混合播放。默认值为 说明 仅在 |
| 参数 | 类型 | 是否必选 | 示例值 | 描述 |
|---|---|---|---|---|
Relative | String | 否 |
| 字幕在画面中的位置。默认值为
|
MarginTb | Float | 否 |
| 字幕的上下边距,即字幕距离画面顶部或底部的距离。取值为画面高度的百分比,取值范围为
|
| MarginLr | Float | 否 | 0.2 | 字幕的左右边距,即字幕距离画面左右边缘的距离。取值为画面宽度的百分比,取值范围为 [0, 0.3]。 |
| 参数 | 类型 | 是否必选 | 示例值 | 描述 |
|---|---|---|---|---|
Language | String | 是 |
| 字幕语言。取值如下:
|
| Font | String | 否 | arial | 字体,默认值为 arial。可通过 GetSpeechConfig 获取当前账号下可使用的字体列表。 |
| FontSize | Integer | 否 | 32 | 字号。默认值为 40。取值范围为 [1,100]。 |
FontColor | String | 否 |
| 字体颜色。默认白色。
|
Alignment | Integer | 否 |
| 字幕对齐方式。默认值为
|
MaxRowNumber | Integer | 否 |
| 原文字幕展示的最大行数, 说明 原文和译文的行数限制单独计算。 |
| MaxCharNumber | Integer | 否 | 60 | 每行字幕的最大字符数。默认值为 60。建议取值 60。 |
Hidden | Boolean | 否 |
| 是否隐藏字幕。默认值为
|
| ShowPriority | Integer | 否 | 100 | 展示优先级。默认原文字幕在上,译文字幕在下。取值越大,优先级越高。 |
| Box | Object of Box | 否 | - | 字体背景。 |
| Border | Object of Border | 否 | - | 字体阴影。 |
| 参数 | 类型 | 是否必选 | 示例值 | 描述 |
|---|---|---|---|---|
Language | String | 是 |
| 字幕语言。取值如下:
|
| Font | String | 否 | arial | 字体,默认值为 arial。可通过 GetSpeechConfig 获取当前账号下可使用的字体列表。 |
| FontSize | Integer | 否 | 32 | 字号。默认值为 40。取值范围为 [1,100]。 |
FontColor | String | 否 |
| 字体颜色。默认白色。
|
Alignment | Integer | 否 |
| 字幕对齐方式。默认值为
|
MaxRowNumber | Integer | 否 |
| 译文字幕展示的最大行数, 说明 原文和译文的行数限制单独计算。 |
| MaxCharNumber | Integer | 否 | 60 | 每行字幕的最大字符数。默认值为 60。建议取值 60。 |
Hidden | Boolean | 否 |
| 是否隐藏字幕。默认值为
|
| ShowPriority | Integer | 否 | 100 | 展示优先级。默认原文字幕在上,译文字幕在下。取值越大,优先级越高。 |
| Box | Object of Box | 否 | - | 字体背景。 |
| Border | Object of Border | 否 | - | 字体阴影。 |
| 参数 | 类型 | 是否必选 | 示例值 | 描述 |
|---|---|---|---|---|
| W | Float | 是 | 1.0 | 宽度。默认值为 1.0。单位为 px。 |
| Color | String | 是 | black@0.5 | 颜色。格式为颜色的英文名称@透明度。透明度取值范围为 [0,1],支持 2 位小数。默认值为 black@0.5。 |
| 参数 | 类型 | 是否必选 | 示例值 | 描述 |
|---|---|---|---|---|
| W | Float | 是 | 1.0 | 宽度。单位为 px。 |
| Color | String | 是 | black@0.5 | 颜色。格式为颜色的英文名称@透明度。透明度取值范围为 [0,1],支持 2 位小数。 |
下表仅列出本接口特有的返回参数。更多信息请见返回结构。
| 参数 | 类型 | 示例值 | 描述 |
|---|---|---|---|
| Code | Integer | 0 | 状态码。 |
| Message | String | success | 状态信息。 |
| Data | Object of Data | - | 任务信息。 |
| 参数 | 类型 | 示例值 | 描述 |
|---|---|---|---|
| TaskID | String | ab5d68****257f3f | 任务 ID。 |
POST https://live.volcengineapi.com?Action=CreateSpeechTask&Version=2023-01-01 { "Name": "TaskA", "Rule": { "Pipe": "si", "Delay": 20, "Source": { "Url": "https://xxx/live/xxx.flv" }, "EndTime": "2025-11-17T12:11:06+08:00", "StartTime": "2025-11-17T11:30:06+08:00", "Output": { "Url": [ "" ] }, "SI": { "LipSync": true }, "RealTime": { "VoiceShow": true }, "Extra": { "AMix": { "BGVolume": 1 } }, "Subtitle": { "Position": { "Relative": "bottom", "MarginTb": 0.05, "MarginLr": 0.2 }, "Original": { "Language": "zh", "Font": "arial", "FontSize": 32, "FontColor": "white", "Alignment": 0, "MaxRowNumber": 2, "MaxCharNumber": 60, "Hidden": false, "ShowPriority": 100, "Box": { "W": 1, "Color": "black@0.5" }, "Border": { "W": 1, "Color": "black@0.5" } }, "Translation": [ { "Language": "en", "Font": "arial", "FontSize": 32, "FontColor": "white", "Alignment": 0, "MaxRowNumber": 2, "MaxCharNumber": 60, "Hidden": false, "ShowPriority": 100, "Box": { "W": 1.0, "Color": "black@0.5" }, "Border": { "W": 1.0, "Color": "green@0.5" } } ] }, "GlossaryMap": { "字节跳动": "ByteDance", "视频直播": "MediaLive" } } }
{ "ResponseMetadata": { "RequestID": "202511171128292187AC16BA39652EACFF", "RequestId": "20230604110420****100232280022D31", "Action": "CreateSpeechTask", "Version": "2023-01-01", "Service": "live", "Region": "cn-north-1" }, "Result": { "Code": 0, "Message": "success", "Data": { "TaskID": "ab5d68****257f3f" } } }
您可访问公共错误码,获取更多错误码信息。