音频切分算子,用于从音频或视频文件中提取音频,并按照指定规则将音频切分为多个片段,输出到用户指定的存储路径。
该算子主要用于长音频或视频的结构化处理场景,如音频预处理、数据切分、训练数据构建等,支持批量并发处理以及灵活的输出路径组织方式。
当前版本以 TOS 存储地址作为输入与输出形式,后续将扩展支持 HTTP/HTTPS 等协议。
1. 音频/视频提取与切分
2. 支持自定义切分规则
3. 支持自定义输出音频格式
4. 支持输出路径模板
5. 支持音频编码参数扩展
调用 las_audio_extract_and_split 算子从视频中提取音频,并进行切分。
参数 | 类型 | 必填 | 示例值 | 说明 | |
|---|---|---|---|---|---|
operator_id | string | 是 | las_audio_extract_and_split | 本算子的id是 las_audio_extract_and_split。 | |
operator_version | string | 是 | v1 | 目前只支持v1。 | |
data | process_param | 是 | 算子参数 | ||
input_path | string | 是 | tos://xxx/video.mp4 | 输入tos路径。支持的音频格式: | |
output_path_template | string | 是 | tos://testbucket/{index}.{output_file_ext} | 输出文件路径模版。可注入变量:
| |
split_duration | double | 否 | 10 | 每个片段的时长(秒),默认为 30.0。 | |
output_format | string | 否 | wav | 输出文件格式,仅支持 | |
timeout | integer | 否 | 10 | ffmpeg 执行超时时间(秒),默认为 无超时。 | |
extra_params | list of string | 否 | ["-ar", "16000", "-ac", "1", "-b:a", "128k"] | 额外的 ffmpeg 参数列表,直接拼接到命令中。 | |
参数 | 类型 | 示例值 | 说明 | |
|---|---|---|---|---|
metadata | metadata | 请求的元信息。 | ||
task_status | string | COMPLETED | 任务状态。
| |
business_code | string | ApiKey.InValid | 业务码。 | |
error_msg | string | The api key is invalid. | 如有异常,会返回详细的异常信息。 | |
request_id | string | 9fed0e5f0659b128bad47e971aed3c81 | 请求的request_id。 | |
data | result | 返回的数据,随着不同算子有不同模式。 | ||
output_paths | list of string | ["tos://dingfeng/0/test.wav", "tos://dingfeng/1/test.wav"] | 输出的音频文件路径列表。 | |
metrics | list of metric | 指标。 | ||
name | string | duration_ms | 指标名称。支持 | |
value | integer | 指标值。 | ||
# 请将 INPUT_PATH 设置为 保存在本账号下的视频文件TOS路径 export INPUT_PATH="tos://xxxx/sample.mp4" # 请将 OUTPUT_PATH_TEMPLATE 设置为本账号上可写入的tos路径 export OUTPUT_PATH_TEMPLATE="tos://xxxx/{index}/test.wav" # 发起算子服务请求 curl --location "https://sd2a6d3q80c6ft26s2tv0.apigateway-cn-beijing.volceapi.com/api/v1/process" \ --header "Content-Type: application/json" \ --header "Authorization: Bearer $LAS_API_KEY" \ --data '{ "operator_id": "las_audio_extract_and_split", "operator_version": "v1", "data": { "input_path": "$INPUT_PATH", "output_format": "wav", "output_path_template": "tos://$OUTPUT_PATH_TEMPLATE/{index}/test.wav", "split_duration": 15 } }'
{ "metadata": { "task_status": "COMPLETED", "business_code": "0", "error_msg": "", "request_id": "c7b29d78a99f88beda5497753ed60816" }, "data": { "output_paths": [ "tos://xxx/0/test.wav", "tos://xxx/1/test.wav" ], "metrics": [ { "name": "duration_ms", "value": 26633 } ] } }
HttpCode | 错误码 | 错误信息 | 说明 |
|---|---|---|---|
401 | Authorization.Missing | Missing Authorization. | 缺少鉴权 |
401 | ApiKey.Invalid | The api key is invalid. | API不合法 |