音频切分算子,用于从音频或视频文件中提取音频,并按照指定规则将音频切分为多个片段,输出到用户指定的存储路径。
该算子主要用于长音频或视频的结构化处理场景,如音频预处理、数据切分、训练数据构建等,支持批量并发处理以及灵活的输出路径组织方式。
当前版本以 TOS 存储地址作为输入与输出形式,后续将扩展支持 HTTP/HTTPS 等协议。
1. 音频/视频提取与切分
2. 支持自定义切分规则
3. 支持自定义输出音频格式
4. 支持输出路径模板
5. 支持音频编码参数扩展
调用 las_audio_extract_and_split 算子从视频中提取音频,并进行切分。
参数 | 类型 | 必填 | 示例值 | 说明 |
|---|---|---|---|---|
operator_id | string | 是 | las_audio_extract_and_split | 本算子的id是 las_audio_extract_and_split。 |
operator_version | string | 是 | v1 | 目前只支持v1。 |
data | process_param | 是 | 算子参数 |
参数 | 类型 | 示例值 | 说明 |
|---|---|---|---|
metadata | metadata | 请求的元信息。 | |
data | result | 返回的数据,随着不同算子有不同模式。 |
# 请将 INPUT_PATH 设置为 保存在本账号下的视频文件TOS路径 export INPUT_PATH="tos://xxxx/sample.mp4" # 请将 OUTPUT_PATH_TEMPLATE 设置为本账号上可写入的tos路径 export OUTPUT_PATH_TEMPLATE="tos://xxxx/{index}/test.wav" # 发起算子服务请求 curl --location "https://operator.las.cn-beijing.volces.com/api/v1/process" \ --header "Content-Type: application/json" \ --header "Authorization: Bearer $LAS_API_KEY" \ --data '{ "operator_id": "las_audio_extract_and_split", "operator_version": "v1", "data": { "input_path": "$INPUT_PATH", "output_format": "wav", "output_path_template": "tos://$OUTPUT_PATH_TEMPLATE/{index}/test.wav", "split_duration": 15 } }'
{ "metadata": { "task_status": "COMPLETED", "business_code": "0", "error_msg": "", "request_id": "c7b29d78a99f88beda5497753ed60816" }, "data": { "output_paths": [ "tos://xxx/0/test.wav", "tos://xxx/1/test.wav" ], "metrics": [ { "name": "duration_ms", "value": 26633 } ] } }
HttpCode | 错误码 | 错误信息 | 说明 |
|---|---|---|---|
401 | Authorization.Missing | Missing Authorization. | 缺少鉴权 |
401 | ApiKey.Invalid | The api key is invalid. | API不合法 |