You need to enable JavaScript to run this app.
文档中心
AI 数据湖服务

AI 数据湖服务

复制全文
下载 pdf
音频处理
音频切分
复制全文
下载 pdf
音频切分

算子介绍

描述

音频切分算子,用于从音频或视频文件中提取音频,并按照指定规则将音频切分为多个片段,输出到用户指定的存储路径。
该算子主要用于长音频或视频的结构化处理场景,如音频预处理、数据切分、训练数据构建等,支持批量并发处理以及灵活的输出路径组织方式。
当前版本以 TOS 存储地址作为输入与输出形式,后续将扩展支持 HTTP/HTTPS 等协议。

核心功能

1. 音频/视频提取与切分

  • 输入可以是音频文件或视频文件
  • 当输入为视频文件时,自动提取音轨
  • 支持将音频按指定时长规则切分为多个片段
  • 对上游数据类型无感,统一输出多个音频片段

2. 支持自定义切分规则

  • 支持配置切分时长(单位:秒)
  • 适用于长音频、长视频的分段处理
  • 未指定切分时长时,可由服务端使用默认策略处理

3. 支持自定义输出音频格式

  • 支持指定输出音频格式
  • 可配置为 mp3、flac、wav 等常见音频格式
  • 实际支持范围以底层 FFmpeg 编解码能力为准

4. 支持输出路径模板

  • 支持用户通过路径模板定义切分后音频的输出路径
  • 输出路径模板支持占位符(如 {index}),用于生成多个音频片段路径
  • 适合按顺序、分段编号或业务规则组织切分结果
  • 返回所有实际生成的 output_paths 列表

5. 支持音频编码参数扩展

  • 支持透传 FFmpeg 级别的扩展参数
  • 可用于控制音频质量、编码方式或采样策略
  • 满足对音频处理有精细化需求的场景

API 调用

接口说明

调用 las_audio_extract_and_split 算子从视频中提取音频,并进行切分。

请求参数

参数
类型
必填
示例值
说明
operator_id
string
las_audio_extract_and_split
本算子的id是 las_audio_extract_and_split。
operator_version
string
v1
目前只支持v1。
data
process_param
算子参数
input_path
string
tos://xxx/video.mp4
输入tos路径。支持的音频格式:mp4、wmv、webm、mkv、m4v、flv、avi、mov。
output_path_template
string
tos://testbucket/{index}.{output_file_ext}
输出文件路径模版。可注入变量:
  • index 下标
  • index1 下标+1
  • ordinal: ordinal string (1st, 2nd, 3rd, etc.)
  • hours 小时数
  • duration 时长(秒)
  • output_file_ext 文件后缀
split_duration
double
10
每个片段的时长(秒),默认为 30.0。
output_format
string
wav
输出文件格式,仅支持 wav, mp3, flac,默认为 wav。
timeout
integer
10
ffmpeg 执行超时时间(秒),默认为 无超时。
extra_params
list of string
No
["-ar", "16000", "-ac", "1", "-b:a", "128k"]
额外的 ffmpeg 参数列表,直接拼接到命令中。
支持命令: `-ac`、`-b:a`、`-ar`、 `-sample_fmt`。

返回数据

参数
类型
示例值
说明
metadata
metadata
请求的元信息。
data
result
返回的数据,随着不同算子有不同模式。
output_paths
list of string
["tos://dingfeng/0/test.wav", "tos://dingfeng/1/test.wav"]
输出的音频文件路径列表。
metrics
list of metric
指标。
name
string
duration_ms
指标名称。支持 duration_ms 音频总毫秒数。
value
integer
指标值。

示例

请求示例

# 请将 INPUT_PATH 设置为 保存在本账号下的视频文件TOS路径
export INPUT_PATH="tos://xxxx/sample.mp4"
# 请将 OUTPUT_PATH_TEMPLATE 设置为本账号上可写入的tos路径
export OUTPUT_PATH_TEMPLATE="tos://xxxx/{index}/test.wav"
# 发起算子服务请求
curl --location "https://operator.las.cn-beijing.volces.com/api/v1/process" \
--header "Content-Type: application/json" \
--header "Authorization: Bearer $LAS_API_KEY" \
--data '{
    "operator_id": "las_audio_extract_and_split",
    "operator_version": "v1",
    "data": {
        "input_path": "$INPUT_PATH",
        "output_format": "wav",
        "output_path_template": "tos://$OUTPUT_PATH_TEMPLATE/{index}/test.wav",
        "split_duration": 15
       }
}'

返回示例

{
    "metadata": {
        "task_status": "COMPLETED",
        "business_code": "0",
        "error_msg": "",
        "request_id": "c7b29d78a99f88beda5497753ed60816"
    },
    "data": {
        "output_paths": [
            "tos://xxx/0/test.wav",
            "tos://xxx/1/test.wav"
        ],
        "metrics": [
            {
                "name": "duration_ms",
                "value": 26633
            }
        ]
    }
}

错误码

HttpCode

错误码

错误信息

说明

401

Authorization.Missing

Missing Authorization.

缺少鉴权

401

ApiKey.Invalid

The api key is invalid.

API不合法

最近更新时间:2026.05.09 11:16:57
这个页面对您有帮助吗?
有用
有用
无用
无用