You need to enable JavaScript to run this app.
AI 数据湖服务

AI 数据湖服务

复制全文
音频处理
音频切分
复制全文
音频切分

算子介绍

描述

音频切分算子,用于从音频或视频文件中提取音频,并按照指定规则将音频切分为多个片段,输出到用户指定的存储路径。
该算子主要用于长音频或视频的结构化处理场景,如音频预处理、数据切分、训练数据构建等,支持批量并发处理以及灵活的输出路径组织方式。
当前版本以 TOS 存储地址作为输入与输出形式,后续将扩展支持 HTTP/HTTPS 等协议。

核心功能

1. 音频/视频提取与切分

  • 输入可以是音频文件或视频文件
  • 当输入为视频文件时,自动提取音轨
  • 支持将音频按指定时长规则切分为多个片段
  • 对上游数据类型无感,统一输出多个音频片段

2. 支持自定义切分规则

  • 支持配置切分时长(单位:秒)
  • 适用于长音频、长视频的分段处理
  • 未指定切分时长时,可由服务端使用默认策略处理

3. 支持自定义输出音频格式

  • 支持指定输出音频格式
  • 可配置为 mp3、flac、wav 等常见音频格式
  • 实际支持范围以底层 FFmpeg 编解码能力为准

4. 支持输出路径模板

  • 支持用户通过路径模板定义切分后音频的输出路径
  • 输出路径模板支持占位符(如 {index}),用于生成多个音频片段路径
  • 适合按顺序、分段编号或业务规则组织切分结果
  • 返回所有实际生成的 output_paths 列表

5. 支持音频编码参数扩展

  • 支持透传 FFmpeg 级别的扩展参数
  • 可用于控制音频质量、编码方式或采样策略
  • 满足对音频处理有精细化需求的场景

API 调用

接口说明

调用 las_audio_extract_and_split 算子从视频中提取音频,并进行切分。

请求参数

参数

类型

必填

示例值

说明

operator_id

string

las_audio_extract_and_split

本算子的id是 las_audio_extract_and_split。

operator_version

string

v1

目前只支持v1。

data

process_param

算子参数

input_path

string

tos://xxx/video.mp4

输入tos路径。支持的音频格式:mp4wmvwebmmkvm4vflvavimov

output_path_template

string

tos://testbucket/{index}.{output_file_ext}

输出文件路径模版。可注入变量:

  • index 下标
  • index1 下标+1
  • ordinal: ordinal string (1st, 2nd, 3rd, etc.)
  • hours 小时数
  • duration 时长(秒)
  • output_file_ext 文件后缀

split_duration

double

10

每个片段的时长(秒),默认为 30.0。

output_format

string

wav

输出文件格式,仅支持 wav, mp3, flac,默认为 wav

timeout

integer

10

ffmpeg 执行超时时间(秒),默认为 无超时。

extra_params

list of string

["-ar", "16000", "-ac", "1", "-b:a", "128k"]

额外的 ffmpeg 参数列表,直接拼接到命令中。

返回数据

参数

类型

示例值

说明

metadata

metadata

请求的元信息。

task_status

string

COMPLETED

任务状态。

  • ACCEPTED, 接收到请求
  • RUNNING, 正在运行
  • COMPLETED, 已经完成
  • FAILED, 失败

business_code

string

ApiKey.InValid

业务码。

error_msg

string

The api key is invalid.

如有异常,会返回详细的异常信息。

request_id

string

9fed0e5f0659b128bad47e971aed3c81

请求的request_id。

data

result

返回的数据,随着不同算子有不同模式。

output_paths

list of string

["tos://dingfeng/0/test.wav", "tos://dingfeng/1/test.wav"]

输出的音频文件路径列表。

metrics

list of metric

指标。

name

string

duration_ms

指标名称。支持 duration_ms 音频总毫秒数。

value

integer

指标值。

示例

请求示例

# 请将 INPUT_PATH 设置为 保存在本账号下的视频文件TOS路径
export INPUT_PATH="tos://xxxx/sample.mp4"
# 请将 OUTPUT_PATH_TEMPLATE 设置为本账号上可写入的tos路径
export OUTPUT_PATH_TEMPLATE="tos://xxxx/{index}/test.wav"
# 发起算子服务请求
curl --location "https://sd2a6d3q80c6ft26s2tv0.apigateway-cn-beijing.volceapi.com/api/v1/process" \
--header "Content-Type: application/json" \
--header "Authorization: Bearer $LAS_API_KEY" \
--data '{
    "operator_id": "las_audio_extract_and_split",
    "operator_version": "v1",
    "data": {
        "input_path": "$INPUT_PATH",
        "output_format": "wav",
        "output_path_template": "tos://$OUTPUT_PATH_TEMPLATE/{index}/test.wav",
        "split_duration": 15
       }
}'

返回示例

{
    "metadata": {
        "task_status": "COMPLETED",
        "business_code": "0",
        "error_msg": "",
        "request_id": "c7b29d78a99f88beda5497753ed60816"
    },
    "data": {
        "output_paths": [
            "tos://xxx/0/test.wav",
            "tos://xxx/1/test.wav"
        ],
        "metrics": [
            {
                "name": "duration_ms",
                "value": 26633
            }
        ]
    }
}

错误码

HttpCode

错误码

错误信息

说明

401

Authorization.Missing

Missing Authorization.

缺少鉴权

401

ApiKey.Invalid

The api key is invalid.

API不合法

最近更新时间:2026.01.15 18:06:19
这个页面对您有帮助吗?
有用
有用
无用
无用