支持将音频文件转写成文本数据,内置自动标点、语义顺滑、数字规整、智能分句等功能,可根据需要任意搭配。适用于非实时的语音识别场景。本文为您介绍如何使用音频处理算子。
点击「语言转文字(ASR) -Qwen-Omin」,在基本信息页面,配置相关参数。
相关参数说明如下:
参数 | 配置说明 |
|---|---|
模型调用地址 | 应用的调用地址 |
推理接入点 | 一般格式为 |
API Key | 一般格式为 |
输入模式:选择输入数据的来源模式。
支持以下两种模式:
下拉单选,支持搜索,根据技术选型选择可选的语言。目前支持中文和英文。
相关参数说明如下:
并发大小 | 设置并发处理的任务数量。 |
|---|---|
超时时间 | 设置任务处理的超时时间,单位为毫秒(ms)。 |
重试间隔 | 设置任务失败后的自动重试次数。 |
异常处理 | 配置当任务发生异常时的处理策略。 |
输出字段:指定用于存储识别结果的输出字段名称。
点击「测试执行」,在「测试执行结果」栏中查看输出结果。