You need to enable JavaScript to run this app.
文档中心
豆包语音

豆包语音

复制全文
下载 pdf
在离线流式音色转换SDK
集成指南
复制全文
下载 pdf
集成指南
环境要求
系统编译环境架构
Windows10, Windows11Visual Studio 2017 及以上版本x64
macOS Catalina 及以上版本Clang9.0 及以上版本x86_64, arm64
集成方式

获取 SDK

SDK通过提供动态库和头文件的方式供您集成。
下载链接见:发布信息

调用 SDK 接口

音色转换SDK当前提供了C语言接口供开发者使用。请参考C接口调用流程

编译&链接

Windows

需链接 speechsdk Rpcrt4 Ws2_32 Winmm 4个库

macOS

只需链接 speechsdk 1个库

Demo

为方便业务了解SDK的使用方式,我们提供了示例工程,该工程演示了SDK目前的各种功能的使用方法。若集成过程中出现问题,请优先查看示例代码进行排查。
下载页面:发布信息

文件说明

  • bin 文件夹:用于存放编译出来的可执行文件;

  • data 文件夹:

    • vc_rec_file.pcm:音色转换测试音频文件,16k采样频率、16bit采样位数、单通道PCM文件;
  • include 文件夹:SDK 头文件;

  • lib 文件夹:SDK 库文件;

  • models 文件夹:存放模型资源的文件夹,运行demo前需要将模型下载并解压到这个文件夹里;

  • src 文件夹:Demo 源代码。

    • voiceconv.cc:音色转换的 Demo 代码,是 bin 文件夹中可执行文件的源文件;
  • build 文件夹:存放编译 Demo 工程所需的关键文件,例如 CMakeLists.txt;

  • run.bat 编译、运行 Demo 的脚本;在 macOS 平台该脚本名为 run.sh;

快速执行

运行 Demo 体验音色转换之前需将 Demo 代码文件中的以下配置替换为向商务人员申请到的参数值:

在线音色转换

SpeechSDK_SetOptionString(handle, OPTIONS_KEY_VOICECONV_CLUSTER_STRING,
                            "YOUR CLUSTER");
SpeechSDK_SetOptionString(handle, OPTIONS_KEY_APP_ID_STRING, "YOUR APPID");
SpeechSDK_SetOptionString(handle, OPTIONS_KEY_APP_TOKEN_STRING, "YOUR TOKEN");

离线音色转换

SpeechSDK_SetOptionString(handle, OPTIONS_KEY_BUSINESS_KEY_STRING, "YOUR BUSINESS KEY");
SpeechSDK_SetOptionString(handle, OPTIONS_KEY_AUTHENTICATE_SECRET_STRING,"YOUR SECRET");

执行以下命令,即可启动 Demo 体验离线音色转换功能:

Windows

./run.bat # 默认运行在线音色转换,要体验离线音色转换继续执行下面的指令
cd ./bin
./voiceconv 1 2048

macOS

sh run.sh # 默认运行在线音色转换,要体验离线音色转换继续执行下面的指令
cd ./bin
./voiceconv 1 2048
最近更新时间:2023.07.04 16:22:09
这个页面对您有帮助吗?
有用
有用
无用
无用