You need to enable JavaScript to run this app.
导航

集成指南

最近更新时间2023.07.04 16:22:09

首次发布时间2023.04.12 18:08:16

环境要求
系统编译环境架构
Windows10, Windows11Visual Studio 2017 及以上版本x64
macOS Catalina 及以上版本Clang9.0 及以上版本x86_64, arm64
集成方式

获取 SDK

SDK通过提供动态库和头文件的方式供您集成。
下载链接见:发布信息

调用 SDK 接口

音色转换SDK当前提供了C语言接口供开发者使用。请参考C接口调用流程

编译&链接

Windows

需链接 speechsdk Rpcrt4 Ws2_32 Winmm 4个库

macOS

只需链接 speechsdk 1个库

Demo

为方便业务了解SDK的使用方式,我们提供了示例工程,该工程演示了SDK目前的各种功能的使用方法。若集成过程中出现问题,请优先查看示例代码进行排查。
下载页面:发布信息

文件说明

  • bin 文件夹:用于存放编译出来的可执行文件;

  • data 文件夹:

    • vc_rec_file.pcm:音色转换测试音频文件,16k采样频率、16bit采样位数、单通道PCM文件;
  • include 文件夹:SDK 头文件;

  • lib 文件夹:SDK 库文件;

  • models 文件夹:存放模型资源的文件夹,运行demo前需要将模型下载并解压到这个文件夹里;

  • src 文件夹:Demo 源代码。

    • voiceconv.cc:音色转换的 Demo 代码,是 bin 文件夹中可执行文件的源文件;
  • build 文件夹:存放编译 Demo 工程所需的关键文件,例如 CMakeLists.txt;

  • run.bat 编译、运行 Demo 的脚本;在 macOS 平台该脚本名为 run.sh;

快速执行

运行 Demo 体验音色转换之前需将 Demo 代码文件中的以下配置替换为向商务人员申请到的参数值:

在线音色转换

SpeechSDK_SetOptionString(handle, OPTIONS_KEY_VOICECONV_CLUSTER_STRING,
                            "YOUR CLUSTER");
SpeechSDK_SetOptionString(handle, OPTIONS_KEY_APP_ID_STRING, "YOUR APPID");
SpeechSDK_SetOptionString(handle, OPTIONS_KEY_APP_TOKEN_STRING, "YOUR TOKEN");

离线音色转换

SpeechSDK_SetOptionString(handle, OPTIONS_KEY_BUSINESS_KEY_STRING, "YOUR BUSINESS KEY");
SpeechSDK_SetOptionString(handle, OPTIONS_KEY_AUTHENTICATE_SECRET_STRING,"YOUR SECRET");

执行以下命令,即可启动 Demo 体验离线音色转换功能:

Windows

./run.bat # 默认运行在线音色转换,要体验离线音色转换继续执行下面的指令
cd ./bin
./voiceconv 1 2048

macOS

sh run.sh # 默认运行在线音色转换,要体验离线音色转换继续执行下面的指令
cd ./bin
./voiceconv 1 2048