You need to enable JavaScript to run this app.
导航

集成指南

最近更新时间2023.09.20 17:58:57

首次发布时间2022.07.14 15:23:18

环境要求
类别兼容范围
系统Linux
GCC版本4.9.2及以上
Glibc版本2.19及以上
Java版本Java SE 7 或 OpenJDK 7 及以上

除上述要求外 SDK 运行需要依赖一些系统库,安装方法如下:

RedHat/CentOS/Fedora

sudo yum install -y apr-util libgomp libnss3.so

Debian/Ubuntu

sudo apt-get install -y libaprutil1-dev libgomp1 libnss3 libglib2.0-0
集成方式

SDK有以下三种集成方式:
其中 {LATEST_VERSION} 请替换成:发布信息 中的最新组件版本。

Maven

在pom.xml中加入依赖:

<repositories>
        <repository>
            <id>bytedance-repo</id>
            <url>https://artifact.bytedance.com/repository/speechengine/</url>
        </repository>
    </repositories>
    
    <dependencies>
        <dependency>
            <groupId>com.bytedance.speechengine.linux</groupId>
            <artifactId>speechengine_asr_streaming_tob</artifactId>
            <version>{LATEST_VERSION}</version>
        </dependency>
    </dependencies>

Gradle

在build.gradle中加入依赖:

repositories {
    maven {
        url "https://artifact.bytedance.com/repository/speechengine/"
    }
}

dependencies {
    implementation 'com.bytedance.speechengine.linux:speechengine_asr_tob:{LATEST_VERSION} '
}

手动下载Jar包

wget https://artifact.bytedance.com/repository/speechengine/com/bytedance/speechengine/linux/speechengine_asr_streaming_tob/{LATEST_VERSION}/speechengine_asr_streaming_tob-{LATEST_VERSION}.jar
Demo

为方便您了解SDK的使用方式,提供示例工程,该工程实现了SDK目前提供的各项能力演示。
若集成过程中出现问题,您可以优先查看示例代码进行排查。
下载页面:发布信息

文件说明

  • asr 文件夹:一句话识别Demo代码文件夹,流式语音识别支持一句话识别场景。

    • Main.java:音频数据来源为File的Demo代码。

    • MainFeed.java:音频数据来源为Stream的Demo代码。

  • asr_streaming 文件夹:流式语音识别Demo代码文件夹。

    • MainFeed.java:音频数据来源为Stream的Demo代码。
  • data 文件夹:

    • asr_rec_file.pcm:一句话识别测试音频文件,16k采样频率、16bit采样位数、单通道PCM文件。

    • asr_long_rec_file.pcm:流式语音识别测试音频文件,16k采样频率、16bit采样位数、单通道PCM文件。

  • models 文件夹:模型资源文件夹,与对应版本的模型资源一致。

  • speechengine.jar:SDK jar包,和通过其他集成方式拉取的对应版本jar包一致。

  • run.sh:Linux 执行脚本,自动编译并执行所有的Demo代码。

快速执行

改为“Demo的运行需在Linux环境下,执行前需将各个Demo代码文件中的以下配置替换为火山控制台下的申请值,其中token需添加"Bearer;"前缀:

speechEngine.setOptionString(SpeechEngineDefines.PARAMS_KEY_APP_ID_STRING, "{YOUR APPID}");
speechEngine.setOptionString(SpeechEngineDefines.PARAMS_KEY_APP_TOKEN_STRING, "Bearer;{YOUR TOKEN}");
speechEngine.setOptionString(SpeechEngineDefines.PARAMS_KEY_UID_STRING, "{YOUR UID}");
speechEngine.setOptionString(SpeechEngineDefines.PARAMS_KEY_ASR_CLUSTER_STRING, "{YOUR CLUSTER}");

完成后执行以下命令,即可执行所有的Demo:

bash run.sh