You need to enable JavaScript to run this app.
导航
只回复指定用户(声纹识别)
最近更新时间:2025.12.12 17:37:24首次发布时间:2025.12.12 17:37:24
复制全文
我的收藏
有用
有用
无用
无用

在多人交谈或背景人声嘈杂的环境中,智能体可能会因采集到非目标用户的语音而产生误识别或错误打断。您可通过声纹识别功能核验说话人身份,让智能体只响应指定用户的指令,从而提升语音交互的准确性和安全性。

声纹识别与声纹降噪的区别,可参见声纹识别与声纹降噪的区别?

使用限制

  • 最多仅支持识别 3 个人的声纹。
  • 该功能目前为限时免费公测阶段。
  • 开启声纹功能时,建议不要开启 AI 降噪,以免影响声纹识别的效果。

实现方法

  1. 调用 RegisterVoicePrint 接口为目标用户注册声纹,获取声纹 ID(VoicePrintId)。
  2. 调用 StartVoiceChat 接口时,配置 AgentConfig.VoicePrint
    • Mode:必填。设置为 2
    • IdList:必填。传入已注册的声纹 ID,最多支持传入 3 个。
    • Score(可选):设置声纹匹配的置信度阈值。取值范围 [1, 100],推荐值为 40-60,默认 50。系统会计算实时语音与注册声纹的“相似度分数”。只有当分数不低于此阈值时,才判定为匹配成功,智能体才会响应。

请求示例

"VoicePrint": {
    "Mode": 2,
    "IdList": ["vp_id_user_A", "vp_id_user_B"],
    "Score": 50
}

FAQ

声纹识别与声纹降噪的区别?

功能

原理

适用场景

声纹识别

只响应特定用户的指令。
验证当前说话人是否为已授权的特定用户。

需要对操作者身份进行验证的场景,如车载语音助手、智能家居控制,以防止儿童或乘客的误操作。

声纹降噪(公测中)

听清特定用户的声音。
即从混合人声中分离并增强目标说话人的声音,抑制其他背景人声的干扰。

提升在嘈杂环境下(如办公室、咖啡馆、家庭客厅)的语音识别准确率。