在多人交谈或背景人声嘈杂的环境中,智能体可能会因采集到非目标用户的语音而产生误识别或错误打断。您可通过声纹识别功能核验说话人身份,让智能体只响应指定用户的指令,从而提升语音交互的准确性和安全性。
声纹识别与声纹降噪的区别,可参见声纹识别与声纹降噪的区别?
VoicePrintId)。AgentConfig.VoicePrint:
Mode:必填。设置为 2。IdList:必填。传入已注册的声纹 ID,最多支持传入 3 个。Score(可选):设置声纹匹配的置信度阈值。取值范围 [1, 100],推荐值为 40-60,默认 50。系统会计算实时语音与注册声纹的“相似度分数”。只有当分数不低于此阈值时,才判定为匹配成功,智能体才会响应。请求示例:
"VoicePrint": { "Mode": 2, "IdList": ["vp_id_user_A", "vp_id_user_B"], "Score": 50 }
功能 | 原理 | 适用场景 |
|---|---|---|
声纹识别 | 只响应特定用户的指令。 | 需要对操作者身份进行验证的场景,如车载语音助手、智能家居控制,以防止儿童或乘客的误操作。 |
听清特定用户的声音。 | 提升在嘈杂环境下(如办公室、咖啡馆、家庭客厅)的语音识别准确率。 |