实时对话 AI 是否支持输入文本来触发AI对话?
目前 AI 方案不支持文字触发 AI 问答,目前仅支持语音麦克风采集问答。
实时对话 AI 支持给用户打电话吗?
不支持传统运营商电话,只支持类似微信语音电话类型的网络电话。运营商的电话拨打需要业务自行和运营商沟通集成,RTC 不提供支持。
实时对话式 AI 如何记忆对话内容?
调用 StartVoiceChat 接口时,配置参数 LLMConfig.HistoryLength
,可以记忆对话内容。
实时对话式 AI 可以基于 WebSocket 的接入吗?
实时对话式 AI 目前暂不支持 WebSocket 接入,需使用通过火山引擎 RTC SDK 接入。
实时对话式 AI 支持几人通话?
目前仅支持 1v1,即一个客户端用户、一个智能体。
启动智能体的 AppId、RoomId、UserId 是随机定义的吗?
- AppId:每个应用(App)的唯一标识符,AppId 由火山分配,不可自定义。
- RoomId:智能体与真人通话的房间 ID,必须与真人用户使用客户端 SDK 进房时使用的 RoomId 保持一致。
- UserId:智能体 ID,用于标识智能体。由你自行定义,支持由大小写字母(A-Z、a-z)、数字(0-9)、下划线(_)、短横线(-)、句点(.)和 @ 组成,最大长度为 128 个字符。
实时对话式 AI 是否可以把图片信息传递给多模态的大模型?
暂不不支持传入图片。
房间只有一个用户,没有智能体,会自动关闭房间吗?
如果没有主动退出房间,在 Token 过期前不会自动关闭房间。
启动智能体后,可以远程控制智能体说话吗?
不支持。
实时对话式 AI 互动支持多少并发?
RTC 关于并发目前没有限制。
实时对话式 AI 是否支持使用第三方服务(比如TTS、ASR)?
部分服务支持使用第三方的,具体支持情况如下:
- LLM:支持使用第三方大模型或 Agent,但是需要满足火山引擎规范。具体请参见接入第三方大模型或 Agent。
- TTS:支持使用 MiniMax 语音合成服务。
- ASR:不支持使用第三方服务,仅支持火山引擎的 ASR 服务。
实时对话式 AI 支持自定义音色吗?
支持。可参看火山声音复刻大模型(非流式输入流式输出)自定义音色。
能否获得 ASR、TTS 和 LLM 模块的内容?
可以。可通过字幕功能接收,具体请参见字幕功能。
是否可以实现对话中查询天气等能力?
可以。可参看 Function Calling功能实现。
是否支持获取大模型的推理过程?
不支持。
如何存储真人用户和智能体的音频对话内容?
可使用云端录制功能存储,详情参看关于云端录制。