2025 年 11 月
功能 | 说明 | 接口版本 | 发布时间 | 相关文档 |
|---|---|---|---|---|
自定义 TTS/第三方 LLM | 新增支持自定义数据透传:在单轮对话过程中,支持将端侧的自定义数据(如业务数据、算法检测结果等)透传给第三方 LLM 或自定义 TTS,且这些数据不会被 TTS 直接朗读。 |
| 2025-11-27 | |
更新智能体 | 启动一个智能体任务后,支持通过 UpdateVoiceChat 接口,更新该任务配置(如TTS、LLM 等)。具体支持更新的配置项,以 |
| 2025-11-27 | |
记忆库(长期记忆) | 新增参数 |
| 2025-11-22 | |
声纹降噪 | 新增字段 |
| 2025-11-18 | |
第三方大模型/Agent | 新增支持 FC、联网问答、MCP。 |
| 2025-11-05 | |
启动智能体 | 在任务启动时对 StartVoiceChat 接口的参数进行校验,并通过回调返回未定义或错误的参数信息。 |
| 2025-11-05 | |
智能体任务状态回调 | 服务端任务状态回调新增状态: |
| 2025-11-05 |
2025 年 10 月
功能 | 说明 | 接口版本 | 发布时间 | 相关文档 |
|---|---|---|---|---|
豆包语音端到端模型 | 新增支持豆包语音端到端模型:整合了 ASR、LLM、TTS 的全链路能力,显著降低闲聊场景的响应延迟。支持两种模式:
|
| 2025-10-23 | |
流式语音识别大模型 | 支持参数透传,提供了更大灵活性。 |
| 2025-10-17 | |
记忆库 | 新增支持接入火山记忆库(VikingDB):通过 MemoryConfig 参数,可为智能体接入长期记忆能力,使其能够检索并利用历史对话信息,提供更具个性化和连续性的交互体验。 |
| 2025-10-17 | |
数字人 | 新增支持接入火山引擎数字人,为智能体赋予具象形态,同时实现精准口型同步,有效增强交互过程的生动性。 |
| 2025-10-10 |
2025 年 9 月
功能 | 说明 | 发布时间 | 相关文档 | |
|---|---|---|---|---|
火山方舟平台模型 | 新增支持接入火山联网问答 Agent:可以让智能体具备实时从互联网检索信息并进行总结回答的能力。例如查询最新资讯、获取天气信息、询问实时股价等。 |
| 2025-09-29 | |
火山方舟平台模型 | 新增支持接入 MCP,以将知识库问答(RAG)、信息搜索、数据分析等复杂能力,作为独立的工具接入到实时对话流中,扩展智能体的能力。
|
| 2025-09-29 | |
声纹降噪 | 新增 |
| 2025-09-25 | |
火山引擎语音识别大模型 | 新增支持双向流式优化版( |
| 2025-09-09 | |
Coze 平台模型 | 新增字段 |
| 2025-09-09 |
2025 年 8 月
功能 | 说明 | 接口版本 | 发布时间 | 相关文档 |
|---|---|---|---|---|
AI 降噪 | 新增 AI 降噪能力(对应字段 |
| 2025-08-27 | |
智能语义断句 | 新增智能语义断句(对应字段 |
| 2025-08-27 | |
声纹降噪 | 新增声纹降噪功能,可用于提升在多人环境下的语音识别准确率。启用后,系统将识别人声并保留目标用户(TargetUserID)的声纹,同时抑制环境中的其他无关人声(旁人噪音)。
|
| 2025-08-27 | |
图片理解 | 新增支持图片理解。对话过程中,通过客户端或服务端随时向智能体发送一张或多张图片并提问。支持多图上传、图片分片上传。 |
| 2025-08-25 | |
Coze 平台模型 | 新增以下字段:
|
| 2025-08-14 | |
第三方大模型 | 新增字段 |
| 2025-08-13 |
2025 年 7 月
功能 | 说明 | 接口版本 | 发布时间 | 说明 |
|---|---|---|---|---|
自定义 TTS 服务 | 新增支持自定义 TTS 服务。具体参数参见 StartVoiceChat 中的 |
| 2025-07-11 | |
火山方舟大模型 | 支持设置模型的深度思考模式(关闭、启用深度思考等)。具体参数参见 StartVoiceChat 中的 |
| 2025-07-11 | |
第三方大模型 | 新增支持视觉理解。具体参数参见 StartVoiceChat 中的 |
| 2025-07-01 |
2025 年 6 月
功能 | 说明 | 接口版本 | 发布 | 相关文档 |
|---|---|---|---|---|
嵌入式硬件 | 嵌入式硬件场景下,支持标识是否为 License 用户。 |
| 2025-06-30 |
2025 年 5 月
功能 | 说明 | 接口版本 | 发布时间 | 相关文档 |
|---|---|---|---|---|
嵌入式硬件 | 嵌入式硬件场景下支持音频快速发送,实现更好的抗弱网能力。 |
| 2025-05-28 |
2025 年 4 月
功能 | 说明 | 接口版本 | 发布时间 | 相关文档 |
|---|---|---|---|---|
火山引擎语音识别大模型 |
|
| 2025-04-14 | |
配置对话触发模式 | 新增选择是否自动触发新一轮对话。 |
| 2025-04-14 | |
打断智能体 | 新增支持关键词打断,若用户说话内容开头包含任一传入打断词,智能体则立刻停止输出。 |
| 2025-04-14 | |
LLM 模块 | 移出 |
| 2025-04-14 | |
Coze 模型 | 新增支持 Coze 平台模型。 |
| 2025-04-11 |
2025 年 1 月
功能 | 说明 | 接口版本 | 发布时间 | 相关文档 |
|---|---|---|---|---|
智能体任务状态回调 | 新增支持智能体任务执行期间回调状态变化,以便你在业务端及时进行后续处理或保证业务的稳定性。 |
| 2025-01-09 | |
火山方舟平台 | 新增支持使用视觉理解模型。 |
| 2025-01-06 |
2024 年 12 月
功能 | 说明 | 接口版本 | 发布时间 | 相关文档 |
|---|---|---|---|---|
更新智能体 |
|
| 2024-12-31 | |
Function calling | 支持使用通过配置的 URL 接收 function calling 函数工具调用的信息指令。 |
| 2024-12-31 | |
实时字幕 | 支持字幕返回无需对齐 TTS 音频时间戳。 |
| 2024-12-31 | |
智能体配置 |
|
| 2024-12-31 | |
火山引擎语音合成大模型 | 新增支持火山引擎双向流式语音合成 |
| 2024-12-25 | |
语音合成 |
|
| 2024-12-25 | |
火山方舟平台模型 | 新增 |
| 2024-12-25 |
2024 年 11 月
功能 | 说明 | 接口版本 | 发布时间 | 相关文档 |
|---|---|---|---|---|
MiniMax 语音合成 | TTS 新增接入 MiniMax 服务提供商。 |
| 2024-11-08 | |
Function calling | 火山方舟平台模型新增支持 Function calling 功能,可使大模型识别用户对话中的特定需求,并调用外部函数实现天气查询、数学计算等功能。流式返回可实现逐步获取工具调用信息,更快收到 Function Calling 结果,从而提升响应效率。 |
| 2024-11-05 |
2024 年 10 月
功能 | 说明 | 接口版本 | 发布时间 | 相关文档 |
|---|---|---|---|---|
语音合成 | 新增支持 TTS 倍速、音量和音高调节。 |
| 2024-10-18 | |
打断智能体 | 新增支持自动打断功能开关。 |
| 2024-10-14 |
2024 年 8 月
功能 | 说明 | 接口版本 | 发布时间 | 相关文档 |
|---|---|---|---|---|
实时字幕 | 新增支持房间内字幕功能 |
| 2024-08-30 | |
火山引擎语音合成大模型 | 新增支持大模型语音合成服务和大模型声音复刻 2.0 服务,下线大模型声音复刻 1.0 服务。 |
| 2024-08-22 | |
第三方大模型 | 新增支持接入第三方大模型或 Agent(如 Dify Agent),以满足特定业务需求。 |
| 2024-08-22 | |
方舟平台模型 | 下线方舟 1.0 大模型,新增支持方舟 2.0 模型。 |
| 2024-08-22 |