新功能发布记录
本文介绍了硬件对话智能体新功能特性的发布动态。
2025年12月
产品特性 | 所属模块 | 功能描述 | 上线范围 | 相关文档 |
|---|
新增喵伴 Demo 及套件 | 示例工程(Demo) | 开源示例工程新增对乐鑫 ESP32-S3-EchoEar(喵伴)开发板的支持。
除了提供完整的源代码外,我们还特别推出了预编译的开发套件 bin 包,支持一键烧录体验。
您可以从 GitHub 仓库下载源码或联系我们获取开发套件。 | 全量发布 | 获取 Demo 和 SDK |
新增平台移植指南 | 文档中心 | 新增“高质量方案设备端 SDK 移植指南”,为开源示例工程暂不支持平台的开发者提供技术指引。 | 全量发布 | 高质量方案设备端 SDK 移植指南 |
支持自定义音色训练 | 控制台/API | 新增声音复刻功能,支持通过控制台界面或服务端 API 训练自定义音色。
该功能允许您通过录制少量音频样本,快速生成高度还原特定人声的数字音色。训练完成后的音色可直接应用于智能体的 TTS 配置中。
您可以访问控制台的 复刻音色 页面进行操作,或调用 TrainTTSVoiceType 相关接口。 | 全量发布 | 使用声音复刻 训练自定义音色 TrainTTSVoiceType |
支持端到端语音模型 | 智能体(API) | 服务端 API 新增 S2SConfig 配置,支持端到端语音模型。
该功能通过端到端模型直接处理语音输入并生成语音输出,省去了中间的“语音转文字(ASR)”和“文字转语音(TTS)”转换过程,从而显著降低对话延迟,并保留更丰富的语音韵律与情感特征。
您可以通过 Config.S2SConfig 参数配置该功能。 | 全量发布 | 创建智能体 AibotCreate 更新智能体 AibotUpdate 查询智能体 AibotQuery 查询指定产品或设备关联的智能体 AibotDescribeBinding |
支持 AIGC 音乐播放能力「限时免费公测」 | 智能体(API) | 服务端 API 新增 MusicAgentConfig 配置,支持智能体接入 AIGC 音乐播放能力。启用后,智能体能够根据用户指令播放音乐和控制音乐播放(如暂停、切歌等)。
该功能目前处于免费公测阶段。您可以通过 Config.MusicAgentConfig 参数配置该功能。 | 全量发布 |
新增文本发送接口 | 客户端(SDK) | 客户端 SDK 新增 volc_send_text_to_agent 接口,允许应用层向智能体发送文本进行直接播报,增强端云交互的灵活性。 | 全量发布 | API 参考 |
2025年11月
产品特性 | 所属模块 | 功能描述 | 上线范围 | 相关文档 |
|---|
支持声纹降噪 | 智能体(API) | 服务端 API 新增声纹管理能力,支持声纹降噪与声纹识别功能。
声纹相关功能通过识别并锁定目标用户声音,能有效抑制环境中的旁人噪声,从而提升多人场景下的语音交互体验与识别准确率,同时支持对特定用户的身份进行校验。
您可以调用声纹管理相关接口(如 IotVoicePrintRegister)维护声纹库,并在智能体配置中通过 AgentConfig.VoicePrint 参数启用相应的降噪或识别模式。 | 全量发布 | |
支持 MCP 服务 | 智能体(API) | 服务端 API 新增对 MCP(模型上下文协议)的支持。
该功能允许您将知识库问答(RAG)、数据分析等外部服务封装为标准化工具,使 LLM 能够在对话中智能调用这些工具以获取数据或执行操作,从而扩展智能体处理复杂业务任务的能力。
您可以在智能体配置中通过 Config.LLMConfig.MCP 参数,指定 MCP Server 地址及关注的工具列表来快速接入。 | 全量发布 | |
支持联网问答 | 智能体(API) | 服务端 API 新增联网问答能力,支持接入火山引擎联网问答 Agent。
启用联网问答可使智能体具备实时检索互联网信息(如最新资讯、天气、实时股价)并进行总结回答的能力,有效补充模型训练数据的时效性短板。
您可以在智能体配置中通过 Config.WebSearchAgentConfig 对象来开启此功能。 | 全量发布 | |
支持模型自定义参数 | 智能体(API) | 服务端 API 的 Config.LLMConfig 配置新增多项自定义参数支持,以提升模型集成的灵活性。
此次更新支持: - 通过
ExtraHeader 为方舟及第三方模型添加自定义请求头。 - 通过
Custom 字段为第三方模型传递特定配置。 - 为 Coze Bot 设置
CustomVariables、MetaData 及 Parameters。
这些变更允许您更精细地控制模型行为并满足特定的鉴权或数据透传需求。
您可以在创建或更新智能体时,在 Config.LLMConfig 对象中配置这些新字段以应用该功能。 | 全量发布 | |
最近更新时间:2026.01.12 16:43:14