We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们
文档
备案
控制台
登录
立即注册
实时对话式 AI
整合大模型(LLM), 语音识别(ASR), 语音合成(TTS)等人工智能技术, 通过火山引擎RTC实现音视频数据的高效采集、处理和传输,快速实现用户与大模型间流畅、自然、真人感的实时对话功能
整合大模型(LLM), 语音识别(ASR), 语音合成(TTS)等人工智能技术, 通过火山引擎RTC实现音视频数据的高效采集、处理和传输,快速实现用户与大模型间流畅、自然、真人感的实时对话功能
秒级延迟
全豆包链路
95%
屏蔽干扰噪声
90%
屏蔽误插话
立即使用
产品文档
业务咨询
硬件对话智能体
NEW
让硬件会听会看会说话
体验 Demo
HOT
豆包最新多模态大模型
跑通 Demo
无代码
3 分钟快速跑通验证
开源 Demo
Web Demo 源码及教程
方案能力
应用场景
方案架构
客户案例
接入流程
让用户和 AI 的互动体验更具真人感
智能降噪
智能打断
超低延时
真人音色
灵活扩展
抗弱网
智能降噪
结合声纹降噪、音频 AI 降噪等算法,过滤 95% 干扰噪声,聚焦目标用户声音,提升智能体语音识别和打断的准确率
立即咨询
智能打断
结合音频帧级别的人声检测(VAD)和语义理解技术,屏蔽 90% 误插话,让真人和智能体的对话轮次交替更自然
立即咨询
超低延时
通过音频流式处理算法,优化 RTC+ASR+LLM+TTS 各个环节的交互延时,端到端整体时延低至 1 秒
立即咨询
真人音色
支持豆包同款音色,自然生动,善于演绎
支持声音复刻,1:1 还原,个性化定制
立即咨询
灵活扩展
多模态、模型扩展:支持无缝扩展至视频 AI 实时互动场景,支持第三方/自部署 LLM/ASR/TTS 灵活组合接入方案
多人扩展:支持无缝扩展至 1v多 AI 实时互动场景
立即咨询
抗弱网
通过智能接入、RTC 云端协同优化,在复杂和弱网环境下确保低延时和传输可靠性,避免因丢字引起大模型理解错误
立即咨询
智能降噪
结合声纹降噪、音频 AI 降噪等算法,过滤 95% 干扰噪声,聚焦目标用户声音,提升智能体语音识别和打断的准确率
立即咨询
智能打断
结合音频帧级别的人声检测(VAD)和语义理解技术,屏蔽 90% 误插话,让真人和智能体的对话轮次交替更自然
立即咨询
超低延时
通过音频流式处理算法,优化 RTC+ASR+LLM+TTS 各个环节的交互延时,端到端整体时延低至 1 秒
立即咨询
真人音色
支持豆包同款音色,自然生动,善于演绎
支持声音复刻,1:1 还原,个性化定制
立即咨询
灵活扩展
多模态、模型扩展:支持无缝扩展至视频 AI 实时互动场景,支持第三方/自部署 LLM/ASR/TTS 灵活组合接入方案
多人扩展:支持无缝扩展至 1v多 AI 实时互动场景
立即咨询
抗弱网
通过智能接入、RTC 云端协同优化,在复杂和弱网环境下确保低延时和传输可靠性,避免因丢字引起大模型理解错误
立即咨询
智能降噪
结合声纹降噪、音频 AI 降噪等算法,过滤 95% 干扰噪声,聚焦目标用户声音,提升智能体语音识别和打断的准确率
智能打断
结合音频帧级别的人声检测(VAD)和语义理解技术,屏蔽 90% 误插话,让真人和智能体的对话轮次交替更自然
超低延时
通过音频流式处理算法,优化 RTC+ASR+LLM+TTS 各个环节的交互延时,端到端整体时延低至 1 秒
真人音色
支持豆包同款音色,自然生动,善于演绎
支持声音复刻,1:1 还原,个性化定制
灵活扩展
多模态、模型扩展:支持无缝扩展至视频 AI 实时互动场景,支持第三方/自部署 LLM/ASR/TTS 灵活组合接入方案
多人扩展:支持无缝扩展至 1v多 AI 实时互动场景
抗弱网
通过智能接入、RTC 云端协同优化,在复杂和弱网环境下确保低延时和传输可靠性,避免因丢字引起大模型理解错误
适用于不同场景的AI应用
情感陪伴
支持丰富音色和声音克隆,满足个性化情感陪伴和角色扮演需求
延时低至 1 秒,随时插话打断,交流更自然
帧级别音/字/画同步,状态词过滤,对话更沉浸
立即使用
在线教育
支持多模态、多语言,拓展丰富教育场景及功能
超低延时响应,随时插话打断,模拟真实教学交流体验
支持降噪和声纹识别,家长陪伴场景不打扰教学效果
立即使用
游戏教练
实时识别游戏画面,精准理解实时游戏战况局面
基于 RAG/联网搜索,提供专业的攻略和建议
支持长期记忆和个性化设置,提供专属指导和情绪价值
立即使用
智能硬件
适配各类硬件终端,有效处理各种回声、噪声、弱网等环境问题
支持对接 RAG 和 FC,无缝调用个性化服务
更低的 CPU 与内存资源占用,更适应各类低功耗芯片
立即使用
智能客服
实时响应、支持插话打断、逼真音色语气,让客服更具真人感
基于 RAG 和记忆能力,提供专业、个性化的服务体验
支持基于软交换技术与 PSTN 公共电话互联
立即使用
情感陪伴
支持丰富音色和声音克隆,满足个性化情感陪伴和角色扮演需求
延时低至 1 秒,随时插话打断,交流更自然
帧级别音/字/画同步,状态词过滤,对话更沉浸
立即使用
在线教育
支持多模态、多语言,拓展丰富教育场景及功能
超低延时响应,随时插话打断,模拟真实教学交流体验
支持降噪和声纹识别,家长陪伴场景不打扰教学效果
立即使用
游戏教练
实时识别游戏画面,精准理解实时游戏战况局面
基于 RAG/联网搜索,提供专业的攻略和建议
支持长期记忆和个性化设置,提供专属指导和情绪价值
立即使用
智能硬件
适配各类硬件终端,有效处理各种回声、噪声、弱网等环境问题
支持对接 RAG 和 FC,无缝调用个性化服务
更低的 CPU 与内存资源占用,更适应各类低功耗芯片
立即使用
智能客服
实时响应、支持插话打断、逼真音色语气,让客服更具真人感
基于 RAG 和记忆能力,提供专业、个性化的服务体验
支持基于软交换技术与 PSTN 公共电话互联
立即使用
情感陪伴
支持丰富音色和声音克隆,满足个性化情感陪伴和角色扮演需求
延时低至 1 秒,随时插话打断,交流更自然
帧级别音/字/画同步,状态词过滤,对话更沉浸
在线教育
支持多模态、多语言,拓展丰富教育场景及功能
超低延时响应,随时插话打断,模拟真实教学交流体验
支持降噪和声纹识别,家长陪伴场景不打扰教学效果
游戏教练
实时识别游戏画面,精准理解实时游戏战况局面
基于 RAG/联网搜索,提供专业的攻略和建议
支持长期记忆和个性化设置,提供专属指导和情绪价值
智能硬件
适配各类硬件终端,有效处理各种回声、噪声、弱网等环境问题
支持对接 RAG 和 FC,无缝调用个性化服务
更低的 CPU 与内存资源占用,更适应各类低功耗芯片
智能客服
实时响应、支持插话打断、逼真音色语气,让客服更具真人感
基于 RAG 和记忆能力,提供专业、个性化的服务体验
支持基于软交换技术与 PSTN 公共电话互联
可扩展、可定制的灵活架构
进阶体验
支持音频/图像/视频多模态实时交互
支持实时字幕、Function Call、过滤指定内容等
快速接入
开箱即用的场景化 Demo
3个 API 实现与大模型实时交互
立即咨询
关联产品
实时音视频
豆包大模型
豆包视觉理解模型
豆包语音大模型
进阶体验
支持音频/图像/视频多模态实时交互
支持实时字幕、Function Call、过滤指定内容等
关联产品
实时音视频
豆包大模型
豆包视觉理解模型
豆包语音大模型
进阶体验
支持音频/图像/视频多模态实时交互
支持实时字幕、Function Call、过滤指定内容等
关联产品
实时音视频
豆包大模型
豆包视觉理解模型
豆包语音大模型
他们的用户都在和大模型实时对话
豆包是你的多功能 AI 助手,为你的生活、学习、工作提供帮助,为你搜索信息,答疑解惑,分析总结,提供灵感,辅助创作。你也可以使用豆包的语音通话功能,让豆包伴你一起学习工作,不打断手上工作,随时和她聊聊
立即咨询
扣子是新一代 AI 应用开发平台,借助可视化设计与编排工具,开发者可以快速搭建基于大模型的各类 AI 项目;集成扣子智能语音 OpenAPI,可以使用户能够和扣子上的智能体进行低延迟、可打断的实时通话
立即咨询
“显眼包”是一款基于大模型开发的情感陪伴玩偶,它不仅能理解并积极回应复杂的问题,还会用鼓励的方式进行互动,内置中英文双语,不管你走到哪里,“显眼包”都会陪在你身边,为你带来大模型智能生成时代的愉悦体验
立即咨询
豆包
扣子
显眼包
豆包是你的多功能 AI 助手,为你的生活、学习、工作提供帮助,为你搜索信息,答疑解惑,分析总结,提供灵感,辅助创作。你也可以使用豆包的语音通话功能,让豆包伴你一起学习工作,不打断手上工作,随时和她聊聊
立即咨询
扣子是新一代 AI 应用开发平台,借助可视化设计与编排工具,开发者可以快速搭建基于大模型的各类 AI 项目;集成扣子智能语音 OpenAPI,可以使用户能够和扣子上的智能体进行低延迟、可打断的实时通话
立即咨询
“显眼包”是一款基于大模型开发的情感陪伴玩偶,它不仅能理解并积极回应复杂的问题,还会用鼓励的方式进行互动,内置中英文双语,不管你走到哪里,“显眼包”都会陪在你身边,为你带来大模型智能生成时代的愉悦体验
立即咨询
更多合作客户
创建你的第一个实时对话式AI应用
了解开发流程,试试无代码跑通「实时对话式AI」Demo
01
开通服务
注册并开通火山引擎RTC/ASR/TTS/LLM
02
集成SDK
集成火山引擎RTC SDK实现采集与进房通话功能
03
调用智能体
调用相关OpenAPI接口实现智能体实时交互能力
或者,用扣子让构建AI更容易
零代码快速搭建个性化智能体
扣子:新一代AI应用开发平台
拖拉拽快速编排工作流
1万+插件,拓展智能体能力边界
3步实现和扣子智能体实时对话
将扣子创建的智能体发布为Agent as API
集成对应平台的RTC SDK
创建RTC房间,并将智能体加入房间
立即使用