实时对话式 AI 是一项组合服务,其总费用由 RTC 服务费和您所选的 AI 服务费构成。
如果您是通过扣子(Coze)平台自行搭建 AI 智能体实现的实时对话式 AI,扣子平台有独立的计费规则。具体计费规则,请参见扣子_音视频费用。
| 费用类别 | 计费项 | 免费额度( 仅限使用火山引擎服务) | 领取方式及规则 |
|---|---|---|---|
RTC 服务费
| 可通过 10000 分钟免费资源包抵扣 | ||
AI 服务费
| 火山方舟:每个模型赠送 50 万 tokens 的免费推理额度 | ||
豆包语音:
| |||
豆包语音:
|
与 AI 智能体进行实时通话会产生 RTC 音视频时长费用,具体产生的费用与启用的功能有关。
具体产生的费用:
- 即使房间内只有 1 个用户,也会计算音频计费时长。
- 若同时订阅了视频流和音频流,只计算视频计费时长,不计算音频计费时长。
| 场景 | 产生的音视频通话费 |
|---|---|
| 未启用视觉理解和数字人 | 音频通话费(真人和智能体互相订阅对方音频流) |
| 仅启用视觉理解 |
|
| 仅启用数字人 |
|
| 启用视觉理解 + 数字人 | 视频通话费(真人和智能体互相订阅对方音视频流) |
音视频计费规则:费用计算标准和普通的音视频通话费用一致。具体计费规则,请参见音视频通话计费。
AI 智能体处理用户音频或视频流时产生的计算资源费用。具体计费规则如下:
| 计费规则 | 说明 |
|---|---|
| 计费公式 | |
| 单价 | |
| 计费时长 |
|
| 付费方式 |
使用 LLM 进行推理服务时产生的费用,基于模型的输入和输出 tokens 计算。具体计费项和规则以实际使用的模型为准。
方舟平台模型服务计费,请参见模型服务计费。
AI 实时对话过程中将用户语音转换为文本的费用。具体计费项和规则以实际使用的服务为准。
火山引擎豆包语音识别服务计费,请参见 豆包语音_计费说明。
AI 实时对话过程中将 AI 智能体的文本回复转换为语音的费用,具体计费项和规则以实际使用的服务为准。
火山引擎豆包语音合成服务计费,请参见 豆包语音_计费说明。
你可以按照步骤停止实时对话式 AI 计费:
客户端各端的 API 说明,请参见 客户端 API 参考。
leaveRoom 使真人用户退出房间。destroyRTCEngine 销毁房间,释放资源。以下示例仅适用于全部使用火山引擎服务(RTC、方舟 LLM、豆包语音 ASR/TTS)的场景。
用户 A 进入 RTC 房间,与 AI 智能体进行了 10 分钟的实时语音对话。对话结束后,用户 A 退房,房间关闭。在这 10 分钟内:
各模块费用如下:
以下费用基于各计费项的后付费刊例价计算,不考虑上下文和免费额度,每个字按 0.59 tokens 计算。
| 计费项 | 单价 | 时长/字符数 | 费用 |
|---|---|---|---|
| 音视频通话 | 7元/千分钟 | 10 × 2=20 分钟(双向通话) | 0.007 × 20=0.14元 |
| 对话式 AI 音频处理时长 | 9元/千分钟 | 10 分钟 | 0.009 × 10=0.09元 |
| LLM 处理 (Doubao-pro-32k) | 0.0008 × 472/1000+0.002 × 590/1000=0.0015576元 | ||
| ASR 语音识别 (大模型流式语音识别) | 4.5元/小时 | 4 分钟 | 4.5 × 4/60=0.3元 |
| TTS 语音合成 (大模型语音合成) | 5元/万字符 | 1000 字符 | 5 × 1000/10000=0.5元 |
| 合计 | 1.0315576 元(约 1.03元) | ||