You need to enable JavaScript to run this app.
导航
对话式 AI 计费
最近更新时间:2025.11.19 11:47:50首次发布时间:2024.12.04 11:17:11
复制全文
我的收藏
有用
有用
无用
无用

实时对话式 AI 是一项组合服务,其总费用由 RTC 服务费和您所选的 AI 服务费构成。

如果您是通过扣子(Coze)平台自行搭建 AI 智能体实现的实时对话式 AI,扣子平台有独立的计费规则。具体计费规则,请参见扣子_音视频费用

费用组成 & 试用

费用类别计费项免费额度( 仅限使用火山引擎服务)领取方式及规则

RTC 服务费

由火山引擎 RTC 收取,所有用户均会产生该费用

可通过 10000 分钟免费资源包抵扣

10000 分钟免费资源包

AI 服务费

由你选择的服务商收取

火山方舟:每个模型赠送 50 万 tokens 的免费推理额度

模型服务计费

豆包语音

  • 流式语音识别:每个豆包语音应用 20 小时
  • 流式语音识别大模型:每个豆包语音应用 20 小时

试用额度

豆包语音

  • 语音合成:每个豆包语音应用 20000 次
  • 语音合成大模型:每个豆包语音应用 20000 字符
  • 声音复刻大模型:每个豆包语音应用 20000 字符

试用额度

计费规则

音视频通话费

与 AI 智能体进行实时通话会产生 RTC 音视频时长费用,具体产生的费用与启用的功能有关。

  • 具体产生的费用

    • 即使房间内只有 1 个用户,也会计算音频计费时长。
    • 若同时订阅了视频流和音频流,只计算视频计费时长,不计算音频计费时长。
    场景产生的音视频通话费
    未启用视觉理解和数字人音频通话费(真人和智能体互相订阅对方音频流)
    仅启用视觉理解
    • 音频通话费(真人订阅智能体的音频流)
    • 视频通话费(智能体订阅真人的音视频流)
    仅启用数字人
    • 音频通话费(智能体订阅真人的音频流)
    • 视频通话费(真人订阅智能体的音视频流)
    启用视觉理解 + 数字人视频通话费(真人和智能体互相订阅对方音视频流)
  • 音视频计费规则:费用计算标准和普通的音视频通话费用一致。具体计费规则,请参见音视频通话计费

对话式 AI 音频/视频处理时长费

AI 智能体处理用户音频或视频流时产生的计算资源费用。具体计费规则如下:

计费规则说明
计费公式
  • 音频处理时长费 = 音频处理时长单价 × 音频处理计费时长
  • 视频处理时长费 = 视频处理时长单价 × 视频处理计费时长
  • 单价
  • 音频处理时长(即账单中的对话式AI-音频时长):9元/千分钟
  • 视频处理时长:99元/千分钟
  • 计费时长
    • 视频处理计费时长:实时对话式 AI 任务处理视频帧的总时长。若一个任务中有多段不连续的视频处理,每段视频处理单独计算时长,然后累加作为该任务的视频总时长。
    • 音频处理计费时长:任务时长 - 视频处理时长
    • 其中,
      • 实时对话式 AI 任务时长:为服务端调用智能体任务从开始到结束的整体时长。
      • 每个自然日的计费时长独立计算,精确到分钟,如果单个自然日内的总计费时长不足 1 分钟,则按 1 分钟来计费。
    付费方式
  • 通过 10000 分钟免费资源包抵扣:具体的抵扣规则,请参见 10000 分钟免费资源包
  • 按量付费:即先使用,后付费,按月结算,每月初出具上一月账单并扣费,通过账户余额抵扣。
  • LLM 服务费

    使用 LLM 进行推理服务时产生的费用,基于模型的输入和输出 tokens 计算。具体计费项和规则以实际使用的模型为准。

    方舟平台模型服务计费,请参见模型服务计费

    语音识别(ASR)费

    AI 实时对话过程中将用户语音转换为文本的费用。具体计费项和规则以实际使用的服务为准。

    火山引擎豆包语音识别服务计费,请参见 豆包语音_计费说明

    语音合成(TTS)费

    AI 实时对话过程中将 AI 智能体的文本回复转换为语音的费用,具体计费项和规则以实际使用的服务为准。

    火山引擎豆包语音合成服务计费,请参见 豆包语音_计费说明

    如何停止计费

    你可以按照步骤停止实时对话式 AI 计费:

    客户端各端的 API 说明,请参见 客户端 API 参考

    1. 调用服务端 API StopVoiceChat 结束对话。
      调用后,AI 智能体会退出房间,ASR、LLM、TTS 服务会停止工作并停止计费。若真人用户未退出房间,仍会产生 RTC 音频订阅费。
    2. 调用客户端 API leaveRoom 使真人用户退出房间。
      真人用户退出房间后,RTC 音频订阅费会停止计费。
    3. 调用客户端 API destroyRTCEngine 销毁房间,释放资源。

    计费示例

    以下示例仅适用于全部使用火山引擎服务(RTC、方舟 LLM、豆包语音 ASR/TTS)的场景。

    用户 A 进入 RTC 房间,与 AI 智能体进行了 10 分钟的实时语音对话。对话结束后,用户 A 退房,房间关闭。在这 10 分钟内:

    • 用户 A 的说话时长:4 分钟
    • 用户 A 的语音转录文字数:800 字
    • 智能体回复文字数:1000 字
    • 使用到的模型:Doubao-pro-32k(LLM)、大模型流式语音识别(ASR)、大模型语音合成(TTS)

    各模块费用如下:

    以下费用基于各计费项的后付费刊例价计算,不考虑上下文和免费额度,每个字按 0.59 tokens 计算。

    计费项单价时长/字符数费用
    音视频通话7元/千分钟10 × 2=20 分钟(双向通话)0.007 × 20=0.14元
    对话式 AI 音频处理时长9元/千分钟10 分钟0.009 × 10=0.09元
    LLM 处理
    (Doubao-pro-32k)
  • 推理服务(输入):0.0008 元/千token
  • 推理服务(输出):0.0020 元/千token
  • 输入:800 × 0.59=472 tokens
  • 输出:1000 × 0.59=590 tokens
  • 0.0008 × 472/1000+0.002 × 590/1000=0.0015576元
    ASR 语音识别
    (大模型流式语音识别)
    4.5元/小时4 分钟4.5 × 4/60=0.3元
    TTS 语音合成
    (大模型语音合成)
    5元/万字符1000 字符5 × 1000/10000=0.5元
    合计1.0315576 元(约 1.03元