本文为您介绍火山方舟平台模型服务不同功能的计费方式、计费逻辑、计费项等内容。如需查询各模型的计费公式及单价请参考 模型服务价格。
说明
诚邀您参与有奖问卷调查,助力优化计费文档体验,前100位参与者将获得火山方舟代金券 。
在线推理功能支持以下 3 种计费方式,下表为您详细对比 3 种计费方式适用的场景、功能、模型、优势等内容,供您进行选型。
对比项 | |||
---|---|---|---|
简介 | 根据模型推理时消耗的 token 数量进行后付费。 | TPM 保障包是针对某个特定模型以及版本保障请求并发达到一定 TPM( Tokens Per Minute)的计费模式。 | 模型单元提供专属算力,对精调后模型表现更优。 |
适用场景 | 说明 SLA(Service Level Agreement,服务等级协议)和延迟要求相对低
| 说明 SLA 要求高,延迟低,并发大
| 说明 精调后模型的高保障方案
|
适用功能 | 基础模型在线推理 | 基础模型在线推理 | 基础模型在线推理 |
主要优势 | 购买非常灵活,按 token 消耗量后付费。 |
|
|
支持模型 |
|
|
|
价格比较 | 低 | 中 | 高 |
服务承诺 | 不对并发能力(TPM)进行承诺 | 对成功购买的保障包内,保障 token 并发(TPM) | 平台提供的算力,可以保障平台预置数据集在相同配置下压测得出低于一定延时的并发 |
计费单位 | token | 购买“TPM 额度” | 购买 “个”模型单元 |
起购时长 | - | 预付费 1 天起购 | 预付费 1 个月起购 |
按 token 后付费,统计模型进行实时推理服务时消耗的 token 数量,按量后付费。
不同模型服务的计费项不同,具体请参考 模型服务价格。
prompt_token
。completion_token
。开启上下文缓存功能后,会增加以下计费项。更多信息请参见 上下文缓存。
prompt_token
单价;未被命中的 token 仍按照prompt_token
计费。按小时结算,账单出账时间通常在当前计费周期结束后1-2小时左右,具体以系统实际出账时间为准。例如:16:00-17:00 的账单约在 18:00-19:00 出账。
按 token 后付费,统计模型进行批量推理服务时消耗的 token 数量,按量后付费。
不同模型服务的计费项不同,具体请参考 模型服务价格。
prompt_token
。completion_token
。部分模型在2025年4月14日21:00开始支持透明前缀缓存能力,您无需任何配置,即可享受前缀缓存技术应用带来的费用降低。
prompt_token
单价的 4 折;未被命中的 token 仍按照prompt_token
计费。按小时结算,账单出账时间通常在当前计费周期结束后1-2小时左右,具体以系统实际出账时间为准。例如:16:00-17:00 的账单约在 18:00-19:00 出账。
按 token 后付费,统计模型进行训练时消耗的 token 数量,按量后付费。
按小时结算,账单出账时间通常在训练任务结束后的1-2小时左右,具体以系统实际出账时间为准。例如:16:00-17:00 的账单约在 18:00-19:00 出账。
后付费账单按小时结算,出具账单后实时结算扣款。如果您账户中的可用额度(含账户余额和代金券)小于待结算的账单,会被认为欠费。
欠费时长 | 说明 |
---|---|
欠费时长 ≤ 2 小时 | 您可以正常使用火山方舟模型服务,火山方舟按照您的具体使用量出具账单。 |
欠费时长 > 2 小时 | 平台会给您发送相关通知,并 关停服务。账号下的所有火山方舟相关模型服务将无法正常使用。 |
什么是 token?如何计算 token 数量?
模型推理请求报错或者中断会计费么?
精调任务失败会计费吗?
手动停止精调任务会计费吗?
账户欠费后如何充值?
为什么我的账户欠费后仍在持续出账?
如何按 Endpoint ID 或精调任务 ID 分账?