本文为您介绍火山方舟平台模型服务不同功能的计费方式、计费逻辑、计费项等内容。如需查询各模型的计费公式及单价请参考 模型服务价格。
在线推理功能支持以下 3 种计费方式,下表为您详细对比 3 种计费方式适用的场景、功能、模型、优势等内容,供您进行选型。
对比项 | |||
|---|---|---|---|
简介 | 根据模型推理时消耗的 token 数量进行后付费。 | TPM 保障包是针对某个特定模型以及版本保障请求并发达到一定 TPM( Tokens Per Minute)的计费模式。 | 模型单元提供专属算力,对精调后模型表现更优。 |
适用场景 | 说明 SLA(Service Level Agreement,服务等级协议)和延迟要求相对低
| 说明 SLA 要求高,延迟低,并发大
| 说明 精调后模型的高保障方案
|
适用功能 | 基础模型在线推理 | 基础模型在线推理 | 基础模型在线推理 |
主要优势 | 购买非常灵活,按 token 消耗量后付费。 |
|
|
支持模型 |
|
|
|
价格比较 | 低 | 中 | 高 |
服务承诺 | 不对并发能力(TPM)进行承诺 | 对成功购买的保障包内,保障 token 并发(TPM) | 平台提供的算力,可以保障平台预置数据集在相同配置下压测得出低于一定延时的并发 |
计费特点 | 计算token使用量 | 购买“TPM 额度”
| 购买 “个”模型单元
|
起购时长 | - | 预付费 1 天起购 | 预付费 1 个月起购 |
按 token 后付费,统计模型进行实时推理服务时消耗的 token 数量,按量后付费。
不同模型服务的计费项不同,具体请参考 模型服务价格。
prompt_token。completion_token。开启上下文缓存功能后,会增加以下计费项。更多信息请参见 上下文缓存。
prompt_token单价;未被命中的 token 仍按照prompt_token计费。按 token 后付费,统计模型进行批量推理服务时消耗的 token 数量,按量后付费。
不同模型服务的计费项不同,具体请参考 模型服务价格。
prompt_token。completion_token。部分模型在2025年4月14日21:00开始支持透明前缀缓存能力,您无需任何配置,即可享受前缀缓存技术应用带来的费用降低。
prompt_token单价的 4 折;未被命中的 token 仍按照prompt_token计费。模型训练一般包括以下两种计费模式,不同模型在不同训练方法下支持不同的计费模式,具体支持情况以控制台显示为准。
说明
在按算力付费的训练过程中,模型部署、产物导出同步以及模型训练阶段(强化学习包含train、rollout、reward计算等环节)将按耗时计费,而数据预处理、训练排队、训练完成、失败阶段不计费。针对手动停止和最终失败的任务,则依据停止时的实际耗时计费。
为提升费用结算的时效性与用户体验,将对部分模型服务功能的出账周期模式进行升级,将现有的按小时计费模式,升级为准实时计费模式。
说明
本次服务升级将于2025年9月11日至9月30日分批完成,逐步覆盖所有线上客户账号。
升级过程中您的服务不会受影响,账单出具时间请以系统实际出账为准。
|
|
|---|---|
每小时出具上一小时费用账单。 | 每5分钟出具上一计费周期费用账单。 |
说明
火山引擎为您提供按小时计费与准实时计费两种模式,该等计费及出账方式旨在协助您更高效、及时地查看账单信息。
如因技术原因导致出账时间延迟,敬请谅解,出账时间和周期均以平台实际执行为准。如您因使用该计费模式而造成损失,火山引擎免责。
模型服务功能 | 计费方式 | 计费项 | 出账周期模式 |
|---|---|---|---|
在线推理(包括精调后推理) | 按token后付费 | 推理输入 |
|
推理输出 |
| ||
缓存命中 |
| ||
缓存存储 | 按小时计费 | ||
TPM 保障包 | |||
模型单元 | |||
批量推理 | 按token后付费 | 推理输入 |
|
推理输出 |
| ||
缓存命中 |
| ||
精调 | 按 token 后付费 | 按 token 后付费 | 按小时计费 |
按算力付费 | 按算力付费 | 按小时计费 |
注意
火山方舟于 2025年7月16日00:00:00 启用新的模型服务欠费规则:由 出具账单后欠费2小时以上关停 变更为 欠费1分钟即关停。如需保障稳定的线上服务,可开启 延期免停权益。
后付费账单按小时结算,出具账单后实时结算扣款。如果您账户中的可用额度(含账户余额和代金券)小于待结算的账单,会被认为欠费。
欠费时长 | 说明 |
|---|---|
欠费时长 ≤ 1 分钟 | 您可以正常使用火山方舟模型服务,火山方舟按照您的具体使用量出具账单。 |
欠费时长 > 1 分钟 | 平台会给您发送相关通知,并 关停服务。账号下的所有火山方舟相关模型服务将无法正常使用。 |
警告
什么是 token?如何计算 token 数量?
模型推理请求报错或者中断会计费么?
精调任务失败会计费吗?
手动停止精调任务会计费吗?
账户欠费后如何充值?
为什么我的账户欠费后仍在持续出账?
如何按 Endpoint ID 或精调任务 ID 分账?