模型费用--扣子-火山引擎

文档中心

扣子

低代码计费项

模型费用

在使用扣子低代码智能体或应用时，通常需要调用大模型处理问题，例如在工作流中使用大模型节点或进行知识库召回等场景。不同的模型收费规则不同。本文档介绍通过扣子使用模型服务时会涉及的费用。

模型类型

通过扣子使用模型服务时，可以根据模型的接入方对模型进行分类，分为扣子模型和方舟模型。如何区分模型类型，可参考如何在扣子中区分扣子模型和火山方舟模型。

模型类型	说明	费用
扣子模型	由扣子统一对接、面向所有扣子用户提供的模型服务，均为扣子模型。通常来说，除火山方舟以外的模型，均为扣子模型。在智能体或工作流大模型节点中选择模型时，如果模型分类展示为豆包系列、新模型体验、Kimi 系列等火山方舟以外的字样，表示此分类的模型为扣子模型。	收费模型：豆包模型、DeepSeek 模型、部分智谱模型，根据 token 扣减积分。具体单价可参考扣子模型费用。限时免费模型：Kimi-8k、Kimi-32k、Kimi-128k、阶跃星辰等其他模型限时免费，但限额使用，每个模型 100次/天，不扣减积分。超出当日免费调用额度后，系统将提示您已超过模型并发上限。
方舟模型	企业版（标准版、旗舰版）支持在火山引擎方舟大模型服务平台创建接入点，从而自行接入所需的模型。这种方式接入的模型被称为方舟模型。在智能体或工作流大模型节点中选择模型时，如果模型分类展示为`火山方舟 \| 由字节跳动提供`，表示这个分类下的模型为方舟模型。	根据模型 token 用量由火山方舟侧收取费用，不支持抵扣扣子积分。模型 token 单价可参考火山方舟文档。

扣子模型费用

计费公式

扣子模型服务根据模型推理时消耗的 token 数量计费，计费公式如下：

模型费用🟰输入单价 ✖️ (输入token ➖ 缓存命中token)
 ➕ 缓存命中单价 ✖️ 缓存命中token
 ➕ 输出单价 ✖️ 输出token

在大语言模型中，token 是文本处理的基本单位，token 可以是单词、字符、子词片段或其他形式的文本片段，具体的划分方式取决于模型使用的分词算法，所以 token 的计算和处理方式可能会根据模型的具体架构和设计而有所不同。

输入 token：将推理输入的内容（包括但不限于文字、图片）转化为 token 数进行计费。
输出 token：将推理输出的内容（包括但不限于文字、图片）转化为 token 数进行计费。
缓存命中 token：当你的请求被系统判断命中了缓存内容时，被命中的 token 会按照缓存命中 token 单价来计费。目前缓存命中 Token 单价为 0，不计费。仅部分模型支持开启上下文缓存功能。

单价

在扣子中，所有扣子计费资源的消耗默认通过积分抵扣。账户内积分余额不足时，系统将自动从主账号的现金账户中扣除对应的金额。每个模型 token 的单价不同，具体如下：

豆包系列

说明

使用豆包 1.6 模型时，输入 token 单价和输出 token 单价均由输入长度决定。例如调用豆包·1.6·自动深度思考模型时，当 1 个请求的输入长度为 200 千tokens，输出长度为 14 千token 时，满足条件输入长度 (128, 256]，将采用计费项 Doubao-Seed-1.6-256k（输入）和 Doubao-Seed-1.6-256k（输出）。
企业版具备免费额度。
- Doubao-Seedance-1.0-lite、Doubao-Seedance-1.0-pro 模型各自为每个企业版账号（主账号+子账号）提供累计 100 万tokens 免费额度。免费额度耗尽后如需继续使用，会从账号中扣减积分。
- 豆包语音播客大模型-输入为每个企业版账号（主账号+子账号）提供累计 20 千tokens 免费额度；豆包语音播客大模型-输出为每个企业版账号（主账号+子账号）提供累计 30 千tokens 免费额度。免费额度耗尽后如需继续使用，会从账号中扣减积分。

模型名称/计费项	条件（千 tokens）	输入/输出/缓存命中	单价
模型名称/计费项	条件（千 tokens）	输入/输出/缓存命中	积分结算（积分/千tokens）	现金结算（元/千tokens）
豆包·2.0·Code （Doubao-Seed-2.0-Code）	输入长度 [0, 32]	输入	3.2	0.0032
	输入长度 [0, 32]	输出	16	0.016
	输入长度 (32, 128]	输入	4.8	0.0048
	输入长度 (32, 128]	输出	24	0.024
	输入长度(128, 256]	输入	9.6	0.0096
	输入长度(128, 256]	输出	48	0.048
doubao-seed-2.0-pro	输入长度 [0, 32]	输入	3.2	0.0032
	输入长度 [0, 32]	输出	16	0.016
	输入长度 (32, 128]	输入	4.8	0.0048
	输入长度 (32, 128]	输出	24	0.024
	输入长度(128, 256]	输入	9.6	0.0096
	输入长度(128, 256]	输出	48	0.048
doubao-seed-2.0-lite	输入长度 [0, 32]	输入	0.6	0.0006
	输入长度 [0, 32]	输出	3.6	0.0036
	输入长度 (32, 128]	输入	0.9	0.0009
	输入长度 (32, 128]	输出	5.4	0.0054
	输入长度(128, 256]	输入	1.8	0.0018
	输入长度(128, 256]	输出	10.8	0.0108
doubao-seed-2.0-mini	输入长度 [0, 32]	输入	0.2	0.0002
	输入长度 [0, 32]	输出	2	0.002
	输入长度 (32, 128]	输入	0.4	0.0004
	输入长度 (32, 128]	输出	4	0.004
	输入长度(128, 256]	输入	0.8	0.0008
	输入长度(128, 256]	输出	8	0.008
豆包·1.8·深度思考（Doubao-Seed-1.8）	输入长度 [0, 32]且输出长度 [0, 0.2] 对应Doubao-Seed-1.8特惠区推理计费项	输入	0.8	0.0008
	输入长度 [0, 32]且输出长度 [0, 0.2] 对应Doubao-Seed-1.8特惠区推理计费项	输出	2	0.002
	输入长度 [0, 32]且输出长度 (0.2, +∞)	输入	0.8	0.0008
	输入长度 [0, 32]且输出长度 (0.2, +∞)	输出	8	0.008
	输入长度 (32, 128]	输入	1.2	0.0012
	输入长度 (32, 128]	输出	16	0.016
	输入长度(128, 256]	输入	2.4	0.0024
	输入长度(128, 256]	输出	24	0.024
豆包·编程（Doubao-Seed-Code）	输入长度 [0, 32]	输入	1.2	0.0012
	输入长度 [0, 32]	输出	8	0.008
	输入长度 (32, 128]	输入	1.4	0.0014
	输入长度 (32, 128]	输出	12	0.012
	输入长度 (128, 256]	输入	2.8	0.0028
	输入长度 (128, 256]	输出	16	0.016
		输出	12	0.012
豆包·1.6·视觉理解·250815 （Doubao-Seed-1.6-vision）	输入长度 [0, 32]	输入	0.8	0.0008
	输入长度 [0, 32]	输出	8	0.008
	输入长度 (32, 128]	输入	1.2	0.0012
	输入长度 (32, 128]	输出	16	0.016
	输入长度 (128, 256]	输入	2.4	0.0024
	输入长度 (128, 256]	输出	24	0.024
豆包·1.6·自动深度思考豆包·1.6·思考深度调节（Doubao-Seed-1.6）	输入长度 [0, 32] 且输出长度 [0, 0.2]	输入	0.8	0.0008
	输入长度 [0, 32] 且输出长度 [0, 0.2]	输出	2	0.002
	输入长度 [0, 32] 且输出长度 (0.2, +∞)	输入	0.8	0.0008
	输入长度 [0, 32] 且输出长度 (0.2, +∞)	输出	8	0.008
	输入长度范围 (32, 128]	输入	1.2	0.0012
	输入长度范围 (32, 128]	输出	16	0.016
	输入长度 (128, 256]	输入	2.4	0.0024
	输入长度 (128, 256]	输出	24	0.024
豆包·1.6·极致速度豆包·1.6·极致速度·250828 （Doubao-seed-1.6-flash）	输入长度范围 [0, 32]	输入	0.15	0.00015
	输入长度范围 [0, 32]	输出	1.5	0.0015
	输入长度范围 (32, 128]	输入	0.3	0.0003
	输入长度范围 (32, 128]	输出	3	0.003
	输入长度 (128, 256]	输入	0.6	0.0006
	输入长度 (128, 256]	输出	6	0.006
豆包·1.5·Pro·视觉理解（Doubao-1.5-vision-pro-32k）	➖	输入	3	0.003
豆包·1.5·Pro·视觉理解（Doubao-1.5-vision-pro-32k）	➖	输出	9	0.009
豆包·1.5·Pro·视觉推理·128K （Doubao-1.5-thinking-pro）	➖	输入	4	0.004
豆包·1.5·Pro·视觉推理·128K （Doubao-1.5-thinking-pro）	➖	输出	16	0.016
豆包·1.5·Pro·角色扮演·250715 （Doubao-1.5-pro-32k）	➖	输入	0.8	0.0008
豆包·1.5·Pro·角色扮演·250715 （Doubao-1.5-pro-32k）	➖	输出	2	0.002
豆包·1.5·Pro·32k （Doubao-1.5-pro-32k）	➖	输入	0.8	0.0008
豆包·1.5·Pro·32k （Doubao-1.5-pro-32k）	➖	输出	2	0.002
豆包·1.5·Lite·32k （Doubao-1.5-lite-32k）	➖	输入	0.3	0.0003
豆包·1.5·Lite·32k （Doubao-1.5-lite-32k）	➖	输出	0.6	0.0006
豆包·通用模型·Lite （Doubao-lite-32k）	➖	输入	0.3	0.0003
豆包·通用模型·Lite （Doubao-lite-32k）	➖	输出	0.6	0.0006
豆包语音播客大模型	➖	输入	120	0.12
豆包语音播客大模型	➖	输出	100	0.1
Doubao-Seedance-1.0-lite （视频生成 Lite）	➖	输入+输出	10	0.01
Doubao-Seedance-1.0-pro （视频生成 Pro）	➖	输入+输出	15	0.015
Doubao-Seedance-1.5-pro （视频生成 1.5Pro-有声）	➖	输入+输出	16	0.016
Doubao-Seedance-1.5-pro （视频生成 1.5Pro-无声）	➖	输入+输出	8	0.008

DeepSeek 系列

模型名称	条件（千 tokens）	计费项	单价
模型名称	条件（千 tokens）	计费项	积分结算（积分/千tokens）	现金结算（元/千tokens）
DeepSeek-V3.2	输入长度 [0, 32]	DeepSeek-V3.2 推理-32k（输入）	2	0.002
	输入长度 [0, 32]	DeepSeek-V3.2 推理-32k（输出）	3	0.003
	输入长度 (32, 128]	DeepSeek-V3.2 推理-128k（输入）	4	0.004
	输入长度 (32, 128]	DeepSeek-V3.2 推理-128k（输出）	6	0.006
DeepSeek-V3 工具调用	➖	DeepSeek-V3 推理（输入）	2	0.002
DeepSeek-V3 工具调用	➖	DeepSeek-V3 推理（输出）	8	0.008

智谱系列

模型名称/计费项	条件（千 tokens）	输入/输出/缓存命中	单价
模型名称/计费项	条件（千 tokens）	输入/输出/缓存命中	积分结算（积分/千tokens）	现金结算（元/千tokens）
GLM-4.7	输入长度 [0, 32]且输出长度 [0, 0.2] 对应GLM-4.7-特惠区推理计费项	输入	2	0.002
	输入长度 [0, 32]且输出长度 [0, 0.2] 对应GLM-4.7-特惠区推理计费项	输出	8	0.008
	输入长度 [0, 32] 且输出长度 (0.2, +∞)	输入	3	0.003
	输入长度 [0, 32] 且输出长度 (0.2, +∞)	输出	14	0.014
	输入长度 (32, 200]	输入	4	0.004
	输入长度 (32, 200]	输出	16	0.016

方舟模型费用

企业版（标准版、旗舰版）用户可通过火山引擎方舟大模型服务平台接入模型资源，如果你在火山方舟创建了模型接入点，在扣子中使用方舟模型，由此产生的 token 费用，由方舟模型服务收取。

说明

如果账号中仍有未过期或未使用完的方舟豆包大模型积分，可抵扣使用火山方舟模型推理时，部分豆包模型产生的 token，包括输入 token 和输出 token。详细说明可参考豆包大模型资源包（已下架）。

方舟模型服务通过大语言模型的 token 使用量计费，更多信息，请参考火山方舟模型服务计费说明。

常见问题

如何在扣子中区分扣子模型和火山方舟模型

在智能体或工作流大模型节点中选择模型时，查看模型的类别即可区分方舟模型和扣子模型。

模型类型	说明	示例
方舟模型	由企业标准版、企业旗舰版用户在火山方舟侧通过创建接入点的方式自行接入的模型，被称为方舟模型。在智能体或工作流大模型节点中选择模型时，如果模型分类展示为`自开通模型`	`在方舟自己开通的模型`，表示这个分类下的模型为方舟模型。
扣子模型	由扣子统一对接、面向所有扣子用户提供的模型服务，均为扣子模型。通常来说，除火山方舟以外的模型，均为扣子模型。在智能体或工作流大模型节点中选择模型时，如果模型分类展示为`扣子官方模型`，表示此分类的模型为扣子模型。

将火山方舟模型切换为扣子模型，对费用有什么影响

在智能体或工作流大模型节点的模型区域，展开模型列表即可切换模型，详细操作可参考如何切换模型？。
如果将火山方舟模型切换为扣子模型：

扣子模型的用量将由扣子统一收取，而不是火山方舟平台。
如果你仍有未过期的豆包大模型积分包，此积分包同样可以抵扣扣子模型的 token 用量。
如果你已经购买了扣子积分，该积分不抵扣方舟模型用量，而是抵扣扣子模型的 token 用量。
如果你没有以上积分包，则根据模型单价从账号中扣减对应的金额。建议在费用中心设置余额阈值提醒，实时关注账户余额情况，以免账号欠费影响线上业务运行。

最近更新时间：2026.05.15 17:20:46

这个页面对您有帮助吗？

有用

无用

扣子

模型类型 #

扣子模型费用 #

计费公式 #

单价 #