在使用扣子智能体或应用时,通常需要调用大模型处理问题,例如在工作流中使用大模型节点或进行知识库召回等场景。不同的模型收费规则不同。本文档介绍通过扣子平台使用模型服务时会涉及的费用。
通过扣子平台使用模型服务时,可以根据模型的接入方对模型进行分类,分为扣子模型和方舟模型。如何区分模型类型,可参考如何在扣子平台中区分扣子模型和火山模型。
模型类型 | 说明 | 费用 |
---|---|---|
扣子模型 | 由扣子统一对接、面向所有扣子用户提供的模型服务,均为扣子模型。通常来说,除火山方舟以外的模型,均为扣子模型。 |
|
方舟模型 | 团队版或企业版套餐支持在火山引擎方舟大模型服务平台创建接入点,从而自行接入所需的模型。这种方式接入的模型被称为方舟模型。 | 由字节跳动提供**,表示这个分类下的模型为方舟模型。 |
扣子豆包模型服务根据模型的 token 使用量计费,计费公式如下:
豆包模型服务费 = token 使用量 ✖️ 模型 token 单价
说明
在大语言模型中,token 是文本处理的基本单位,模型通常将输入文本分解成一系列 token,然后对这些 token 进行处理和分析。token 可以是单词、字符、子词片段或其他形式的文本片段,具体的划分方式取决于模型使用的分词算法,所以 token 的计算和处理方式可能会根据模型的具体架构和设计而有所不同。
每个模型 token 的单价不同,具体如下:
说明
模型名称 | 条件 | 输入/输出 | 资源点 | 单价 |
---|---|---|---|---|
豆包·1.6·深度思考·多模态 | 输入长度 [0, 32] | 输入 | 0.8 资源点 | 0.0008 元 |
输出 | 8 资源点 | 0.008 元 | ||
输入长度 (32, 128] | 输入 | 1.2 资源点 | 0.0012 元 | |
输出 | 16 资源点 | 0.016 元 | ||
输入长度 (128, 256] | 输入 | 2.4 资源点 | 0.0024 元 | |
输出 | 24 资源点 | 0.024 元 | ||
豆包·1.6·自动深度思考·多模态 | 输入长度 [0, 32] 且 | 输入 | 0.8 资源点 | 0.0008 元 |
输出 | 2 资源点 | 0.002 元 | ||
输入长度 [0, 32] 且 | 输入 | 0.8 资源点 | 0.0008 元 | |
输出 | 8 资源点 | 0.008 元 | ||
输入长度范围 (32, 128] | 输入 | 1.2 资源点 | 0.0012 元 | |
输出 | 16 资源点 | 0.016 元 | ||
输入长度 (128, 256] | 输入 | 2.4 资源点 | 0.0024 元 | |
输出 | 24 资源点 | 0.024 元 | ||
豆包·1.6·极致速度·多模态 | 输入长度范围 [0, 32] | 输入 | 0.15 资源点 | 0.00015 元 |
输出 | 1.5 资源点 | 0.0015 元 | ||
输入长度范围 (32, 128] | 输入 | 0.3 资源点 | 0.0003 元 | |
输出 | 3 资源点 | 0.003 元 | ||
输入长度 (128, 256] | 输入 | 0.6 资源点 | 0.0006 元 | |
输出 | 6 资源点 | 0.006 元 | ||
豆包·1.5·Pro·视觉深度思考 | 输入 | 3 资源点 | 0.003 元 | |
输出 | 9 资源点 | 0.009 元 | ||
豆包·1.5·Pro·视觉理解 | 输入 | 3 资源点 | 0.003 元 | |
输出 | 9 资源点 | 0.009 元 | ||
豆包·1.5·Pro·视觉理解·32k | 输入 | 3 资源点 | 0.003 元 | |
输出 | 9 资源点 | 0.009 元 | ||
豆包·1.5·Pro·深度思考 | 输入 | 4 资源点 | 0.004 元 | |
输出 | 16 资源点 | 0.016 元 | ||
豆包·1.5·Pro·深度思考·多模态 | 输入 | 4 资源点 | 0.004 元 | |
输出 | 16 资源点 | 0.016 元 | ||
豆包·1.5·Pro·角色扮演 | 输入 | 0.8 资源点 | 0.0008 元 | |
输出 | 2 资源点 | 0.002 元 | ||
豆包·1.5·Pro·32k | 输入 | 0.8 资源点 | 0.0008 元 | |
输出 | 2 资源点 | 0.002 元 | ||
豆包·1.5·Pro·256k | 输入 | 5 资源点 | 0.005 元 | |
输出 | 9 资源点 | 0.009 元 | ||
豆包·1.5·Lite·视觉理解 | 输入 | 1.5 资源点 | 0.0015 元 | |
输出 | 4.5 资源点 | 0.0045 元 | ||
豆包·1.5·Lite·32k | 输入 | 0.3 资源点 | 0.0003 元 | |
输出 | 0.6 资源点 | 0.0006 元 | ||
豆包·1.5·GUI·Agent模型 | 输入 | 3.5 资源点 | 0.0035 元 | |
输出 | 12 资源点 | 0.0120 元 | ||
豆包·通用模型·Pro | 输入 | 0.8 资源点 | 0.0008 元 | |
输出 | 2 资源点 | 0.002 元 | ||
豆包·通用模型·Pro·256k | 输入 | 5 资源点 | 0.005 元 | |
输出 | 9 资源点 | 0.009 元 | ||
豆包·通用模型·Lite·128k | 输入 | 0.8 资源点 | 0.0008 元 | |
输出 | 1 资源点 | 0.001 元 | ||
豆包·工具调用 | 输入 | 0.8 资源点 | 0.0008 元 | |
输出 | 2 资源点 | 0.002 元 | ||
Doubao-Seedance-1.0-lite | 10 资源点 | 0.01 元 | ||
Doubao-Seedance-1.0-pro | 15 资源点 | 0.015 元 |
模型名称 | 计费项 | 资源点 | 单价 |
---|---|---|---|
DeepSeek-V3、 | DeepSeek-V3 推理(输入) | 2 资源点 | 0.002 元 |
DeepSeek-V3 推理(输出) | 8 资源点 | 0.008 元 | |
DeepSeek-R1、 | DeepSeek-R1 推理(输入) | 4 资源点 | 0.004 元 |
DeepSeek-R1 推理(输出) | 16 资源点 | 0.016 元 | |
DeepSeek-R1-Distill-Qwen-7B | DeepSeek-R1-Distill-Qwen-7B 推理(输入) | 0.6 资源点 | 0.0006 元 |
DeepSeek-R1-Distill-Qwen-7B 推理(输出) | 2.4 资源点 | 0.0024 元 | |
DeepSeek-R1-Distill-Qwen-32B | DeepSeek-R1-Distill-Qwen-32B 推理(输入) | 1.5 资源点 | 0.0015 元 |
DeepSeek-R1-Distill-Qwen-32B 推理(输出) | 6 资源点 | 0.006 元 |
扣子付费套餐支持通过扣子资源包抵扣资源点,资源包中包含不同数量的资源点,可抵扣包括扣子模型在内的多种扣子服务及资源费用,包括输入 Token 和输出 Token。详细说明可参考扣子资源包。
扣子团队版或企业版套餐用户可通过火山引擎方舟大模型服务平台接入模型资源,如果你在火山方舟创建了模型接入点,在扣子中使用方舟模型,由此产生的 Token 费用,由方舟模型服务收取。
方舟模型服务通过大语言模型的 Token 使用量计费,计费公式为:
方舟模型服务费 = Token 使用量 ✖️ 模型 Token 单价
如果账号中仍有未过期或未使用完的方舟豆包大模型资源包,可抵扣使用火山方舟模型推理时,部分豆包模型产生的 Token,包括输入 Token 和输出 Token。详细说明可参考豆包大模型资源包(已下架)。
注意
此资源包已下架且不支持续购,建议关注火山方舟的其他促销活动。
在智能体或工作流大模型节点中选择模型时,查看模型的类别即可区分方舟模型和扣子模型。
模型类型 | 说明 | 示例 |
---|---|---|
方舟模型 | 由团队版和企业版用户在火山方舟侧通过创建接入点的方式自行接入的模型,被称为方舟模型。
|
|
扣子模型 | 由扣子统一对接、面向所有扣子用户提供的模型服务,均为扣子模型。通常来说,除火山方舟以外的模型,均为扣子模型。 |
在智能体或工作流大模型节点的模型区域,展开模型列表即可切换模型,详细操作可参考如何切换模型?。
如果将火山方舟模型切换为扣子模型: