You need to enable JavaScript to run this app.
导航
模型服务计费
最近更新时间:2024.06.14 11:05:38首次发布时间:2023.06.27 23:50:07

计费概述

您可以在 开通管理 页中查看各模型定价与使用限制,开通后使用各模型服务,不同模型的单价不同。其中,大语言模型费用计算方式如下:
费用 = tokens使用量 ✖️ 模型tokens单价

  • Tokens定义说明: 通常1个中文词语、英文单词、数字、符号计为 1 个token,由于不同模型采用的分词器不同,同一段文本可能会分为不同的tokens数量。您可通过管控台中的 在线体验工具 了解tokens定义
    • 图片
    • 在线体验工具入口:开通管理 页面中 定价 标题的提示文案
      • 图片

产品价格

模型推理

大语言模型:

后付费(按tokens使用量付费)

按tokens使用量(输入文本+输出文本)计费,每小时出账,按量后付费。

模型提供方

模型

上下文长度

服务类型

定价(单位:元/千tokens)

计费方式

免费额度

智谱AI

GLM3-130B

8K

推理服务

免费限量测试

GLM3-130B金融模型

8K

推理服务

免费限量测试

月之暗面

Moonshot-v1-8K

8K

推理服务

0.012

后付费

50万tokens

Moonshot-v1-32K

32K

推理服务

0.024

后付费

50万tokens

Moonshot-v1-128K

128K

推理服务

0.06

后付费

50万tokens

字节跳动

Doubao-lite-4k
(包括分支版本lite-character)

4K

推理服务(输入)

0.0003

后付费

50万tokens

推理服务(输出)

0.0006

后付费

Doubao-lite-32k

32K

推理服务(输入)

0.0003

后付费

50万tokens

推理服务(输出)

0.0006

后付费

Doubao-lite-128k

128K

推理服务(输入)

0.0008

后付费

50万tokens

推理服务(输出)

0.0010

后付费

Doubao-pro-4k
(包括分支版本pro-character、pro-functioncall)

4K

推理服务(输入)

0.0008

后付费

50万tokens

推理服务(输出)

0.0020

后付费

Doubao-pro-32k

32K

推理服务(输入)

0.0008

后付费

50万tokens

推理服务(输出)

0.0020

后付费

Doubao-pro-128k

128K

推理服务(输入)

0.0050

后付费

50万tokens

推理服务(输出)

0.0090

后付费

Meta

Llama3-8B(开源)

8K

推理服务

免费限量测试

Llama3-70B(开源)

8K

推理服务

免费限量测试

Mistral AI

Mistral-7B(开源)

32K

推理服务

免费限量测试

百川智能

baichuan-7B(开源)

4K

推理服务

免费限量测试

Databricks

Dolly-V2-12B(开源)

2K

推理服务

免费限量测试

预付费(模型单元)

模型单元是调用某个特定模型的 TPM(Tokens Per Minute,每分钟tokens数量)配额,购买后无需再为 Tokens 消耗付费,详细使用说明请见创建推理接入点

模型提供方

模型

计费项

支持TPM

定价(单位:元/个)

计费方式

字节跳动

Doubao-lite-4k

模型单元(包天)

10K

25

预付费

模型单元(包月)

10K

600

预付费

Doubao-lite-32k

模型单元(包天)

10K

25

预付费

模型单元(包月)

10K

600

预付费

Doubao-lite-128k

模型单元(包天)

10K

100

预付费

模型单元(包月)

10K

2400

预付费

Doubao-pro-4k

模型单元(包天)

10K

85

预付费

模型单元(包月)

10K

2000

预付费

Doubao-pro-32k

模型单元(包天)

10K

85

预付费

模型单元(包月)

10K

2000

预付费

Doubao-pro-128k

模型单元(包天)

10K

340

预付费

模型单元(包月)

10K

8000

预付费

视觉大模型:

Stable-DiffusionStable-Diffusion-XL模型卡片暂未完全公开,如需申请使用,请联系与您对接的火山引擎销售人员

Doubao-文生图模型即将于24年6月底公开发布,完成个人或企业实名认证后即可使用,敬请期待

模型提供方

模型

计费项

支持并发

定价(单位:元/个)

计费方式

RunwayML

Stable-Diffusion-1.5

模型单元(包天)

详见控制台

175

预付费

模型单元(包月)

详见控制台

4200

预付费

Stability AI

Stable-Diffusion-XL

模型单元(包天)

详见控制台

175

预付费

模型单元(包月)

详见控制台

4200

预付费

语音大模型:

说明

Doubao-语音合成模型只对企业客户开放,如需测试或接入请先进行企业认证,然后联系与您对接的火山引擎销售人员

模型提供方

模型

服务类型

定价(单位:元/万字符)

计费方式

免费额度

字节跳动

Doubao-语音合成

推理服务

5

后付费

5000 字符

Doubao-声音复刻

推理服务

8

后付费

5000 字符

向量模型:

模型提供方

模型

最长输入长度

服务类型

定价(单位:元/千tokens)

计费方式

免费额度

字节跳动

Doubao-embedding

4K

推理服务(输入)

0.0005

后付费

50万tokens

模型精调

大语言模型:

按tokens使用量(训练文本*训练迭代次数)计费,训练完成后出账,按量后付费

模型提供方

模型

服务类型

定价(单位:元/千tokens)

计费方式

字节跳动

Doubao-lite-4k

模型精调(LoRA)

0.03

后付费

Doubao-lite-32k

模型精调(LoRA)

0.03

后付费

Doubao-lite-128k

模型精调(LoRA)

0.03

后付费

Doubao-pro-4k

模型精调(LoRA)

0.05

后付费

Doubao-pro-32k

模型精调(LoRA)

0.05

后付费

Doubao-pro-128k

模型精调(LoRA)

0.05

后付费

使用限制

模型推理限制

当前对每个模型设置了RPM(Requests Per Minute,每分钟请求数)及TPM(Tokens Per Minute,每分钟tokens数量)的调用限制,每个账号(含主账号下的所有子账号,合并计算)的具体限制可在 开通管理 页中查看。
如需提升,可提交工单联系我们

模型精调限制

每个账号会有最多可同时创建运行中的精调任务数的限制,具体限制请见控制台报错提示,若到达上限的,请耐心等待精调任务完成并释放额度后重试,或在 配额中心 中提交申请更多额度。

账单查询

点击方舟平台右上角 费用 可查看账户总览和账单详情

服务关停
  • 账户余额不足或账户余额小于0被扣为负值即为欠费。
  • 账号欠费后2小时内补缴所有欠费账单的,可正常使用火山方舟模型服务。欠费后2小时仍未能补缴所有欠费账单的,将关停账号下所有火山方舟相关模型服务。