You need to enable JavaScript to run this app.
复制全文
产品计费
大模型调用计费
复制全文
大模型调用计费

本文为您介绍使用LAS AI算子等相关功能,调用了大模型时,产生的模型费用详情。

背景信息

计费项说明

功能模块

计费项

计费简介

算子广场 & 算子服务

  • 方舟模型
    使用LAS AI的算子进行数据处理时,部分算子能力是基于方舟模型,使用此类算子时,会基于使用的方舟模型类型收取模型费用。
  • 计费方式:“按量付费”,根据使用的模型类型进行计费。
  • 自研模型、模型增强
    部分算子的模型为LAS自研模型,或者基于一些模型进行了能力增强,使用此类算子时,会基于使用算子关联的模型类型收取模型费用。
  • 计费方式:”按量付费“,根据使用的模型类型进行计费。

计费单位说明:token

大模型在处理数据时,以 Token 作为基本单位。Token 是模型推理过程中文本的最小意义单元,它可以是一个单词、汉语里的词语 / 短句、标点符号或数字等。一般来说,一段常规的中文文本中,1 个 Token 大约对应 1.5~2 个汉字。这种划分方式让模型能够高效地理解和处理语言结构,无论是短句还是复杂文本,都能通过 Token 的组合来解析语义。
如语言大模型推理服务费用的一种较为常见的计算方式如下:

费用 = token 使用数量 * token 单价
  • 由于不同模型采用的分词策略不同,同一段文本可能会被转化为不同数量的 token。
  • 您可以使用 Token 计算器 或者 分词 API 接口,来估算内容对应的 token 数量。

模型计费详情:方舟模型

基于方舟模型的算子,在进行数据处理时,可基于模型的推理类型分为“在线推理”、“批量推理”两类。以下分别为您介绍这两类模型的计费详情。

在线推理模型

支持的地域

模型名称

计费项

条件(千 token)

单价

华北2(北京)
华东2(上海)
华南1(广州)

doubao-seed-1.8

推理服务(输入)

输入长度 [0, 32] 且输出长度 [0, 0.2]

0.8 元 / 百万 Tokens

推理服务(输出)

2 元 / 百万 Tokens

推理服务(输入)

输入长度 [0, 32] 且输出长度
(0.2,+∞)

0.8 元 / 百万 Tokens

推理服务(输出)

8 元 / 百万 Tokens

推理服务(输入)

输入长度 (32, 128]

1.2 元 / 百万 Tokens

推理服务(输出)

16 元 / 百万 Tokens

推理服务(输入)

输入长度 (128, 256]

2.4 元 / 百万 Tokens

推理服务(输出)

24 元 / 百万 Tokens

doubao-seed-1.6

推理服务(输入)

输入长度 [0, 32] 且输出长度 [0, 0.2]

0.8 元 / 百万 Tokens

推理服务(输出)

2 元 / 百万 Tokens

推理服务(输入)

输入长度 [0, 32] 且输出长度
(0.2,+∞)

0.8 元 / 百万 Tokens

推理服务(输出)

8 元 / 百万 Tokens

推理服务(输入)

输入长度 (32, 128]

1.2 元 / 百万 Tokens

推理服务(输出)

16 元 / 百万 Tokens

推理服务(输入)

输入长度 (128, 256]

2.4 元 / 百万 Tokens

推理服务(输出)

24 元 / 百万 Tokens

doubao-seed-1.6-thinking

推理服务(输入)

输入长度 [0, 32]

0.8 元 / 百万 Tokens

推理服务(输出)

8 元 / 百万 Tokens

推理服务(输入)

输入长度 (32, 128]

1.2 元 / 百万 Tokens

推理服务(输出)

16 元 / 百万 Tokens

推理服务(输入)

输入长度 (128, 256]

2.4 元 / 百万 Tokens

推理服务(输出)

24 元 / 百万 Tokens

doubao-seed-1.6-vision

推理服务(输入)

输入长度 [0, 32]

0.8 元 / 百万 Tokens

推理服务(输出)

8 元 / 百万 Tokens

推理服务(输入)

输入长度 (32, 128]

1.2 元 / 百万 Tokens

推理服务(输出)

16 元 / 百万 Tokens

推理服务(输入)

输入长度 (128, 256]

2.4 元 / 百万 Tokens

推理服务(输出)

24 元 / 百万 Tokens

doubao-seed-1.6-flash

推理服务(输入)

输入长度 [0, 32]

0.15 元 / 百万 Tokens

推理服务(输出)

1.5 元 / 百万 Tokens

推理服务(输入)

输入长度 (32, 128]

0.3 元 / 百万 Tokens

推理服务(输出)

3 元 / 百万 Tokens

推理服务(输入)

输入长度 (128, 256]

0.6 元 / 百万 Tokens

推理服务(输出)

6 元 / 百万 Tokens

doubao-seedream-4.5

不涉及

元/张

0.25

doubao-seedream-4.0

不涉及

元/张

0.2

deepseek-v3.2

推理服务(输入)

输入长度 [0, 32]

2 元 / 百万 Tokens

推理服务(输出)

3 元 / 百万 Tokens

推理服务(输入)

输入长度 (32, 128]

4 元 / 百万 Tokens

推理服务(输出)

6 元 / 百万 Tokens

doubao-embedding

推理服务(输入)

不涉及

0.5 元 / 百万 Tokens

doubao-embedding-large

推理服务(输入)

不涉及

0.7 元 / 百万 Tokens

doubao-embedding-vision

推理服务(文本输入)

不涉及

0.7 元 / 百万 Tokens

推理服务(图片输入)

不涉及

1.8 元 / 百万 Tokens

doubao-1.5-pro-32k

推理服务(输入)

不涉及

0.8 元 / 百万 Tokens

推理服务(输出)

不涉及

2 元 / 百万 Tokens

精调模型推理服务(输入)

不涉及

2 元 / 百万 Tokens

精调模型推理服务(输出)

不涉及

5 元 / 百万 Tokens

doubao-1.5-pro-256k

推理服务(输入)

不涉及

5 元 / 百万 Tokens

推理服务(输出)

不涉及

9 元 / 百万 Tokens

doubao-1.5-lite-32k

推理服务(输入)

不涉及

0.3 元 / 百万 Tokens

推理服务(输出)

不涉及

0.6 元 / 百万 Tokens

精调模型推理服务(输入)

不涉及

0.75 元 / 百万 Tokens

精调模型推理服务(输出)

不涉及

1.5 元 / 百万 Tokens

deepseek-v3

推理服务(输入)

不涉及

2 元 / 百万 Tokens

推理服务(输出)

不涉及

8 元 / 百万 Tokens

deepseek-r1

推理服务(输入)

不涉及

4 元 / 百万 Tokens

推理服务(输出)

不涉及

16 元 / 百万 Tokens

deepseek-r1-distill-qwen-32b

推理服务(输入)

不涉及

1.5 元 / 百万 Tokens

推理服务(输出)

不涉及

6 元 / 百万 Tokens

Doubao-1.5-thinking-vision-pro

推理服务(输入)

不涉及

3 元 / 百万 Tokens

推理服务(输出)

不涉及

9 元 / 百万 Tokens

doubao-seedance-1.0-pro

不涉及

不涉及

15 元 / 百万 Tokens

doubao-seedance-1-0-lite

不涉及

不涉及

10 元 / 百万 Tokens

华北2(北京)
华南1(广州)

doubao-seed-1.6-lite

推理服务(输入)

输入长度 [0, 32] 且输出长度 [0, 0.2]

0.3 元 / 百万 Tokens

推理服务(输出)

0.6元 / 百万 Tokens

推理服务(输入)

输入长度 [0, 32] 且输出长度
(0.2,+∞)

0.3元 / 百万 Tokens

推理服务(输出)

2.4元 / 百万 Tokens

推理服务(输入)

输入长度 (32, 128]

0.6元 / 百万 Tokens

推理服务(输出)

4元 / 百万 Tokens

推理服务(输入)

输入长度 (128, 256]

1.2元 / 百万 Tokens

推理服务(输出)

12元 / 百万 Tokens

华北2(北京)
华东2(上海)

doubao-seedance-1.5-pro

有声

不涉及

16 元 / 百万 Tokens

无声

不涉及

8 元 / 百万 Tokens

doubao-seedance-1.0-pro-fast

不涉及

不涉及

4.2元 / 百万 Tokens

批量推理模型

支持的地域

模型名称

计费项

条件(千 token)

单价

华北2(北京)
华南1(广州)
华东2(上海)

doubao-seed-1.8

推理服务(输入)

输入长度 [0, 32] 且输出长度 [0, 0.2]

0.4 元 / 百万 Tokens

推理服务(输出)

1 元 / 百万 Tokens

推理服务(输入)

输入长度 [0, 32] 且输出长度
(0.2,+∞)

0.4 元 / 百万 Tokens

推理服务(输出)

4 元 / 百万 Tokens

推理服务(输入)

输入长度 (32, 128]

0.6 元 / 百万 Tokens

推理服务(输出)

8 元 / 百万 Tokens

推理服务(输入)

输入长度 (128, 256]

1.2 元 / 百万 Tokens

推理服务(输出)

12 元 / 百万 Tokens

doubao-seed-1.6

推理服务(输入)

输入长度 [0, 32] 且输出长度 [0, 0.2]

0.4 元 / 百万 Tokens

推理服务(输出)

1 元 / 百万 Tokens

推理服务(输入)

输入长度 [0, 32] 且输出长度
(0.2,+∞)

0.4 元 / 百万 Tokens

推理服务(输出)

4 元 / 百万 Tokens

推理服务(输入)

输入长度 (32, 128]

0.6 元 / 百万 Tokens

推理服务(输出)

8 元 / 百万 Tokens

推理服务(输入)

输入长度 (128, 256]

1.2 元 / 百万 Tokens

推理服务(输出)

12 元 / 百万 Tokens

doubao-seed-1.6-thinking

推理服务(输入)

输入长度 [0, 32]

0.4 元 / 百万 Tokens

推理服务(输出)

4 元 / 百万 Tokens

推理服务(输入)

输入长度 (32, 128]

0.6 元 / 百万 Tokens

推理服务(输出)

8 元 / 百万 Tokens

推理服务(输入)

输入长度 (128, 256]

1.2 元 / 百万 Tokens

推理服务(输出)

12 元 / 百万 Tokens1

doubao-seed-1.6-flash

推理服务(输入)

输入长度 [0, 32]

0.075 元 / 百万 Tokens

推理服务(输出)

0.75 元 / 百万 Tokens

推理服务(输入)

输入长度 (32, 128]

0.15 元 / 百万 Tokens

推理服务(输出)

1.5 元 / 百万 Tokens

推理服务(输入)

输入长度 (128, 256]

0.3 元 / 百万 Tokens

推理服务(输出)

3 元 / 百万 Tokens

doubao-seed-1.6-vision

推理服务(输入)

输入长度 [0, 32]

0.4 元 / 百万 Tokens

推理服务(输出)

4 元 / 百万 Tokens

推理服务(输入)

输入长度 (32, 128]

0.6 元 / 百万 Tokens

推理服务(输出)

8 元 / 百万 Tokens

推理服务(输入)

输入长度 (128, 256]

1.2 元 / 百万 Tokens

推理服务(输出)

12 元 / 百万 Tokens

doubao-1.5-pro-32k

推理服务(输入)

不涉及

0.4 元 / 百万 Tokens

推理服务(输出)

不涉及

1 元 / 百万 Tokens

doubao-1.5-lite-32k

推理服务(输入)

不涉及

0.15 元 / 百万 Tokens

推理服务(输出)

不涉及

0.3 元 / 百万 Tokens

doubao-seedance-1.0-pro

不涉及

不涉及

7.5 元 / 百万 Tokens

doubao-seedance-1-0-lite

不涉及

不涉及

5 元 / 百万 Tokens

deepseek-v3.2

推理服务(输入)

输入长度 [0, 32]

1 元 / 百万 Tokens

推理服务(输出)

1.5 元 / 百万 Tokens

推理服务(输入)

输入长度 (32, 128]

2 元 / 百万 Tokens

推理服务(输出)

3 元 / 百万 Tokens

华北2(北京)
华东2(上海)

doubao-seedance-1.5-pro

有声

不涉及

8 元 / 百万 Tokens

无声

不涉及

4 元 / 百万 Tokens

doubao-seedance-1.0-pro-fast

不涉及

不涉及

2.1元 / 百万 Tokens

华北2(北京)
华南1(广州)

doubao-seed-1.6-lite

推理服务(输入)

输入长度 [0, 32] 且输出长度 [0, 0.2]

0.15 元 / 百万 Tokens

推理服务(输出)

0.3 元 / 百万 Tokens

推理服务(输入)

输入长度 [0, 32] 且输出长度
(0.2,+∞)

0.15 元 / 百万 Tokens

推理服务(输出)

1.2 元 / 百万 Tokens

推理服务(输入)

输入长度 (32, 128]

0.3 元 / 百万 Tokens

推理服务(输出)

2 元 / 百万 Tokens

推理服务(输入)

输入长度 (128, 256]

0.6 元 / 百万 Tokens

推理服务(输出)

6 元 / 百万 Tokens

模型计费详情:自研模型、模型增强

支持的地域

算子服务 & 模型名称

计费项

条件(千 token)

单价

华北2(北京)
华东2(上海)
华南1(广州)

  • 算子服务:视频内容理解(豆包系列)增强版-公网
  • 模型:视频处理服务-VLM

推理服务(输入)

输入长度 [0, 128]

4.7元 / 百万 Tokens

推理服务(输出)

20元 / 百万 Tokens

推理服务(输入)

输入长度 (128, 256]

5.9元 / 百万 Tokens

推理服务(输出)

30元 / 百万 Tokens

  • 算子服务:视频内容理解(豆包系列)增强版-内网
  • 模型:视频处理服务-VLM

推理服务(输入)

输入长度 [0, 128]

2.6元 / 百万 Tokens

推理服务(输出)

20元 / 百万 Tokens

推理服务(输入)

输入长度 (128, 256]

3.8元 / 百万 Tokens

推理服务(输出)

30元 / 百万 Tokens

  • 算子服务:语音转文字(LAS ASR服务)-Seed-ASR 2.0
  • 模型大模型服务-豆包语音-大模型录音文件识别

不涉及

不涉及

0.8元/小时

  • 算子服务:语音转文字(LAS ASR服务)-Seed-ASR 1.0
  • 模型大模型服务-豆包语音-大模型录音文件识别

不涉及

不涉及

2.3元/小时

  • 算子服务:智能音频切分
  • 模型:音频处理模型

不涉及

不涉及

0.003元/分钟

  • 算子服务:智能音频转换
  • 模型:音频处理模型

不涉及

不涉及

0.003元/分钟

  • 算子服务:语音转文字(豆包语音)增强版
  • 模型:豆包语音2.0增强版

不涉及

不涉及

1.6元/小时

  • 算子服务:语音转文字(豆包语音)增强版
  • 模型:豆包语音1.0增强版

不涉及

不涉及

4.6元/小时

  • 算子服务:PDF智能文档解析(豆包系列)
  • 模型:PDF解析模型-normal模式

不涉及

不涉及

0.02元/页

  • 算子服务:PDF智能文档解析(豆包系列)
  • 模型:PDF解析模型-detail模式

不涉及

不涉及

0.04元/页

  • 算子服务:视频智能剪辑
  • simple模式

不涉及

不涉及

1.5元/分钟

  • 算子服务:视频智能剪辑
  • detail模式

不涉及

不涉及

2元/分钟

配额说明
  • 批量推理限配额 TPD 计算逻辑:
    • 同账号下按照模型名称(如 doubao-pro-32k-*** 所有版本)汇总计算。
    • 不与在线推理的限流数合并计算。

说明

例如您主账号下使用 doubao-pro-32k 模型,有 a、b、c 三个的批量推理任务和d、e 两个在线推理任务。则您每天a、b、c 批量推理共用 10B token 配额,d 、e 共用在线推理任务 TPM、RPM 限流额度。

  • 方舟对批量推理设置配额的原则是保障用户间资源分配的公平性,防止滥用或误用接口造成平台过载而服务中断。如您业务需要每天处理更多数据,可通过提工单方式申请。
  • 您可以提交超出配额的任务量,当方舟平台有空闲资源,将动态扩展您的配额量。
  • TPD的时间计算窗口为24小时滑动窗口,一次短时高并发请求影响后续24小时的配额,与固定窗口相比,您请注意请求分布的均匀性。
  • 账号配额,默认每个模型 10B Tokens / 天,可通过提工单方式申请提额。
最近更新时间:2026.02.12 17:22:51
这个页面对您有帮助吗?
有用
有用
无用
无用