You need to enable JavaScript to run this app.
导航
模型服务价格
最近更新时间:2025.06.23 18:06:56首次发布时间:2025.04.28 12:03:54
我的收藏
有用
有用
无用
无用

不同模型服务支持的能力及单价各不相同,本文为您介绍各模型的计费公式及单价,方便您进行模型价格查阅和比较。

说明

  • 如需了解模型服务各功能模块支持的计费方式及详细计费逻辑,请参见 模型服务计费说明
  • 支持通过 价格计算器 预估 满足业务需求所需的费用。
  • 本文价格和 定价详情页 仅作为商品规格和价格的参考,具体可购买的商品规格及费用请以实际下单结果为准。

深度思考模型

在线推理

按 token 后付费价格

计费公式
在线推理费用 = 输入单价 × 输入token + 输出单价 × 输出token,其中输出 token 包括模型输出content内容和思维链
reasoning_content内容。

若开启 上下文缓存(部分模型支持),
在线推理费用 = 输入单价 × (输入token - 缓存命中token) + 缓存命中单价 × 缓存命中token + 缓存存储单价 × 缓存存储token × 时长 + 输出单价 × 输出token

  • doubao-seed-1.6- 系列支持按照每次请求的输入长度(及输出长度),划分模型单价,如下表所示。
  • 举例,调用 doubao-seed-1.6 模型,当1个请求的输入长度为 200k,输出长度为 14k 时,满足 输入长度 (128, 256] 条件,模型产生的所有 token 按照:输入2.4 元/百万 token,输出 24 元/百万 token 单价计费。
  • 查看往期调用的输入输出长度分布,请查看常见问题 如何查看历史调用的输入输出长度的区间分布?

计费单价

模型名称

条件
千 token

输入
元/百万 token

缓存存储
元/百万 token /小时

缓存命中
元/百万 token

输出
元/百万 token

doubao-seed-1.6

输入长度 [0, 32]
且输出长度 [0, 0.2]

0.80

0.017

0.16

2.00

输入长度 [0, 32]
且输出长度 (0.2,+∞)

0.80

0.017

0.16

8.00

输入长度 (32, 128]

1.20

0.017

0.16

16.00

输入长度 (128, 256]

2.40

0.017

0.16

24.00

doubao-seed-1.6-thinking

输入长度 [0, 32]

0.80

0.017

0.16

8.00

输入长度 (32, 128]

1.20

0.017

0.16

16.00

输入长度 (128, 256]

2.40

0.017

0.16

24.00

doubao-seed-1.6-flash

输入长度 [0, 32]

0.15

0.017

0.03

1.50

输入长度 (32, 128]

0.30

0.017

0.03

3.00

输入长度 (128, 256]

0.60

0.017

0.03

6.00

doubao-1.5-thinking-pro

m-250415m-250428版本

-

4.00

不支持

不支持

16.00

doubao-1.5-thinking-vision-pro

-

3.00

不支持

不支持

9.00

deepseek-r1

-

4.00

0.017

0.80

16.00

deepseek-r1-distill-qwen-32b

-

1.50

0.017

0.30

6.00

deepseek-r1-distill-qwen-7b

-

0.60

不支持

不支持

2.40

批量推理

按 token 后付费价格
部分模型的批量推理价格是在线推理价格的50%,实际请以下面表格中的价格为准。

计费公式
批量推理费用 = 输入单价 × 输入token + 输出单价 × 输出token, 其中输出token包括模型输出content内容和思维链
reasoning_content内容。

若开启缓存功能(部分模型于2025年4月14日21:00开始支持透明前缀缓存能力,无需任何配置,命中缓存后可享受更低的单价),
批量推理费用 = 输入单价 × (输入token 不支持 缓存命中token) + 缓存命中单价 × 缓存命中token + 输出单价 × 输出token

  • doubao-seed-1.6-** 系列支持按照每次请求的输入长度(及输出长度),划分模型单价,如下表所示。
  • 举例,调用 doubao-seed-1.6 模型,当1个请求的输入长度为 200k,输出长度为 14k 时,满足 输入长度 (128, 256] 条件,模型产生的所有 token 按照:输入1.2 元/百万 token,缓存命中输入0.16 元/百万 token,输出 12 元/百万 token 单价计费。
  • 查看往期调用的输入输出长度分布,请查看常见问题 如何查看历史调用的输入输出长度的区间分布?

计费单价

模型名称

条件
千 token

输入
元/百万token

缓存命中
元/百万token

输出
元/百万token

doubao-seed-1.6

输入长度 [0, 32]
且输出长度 [0, 0.2]

0.40

0.16

1.00

输入长度 [0, 32]
且输出长度 (0.2,+∞)

0.40

0.16

4.00

输入长度 [32, 128]

0.60

0.16

8.00

输入长度 (128, 256]

1.20

0.16

12.00

doubao-seed-1.6-thinking

输入长度 [0, 32]

0.40

0.16

4.00

输入长度 [32, 128]

0.60

0.16

8.00

输入长度 (128, 256]

1.20

0.16

12.00

doubao-seed-1.6-flash

输入长度 [0, 32]

0.075

0.03

0.75

输入长度 [32, 128]

0.150

0.03

1.50

输入长度 (128, 256]

0.300

0.03

3.00

doubao-1.5-thinking-pro

m-250425版本

-

2.00

不支持

8.00

doubao-1.5-thinking-vision-pro

-

1.50

不支持

4.50

deepseek-r1

-

2.00

0.80

8.00

deepseek-r1-distill-qwen-32b

-

0.75

不支持

3.00

deepseek-r1-distill-qwen-7b

-

0.30

不支持

1.20

大语言模型

在线推理

按 token 后付费价格

计费公式
在线推理费用 = 输入单价 × 输入token + 输出单价 × 输出token

若开启 上下文缓存(部分模型支持),
在线推理费用 = 输入单价 × (输入token - 缓存命中token) + 缓存命中单价 × 缓存命中token + 缓存存储单价 × 缓存存储token × 时长 + 输出单价 × 输出token

计费单价

模型名称

输入
元/百万token

缓存存储
元/百万token/小时

缓存命中
元/百万token

输出
元/百万token

doubao-1.5-pro-32k

0.80

0.017

0.16

2.00

doubao-1.5-pro-256k

5.00

不支持

不支持

9.00

doubao-1.5-lite-32k

0.30

0.017

0.06

0.60

doubao-pro-32k

0.80

0.017

0.16

2.00

doubao-pro-256k

5.00

不支持

不支持

9.00

doubao-lite-4k
包括分支版本 character

0.30

不支持

不支持

0.60

doubao-lite-32k

0.30

0.017

0.06

0.60

doubao-lite-128k

0.80

不支持

不支持

1.00

deepseek-v3

2.00

0.017

0.40

8.00

批量推理

按 token 后付费价格
部分模型的批量推理价格是在线推理价格的50%,实际请以下面表格中的价格为准。

计费公式
批量推理费用 = 输入单价 × 输入token + 输出单价 × 输出token

若开启缓存功能(部分模型于2025年4月14日21:00开始支持透明前缀缓存能力,无需任何配置,命中缓存后可享受更低的单价),
批量推理费用 = 输入单价 × (输入token - 缓存命中token) + 缓存命中单价 × 缓存命中token + 输出单价 × 输出token

计费单价

模型名称

输入
元/百万token

缓存命中
元/百万token

输出
元/百万token

doubao-1.5-pro-32k

0.40

0.16

1.00

doubao-1.5-pro-256k

5.00

不支持

9.00

doubao-1.5-lite-32k

0.15

0.06

0.30

doubao-pro-32k

0.80

0.16

2.00

doubao-lite-32k

0.30

0.06

0.60

deepseek-v3

1.00

0.40

4.00

视觉理解模型

将输入信息(包括图片)转化为 token 计费

计费公式
推理费用 = 输入单价 × 输入token + 输出单价 × 输出token
图片token用量 = min(图片宽 × 图片高 ÷ 784, 单图 token 限制),具体用量统计逻辑请参见 token 用量说明

在线推理

按 token 后付费价格

模型

输入
元/百万token

输出
元/百万token

doubao-1.5-vision-pro

3.00

9.00

doubao-1.5-vision-lite

1.50

4.50

doubao-1.5-ui-tars

3.50

12.00

doubao-1.5-vision-pro-32k

3.00

9.00

doubao-vision-pro-32k

3.00

9.00

doubao-vision-lite-32k

1.50

4.50

批量推理

按 token 后付费价格
部分模型的批量推理价格是在线推理价格的50%,实际请以下面表格中的价格为准。

模型

输入
元/百万token

输出
元/百万token

doubao-1.5-vision-pro-32k

1.50

4.50

视频生成模型

异步推理,将输出视频转化为 token 计费
按 token 后付费价格

计费公式
推理费用 = 按token付费单价 × 视频token用量
视频token用量≈ (宽 × 高 × 帧率 × 时长)/1024,准确的 token 用量以调用 API 后返回信息中的usage字段为准。

单价

模型

文生视频
元/百万token

图生视频
元/百万token

doubao-seedance-1-0-pro

15.00

15.00

doubao-seedance-1-0-lite

10.00

10.00

doubao-seaweed

30.00

30.00

wan2.1-14b

50.00

50.00

计费示例

模型

画面比例

分辨率

宽×高
(像素)

帧率
(帧/秒)

视频时长
(秒)

用量
(token)

价格
(元/个)

doubao-seedance-1-0-pro

16:9

480p

864×480

24

5

48600

0.73

16:9

864×480

24

10

97000

1.46

4:3

736×544

24

5

46920

0.70

4:3

736×544

24

10

93840

1.41

1:1

640×640

24

5

48000

0.72

1:1

640×640

24

10

96000

1.44

21:9

960×416

24

5

46800

0.70

21:9

960×416

24

10

93600

1.40

16:9

1080p

1920×1088

24

5

244800

3.67

16:9

1920×1088

24

10

489600

7.34

4:3

1664×1248

24

5

243360

3.65

4:3

1664×1248

24

10

486720

7.30

1:1

1440×1440

24

5

243000

3.65

1:1

1440×1440

24

10

486000

7.29

21:9

2176×928

24

5

236640

3.55

21:9

2176×928

24

10

473280

7.10

doubao-seedance-1-0-lite

16:9

480p

864×480

24

5

48600

0.49

16:9

864×480

24

10

97000

0.97

4:3

736×544

24

5

46920

0.47

4:3

736×544

24

10

93840

0.94

1:1

640×640

24

5

48000

0.48

1:1

640×640

24

10

96000

0.96

21:9

960×416

24

5

46800

0.47

21:9

960×416

24

10

93600

0.94

16:9

720p

1248×704

24

5

102960

1.03

16:9

1248×704

24

10

205920

2.06

4:3

1120×832

24

5

109200

1.09

4:3

1120×832

24

10

218400

2.18

1:1

960×960

24

5

108000

1.08

1:1

960×960

24

10

216000

2.16

21:9

1504×640

24

5

112800

1.13

21:9

1504×640

24

10

225600

2.26

16:9

1080p

1920×1088

24

5

244800

2.45

16:9

1920×1088

24

10

489600

4.90

4:3

1664×1248

24

5

243360

2.43

4:3

1664×1248

24

10

486720

4.87

1:1

1440×1440

24

5

243000

2.43

1:1

1440×1440

24

10

486000

4.86

21:9

2176×928

24

5

236640

2.37

21:9

2176×928

24

10

473280

4.73

doubao-seaweed

1:1

480p

480×480

24

5

27,000

0.81

4:3

640×480

24

5

36,000

1.08

16:9

848×480

24

5

47,700

1.43

1:1

480×480

24

10

54,000

1.62

4:3

640×480

24

10

72,000

2.16

16:9

848×480

24

10

95,400

2.86

1:1

720p

720×720

24

5

60,750

1.82

4:3

960×720

24

5

81,000

2.43

16:9

1280×720

24

5

108,000

3.24

1:1

720×720

24

10

121,500

3.65

4:3

960×720

24

10

162,000

4.86

16:9

1280×720

24

10

216,000

6.48

wan2.1-14b

16:9

480p

832×480

16

5

31,200

1.56

16:9

720p

1280×720

16

5

72,000

3.60

图片生成模型

按使用张数后付费价格,单位:元/张

模型

定价
元/张

生成质量

doubao-Seedream-3.0-t2i

0.259

同声传译模型

按 token 后付费价格

模型名称

主账号下同时在线连接数

单连接最大连接时长
(小时)

单连接静默持续时长
(小时)

免费额度
(token)

计费
(元/千 token)

doubao-同声传译

100

2

0.5

500k

语音输入:0.03
文本输出:0.03

源语言文本和目标语言文本

文本向量模型

将输入信息转化为 token 计费
按 token 后付费价格

模型

输入
元/百万token

doubao-embedding

0.50

doubao-embedding-large

0.70

图文向量模型

将输入信息(包括图片)转化为 token 计费
按 token 后付费价格

计费公式
推理费用 = 文本输入单价 × 文本token + 图片输入单价 × 图片输入token
图片tokens = (width px × height px)/784,超大图封顶 1312 token。

计费单价

模型

文本输入
元/百万token

图片输入
元/百万token

doubao-embedding-vision

0.70

1.80

语音模型

按输入字数后付费价格,单位:元/万字

模型

定价
元/百万token

doubao-语音合成

5

doubao-声音复刻

8

TPM 保障包

对于部分模型,支持购买 TPM(Tokens Per Minute)保障包。对成功购买的保障包内,保障 token 并发。相比单纯的按token计费,可获得更高的并发,更低的延迟,更强的稳定性。
「小时后付费」和「包天预付费」两种方式支持叠加购买,您可依据业务流量灵活采购。

深度思考模型

模型

计费方式

输入

输出

doubao-1.5-thinking-pro

小时后付费

9.60 元/每10K TPM

3.84 元/每1K TPM

包天预付费

115.20 元/每10K TPM

46.08 元/每1K TPM

deepseek-r1

小时后付费

9.60 元/每10K TPM

3.84 元/每1K TPM

包天预付费

115.20 元/每10K TPM

46.08 元/每1K TPM

大语言模型

模型

计费方式

输入

输出

doubao-1.5-pro-32k

小时后付费

1.920 元/每10K TPM

0.480 元/每1K TPM

包天预付费

23.040 元/每10K TPM

5.760 元/每1K TPM

doubao-1.5-lite-32k

小时后付费

0.72 元/每10K TPM

0.144 元/每1K TPM

包天预付费

8.64 元/每10K TPM

1.728 元/每1K TPM

doubao-pro-32k

小时后付费

1.920 元/每10K TPM

0.480 元/每1K TPM

包天预付费

23.040 元/每10K TPM

5.760 元/每1K TPM

deepseek-v3

小时后付费

4.80 元/每10K TPM

1.92 元/每1K TPM

包天预付费

57.60 元/每10K TPM

23.04 元/每1K TPM

模型精调

精调训练

按 token 后付费价格

计费公式
训练费用 = 训练tokens量 x 精调单价 = (数据集总 tokens x 迭代轮次)x 精调单价
若 token 数小于 1000,将会上取整为 1000 tokens 计算。

计费单价

基础模型

LoRA精调
元/百万token

全量精调
元/百万token

doubao-1.5-pro-32k

50

100

doubao-1.5-lite-32k

30

60

doubao-pro-32k

50

-

doubao-lite-32k

30

-

精调后在线推理

按 token 后付费价格

说明

  • 仅部分 doubao 模型精调后在线推理支持按 token 付费,以创建在线推理接入点页面可选的付费方式为准。
  • doubao 1.5 及后续模型的精调后推理服务在延迟和性能方面较旧版模型有比较明显的提升,在大流量场景的稳定性也有提升。

精调模型对应的基础模型

输入
元/百万token

输出
元/百万token

doubao-1.5-pro-32k

2.00

5.00

doubao-1.5-lite-32k

0.75

1.50

doubao-pro-32k

0.80

2.00

doubao-lite-32k

0.30

0.60

精调后批量推理

按 token 后付费价格

精调模型对应的基础模型

输入
元/百万token

缓存命中
元/百万token

输出
元/百万token

doubao-1.5-pro-32k

0.40

0.16

1.00

doubao-1.5-lite-32k

0.15

0.06

0.30

doubao-pro-32k

0.80

0.16

2.00

doubao-lite-32k

0.30

0.06

0.60

模型单元

对于部分大语言模型,支持按模型单元付费。模型单元提供专属算力,对精调后模型表现更优。
「按小时后付费」和「包月预付费」两种方式支持叠加购买,您可依据业务流量灵活采购。

说明

此为邀测能力,如需使用,提交测试申请工单

模型

计费方式

性能预估
TPS
(Tokens Per Second)

定价
元/个

doubao-lite-4k

按小时后付费

3000

60

包月预付费

3000

28000

doubao-lite-32k

按小时后付费

3000

60

包月预付费

3000

28000

doubao-lite-128k

按小时后付费

4500

240

包月预付费

4500

112000

doubao-pro-32k

按小时后付费

3200

160

包月预付费

3200

80000