不同模型服务支持的能力及单价各不相同,本文为您介绍各模型的计费公式及单价,方便您进行模型价格查阅和比较。
说明
按 token 后付费价格
计费公式
在线推理费用 = 输入单价 × 输入token + 输出单价 × 输出token,其中输出 token 包括模型输出content
内容和思维链reasoning_content
内容。
若开启 上下文缓存(部分模型支持),
在线推理费用 = 输入单价 × (输入token - 缓存命中token) + 缓存命中单价 × 缓存命中token + 缓存存储单价 × 缓存存储token × 时长 + 输出单价 × 输出token
- doubao-seed-1.6- 系列支持按照每次请求的输入长度(及输出长度),划分模型单价,如下表所示。
- 举例,调用 doubao-seed-1.6 模型,当1个请求的输入长度为 200k,输出长度为 14k 时,满足 输入长度 (128, 256] 条件,模型产生的所有 token 按照:输入2.4 元/百万 token,输出 24 元/百万 token 单价计费。
- 查看往期调用的输入输出长度分布,请查看常见问题 如何查看历史调用的输入输出长度的区间分布?
计费单价
模型名称 | 条件 | 输入 | 缓存存储 | 缓存命中 | 输出 |
---|---|---|---|---|---|
doubao-seed-1.6 | 输入长度 [0, 32] | 0.80 | 0.017 | 0.16 | 2.00 |
输入长度 [0, 32] | 0.80 | 0.017 | 0.16 | 8.00 | |
输入长度 (32, 128] | 1.20 | 0.017 | 0.16 | 16.00 | |
输入长度 (128, 256] | 2.40 | 0.017 | 0.16 | 24.00 | |
doubao-seed-1.6-thinking | 输入长度 [0, 32] | 0.80 | 0.017 | 0.16 | 8.00 |
输入长度 (32, 128] | 1.20 | 0.017 | 0.16 | 16.00 | |
输入长度 (128, 256] | 2.40 | 0.017 | 0.16 | 24.00 | |
doubao-seed-1.6-flash | 输入长度 [0, 32] | 0.15 | 0.017 | 0.03 | 1.50 |
输入长度 (32, 128] | 0.30 | 0.017 | 0.03 | 3.00 | |
输入长度 (128, 256] | 0.60 | 0.017 | 0.03 | 6.00 | |
doubao-1.5-thinking-pro
| - | 4.00 | 不支持 | 不支持 | 16.00 |
doubao-1.5-thinking-vision-pro | - | 3.00 | 不支持 | 不支持 | 9.00 |
deepseek-r1 | - | 4.00 | 0.017 | 0.80 | 16.00 |
deepseek-r1-distill-qwen-32b | - | 1.50 | 0.017 | 0.30 | 6.00 |
deepseek-r1-distill-qwen-7b | - | 0.60 | 不支持 | 不支持 | 2.40 |
按 token 后付费价格
部分模型的批量推理价格是在线推理价格的50%,实际请以下面表格中的价格为准。
计费公式
批量推理费用 = 输入单价 × 输入token + 输出单价 × 输出token, 其中输出token包括模型输出content
内容和思维链reasoning_content
内容。
若开启缓存功能(部分模型于2025年4月14日21:00开始支持透明前缀缓存能力,无需任何配置,命中缓存后可享受更低的单价),
批量推理费用 = 输入单价 × (输入token 不支持 缓存命中token) + 缓存命中单价 × 缓存命中token + 输出单价 × 输出token
- doubao-seed-1.6-** 系列支持按照每次请求的输入长度(及输出长度),划分模型单价,如下表所示。
- 举例,调用 doubao-seed-1.6 模型,当1个请求的输入长度为 200k,输出长度为 14k 时,满足 输入长度 (128, 256] 条件,模型产生的所有 token 按照:输入1.2 元/百万 token,缓存命中输入0.16 元/百万 token,输出 12 元/百万 token 单价计费。
- 查看往期调用的输入输出长度分布,请查看常见问题 如何查看历史调用的输入输出长度的区间分布?
计费单价
模型名称 | 条件 | 输入 | 缓存命中 | 输出 |
---|---|---|---|---|
doubao-seed-1.6 | 输入长度 [0, 32] | 0.40 | 0.16 | 1.00 |
输入长度 [0, 32] | 0.40 | 0.16 | 4.00 | |
输入长度 [32, 128] | 0.60 | 0.16 | 8.00 | |
输入长度 (128, 256] | 1.20 | 0.16 | 12.00 | |
doubao-seed-1.6-thinking | 输入长度 [0, 32] | 0.40 | 0.16 | 4.00 |
输入长度 [32, 128] | 0.60 | 0.16 | 8.00 | |
输入长度 (128, 256] | 1.20 | 0.16 | 12.00 | |
doubao-seed-1.6-flash | 输入长度 [0, 32] | 0.075 | 0.03 | 0.75 |
输入长度 [32, 128] | 0.150 | 0.03 | 1.50 | |
输入长度 (128, 256] | 0.300 | 0.03 | 3.00 | |
doubao-1.5-thinking-pro
| - | 2.00 | 不支持 | 8.00 |
doubao-1.5-thinking-vision-pro | - | 1.50 | 不支持 | 4.50 |
deepseek-r1 | - | 2.00 | 0.80 | 8.00 |
deepseek-r1-distill-qwen-32b | - | 0.75 | 不支持 | 3.00 |
deepseek-r1-distill-qwen-7b | - | 0.30 | 不支持 | 1.20 |
按 token 后付费价格
计费公式
在线推理费用 = 输入单价 × 输入token + 输出单价 × 输出token
若开启 上下文缓存(部分模型支持),
在线推理费用 = 输入单价 × (输入token - 缓存命中token) + 缓存命中单价 × 缓存命中token + 缓存存储单价 × 缓存存储token × 时长 + 输出单价 × 输出token
计费单价
模型名称 | 输入 | 缓存存储 | 缓存命中 | 输出 |
---|---|---|---|---|
doubao-1.5-pro-32k | 0.80 | 0.017 | 0.16 | 2.00 |
doubao-1.5-pro-256k | 5.00 | 不支持 | 不支持 | 9.00 |
doubao-1.5-lite-32k | 0.30 | 0.017 | 0.06 | 0.60 |
doubao-pro-32k | 0.80 | 0.017 | 0.16 | 2.00 |
doubao-pro-256k | 5.00 | 不支持 | 不支持 | 9.00 |
doubao-lite-4k | 0.30 | 不支持 | 不支持 | 0.60 |
doubao-lite-32k | 0.30 | 0.017 | 0.06 | 0.60 |
doubao-lite-128k | 0.80 | 不支持 | 不支持 | 1.00 |
deepseek-v3 | 2.00 | 0.017 | 0.40 | 8.00 |
按 token 后付费价格
部分模型的批量推理价格是在线推理价格的50%,实际请以下面表格中的价格为准。
计费公式
批量推理费用 = 输入单价 × 输入token + 输出单价 × 输出token
若开启缓存功能(部分模型于2025年4月14日21:00开始支持透明前缀缓存能力,无需任何配置,命中缓存后可享受更低的单价),
批量推理费用 = 输入单价 × (输入token - 缓存命中token) + 缓存命中单价 × 缓存命中token + 输出单价 × 输出token
计费单价
模型名称 | 输入 | 缓存命中 | 输出 |
---|---|---|---|
doubao-1.5-pro-32k | 0.40 | 0.16 | 1.00 |
doubao-1.5-pro-256k | 5.00 | 不支持 | 9.00 |
doubao-1.5-lite-32k | 0.15 | 0.06 | 0.30 |
doubao-pro-32k | 0.80 | 0.16 | 2.00 |
doubao-lite-32k | 0.30 | 0.06 | 0.60 |
deepseek-v3 | 1.00 | 0.40 | 4.00 |
将输入信息(包括图片)转化为 token 计费
计费公式
推理费用 = 输入单价 × 输入token + 输出单价 × 输出token
图片token用量 = min(图片宽 × 图片高 ÷ 784, 单图 token 限制),具体用量统计逻辑请参见 token 用量说明。
按 token 后付费价格
模型 | 输入 | 输出 |
---|---|---|
doubao-1.5-vision-pro | 3.00 | 9.00 |
doubao-1.5-vision-lite | 1.50 | 4.50 |
doubao-1.5-ui-tars | 3.50 | 12.00 |
doubao-1.5-vision-pro-32k | 3.00 | 9.00 |
doubao-vision-pro-32k | 3.00 | 9.00 |
doubao-vision-lite-32k | 1.50 | 4.50 |
按 token 后付费价格
部分模型的批量推理价格是在线推理价格的50%,实际请以下面表格中的价格为准。
模型 | 输入 | 输出 |
---|---|---|
doubao-1.5-vision-pro-32k | 1.50 | 4.50 |
异步推理,将输出视频转化为 token 计费
按 token 后付费价格
计费公式
推理费用 = 按token付费单价 × 视频token用量
视频token用量≈ (宽 × 高 × 帧率 × 时长)/1024,准确的 token 用量以调用 API 后返回信息中的usage
字段为准。
单价
模型 | 文生视频 | 图生视频 |
---|---|---|
doubao-seedance-1-0-pro | 15.00 | 15.00 |
doubao-seedance-1-0-lite | 10.00 | 10.00 |
doubao-seaweed | 30.00 | 30.00 |
wan2.1-14b | 50.00 | 50.00 |
计费示例
模型 | 画面比例 | 分辨率 | 宽×高 | 帧率 | 视频时长 | 用量 | 价格 |
---|---|---|---|---|---|---|---|
doubao-seedance-1-0-pro | 16:9 | 480p | 864×480 | 24 | 5 | 48600 | 0.73 |
16:9 | 864×480 | 24 | 10 | 97000 | 1.46 | ||
4:3 | 736×544 | 24 | 5 | 46920 | 0.70 | ||
4:3 | 736×544 | 24 | 10 | 93840 | 1.41 | ||
1:1 | 640×640 | 24 | 5 | 48000 | 0.72 | ||
1:1 | 640×640 | 24 | 10 | 96000 | 1.44 | ||
21:9 | 960×416 | 24 | 5 | 46800 | 0.70 | ||
21:9 | 960×416 | 24 | 10 | 93600 | 1.40 | ||
16:9 | 1080p | 1920×1088 | 24 | 5 | 244800 | 3.67 | |
16:9 | 1920×1088 | 24 | 10 | 489600 | 7.34 | ||
4:3 | 1664×1248 | 24 | 5 | 243360 | 3.65 | ||
4:3 | 1664×1248 | 24 | 10 | 486720 | 7.30 | ||
1:1 | 1440×1440 | 24 | 5 | 243000 | 3.65 | ||
1:1 | 1440×1440 | 24 | 10 | 486000 | 7.29 | ||
21:9 | 2176×928 | 24 | 5 | 236640 | 3.55 | ||
21:9 | 2176×928 | 24 | 10 | 473280 | 7.10 | ||
doubao-seedance-1-0-lite | 16:9 | 480p | 864×480 | 24 | 5 | 48600 | 0.49 |
16:9 | 864×480 | 24 | 10 | 97000 | 0.97 | ||
4:3 | 736×544 | 24 | 5 | 46920 | 0.47 | ||
4:3 | 736×544 | 24 | 10 | 93840 | 0.94 | ||
1:1 | 640×640 | 24 | 5 | 48000 | 0.48 | ||
1:1 | 640×640 | 24 | 10 | 96000 | 0.96 | ||
21:9 | 960×416 | 24 | 5 | 46800 | 0.47 | ||
21:9 | 960×416 | 24 | 10 | 93600 | 0.94 | ||
16:9 | 720p | 1248×704 | 24 | 5 | 102960 | 1.03 | |
16:9 | 1248×704 | 24 | 10 | 205920 | 2.06 | ||
4:3 | 1120×832 | 24 | 5 | 109200 | 1.09 | ||
4:3 | 1120×832 | 24 | 10 | 218400 | 2.18 | ||
1:1 | 960×960 | 24 | 5 | 108000 | 1.08 | ||
1:1 | 960×960 | 24 | 10 | 216000 | 2.16 | ||
21:9 | 1504×640 | 24 | 5 | 112800 | 1.13 | ||
21:9 | 1504×640 | 24 | 10 | 225600 | 2.26 | ||
16:9 | 1080p | 1920×1088 | 24 | 5 | 244800 | 2.45 | |
16:9 | 1920×1088 | 24 | 10 | 489600 | 4.90 | ||
4:3 | 1664×1248 | 24 | 5 | 243360 | 2.43 | ||
4:3 | 1664×1248 | 24 | 10 | 486720 | 4.87 | ||
1:1 | 1440×1440 | 24 | 5 | 243000 | 2.43 | ||
1:1 | 1440×1440 | 24 | 10 | 486000 | 4.86 | ||
21:9 | 2176×928 | 24 | 5 | 236640 | 2.37 | ||
21:9 | 2176×928 | 24 | 10 | 473280 | 4.73 | ||
doubao-seaweed | 1:1 | 480p | 480×480 | 24 | 5 | 27,000 | 0.81 |
4:3 | 640×480 | 24 | 5 | 36,000 | 1.08 | ||
16:9 | 848×480 | 24 | 5 | 47,700 | 1.43 | ||
1:1 | 480×480 | 24 | 10 | 54,000 | 1.62 | ||
4:3 | 640×480 | 24 | 10 | 72,000 | 2.16 | ||
16:9 | 848×480 | 24 | 10 | 95,400 | 2.86 | ||
1:1 | 720p | 720×720 | 24 | 5 | 60,750 | 1.82 | |
4:3 | 960×720 | 24 | 5 | 81,000 | 2.43 | ||
16:9 | 1280×720 | 24 | 5 | 108,000 | 3.24 | ||
1:1 | 720×720 | 24 | 10 | 121,500 | 3.65 | ||
4:3 | 960×720 | 24 | 10 | 162,000 | 4.86 | ||
16:9 | 1280×720 | 24 | 10 | 216,000 | 6.48 | ||
wan2.1-14b | 16:9 | 480p | 832×480 | 16 | 5 | 31,200 | 1.56 |
16:9 | 720p | 1280×720 | 16 | 5 | 72,000 | 3.60 |
按使用张数后付费价格,单位:元/张
模型 | 定价 | 生成质量 | |
---|---|---|---|
doubao-Seedream-3.0-t2i | 0.259 | 高 |
按 token 后付费价格
模型名称 | 主账号下同时在线连接数 | 单连接最大连接时长 | 单连接静默持续时长 | 免费额度 | 计费 |
---|---|---|---|---|---|
doubao-同声传译 | 100 | 2 | 0.5 | 500k | 语音输入:0.03
|
将输入信息转化为 token 计费
按 token 后付费价格
模型 | 输入 |
---|---|
doubao-embedding | 0.50 |
doubao-embedding-large | 0.70 |
将输入信息(包括图片)转化为 token 计费
按 token 后付费价格
计费公式
推理费用 = 文本输入单价 × 文本token + 图片输入单价 × 图片输入token
图片tokens = (width px × height px)/784,超大图封顶 1312 token。
计费单价
模型 | 文本输入 | 图片输入 |
---|---|---|
doubao-embedding-vision | 0.70 | 1.80 |
语音模型
按输入字数后付费价格,单位:元/万字
模型 | 定价 |
---|---|
doubao-语音合成 | 5 |
doubao-声音复刻 | 8 |
对于部分模型,支持购买 TPM(Tokens Per Minute)保障包。对成功购买的保障包内,保障 token 并发。相比单纯的按token计费,可获得更高的并发,更低的延迟,更强的稳定性。
「小时后付费」和「包天预付费」两种方式支持叠加购买,您可依据业务流量灵活采购。
模型 | 计费方式 | 输入 | 输出 |
---|---|---|---|
doubao-1.5-thinking-pro | 小时后付费 | 9.60 元/每10K TPM | 3.84 元/每1K TPM |
包天预付费 | 115.20 元/每10K TPM | 46.08 元/每1K TPM | |
deepseek-r1 | 小时后付费 | 9.60 元/每10K TPM | 3.84 元/每1K TPM |
包天预付费 | 115.20 元/每10K TPM | 46.08 元/每1K TPM |
模型 | 计费方式 | 输入 | 输出 |
---|---|---|---|
doubao-1.5-pro-32k | 小时后付费 | 1.920 元/每10K TPM | 0.480 元/每1K TPM |
包天预付费 | 23.040 元/每10K TPM | 5.760 元/每1K TPM | |
doubao-1.5-lite-32k | 小时后付费 | 0.72 元/每10K TPM | 0.144 元/每1K TPM |
包天预付费 | 8.64 元/每10K TPM | 1.728 元/每1K TPM | |
doubao-pro-32k | 小时后付费 | 1.920 元/每10K TPM | 0.480 元/每1K TPM |
包天预付费 | 23.040 元/每10K TPM | 5.760 元/每1K TPM | |
deepseek-v3 | 小时后付费 | 4.80 元/每10K TPM | 1.92 元/每1K TPM |
包天预付费 | 57.60 元/每10K TPM | 23.04 元/每1K TPM |
按 token 后付费价格
计费公式
训练费用 = 训练tokens量 x 精调单价 = (数据集总 tokens x 迭代轮次)x 精调单价
若 token 数小于 1000,将会上取整为 1000 tokens 计算。
计费单价
基础模型 | LoRA精调 | 全量精调 |
---|---|---|
doubao-1.5-pro-32k | 50 | 100 |
doubao-1.5-lite-32k | 30 | 60 |
doubao-pro-32k | 50 | - |
doubao-lite-32k | 30 | - |
按 token 后付费价格
说明
精调模型对应的基础模型 | 输入 | 输出 |
---|---|---|
doubao-1.5-pro-32k | 2.00 | 5.00 |
doubao-1.5-lite-32k | 0.75 | 1.50 |
doubao-pro-32k | 0.80 | 2.00 |
doubao-lite-32k | 0.30 | 0.60 |
按 token 后付费价格
精调模型对应的基础模型 | 输入 | 缓存命中 | 输出 |
---|---|---|---|
doubao-1.5-pro-32k | 0.40 | 0.16 | 1.00 |
doubao-1.5-lite-32k | 0.15 | 0.06 | 0.30 |
doubao-pro-32k | 0.80 | 0.16 | 2.00 |
doubao-lite-32k | 0.30 | 0.06 | 0.60 |
对于部分大语言模型,支持按模型单元付费。模型单元提供专属算力,对精调后模型表现更优。
「按小时后付费」和「包月预付费」两种方式支持叠加购买,您可依据业务流量灵活采购。
说明
此为邀测能力,如需使用,提交测试申请工单。
模型 | 计费方式 | 性能预估 | 定价 |
---|---|---|---|
doubao-lite-4k | 按小时后付费 | 3000 | 60 |
包月预付费 | 3000 | 28000 | |
doubao-lite-32k | 按小时后付费 | 3000 | 60 |
包月预付费 | 3000 | 28000 | |
doubao-lite-128k | 按小时后付费 | 4500 | 240 |
包月预付费 | 4500 | 112000 | |
doubao-pro-32k | 按小时后付费 | 3200 | 160 |
包月预付费 | 3200 | 80000 |