本文为您介绍使用LAS AI算子等相关功能,调用了大模型时,产生的模型费用详情。
功能模块 | 计费项 | 计费简介 |
|---|---|---|
算子广场 & 算子服务 |
|
|
|
|
大模型在处理数据时,以 Token 作为基本单位。Token 是模型推理过程中文本的最小意义单元,它可以是一个单词、汉语里的词语 / 短句、标点符号或数字等。一般来说,一段常规的中文文本中,1 个 Token 大约对应 1.5~2 个汉字。这种划分方式让模型能够高效地理解和处理语言结构,无论是短句还是复杂文本,都能通过 Token 的组合来解析语义。
如语言大模型推理服务费用的一种较为常见的计算方式如下:
费用 = token 使用数量 * token 单价
基于方舟模型的算子,在进行数据处理时,可基于模型的推理类型分为“在线推理”、“批量推理”两类。以下分别为您介绍这两类模型的计费详情。
支持的地域 | 模型名称 | 计费项 | 条件(千 token) | 单价 |
|---|---|---|---|---|
华北2(北京) | doubao-seed-1.8 | 推理服务(输入) | 输入长度 [0, 32] 且输出长度 [0, 0.2] | 0.8 元 / 百万 Tokens |
推理服务(输出) | 2 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 [0, 32] 且输出长度 | 0.8 元 / 百万 Tokens | ||
推理服务(输出) | 8 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (32, 128] | 1.2 元 / 百万 Tokens | ||
推理服务(输出) | 16 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (128, 256] | 2.4 元 / 百万 Tokens | ||
推理服务(输出) | 24 元 / 百万 Tokens | |||
doubao-seed-1.6 | 推理服务(输入) | 输入长度 [0, 32] 且输出长度 [0, 0.2] | 0.8 元 / 百万 Tokens | |
推理服务(输出) | 2 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 [0, 32] 且输出长度 | 0.8 元 / 百万 Tokens | ||
推理服务(输出) | 8 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (32, 128] | 1.2 元 / 百万 Tokens | ||
推理服务(输出) | 16 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (128, 256] | 2.4 元 / 百万 Tokens | ||
推理服务(输出) | 24 元 / 百万 Tokens | |||
doubao-seed-1.6-thinking | 推理服务(输入) | 输入长度 [0, 32] | 0.8 元 / 百万 Tokens | |
推理服务(输出) | 8 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (32, 128] | 1.2 元 / 百万 Tokens | ||
推理服务(输出) | 16 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (128, 256] | 2.4 元 / 百万 Tokens | ||
推理服务(输出) | 24 元 / 百万 Tokens | |||
doubao-seed-1.6-vision | 推理服务(输入) | 输入长度 [0, 32] | 0.8 元 / 百万 Tokens | |
推理服务(输出) | 8 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (32, 128] | 1.2 元 / 百万 Tokens | ||
推理服务(输出) | 16 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (128, 256] | 2.4 元 / 百万 Tokens | ||
推理服务(输出) | 24 元 / 百万 Tokens | |||
doubao-seed-1.6-flash | 推理服务(输入) | 输入长度 [0, 32] | 0.15 元 / 百万 Tokens | |
推理服务(输出) | 1.5 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (32, 128] | 0.3 元 / 百万 Tokens | ||
推理服务(输出) | 3 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (128, 256] | 0.6 元 / 百万 Tokens | ||
推理服务(输出) | 6 元 / 百万 Tokens | |||
doubao-seedream-4.5 | 不涉及 | 元/张 | 0.25 | |
doubao-seedream-4.0 | 不涉及 | 元/张 | 0.2 | |
deepseek-v3.2 | 推理服务(输入) | 输入长度 [0, 32] | 2 元 / 百万 Tokens | |
推理服务(输出) | 3 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (32, 128] | 4 元 / 百万 Tokens | ||
推理服务(输出) | 6 元 / 百万 Tokens | |||
doubao-embedding | 推理服务(输入) | 不涉及 | 0.5 元 / 百万 Tokens | |
doubao-embedding-large | 推理服务(输入) | 不涉及 | 0.7 元 / 百万 Tokens | |
doubao-embedding-vision | 推理服务(文本输入) | 不涉及 | 0.7 元 / 百万 Tokens | |
推理服务(图片输入) | 不涉及 | 1.8 元 / 百万 Tokens | ||
doubao-1.5-pro-32k | 推理服务(输入) | 不涉及 | 0.8 元 / 百万 Tokens | |
推理服务(输出) | 不涉及 | 2 元 / 百万 Tokens | ||
精调模型推理服务(输入) | 不涉及 | 2 元 / 百万 Tokens | ||
精调模型推理服务(输出) | 不涉及 | 5 元 / 百万 Tokens | ||
doubao-1.5-pro-256k | 推理服务(输入) | 不涉及 | 5 元 / 百万 Tokens | |
推理服务(输出) | 不涉及 | 9 元 / 百万 Tokens | ||
doubao-1.5-lite-32k | 推理服务(输入) | 不涉及 | 0.3 元 / 百万 Tokens | |
推理服务(输出) | 不涉及 | 0.6 元 / 百万 Tokens | ||
精调模型推理服务(输入) | 不涉及 | 0.75 元 / 百万 Tokens | ||
精调模型推理服务(输出) | 不涉及 | 1.5 元 / 百万 Tokens | ||
deepseek-v3 | 推理服务(输入) | 不涉及 | 2 元 / 百万 Tokens | |
推理服务(输出) | 不涉及 | 8 元 / 百万 Tokens | ||
deepseek-r1 | 推理服务(输入) | 不涉及 | 4 元 / 百万 Tokens | |
推理服务(输出) | 不涉及 | 16 元 / 百万 Tokens | ||
deepseek-r1-distill-qwen-32b | 推理服务(输入) | 不涉及 | 1.5 元 / 百万 Tokens | |
推理服务(输出) | 不涉及 | 6 元 / 百万 Tokens | ||
Doubao-1.5-thinking-vision-pro | 推理服务(输入) | 不涉及 | 3 元 / 百万 Tokens | |
推理服务(输出) | 不涉及 | 9 元 / 百万 Tokens | ||
doubao-seedance-1.0-pro | 不涉及 | 不涉及 | 15 元 / 百万 Tokens | |
doubao-seedance-1-0-lite | 不涉及 | 不涉及 | 10 元 / 百万 Tokens | |
华北2(北京) | doubao-seed-1.6-lite | 推理服务(输入) | 输入长度 [0, 32] 且输出长度 [0, 0.2] | 0.3 元 / 百万 Tokens |
推理服务(输出) | 0.6元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 [0, 32] 且输出长度 | 0.3元 / 百万 Tokens | ||
推理服务(输出) | 2.4元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (32, 128] | 0.6元 / 百万 Tokens | ||
推理服务(输出) | 4元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (128, 256] | 1.2元 / 百万 Tokens | ||
推理服务(输出) | 12元 / 百万 Tokens | |||
华北2(北京) | doubao-seedance-1.5-pro | 有声 | 不涉及 | 16 元 / 百万 Tokens |
无声 | 不涉及 | 8 元 / 百万 Tokens | ||
doubao-seedance-1.0-pro-fast | 不涉及 | 不涉及 | 4.2元 / 百万 Tokens |
支持的地域 | 模型名称 | 计费项 | 条件(千 token) | 单价 |
|---|---|---|---|---|
华北2(北京) | doubao-seed-1.8 | 推理服务(输入) | 输入长度 [0, 32] 且输出长度 [0, 0.2] | 0.4 元 / 百万 Tokens |
推理服务(输出) | 1 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 [0, 32] 且输出长度 | 0.4 元 / 百万 Tokens | ||
推理服务(输出) | 4 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (32, 128] | 0.6 元 / 百万 Tokens | ||
推理服务(输出) | 8 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (128, 256] | 1.2 元 / 百万 Tokens | ||
推理服务(输出) | 12 元 / 百万 Tokens | |||
doubao-seed-1.6 | 推理服务(输入) | 输入长度 [0, 32] 且输出长度 [0, 0.2] | 0.4 元 / 百万 Tokens | |
推理服务(输出) | 1 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 [0, 32] 且输出长度 | 0.4 元 / 百万 Tokens | ||
推理服务(输出) | 4 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (32, 128] | 0.6 元 / 百万 Tokens | ||
推理服务(输出) | 8 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (128, 256] | 1.2 元 / 百万 Tokens | ||
推理服务(输出) | 12 元 / 百万 Tokens | |||
doubao-seed-1.6-thinking | 推理服务(输入) | 输入长度 [0, 32] | 0.4 元 / 百万 Tokens | |
推理服务(输出) | 4 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (32, 128] | 0.6 元 / 百万 Tokens | ||
推理服务(输出) | 8 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (128, 256] | 1.2 元 / 百万 Tokens | ||
推理服务(输出) | 12 元 / 百万 Tokens1 | |||
doubao-seed-1.6-flash | 推理服务(输入) | 输入长度 [0, 32] | 0.075 元 / 百万 Tokens | |
推理服务(输出) | 0.75 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (32, 128] | 0.15 元 / 百万 Tokens | ||
推理服务(输出) | 1.5 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (128, 256] | 0.3 元 / 百万 Tokens | ||
推理服务(输出) | 3 元 / 百万 Tokens | |||
doubao-seed-1.6-vision | 推理服务(输入) | 输入长度 [0, 32] | 0.4 元 / 百万 Tokens | |
推理服务(输出) | 4 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (32, 128] | 0.6 元 / 百万 Tokens | ||
推理服务(输出) | 8 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (128, 256] | 1.2 元 / 百万 Tokens | ||
推理服务(输出) | 12 元 / 百万 Tokens | |||
doubao-1.5-pro-32k | 推理服务(输入) | 不涉及 | 0.4 元 / 百万 Tokens | |
推理服务(输出) | 不涉及 | 1 元 / 百万 Tokens | ||
doubao-1.5-lite-32k | 推理服务(输入) | 不涉及 | 0.15 元 / 百万 Tokens | |
推理服务(输出) | 不涉及 | 0.3 元 / 百万 Tokens | ||
doubao-seedance-1.0-pro | 不涉及 | 不涉及 | 7.5 元 / 百万 Tokens | |
doubao-seedance-1-0-lite | 不涉及 | 不涉及 | 5 元 / 百万 Tokens | |
deepseek-v3.2 | 推理服务(输入) | 输入长度 [0, 32] | 1 元 / 百万 Tokens | |
推理服务(输出) | 1.5 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (32, 128] | 2 元 / 百万 Tokens | ||
推理服务(输出) | 3 元 / 百万 Tokens | |||
华北2(北京) | doubao-seedance-1.5-pro | 有声 | 不涉及 | 8 元 / 百万 Tokens |
无声 | 不涉及 | 4 元 / 百万 Tokens | ||
doubao-seedance-1.0-pro-fast | 不涉及 | 不涉及 | 2.1元 / 百万 Tokens | |
华北2(北京) | doubao-seed-1.6-lite | 推理服务(输入) | 输入长度 [0, 32] 且输出长度 [0, 0.2] | 0.15 元 / 百万 Tokens |
推理服务(输出) | 0.3 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 [0, 32] 且输出长度 | 0.15 元 / 百万 Tokens | ||
推理服务(输出) | 1.2 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (32, 128] | 0.3 元 / 百万 Tokens | ||
推理服务(输出) | 2 元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (128, 256] | 0.6 元 / 百万 Tokens | ||
推理服务(输出) | 6 元 / 百万 Tokens |
支持的地域 | 算子服务 & 模型名称 | 计费项 | 条件(千 token) | 单价 |
|---|---|---|---|---|
华北2(北京) |
| 推理服务(输入) | 输入长度 [0, 128] | 4.7元 / 百万 Tokens |
推理服务(输出) | 20元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (128, 256] | 5.9元 / 百万 Tokens | ||
推理服务(输出) | 30元 / 百万 Tokens | |||
| 推理服务(输入) | 输入长度 [0, 128] | 2.6元 / 百万 Tokens | |
推理服务(输出) | 20元 / 百万 Tokens | |||
推理服务(输入) | 输入长度 (128, 256] | 3.8元 / 百万 Tokens | ||
推理服务(输出) | 30元 / 百万 Tokens | |||
| 不涉及 | 不涉及 | 0.8元/小时 | |
| 不涉及 | 不涉及 | 2.3元/小时 | |
| 不涉及 | 不涉及 | 0.003元/分钟 | |
| 不涉及 | 不涉及 | 0.003元/分钟 | |
| 不涉及 | 不涉及 | 1.6元/小时 | |
| 不涉及 | 不涉及 | 4.6元/小时 | |
| 不涉及 | 不涉及 | 0.02元/页 | |
| 不涉及 | 不涉及 | 0.04元/页 | |
| 不涉及 | 不涉及 | 1.5元/分钟 | |
| 不涉及 | 不涉及 | 2元/分钟 |
doubao-pro-32k-*** 所有版本)汇总计算。说明
例如您主账号下使用 doubao-pro-32k 模型,有 a、b、c 三个的批量推理任务和d、e 两个在线推理任务。则您每天a、b、c 批量推理共用 10B token 配额,d 、e 共用在线推理任务 TPM、RPM 限流额度。