You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们
选择服务
售卖模式
大语言模型

按tokens使用量(输入文本+输出文本)计费,每小时出账,按量后付费。每个模型分别提供50万tokens免费推理额度,详见产品计费文档

模型提供方
模型
上下文长度
服务类型
定价(单位:元/千tokens)
字节跳动
Doubao-pro-4k(输入)
4k
推理服务(输入)
-
字节跳动
Doubao-pro-4k(输出)
4k
推理服务(输出)
-
字节跳动
Doubao-pro-32k(输入)
32k
推理服务(输入)
-
字节跳动
Doubao-pro-32k(输出)
32k
推理服务(输出)
-
字节跳动
Doubao-pro-vision-32k(输入)
32k
推理服务(输入)
-
字节跳动
Doubao-pro-vision-32k(输出)
32k
推理服务(输出)
-
字节跳动
Doubao-pro-128k(输入)
128k
推理服务(输入)
-
字节跳动
Doubao-pro-128k(输出)
128k
推理服务(输出)
-
字节跳动
Doubao-pro-256k(输入)
256k
推理服务(输入)
-
字节跳动
Doubao-pro-256k(输出)
256k
推理服务(输出)
-
字节跳动
Doubao-lite-4k(输入)
4k
推理服务(输入)
-
字节跳动
Doubao-lite-4k(输出)
4k
推理服务(输出)
-
字节跳动
Doubao-lite-32k(输入)
32k
推理服务(输入)
-
字节跳动
Doubao-lite-32k(输出)
32k
推理服务(输出)
-
字节跳动
Doubao-lite-128k(输入)
128k
推理服务(输入)
-
字节跳动
Doubao-lite-128k(输出)
128k
推理服务(输出)
-
月之暗面
Moonshot-v1-8k
8k
推理服务
-
月之暗面
Moonshot-v1-32k
32k
推理服务
-
月之暗面
Moonshot-v1-128k
128k
推理服务
-
智谱AI
GLM3-130B
8k
推理服务
-
智谱AI
GLM3-130B金融模型
8k
推理服务
-
语音大模型

语音合成和声音复刻模型卡片暂未完全公开,如需申请使用,请提交工单联系我们

模型提供方
模型
服务类型
定价(单位:元/万字符)
免费额度
字节跳动
语音合成大模型
推理服务
5
5000 字符
字节跳动
声音复刻大模型
推理服务
8
5000 字符
向量模型
模型提供方
模型
最长输入长度
服务类型
定价(单位:元/千tokens)
免费额度
字节跳动
Doubao-embedding
4K
推理服务(输入)
-
50万tokens
字节跳动
Doubao-embedding-large
4K
推理服务(输入)
-
50万tokens
模型精调

按tokens使用量(训练文本*训练迭代次数)计费,训练完成后出账,按量后付费。

模型提供方
模型
服务类型
定价(单位:元/千tokens)
字节跳动
Doubao-lite-4k
模型精调(LoRA)
-
字节跳动
Doubao-lite-32k
模型精调(LoRA)
-
字节跳动
Doubao-lite-128k
模型精调(LoRA)
-
字节跳动
Doubao-pro-4k
模型精调(LoRA)
-
字节跳动
Doubao-pro-32k
模型精调(LoRA)
-
字节跳动
Doubao-pro-128k
模型精调(LoRA)
-
大语言模型

模型单元是调用某个特定模型的 TPM(Tokens Per Minute,每分钟tokens数量)配额,购买后无需再为 Tokens 消耗付费,详细使用说明请见查看并管理模型推理接入点

模型提供方
模型
预计可承载性能(TPS)
定价(单位:元/个)
计费方式
字节跳动
Doubao-lite-4k(按小时)
3000
60
后付费
字节跳动
Doubao-lite-4k(包月)
3000
28000
预付费
字节跳动
Doubao-lite-32k(按小时)
3000
60
后付费
字节跳动
Doubao-lite-32k(包月)
3000
28000
预付费
字节跳动
Doubao-lite-128k(按小时)
4500
240
后付费
字节跳动
Doubao-lite-128k(包月)
4500
112000
预付费
字节跳动
Doubao-pro-4k(按小时)
3200
160
后付费
字节跳动
Doubao-pro-4k(包月)
3200
80000
预付费
字节跳动
Doubao-pro-32k(按小时)
3200
160
后付费
字节跳动
Doubao-pro-32k(包月)
3200
80000
预付费
字节跳动
Doubao-pro-128k(按小时)
3500
1200
后付费
字节跳动
Doubao-pro-128k(包月)
3500
550000
预付费
视觉大模型

Stable-Diffusion和Stable-Diffusion-XL模型卡片暂未完全公开,如需申请使用,请提交工单联系我们

模型提供方
模型
定价(单位:元/个)
RunwayML
Stable-Diffusion-1.5(包天)
175
RunwayML
Stable-Diffusion-1.5(包月)
4200
Stability AI
Stable-Diffusion-XL(包天)
175
Stability AI
Stable-Diffusion-XL(包月)
4200
知识库

知识库的计费有三个核心组成部分:计算资源、离线存储资源、大模型调用。其中计算资源和离线存储资源,会在知识库索引构建成功后启动计费,无论是否调用均会以小时维度出账;大模型部分则会按实际调用 tokens 量计费,以小时维度出账,具体计费项以实际功能使用时选择的模型为准,详见产品计费文档

计算资源
计费项
定义
如何计量
单价
单位
计算资源-知识库
使用知识库时,构建索引、自动优化分析、线上检索依赖的计算资源
按 CU(Compute Unit)计量,1 CU包含的计算资源为 8 GB 内存和 1 CPU Core。 例如,32 CU所包含的计算资源为 256 GB 内存和 32 CPU Core,若运行 5 小时,则计算费用 = 5×32×0.45 =72元。
-
元/CU/小时
离线存储资源
计费项
定义
如何计量
单价
单位
离线存储资源-知识库
向量和向量相关的数据属性所需的存储资源
按占用的 GB 计量
-
元/GB/小时
大模型调用
计费项
定义
如何计量
单价
单位
文本向量模型-知识库
使用知识库,提供文本向量服务,帮助开发者将文本数据快速转换为向量数据。
按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。
-
元/千Tokens
文本向量模型(多功能版)-知识库
使用知识库,提供文本向量服务,帮助开发者将文本数据快速转换为向量数据。支持多语言和长文本,可同时进行稀疏和稠密索引构建和检索。
按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。
-
元/千Tokens
文本向量模型(豆包embedding)-知识库
使用知识库,提供文本向量服务,帮助开发者将文本数据快速转换为向量数据。字节跳动自研向量化模型,支持中英双语和高精度纯语义检索。
按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。
-
元/千Tokens
文本向量模型(豆包embedding-large)-知识库
使用知识库,提供文本向量服务,帮助开发者将文本数据快速转换为向量数据。字节跳动自研向量化模型,支持中英双语和高精度纯语义检索。
按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。
-
元/千Tokens
大语言模型输入(Doubao-pro-256k)-知识库
使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。
按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。
-
元/千Tokens
大语言模型输出(Doubao-pro-256k)-知识库
使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。
按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。
-
元/千Tokens
大语言模型输入(Doubao-pro-128k)-知识库
使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。
按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。
-
元/千Tokens
大语言模型输出(Doubao-pro-128k)-知识库
使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。
按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。
-
元/千Tokens
大语言模型输入(Doubao-pro-32k)-知识库
使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。
按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。
-
元/千Tokens
大语言模型输出(Doubao-pro-32k)-知识库
使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。
按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。
-
元/千Tokens
大语言模型输入(Doubao-lite-128k)-知识库
使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。
按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。
-
元/千Tokens
大语言模型输出(Doubao-lite-128k)-知识库
使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。
按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。
-
元/千Tokens
大语言模型输入(Doubao-lite-32k)-知识库
使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。
按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。
-
元/千Tokens
大语言模型输出(Doubao-lite-32k)-知识库
使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。
按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。
-
元/千Tokens
联网内容插件

使用插件可能会产生大语言模型额外tokens消耗费用,详见产品计费文档

官方组件名称
计费说明
单价
单位
免费额度
联网资源
支持实时搜索互联网公开域内容
-
元/次
2万次/月
头条资源
支持实时搜索今日头条图文内容,并提供内容详情信息供展示交互卡片
-
元/次
抖音资源
支持实时搜索抖音视频、抖音百科内容,并提供内容详情信息供展示交互卡片
-
元/次
墨迹天气
支持实时搜索墨迹天气内容资源
-
元/次
火山引擎定价模块仅作为商品规格和价格的参考,具体可购买的商品规格及费用请以实际下单结果为准。

一键开启云上增长新空间

立即注册