deepseek-r1--火山方舟大模型服务平台-火山引擎

文档中心

立即注册

导航

火山方舟大模型服务平台

deepseek-r1

最近更新时间：2025.11.11 19:38:40首次发布时间：2025.05.08 19:50:58

模型效果

★★★★★

速度

★★

输入

Text,

~~Image~~ , ~~Video~~, ~~Audio~~

文本

输出

Text,

~~Image~~ , ~~Video~~, ~~Audio~~

文本

价格（元/百万 token）

4, 16

[输入], [输出]

deepseek-r1 是由深度求索推出的深度思考模型。在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。

最大上下文长度：128k
最大输入长度：96k
最大思维链内容长度：32k
可设置最大回答长度：32k
默认最大回答长度：4k

模型价格

输入单价元/百万 token	输入命中缓存元/百万 token	输出单价元/百万 token	缓存存储元/百万 token/小时	输入单价[批量] 元/百万 token	输入命中缓存单价[批量] 元/百万 token	输出单价[批量] 元/百万 token
4.00	0.80	16.00	0.017	2.00	0.80	8.00

其中使用前缀缓存会产生缓存命中、缓存存储计费；批量推理产生输入[批量]、输出[批量]费用。具体请参阅模型服务价格。

能力支持

函数调用 Function Calling
上下文缓存(Context API)
- 支持前缀缓存

模型版本

deepseek-r1

deepseek-r1-250528：新支持结构化输出；支持max_completion_tokens字段，输出超长内容。
deepseek-r1-250120：待下线

模型限流

速率限制通过对给定时间段内的请求或令牌使用量设置特定上限来确保公平可靠地访问 API。

TPM：5,000,000

TPM：800,000

RPM：30,000

RPM：15,000

使用文档

深度思考

模型调用教程

供您了解如何调用该模型，包括参数如何配置以及一些典型使用示例代码，您可以基于此进行扩展。

Chat API

模型调用API参数的说明

供您查阅API请求以及返回参数取值范围、默认值、示例等信息。

其他说明

不支持的参数

下面介绍模型对于API参数的支持情况

字段	类型	传入后行为
stop	String or Array	不支持，忽略不报错。
frequency_penalty	Float	不支持，忽略不报错。
presence_penalty	Float	不支持，忽略不报错。
temperature	Float	不支持，忽略不报错。
top_p	Float	不支持，忽略不报错。
logprobs	Boolean	不支持，报错。
top_logprobs	Integer	不支持，报错。
logit_bias	Object	不支持，报错。
thinking	Object	不支持，报错。
response_format	Object	暂不支持，报错。

控制模型输出长度

详细使用请参见设置模型输出长度限制。