You need to enable JavaScript to run this app.
导航
deepseek-v3
最近更新时间:2025.11.27 17:54:18首次发布时间:2025.03.26 23:10:05
复制全文
我的收藏
有用
有用
无用
无用
模型效果
★★★
速度
★★
输入
Text,
Image, Audio
文本
输出
Text,
Image , Audio文本
价格(元/百万 token
2.0, 8.0
[输入], [输出]

deepseek-v3 由深度求索公司自研的MoE模型,多项评测成绩超越了 qwen2.5-72b 和 llama-3.1-405b 等开源模型,并在性能上和世界顶尖的闭源模型 gpt-4o 及 claude-3.5-Sonnet 不分伯仲。

最大上下文长度:128k
最大思维链内容长度:不涉及
设置最大回答长度:16k
默认最大回答长度:4k


模型价格

输入
元/百万 token

输入命中缓存
元/百万 token

输出单价
元/百万 token

缓存存储
元/百万 token/小时

输入单价[批量]
元/百万 token

输入命中缓存单价[批量]
元/百万 token

输出单价[批量]
元/百万 token

2.00

0.40

8.00

0.017

1.00

0.40

4.00

其中使用前缀缓存会产生缓存命中、缓存存储计费;批量推理产生输入[批量]、输出[批量]费用。具体请参阅模型服务价格

能力支持

模型版本

deepseek-v3

  • deepseek-v3-250324:新支持前缀缓存。

模型限流

速率限制通过对给定时间段内的请求或令牌使用量设置特定上限来确保公平可靠地访问 API。

TPM:5,000,000
TPM:800,000
RPM:30,000
RPM:15,000

使用文档

模型调用教程
供您了解如何调用该模型,包括参数如何配置以及一些典型使用示例代码,您可以基于此进行扩展。
模型调用API参数的说明
供您查阅API请求以及返回参数取值范围、默认值、示例等信息。

其他说明

方舟 deepseek-v3-250324 模型 temperature 字段对齐DeepSeek官方的处理逻辑

举例:您在请求中设置temperature1,则在模型侧会映射 temperature 值为0.3

Image