You need to enable JavaScript to run this app.
导航
kimi-k2
最近更新时间:2025.09.16 11:15:31首次发布时间:2025.07.22 13:59:33
复制全文
我的收藏
有用
有用
无用
无用
模型效果
★★★★★
速度
★★
价格(元/百万token)
4, 16
[输入], [输出]
输入
Text,
Image , Video, Audio
文本
输出
Text,
Image , Video, Audio
文本

具备超强代码和 Agent 能力的 MoE (混合专家模型)架构基础模型,总参数 1T,激活参数 32B。在通用知识推理、编程、数学、Agent 等主要类别的基准性能测试中,K2 模型的性能超过其他主流开源模型

最大上下文长度:128k
可配置最大回答长度:32k
默认最大回答长度:4k


模型价格

元/百万 token

输入
4.00
输出
16.00
缓存输入
0.80
缓存存储[每小时]
0.017
输入[批量]
-
输出[批量]
-

其中使用前缀缓存会产生缓存命中、缓存存储计费;批量推理产生输入[批量]、输出[批量]费用。具体请参阅模型服务价格

能力支持

模型版本

kimi-k2

  • kimi-k2-250905
    新支持 Responses API 及上下文缓存。
  • kimi-k2-250711
    待下线

模型限流

速率限制通过对给定时间段内的请求或令牌使用量设置特定上限来确保公平可靠地访问 API。

TPM:500,000
RPM:5,000

使用文档

模型调用教程
供您了解如何调用该模型,包括参数如何配置以及一些典型使用示例代码,您可以基于此进行扩展。
Responses API参数说明
供您查阅API请求以及返回参数取值范围、默认值、示例等信息。
Chat API参数的说明
供您查阅API请求以及返回参数取值范围、默认值、示例等信息。