模型效果速度价格(元/百万token)输入输出具备超强代码和 Agent 能力的 MoE (混合专家模型)架构基础模型,总参数 1T,激活参数 32B。在通用知识推理、编程、数学、Agent 等主要类别的基准性能测试中,K2 模型的性能超过其他主流开源模型
最大上下文长度:128k
可配置最大回答长度:32k
默认最大回答长度:4k
元/百万 token
输入输出缓存输入缓存存储[每小时]输入[批量]输出[批量]其中使用前缀缓存会产生缓存命中、缓存存储计费;批量推理产生输入[批量]、输出[批量]费用。具体请参阅模型服务价格。
kimi-k2
速率限制通过对给定时间段内的请求或令牌使用量设置特定上限来确保公平可靠地访问 API。