智力程度
速度
价格(元/百万token)
8K
32K
128K
输入
输出
moonshot-v1 是由 moonshot AI 推出的千亿参数的语言模型,具备优秀的语义理解、指令遵循和文本生成能力。moonshot-v1 有8K、32K、128K 三种上下文长度的模型。
最大上下文长度:128k
可配置最大输出长度:4k
默认最大输出长度:4k
元/百万 token
输入
8K
32K
128K
输出
8K
32K
128K
缓存命中
缓存存储[每小时]
输入[批量]
输出[批量]
其中使用前缀缓存会产生缓存命中、缓存存储计费;批量推理产生输入[批量]、输出[批量]费用。具体请参阅模型服务价格。
moonshot-v1
速率限制通过对给定时间段内的请求或令牌使用量设置特定上限来确保公平可靠地访问 API。