智力程度
速度
价格(元/百万token)
输入
输出
Doubao-1.5-lite,全新一代轻量版模型,极致响应速度,效果与时延均达到全球一流水平。支持32k上下文窗口,输出长度支持最大12k tokens。
最大上下文长度:32k
可配置最大输出长度:12k
默认最大输出长度:4k
元/百万 token
输入
输出
缓存命中
缓存存储[每小时]
输入[批量]
输出[批量]
其中使用前缀缓存会产生缓存命中、缓存存储计费;批量推理产生输入[批量]、输出[批量]费用。具体请参阅模型服务价格。
doubao-1.5-lite-32k
速率限制通过对给定时间段内的请求或令牌使用量设置特定上限来确保公平可靠地访问 API。