智力程度
速度
价格(元/百万token)
输入
输出
Doubao-1.5全新深度思考模型,在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出,在AIME 2024、Codeforces、GPQA等多项权威基准上达到或接近业界第一梯队水平。
最大上下文长度:128k
最大输入长度:96k
最大思维链内容长度:32k
可配置最大输出长度:16k
默认最大输出长度:4k
元/百万 token
输入
输出
缓存命中
缓存存储[每小时]
输入[批量]
输出[批量]
其中使用前缀缓存会产生缓存命中、缓存存储计费;批量推理产生输入[批量]、输出[批量]费用。具体请参阅模型服务价格。
doubao-1.5-thinking-pro
速率限制通过对给定时间段内的请求或令牌使用量设置特定上限来确保公平可靠地访问 API。
doubao-1.5-thinking-pro-m-250428
支持使用 thinking 参数控制模型是否开启深度思考模式。默认为开启
状态。
当前 SDK 还不支持
thinking
字段,支持的 SDK 版本将在近期更新。
开启深度思考:传入"thinking":{"type":"enabled"}
,或者保持缺省状态(即不设置 thinking 字段),模型会启用深度思考,输出思维链内容。
curl --location 'https://ark.cn-beijing.volces.com/api/v3/chat/completions' --header 'Authorization: Bearer <YOUR_ARK_API_KEY>' --header 'Content-Type: application/json' --data '{ "model": "doubao-1-5-thinking-pro-m-250428", "messages": [ { "role": "user", "content": [ { "type":"text", "text":"图片里有什么?" }, { "type": "image_url", "image_url": { "url":"https://ark-project.tos-cn-beijing.volces.com/doc_image/ark_demo_img_1.png" } } ] } ], "thinking":{ "type":"enabled" } }'