模型效果速度 输入输出价格(元/百万token)doubao-seed-code是专为实际开发场景打造的AI Coding模型,强化了Bugfix能力和前端能力。支持输入透明Cache能力,降低使用成本。
最大上下文长度:256k
最大输入长度:224k
最大思维链内容长度:32k
max_tokens:最大32k,默认4k(不包含思考内容)
max_completion_tokens:最大64k(包含思考内容)
条件 | 输入 | 输入命中缓存 | 输出单价 | 缓存存储 |
|---|---|---|---|---|
输入长度 [0, 32] | 1.20 | 0.24 | 8.00 | 0.017 |
输入长度 (32, 128] | 1.40 | 0.24 | 12.00 | 0.017 |
输入长度 (128, 256] | 2.80 | 0.24 | 16.00 | 0.017 |
下面是计费项的简单说明,具体请参阅模型服务价格。
- 输入输出价位按照输入长度来定档,举例,在线推理场景,当输入长度为 16k ,则输入单价为1.2 元/百万 token,输出单价为8 元/百万 token。
- 使用在线推理的上下文缓存能力,产生命中缓存的输入折后费用、创建的缓存存储费用。
doubao-seed-code
速率限制通过对给定时间段内的请求或令牌使用量设置特定上限来确保公平可靠地访问 API。
支持使用 thinking 参数控制模型是否开启深度思考模式。默认为开启状态。详细使用请参见 开启关闭深度思考文档。
支持 max_completion_tokens、max_tokens。
详细使用请参见 设置模型输出长度限制。
方舟 Coding Plan 是为广大开发者量身打造的AI Coding场景订阅服务,支持最新的Doubao-Seed-Code模型与多款主流 AI 编码工具,为开发者提供畅快、智能、稳定的编码体验,大幅提升代码编写效率与质量。
注意
以下接入方式将使用Tokens按量后付费方式计费,不会使用 Coding Plan 额度。如需接入 Coding plan,请详见方舟 Coding Plan 接入方式。
Base URL:https://ark.cn-beijing.volces.com/api/v3
API使用文档:Chat API
Base URL:https://ark.cn-beijing.volces.com/api/v3
API使用文档:Responses API
Base URL:https://ark.cn-beijing.volces.com/api/compatible
使用示例如下:
curl https://ark.cn-beijing.volces.com/api/compatible/v1/messages \ -H "Content-Type: application/json" \ -H "x-api-key: $ARK_API_KEY" \ -d '{ "model": "doubao-seed-code-preview-251028", "system":"你是Doubao,我的编程助手。", "messages": [ { "role": "user", "content": "Hello!" } ] }'