方舟为新用户提供免费推理试用额度,便于新用户 0 成本学习以及尝试将模型推理能力与业务相结合。您只需要注册火山引擎,即可获得一定额度的免费调用模型推理服务的次数。
使用限制
- 免费额度仅适用于抵扣按 token 后付费产生的在线推理费用,不能抵扣使用各类插件、知识库等产生的费用。
- 免费额度无法抵扣批量推理调用产生的 token。
- 免费额度可以抵扣使用上下文缓存命中缓存的token、未命中缓存的token、输出产生的token,但是无法抵扣缓存上下文产生的存储费用。
- 免费推理额度,不同模型分别计算,主账号下共享。
举例说明:
主账号如果有 A、B 2 个子账号调用模型推理服务,分别使用模型 1、模型 2 推理额度(k token)为 300、100,300、200 。模型 1、模型 2 的免费推理额度均为 500。则主账号下的免费额度剩余:
模型1: 500 - 300 - 300 = -100 (k token)
模型2: 500 - 100 - 200 = 200 (k token)
模型额度剩余如下:
模型 1 :0,且产生 100 k token 使用量。
模型 2:200 k token 。
- 免费推理额度,基础模型和精调后模型共享。
举例说明:
假设模型 1 的免费推理额度为 500,则模型 1 和基于模型 1 精调后的模型,共享 500 的额度。
获取资格
注册并认证火山引擎用户。
查询额度
您可以通过下面渠道查询到各个模型的免费额度。
- 模型列表:无需登陆,可以查询各个模型的免费额度。
- 开通管理:登陆主账号,可以在控制台实时查询账号下免费额度抵扣情况。
消耗额度
免费额度耗尽,调用将会失败,需要继续使用,需要手动开通对应的模型推理服务,开通方式请见开通管理。
抵扣规则
如果您参与了协作奖励计划,可能会获得「协作奖励计划资源包」。本节为您介绍抵扣顺序的优先级:
- 不同类型的资源包:
- 「免费在线推理资源包(即免费推理额度)」抵扣优先级高于「协作奖励计划资源包」。
- 同一类型的资源包:
如果用户名下同时存在多个可抵扣的同类型资源包,则系统会按照如下优先级进行抵扣:失效时间>生效时间
- 优先使用失效时间早的资源包;针对周期型资源包,失效时间指的是当前重置周期结束时间。
- 若资源包失效时间都相同,则优先使用生效时间早的的资源包进行抵扣;针对周期型资源包,生效时间指的是当前重置周期开始时间。
安心体验模式
安心体验模式是针对未开通过模型服务的新用户更方便体验免费额度设计的,可以保障您免费体验模型推理服务,又不产生费用。在安心体验模式下,您调用推理 API 时仅消耗平台赠送的 50w token 免费额度,接近免费额度后服务将暂停,避免产生额外费用。详情请参见 安心体验模式细则说明。