方舟为新用户提供免费推理试用额度,便于新用户 0 成本学习以及尝试将模型推理能力与业务相结合。您只需要注册火山引擎,即可获得一定额度的免费调用模型推理服务的次数。
- 上下文缓存介绍请参见上下文缓存(Context API)概述。
- 上下文缓存计费请参见上下文缓存计费。
模型1: 500 - 300 - 300 = -100 (k token) 模型2: 500 - 100 - 200 = 200 (k token)
模型额度剩余如下:
模型 1 :0,且产生 100 k token 使用量。
模型 2:200 k token 。
注册并认证火山引擎用户。
您可以通过下面渠道查询到各个模型的免费额度。
免费额度耗尽,调用将会失败,需要继续使用,需要手动开通对应的模型推理服务,开通方式请见开通管理。
安心体验模式是针对未开通过模型服务的新用户更方便体验免费额度设计的,可以保障您免费体验模型推理服务,又不产生费用。在安心体验模式下,您调用推理 API 时仅消耗平台赠送的 50w token 免费额度,接近免费额度后服务将暂停,避免产生额外费用。详情请参见 安心体验模式细则说明。