You need to enable JavaScript to run this app.
导航
模型 TPM 保障费用
最近更新时间:2025.07.16 16:12:03首次发布时间:2025.06.05 16:36:45
我的收藏
有用
有用
无用
无用

使用扣子模型服务时,如果你是团队版和企业版套餐用户,且默认的模型 TPM ( Tokens per Minute)无法满足企业团队的并发请求,你可以灵活选择购买额外的 TPM 保障服务。

什么是模型 TPM 保障

模型 TPM 保障服务是针对特定模型处理高并发请求的保障服务,确保模型在一定时间内能够处理指定的每分钟 Token 数量(TPM)。该服务采用类似包年包月的计费模式,在保障额度内仅收取固定的 TPM 保障费用。如果实际使用超出 TPM 保障额度,则超出部分按照模型 token 按量计费,模型 token 费用,请参考模型费用。相比单纯的按 token 计费,购买模型 TPM 保障,可以更好地提升模型的并发处理能力。
例如某企业的超级管理员为 Doubao-pro-32k 模型购买了一个小时的 TPM 保障服务,设定模型输入TPM 保障值为 10000,模型输出 TPM 保障值为 1000。在实际运行中,在某分钟该大模型的输入为 12000 tokens,输出为 1300 tokens,具体费用包括如下两部分:

  • 一小时 TPM 保障服务:1200 资源点
  • 超额部分:(12000 - 10000)/ 1000 ✖️ 0.8 资源点/千tokens +(1300 - 1000)/ 1000 ✖️ 2 资源点/千tokens = 2.2 资源点

总费用为 1202.2 资源点。

购买说明

  • 仅团队版或企业版的超级管理员或管理员可以购买模型 TPM 保障包。购买后,仅在企业或团队的工作空间范围内生效。
  • 保障服务支持按小时购买,你可以在业务高峰时按小时购买保障服务,贴合流量波峰波谷,避免资源浪费。
  • 保障服务将依据你购买时所指定的保障时间,准时生效。
  • 仅扣子模型支持增购扣子 TPM 保障包,如果是方舟模型,需在火山方舟控制台中购买。具体操作,请参考火山方舟 TPM 保障包

支持模型

当前如下模型支持购买 TPM 保障服务。

  • Doubao-pro-32k
  • Doubao-1.5-vision-pro-32k
  • Doubao-1.5-pro-32k
  • Doubao-1.5-lite-32k

单价

在扣子平台,所有扣子计费资源的消耗默认通过资源点进行抵扣。当账户或资源包内的资源点余额不足时,系统将自动从你的现金账户中扣除对应的金额。模型 TPM 保障费用的价格如下:

模型

计费项

单价

资源点结算(资源点/小时 )

现金结算(元/小时)

Doubao-pro-32k

TPM保障额度-每10K(输入)

960

0.96

TPM保障额度-每1K(输出)

240

0.24

Doubao-1.5-vision-pro-32k

TPM保障额度-每10K(输入)

3600

3.60

TPM保障额度-每1K(输出)

1080

1.08

Doubao-1.5-pro-32k

TPM保障额度-每10K(输入)

960

0.96

TPM保障额度-每1K(输出)

240

0.24

Doubao-1.5-lite-32k

TPM保障额度-每10K(输入)

360

0.36

TPM保障额度-每1K(输出)

72

0.072

购买 TPM 保障

  1. 扣子开发平台工作空间 > 模型管理页面,单击目标模型。
  2. 并发监控页签下,单击 TPM保障
    Image
  3. TPM 保障面板中,完成配置与购买。
    1. 设置每分钟请求次数,即输入希望保障的请求峰值。
    2. 单击自动计算。
      系统将根据用户近 30 天模型的输入和输出 token 均值以及输入的每分钟请求次数给出建议保障的输入和输出 TPM。
    3. 确认 TPM 保障值。
    4. 设置保障时间。最低可设置为 1 小时。
      Image