使用扣子模型服务时,如果你是团队版和企业版套餐用户,且默认的模型 TPM ( Tokens per Minute)无法满足企业团队的并发请求,你可以灵活选择购买额外的 TPM 保障服务。
模型 TPM 保障服务是针对特定模型处理高并发请求的保障服务,确保模型在一定时间内能够处理指定的每分钟 Token 数量(TPM)。该服务采用类似包年包月的计费模式,在保障额度内仅收取固定的 TPM 保障费用。如果实际使用超出 TPM 保障额度,则超出部分按照模型 token 按量计费,模型 token 费用,请参考模型费用。相比单纯的按 token 计费,购买模型 TPM 保障,可以更好地提升模型的并发处理能力。
例如某企业的超级管理员为 Doubao-pro-32k 模型购买了一个小时的 TPM 保障服务,设定模型输入TPM 保障值为 10000,模型输出 TPM 保障值为 1000。在实际运行中,在某分钟该大模型的输入为 12000 tokens,输出为 1300 tokens,具体费用包括如下两部分:
总费用为 1202.2 资源点。
当前如下模型支持购买 TPM 保障服务。
在扣子平台,所有扣子计费资源的消耗默认通过资源点进行抵扣。当账户或资源包内的资源点余额不足时,系统将自动从你的现金账户中扣除对应的金额。模型 TPM 保障费用的价格如下:
模型 | 计费项 | 单价 | |
---|---|---|---|
资源点结算(资源点/小时 ) | 现金结算(元/小时) | ||
Doubao-pro-32k | TPM保障额度-每10K(输入) | 960 | 0.96 |
TPM保障额度-每1K(输出) | 240 | 0.24 | |
Doubao-1.5-vision-pro-32k | TPM保障额度-每10K(输入) | 3600 | 3.60 |
TPM保障额度-每1K(输出) | 1080 | 1.08 | |
Doubao-1.5-pro-32k | TPM保障额度-每10K(输入) | 960 | 0.96 |
TPM保障额度-每1K(输出) | 240 | 0.24 | |
Doubao-1.5-lite-32k | TPM保障额度-每10K(输入) | 360 | 0.36 |
TPM保障额度-每1K(输出) | 72 | 0.072 |