You need to enable JavaScript to run this app.
导航
记忆库计费
最近更新时间:2025.09.30 15:22:29首次发布时间:2025.08.15 16:06:26
复制全文
我的收藏
有用
有用
无用
无用

计费说明

本文介绍记忆库产品的计费说明,包括计费方式、计费周期、计费项。

计费方式

支持按量计费(后付费),即先使用再付费。费用计入账单内,您可以在账单出账后结算费用。

计费周期

记忆库以 <小时> 为周期统计所有计费项的使用量,并结算生成账单。

注意

创建记忆库后,上传session会触发记忆库计算资源的分配和预留,并开始持续按小时计费,session删除不影响计算资源占用,若无需使用请主动删除记忆库。

计费项

记忆库后付费的出账构成:
1、资源按小时计费:计算资源,记忆抽取完成后会将记忆进行向量化并流式写入索引,因此需要持续对计算资源产生占用,每个小时均会按照当时实际用量计算该小时费用。
⚠️ 注意:计算和存储资源大小与记忆量成正比,系统会按照实际用量自动扩缩容。
⚠️ 注意:每小时均会产生费用,如不需要使用,请及时清理记忆库。

2、模型按调用量计费:向量化和记忆抽取模型的推理,会按照实际的 tokens 消耗统计进行计费。

详细计费项说明如下:

计费项

定义

如何计量

单价

记忆抽取大模型输入

使用记忆库,调用大语言模型服务进行记忆抽取时,输入原始session的消耗。

按输入的 tokens 计量。

0.0008 元 / 千 tokens

记忆抽取大模型输入(缓存版)

使用记忆库,调用大语言模型服务进行记忆抽取时,prompt部分使用前缀缓存(缓存可减少每次请求时重复处理加载开销)的消耗。

按输入的 tokens 计量。

0.00016 元 / 千 tokens

记忆抽取大模型输出

使用记忆库,调用大语言模型服务进行记忆抽取,输出记忆的消耗。

按输出的 tokens 计量。

0.002 元 / 千 tokens

标准记忆存算资源

存储资源包含抽取记忆向量化后,向量和向量相关的数据属性所需的存储资源。计算资源包括构建索引、自动优化分析、线上检索依赖的计算资源。标准版记忆库采用共享资源模式。

按记忆条数*时间收费

0.02 元 / 万条 / 小时

计算资源

使用记忆库旗舰版的计算资源,包括构建索引、自动优化分析、线上检索依赖的计算资源。

按 CU(Compute Unit)计量,1 CU 包含的计算资源为 8 GB 内存和 1 CPU Core。

0.6 元 / CU / 小时

记忆向量化模型(文本)

使用记忆库,提供文本向量服务,帮助开发者将文本数据快速转换为向量数据,以进行记忆的检索。

按输入的 tokens 计量。

0.0005 元 / 千tokens

欠费说明

如果您账户中的可用额度(含账户余额和代金券)小于待结算的账单,会被认为欠费,您将会收到余额不足的短信或邮件提醒。本文介绍欠费之后您的资源情况及可执行操作。
请您在欠费 24 小时内充值并结清欠费账单,否则您将不能正常使用向量数据库及记忆库服务。
向量数据库及记忆库产生欠费后服务状态变化如下:

  • 欠费 24 小时以内,系统将保持正常运行,持续计费。
  • 欠费超过 24 小时不足 168 小时,火山引擎会暂停本服务使用,但仍保留您的数据及相关资源,关停期间不计费。
  • 当欠费超过 168 小时,视为您主动放弃向量数据库及记忆库后付费服务,相关资源、数据将被释放,释放的资源及数据无法恢复。
  • 如您在欠费 168 小时内补缴所有欠费账单后,服务将恢复正常。

税费及发票

除非另有说明,否则火山引擎平台上产品或服务定价均为包含增值税的金额。在服务提供过程中或产品使用期内,如遇国家税收政策调整,导致增值税税率发生变化的,增值税适用税率应按照国家税收政策相应调整,不含税价格保持不变。
我们支持您根据您在火山引擎账户已成功订购的订单和/或已出具的账单金额向您开具等额增值税发票,您可以通过火山引擎控制台-费用中心-发票管理申请增值税发票,我们将在收到您的发票申请后及时向您开具增值税发票。如您使用的服务对应的服务规则与本条约定不一致或双方另有约定的,应适用该等特定服务规则或双方另行约定的条款和条件。针对周期结算服务及具体使用量,公司亦保留要求用户提供资信证明、预付款、保证金或其他公司认为必要的开通和订购条件。
我们将根据您购买的具体产品或服务类型,按照如下发票内容向您开具增值税发票:

产品或服务交付方式

服务期或授权期

发票内容

税率

记忆库-公有云版本

以客户实际使用服务期为准

信息系统增值服务技术服务费*6%

6%