You need to enable JavaScript to run this app.
向量数据库VikingDB

向量数据库VikingDB

复制全文
知识库常见问题
常见问题
复制全文
常见问题

API 接入与技术支持
  1. 配置 project 字段时,如何查询项目名称?
  • VikingDB 用户,访问控制的项目管理控制台,创建/查询项目信息。
  • 火山引擎方舟用户,访问控制的项目管理控制台,创建/查询项目信息。
  1. 能否使用 API key 进行鉴权?

当前只支持使用 ak/sk 的方式进行鉴权,可参考 Access Key(密钥)管理 获得账号 ak/sk。

  1. 使用 API 调用时延不稳定该怎么办?

请检查公网延迟是否正常。如果无法解决可以使用私网连接,参考 知识库私网连接方式

  1. 使用 API 调用和使用可视化界面的效果不一致?

建议在可视化页面左下角发布知识服务,并通过 service_chat 进行调用,以保证效果一致。

  1. 知识库是否支持 Go 或者 Java 的 SDK?

知识库目前仅支持 Python SDK。如需使用其他开发语言,可参考签名鉴权生成签名,并调用 API 的相应服务。

  1. 用 API 报错身份验证失败或者无权限?

请检查 API 鉴权函数是否符合要求,可参考 签名鉴权

文档管理与检索
  1. 知识库支持哪些文档上传方式?

目前支持的导入方式:支持本地上传、飞书导入、TOS 中导入、公开下载链接。

  1. 上传的文档中如果包含表格、图片等内容会如何处理?

对于包含图片或表格的文档,能够自动解析出其中的文本和表格,且当开启【图片 OCR】功能时,还可以对 pdf、docx 等文件中的图片进行文字识别,并结合上下文作为一个切片存储,检索测试支持返回参考图。

  1. 导入文档失败该怎么办?

首先检查是否上传了不支持的文档格式(特别注意 faq 文档正确命名应为 name.faq.xlsx),并检查文档是否超出了当前大小限制。如果是通过 URL 方式上传文档,请保证 URL 可以公开下载。

  1. 如何实现文档内容的更新同步?

在上传更新后的文档时,指定原文档的 doc_id,知识库会根据 doc_id 匹配到对应文档并实现覆盖更新。

  1. 如何实现 TOS 目录下新文档的同步?

目前知识库支持从 TOS 中导入实现文档增量更新。当已导入的 TOS 目录下有新文档存在,再次导入该目录,知识库会自动根据是否已有同名文档进行判断,并将未导入的文档上传到知识库中。同名的重复文档则会自动跳过,不会再次上传知识库。

  1. 利用 TOS 导入文档时,如何指定 doc_id?

对象存储控制台中可以针对文档指定元数据信息,参数类型选择“x-tos-meta-”,参数名定义为“doc_id“,参数值需符合知识库 ”doc_id“ 命名规范:只能使用英文字母、数字、下划线_,并以英文字母开头,不能为空,长度要求:[1, 128]。

  1. 如何能够导出知识库内的切片?

目前知识库仅支持使用 API 接口获得知识库的所有切片或具体文档所对应的切片,详情可参考 概述

  1. 知识库支持哪些 embedding 模型,分别有什么特点?

知识库支持 embedding 模型参考 向量化模型及索引算法对照表

  1. 文档从上传到可被检索到需要多久?

文档上传后需要经过解析、切片、embedding 等过程,耗时与文档大小和文档的复杂度强相关,一般单个文档在 1 分钟内可以完成。

  1. 知识库检索调用的耗时如何?

不开重排模型时,百亿数据规模下,知识库的检索延迟大约在 10ms 左右。
开启重排模型时,检索延时受所选重排模型和 TopK 影响,TopK 越大延迟越高,相同 TopK 的情况下 base-multilingual-rerank 延迟较小。

  1. 知识库检索调用超时怎么处理?

(1)若对检索延迟有非常高的要求,可以通过关闭重排,增大召回切片数,尽量在不影响效果的前提下降低延迟。
(2)若对召回准确性和 token 消耗有非常高的要求,可以尝试切换到 base-multilingual-rerank 模型进行重排,同时可以调整增大 安装与初始化中的 timeout 参数,延长超时时间。

  1. 文档处理效果不佳,解析的切片不符合预期效果该怎么办?

如果用户文档比较规整,有明确的切片分割规则,建议使用自定义分割符的方式进行切片。如果切片长度过短,短文本片较多,建议使用合并短文本片的方式改善切片效果。

  1. 检索召回的切片里没有正确的切片怎么办?

首先可以尝试通过增加【返回文本片数量】召回更多切片解决。如果返回文本片数量已经比较大了,可以检查是否采用“混合检索”方案,即选择向量化模型及索引算法对照表中稠密向量和稀疏向量的混合检索方案提高召回率。

  1. 发现召回切片中包含正确的切片,但从排序上看不在前置位置该如何处理?

可以尝试开启【重排模型】,通过语义重排提高正确切片的位次。也可以尝试调整【dense_weight】进行优化,其取值越偏向 1 表示越倾向于语义检索,越偏向 0 则表示越偏向于关键词匹配检索。

  1. 能够召回正确的切片,但是切片分数都偏低?

(1)需要根据分数进行截断的场景,可以通过开启重排,提升分数置信度。
(2)知识库会按照用户设定的数量召回足够的切片,通常情况下切片分数偏低不会影响大模型生成效果。

  1. 创建完知识库后,想要修改知识库的离线处理策略(如更换嵌入模型、修改切分策略、更改量化方式等)应该怎么办?

知识库支持创建实验版本,不用重新导入文档,您就可修改知识库的离线处理策略并测试验证新策略的效果。具体使用方式您可参考配置实验版本

服务开通与权限管理
  1. 如何开始使用知识库?

首先需要开通知识库服务,目前开通知识库服务有两个入口,分别可通过火山控制台 - 向量数据库 VikingDB / 知识库火山控制台 - 火山方舟 / 知识库开通知识库服务。然后可根据知识库核心流程的指导,创建知识库并执行后续流程。

  1. 开通页面异常,提示未下单/未购买产品该怎么办?

购买后的校验有大概 1分钟 的缓存, 请等待一段时间再访问。知识库目前只支持华北,其他地区未开服,网页端会默认跳转华北知识库页面,需要在华北开通服务。

  1. 主账号开通了知识库服务,子账号可以使用么?

主账号默认有读写权限,如果子账号使用,需要由主账号给子账号正确配置权限,可参考知识库权限资源进行权限配置。

  1. 不想继续使用知识库了,如何退订知识库服务?

当您不再需要知识库服务时,可以点击知识库列表页右上角【···】进行退订,可参考退订知识库。退订后您的知识库数据将被删除,资源将被释放。请注意一旦退订,将无法恢复,请谨慎操作。

  1. 导入飞书文档报错提示 :“ 无多维表格权限,请确认企业已安装最新版应用,重新授权后生效 ”,如何操作?

飞书应用中心 将【火山方舟知识库】应用更新至最新版。详情可查看导入文档中“飞书文档导入”部分。

计费与资源管理
  1. 知识库是如何计费的?

知识库支持两种计费方式,分别是:

  • 按量计费(后付费),即先使用再付费,费用计入账单内,您可以在账单出账后结算费用;
  • 预付费,即先付费后使用,按订单结算;下单时扣费,不会再出账单。

更多信息可参考 知识库计费

  1. 预付费用户如何增购资源包或后付费实例?

知识库当前支持预付费用户下单后按需增购资源包或后付费实例,您可前往知识库下单页按业务需要下单增购资源包或后付费实例。

  1. 知识库内没有任何文档,为什么会产生费用?

对于旗舰版知识库,创建知识库不会立刻开始计费,只有上传文档才会触发知识库计算资源的分配和预留,同时知识库开始计费。文档删除不影响计算资源占用,因此将文档清空知识库仍会继续计费,若无需使用请主动删除知识库。删除知识库后,下一个计费周期不会产生新的费用。
对于标准版知识库,创建即会占用公共索引资源,并开始计费,1 元/天。

  1. 用户创建的知识库上限是什么?

目前一个用户支持创建的知识库上限为 200 个,如需更大请联系客服评估扩容

最近更新时间:2026.01.09 10:39:35
这个页面对您有帮助吗?
有用
有用
无用
无用