You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

图数据库i2i召回

在现代的大数据时代,数据量呈指数级增长,如何快速高效地召回所需数据成为了一个重要的问题。传统的关系型数据库,在处理数据量大、数据结构复杂、关系复杂的场景下,性能往往受到限制。因此,图数据库应用变得越来越普遍,而i2i召回作为其中重要的应用场景,是个关键词。

一、i2i召回是什么

i2i召回,全名Item to Item 召回,是指在一个大规模的推荐系统中,基于当前用户的操作记录,找到和当前用户所操作的商品相似的其它商品。比如电商网站中,用户A购买了商品1,那么在用户A下一次进入网站的时候,推荐系统就有可能向A推荐和商品1相似的商品2、商品3等等。

二、为什么使用图数据库

首先,对于i2i召回来说,需要考虑的因素很多。比如,需要处理的商品数量,商品属性的维度和数量,商品间的关系等等。在处理这些关系上,图数据库比传统的关系型数据库表现更加优异。

其次,图数据库天生擅长处理图论上相关的问题, 如最短路径、广度/深度优先搜索等等,而i2i召回正是面临这些问题。

最后,图数据库具备高效的数据存储和查询能力,拥有快速索引,可快速扫描大规模的图结构。这一点对i2i召回尤为重要。

三、图数据库中的i2i召回

3.1 图模型的构建

i2i召回的实现,离不开底层的图模型,同时也要考虑不同的模型对查询性能的影响。

通过构建具有明确的节点和关系的图模型来捕获i2i之间的相似性。节点可以是商品,用户,分类,品牌等对象,关系可以是购买,浏览,加入购物车等动作。

构建图模型

本文内容通过AI工具匹配关键字智能整合而成,仅供参考,火山引擎不对内容的真实、准确或完整作任何形式的承诺。如有任何问题或意见,您可以通过联系service@volcengine.com进行反馈,火山引擎收到您的反馈后将及时答复和处理。
展开更多

社区干货

VikingDB:大规模云原生向量数据库的前沿实践与应用

向量数据库近来的火热来源于大语言模型的兴起,但在大模型兴起之前,VikingDB 已经在字节内部广泛应用,最初应用在推荐、广告、搜索的召回环节,后来逐步扩展到了消重、风控、对话、文档搜索等需要向量检索的其他场景。... 上面几张图从索引算法、量化方式、索引参数以及硬件等维度表示了精度和延迟之间的取舍。最左侧第一张图相对比较了 FLAT、IVF、HNSW 这三种索引算法的计算精度和延迟。向量检索的计算和访存 IO 都非常重,为了提高...

抖音大规模实践,火山引擎向量数据库是这样炼成的

AI时代,如何用好大模型是当前各行各业瞩目的焦点。向量数据库作为大模型“记忆体”,不仅能够为其提供数据存储,而且能通过数据检索、分析让大模型进行知识增强,成为生成式AI应用开发新范式的重要组成部分。用图片... 向量召回结果比例较高的场景;二是先过滤,先使用DSL过滤数据集,然后在结果集中进行向量排序,适用于DSL过滤结果较少的场景。随着数据量的增加,这两种检索链路的性能各有适用的场景,但如何在执行时自动找到最适合的...

抖音大规模实践,火山引擎向量数据库是这样炼成的

向量数据库作为大模型“记忆体”,不仅能够为其提供数据存储,而且能通过数据检索、分析让大模型进行知识增强,成为生成式 AI 应用开发新范式的重要组成部分。用图片搜索图片或者文本搜索文本时,在数据库中存储和对... 向量召回结果比例较高的场景;二是先过滤,先使用 DSL 过滤数据集,然后在结果集中进行向量排序,适用于 DSL 过滤结果较少的场景。随着数据量的增加,这两种检索链路的性能各有适用的场景,但如何在执行时自动找到最适...

海量笔记@在云上,如何搭建属于自己的全文搜索引擎 Web应用-个人站点 | 社区征文

**描述:免费流行的关系型数据库管理系统,在WEB应用方面-RDBMS(Relational Database Management System:关系数据库管理系统)应用软件之一。**```yum源方式安装:示例:包存在yum install mysql-server示例:包不存在(镜像站RPM或源码编译方式)通过wget方式下载repo源:wget http://repo.mysql.com/mysql-community-***.***.rpm安装:rpmrpm -ivh mysql-community-***.***.rpm安装:mysqlyum install mysql-server启动:mysqls...

特惠活动

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

图数据库i2i召回-优选内容

基于 ES 的排序学习实践
背景介绍火山引擎云搜索服务的搜索过程一般包含召回+排序两个阶段。通过用户输入的文本作为关键词,使用 BM25 打分算法,遍历数据库挑选出分数最高的文档并进行排序后返回查询结果。由于 BM25 算法模型考虑的主要是文本的词频、逆文档频率等因素,因此搜索结果的排序仅取决于与所检索文本的相关性。在大部分场景使用召回+排序便可满足需求,但是有些应用场景用户则想要实现个性化推荐效果。 为了实现个性化推荐,需要在已有召回、排...
VikingDB:大规模云原生向量数据库的前沿实践与应用
向量数据库近来的火热来源于大语言模型的兴起,但在大模型兴起之前,VikingDB 已经在字节内部广泛应用,最初应用在推荐、广告、搜索的召回环节,后来逐步扩展到了消重、风控、对话、文档搜索等需要向量检索的其他场景。... 上面几张图从索引算法、量化方式、索引参数以及硬件等维度表示了精度和延迟之间的取舍。最左侧第一张图相对比较了 FLAT、IVF、HNSW 这三种索引算法的计算精度和延迟。向量检索的计算和访存 IO 都非常重,为了提高...
Rerank重排
概述/index/batch_rerank接口用于重新批量计算输入文本与检索到的文本之间的score值,以对召回结果进行重排序。 请求接口说明 请求向量数据库 VikingDB 的 OpenAPI 接口时,需要构造签名进行鉴权,详细的 OpenAPI 签名调用方法请参见 API签名调用指南。 rerank重排接口服务当前仅供测试验证使用。 URI http://api-knowledgebase.ml_platform.cn-beijing.volces.com/api/knowledge/service/rerank 统一资源标识符 方法 POST 客...
抖音大规模实践,火山引擎向量数据库是这样炼成的
AI时代,如何用好大模型是当前各行各业瞩目的焦点。向量数据库作为大模型“记忆体”,不仅能够为其提供数据存储,而且能通过数据检索、分析让大模型进行知识增强,成为生成式AI应用开发新范式的重要组成部分。用图片... 向量召回结果比例较高的场景;二是先过滤,先使用DSL过滤数据集,然后在结果集中进行向量排序,适用于DSL过滤结果较少的场景。随着数据量的增加,这两种检索链路的性能各有适用的场景,但如何在执行时自动找到最适合的...

图数据库i2i召回-相关内容

海量笔记@在云上,如何搭建属于自己的全文搜索引擎 Web应用-个人站点 | 社区征文

**描述:免费流行的关系型数据库管理系统,在WEB应用方面-RDBMS(Relational Database Management System:关系数据库管理系统)应用软件之一。**```yum源方式安装:示例:包存在yum install mysql-server示例:包不存在(镜像站RPM或源码编译方式)通过wget方式下载repo源:wget http://repo.mysql.com/mysql-community-***.***.rpm安装:rpmrpm -ivh mysql-community-***.***.rpm安装:mysqlyum install mysql-server启动:mysqls...

基于火山引擎云搜索服务的排序学习实战

> 排序学习(LTR: Learning to Rank)作为一种机器学习技术,其应用场景非常广泛。例如,在**电商推荐**领域,可以帮助电商平台对用户的购买历史、搜索记录、浏览行为等数据进行分析和建模;可以帮助**搜索引擎**对用户的搜索关键词进行分析建模;可以为广告主提供最精准和最有效的**广告投放**方案;在**金融风控**领域,排序学习可以帮助金融机构分析客户的信用评级和欺诈风险,提高风控能力和业务效率。#### 本文相关产品-火山引擎云搜...

火山引擎ByteHouse:“专用向量数据库”与“数据库+向量扩展”,怎么选?

向量数据库中的向量是由多个维度组成的,每个维度代表向量的一个特征。例如,一张图片可以表示为一个三维向量,分别代表图片的宽度、高度和颜色。向量数据库中的向量可以是稠密向量或稀疏向量,稠密向量是指向量中大部... 计算在向量数据库中和问题向量最相似的top k个文档片段,通过大模型的上下文组织能力,将查询结果包装成标准回答返回给应用系统。:在数据量较大,而且需要做逻辑分割管理;对于性能要求在几十ms到一两百ms;对召回率要...

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

初探金融风控中的信用评分卡搭建全流程 | 社区征文

召回率(Recall)是相互制约的指标。此时可以考虑牺牲精确率,提高召回率,以求可以甄别更多的坏样本。1. 模型的响应时间:不同的模型应用场景对响应时间的要求不同。不同的响应需要决定了模型的复杂程度,如果是实时... 数据不同源是指不同类型的数据存在于不同的数据库中。由于不同源会造成数据的质量与缺失值有所差异,在做表关联与合并时会出现不一致或部分时间内某些变量缺失值较多的情况。在模型训练时,模型会更倾向于选择缺失值...

火山引擎 DataLeap 套件下构建数据目录(Data Catalog)系统的实践

图数据库等系统存储元数据,维护成本很高;接入一种元数据会增加2~3个ETL任务,运维成本直线上升## 新版本目标基于上述痛点,火山引擎 DataLeap 研发人员重新设计实现Data Catalog系统,希望能达成如下目标:- 产... 架构如上图所示。粗略来看,可以划分为两大部分:- 离线部分:负责汇集各类与搜索相关的数据,做数据清洗或者模型训练,根据不同的用途,写入不同的存储,供给在线搜索模块使用。- 在线部分:分为搜索理解、召回、精...

推荐系统是如何做召回的?

推荐系统示意图(引用自阿里巴巴DIN论文) # 一、什么是召回?相对于排序而言,召回不是一个太常见的词,有一些统计学知识背景的同学可能还会把它和混淆矩阵中的召回率(recall)搞混,其实他们并没有什么关系。推荐系... 然后每个指标下取前K个商品作为属性的召回列表存储在数据库中,线上用户访问时,直接对某些属性进行召回,从而达到了快速且高质量的目的,剩下的工作便交给了排序环节。这样简单高效的召回方式是非常符合直觉的,但是...

list

概述 /index/list 接口用于查询和数据集 Collection 关联的索引 Index列表。 请求接口 说明 请求向量数据库 VikingDB 的 OpenAPI 接口时,需要构造签名进行鉴权,详细的 OpenAPI 签名调用方法请参见 API签名调用指南。 URI /api/index/list 统一资源标识符 请求方法 GET 客户端对向量数据库服务器请求的操作类型 请求头 Content-Type: application/json 请求消息类型 Authorization: HMAC-SHA256 *** 鉴权 请求参数 参...

特惠活动

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

产品体验

体验中心

云服务器特惠

云服务器
云服务器ECS新人特惠
立即抢购

白皮书

从ClickHouse到ByteHouse
关于金融、工业互联网,都有对应的场景特性、解决策略、实践效果具体呈现,相信一定能解决你的诸多疑惑
立即获取

最新活动

爆款1核2G共享型服务器

首年60元,每月仅需5元,限量秒杀
立即抢购

火山引擎增长体验专区

丰富能力激励企业快速增长
查看详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

一键开启云上增长新空间

立即咨询