You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

图数据库边上的边

社区干货

字节跳动自研万亿级图数据库 & 图计算实践

图数据的分析和计算需求也逐渐显现。在这篇文章中,将从 ByteGraph 的适用场景、内部架构、关键问题分析几个方面作深入介绍,并将介绍图计算相关实践。 自研图数据库(ByteGraph)介绍 从数据模型角度看,图数据库内部数据是有向属性图,其 **基本元素是 Graph 中的点(Vertex)、(Edge)以及其上附着的属性** ;作为一个工具,图数据对外提供的接口都是围绕这些元素展开。**图数据库本质也是一...

火山引擎DataLeap专家总结:3个必看的“数据血缘”建设经验!

目前主要基于Apache Atlas原生图数据库——JanusGraph。**JanusGraph底层支持HBase。我们将每条边的关系作为两边的资产节点的属性,存入到对应RowKey的独立cell中。 另外,我们也对存储做了相关的改造,如字节内部自研的存算分离key-value存储。我们也在独立环境中会做轻量级部署,同时基于性能或成本,以及部署复杂度,把存储切换为OLTP数据库,比如MYSQL数据库。 ![picture.image](https://p3-volc-comm...

火山引擎DataLeap数据血缘技术建设实践

通过Apache Atlas暴露的接口来转换成图上查找某个节点对应血缘关系的,以此实现血缘查询。![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/74d4c574259c47e1ab8866d606f61e01~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1716135687&x-signature=2WTosvgUuMQSdQ9vLFEOUe5M5f0%3D)## 5. 数据血缘模型-存储层在存储层,目前主要基于Apache Atlas原生图数据库——JanusGraph。...

火山引擎 DataLeap:揭秘字节跳动数据血缘架构演进之路

在血缘加工任务方面(见上图中间部分):这部分会对任务进行血缘解析,产生血缘快照文件。由于第一版采用离线方式运行,每天该血缘任务均会生成对应的血缘快照文件。我们通过对比前后两天的血缘快照文件,来获取血缘的变更情况,然后把这些变更加载到图中。除此之外,血缘中涉及的元数据会冗余一份,并存储到图里。- 在血缘存储方面(见上图右部分),除了图数据库之外,血缘本身也会依赖元数据的存储,如 Mysql 以及索引类存储。...

特惠活动

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

图数据库边上的边-优选内容

字节跳动自研万亿级图数据库 & 图计算实践
图数据的分析和计算需求也逐渐显现。在这篇文章中,将从 ByteGraph 的适用场景、内部架构、关键问题分析几个方面作深入介绍,并将介绍图计算相关实践。 自研图数据库(ByteGraph)介绍 从数据模型角度看,图数据库内部数据是有向属性图,其 **基本元素是 Graph 中的点(Vertex)、(Edge)以及其上附着的属性** ;作为一个工具,图数据对外提供的接口都是围绕这些元素展开。**图数据库本质也是一...
火山引擎DataLeap专家总结:3个必看的“数据血缘”建设经验!
目前主要基于Apache Atlas原生图数据库——JanusGraph。**JanusGraph底层支持HBase。我们将每条边的关系作为两边的资产节点的属性,存入到对应RowKey的独立cell中。 另外,我们也对存储做了相关的改造,如字节内部自研的存算分离key-value存储。我们也在独立环境中会做轻量级部署,同时基于性能或成本,以及部署复杂度,把存储切换为OLTP数据库,比如MYSQL数据库。 ![picture.image](https://p3-volc-comm...
火山引擎DataLeap数据血缘技术建设实践
通过Apache Atlas暴露的接口来转换成图上查找某个节点对应血缘关系的,以此实现血缘查询。![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/74d4c574259c47e1ab8866d606f61e01~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1716135687&x-signature=2WTosvgUuMQSdQ9vLFEOUe5M5f0%3D)## 5. 数据血缘模型-存储层在存储层,目前主要基于Apache Atlas原生图数据库——JanusGraph。...
火山引擎 DataLeap:揭秘字节跳动数据血缘架构演进之路
在血缘加工任务方面(见上图中间部分):这部分会对任务进行血缘解析,产生血缘快照文件。由于第一版采用离线方式运行,每天该血缘任务均会生成对应的血缘快照文件。我们通过对比前后两天的血缘快照文件,来获取血缘的变更情况,然后把这些变更加载到图中。除此之外,血缘中涉及的元数据会冗余一份,并存储到图里。- 在血缘存储方面(见上图右部分),除了图数据库之外,血缘本身也会依赖元数据的存储,如 Mysql 以及索引类存储。...

图数据库边上的边-相关内容

一文读懂火山引擎云数据库产品及选型

数据库发展与类型简介数据库系统在上世纪70年代初出现,至今已经发展了半个多世纪,其理论、技术与产品已经非常丰富,呈现出百花齐放的景象。根据其特点可以大概分为关系型数据库管理系统(RDBMS),非关系型数据库(NoSQL),NewSQL、云原生数据库、分布式数据库等等。每一类数据库中使用不同的技术实现,又可以分化出不同的产品类型。根据DB-Engines的统计,数据库产品数量已经有将近400种,数据库厂商也有几百家,如下图所示,不同数据库产...

字节跳动 NoSQL 的探索与实践

这三种数据关联到一起就会形成图状结构。### 自研分布式图数据库为了满足内部 social graph 在线增删改查的场景,字节跳动自研了分布式图存储数据库 ByteGraph。针对刚才提到的图状数据结构,ByteGraph 支持有向属性的图数据模型、Gremlin 查询语言以及丰富的写入和查询接口,具有海量存储和吞吐能力,单体集群可达万亿条,支持百万 QPS 图上多度读写。ByteGraph 也支持 Super Node 热点访问,单个过亿出度节点 10K 量级 QPS 毫秒...

一文读懂火山引擎云数据库产品及选型

数据库系统在上世纪 70 年代初出现,至今已经发展了半个多世纪,其理论、技术与产品已经非常丰富,呈现出百花齐放的景象。根据其特点可以大概分为关系型数据库管理系统(RDBMS),非关系型数据库(NoSQL),NewSQL、云原生数据库、分布式数据库等等。每一类数据库中使用不同的技术实现,又可以分化出不同的产品类型。根据 DB-Engines 的统计,数据库产品数量已经有将近 400 种,数据库厂商也有几百家,如下图所示,不同数据库产品的实际应用规模...

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

字节跳动 NoSQL 的探索与实践

这三种数据关联到一起就会形成图状结构。### 自研分布式图数据库为了满足内部 social graph 在线增删改查的场景,字节跳动自研了分布式图存储数据库 ByteGraph。针对刚才提到的图状数据结构,ByteGraph 支持有向属性的图数据模型、Gremlin 查询语言以及丰富的写入和查询接口,具有海量存储和吞吐能力,单体集群可达万亿条,支持百万 QPS 图上多度读写。ByteGraph 也支持 Super Node 热点访问,单个过亿出度节点 10K 量级 QPS 毫秒...

火山引擎 DataLeap 套件下构建数据目录(Data Catalog)系统的实践

图数据库等系统存储元数据,维护成本很高;接入一种元数据会增加2~3个ETL任务,运维成本直线上升## 新版本目标基于上述痛点,火山引擎 DataLeap 研发人员重新设计实现Data Catalog系统,希望能达成如下目标:- 产... 数据血缘的系统界是:从RDS和MQ开始,一路途径各种计算和存储,最终汇入指标、报表和数据服务系统。**其次**,在设计系统时,火山引擎 DataLeap 研发人员充分考虑了血缘链路的多样性和复杂性。如下图所示,火山引擎 ...

干货 | 以一次Data Catalog架构升级为例,聊聊业务系统的性能优化

引入了字节内部的图数据库veGraph,写入时,需要业务层处理MySQL、ElasticSearch和veGraph三种存储,模型也需要同时理解关系型和图两种。更多的背景可以参照之前的[文章](https://mp.weixin.qq.com/s?__biz=MzkwMzMw... 修改遍历的读数据方式,调整为以点以及点上的属性过滤拉取,触发multiPreFetch优化。* 支持根据边类型拉取数据,在应用层根据不同的场景,指定不同的边类型集合,做数据的裁剪。最典型的应用是,在详情展示页面,去掉...

如何在大背景下降本增效,构建超大规模存储架构?

目前在小红书负责 NoSQL KV 数据库图数据库、NewSQL 数据库的研发和架构演进。 **演讲题目:小红书面对万亿社交网络关系的图存储实践** **演讲提纲:** 小红书是一个社区属性为主的产品,它涵盖了各个领域的生... 并减少数据库压力和成本,我们自研了面向超大规模社交网络的图存储系统 REDtao,大大提高了系统稳定性,它将缓存和底层数据库封装起来,并对外提供统一的图查询 API,实现了访问收敛,同时在缓存中实现了高效的聚合。...

如何在大背景下降本增效,构建超大规模存储架构?

目前在小红书负责 NoSQL KV 数据库图数据库、NewSQL 数据库的研发和架构演进。**演讲题目:小红书面对万亿社交网络关系的图存储实践****演讲提纲:** 小红书是一个社区属性为主的产品,它涵盖了各个领域的生活社... 并减少数据库压力和成本,我们自研了面向超大规模社交网络的图存储系统 REDtao,大大提高了系统稳定性,它将缓存和底层数据库封装起来,并对外提供统一的图查询 API,实现了访问收敛,同时在缓存中实现了高效的聚合。...

字节跳动 NoSQL 的探索与实践

这三种数据关联到一起就会形成 **图状结构** 。**自研分布式图数据库**为了满足内部 social graph 在线增删改查的场景,字节跳动自研了 **分布式图存储数据库 ByteGraph** 。针对刚才提到的图状数据结构,ByteGraph 支持有向属性的图数据模型、Gremlin 查询语言以及丰富的写入和查询接口,具有海量存储和吞吐能力,单体集群可达万亿条,支持百万 QPS 图上多度读写。ByteGraph 也支持 Super Node 热点访问,单个过亿出度节点...

特惠活动

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

产品体验

体验中心

云服务器特惠

云服务器
云服务器ECS新人特惠
立即抢购

白皮书

从ClickHouse到ByteHouse
关于金融、工业互联网,都有对应的场景特性、解决策略、实践效果具体呈现,相信一定能解决你的诸多疑惑
立即获取

最新活动

爆款1核2G共享型服务器

首年60元,每月仅需5元,限量秒杀
立即抢购

火山引擎增长体验专区

丰富能力激励企业快速增长
查看详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

一键开启云上增长新空间

立即咨询