[picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/5357a124a5134af89ad57441c53d42a2~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1713975634&x-signature=%2FbWCeU7OSvENcK79RgjTLrLvdJE%3D) 本文将对字节跳动自研的分布式图数据库和图计算专用引擎做深度解析和分享,展示新技术是如何解决业务问题,影响几亿互联网用户的产品体验。来源:字节跳动技术团队...
字节跳动的分布式数据库系统取得了令人振奋的发展。如下图所示,在这 4 年间,公司应用侧容器数量从 5 万个增长到了 750 万个,截至目前已经突破 **1000 万** 。这 1000 万个容器筑成了字节跳动坚实的云原生基础设施,支撑着整个业务体系的发展。从在线数据角度看,1000 万个容器构成了超过 10 万个微服务,这些微服务在线上运行期间会产生大量数据。在 2020 年,字节跳动的在线数据量级达到 EB 级;到 2021 年 5 月份,字节跳动数据库...
> 数据地图平台是字节跳动内部的大数据检索平台,每天近万的字节员工在此查找所需数据。数据地图通过提供便捷的找数,理解数服务,大大节省了内部数据的沟通和建设成本。> > 血缘图谱由 xGraph 与数据地图平台团队合作研发。xGraph 从 Dataleap 业务中孵化,从底至上完全自研,提供设计成熟的内置节点、连线、分组样式,精心打磨图分析产品中常用布局和交互,帮助用户快速搭建关系图产品。血缘图谱解决方案已沉淀到 xGraph 为更多团队...
[字节跳动数据库的过去、现状与未来](https://mp.weixin.qq.com/s/4Bvo0EBo_xtKdVcqhGynCQ)》,本文根据分享整理而成。数据库技术一直是信息技术中极其重要的一环,在步入云原生时代后,云基础设施和数据库进一步整合,弥补了传统数据库的痛点,带来了高可扩展性、全面自动化、快速部署、节约成本、管理便捷等优势。从 2018 到 2021 年,伴随业务和数据的迅猛增长,字节跳动的分布式数据库系统取得了令人振奋的发展。如下图所示,在这...
**小火山:什么时候加入字节跳动的?对字节跳动最大的感受是什么?** **马浩翔**:我于 2019 年 6 月加入字节,一直参与着我们的分布式数据库系统项目。我加入的时候项目是全零状态,有幸从 0 到 1 参与了设计、编码、测试的全过程,现在我们的项目已经逐渐支撑了各业务的超大流量。反观自身成长过程, **对字节最深的感受就是开放谦逊的文化** ,不管 senior 还是 junior,都能就事论事开放讨论,谦逊地听取别人的建议,共同把事...
字节跳动的大部分业务数据可归纳为以下几种类型:* 用户之间的关系:比如关注好友等;* 内容:视频、文章、广告等;* 用户和内容的连接:用户发布内容之后的评论、点赞、转发等,自媒体还会关注广告点击及分成收益等数据。这三种数据关联到一起就会形成 **图状结构** 。**自研分布式图数据库**为了满足内部 social graph 在线增删改查的场景,字节跳动自研了 **分布式图存储数据库 ByteGraph** 。针对刚才提到的图状数...
字节跳动的大部分业务数据可归纳为以下几种类型:- 用户之间的关系:比如关注好友等;- 内容:视频、文章、广告等;- 用户和内容的连接:用户发布内容之后的评论、点赞、转发等,自媒体还会关注广告点击及分成收益等数据。这三种数据关联到一起就会形成图状结构。### 自研分布式图数据库为了满足内部 social graph 在线增删改查的场景,字节跳动自研了分布式图存储数据库 ByteGraph。针对刚才提到的图状数据结构,ByteGraph 支持...
# 一、背景字节跳动内部有很多混合计算的需求,需要一套既支持 TP 计算,也支持 AP 计算的系统。下图是字节跳动 HTAP 系统的总体架构。系统使用内部自研的数据库作为 TP 计算引擎,使用 Flink 作为 AP 的计算引擎。![1.jpeg](https://p6-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/dbae293d12ff40339ab4cd5a5065ff5c~tplv-k3u1fbpfcp-5.jpeg?) 字节跳动 HTAP 系统的总体架构 HTAP 系统对外支持 MySQL 协议,MySQL Proxy 接收到查询...
用户和内容的连接:用户发布内容之后的评论、点赞、转发等,自媒体还会关注广告点击及分成收益等数据。这三种数据关联到一起就会形成图状结构。### 自研分布式图数据库为了满足内部 social graph 在线增删改查的场景,字节跳动自研了分布式图存储数据库 ByteGraph。针对刚才提到的图状数据结构,ByteGraph 支持有向属性的图数据模型、Gremlin 查询语言以及丰富的写入和查询接口,具有海量存储和吞吐能力,单体集群可达万亿条...
[picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/a46aa7f7651245de8d75fd0ecd05287a~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1713975630&x-signature=WzeC5blf1B%2BVPL4%2BB8mwYlXN9GM%3D)本文解读了新加坡国立大学马天白教授团队、字节跳动基础架构-计算-流式计算团队联合发表在国际数据库与数据管理顶级会议 VLDB 2023 上的论文“StreamOps: Cloud-Native Runtim...
这是字节跳动基础架构 计算-实时引擎, 创新应用中心, 存储-HDFS & NoSQL 团队共同合作研发的新一代面向复杂业务的实时服务分析系统(HSAP: Hybrid Serving and Analytical Processing),希望能在应对大数据复杂分析场... 上图是字节典型的广告后端架构,数据通过 Kafka 流入不同的系统。对于离线链路,数据通常流入到 Spark/Hive 中进行计算,结果通过 ETL 导入到 HBase/ES/ClickHouse 等系统提供在线的查询服务。对于实时链路, 数据会直...
**一、背景**========= 字节跳动内部有很多混合计算的需求,需要一套既支持 TP 计算,也支持 AP 计算的系统。下图是字节跳动 HTAP 系统的总体架构。系统使用内部自研的数据库作为 TP 计算引擎,使用 Flink 作为 AP 的计算引擎。 ![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/0d8574bb18884217b4cab8ded8c6ff60~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expi...
这是字节跳动基础架构 计算-实时引擎, 创新应用中心, 存储-HDFS & NoSQL 团队共同合作研发的新一代面向复杂业务的实时服务分析系统(HSAP: Hybrid Serving and Analytical Processing),希望能在应对大数据复杂分析场... 上图是字节典型的广告后端架构,数据通过 Kafka 流入不同的系统。对于离线链路,数据通常流入到 Spark/Hive 中进行计算,结果通过 ETL 导入到 HBase/ES/ClickHouse 等系统提供在线的查询服务。对于实时链路, 数据会直...