图数据库内部数据是有向属性图,其 **基本元素是 Graph 中的点(Vertex)、边(Edge)以及其上附着的属性** ;作为一个工具,图数据对外提供的接口都是围绕这些元素展开。**图数据库本质也是一个存储系统**,它和常见的 KV 存储系统、MySQL 存储系统相比,主要区别在于目标数据的逻辑关系不同和访问模式不同,对于数据内在关系是图模型以及在图上游走类和模式匹配类的查询,比如社交关系查询,图数据库会有更大的性能优势和更加简洁高效...
# 前言从 on-premise 数据库迁移到火山引擎(ECS 自建或是RDS),您可能希望做一次全面的性能测试,本文主要说明在测试前,我们需要提前考虑哪些先决条件。在测试之前,需要尽可能的保证二者具有相同的环境,如网络,实例规格,部署架构,数据库版本,参数配置等。# 网络环境由于公网网络环境的不可预测性,在性能测试时,不论 ECS 自建数据库还是 RDS,请均使用内网环境,即客户端和数据库实例在同一可用区。常见的部署架构有:1. 应用...
# 前言从 on-premise 数据库迁移到火山引擎(ECS 自建或是RDS),您可能希望做一次全面的性能测试,本文主要说明在测试前,我们需要提前考虑哪些先决条件。在测试之前,需要尽可能的保证二者具有相同的环境,如网络,实例规格,部署架构,数据库版本,参数配置等。# 网络环境由于公网网络环境的不可预测性,在性能测试时,不论 ECS 自建数据库还是 RDS,请均使用内网环境,即客户端和数据库实例在同一可用区。常见的部署架构有:1. 应用 与...
自研分布式图数据库系统 ByteGraph而面对抖音在整个春晚红包活动中提供的红包雨、集灯笼、答题分红包等多种互动玩法,抖音技术团队和火山引擎云原生团队将字节跳动 **自研分布式图数据库系统** **ByteGraph** 用在了生产环境。在红包活动中,相比常见的 KV 存储系统和 MySQL 存储系统,图数据库在应对春晚千万级并发查询方面有更大的性能优势和更简洁高效的接口。而 ByteGraph 历经字节跳动丰富在线存储场景,在功能上已演...
本文介绍以 Memtier-benchmark 工具测试缓存数据库 Redis 版实例性能的详细方法和测试结果,您可以按照本文介绍自行测试对比,快速了解数据库系统的性能。 测试环境测试所用的 ECS 实例和缓存数据库 Redis 版实例均在同一地域、同一可用区。本测试中为华北 2(北京)可用区 A。 网络类型均为私有网络 VPC。 说明 ECS 实例和 Redis 实例需保证在同一个 VPC中。 测试所用缓存数据库 Redis 版实例 数据库版本为 Redis 5.0。 实例类型...
本文介绍以 YCSB 压测工具测试文档数据库 MongoDB 版实例性能的详细方法和测试结果,您可以按照本文介绍自行测试对比,快速了解数据库系统的性能。 测试环境测试所用的 ECS 实例和文档数据库 MongoDB 版实例均在同一地域、同一可用区。本测试中为华北 2(北京)可用区 A。 网络类型均为私有网络 VPC,且 ECS 实例和 MongoDB 实例均在同一个 VPC 中。 测试所用文档数据库 MongoDB 版实例: 各规格的副本集实例。关于 MongoDB 实例规格...
我分享的主题是基于国产化环境的金融级业务系统性能优化实践。# 一、项目背景项目是一个金融级的业务系统,架构是基于微服务设计理念的分布式架构,环境上支持国产化软硬件、操作系统以及分布式数据库,具有高性能、低成本、弹性扩展、敏捷交付等特点,有效解决传统架构的性能瓶颈。系统从应用架构上构建了完善的业务中台能力,真正做到系统解耦,支持对业务服务场景进行整合重构,为产品创新和服务创新提供强有力的支撑。系统总体...
我们遇到了比较多的性能问题。 **本文以Data Catalog系统升级过程为例,与大家讨论业务系统性能优化方面的思考,也会介绍字节跳动关于Apache Atlas相关的性能优化。**> > > > > ![picture.image]... 引入了字节内部的图数据库veGraph,写入时,需要业务层处理MySQL、ElasticSearch和veGraph三种存储,模型也需要同时理解关系型和图两种。更多的背景可以参照之前的[文章](https://mp.weixin.qq.com/s?__biz=MzkwMzMw...
# 引言随着业务的发展,微服务架构逐渐成为当下业务中台的主流架构形式,它不但解决了各个应用之间的解耦问题,同时也解决了单体应用的性能问题实现可扩展可动态伸缩的能力。如下图所示,业务中台就是将平台的通用能... 我们先来一起回顾下数据库事务的相关内容,通过对数据库事务的分析,我们可以看出来在微服务架构中想要保证数据的一致性将会遇到什么样的问题。## 1、本地事务事务的概念对于程序猿来说一定不陌生,这里的事务指的...
向量数据库近来的火热来源于大语言模型的兴起,但在大模型兴起之前,VikingDB 已经在字节内部广泛应用,最初应用在推荐、广告、搜索的召回环节,后来逐步扩展到了消重、风控、对话、文档搜索等需要向量检索的其他场景。在内部推广应用的过程中,VikingDB 经历了非常多样的挑战:超大规模的数据、极致的延迟/性能要求、海量业务场景的接入支持等。为了克服这些困难,我们做了很多架构和性能的优化,以及产品特性的完善。比如:* 架构层...
# 简介众所周知,在数据库存储引擎侧通常有两类存储模型,行式存储NSM(N-ary Storage Model)和列式存储DSM(Decomposition Storage Model),两种存储模型各有其特定的擅长场景。在以前,主流存储设备是机械磁盘的情况下,数据一般采用一个一个的数据块进行存储,利用顺序读写提升性能。行存的实现一般是将一行数据完整的从头到尾连续存储(超长的字段一般会单独存储,行内记录逻辑地址),连续多行构成一个页,页的尾部通常会存储索引来解决...
**《VikingDB:大规模云原生向量数据库的前沿实践与应用》**谢剑桥|火山引擎向量数据库高级工程师向量数据库是解决海量非结构化数据检索与分析问题的行业共识,我们从 19 年解决大规模分布式向量检索问题,到推出云原生、AI 原生的向量数据库,持续应对抖音集团内外部业务的复杂技术挑战,积累了丰富实践经验。本次演讲将重点介绍 VikingDB 解决各类应用中极限性能、规模、精度问题上的探索实践,并通过落地的案例向听众介绍如何...
图数据库等系统存储元数据,维护成本很高;接入一种元数据会增加2~3个ETL任务,运维成本直线上升## 新版本目标基于上述痛点,火山引擎 DataLeap 研发人员重新设计实现Data Catalog系统,希望能达成如下目标:- 产... 图存储中的点和边分别到达百万和千万量级,读写性能都遇到了比较大的问题。我们做了部分源码的修改,这边介绍其中比较重要的两个,更多细节请参照后续的文章。### 读优化:**开启MutilPreFetch 能力**在我们的图库...