You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

什么是大数据库

基于云平台的即开即用、稳定可靠、灵活弹性、易于使用的关系型数据库服务

社区干货

三分钟了解数据技术发展史|社区征文

每个公司或者个人都有自己的数据处理系统,并没有形成编程框架和理念,而这三篇论文也就是我们熟知的大数据三驾马车,分别是分布式文件系统 GFS、大数据分布式计算框架 MapReduce 和 NoSQL 数据库 BigTable,这三篇论... 于是出现了 Yarn 可以将 MapReduce 的资源调度与执行引擎分离开来,随后被各类大数据产品支持,成为大数据平台上最主流的资源调度系统。经历了多年的发展从 2016 年前后 MapReduce 慢慢的被其他产品取代了,为什么会...

基于国产化环境的金融级业务系统性能优化实践|社区征文

又是一年总结时,每年这个时候都是一个让人期盼的时候,此时我们可以放下思想包袱思考这一年自己都做了什么,有什么收获,对未来有怎样的憧憬,回首过往,是充实还是虚度?是时候给自己一个交代了。2022年,而我正式从一个... 我分享的主题是基于国产化环境的金融级业务系统性能优化实践。# 一、项目背景项目是一个金融级的业务系统,架构是基于微服务设计理念的分布式架构,环境上支持国产化软硬件、操作系统以及分布式数据库,具有高性能...

字节跳动 NoSQL 的探索与实践

本文整理自火山引擎开发者社区技术讲堂第三期演讲,主要介绍了 NoSQL 的前世今生和发展脉搏,以及字节跳动 NoSQL 的实践。 作者:王佳毅|火山引擎存储&数据库解决方案负责人 NoSQL 应用的现状 什么是 NoSQL?我们知道关系型数据库强调 CAP 理论:Consistency,Availability 和 Partition Tolerance,这三者不可兼得。谈到 NoSQL,我们会引入 BASE 概念:* **Basically Available*...

分布式数据库在抖音春晚活动中的应用

MySQL 和 PG 都是关系型数据库的 Top5。这就意味着,如果我们想做一款数据库产品,概率永远都绕不过 MySQL 和 PG 的生态。所以我们如果要做个数据库产品,不要想着完全自成一套,还是要把兼容 MySQL 和 PG 生态放在高优先级上。这时候可能有同学会问,既然开源的 MySQL 和开源的 PG 发展得这么好,它们的生态非常完善,用户也非常多,排名也很靠前,我们为什么还需要去开发分布式数据库?这个问题的答案其实也比较显而易见,就是原有的架...

特惠活动

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

什么是大数据库-优选内容

数据库表及视图
按键排序用于决定数据在数据库中的实际存储方式。用户使用按键排序最多可以指定 5 列。 主键 (强制)- 主键通常与按键排序的作用相同,用于整理数据文件。 分区键 (强制)- 分区键用于决定表中的每行属于哪个数据分区,它将一个的表分成一些小的部分。 分桶键 对于每一个表或分区,通过指定分桶键 (Cluster Key) 进一步细分成桶,对列中的数据进行哈希,进行更细粒度的划分,从而提高查询和采样效率。 保留时间 (可选)- 数据保留的具体...
三分钟了解数据技术发展史|社区征文
每个公司或者个人都有自己的数据处理系统,并没有形成编程框架和理念,而这三篇论文也就是我们熟知的大数据三驾马车,分别是分布式文件系统 GFS、大数据分布式计算框架 MapReduce 和 NoSQL 数据库 BigTable,这三篇论... 于是出现了 Yarn 可以将 MapReduce 的资源调度与执行引擎分离开来,随后被各类大数据产品支持,成为大数据平台上最主流的资源调度系统。经历了多年的发展从 2016 年前后 MapReduce 慢慢的被其他产品取代了,为什么会...
自建高性能数据库-选型与性能测试
本文介绍如何选择火山引擎云服务器自建各类高性能数据库。 一、场景描述数据库一直是构建现代应用的重要组件,几乎所有应用都始于数据并终于数据。随着数据驱动时代的到来,数据更是无处不在,进一步成为未来创新的基石。 在应用的微服务化、数据类型多样化的趋势下,单一种类的数据库已经无法满足现代应用的需求,因此各类专门构建的数据库应运而生,包括关系数据库、键值数据库、文档数据库、内存中数据库、图形数据库、时间序列数...
分布式数据库在抖音春晚活动中的应用
MySQL 和 PG 都是关系型数据库的 Top5。这就意味着,如果我们想做一款数据库产品,概率永远都绕不过 MySQL 和 PG 的生态。所以我们如果要做个数据库产品,不要想着完全自成一套,还是要把兼容 MySQL 和 PG 生态放在高优先级上。这时候可能有同学会问,既然开源的 MySQL 和开源的 PG 发展得这么好,它们的生态非常完善,用户也非常多,排名也很靠前,我们为什么还需要去开发分布式数据库?这个问题的答案其实也比较显而易见,就是原有的架...

什么是大数据库-相关内容

分布式数据库TiDB的设计和架构

导语市场上有很多数据库产品,如Oracle、MySQL、SQLServer、NoSQL、NewSQL等,那么目前数据库圈最火的分布式关系型数据库之一TiDB你了解吗?相信很多同学以前听说过TiDB,也知道是一款国人研发的数据库,但你知道TiDB到底是如何实现的?它跟其他数据库产品相比,它的核心优势是什么?此次夜校分享,xiaoyu向家介绍了数据库发展史、TiDB 设计、架构及生态及TiDB在得物的应用。数据库技术发展演进**2008年以前**2008 年以前应用...

分布式数据库TiDB的设计和架构

他拥有10年+互联网数据库运维经验、在游戏、电商、OTA行业从事过DBA运维工作、在规模数据库自动化、平台化方面有较资深的落地经验。# 导语市场上有很多数据库产品,如Oracle、MySQL、SQLServer、NoSQL、NewSQL等,那么目前数据库圈最火的分布式关系型数据库之一TiDB你了解吗?相信很多同学以前听说过TiDB,也知道是一款国人研发的数据库,但你知道TiDB到底是如何实现的?它跟其他数据库产品相比,它的核心优势是什么?此次夜校分...

Apache Pulsar 在火山引擎 EMR 的集成与场景

开源数据平台则是 EMR 这类云产品的共有定义。接下来重点讲一下 Stateless 这个概念。 Stateless 指的是“无状态”。在 EMR 中创建的用户集群的“状态”指的是什么呢?以有状态场景下的 Hadoop 集群类型为例... 将大数据体系外面的数据上报到消息队列后,消息队列作为一个沟通的纽带,消息会流向下游的数据仓库的各层存储中,进入大数据体系内部。 不光是埋点日志信息,用户的业务数据库的信息,也可以通过把数据库 binlog 上...

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

字节跳动实时数据湖构建的探索和实践

底表的分布也是按照这个时间戳进行分区,最近几小时或者几天的数据会有比较频繁的更新,但是更老的数据则不会有太多的变化。**冷热分区的场景就比较适合布隆索引、带TTL的State索引和哈希索引**。#### CDC场景第二个例子是一个数据库导出的例子,也就是CDC场景。这个场景更新数据会随机分布,没有什么规律可言,并且底表的数据量会比较,新增的数据量通常相比底表会比较小。在这种场景下,我们可以**选用哈希索引、State索引和...

让快更快, 火山引擎ByteHouse为ClickHouse提速

但是维护多个开源数据库将导致成本高,选择一款可以避免成本无限扩展的计算引擎成为字节数据研发首要考虑的问题。 ClickHouse性能高、灵活性强,且主要依赖磁盘、成本相对可控,成为字节跳动内部计算引擎的首选... 出现了什么问题、问题如何解决,最程度把问题前置化,降低运维风险。从效果上看, 18000 个节点只需要不到 10 个运维人员来支持。 第四, 存算分离,实现OLAP引擎架构进化。ByteHouse推出了 MPP 2. 0 即存算分离...

字节跳动 NoSQL 的探索与实践

> 本文整理自火山引擎开发者社区技术讲堂第三期演讲,主要介绍了 NoSQL 的前世今生和发展脉搏,以及字节跳动 NoSQL 的实践。**作者:王佳毅|火山引擎存储&数据库解决方案负责人**## NoSQL 应用的现状什么是 NoSQL?我们知道关系型数据库强调 CAP 理论:Consistency,Availability 和 Partition Tolerance,这三者不可兼得。谈到 NoSQL,我们会引入 BASE 概念:- Basically Available:分布式系统在出现故障时允许损失部分可用性,...

字节跳动数据湖技术选型的思考

涵盖了线上数据库,例如 MySQL、Oracle 和 MongoDB;消息队列,例如 Kafka、RocketMQ;数据生态系统的各种组件,例如 HDFS、Hive 和 ClickHouse。在字节跳动内部,数据集成系统服务了几乎所有的业务线,包括抖音、今... 于是我们的核心问题便集中在了以下两个问题:* 哪个框架可以更好的支持我们 CDC 数据处理的核心诉求?* 哪个框架可以更快速补齐另一个框架的功能,从而成长为一个通用并且成熟的数据湖框架?经过多次的内部讨论...

2023 年数据个人技术能力提升心得体会|社区征文

**首先第一步是获取数据**,也叫数据采集,只有把数据放到数据平台,我们才能进行后面的操作,那么都获取哪些数据呢,无非就下面这几种:- 第一:业务库中的数据,比如存储用户信息的,订单信息的数据。这些数据一般都是存在关系型数据库如MySql中。- 第二:日志数据,日志数据包括,埋点的数据和系统产生的日志数据,埋点数据就是存储 哪个用户在什么时间什么地点,点击了平台上的什么按钮等等这类的数据,因为这类数据比较多,并且一般都...

2023 年的“云原生的演化”|社区征文

云上生,云上长的 IT 架构就是云原生## 什么是云原生:Cloud Native是一个组合词, Cloud +Native的组合, 其中 Cloud中负责应用程序位于云环境中,而非传统的数据中心; Navite负责,在应用程序设计中就要考虑云环境; 云数据库,数据服务,以及云上建立的众多产品服务等是否也可以成为云原生,云原生首先要生于云,运行在云上;## 云原生的主要说法:- 云原生指的是 容器、微服务、Devops 等技术的合集。 - 云原生是一种开发方...

特惠活动

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

产品体验

体验中心

云服务器特惠

云服务器
云服务器ECS新人特惠
立即抢购

白皮书

数据智能知识图谱
火山引擎数智化平台基于字节跳动数据平台,历时9年,基于多元、丰富场景下的数智实战经验打造而成
立即获取

最新活动

爆款1核2G共享型服务器

首年60元,每月仅需5元,限量秒杀
立即抢购

火山引擎增长体验专区

丰富能力激励企业快速增长
查看详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

一键开启云上增长新空间

立即咨询