You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

数据湖升级Gen2

面向开发者的云福利中心,ECS 60元/年,域名1元起,助力开发者快速在云上构建可靠应用

社区干货

干货|揭秘字节跳动对Apache Doris 数据湖联邦分析的升级和优化

=&rk3s=8031ce6d&x-expires=1714839650&x-signature=gZ%2BliOzHaELMvgWg9ckI%2B%2Fk02ws%3D) 本文主要介绍 Apache Doris 设计和开发数据湖联邦分析特性的思考和实践。 全文分为三部分,首先介绍数... 数据可以秒级入库。实时数仓的分析能力也较强,支持秒级和亚秒级的数据分析,支持多维分析和联合分析。对外可以提供高并发数据服务,如 Doris 可以提供万级 QPS 的数据服务,也提供数据更新能力。![picture.imag...

揭秘字节跳动对 Apache Doris 数据湖联邦分析的升级和优化

发现数据的商业价值。在这个时期,主要是将来自业务系统的多种结构化数据聚合到数据仓库中,利用 MPP 等大规模并发技术对企业的数据进行分析,支撑上层的商业分析和决策。 ### 1.2 数据湖阶段数仓的主要特点是... 数据可以秒级入库。实时数仓的分析能力也较强,支持秒级和亚秒级的数据分析,支持多维分析和联合分析。对外可以提供高并发数据服务,如 Doris 可以提供万级 QPS 的数据服务,也提供数据更新能力。![picture.image](...

干货|揭秘字节跳动对Apache Doris 数据湖联邦分析的升级和优化

首先介绍数据湖相关技术的演进,其次介绍 Apache Doris 数据湖联邦分析的整体设计和相关特性,最后介绍 Apache Doris 在数据湖联邦分析上的未来规划。# 1. 湖仓一体架构演进回顾湖仓一体的发展史,主要经历了三个... 数据可以秒级入库。实时数仓的分析能力也较强,支持秒级和亚秒级的数据分析,支持多维分析和联合分析。对外可以提供高并发数据服务,如 Doris 可以提供万级 QPS 的数据服务,也提供数据更新能力。![picture.image](...

干货 | 实时数据湖在字节跳动的实践

来看一下字节跳动对数据湖的解读。我们是结合字节的业务场景来解读的。通过实践总结,**我们发现数据湖需要具备六大能力:**![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/26382a3ff5bc44cd8803a3c02b8aae67~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1714839698&x-signature=mL7HNIU7N6aDfZgpcfeGlu6DW%2BA%3D)**第一是高效的并发更新能力。** 因为它能够改变我们在 Hive ...

特惠活动

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

数据湖升级Gen2-优选内容

干货|揭秘字节跳动对Apache Doris 数据湖联邦分析的升级和优化
=&rk3s=8031ce6d&x-expires=1714839650&x-signature=gZ%2BliOzHaELMvgWg9ckI%2B%2Fk02ws%3D) 本文主要介绍 Apache Doris 设计和开发数据湖联邦分析特性的思考和实践。 全文分为三部分,首先介绍数... 数据可以秒级入库。实时数仓的分析能力也较强,支持秒级和亚秒级的数据分析,支持多维分析和联合分析。对外可以提供高并发数据服务,如 Doris 可以提供万级 QPS 的数据服务,也提供数据更新能力。![picture.imag...
揭秘字节跳动对 Apache Doris 数据湖联邦分析的升级和优化
发现数据的商业价值。在这个时期,主要是将来自业务系统的多种结构化数据聚合到数据仓库中,利用 MPP 等大规模并发技术对企业的数据进行分析,支撑上层的商业分析和决策。 ### 1.2 数据湖阶段数仓的主要特点是... 数据可以秒级入库。实时数仓的分析能力也较强,支持秒级和亚秒级的数据分析,支持多维分析和联合分析。对外可以提供高并发数据服务,如 Doris 可以提供万级 QPS 的数据服务,也提供数据更新能力。![picture.image](...
干货|揭秘字节跳动对Apache Doris 数据湖联邦分析的升级和优化
首先介绍数据湖相关技术的演进,其次介绍 Apache Doris 数据湖联邦分析的整体设计和相关特性,最后介绍 Apache Doris 在数据湖联邦分析上的未来规划。# 1. 湖仓一体架构演进回顾湖仓一体的发展史,主要经历了三个... 数据可以秒级入库。实时数仓的分析能力也较强,支持秒级和亚秒级的数据分析,支持多维分析和联合分析。对外可以提供高并发数据服务,如 Doris 可以提供万级 QPS 的数据服务,也提供数据更新能力。![picture.image](...
干货 | 实时数据湖在字节跳动的实践
来看一下字节跳动对数据湖的解读。我们是结合字节的业务场景来解读的。通过实践总结,**我们发现数据湖需要具备六大能力:**![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/26382a3ff5bc44cd8803a3c02b8aae67~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1714839698&x-signature=mL7HNIU7N6aDfZgpcfeGlu6DW%2BA%3D)**第一是高效的并发更新能力。** 因为它能够改变我们在 Hive ...

数据湖升级Gen2-相关内容

字节跳动基于 Hudi 的实时数据湖平台

=&rk3s=8031ce6d&x-expires=1714839697&x-signature=qqAxdEtzS%2BJG98HaeD8gRs9%2Fo%2Bk%3D)> 作者:耿筱喻 |字节跳动数据平台数据湖团队研发工程师# 1. **Hudi和字节跳动实时数据湖平台简介**Hudi 是一个流式数据湖平台,提供 ACID 功能,支持实时消费增量数据、离线批量更新数据,并且可以通过 Spark、Flink、Presto 等计算引擎进行查询。![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddh...

字节跳动基于数据湖技术的近实时场景实践

数据湖采用了一种 schema on read 的模式,即不会事先对它的 schema 做过多的定义,而是在使用的时候才去决定 schema,从而支持上游更丰富、更灵活的应用。## **1.2 字节数据湖**Apache Hudi有下面非常重要的特性... 对于需要融合多种数据源或者构建集市型数据集的场景,多源拼接功能简化了数据操作,使数据集的构建更加简便。- 字节数据湖支持 read optimize 和 real time两种 query 模式。同时提供 upsert(主键更新)、append(非...

直播预告|数据湖实时化与智能化实践探索

数据湖相关技术正在各大企业中得到越来越广泛的应用。数据湖技术优雅地解决了**传统** **数仓** **场景下遇到的数据孤岛、数据不支持更新、不支持** **ACID** **事务、数据实效性差等核心问题**。在数据湖相关技... 数据存储、特征回填需求、降低成本、提升速度等需求的期待。本次分享将围绕以上业务需求展开:1. 字节跳动数据湖选型,Why Iceberg,如:元数据能力强、多版本快照、分布式扫描计划等;2. 字节跳动基于 Iceberg 的改...

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

干货|字节跳动数据湖技术选型的思考

本文是字节跳动数据平台开发套件团队在Flink Forward Asia 2021: Flink Forward 峰会上的演讲,着重分享了字节跳动数据湖技术上的选型思考和探索实践。![picture.image](https://p3-volc-community-sign.byt... 对数据准确性要求非常高。在CDC链路的整体链路比较长。首先,首次导入为批式导入,我们通过Flink Batch模式直连Mysql库拉取全量数据写入到Hive,增量Binlog数据通过流式任务导入到HDFS。由于Hive不支持更新操作...

字节跳动数据湖索引演进

字节数据湖索引演进- 未来规划分享嘉宾|耿筱喻 字节跳动 火山引擎LAS研发工程师编辑整理|吕宴全 浙江大学出品平台|DataFunTalk* * * # **1. Hudi 索引介绍**## **1.1 传统数仓数据更新**... (https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/68c60b6596a84a2b85a88d2583fa2945~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1714839698&x-signature=0A2pWs%2BxZQxPtCALX%2FL3...

字节跳动数据湖技术选型的思考

和不同数据源之间的批式传输。在 2020 年,我们基于 Flink 构造了 MQ-Hive 的实时数据集成通道,主要用于将消息队列中的数据实时写入到 Hive 和 HDFS,在计算引擎上做到了流批统一。到了 2021 年,我们基于 Flink 构造了实时数据湖集成通道,从而完成了湖仓一体的数据集成系统的构建。![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/fe9eeac916c0495ba54acaec012d0e2f~tplv-tlddhu82om-...

直播预告|数据湖实时化与智能化实践探索

2FW6LDqb9WhaAqw%3D) 2022年12月18日 9:00-12:50,由火山引擎云原生计算技术负责人李亚坤出品的 DataFunCon 2022 大会「实时与智能数据湖」专场将围绕数据湖技术的实时化与智能化展开深度分享。专场全程直播,欢迎准时收看!近年来,数据湖相关技术正在各大企业中得到越来越广泛的应用。数据湖技术优雅地解决了**传统****数仓****场景下遇到的数据孤岛、数据不支持更新、不支持** **ACID** **事务、数据实...

字节跳动基于数据湖技术的近实时场景实践

数据湖采用了一种 schema on read 的模式,即不会事先对它的 schema 做过多的定义,而是在使用的时候才去决定 schema,从而支持上游更丰富、更灵活的应用。2. ## **字节**数据湖Apache Hudi有下面非常重要的特性... 字节数据湖支持 read optimize 和 real time两种 query 模式。同时提供 upsert(主键更新)、append(非主键更新)两种数据更新能力,应用扩展性强,对用户使用友好。# ▌**近实时技术架构**3. ## **近实时场景...

干货 | 实时数据湖在字节跳动的实践

来看一下字节跳动对数据湖的解读。我们是结合字节的业务场景来解读的。通过实践总结, **我们发现数据湖需要具备六大能力:**![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/e18a22a3c4084b0b898aa1ba3bdb59fd~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1714839651&x-signature=k9Tf8iZjdFC82D9I8%2Beh0kRKVJA%3D)**第一是高效的并发更新能力。**因为它能够改变我们在...

特惠活动

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

产品体验

体验中心

云服务器特惠

云服务器
云服务器ECS新人特惠
立即抢购

白皮书

一图详解大模型
浓缩大模型架构,厘清生产和应用链路关系
立即获取

最新活动

爆款1核2G共享型服务器

首年60元,每月仅需5元,限量秒杀
立即抢购

火山引擎增长体验专区

丰富能力激励企业快速增长
查看详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

一键开启云上增长新空间

立即咨询