You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

数据仓库具有三个常用概念

从数据接入、查询分析到可视化展现,提供一站式洞察平台,让数据发挥价值

社区干货

数仓黄金价值圈: 为什么、是什么、怎么做|社区征文

搭建数据仓库是什么,数据仓库定义怎么做,如何搭建数仓# 一:为什么,搭建数据仓库最终目标:**数据驱动资源优化配置,即科学、高效和精准的决策**第一个视角是从业务视角出发,我们可以提炼为三个字为**管**,**产**,**运**1、管是管理,即让管理层进行科学决策【不再是屁股决定脑袋的决策】2、产是产品,即让产品流程优化,快速迭代【不再自嗨式的闭门造车】3、运是运营,即数据驱动业务运营策略【不再是盲人摸象式的策...

浅谈大数据建模的主要技术:维度建模 | 社区征文

怎么组织才能使得数据仓库具有良好的可扩展性和可维护性?> **Ralph Kimball 维度建模理论很好地回答和解决了上述问题。**维度建模理论和技术也是目前在数据仓库领域中使用最为广泛的、也最得到认可和接纳的一项技术。今天我们就来深入探讨 Ralph Kimball 维度建模的各项技术,涵盖其基本理论、一般过程、维度表设计和事实表设计等各个方面,也为我们后面讲Hadoop 数据仓库实战打下基础。## 维度建模关键概念### 度量和环...

火山引擎云原生数据仓库 ByteHouse 技术白皮书 V1.0(上)

> 更多技术交流、求职机会,欢迎关注**字节跳动数据平台微信公众号,回复【1】进入官方交流群** **近日,《火山引擎云原生数据仓库 ByteHouse 技术白皮书》正式发布。** 白皮书简述了 ByteHouse 基于 ClickHous... 数据一致性与事务支持。- 计算资源隔离,读写分离:通过计算组(VW)概念,对宿主机硬件资源进行灵活切割分配,按需扩缩容。资源有效隔离,读写分开资源管理,任务之间互不影响,杜绝了大查询打满所有资源拖垮集群的...

浅谈数仓建设及数据治理 | 社区征文

(https://cdn.jsdelivr.net/gh/sunmyuan/cdn/210316_3.png)根据 Inmon 的观点,数据仓库模型的建设方法和业务系统的企业数据模型类似。在业务系统中,企业数据模型决定了数据的来源,而企业数据模型也分为两个层次,即主题域模型和逻辑模型。同样,主题域模型可以看成是业务模型的概念模型,而逻辑模型则是域模型在关系型数据库上的实例化。#### 2) 实体建模法实体建模法并不是数据仓库建模中常见的一个方法,它来源于哲学的一个流...

特惠活动

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

数据仓库具有三个常用概念-优选内容

数仓黄金价值圈: 为什么、是什么、怎么做|社区征文
搭建数据仓库是什么,数据仓库定义怎么做,如何搭建数仓# 一:为什么,搭建数据仓库最终目标:**数据驱动资源优化配置,即科学、高效和精准的决策**第一个视角是从业务视角出发,我们可以提炼为三个字为**管**,**产**,**运**1、管是管理,即让管理层进行科学决策【不再是屁股决定脑袋的决策】2、产是产品,即让产品流程优化,快速迭代【不再自嗨式的闭门造车】3、运是运营,即数据驱动业务运营策略【不再是盲人摸象式的策...
浅谈大数据建模的主要技术:维度建模 | 社区征文
怎么组织才能使得数据仓库具有良好的可扩展性和可维护性?> **Ralph Kimball 维度建模理论很好地回答和解决了上述问题。**维度建模理论和技术也是目前在数据仓库领域中使用最为广泛的、也最得到认可和接纳的一项技术。今天我们就来深入探讨 Ralph Kimball 维度建模的各项技术,涵盖其基本理论、一般过程、维度表设计和事实表设计等各个方面,也为我们后面讲Hadoop 数据仓库实战打下基础。## 维度建模关键概念### 度量和环...
火山引擎云原生数据仓库 ByteHouse 技术白皮书 V1.0(上)
> 更多技术交流、求职机会,欢迎关注**字节跳动数据平台微信公众号,回复【1】进入官方交流群** **近日,《火山引擎云原生数据仓库 ByteHouse 技术白皮书》正式发布。** 白皮书简述了 ByteHouse 基于 ClickHous... 数据一致性与事务支持。- 计算资源隔离,读写分离:通过计算组(VW)概念,对宿主机硬件资源进行灵活切割分配,按需扩缩容。资源有效隔离,读写分开资源管理,任务之间互不影响,杜绝了大查询打满所有资源拖垮集群的...
浅谈数仓建设及数据治理 | 社区征文
(https://cdn.jsdelivr.net/gh/sunmyuan/cdn/210316_3.png)根据 Inmon 的观点,数据仓库模型的建设方法和业务系统的企业数据模型类似。在业务系统中,企业数据模型决定了数据的来源,而企业数据模型也分为两个层次,即主题域模型和逻辑模型。同样,主题域模型可以看成是业务模型的概念模型,而逻辑模型则是域模型在关系型数据库上的实例化。#### 2) 实体建模法实体建模法并不是数据仓库建模中常见的一个方法,它来源于哲学的一个流...

数据仓库具有三个常用概念-相关内容

数仓进阶篇@记一次BigData-OLAP分析引擎演进思考过程 | 社区征文

3u1fbpfcp/88980f084ca04d0db247dfa6c168342b~tplv-k3u1fbpfcp-5.jpeg?)## 资讯元宇宙(Metaverse),数据湖(Data Lake),信创自主可控,互联互通,数字化建设...... 这些概念越来越火热,前些时候大部分工作集... 3u1fbpfcp-5.jpeg?) **Impala:** 开源,基于HDFS/HBase的MPP SQL引擎,拥有和Hadoop一样的可扩展性、它提供了类SQL-类Hsql语法,在多用户场景下亦能拥有较高的响应速度和吞吐量,兼顾数据仓库,具有实时,批处理,多...

干货|揭秘字节跳动对Apache Doris 数据湖联邦分析的升级和优化

其次介绍 Apache Doris 数据湖联邦分析的整体设计和相关特性,最后介绍 Apache Doris 在数据湖联邦分析上的未来规划。# 1. 湖仓一体架构演进回顾湖仓一体的发展史,主要经历了三个阶段。第一个阶段是数据仓库,第... 数据湖模式缺乏一些关键特性,如不支持事务、数据缺乏一致性、缺乏隔离性、无法保证数据质量等,导致数据湖管理复杂,如果管理不善,数据湖将会退化成数据沼泽。 于是,2020年湖仓一体的概念被提出,主要指在数据湖中建...

基于 ByteHouse 构建实时数仓实践

> 更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 **随着数据的应用场景越来越丰富,企业对数据价值反馈到业务中的时效性要求也越来越高,很早就有人提出过一个概念:**... 高效数据集成:流式数据的集成必须方便高效,要求能进行高并发、大数据量的写入;三、极致性能要求:实时数仓不能仅限于简单查询,需要支持复杂计算能力,且计算结果可秒级返回;四、灵活查询:需要具备自助分析的能力...

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

字节跳动基于数据湖技术的近实时场景实践

主要包括以下几部分内容:数据湖技术的特性、近实时技术的架构、电商****数仓****实践、未来的挑战与规划。** # ▌**数据湖**技术特性1. ## **数据湖**概念从数据研发与应用的角度,数据湖技术具有以下特... 具备数据库、 数据仓库核心功能(高效upsert/deletes、索引、压缩优化)的数据湖平台。 - Hudi 支持各类计算、查询引擎(Flink、Spark、Presto、Hive),底层存储兼容各类文件系统 (HDFS、Amazon S3、GCS、OSS) - H...

SparkSQL 在企业级数仓建设的优势

3YPEoQ%3D)文 | **惊帆** 来自 字节跳动数据平台 EMR 团队# 前言Apache Hive 经过多年的发展,目前基本已经成了业界构建超大规模数据仓库的事实标准和数据处理工具,Hive 已经不单单是一个技术组件,而是一种设... **一个企业在实施数据平台的时候,由多个不同组件各自工作在不同的架构层中,无法相互取代,相互协作配合,承载整个企业的数据平台业务。**# 企业级数仓技术选择Google发表的三篇论文从存储,计算,检索三个方向阐...

年终学习大礼包|云原生大数据知识地图

云原生大数据带来了大数据在使用和运维方面的巨大变化,从以下三个角度来看:* **业务层面**:传统模式下,业务独立占用资源,在业务高峰时段占用全部资源,但在低谷时段资源占用率可能只有20%-30%; **云原生** **模式下**的业务是混部的,比如在线和离线业务,它可以按分时复用的方式来调用资源。* **资源调度层面**:在传统模式下,如果一个 Flink 集群有100台机器,那这100台机器就由它独占;云原生模式虚拟化出了资源池的概念。资...

干货 | 看 SparkSQL 如何支撑企业级数仓

安全这几个纬度思考。本文作者:惊帆 来自于数据平台 EMR 团队# 前言Apache Hive 经过多年的发展,目前基本已经成了业界构建超大规模数据仓库的事实标准和数据处理工具,Hive 已经不单单是一个技术组件,而是一种... 一个企业在实施数据平台的时候,由多个不同组件各自工作在不同的架构层中,无法相互取代,相互协作配合,承载整个企业的数据平台业务。# 企业级数仓技术选择Google 发表的三篇论文从存储,计算,检索三个方向阐述了海...

观点|SparkSQL在企业级数仓建设的优势

=&rk3s=8031ce6d&x-expires=1716222059&x-signature=ocvHR13mP6xwOcfdnFXw0qYK5Fs%3D) 文 | **惊帆** 来自 字节跳动数据平台EMR团队EMR 前言Apache Hive 经过多年的发展,目前基本已经成了业界构建超大规模数据仓库的事实标准和数据处理工具,Hive已经不单单是一个技术组件,而是一种设计理念。Hive有JDBC客户端,支持标准JDBC接口访问的HiveServer2服务器,管理元数据服务的Hive Meta...

揭秘字节跳动对 Apache Doris 数据湖联邦分析的升级和优化

其次介绍 Apache Doris 数据湖联邦分析的整体设计和相关特性,最后介绍 Apache Doris 在数据湖联邦分析上的未来规划。## 1. 湖仓一体架构演进回顾湖仓一体的发展史,主要经历了三个阶段。第一个阶段是数据仓库,第二... ### 1.3 湖仓一体阶段数据湖模式缺乏一些关键特性,如不支持事务、数据缺乏一致性、缺乏隔离性、无法保证数据质量等,导致数据湖管理复杂,如果管理不善,数据湖将会退化成数据沼泽。 于是,2020年湖仓一体的概念被...

特惠活动

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

产品体验

体验中心

云服务器特惠

云服务器
云服务器ECS新人特惠
立即抢购

白皮书

数据智能知识图谱
火山引擎数智化平台基于字节跳动数据平台,历时9年,基于多元、丰富场景下的数智实战经验打造而成
立即获取

最新活动

爆款1核2G共享型服务器

首年60元,每月仅需5元,限量秒杀
立即抢购

火山引擎增长体验专区

丰富能力激励企业快速增长
查看详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

一键开启云上增长新空间

立即咨询