You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

数据仓库中面向主题的理解

从数据接入、查询分析到可视化展现,提供一站式洞察平台,让数据发挥价值

社区干货

数仓黄金价值圈: 为什么、是什么、怎么做|社区征文

数据仓库广泛定义:数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。随着数字化浪潮到来仅仅支撑管理决策暴露出了局限性,**应在管理决策基础上扩展到产品决策、运营决策、服务决策等等** 1、面向主题【微服务、业务过程、数据域】 操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数...

浅谈数仓建设及数据治理 | 社区征文

通过数据分层管理可以简化数据清洗的过程,因为把原来一步的工作分到了多个步骤去完成,相当于把一个复杂的工作拆成了多个简单的工作,把一个大的黑盒变成了一个白盒,每一层的处理逻辑都相对简单和容易理解,这样我们比较容易保证每一个步骤的正确性,当数据发生错误的时候,往往我们只需要局部调整某个步骤即可。数据仓库之父 Bill Inmon对数据仓库做了定义——面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管...

ByteHouse:基于ClickHouse的实时数仓能力升级解读

ByteHouse是火山引擎上的一款云原生数据仓库,为用户带来极速分析体验,能够支撑实时数据分析和海量数据离线分析。便捷的弹性扩缩容能力,极致分析性能和丰富的企业级特性,助力客户数字化转型。全篇将从两个版块讲解ByteHouse的技术业务场景及实践经验。第一版块将核心介绍ByteHouse于字节内部的业务应用场景,以及使用ClickHouse打造实时数仓的经验。第二板块将集讲解字节基于ByteHouse对金融行业实时数仓的现状的理解与思考。...

数仓进阶篇@记一次BigData-OLAP分析引擎演进思考过程 | 社区征文

## 开篇 想必大家都有一个疑问?何为**OLTP**,**OLAP**?它又能够给我们带来什么? ![image.png](https://p6-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/645ebe45d53945399ac78c50f7703656~tplv-k3u1fbpfcp-5.jpeg?) 引入 | 图解那些OLAP分析引擎中的DBMS ![DB-Engines Ranking.jpg](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/88980f084ca04d0db247dfa6c168342b~tplv-k3u1

特惠活动

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

数据仓库中面向主题的理解-优选内容

数仓黄金价值圈: 为什么、是什么、怎么做|社区征文
数据仓库广泛定义:数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。随着数字化浪潮到来仅仅支撑管理决策暴露出了局限性,**应在管理决策基础上扩展到产品决策、运营决策、服务决策等等** 1、面向主题【微服务、业务过程、数据域】 操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数...
浅谈数仓建设及数据治理 | 社区征文
通过数据分层管理可以简化数据清洗的过程,因为把原来一步的工作分到了多个步骤去完成,相当于把一个复杂的工作拆成了多个简单的工作,把一个大的黑盒变成了一个白盒,每一层的处理逻辑都相对简单和容易理解,这样我们比较容易保证每一个步骤的正确性,当数据发生错误的时候,往往我们只需要局部调整某个步骤即可。数据仓库之父 Bill Inmon对数据仓库做了定义——面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管...
ByteHouse:基于ClickHouse的实时数仓能力升级解读
ByteHouse是火山引擎上的一款云原生数据仓库,为用户带来极速分析体验,能够支撑实时数据分析和海量数据离线分析。便捷的弹性扩缩容能力,极致分析性能和丰富的企业级特性,助力客户数字化转型。全篇将从两个版块讲解ByteHouse的技术业务场景及实践经验。第一版块将核心介绍ByteHouse于字节内部的业务应用场景,以及使用ClickHouse打造实时数仓的经验。第二板块将集讲解字节基于ByteHouse对金融行业实时数仓的现状的理解与思考。...
浅谈大数据建模的主要技术:维度建模 | 社区征文
还是基于传统 MPP 架构的数据仓库(如Teradata ),抑或是基于传统 Oracle 、MySQL 、MS SQL Server 关系型数据库的数据仓库,其实都面临如下问题:- 怎么组织数据仓库中的数据?- 怎么组织才能使得数据的使用最为方便... 在理解了事实表和维度表之后,接下来的问题就是如何组合它 在维度建模中,存在两种组合维度表和事实表的基本架构:星形架构和雪花架构。当所有维度表直接连接到事实表时,整个组合的形状类似于星星,所以被称为星形架...

数据仓库中面向主题的理解-相关内容

ByConity 替换 ClickHouse 构建 OLAP 数据平台,资源成本大幅降低

ByConity 是字节跳动开源的云原生数据仓库,在满足数仓用户对资源弹性扩缩容,读写分离,资源隔离,数据强一致性等多种需求的同时,提供优异的查询,写入性能。文章来源|ByConity 开源社区GitHub |https://github.com/ByConity/ByConity作者|程伟,MetaAPP 大数据研发工程师 MetaApp 是国内领先的游戏开发与运营商,专注移动端信息高效分发,致力于构建面向全年龄段的虚拟世界。截至 2023 年,MetaAp...

干货|ByteHouse:百万级TPS!看字节跳动如何基于ClickHouse落地高性能实时数仓

一款云原生数据仓库,为用户带来极速分析体验,能够支撑实时数据分析和海量数据离线分析。便捷的弹性扩缩容能力,极致分析性能和丰富的企业级特性,助力客户数字化转型。> > > > > **全篇将从两个版块讲解 ByteHouse 的技术业务场景及实践经验。**> 第一版块将核心介绍 ByteHouse 于字节内部的业务应用场景,以及使用 ClickHouse 打造实时数仓的经验。第二板块将集讲解字节基于 ByteHouse 对金融行业实时数仓的现状的理解与...

系统集成在一些特定行业的相关概念

数据的安全性和完整性等;分析型处理则用于管理人员的决策分析,经常要访问大量的历史数据。数据仓库(DataWarehouse)是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。可从两个层面理解数据仓库:首先数据仓库用于决策支持,面向分析型数据处理,不同于企业现有的操作型数据库;其次数据仓库是对多个异构数据源的有效集成,集成后按主题重组,且放在数据仓库中的数据一般不再修改。数据仓库系...

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

观点|SparkSQL在企业级数仓建设的优势

管理元数据服务的Hive Metastore,以及任务以MapReduce分布式任务运行在YARN上。标准的JDBC接口,标准的SQL服务器,分布式任务执行,以及元数据中心,这一系列组合让Hive完整的具备了构建一个企业级数据仓库的所有... 通常工作在企业的DM层直接面向业务,处理业务需求。* Hive、Spark:更注重任务的稳定性,对网络,IO要求比较高,有着完善的中间临时文件落盘,节点任务失败的重试恢复,更加合适小时及以上的长时任务运行,工作在企业的的...

SparkSQL 在企业级数仓建设的优势

以及元数据中心,这一系列组合让 Hive 完整的具备了构建一个企业级数据仓库的所有特性,并且 Hive 的 SQL 服务器是目前使用最广泛的标准服务器。虽然 Hive 有非常明显的优点,可以找出完全替代 Hive 的组件寥寥无几... 通常工作在企业的DM层直接面向业务,处理业务需求。- Hive、Spark:更注重任务的稳定性,对网络,IO要求比较高,有着完善的中间临时文件落盘,节点任务失败的重试恢复,更加合适小时及以上的长时任务运行,工作在企业的...

从思考到实践,企业级大数据平台的构建之路

点击上方👆蓝字关注我们! 伴随着移动互联网、5G、AI、IoT 的飞速发展,企业数据建设正处于更大规模和更多样的变化趋势。传统自建数据仓库,在企业数据体量持续增长、业务时效性持续提升的... 火山引擎湖仓一体分析服务 LAS 是面向湖仓一体架构的 Serverless 数据处理分析服务,提供一站式的海量数据存储计算和交互分析能力,完全兼容 Spark、Presto、Flink 生态,在字节跳动内部有着广泛的应用。本次演讲将介...

ByConity 替换 ClickHouse 构建 OLAP 数据平台,资源成本大幅降低

数据仓库,在满足数仓用户对资源弹性扩缩容,读写分离,资源隔离,数据强一致性等多种需求的同时,并提供优异的查询,写入性能。MetaApp 是国内领先的游戏开发与运营商,专注移动端信息高效分发,致力于构建面向全年龄段... MetaApp 大数据研发团队对 ByConity 进行了初步测试。其存算分离的架构、优秀的性能,尤其在日志分析场景,对于大规模数据复杂查询的支持,吸引 MetaApp 对 ByConity 进行了深入测试,最终在生产环境全量替换 ClickH...

字节跳动基于 Apache Hudi 构建实时数仓的实践

**导读:** 今天很高兴能与大家分享字节数据平台在实时数仓中的一些实践。目前在数据湖和 Hudi 相关的一些基本技术原理方面社区已有较多的介绍,所以我们今天的分享主要聚焦于实践部分的内容。今天我们的分享主要分... 对于整个链路来说我们会把左边 MySQL 数据源的数据导到 Table 1 中,右边 Redis 的数据导到 Table 2 中,然后将两个表做 Join。这存在两个比较大的问题,一个是高峰期的资源占用率较高,因为天级 Dump 数据量较大,且...

「火山引擎」数智平台 VeDI 数据中台产品双月刊 VOL.03

安全等全套数据中台建设,提升数据研发效率、降低管理成本。搭配 EMR/LAS 大数据存储计算引擎,加速企业数据中台及湖仓一体平台建设,为企业数字化转型提供数据支撑。**火山引擎云原生数据仓库** **ByteHouse**云原生数据仓库,为用户提供极速分析体验,能够支撑实时数据分析和海量数据离线分析。便捷的弹性扩缩容能力,极致分析性能和丰富的企业级特性,助力客户数字化转型。**火山引擎湖仓一体分析服务 LAS**面向湖仓一体架构...

特惠活动

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

产品体验

体验中心

云服务器特惠

云服务器
云服务器ECS新人特惠
立即抢购

白皮书

数据智能知识图谱
火山引擎数智化平台基于字节跳动数据平台,历时9年,基于多元、丰富场景下的数智实战经验打造而成
立即获取

最新活动

爆款1核2G共享型服务器

首年60元,每月仅需5元,限量秒杀
立即抢购

火山引擎增长体验专区

丰富能力激励企业快速增长
查看详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

一键开启云上增长新空间

立即咨询