You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

数据仓库与数据挖掘运用实例

从数据接入、查询分析到可视化展现,提供一站式洞察平台,让数据发挥价值

社区干货

面向智能化BI分析平台建设的初步探索 | 社区征文

### 1、BI的起源与发展 BI又称商业智慧或商务智能,是指用现代数据仓库技术、线上分析处理技术、数据挖掘以及数据展现技术进行数据分析以实现商业价值。 商业智能的概念最早在1996年由加特纳集团提出,加特纳集团在商业智能的定义中指出,商业智能描述了一系列的概念和方法,通过应用基于事实的支持系统来辅助商业决策的制定。商业智能技术提供使企业迅速分析数据的技术和方法,包括收集、管理和分析数据,并将这些数据转化为有...

以 100GB SSB 性能测试为例,通过 ByteHouse 云数仓开启你的数据分析之路

ByteHouse 作为云原生的数据平台,从架构层面入手,通过存储和计算分离的云原生架构完美适配云上基础设施。在字节跳动内部,ByteHouse 已经支持 80% 的分析应用场景,包括用户增长业务、广告、A/B 测试等。除了极致的分析性能之外,ByteHouse 开箱即用,按实际使用付费的特性也极大地降低了企业和个人的上手门槛,能够在短短数分钟内体验到数据分析的魅力。 Talk is cheap, 接下来就让我们通过一个实战案例来体验下 ByteHouse 云数...

LAS Spark 在 TPC-DS 的优化揭秘

和统计报表类应用,同时大数据的数据质量较低,数据分布真实而不均匀。因此 TPC-DS 成为客观衡量多个不同 Hadoop 版本以及 SQL on Hadoop 技术的最佳测试集。这个基准测试有以下几个主要特点:- 一共 99 个测试案例,遵循 SQL 99 和 SQL 2003 的语法标准,SQL 案例比较复杂;- 分析的数据量大,并且测试案例是在回答真实的商业问题;- 测试案例中包含各种业务模型(如分析报告型,迭代式的联机分析型,数据挖掘型等);- 几乎所有...

ELT in ByteHouse 实践与展望

用户可以将数据导入后,通过自定义的SQL语句,在ByteHouse内部进行数据转换,而无需依赖独立的ETL系统及资源。 火山引擎ByteHouse是一款基于开源ClickHouse推出的云原生数据仓库,本篇文章将介绍ByteHouse团队如何在ClickHouse的基础上,构建并优化ELT能力,具体包括四部分:ByteHouse在字节的应用、ByteHouse团队做ELT的初衷、ELT in ByteHouse实现方案、未来规划。 # ByteHouse在字节的应用## 关于ByteHouse### ByteH...

特惠活动

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

数据仓库与数据挖掘运用实例-优选内容

面向智能化BI分析平台建设的初步探索 | 社区征文
### 1、BI的起源与发展 BI又称商业智慧或商务智能,是指用现代数据仓库技术、线上分析处理技术、数据挖掘以及数据展现技术进行数据分析以实现商业价值。 商业智能的概念最早在1996年由加特纳集团提出,加特纳集团在商业智能的定义中指出,商业智能描述了一系列的概念和方法,通过应用基于事实的支持系统来辅助商业决策的制定。商业智能技术提供使企业迅速分析数据的技术和方法,包括收集、管理和分析数据,并将这些数据转化为有...
以 100GB SSB 性能测试为例,通过 ByteHouse 云数仓开启你的数据分析之路
ByteHouse 作为云原生的数据平台,从架构层面入手,通过存储和计算分离的云原生架构完美适配云上基础设施。在字节跳动内部,ByteHouse 已经支持 80% 的分析应用场景,包括用户增长业务、广告、A/B 测试等。除了极致的分析性能之外,ByteHouse 开箱即用,按实际使用付费的特性也极大地降低了企业和个人的上手门槛,能够在短短数分钟内体验到数据分析的魅力。 Talk is cheap, 接下来就让我们通过一个实战案例来体验下 ByteHouse 云数...
LAS Spark 在 TPC-DS 的优化揭秘
和统计报表类应用,同时大数据的数据质量较低,数据分布真实而不均匀。因此 TPC-DS 成为客观衡量多个不同 Hadoop 版本以及 SQL on Hadoop 技术的最佳测试集。这个基准测试有以下几个主要特点:- 一共 99 个测试案例,遵循 SQL 99 和 SQL 2003 的语法标准,SQL 案例比较复杂;- 分析的数据量大,并且测试案例是在回答真实的商业问题;- 测试案例中包含各种业务模型(如分析报告型,迭代式的联机分析型,数据挖掘型等);- 几乎所有...
ELT in ByteHouse 实践与展望
用户可以将数据导入后,通过自定义的SQL语句,在ByteHouse内部进行数据转换,而无需依赖独立的ETL系统及资源。 火山引擎ByteHouse是一款基于开源ClickHouse推出的云原生数据仓库,本篇文章将介绍ByteHouse团队如何在ClickHouse的基础上,构建并优化ELT能力,具体包括四部分:ByteHouse在字节的应用、ByteHouse团队做ELT的初衷、ELT in ByteHouse实现方案、未来规划。 # ByteHouse在字节的应用## 关于ByteHouse### ByteH...

数据仓库与数据挖掘运用实例-相关内容

浅谈数仓建设及数据治理 | 社区征文

并提供多样的数据应用,数据自下而上流入数据仓库后向上层开放应用,而数据仓库只是中间集成化数据管理的一个平台。**源数据**:此层数据无任何更改,直接沿用外围系统数据结构和数据,不对外开放;为临时存储层,是接口... 而企业数据模型也分为两个层次,即主题域模型和逻辑模型。同样,主题域模型可以看成是业务模型的概念模型,而逻辑模型则是域模型在关系型数据库上的实例化。#### 2) 实体建模法实体建模法并不是数据仓库建模中常见...

ByConity 技术详解之 ELT

谈到数据仓库, 一定离不开使用Extract-Transform-Load (ETL)或 Extract-Load-Transform (ELT)。 将来源不同、格式各异的数据提取到数据仓库中,并进行处理加工。传统的数据转换过程一般采用Extract-Transform-Load (ETL)来将业务数据转换为适合数仓的数据模型,然而,这依赖于独立于数仓外的ETL系统,因而维护成本较高。ByConity 作为云原生数据仓库,从0.2.0版本开始逐步支持 Extract-Load-Transform (ELT),使用户免于维护多套异构...

干货|以 100GB SSB 性能测试为例,通过 ByteHouse 云数仓开启你的数据分析之路

ByteHouse 作为云原生的数据平台,从架构层面入手,通过存储和计算分离的云原生架构完美适配云上基础设施。在字节跳动内部, **ByteHouse 已经支持 80% 的分析应用场景,包括用户增长业务、广告、A/B 测试等** 。除了极致的分析性能之外,ByteHouse 开箱即用, **按实际使用付费的特性也极大地降低了企业和个人的上手门槛,** 能够在短短数分钟内体验到数据分析的魅力。 Talk is cheap, 接下来就让我们通过一个实战案例来体...

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

ByteHouse CDW SQL

ByteHouse 云数仓版(ByteHouse CDW)是一款云原生数据仓库,能够支持实时数据分析和海量数据离线分析,对 PB 级海量数据进行高效分析,其便捷的弹性扩缩容能力,极致分析性能和丰富的企业级特性,助力于客户数字化转型。... 单击数据开发进入对应项目。 在任务开发界面,左侧导航栏中,单击新建任务按钮,进入新建任务页面。 选择任务类型: 分类:数据开发。 绑定引擎:ByteHouse 云数仓版。 关联实例:在下拉列表中选择项目绑定时的 ByteHou...

ELT in ByteHouse 实践与展望

以火山引擎 ByteHouse 为例的云原生数据仓库,凭借其强大的计算能力、可扩展性,开始全面支持Extract-Load-Transform(ELT)的能力,从而使用户免于维护多套异构系统。具体而言,用户可以将数据导入后,通过自定义的SQL语句,在ByteHouse 内部进行数据转换,而无需依赖独立的 ETL 系统及资源。 ByteHouse 在字节的应用 **关于 ByteHouse**从 2017 年开始,字节内部的整体数据量不断上涨,为了支撑实时分析...

功能发布记录(2024年)

2024/04/23序号 功能 功能描述 使用文档 1 数据开发 数据开发调用依赖设置新增支持就近依赖方式,下游任务可快速依赖距离其定时执行时间最近的上游实例。 数据开发支持绑定 ByteHouse 云数仓版引擎,新增 Byt... 临时查询执行和数据开发任务调试支持选择是否开启任务成功\失败时的消息通知; 资源库支持EMR和通用(Shell/Python)引擎的资源类型进行跨引擎复制、华北地域资源来源新增制品仓库(SCM)形式; 调度时间变量参数支持分...

干货 | 这样做,能快速构建企业级数据湖仓

近几年热门的 ClickHouse 和 Doris 也是 Native 化的表现。### **第二,向量化。**Codegen 和向量化都是从数据仓库,而不是 Hadoop 体系的产品中衍生出来。Codegen 是 Hyper 提出的技术,而向量化则是 MonetDB 提出的,所以计算引擎的精细化也是沿着数仓开辟的路子在走。Spark 等 Hadoop 体系均走了 Codegen 的道路,因为 Java 做 Codegen 比做向量化要更容易一些。但现在,向量化是一个更好的选择,因为向量化可以一次处理...

迁移指南说明

支持海量数据的存储、查询和分析,可弹性伸缩,按需使用,使用更低的成本,也可与大数据开发治理套件(DataLeap)等其他产品能力结合,提供端到端的数据接入/分析/挖掘能力,帮助用户轻松完成企业大数据平台的构建和数据上... 引擎的假设和数据格式的价格一样,替换执行引擎的成本是昂贵的,考虑到不同引擎间的语法差异性,作业代码通常需要改造。 特定实例类型对于运行负载是最优的。 很多时候,另一种实例类型执行的更好。比如,c2i 实例性能...

干货 | 看 SparkSQL 如何支撑企业级数仓

本文作者:惊帆 来自于数据平台 EMR 团队# 前言Apache Hive 经过多年的发展,目前基本已经成了业界构建超大规模数据仓库的事实标准和数据处理工具,Hive 已经不单单是一个技术组件,而是一种设计理念。Hive 有 JDB... 拥有较好的数据安全。- 集成成本低:MapReduce 只支持编程态的接口,并且不支持迭代计算,Hive 封装了 MapReduce 提供 SQL 的接口,可以很低成本的和上层数据挖掘,数据分析工具进行集成。所以虽然 Hive 出现已经非...

特惠活动

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

产品体验

体验中心

云服务器特惠

云服务器
云服务器ECS新人特惠
立即抢购

白皮书

数据智能知识图谱
火山引擎数智化平台基于字节跳动数据平台,历时9年,基于多元、丰富场景下的数智实战经验打造而成
立即获取

最新活动

爆款1核2G共享型服务器

首年60元,每月仅需5元,限量秒杀
立即抢购

火山引擎增长体验专区

丰富能力激励企业快速增长
查看详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

一键开启云上增长新空间

立即咨询