You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

大数据分析入门

从数据接入、查询分析到可视化展现,提供一站式洞察平台,让数据发挥价值

社区干货

工业大数据分析与应用——知识总结 | 社区征文

数据挖掘、数据统计、基于大数据的业务分析与预测、基于大数据的决策、商业智能、人工智能、数据可视化等。 - 大数据应用服务 - 如数据运营、大数据交易、分析与预测服务、决策支持服务、数据分享平台、数据分析平台等。- 大数据IT基础设施:存储设备、运算设备、一体机、操作系统、基础软件、IT支撑等。#### 1.1.4 大数据的发展历程### 1.2 大数据的概念与特点* 概念:**大数据(Big data)**,指无法在一定时...

大数据学习架构实践|社区征文

> “大数据“,近几年来最火的词之一。虽然大数据这个词的正式产生也就10年左右,但对大数据分析却早就有之。早在互联网初期,就有很多公司通过计算机技术对大量的分析处理,比如各个浏览引擎。> 然而,大数据的真正提... 适合大规模的数据存储,解决了大批量大规模数据的存储问题。2)HBase列式存储在HDFS基础上,采用了列式存储的HBase数据库,解决了数据稀疏性的问题。并且由于HBase中数据结构的优化,使得快速实时查询在HBase上成为...

三分钟了解大数据技术发展史|社区征文

可以称得上大数据的基石,Doug cutting 大佬在基于谷歌的三篇论文开发出了 hadoop hdfs 分布式文件存储、MapReduce 计算框架,实际上从 hadoop 开源代码中窥见大数据并没有多么高深的技术难点,大部分实现都是基础的 ... 极大的简化了 MapReduce 分布式程序的门槛,让数据开发人员、数据分析师也能够快速入手,因此 hive 迅速得到了开发者和企业的追捧。随后众多 Hadoop 周边产品开始出现,其中包括:- 专门将关系数据库中的数据导入导...

我的大数据学习总结 |社区征文

# 学习的体系在开始学习大数据时,我参考过许多学习路线的建议,但觉得直接照搬别人的学习顺序未必适合自己。最后结合工作需要和个人经历,我制定了一套适合自己的学习路线:开始学习Linux命令和系统基本概念。然后分... RDD本身是一个不可变的分布式数据集,它支持两类基础操作:转换操作(transformation):转换RDD会产生新的RDD。例如:map、filter、 flatMap 等。行动操作(action):RDD的转换操作是惰性计算的,只有在行动操作时才会真正...

特惠活动

缓存型数据库Redis

1GB 1分片+2节点,高可用架构
24.00/80.00/月
立即购买

短文本语音合成 10千次

多音色、多语言、多情感,享20款免费精品音色
15.00/30.00/年
立即购买

短文本语音合成 30千次

5折限时特惠,享20款免费精品音色
49.00/99.00/年
立即购买

大数据分析入门-优选内容

工业大数据分析与应用——知识总结 | 社区征文
数据挖掘、数据统计、基于大数据的业务分析与预测、基于大数据的决策、商业智能、人工智能、数据可视化等。 - 大数据应用服务 - 如数据运营、大数据交易、分析与预测服务、决策支持服务、数据分享平台、数据分析平台等。- 大数据IT基础设施:存储设备、运算设备、一体机、操作系统、基础软件、IT支撑等。#### 1.1.4 大数据的发展历程### 1.2 大数据的概念与特点* 概念:**大数据(Big data)**,指无法在一定时...
大数据学习架构实践|社区征文
> “大数据“,近几年来最火的词之一。虽然大数据这个词的正式产生也就10年左右,但对大数据分析却早就有之。早在互联网初期,就有很多公司通过计算机技术对大量的分析处理,比如各个浏览引擎。> 然而,大数据的真正提... 适合大规模的数据存储,解决了大批量大规模数据的存储问题。2)HBase列式存储在HDFS基础上,采用了列式存储的HBase数据库,解决了数据稀疏性的问题。并且由于HBase中数据结构的优化,使得快速实时查询在HBase上成为...
三分钟了解大数据技术发展史|社区征文
可以称得上大数据的基石,Doug cutting 大佬在基于谷歌的三篇论文开发出了 hadoop hdfs 分布式文件存储、MapReduce 计算框架,实际上从 hadoop 开源代码中窥见大数据并没有多么高深的技术难点,大部分实现都是基础的 ... 极大的简化了 MapReduce 分布式程序的门槛,让数据开发人员、数据分析师也能够快速入手,因此 hive 迅速得到了开发者和企业的追捧。随后众多 Hadoop 周边产品开始出现,其中包括:- 专门将关系数据库中的数据导入导...
我的大数据学习总结 |社区征文
# 学习的体系在开始学习大数据时,我参考过许多学习路线的建议,但觉得直接照搬别人的学习顺序未必适合自己。最后结合工作需要和个人经历,我制定了一套适合自己的学习路线:开始学习Linux命令和系统基本概念。然后分... RDD本身是一个不可变的分布式数据集,它支持两类基础操作:转换操作(transformation):转换RDD会产生新的RDD。例如:map、filter、 flatMap 等。行动操作(action):RDD的转换操作是惰性计算的,只有在行动操作时才会真正...

大数据分析入门-相关内容

零门槛完成数据分析 火山引擎VeDI发布旗下BI产品新功能

一般情况下行业数据分析师会在此环节承担大多数取数、统计工作,并将结果性数据反馈给运营。但在实际工作场景中,临时性的数据需求往往会因为包括分析师资源紧张、多需求并线等原因,难以被满足,这时候就需要运营自行按照临时自定义的逻辑,完成数据加工处理的操作。 但即便是借助BI产品,也并非仅靠“傻瓜式”操作就能完成整套工作流程。 首先,在数据提取上,运营必须掌握基础SQL操作,才能从庞杂的数据字段中筛选自己所需...

演讲预告|云原生大数据系列实践分享

支撑了全公司的数据平台、搜索、广告、推荐算法等中台,以及抖音、今日头条、西瓜视频、懂车帝、飞书等众多业务的大数据分析需求,带领团队完成了在离线资源混部、Hadoop 上云等众多项目。目前整体负责火山引擎云原生... 本文会分享字节跳动在 Spark Shuffle 云原生化方面的大规模演进实践。 **讲师简介** :现任字节跳动基础架构工程师,主要负责 Spark 内核开发及字节自研 Cloud Shuffle Service 开发。* **火山引擎** **云...

演讲预告|云原生大数据系列实践分享

支撑了全公司的数据平台、搜索、广告、推荐算法等中台,以及抖音、今日头条、西瓜视频、懂车帝、飞书等众多业务的大数据分析需求,带领团队完成了在离线资源混部、Hadoop 上云等众多项目。目前整体负责火山引擎云原生... 本文会分享字节跳动在 Spark Shuffle 云原生化方面的大规模演进实践。**讲师简介**:现任字节跳动基础架构工程师,主要负责 Spark 内核开发及字节自研 Cloud Shuffle Service 开发。 **火山引擎云原生存储加...

缓存型数据库Redis

1GB 1分片+2节点,高可用架构
24.00/80.00/月
立即购买

短文本语音合成 10千次

多音色、多语言、多情感,享20款免费精品音色
15.00/30.00/年
立即购买

短文本语音合成 30千次

5折限时特惠,享20款免费精品音色
49.00/99.00/年
立即购买

火山引擎——大数据智能平台的构建策略与步骤|社区征文

最后是数据业务开展,需要把数据价值体现到业务上去,也就是数据业务的发展,通过分析人员对数据进行再整理、可视化呈现、洞察后来指导业务开展。而如果从中可以抽象出新的产品,那么通过产品设计来形成创新,创造出新的商业价值。## 1●数据系统建设为了把这个事情说明白,特别是对里面的要点、难点等有一个清晰的呈现,下面采用一个现实中的基础建设的例子来说明。假设我们目前需要在一个靠近大海的地方建设一个新型设备的工厂,...

干货|以 100GB SSB 性能测试为例,通过 ByteHouse 云数仓开启你的数据分析之路

随着数据量级和复杂度的增大,数据分析处理的技术架构也在不断演进。在面对海量数据分析时,传统 OLAP 技术架构中的痛点变得越来越明显,如扩容缩容耗时长,导致资源利用率偏低,成本居高不下;以及运维配置复杂,需要专业的技术人员介入等。 为了解决这类问题,云数仓的概念应运而生。和传统数仓架构不同的是,云原生数仓借助于云平台的基础资源,**实现了资源的动态扩缩容,并最大化利用资源,**从而达到 Pay as you go 按实际...

大数据技术年度总结 | 主赛道

大数据技术已经成为当今社会不可或缺的重要支撑。作为一名从事大数据技术研究的工程师,我深感荣幸能够参与到这个充满挑战和机遇的领域。本文将对我过去一年的工作进行总结,并展望未来的发展趋势。***大数据可视... oneData通过数据可视化,将复杂的数据转化为易于理解和解读的可视化形式,帮助用户更好地理解数据。直观的数据展示可以帮助用户发现数据中的模式、趋势和关联性,支持更深入的数据分析和决策制定。因此,我们可以看到...

智能数据洞察是什么

1. 产品简介 智能数据洞察 DataWind 是一款基于大数据明细级别分析的增强型 DataWind 平台。能够提供万亿级数据、亚秒级查询的计算性能,支持丰富的可视化效果和简易的拖拽式操作,能够融合 AI 技术对数据进行智能洞察。智能数据洞察不仅能帮企业完成数据整合与分析,也是企业发展数据智能决策的有力工具。 2. 产品介绍 DataWind 产品的功能架构可以划分为如下六个层级,自下而上来看: 2.1 数据接入通常 BI 应用的第一步就是要完成数...

LAS Spark+云原生:数据分析全新解决方案

> 更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群随着数据规模的迅速增长和数据处理需求的不断演进,云原生架构和湖仓分析成为了现代数据处理的重要趋势。在这个数字化时代,企业面临着海量数据的挑战和机遇,而构建可扩展、灵活且高效的数据分析平台成为了迫切的需求。文章主要介绍了火山引擎湖仓一体分析服务 LAS(下文以 LAS 指代)基于 Spark 的云原生湖仓分析实践,利用 Spark 的强大功...

企业级数据平台云原生转型之路|社区征文

同时也为了消除数据孤岛问题,那在数据平台技术组件层面作为根基部署完成之后,对于平台来讲,就需要独立的基础架构团队来维护根基的稳定性,包括如下几点: 1. 组件性能优化1. 组件功能扩展1. 权限控制1. 稳定性维护 只有在平台根基比较稳定的前提下,上层才能做更多的事情,那在根基之上,要做哪些事情呢?我们可以想象一下,平时在使用组件开发时会有哪些问题?包括数据采集、数据分析、数据调度、数据管理等等,简单了...

特惠活动

缓存型数据库Redis

1GB 1分片+2节点,高可用架构
24.00/80.00/月
立即购买

短文本语音合成 10千次

多音色、多语言、多情感,享20款免费精品音色
15.00/30.00/年
立即购买

短文本语音合成 30千次

5折限时特惠,享20款免费精品音色
49.00/99.00/年
立即购买

产品体验

体验中心

云服务器特惠

云服务器
云服务器ECS新人特惠
立即抢购

白皮书

数据智能知识图谱
火山引擎数智化平台基于字节跳动数据平台,历时9年,基于多元、丰富场景下的数智实战经验打造而成
立即获取

最新活动

爆款1核2G共享型服务器

首年60元,每月仅需5元,限量秒杀
立即抢购

火山引擎增长体验专区

丰富能力激励企业快速增长
查看详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

一键开启云上增长新空间

立即咨询