云数据仓库
企业在高速发展的业务驱动下构建数据仓库,能够帮助企业敏捷迭代,通过开源系统与旧系统低成本适配,打破数据孤岛,满足海量数据处理场景。
帮助企业更好地了解业务运行情况,发现问题和优化机会,从而提高运营效率和决策质量,例如:网络安全分析、应用性能分析、业务分析、市场营销分析等。
支持电商/金融/汽车/游戏等行业,挖掘数据资产,发挥数据价值,帮助企业提升运营效率、决策质量、精准服务、客户满意度,同时大大降低运营成本。
混合云是指同时采用公有云和私有云来部署应用程序和数据平台的架构,这种架构允许企业根据发展阶段和特定的业务形态来管理集群水位,在业务高峰期将负载路由到公有云来实现灵活扩展和按需支付IT费用。
通过这种架构升级,不但实现了灵活的资源分配和扩展,还能保证敏感数据和关键工作负载控制在私有云中,帮助企业降低私有基础设施的规模和成本,并且巧妙的实现了IT的高可用和灾难恢复能力。
客户是中国领先的在线教育科技公司,数据中台部门致力于构建一个统一的数据服务平台,在IDC内有超过1万核机器提供数据服务。随着新兴业务的兴起和海外业务的发展,数据平台的计算资源在每天早上9点到11点期间严重超水位运行,任务排队积压情况严重。在2023年底到2024年Q1,客户与火山EMR团队紧密合作,经过调研、适配、试运行、正式运行等几个阶段的落地实施,目前已经顺利上线,预计到4月底,客户每日提交到云上的算力峰值为2000核,每日使用弹性算力的时间超过8个小时,极大的缩短了客户IDC的建设周期,提高了平台稳定性,降低算力成本。
在大数据技术高速迭代的当下,SQL 凭借其通用性与易用性,始终是大规模数据处理与分析的核心工具。而在大数据 SQL 生态中,Hive 作为经典技术底座,通过类 SQL 的 HiveQL 接口,让用户无需深入理解分布式计算细节,即可对 HDFS 及兼容存储系统中的海量数据进行汇总、即席查询与离线分析,至今仍是企业构建数据仓库的重要基石。
然而,当数据规模突破 TB 甚至达到 PB 级,且业务对查询响应速度提出 “实时化”“交互式” 需求时,传统 Hive 的批处理模式已难以满足。正是基于这一痛点,Presto作为专为大数据实时查询优化的 SQL 引擎应运而生,通过技术创新在保留 SQL 易用性的同时,实现了大规模数据的高效分析,成为实时 SQL 场景的核心选择。
StarRocks/Doris 能够使用一套系统解决多维分析、高并发查询、预计算、实时分析查询等场景,降低系统复杂度和多技术栈开发与维护成本。StarRocks/Doris 采用 MPP(大规模并行处理)架构,能够充分利用所有节点资源,显著提升查询性能。
实时数仓对数据实时性、数据服务(data serving)、并发量等有较高要求,离线分析系统无法满足这类需求。StarRocks 支持实时数据更新与删除,适用于需频繁更新数据的场景:
企业可基于 EMR Doris/StarRocks 构建实时数仓。数据入仓后,经过流式计算,明细数据进入 Doris/StarRocks 集群 ODS层,数据聚合计算后进入 DWS 层,数据指标经计算后存入 ADS 层。数据支撑在线更新。由 Doris/StarRocks 对数据应用层提供服务,支持在线、离线查询分析,支持几十万级 QPS。
StarRocks 是一款高性能的分析型数据库,专为 OLAP(在线分析处理)查询设计,它能够与多种 BI(商业智能)工具集成,这意味着可以将 StarRocks 作为数据源,直接在这些工具中进行数据查询和分析。这种集成能力使得企业能够利用 StarRocks 的强大分析能力,结合 BI 工具的可视化和报告功能,更有效地洞察数据,做出决策。
StarRocks 支持标准的 SQL 接口,这使得它能够轻松地与各种 BI 工具连接,如 Tableau、Power BI、Looker 等。这些工具通常提供图形界面,让用户能够通过拖放的方式构建复杂的查询和仪表板,而无需编写复杂的 SQL 代码。StarRocks 的高性能查询引擎确保了即使在处理大规模数据集时,BI 工具也能快速响应用户的查询请求,提供实时的数据分析结果。StarRocks 的兼容性不仅限于传统的 BI 工具,它还支持与现代的、基于云的 BI 平台集成,如火山引擎智能数据洞察平台ABI等。这种广泛的兼容性使得 StarRocks 能够适应不同的业务场景和技术栈,为用户提供灵活的数据访问和分析选项。
借助StarRocks 与多种 BI 工具标准化集成的能力,能够支持企业用户的数据分析平台场景,使得管理决策及数据分析人员可以更直观、更快速地从数据中提取价值,支持业务决策。