You need to enable JavaScript to run this app.
导航

什么是EMR

最近更新时间2023.06.27 17:00:24

首次发布时间2021.09.01 17:27:33

产品定义

火山引擎E-MapReduce(简称“EMR”)是开源Hadoop生态的企业级大数据分析系统,完全兼容开源,提供Hadoop、Spark、Flink、Hive、Presto、Kafka、Doris、StarRocks、ClickHouse、Hudi、Iceberg等生态组件集成和管理,支持海量数据的存储、查询和分析,可弹性伸缩,按需使用,更低成本,可与数据开发治理套件等其他产品能力结合,提供端到端的数据接入/分析/挖掘能力,帮助用户轻松完成企业大数据平台的构建和数据上云,降低运维门槛,加速数据洞察和业务决策。
   
EMR与自建Hadoop优势对比如下,EMR提供了集群一键化创建和管理解决方案,例如主机选型、集群搭建、集群配置、运行监控、参数配置、作业运行、集群监控告警等。通过EMR可以从繁重的集群相关设备采购、软件安装部署和测试、集群管理和维护等工作中解放出来,专注数据应用开发。

对比维度火山引擎EMR自建Hadoop集群
成本低成本,可按需购买(包年包月/按量付费),支持集群资源灵活调整,无需支付额外License费用固定资源,资源使用率低,发行版需支付License费用
易用分钟级别完成环境部署和安装,灵活调整集群资源静态固定的集群资源,需自行配套各组件,部署周期长
稳定100%兼容开源社区版本,加持企业级优化和长时间的兼容性和稳定性测试自行保证兼容性和稳定性,业务上线前需要较长时间验证测试
弹性按需创建与销毁集群,支持按规则与集群负载自动进行集群的存储和计算资源动态调整无自动弹性能力,运维人员根据集群压力判断是否需要扩缩容
安全基于火山生态企业级数据安全、鉴权解决方案,支持细粒度的权限控制,支持RBAC模式开源社区数据安全方案,能力不完善,无法满足生产
性能按集群规格默认经过参数调优,对核心组件进行特性级性能优化开源版本,自行性能调优,难度较大
生态开源生态与火山引擎生态打通,基于ECS、TOS等特性的性能和功能优化,无缝对接DataLeap等数据产品社区开源生态,无云上多产品组合使用的丝滑体验
服务专业的大数据专家服务和售后维护支持需要组建大数据维护团队,解决问题难度大