You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们
E-MapReduce
云原生开源大数据平台,提供企业级的 Hadoop、Spark、Flink、Hive、Presto、Kafka、Doris、StarRocks、Hudi、Iceberg 等大数据生态组件,100%开源兼容,快速构建企业级大数据平台,降低运维门槛
云原生开源大数据平台,提供企业级的 Hadoop、Spark、Flink、Hive、Presto、Kafka、Doris、StarRocks、Hudi、Iceberg 等大数据生态组件,100%开源兼容,快速构建企业级大数据平台,降低运维门槛
管理控制台
产品咨询
帮助文档
快速了解产品使用方法
产品定价
按量付费仅需 0.02 元/核/小时
客户动态
Hot
途牛:打造大数据降本新范式
产品动态
New
EMR StarRocks 集群正式上线
重点功能
Stateless 云原生开源大数据平台
开源生态组件

集成Hadoop、Spark、Flink、Hive、Presto、Kafka、Hudi、Iceberg、Doris、StarRocks等组件,100%开源兼容,并基于字节内部实践持续深度优化

云原生运维

一站式云托管,提供集群管理、服务管理、用户管理、监控告警、日志查询等能力;支持服务监控指标体系,感知集群组件及任务的运行异常状况

存算分离架构

采用先进的Stateless架构,将EMR状态服务和数据外置,使长运行集群变为轻量级瞬态集群,实现性能和使用成本的深度优化

弹性伸缩策略

支持基于时间规则和集群负载两种弹性伸缩策略,并可搭配使用;配合Stateless存算分离架构,实现更为灵活的集群弹性粒度,成本更优

企业级安全

支持Kerberos和lAM两种强认证模式、RBAC模式、审计日志与访问审计等,安全管控服务支持高可用,协同火山引擎安全体系,实现全方位安全管控

支持云上生态

无缝对接火山引擎大数据研发治理套件DataLeap以及相关各类云上产品,提供云上一站式产品体验

重点功能
Stateless 云原生开源大数据平台
开源生态组件

集成Hadoop、Spark、Flink、Hive、Presto、Kafka、Hudi、Iceberg、Doris、StarRocks等组件,100%开源兼容,并基于字节内部实践持续深度优化

云原生运维

一站式云托管,提供集群管理、服务管理、用户管理、监控告警、日志查询等能力;支持服务监控指标体系,感知集群组件及任务的运行异常状况

存算分离架构

采用先进的Stateless架构,将EMR状态服务和数据外置,使长运行集群变为轻量级瞬态集群,实现性能和使用成本的深度优化

弹性伸缩策略

支持基于时间规则和集群负载两种弹性伸缩策略,并可搭配使用;配合Stateless存算分离架构,实现更为灵活的集群弹性粒度,成本更优

企业级安全

支持Kerberos和lAM两种强认证模式、RBAC模式、审计日志与访问审计等,安全管控服务支持高可用,协同火山引擎安全体系,实现全方位安全管控

支持云上生态

无缝对接火山引擎大数据研发治理套件DataLeap以及相关各类云上产品,提供云上一站式产品体验

产品架构
云原生湖仓一体功能架构
点击查看完整架构
产品架构
云原生湖仓一体功能架构
核心优势
重新定义云原生开源大数据平台
开源 & 开放
• 100%兼容社区主流版本,满足应用开发需求,便于平台整体迁移
• 提供半托管的白盒环境,支持引导操作与集群脚本等开放能力
Stateless云原生湖仓
• 无状态集群交付,优雅的存算分离架构,最大程度降本提效
• 灵活的弹性伸缩策略,支持按时间规则与集群负载两种模式
• 开放湖仓架构,灵活满足各类数据平台建设需求
引擎企业级优化
• Spark、Flink、Presto、Trino、Hudi、Iceberg、Doris、StarRocks 等核心引擎性能提升
• 企业级权限管理,火山引擎IAM+Kerberos认证
云上便捷运维
• 一站式云托管,分钟级创建/销毁集群,提供两种计费模式
• 精细化的集群运维与监控告警能力,支持丰富的组件操作
开源 & 开放
• 100%兼容社区主流版本,满足应用开发需求,便于平台整体迁移
• 提供半托管的白盒环境,支持引导操作与集群脚本等开放能力
Stateless云原生湖仓
• 无状态集群交付,优雅的存算分离架构,最大程度降本提效
• 灵活的弹性伸缩策略,支持按时间规则与集群负载两种模式
• 开放湖仓架构,灵活满足各类数据平台建设需求
引擎企业级优化
• Spark、Flink、Presto、Trino、Hudi、Iceberg、Doris、StarRocks 等核心引擎性能提升
• 企业级权限管理,火山引擎IAM+Kerberos认证
云上便捷运维
• 一站式云托管,分钟级创建/销毁集群,提供两种计费模式
• 精细化的集群运维与监控告警能力,支持丰富的组件操作
应用场景
支持多场景云上数据平台建设需求
云原生数据湖仓
开源兼容,支持平滑迁移和长期演进;提供企业级组件优化和管控能力,帮助企业开发运维降本增效。
离线/批量数据分析
对多种类型数据进行采集/导入/清洗转换,满足业务分析模型需求,支撑企业基于统一数据进行分析决策。
实时/流式计算
面向IoT、实时风控/预警等业务需求,支持数据实时采集接入和处理分析,实现实时数据展示或动作触发。
实时数仓
针对实时性、高并发等需求场景,基于EMR Doris / StarRocks搭建实时数仓并提供服务,支持十万级QPS在线/离线查询分析。
应用场景
支持多场景云上数据平台建设需求
云原生数据湖仓
开源兼容,支持平滑迁移和长期演进;提供企业级组件优化和管控能力,帮助企业开发运维降本增效。
离线/批量数据分析
对多种类型数据进行采集/导入/清洗转换,满足业务分析模型需求,支撑企业基于统一数据进行分析决策。
实时/流式计算
面向IoT、实时风控/预警等业务需求,支持数据实时采集接入和处理分析,实现实时数据展示或动作触发。
实时数仓
针对实时性、高并发等需求场景,基于EMR Doris / StarRocks搭建实时数仓并提供服务,支持十万级QPS在线/离线查询分析。
产品动态
功能发布记录
2024年3月
平台功能更新
弹性伸缩支持预约式弹性实例(ESI);支持外部创建的KDC进行身份管理和认证;新增软件栈v3.9.0:新增Paimon组件等。
2024年1月
平台功能更新
StarRocks独立集群支持按时间弹性伸缩;按量付费集群支持停机节省模式;云监控上线预置告警模板,一键应用;新增软件栈v3.8.0。
2023年12月
平台功能更新
支持创建StarRocks存算分离集群;支持抢占式实例(SPOT);新增软件栈v3.7.0:升级Doris、StarRocks、Trino等组件。
2023年10月
平台功能更新
新增Kerberos集群能力,适配Hadoop、Kafka、HBase、Flink;新增适配GPU机型,满足AI计算场景;支持Tez Web UI。
2023年10月
平台功能更新
StarRocks集群支持Task节点;Hadoop集群支持多个Core节点组;新增ECS第三代AMD芯片实例 g3a、c3a、r3a;新增软件栈v3.5.0。
2023年8月
新增 Region
新增亚太东南(柔佛)Region,支持出海客户需求,功能与国内其他Region对齐。截止目前,EMR已上线火山引擎全部Region。
2023年7月
软件栈更新
新增软件栈 v3.4.0:新增Kyuubi组件;Iceberg、StarRocks、Hive、Presto、Trino、DolphinScheduler等升级。
2023年7月
软件栈更新
新增软件栈 v2.3.0:新增Phoenix组件;Iceberg、Presto、Trino、Flink、DolphinScheduler等升级。
2023年7月
平台功能更新
Hadoop集群新增ECS三代AMD实例,较上一代价格降低15~20%;Hadoop集群新增ECS三代Intel实例,较上一代性能大幅提升。
2023年6月
平台功能更新
DataLeap支持关联EMR Doris/StarRocks集群,进行元数据管理、数据开发任务调度、临时查询等。
2023年3月
软件栈更新
新增软件栈 v3.2.1:Kafka、Hudi、Flink、Doris等组件版本升级;HBase集群集成MapReduce2和YARN组件。
2023年3月
软件栈更新
新增软件栈 v2.2.0:HBase独立集群集成Knox、YARN、MapReduce2等组件;Flink引擎支持avro,csv等更多格式。
2023年3月
平台功能更新
多项DataLeap&DataSail协同功能发布;弹性伸缩性能优化,时长进一步缩短;多项监控管理功能发布。
2023年2月
软件栈更新
新增软件栈v3.1.1:发布StarRocks独立集群,新增Phoenix组件;新增软件栈v2.1.1:多个核心组件接入告警管理。
2023年2月
平台功能更新
Presto,Trino集群接入Public History Server服务,支持集群释放后查询作业日志;包年包月集群支持退订。
2022年12月
软件栈更新
新增软件栈v3.1.0:发布ClickHouse独立集群;新增软件栈v2.1.0:发布Hadoop 2.10.0集群。
2022年12月
平台功能更新
发布Public History Server功能,支持历史集群日志回放;支持集群名称修改;新增EMR Python SDK。
2022年11月
功能发布
支持EMR Flume读写TOS、CloudFS;新增软件栈v3.0.1;新增软件栈v2.0.1。
2022年10月
功能发布
Hadoop集群支持按时间弹性伸缩;支持计算存储分离架构;支持包年包月购买方式。
2022年10月
功能发布
新增软件栈v3.0.0,采用Hadoop3.x,支持数据格式Delta Lake;新增软件栈v2.0.0,采用Hadoop2.x,降低用户迁移成本。
2022年10月
新增Region
新增华东2(上海)Region
2022年8月
功能发布
发布软件栈 v1.3.1,支持 Flink 写入 ByteHouse(云数仓版);支持按量付费 Task 节点缩容。
2022年7月
新增 Region
新增华南1(广州)Region;新增华北2(北京)Region。
2022年7月
功能发布
发布软件栈 v1.3.0,新增 Pulsar 集群类型;支持存算分离架构,Spark、Flink、Presto、Trino 读写 CloudFS 和 TOS。
2022年6月
正式商业化
功能发布
支持弹性块存储,极速型 SSD FlexPL。
2022年5月
功能发布
发布软件栈 v1.2.1,新增 Doris 集群类型,支持 Presto 和 Trino Coordinator 服务高可用。
2022年4月
功能发布
发布软件栈 v1.2.0,新增 Presto、Trino、HBase、Tensorflow、OpenSearch 集群类型;支持 OpenAPI。
2022年2月
启动公测
功能发布
发布软件栈 v1.1.1;支持包年包月付费类型。
2021年12月
功能发布
发布软件栈 v1.1.0;新增 Kafka、Flink 集群类型;新增服务监控模块,支持对组件指标的监控;新增日志管理模块,支持进行操作审计。
2021年9月
启动邀测
功能发布
发布软件栈 v1.0.0;支持创建 Hadoop 集群;支持 IAM 用户管理;支持对接大数据研发治理套件 DataLeap。
展开查看更多
接入流程
便捷的接入流程
01.|服务开通
02.|创建集群
03.|管理集群
04.|创建并运行作业
点击官网右上角“管理控制台”进入到 EMR 服务的开通申请页,提交信息并审核完成后可开通 EMR 服务
在 EMR 控制台中,根据分析场景创建所需的集群类型
通过集群管理界面对集群进行管理、监控和维护操作
通过 EMR 内置开源组件 Hue 或大数据研发治理套件 DataLeap 创建并提交作业
接入流程
便捷的接入流程
Step.01|服务开通
点击官网右上角“管理控制台”进入到 EMR 服务的开通申请页,提交信息并审核完成后可开通 EMR 服务
Step.02|创建集群
在 EMR 控制台中,根据分析场景创建所需的集群类型
Step.03|管理集群
通过集群管理界面对集群进行管理、监控和维护操作
Step.04|创建并运行作业
通过 EMR 内置开源组件 Hue 或大数据研发治理套件 DataLeap 创建并提交作业
一键启动火山引擎之旅
联系我们