You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

E-MapReduce

AI 时代开源大数据平台,提供丰富的增强型大数据组件,100% 兼容开源,具备极致弹性资源、存算分离架构,覆盖迁移上云、湖仓分析、多模数据处理、AI 应用等场景,加速 AI 业务落地,激发数据价值。
AI时代开源大数据平台,具备极致弹性资源、存算分离架构,覆盖迁移上云、湖仓分析、多模数据处理、AI应用等场景,加速AI业务落地。
10EB级别
生产实践
1000万核
集群规模
200
日均作业量
产品优势
产品功能
产品架构
产品形态
应用场景
客户案例
使用指南

产品优势

大幅降低成本
40%+

火山引擎独有内外潮汐机房
存算分离架构,冷热分层
弹性伸缩,多负载混用资源
最新开源框架
开源增强

开放架构、自定义镜像、自由创新
Ray 加速 AI 数据训练
自研加速引擎 Bolt
灵活弹性计算
极致弹性

分钟级弹性伸缩,快速响应
支持负载/时间弹性类型
全托管模式,丰富运维管控能力
专业迁移方案
丝滑快速

为客户定制化整套搬站方案
提供丰富自动化迁移工具和产品
过程可视化监控,确保迁移丝滑
大幅降低成本
40%+

火山引擎独有内外潮汐机房
存算分离架构,冷热分层
弹性伸缩,多负载混用资源
最新开源框架
开源增强

开放架构、自定义镜像、自由创新
Ray 加速 AI 数据训练
自研加速引擎 Bolt
灵活弹性计算
极致弹性

分钟级弹性伸缩,快速响应
支持负载/时间弹性类型
全托管模式,丰富运维管控能力
专业迁移方案
丝滑快速

为客户定制化整套搬站方案
提供丰富自动化迁移工具和产品
过程可视化监控,确保迁移丝滑

产品功能

开源生态组件

开源生态组件

集成大数据全栈组件,完全兼容开源,经字节跳动内部实践持续优化,Spark优化2.5倍+,Presto优化4.8倍+
多模态数据处理

多模态数据处理

优化Ray、Spark、Lance,异构调度CPU/GPU,适配LAS 构建AI数据湖,支撑数据全流程,实现湖·仓·AI一体化
存算分离架构

存算分离架构

存算解耦、按需扩优,资源灵活配比提效;统一数据湖兼容多引擎,Proton加速降本30%+
弹性伸缩能力

弹性伸缩能力

依时间/负载策略弹性伸缩(节点/容器/作业级),适配抢占式/VCI等资源,灵活应对波峰波谷,极致降本
超大规模生产实践

超大规模生产实践

单集群10万核+(跨AZ部署),千节点扩容+容灾;EMR Spark日处理10EB级,Ray支撑GPU万卡AI业务
云原生运维

云原生运维

一站式云托管集群/服务等全功能运维管理,配备监控诊断能力,感知异常、降低运维门槛
企业级数据安全

企业级数据安全

双认证+RBAC+审计日志,加密隔离+细粒度访问控制,协同火山安全体系,提供全方位安全管控
云上生态融合

云上生态融合

无缝对接LAS、机器学习平台等火山产品,提供专业高效的一站式体验,全链路支撑多业务场景
开源生态组件

开源生态组件

集成大数据全栈组件,完全兼容开源,经字节跳动内部实践持续优化,Spark优化2.5倍+,Presto优化4.8倍+
多模态数据处理

多模态数据处理

优化Ray、Spark、Lance,异构调度CPU/GPU,适配LAS 构建AI数据湖,支撑数据全流程,实现湖·仓·AI一体化
存算分离架构

存算分离架构

存算解耦、按需扩优,资源灵活配比提效;统一数据湖兼容多引擎,Proton加速降本30%+
弹性伸缩能力

弹性伸缩能力

依时间/负载策略弹性伸缩(节点/容器/作业级),适配抢占式/VCI等资源,灵活应对波峰波谷,极致降本
超大规模生产实践

超大规模生产实践

单集群10万核+(跨AZ部署),千节点扩容+容灾;EMR Spark日处理10EB级,Ray支撑GPU万卡AI业务
云原生运维

云原生运维

一站式云托管集群/服务等全功能运维管理,配备监控诊断能力,感知异常、降低运维门槛
企业级数据安全

企业级数据安全

双认证+RBAC+审计日志,加密隔离+细粒度访问控制,协同火山安全体系,提供全方位安全管控
云上生态融合

云上生态融合

无缝对接LAS、机器学习平台等火山产品,提供专业高效的一站式体验,全链路支撑多业务场景
展开查看更多

产品架构

架构图
架构图
架构图

产品形态

EMR Serverless

火山引擎EMR提供Spark、Presto、Ray、RSS等全托管服务,完全兼容开源,性能增强3~5倍,具备开箱即用、秒级弹性、免运维、自定义镜像的特性,让用户更专注于业务。
了解更多

EMR on ECS

火山引擎EMR基于ECS的半托管模式,提供更全面的Hadoop、Spark等几十个大数据生态组件,计算存储资源归属用户,可登陆ECS进行自定义操作,具备存算分离、分钟级弹性、灵活自运维的特性。
了解更多

EMR on VKE

火山引擎EMR基于VKE(K8S)的半托管模式,资源引擎从YARN升级为K8S统一调度,满足用户离线、在线、AI等不同Workload的潮汐混部运行,最大程度提升资源利用率,同时具备半托管的灵活性。
了解更多

应用场景

多模态数据处理

离线推理

大数据迁移上云

云原生数据湖仓

离线数据分析

实时数据分析

交互式分析

多模态数据处理
多模态数据处理
基于 EMR Spark 和 EMR Ray 构建数据处理任务,提升非结构化数据的预处理效率,加速 AI 模型训练,优化资源利用,实现降本增效。

架构优势

异构计算
支持使用 CPU 和 GPU 异构资源,满足各类需求
极致弹性
秒级弹性伸缩,支持多种弹性算力和规则
引擎增强
EMR Ray 在开源基础上支持 Ray 的多种高级特性

推荐相关产品

多模态数据处理

架构优势

异构计算
极致弹性
引擎增强
离线推理
离线推理
基于 EMR Ray、推理框架 vLLM 和开源模型构建离线推理,支持不同模态之间的数据转换,比如从视频中提取音频、把音频转成字幕等。

架构优势

异构计算
支持 CPU/GPU 异构资源,满足多样需求
开源框架
EMR Ray 版本稳定,适配主流框架,自定义镜像
引擎增强
支持 History Server 等多项高级特性

推荐相关产品

离线推理

架构优势

异构计算
开源框架
引擎增强
大数据迁移上云
大数据迁移上云
EMR 具备平迁能力,提供自动化迁移和监控工具,提高效率、降低复杂度,解决开源组件版本滞后、技术栈复杂等问题,快速构建高性能低成本大数据平台。

架构优势

迁移简单快速
多种方案、丰富工具,业务无中断,快速丝滑迁移
完全兼容开源
100%兼容开源生态,组件能力企业级增强、版本常新
技术架构升级
云原生架构升级,实现存算分离、灵活弹性伸缩

推荐相关产品

大数据迁移上云

架构优势

迁移简单快速
完全兼容开源
技术架构升级
云原生数据湖仓
云原生数据湖仓
随着企业发展,数据规模庞大、结构复杂、引擎众多、分析复杂,传统架构难以支撑,EMR 湖仓方案满足低成本、统一存储&管理、多样分析场景等需求。

架构优势

存算分离&冷热分层
存储与计算解耦,数据分层定价,极致提效与降本
多引擎灵活对接
支持实时、离线、交互查询等计算引擎,数据一致
元数据智能管理
统一元数据视图,跨源查询分析,数据自动发现

推荐相关产品

云原生数据湖仓

架构优势

存算分离&冷热分层
多引擎灵活对接
元数据智能管理
离线数据分析
离线数据分析
构建以 Hadoop 为核心的企业级离线数仓,对多种类型数据做采集、清洗、转化,一个平台支持多种计算引擎,满足复杂分析需求,支撑企业智能高效决策。

架构优势

灵活的云上架构
云原生架构,资源弹性伸缩,灵活满足业务需求
增强版开源组件
容开源深度优化,确保高可用、高稳定、高性能
丰富的高阶运维
提供丰富多样的运维工具,自动告警,可视化界面

推荐相关产品

离线数据分析

架构优势

灵活的云上架构
增强版开源组件
丰富的高阶运维
实时数据分析
实时数据分析
支持数据实时采集和流式处理分析、支撑10万级QPS在线查询分析,达到实时数据展示和动作触发,满足实时性、高并发等需求场景,支撑实时计算及决策。

架构优势

实时计算
支持流式计算引擎,高吞吐、低延时,秒级响应
批流一体
一个平台实现数据集成、计算、分析、应用、存储
实时决策
支持 IoT、车联网、广告、风控、交易等实时业务

推荐相关产品

实时数据分析

架构优势

实时计算
批流一体
实时决策
交互式分析
交互式分析
通过对各类业务系统的结构化/非结构化数据进行加工和查询,支撑上层业务灵活且快速地进行数据分析、探索、预测,提高业务决策效率、组织响应速度。

架构优势

极速查询
物化视图加速数据查询,极速调用数据、分析数据
灵活查询
支持SQL语句,灵活支持各类逻辑分析、复杂分析
高效开发
提供集群管理、监控、扩容等能力,专注业务发展

推荐相关产品

交互式分析

架构优势

极速查询
灵活查询
高效开发

多模态数据处理

多模态数据处理

架构优势

异构计算
极致弹性
引擎增强
离线推理

架构优势

异构计算
开源框架
引擎增强
大数据迁移上云

架构优势

迁移简单快速
完全兼容开源
技术架构升级
云原生数据湖仓

架构优势

存算分离&冷热分层
多引擎灵活对接
元数据智能管理
离线数据分析

架构优势

灵活的云上架构
增强版开源组件
丰富的高阶运维
实时数据分析

架构优势

实时计算
批流一体
实时决策
交互式分析

架构优势

极速查询
灵活查询
高效开发

客户案例

月之暗面
LLM训练需要处理海量多结构数据,在计算调度与存储上面临极大挑战,通过EMR提供Spark等多种计算框架,实现集群资源共享,提高数据清洗效率,集群成本降低30%,推动Kimi的应用落地以及技术突破。
月之暗面
沐瞳科技
助力沐瞳 AI 大数据业务平滑上云,通过 Serverless Spark、Flink 解决原架构复杂、成本不可控问题,构建自主可控、弹性伸缩的云原生大数据平台,支撑游戏推荐、图计算等业务创新。
沐瞳科技
智己汽车
EMR助力智己汽车应对智能网联时代海量数据爆发式增长,构建云原生实时大数据平台,实现数据处理秒级响应、资源成本下降,通过数据挖掘推动智驾迭代,打造汽车全链路数智化能力。
智己汽车
毫末智行
EMR为客户定制整套搬站方案,并搭建智驾大数据平台,解决开源组件性能低的问题,让资源成本降低30%、任务执行效率大幅提升,同时构建数据分析体系,支持业务经营决策、模型迭代效果评估,驱动智驾应用与增长。
毫末智行
理想汽车
与EMR合作,将架构升级至云原生实时大数据平台,支撑庞大且高频的数据采集、处理的车联网服务,通过数据挖掘推动智驾快速迭代,打造汽车研发、制造、销售、客户交互等全链路数智化能力,驱动生产优化和业务增长。
理想汽车
洋葱学园
针对IDC逐渐暴露算力不足、不稳定等问题,EMR帮助客户平滑迁移上云,搭建存算分离&弹性伸缩大数据架构,实现资源降本30%、运维降本50%,在软件栈上实现5年的技术跨越,支撑成为国内广受欢迎教育平台。
洋葱学园
创量
业务极速增长对时效性、运维效率提出更高诉求,客户通过搬站到EMR,实现秒级的时效跃迁,满足实时报表分析需求,性能提升5倍,丰富的组件简化运维工作,实现资源降本50%,支撑广告业务智能分析、快速决策。
创量
月之暗面沐瞳科技智己汽车毫末智行理想汽车洋葱学园创量

更多合作客户

Momenta
智谱华章
月之暗面
旺脉
沐瞳
山西鹏景
视客网
洋葱学园
下厨房
极氪
长城汽车
汇付天下
一键启动火山引擎之旅
联系我们