We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们
文档
备案
控制台
登录
立即注册
E-MapReduce
AI 时代开源大数据平台,提供丰富的增强型大数据组件,100% 兼容开源,具备极致弹性资源、存算分离架构,覆盖迁移上云、湖仓分析、多模数据处理、AI 应用等场景,加速 AI 业务落地,激发数据价值。
AI时代开源大数据平台,具备极致弹性资源、存算分离架构,覆盖迁移上云、湖仓分析、多模数据处理、AI应用等场景,加速AI业务落地。
10
EB级别
生产实践
1000
万核
集群规模
200
万
日均作业量
立即咨询
立即购买
进入控制台
LLM 客户案例
携手月之暗面,集群降本30%
HOT
帮助文档
快速了解产品使用方法
产品定价
最低仅需0.05元/核/小时
VeDI 学习中心
手把手教你用好数据产品
NEW
产品优势
产品功能
产品架构
产品形态
应用场景
客户案例
使用指南
产品优势
大幅降低成本
40
%+
火山引擎独有内外潮汐机房
存算分离架构,冷热分层
弹性伸缩,多负载混用资源
最新开源框架
开源增强
开放架构、自定义镜像、自由创新
Ray 加速 AI 数据训练
自研加速引擎 Bolt
灵活弹性计算
极致弹性
分钟级弹性伸缩,快速响应
支持负载/时间弹性类型
全托管模式,丰富运维管控能力
专业迁移方案
丝滑快速
为客户定制化整套搬站方案
提供丰富自动化迁移工具和产品
过程可视化监控,确保迁移丝滑
大幅降低成本
40
%+
火山引擎独有内外潮汐机房
存算分离架构,冷热分层
弹性伸缩,多负载混用资源
最新开源框架
开源增强
开放架构、自定义镜像、自由创新
Ray 加速 AI 数据训练
自研加速引擎 Bolt
灵活弹性计算
极致弹性
分钟级弹性伸缩,快速响应
支持负载/时间弹性类型
全托管模式,丰富运维管控能力
专业迁移方案
丝滑快速
为客户定制化整套搬站方案
提供丰富自动化迁移工具和产品
过程可视化监控,确保迁移丝滑
产品功能
开源生态组件
集成大数据全栈组件,完全兼容开源,经字节跳动内部实践持续优化,Spark优化2.5倍+,Presto优化4.8倍+
多模态数据处理
优化Ray、Spark、Lance,异构调度CPU/GPU,适配LAS 构建AI数据湖,支撑数据全流程,实现湖·仓·AI一体化
存算分离架构
存算解耦、按需扩优,资源灵活配比提效;统一数据湖兼容多引擎,Proton加速降本30%+
弹性伸缩能力
依时间/负载策略弹性伸缩(节点/容器/作业级),适配抢占式/VCI等资源,灵活应对波峰波谷,极致降本
超大规模生产实践
单集群10万核+(跨AZ部署),千节点扩容+容灾;EMR Spark日处理10EB级,Ray支撑GPU万卡AI业务
云原生运维
一站式云托管集群/服务等全功能运维管理,配备监控诊断能力,感知异常、降低运维门槛
企业级数据安全
双认证+RBAC+审计日志,加密隔离+细粒度访问控制,协同火山安全体系,提供全方位安全管控
云上生态融合
无缝对接LAS、机器学习平台等火山产品,提供专业高效的一站式体验,全链路支撑多业务场景
开源生态组件
集成大数据全栈组件,完全兼容开源,经字节跳动内部实践持续优化,Spark优化2.5倍+,Presto优化4.8倍+
多模态数据处理
优化Ray、Spark、Lance,异构调度CPU/GPU,适配LAS 构建AI数据湖,支撑数据全流程,实现湖·仓·AI一体化
存算分离架构
存算解耦、按需扩优,资源灵活配比提效;统一数据湖兼容多引擎,Proton加速降本30%+
弹性伸缩能力
依时间/负载策略弹性伸缩(节点/容器/作业级),适配抢占式/VCI等资源,灵活应对波峰波谷,极致降本
超大规模生产实践
单集群10万核+(跨AZ部署),千节点扩容+容灾;EMR Spark日处理10EB级,Ray支撑GPU万卡AI业务
云原生运维
一站式云托管集群/服务等全功能运维管理,配备监控诊断能力,感知异常、降低运维门槛
企业级数据安全
双认证+RBAC+审计日志,加密隔离+细粒度访问控制,协同火山安全体系,提供全方位安全管控
云上生态融合
无缝对接LAS、机器学习平台等火山产品,提供专业高效的一站式体验,全链路支撑多业务场景
展开查看更多
产品架构
产品形态
EMR Serverless
火山引擎EMR提供Spark、Presto、Ray、RSS等全托管服务,完全兼容开源,性能增强3~5倍,具备开箱即用、秒级弹性、免运维、自定义镜像的特性,让用户更专注于业务。
了解更多
EMR on ECS
火山引擎EMR基于ECS的半托管模式,提供更全面的Hadoop、Spark等几十个大数据生态组件,计算存储资源归属用户,可登陆ECS进行自定义操作,具备存算分离、分钟级弹性、灵活自运维的特性。
了解更多
EMR on VKE
火山引擎EMR基于VKE(K8S)的半托管模式,资源引擎从YARN升级为K8S统一调度,满足用户离线、在线、AI等不同Workload的潮汐混部运行,最大程度提升资源利用率,同时具备半托管的灵活性。
了解更多
应用场景
多模态数据处理
离线推理
大数据迁移上云
云原生数据湖仓
离线数据分析
实时数据分析
交互式分析
多模态数据处理
基于 EMR Spark 和 EMR Ray 构建数据处理任务,提升非结构化数据的预处理效率,加速 AI 模型训练,优化资源利用,实现降本增效。
架构优势
异构计算
支持使用 CPU 和 GPU 异构资源,满足各类需求
极致弹性
秒级弹性伸缩,支持多种弹性算力和规则
引擎增强
EMR Ray 在开源基础上支持 Ray 的多种高级特性
立即咨询
推荐相关产品
AI 数据湖服务 LAS
机器学习平台 MLP
对象存储 TOS
架构优势
异构计算
极致弹性
引擎增强
推荐相关产品
AI 数据湖服务 LAS
机器学习平台 MLP
对象存储 TOS
离线推理
基于 EMR Ray、推理框架 vLLM 和开源模型构建离线推理,支持不同模态之间的数据转换,比如从视频中提取音频、把音频转成字幕等。
架构优势
异构计算
支持 CPU/GPU 异构资源,满足多样需求
开源框架
EMR Ray 版本稳定,适配主流框架,自定义镜像
引擎增强
支持 History Server 等多项高级特性
立即咨询
推荐相关产品
AI 数据湖服务 LAS
文件存储 vePFS
对象存储 TOS
架构优势
异构计算
开源框架
引擎增强
推荐相关产品
AI 数据湖服务 LAS
文件存储 vePFS
对象存储 TOS
大数据迁移上云
EMR 具备平迁能力,提供自动化迁移和监控工具,提高效率、降低复杂度,解决开源组件版本滞后、技术栈复杂等问题,快速构建高性能低成本大数据平台。
架构优势
迁移简单快速
多种方案、丰富工具,业务无中断,快速丝滑迁移
完全兼容开源
100%兼容开源生态,组件能力企业级增强、版本常新
技术架构升级
云原生架构升级,实现存算分离、灵活弹性伸缩
立即咨询
推荐相关产品
大数据研发治理套件 DataLeap
全域数据集成 DataSail
对象存储 TOS
架构优势
迁移简单快速
完全兼容开源
技术架构升级
推荐相关产品
大数据研发治理套件 DataLeap
全域数据集成 DataSail
对象存储 TOS
云原生数据湖仓
随着企业发展,数据规模庞大、结构复杂、引擎众多、分析复杂,传统架构难以支撑,EMR 湖仓方案满足低成本、统一存储&管理、多样分析场景等需求。
架构优势
存算分离&冷热分层
存储与计算解耦,数据分层定价,极致提效与降本
多引擎灵活对接
支持实时、离线、交互查询等计算引擎,数据一致
元数据智能管理
统一元数据视图,跨源查询分析,数据自动发现
立即咨询
推荐相关产品
大数据研发治理套件 DataLeap
AI 数据湖服务 LAS
对象存储 TOS
架构优势
存算分离&冷热分层
多引擎灵活对接
元数据智能管理
推荐相关产品
大数据研发治理套件 DataLeap
AI 数据湖服务 LAS
对象存储 TOS
离线数据分析
构建以 Hadoop 为核心的企业级离线数仓,对多种类型数据做采集、清洗、转化,一个平台支持多种计算引擎,满足复杂分析需求,支撑企业智能高效决策。
架构优势
灵活的云上架构
云原生架构,资源弹性伸缩,灵活满足业务需求
增强版开源组件
容开源深度优化,确保高可用、高稳定、高性能
丰富的高阶运维
提供丰富多样的运维工具,自动告警,可视化界面
立即咨询
推荐相关产品
大数据研发治理套件 DataLeap
全域数据集成 DataSail
智能数据洞察 DataWind
架构优势
灵活的云上架构
增强版开源组件
丰富的高阶运维
推荐相关产品
大数据研发治理套件 DataLeap
全域数据集成 DataSail
智能数据洞察 DataWind
实时数据分析
支持数据实时采集和流式处理分析、支撑10万级QPS在线查询分析,达到实时数据展示和动作触发,满足实时性、高并发等需求场景,支撑实时计算及决策。
架构优势
实时计算
支持流式计算引擎,高吞吐、低延时,秒级响应
批流一体
一个平台实现数据集成、计算、分析、应用、存储
实时决策
支持 IoT、车联网、广告、风控、交易等实时业务
立即咨询
推荐相关产品
全域数据集成 DataSail
流式计算 Flink 版
云数据库 MySQL 版
架构优势
实时计算
批流一体
实时决策
推荐相关产品
全域数据集成 DataSail
流式计算 Flink 版
云数据库 MySQL 版
交互式分析
通过对各类业务系统的结构化/非结构化数据进行加工和查询,支撑上层业务灵活且快速地进行数据分析、探索、预测,提高业务决策效率、组织响应速度。
架构优势
极速查询
物化视图加速数据查询,极速调用数据、分析数据
灵活查询
支持SQL语句,灵活支持各类逻辑分析、复杂分析
高效开发
提供集群管理、监控、扩容等能力,专注业务发展
立即咨询
推荐相关产品
全域数据集成 DataSail
大数据研发治理套件 DataLeap
智能数据洞察 DataWind
架构优势
极速查询
灵活查询
高效开发
推荐相关产品
全域数据集成 DataSail
大数据研发治理套件 DataLeap
智能数据洞察 DataWind
多模态数据处理
架构优势
异构计算
极致弹性
引擎增强
推荐相关产品
AI 数据湖服务 LAS
机器学习平台 MLP
对象存储 TOS
离线推理
架构优势
异构计算
开源框架
引擎增强
推荐相关产品
AI 数据湖服务 LAS
文件存储 vePFS
对象存储 TOS
大数据迁移上云
架构优势
迁移简单快速
完全兼容开源
技术架构升级
推荐相关产品
大数据研发治理套件 DataLeap
全域数据集成 DataSail
对象存储 TOS
云原生数据湖仓
架构优势
存算分离&冷热分层
多引擎灵活对接
元数据智能管理
推荐相关产品
大数据研发治理套件 DataLeap
AI 数据湖服务 LAS
对象存储 TOS
离线数据分析
架构优势
灵活的云上架构
增强版开源组件
丰富的高阶运维
推荐相关产品
大数据研发治理套件 DataLeap
全域数据集成 DataSail
智能数据洞察 DataWind
实时数据分析
架构优势
实时计算
批流一体
实时决策
推荐相关产品
全域数据集成 DataSail
流式计算 Flink 版
云数据库 MySQL 版
交互式分析
架构优势
极速查询
灵活查询
高效开发
推荐相关产品
全域数据集成 DataSail
大数据研发治理套件 DataLeap
智能数据洞察 DataWind
客户案例
LLM训练需要处理海量多结构数据,在计算调度与存储上面临极大挑战,通过EMR提供Spark等多种计算框架,实现集群资源共享,提高数据清洗效率,集群成本降低30%,推动Kimi的应用落地以及技术突破。
案例详情
助力沐瞳 AI 大数据业务平滑上云,通过 Serverless Spark、Flink 解决原架构复杂、成本不可控问题,构建自主可控、弹性伸缩的云原生大数据平台,支撑游戏推荐、图计算等业务创新。
立即咨询
EMR助力智己汽车应对智能网联时代海量数据爆发式增长,构建云原生实时大数据平台,实现数据处理秒级响应、资源成本下降,通过数据挖掘推动智驾迭代,打造汽车全链路数智化能力。
立即咨询
EMR为客户定制整套搬站方案,并搭建智驾大数据平台,解决开源组件性能低的问题,让资源成本降低30%、任务执行效率大幅提升,同时构建数据分析体系,支持业务经营决策、模型迭代效果评估,驱动智驾应用与增长。
立即咨询
与EMR合作,将架构升级至云原生实时大数据平台,支撑庞大且高频的数据采集、处理的车联网服务,通过数据挖掘推动智驾快速迭代,打造汽车研发、制造、销售、客户交互等全链路数智化能力,驱动生产优化和业务增长。
立即咨询
针对IDC逐渐暴露算力不足、不稳定等问题,EMR帮助客户平滑迁移上云,搭建存算分离&弹性伸缩大数据架构,实现资源降本30%、运维降本50%,在软件栈上实现5年的技术跨越,支撑成为国内广受欢迎教育平台。
立即咨询
业务极速增长对时效性、运维效率提出更高诉求,客户通过搬站到EMR,实现秒级的时效跃迁,满足实时报表分析需求,性能提升5倍,丰富的组件简化运维工作,实现资源降本50%,支撑广告业务智能分析、快速决策。
立即咨询
月之暗面
沐瞳科技
智己汽车
毫末智行
理想汽车
洋葱学园
创量
LLM训练需要处理海量多结构数据,在计算调度与存储上面临极大挑战,通过EMR提供Spark等多种计算框架,实现集群资源共享,提高数据清洗效率,集群成本降低30%,推动Kimi的应用落地以及技术突破。
案例详情
助力沐瞳 AI 大数据业务平滑上云,通过 Serverless Spark、Flink 解决原架构复杂、成本不可控问题,构建自主可控、弹性伸缩的云原生大数据平台,支撑游戏推荐、图计算等业务创新。
立即咨询
EMR助力智己汽车应对智能网联时代海量数据爆发式增长,构建云原生实时大数据平台,实现数据处理秒级响应、资源成本下降,通过数据挖掘推动智驾迭代,打造汽车全链路数智化能力。
立即咨询
EMR为客户定制整套搬站方案,并搭建智驾大数据平台,解决开源组件性能低的问题,让资源成本降低30%、任务执行效率大幅提升,同时构建数据分析体系,支持业务经营决策、模型迭代效果评估,驱动智驾应用与增长。
立即咨询
与EMR合作,将架构升级至云原生实时大数据平台,支撑庞大且高频的数据采集、处理的车联网服务,通过数据挖掘推动智驾快速迭代,打造汽车研发、制造、销售、客户交互等全链路数智化能力,驱动生产优化和业务增长。
立即咨询
针对IDC逐渐暴露算力不足、不稳定等问题,EMR帮助客户平滑迁移上云,搭建存算分离&弹性伸缩大数据架构,实现资源降本30%、运维降本50%,在软件栈上实现5年的技术跨越,支撑成为国内广受欢迎教育平台。
立即咨询
业务极速增长对时效性、运维效率提出更高诉求,客户通过搬站到EMR,实现秒级的时效跃迁,满足实时报表分析需求,性能提升5倍,丰富的组件简化运维工作,实现资源降本50%,支撑广告业务智能分析、快速决策。
立即咨询
更多合作客户
使用指南
产品计费
灵活变更计费项规格,按需调整资源计费方式
计费说明
计费方式:按量付费
计费方式:包年包月
按量付费转包年包月
CPU 计算资源
GPU 计算资源
欠费说明
到期说明
退订和续费
快速入门
准备工作
创建资源队列
提交作业
用户指南
EMR Serverless 队列
EMR Serverless 实例(OLAP)
服务开发
迁移指南
迁移指南说明
成本评估优化
数据迁移
最佳实践
EMR 数据湖集群资源规划
基于 EMR Serverless Ray 的音频数据预处理
基于 StarRocks 的准实时数据分析
存算分离最佳实践
一键启动火山引擎之旅
联系我们