EMR Serverless Spark 是 EMR 公有云产品框架下 Serverless 形态的数据产品,提供开箱即用,完全兼容开源的Spark 引擎能力。通过 LAS Foramtion 提供统一元数据服务和数据权限服务,内置高可用 Remote shuffle Service,支持直接读写火山对象存储系统 TOS。
开箱即用,0 门槛开启数据分析,无需构建集群、配置参数、运维保障,会 SQL 就能上手,确保客户聚焦业务需求本身。
基于社区最新稳定版本 Spark 提供服务,完全兼容开源语法/执行方式,字节内部优化特性加持,性能远超开源 2.7+ 倍;提供多种资源形式,支持SQL作业加速,通过 Native Engine 实现执行加速。
通过独立服务 LAS Formation 提供统一元数据服务和权限管控服务,实现跨源查询分析能力,支持多种开放湖仓格式。
内置高可用服务级别Remote Shuffle Service,根据计算需求随时使用高性能存储服务,提高作业执行效率,降低综合成本。
基于自研资源调度系统,支持大规模安全容器(增强 Kubernetes)的秒级别调度编排能力,具备超大规模存储和连接资源的极致弹性扩展能力,实现作业级弹性,自适应业务动态变化的跨云运算需求。
提供企业级多租户隔离能力,数据隔离和资源隔离。
EMR 产品生态,提供平台级别的资源管控、作业管理、日志分析等能力,通过统一元数据实现半托管全托管集群的数据互通,满足企业丰富的资源交付需要。