文档中心
文档
备案
控制台
登录
立即注册
导航
E-MapReduce
搜索目录或文档标题
搜索目录或文档标题
EMR on ECS
产品动态
功能发布记录
产品公告
【调价】开源大数据平台 E-MapReduce 刊例价与退订规则调整
【调价】开源大数据平台E-MapReduce部分地域刊例价调整
【调价】开源大数据平台E-MapReduce刊例价调整
【调价】开源大数据平台E-MapReduce部分地域刊例价调整
产品简介
什么是EMR
产品架构
应用场景
产品优势
使用限制
EMR使用限制
开源组件使用限制
基本概念
发行版本
版本概述
版本说明
EMR 3.x版本
EMR-3.11.0发布说明
EMR-3.10.0版本说明
EMR-3.9.0版本说明
EMR-3.8.0 版本说明
EMR-3.7.0 版本说明
EMR-3.6.X 版本说明
EMR-3.6.2 版本说明
EMR-3.6.1 版本说明
EMR-3.6.0 版本说明
EMR-3.5.X 版本说明
EMR-3.5.4 版本说明
EMR-3.5.3 版本说明
EMR-3.5.2 版本说明
EMR-3.5.1 版本说明
EMR-3.5.0 版本说明
EMR-3.4.X 版本
EMR 3.4.11 版本说明
EMR 3.4.10 版本说明
EMR-3.4.9 版本说明
EMR-3.4.8 版本说明
EMR-3.4.7 版本说明
EMR-3.4.6 版本说明
EMR-3.4.4 版本说明
EMR-3.4.3 版本说明
ERM-3.4.2 版本说明
EMR-3.4.0 版本说明
EMR-3.3.0 版本说明
EMR-3.2.1 版本说明
EMR-3.1.1 版本说明
EMR-3.1.0版本说明
EMR-3.0.1版本说明
EMR-3.0.0版本说明
EMR 2.x版本
EMR-2.5.0 版本说明
EMR-2.4.0 版本说明
EMR-2.3.X 版本
EMR-2.3.2 版本说明
EMR-2.3.1 版本说明
EMR-2.3.0 版本说明
EMR-2.2.0 版本说明
EMR-2.1.1 版本说明
EMR-2.1.0版本说明
EMR-2.0.1版本说明
EMR-2.0.0版本说明
EMR 1.x版本
EMR 1.3.x版本
EMR 1.3.1版本说明
EMR 1.3.0版本说明
EMR 1.2.x版本
EMR 1.2.x版本中的应用程序版本
EMR 1.2.1版本说明
EMR 1.2.0版本说明
EMR 1.1.x版本
EMR 1.1.x版本中的应用程序版本
EMR 1.1.1版本说明
EMR 1.1.0版本说明
EMR 1.0.0版本说明
产品计费
计费说明
计费项
计费方式
按量付费
包年包月
按量付费转包年包月
欠费说明
到期说明
退订和续费说明
查看账单
退订集群
快速入门
E-MapReduce 快速入门
准备工作
创建集群
创建并运行作业
DataLeap on EMR 快速入门
用户指南
集群管理
集群类型
支持ECS实例
集群配置
创建集群
创建集群概述
管理安全组
查看集群列表及详情
集群状态
引导操作
集群脚本
弹性伸缩
节点组管理
访问链接
用户管理
权限管理
权限管理
角色授权
角色与权限
EMR服务角色
集群组件端口说明
配置中心
集群模版
元数据连接
克隆集群
标签配置
项目配置
History 服务使用文档
集群运维
常用文件路径
登录集群
扩容集群
域名规则
缩容集群
扩容磁盘
释放集群
集群操作日志
日志中心
告警中心
集群监控
监控指标
概述
节点TopN监控指标
HDFS 监控指标
Yarn 监控指标
Hive 监控指标
ZooKeeper 监控指标
HBase 监控指标
OpenSearch 监控指标
Doris 监控指标
StarRocks 监控指标
Impala 监控指标
Kudu 服务监控
ClickHouse 集群监控
Presto 监控指标
Trino 监控指标
Celeborn 监控指标
Kyuubi 监控指标
告警管理
监控指标导出实践手册
集群事件中心
集群管理常见问题
服务管理
查看服务列表
服务概述
添加/重启服务
服务启停
管理服务配置参数
组件拓扑管理
服务开发指南
HDFS
使用说明
基础使用
高阶使用
快速开始
开发指南
最佳实践
常见问题
YARN
使用说明
基础使用
进阶使用
YARN 队列管理
常见问题
最佳实践
YARN Node Label介绍与最佳实践
MapReduce2
使用说明
Hive
概述
基础使用
Hive 基础操作
Hive 连接方式
确定 HiveServer2 地址
Hive3 使用注意事项
高阶使用
管理 LDAP 认证
Hive 作业调优
HiveServer2 负载均衡
开发指南
自定义函数 (UDF)
最佳实践
Hive 访问 Hudi 数据
在EMR集群运行TPC-DS Benchmark
Spark
使用说明
快速开始
基础使用
基础使用
DDL语句
DML 语句
SELECT 语句
PySpark 基础使用
Spark RDD 基础使用
最佳实践
Spark on GPU 最佳实践
Ksana for SparkSQL
MaxCompute Buildin Function Plugin
Spark 调优指南
常见问题
Flink
概述
Flink 基础使用
Flink SQL Client 使用参考
常见问题
Presto
使用说明
基础使用
高阶使用
常见问题
Hue
使用说明
最佳实践
通过hue进行数据查询
Hue 高可用访问集群内其他服务
Knox
使用说明
OpenLDAP
概述
基础使用
最佳实践
手动配置LDAP认证
Ranger
概述
组件集成
HDFS 集成
YARN 集成
Hive 集成
Spark集成
Presto集成
Trino 集成
HBase 集成
高阶功能
Ranger User Sync 集成LDAP
查看Ranger审计日志信息
配置DataLeap数据开发权限
快速开始
常见问题
Sqoop
使用说明
常见问题
ZooKeeper
概述
基本使用
进阶使用
Kafka
Kafka 概述
基础使用
高阶使用
快速开始
开发指南
常见问题
Airflow
概述
快速开始
基础使用
代码示例
关键配置
高阶使用
常见问题和注意事项
最佳实践
HBase
使用说明
HBase Shell
Phoenix
使用说明
TensorFlow
使用说明
快速开始
基础使用
高阶使用
Tez
使用说明
Hudi
使用说明
基础使用
高阶使用
Iceberg
使用说明
基础使用
Iceberg 基础使用
Iceberg 基础使用(适用于EMR2.x版本)
高阶使用
Iceberg 参数配置
Spark流式读写 Iceberg
Spark流式读写 Iceberg(适用于EMR 2.x版本)
Spark批式读写Iceberg
Iceberg与Trino/Presto集成
Iceberg与Flink集成
Hive 中操作 Iceberg 数据
TOS 中操作 Iceberg 表
TOS 中操作 Iceberg 表(适用于 EMR 2.x 版本)
Trino
使用说明
基础使用
高阶使用
常见问题
Doris
Doris 概述
基础使用
快速开始
高阶使用
高阶使用
最佳实践
Doris连接Tableau
常见问题
Pulsar
使用说明
快速开始
常见问题
Impala
Impala 概述
基础使用
Impala 基础操作
Impala 连接方式
Impala-shell 工具
高阶使用
管理 LDAP 认证
最佳实践
使用 Impala 访问 Kudu
Kudu
Kudu 概述
基础使用
Kudu 基础操作
高阶使用
Impala 集成 Kudu
使用 Flume 同步数据到 Kudu
Delta Lake
使用说明
基础使用
进阶使用
StarRocks
概述
规划 StarRocks 集群
快速开始
运维管理
StarRocksUI使用
StarRocks参数配置
使用CLB实现负载均衡
用户和权限管理
基础使用
高阶使用
StarRocks 分区表使用
StarRocks 访问 TOS
数据导出
StarRocks Spark Connector
StarRocks Flink Connector
慢SQL分析
数据湖分析
Catalog
Default Catalog
External Catalog
最佳实践
StarRocks高可用最佳实践
使用Serveless Flink实现MySQL到StarRocks数据集成
使用智能数据洞察对StarRocks数据进行分析
StarRocks集群资源规划
StarRocks表模型设计
使用DataSail实现MySQL到StarRocks数据集成
Starrocks跨大版本升级
常见问题
ClickHouse
概述
快速开始
基础使用
高阶使用
Proton
Proton 概述
发行版本
Proton 发行版本
JobCommitter版本
基础使用
Hadoop 使用 Proton
Spark 使用 Proton
Flink 使用 Proton
Hive 使用 Proton
Impala 使用 Proton
快速上手
Proton 缓存模式
Proton 无缓存模式
高阶使用
Proton Cli
Proton 确定缓存大小
Proton元数据同步
Distcp拷贝数据到TOS
Proton 参数配置
Proton按需缓存使用手册
Distcp从OSS拷贝数据到TOS
使用 FUSE 挂载 Proton
最佳实践
EMR 存算分离JobCommitter最佳实践
Proton SDK调优指南
Proton加速模式快速入门
DolphinScheduler
概述
快速开始
集成示例
配置指引
常见问题
Kerberos
使用 Kerberos 认证集群
配置 Kerberos 集群间跨域互信
EMR 使用外部KDC
Apache Livy
Apache Livy 使用说明
Kyuubi
Kyuubi 概述
Kyuubi 快速开始
Kyuubi 高级特性
Celeborn
Celeborn概述
基础使用
高阶使用
Lance
使用Lance Python SDK访问TOS上的Lance数据
使用Lance数据格式训练CLIP多模模型
最佳实践
数据集成最佳实践
基于 StarRocks 的准实时数据分析
EMR Flink 数据写入 Bytehouse
火山引擎 EMR 迁移指南
迁移指南说明
成本评估优化
数据迁移
元数据迁移
权限迁移
迁移作业至火山引擎 EMR
DataLeap Shell 结合 EMR 系列实践
Shell 执行 EMR Doris SQL 任务
Shell 触发 Airflow 工作流执行
组件最佳实践
EMR 集群客户端最佳实践
在自定义DNS的VPC下创建EMR集群
EMR本地盘实例故障运维
弹性伸缩最佳实践
在Docker中使用EMR CLI
API参考
使用前必读
EMR API概览
调用方法
请求结构
公共参数
签名方法
响应结果
公共错误码
操作管理
ListOperations - 操作列表
集群管理
UpdateClusterAttribute - 更新集群属性
ReleaseCluster - 释放或退订集群
ListClusters - 集群列表
GetCluster - 获取集群
CreateCluster - 创建集群
订单管理
ListOrders - 订单列表
节点组管理
ScaleOutNodeGroup - 扩容节点组
CreateNodeGroup - 创建节点组
UpdateNodeGroupChargeType - 更新节点组付费类型
ScaleInNodeGroup - 缩容节点组
UpdateNodeGroupEcsSpec - 更新节点组ECS规格
ScaleUpNodeGroupDisk - 扩容节点组磁盘
ListNodeGroups - 节点组列表
DeleteNodeGroup - 删除节点组
UpdateNodeGroupAttribute - 更新节点组属性
ListNodes - 节点列表
用户管理
GetClusterUsers - 获取EMR管控用户详情
UpdateClusterUserPassword - 更新集群用户密码
ListClusterUsers - 获取集群用户列表
DeleteClusterUser - 删除集群用户
UpdateClusterUser - 修改已创建用户信息
CheckUserCredentials - 校验集群用户
CreateClusterUser - 创建集群用户
用户组管理
GetClusterUserGroups - 集群用户组详情
ListClusterUserGroups - 获取集群用户组列表
CreateClusterUserGroup - 创建集群用户组
DeleteClusterUserGroup - 删除集群用户组
UpdateClusterUserGroup - 更新集群用户组
应用管理
ListApplicationConfigs - 配置项列表
GetApplicationConfigFile - 获取集群配置文件信息
RunApplicationAction - 执行应用操作
ListApplicationConfigFiles - 集群配置文件列表
UpdateApplicationConfig - 更新配置项
ListApplicationConfigHistories - 配置项修改历史列表
GetApplicationPacket - 获取应用安装包信息
ListApplications - 集群列表
ListComponentInstances - 组件实例列表
ListComponents - 组件列表
API参考(旧)
使用前必读
如何调用API
API说明
CreateCluster(创建集群)
ResizeCluster(集群扩容)
DescribeCluster(集群详情)
ListInstances(查询节点)
ListClusters(集群列表)
ListInstanceGroups(查询节点组)
ReleaseCluster(释放集群)
AddTags(添加Tags)
RemoveTags(删除Tags)
API 版本说明
SDK参考
SDK 概述
Python SDK
常见问题
常见问题
技术支持与服务
技术支持
大数据专家服务计费说明
相关协议
E-MapReduce服务等级协议
数据中台产品和服务专用条款
EMR on VKE
产品公告
【公告】EMR on VKE 商业化公告
产品概述
什么是EMR on VKE
版本说明
功能发布记录
版本概述
版本说明
EMR-VKE-1.7.0发布说明
EMR-VKE-1.6.0发布说明
EMR-VKE-1.5.0发布说明
EMR-VKE-1.4.0发布说明
产品计费
计费说明
计费项
按量付费
欠费说明
查看账单
快速入门
EMR on VKE 服务关联角色
集群管理
创建虚拟集群
释放集群
节点管理
操作日志
查看集群列表及详情
服务管理
配置管理
作业管理
查看作业列表
镜像管理
使用自定义 Docker 镜像运行作业
Ray镜像列表
Spark镜像列表
组件操作指南
Spark
使用 kubectl管理作业
新建 HiveMetaStore 集群并运行 SparkSQL 作业
使用弹性容器实例(VCI)调度 Spark 作业
Spark 集群手动关联 RSS 集群
如何解决 Ray 集群的压力负载及内存溢出问题
Celeborn
Celeborn Master pod节点不允许移除
最佳实践
Celeborn超大分区使用参数说明
Ray
Ray简介
Ray快速入门
Ray on VKE产品介绍
使用RayHistoryServer查看历史作业
Ray vs Spark对比
RayJob使用
RayJob快速入门
提交RayJob使用指导
通过Ray Dashboard查看任务情况
通过EMR监控RayJob
KubeRay RayJob提交使用指导
Raycluster使用
RayCluster快速入门
提交Ray作业使用指导
使用Ray Dashboard监控作业
Ray访问TOS使用示例
使用Ray进行词频统计(WordCount)
Ray中Placement Group 使用指导
RayData使用
AutoScale:使用AdaptiveStreamingExecutor
最佳实践
Ray任务运行在GPU上
Ray Dashboard开启metrics能力
使用 Volcano Scheduler 替换 K8S Default Scheduler 运行 Spark 及 Ray 作业
RayCluster开启Autoscaler
Ray 接入日志服务TLS
将传统的 Python 程序改造为 Ray 程序的实践指南
API参考
使用前必读
API概览
集群管理
CreateVirtualCluster - 创建集群
GetVirtualCluster - 查看集群详情
DeleteVirtualCluster - 删除集群
ListVirtualClusters - 集群列表
操作管理
GetOperation - 查看操作日志信息
应用管理
UndeployApplications - 卸载应用
DeployApplications - 部署应用
RunApplicationAction - 运行应用Action
ListApplications - 应用列表
最佳实践
使用PriorityClass调度大作业避免资源碎片
EMR Serverless Spark
产品动态
功能发布记录
产品简介
产品简介
基本概念
应用场景-云数据仓库建设
应用场景-混合云架构解决方案
产品计费
计费说明
计费方式
标准计算资源
续费&退订
升配&降配
欠费停服&恢复
快速入门
准备工作
创建资源队列
创建并提交作业
用户指南
队列管理
队列管理
队列监控
队列权限
对接LAS Formation
Spark SQL作业开发指南
Spark Jar作业开发指南
PySpark作业开发指南
SQL专用资源预热能力
开发指南
引擎介绍
基础使用
数据Shuffle
JDBC使用
Spark Native使用说明
Serverless Spark读写StarRocks(存算分离)操作手册
最佳实践
Dataleap联合开通及使用
最佳实践
Serverless Ray 开发指南
Serverless PySpark 开发指南
API参考
Open API
SDK参考
Spark-submit工具使用说明
Java Query SDK
Python Query SDK
常见问题
常见问题
EMR Serverless Presto
产品动态
功能发布记录
产品简介
产品计费
计费说明
计费方式
按量付费
包年包月
快速入门
准备工作
创建资源队列
创建并提交作业
用户指南
队列管理
开通 LAS
作业开发指南
开发指南
基础使用
JDBC 程序连接 Presto
客户端工具连接 Presto
Datawind
DBeaver
Tableau
EMR Serverless OLAP
产品简介
什么是 EMR Serverless OLAP
产品架构
基本概念
产品计费
计费概述
续费说明
操作指南
权限管理
EMR Serverless OLAP服务关联角色
为 IAM 用户授权
实例管理
创建实例
查看实例列表与详情
实例状态表
用户管理
实例扩容
磁盘扩容
实例升配
连接实例
StarRocks存算分离集群配置建议
数据导入
导入概述
Stream Load
Broker Load
Routine Load
Insert方式 导入
数据湖查询(StarRocks)
Catalog
Catalog概述
Default Catalog
External Catalog
外部表
读取Hadoop集群中的数据
更新元数据缓存
读取LAS数据
性能调优
SQL诊断使用说明
最佳实践
存算分离最佳实践
Serverless StarRocks TPC-H 基准测试说明
Serverless StarRocks表模型设计
Serverless StarRocks集群资源规划
使用Serveless Flink实现MySQL到StarRocks数据集成
Serverless StarRocks使用火山引擎智能数据洞察进行分析
Serverless StarRocks高可用最佳实践
相关协议
EMR Serverless OLAP 服务等级协议
文档首页
/
E-MapReduce
/
EMR Serverless OLAP
EMR Serverless OLAP
产品简介
产品计费
操作指南
相关协议