在创建备份任务之后,可以通过恢复任务将已有的备份回到系统中。
恢复任务管理

通过恢复任务列表页面,您可以统一管理所有历史恢复任务,实现以下功能:
- 任务列表展示:
- 显示任务名称、恢复对象(管控服务/集群)、任务状态(初始化/运行中/成功/失败)、创建时间、完成时间等核心信息。
- 检索与筛选:
- 支持按任务名称、恢复对象(如集群名称)、任务状态(成功/失败等)进行搜索与过滤。
- 操作列功能:
- 立即执行:手动触发恢复任务。
- 删除任务:移除已完成或废弃的恢复任务(需二次确认)。
创建恢复任务
基础信息配置
- 任务基本信息:

- 任务名称(必填):自定义恢复任务名称(建议包含恢复目标标识,如
restore_prod_hive_20231001
)。 - 描述(选填):补充任务用途或特殊说明。
- 恢复对象(必选):
- 管控服务:恢复平台管理元数据(如用户权限、服务配置等)。
- 集群:恢复指定集群的业务数据。
- 任务执行集群(必选):选择执行恢复操作的集群(需确保该集群可访问备份数据源)。
恢复备份源配置

选择备份数据来源类型:
- 本地 HDFS:从当前集群的 HDFS 路径读取备份数据。
- 远程 HDFS(需额外配置):
- NameNode 地址(必填):备份数据所在的远程 HDFS NameNode IP 或域名。
- 端口(必填):默认
8020
,按实际环境填写。 - YARN 队列名称(必选):选择执行恢复任务时使用的 YARN 队列(需队列资源充足)。
元数据恢复(可选)
开启后配置以下内容:

- 选择恢复组件(多选):
- 支持组件:管控面元数据、Hive、Ranger、Hue、DolphinScheduler、Presto、HDFS。
- 恢复策略:
- 备份路径(必填):为每个组件指定备份数据的 HDFS 完整路径(例如:
/backup/metadata/hive/20231001
)。
重要:恢复数据的时候会停止该服务,请确保此时没有重要业务运行。
业务数据恢复(可选)
开启后配置以下内容(当前仅支持 HDFS):

- 恢复策略:
- 备份文件地址(必填):输入待恢复的备份数据 HDFS 路径(例如:
/backup/data/hdfs/full_20231001
)。 - 目标恢复路径(必填):指定数据恢复到目标集群的 HDFS 路径(默认还原至备份原路径,可自定义)。
- 高级设置:
- 并发数量:控制数据恢复的并发线程数(默认值:3,过高可能影响集群性能)。
- 限速设置:限制恢复任务的带宽占用(单位:MB/s)。
- 自定义参数:输入 Hadoop 调优参数。
提交任务
点击【提交】后,任务将进入任务列表:
- 若未设置立即执行,任务状态为“等待中”,需手动触发执行。
- 恢复任务执行期间,禁止对恢复对象进行写操作,避免数据冲突。
操作恢复任务
- 立即执行:
- 在任务列表点击【立即执行】,系统将跳过等待状态直接运行任务。
- 删除任务:
- 选择任务后点击【删除】,系统将移除任务记录(不影响已恢复的数据)。
注意事项
- 备份源验证:
- 恢复前需确保备份文件完整且未被篡改,可通过校验文件(如
checksum
)或备份日志确认。
- 权限检查:
- 执行恢复的账号需拥有备份路径的读取权限及目标恢复路径的写入权限。
- 服务影响:
- 元数据恢复可能导致服务短暂不可用(如 Hive元数据库恢复时,建议暂停相关服务)。
- 冲突处理:
- 若恢复路径已存在数据,根据覆盖策略选择保留或替换,建议提前备份当前状态。