You need to enable JavaScript to run this app.
导航
备份管理
最近更新时间:2025.04.01 20:13:42首次发布时间:2025.03.27 16:24:14
我的收藏
有用
有用
无用
无用

产品概念

LAS 平台的备份恢复功能是为企业级数据资产构建的全生命周期防护体系,旨在通过自动化、可定制的备份策略与快速恢复能力,保障关键数据(包括元数据与业务数据)的完整性、安全性及高可用性。该功能深度融合平台管控服务与集群运维场景,支持灵活配置本地/远程存储目的地、多组件粒度化备份策略,以及智能化的版本管理机制,有效应对硬件故障、人为误操作、软件故障等风险场景,为企业构建防丢失、可追溯、快速回退的数据安全防线。
备份恢复功能的主要目的是:

  1. 保障数据安全
    • 通过定期备份与版本保留策略,确保元数据(如 Hive 表结构、Ranger 权限策略)与业务数据(如 HDFS 文件)的零丢失,避免因误删、配置错误或系统故障导致的数据不可逆损坏。
  2. 提升运维效率
    • 提供统一管理界面与自动化任务调度,简化多集群、多组件备份的复杂度,降低人工操作成本;支持快速恢复至指定时间点或版本,最大限度减少业务中断时间。
  3. 支持业务连续性
    • 通过本地与远程HDFS的多副本存储机制,实现跨环境容灾,确保极端场景下仍可通过备份数据快速重建服务,保障业务连续运行。
  4. 适应多样化需求
    • 覆盖全量/增量备份、并发控制、限速等高级配置,满足不同规模数据量与业务场景下的性能与资源平衡需求,适配开发、测试、生产环境的差异化管控要求。

备份任务

通过备份任务列表页面,您可以集中管理所有已创建的备份任务,支持以下操作:
Image

  • 查看任务列表:展示所有备份任务的基本信息,包括任务名称、任务类型(周期/手动)、备份对象、最近执行状态、下次执行时间(周期任务)等。
  • 搜索与筛选:支持按任务名称、、集群、备份类型、调度状态、最近一次执行状态等字段快速检索任务。
  • 创建任务:支持进入创建备份任务的流程。
  • 操作列功能
    • 立即执行:立即触发运行一次备份任务。
    • 恢复:根据备份任务创建相应的恢复任务。
    • 编辑任务:修改备份任务配置。
    • 历史/查看日志:查看备份任务的运行记录,以及任务历史执行日志及错误详情。
    • 启用/禁用:启用或者禁用备份任务。
    • 删除任务:移除不再需要的备份任务(需确认操作)。

创建备份任务

在任务管理页面,支持点击创建任务按钮,则可以进入引导式界面创建备份任务。需要填写以下内容:

基本配置

Image

  • 任务名称:(必填)自定义任务名称(建议包含业务标识,如prod_hive_metadata_daily)。
  • 描述:(选填)简要描述任务用途或注意事项。
  • 备份对象:(必选)选择需备份的目标,支持:
    • 管控服务:备份 LAS 平台管控面本身的元数据。
    • 集群:备份指定集群组件的数据。
  • 任务执行集群:(必选)选择执行备份操作的集群。
  • 任务类型(必选):
    • 周期备份:需设置开始时间备份周期(支持按指定小时/天重复)。
    • 手动备份:仅通过手动触发执行。

备份目的地配置

选择备份存储位置:
Image
本地 HDFS:默认存储至当前集群的 HDFS 路径,需要以 /开头的路径模式,形如/backup等。
远程 HDFS(需额外配置):

  • NameNode 地址(必填):目标 HDFS 的 NameNode IP 或域名。
  • 端口(必填):按实际环境填写。
  • 队列名称(必填):选择执行备份任务时使用的 YARN 队列。

注意

如果选择远程 HDFS,请确保执行集群与远程 HDFS 网络互通,且账号有写入权限。

元数据备份(可选)

开启后配置以下内容:
Image

  • 选择组件(多选):
    • 支持组件:管控面元数据、Hive、Ranger、Hue、DolphinScheduler、Presto、HDFS。
  • 备份策略
    • 备份路径:为每个组件指定 HDFS 存储路径,注意路径不需要填写任何前缀,填写以根路径开始的绝对路径即可。
    • 保留数量:设置最大保留的备份版本数,超限后自动清理旧版本。

业务数据备份(可选)

开启后配置以下内容(当前仅支持 HDFS):
Image

  • 备份策略
    • 备份模式(必选):
      • 全量备份:完整备份指定目录。
      • 增量备份:仅备份自上次备份后的变更数据。
    • 备份数据(必填):通过界面勾选需要备份的文件目录。

Image

  • 目标路径(必填):备份文件存储的 HDFS 路径。
  • 保留数量:设置最大保留的备份版本数。
  • 高级设置

Image

  • 并发数量:控制备份任务的并发线程数(默认值:3)。
  • 限速设置:限制备份任务带宽(单位:MB/s)。
  • 自定义参数:输入额外 Hadoop 参数。

创建任务

完成配置后点击【立即创建】,任务将根据类型立即执行(手动任务)或按计划运行(周期任务)。

备份任务管理

以下详述备份任务的管理中的重要功能。

立即执行

点击操作列表中的立即执行,会立即触发运行一次备份任务。在仔细确认当前集群资源充沛后可以确认启动:
Image

恢复

点击操作列表中的恢复按钮,会根据备份任务创建相应的恢复任务。具体的流程可以参见恢复管理模块。
Image

编辑任务

点击操作列表中的编辑按钮,会进入修改任务的流程。当前仅支持修改任务描述。
Image

历史/查看日志

点击操作列表中的历史按钮,可以进入运行日志界面,其中可以查看所有历史备份任务的实际运行情况。运行成功的任务可以查看具体成功备份的路径,可以通过指定路径进行数据恢复操作。
Image

启用/禁用

点击操作列表中启用/禁用,可以开启调度备份任务,或者禁止调度备份任务。

删除任务

当备份任务不再需要的时候,可以点击操作列表中的删除按钮进行任务的删除操作。

注意事项

  1. 备份路径容量:定期监控存储路径的磁盘空间,避免备份失败。
  2. 任务冲突:同一集群的并发备份任务可能导致资源争用,建议错峰执行。