You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

Oracle Veritas双节点集群备节点运行时向主节点故障回切咨询

生产环境下Veritas集群Oracle主备节点回切至node1的操作指南

针对你描述的JBoss6.4环境下Veritas管理的Oracle主备双节点回切需求——当前node2以只读备库状态承载业务,需恢复node1为主节点——我结合生产环境的严谨操作规范,整理了以下分步流程:

一、回切前的绝对必要检查(生产环境禁止跳过)

  • 确认node1的硬件、网络、共享存储(若涉及)已完全修复,无任何硬件告警或资源占用异常
  • 单独启动node1上的Oracle实例至MOUNT状态,验证监听、数据库文件完整性,确保能正常启动(不要接入集群资源组
  • 在node2上检查Oracle备库同步状态:
    SELECT OPEN_MODE, DATABASE_ROLE, SWITCHOVER_STATUS FROM V$DATABASE;
    
    需确保SWITCHOVER_STATUSTO_PRIMARYSESSIONS ACTIVE(若为后者,需提前协调业务团队断开node2的应用连接)
  • 备份Veritas集群配置文件,防止操作失误:
    haconf -dump -makero
    
  • 与业务团队确认切换窗口,建议预留10-15分钟的应急缓冲时间

二、执行回切操作(Oracle角色切换 + Veritas资源组迁移)

步骤1:切换Oracle主备角色

  1. 在node2(当前只读备库)执行,断开现有业务会话并切换为临时主库:
    ALTER DATABASE COMMIT TO SWITCHOVER TO PRIMARY WITH SESSION SHUTDOWN;
    
    执行后验证node2的角色:SELECT DATABASE_ROLE FROM V$DATABASE; 应显示PRIMARY(临时)
  2. 在node1上启动数据库并切换为物理备库,开始同步:
    ALTER DATABASE MOUNT STANDBY DATABASE;
    ALTER DATABASE RECOVER MANAGED STANDBY DATABASE DISCONNECT FROM SESSION;
    
  3. 再次在node2上执行,将主库角色切换回node1:
    ALTER DATABASE COMMIT TO SWITCHOVER TO PHYSICAL STANDBY WITH SESSION SHUTDOWN;
    
  4. 最后在node1上激活为主库(读写模式):
    ALTER DATABASE COMMIT TO SWITCHOVER TO PRIMARY;
    ALTER DATABASE OPEN;
    
    验证node1状态:SELECT OPEN_MODE, DATABASE_ROLE FROM V$DATABASE; 应显示READ WRITEPRIMARY

步骤2:迁移Veritas集群资源组至node1

  1. 先冻结node2上的Oracle资源组,避免集群自动触发不必要的故障转移:
    hagrp -freeze <your_oracle_resource_group_name> -persistent
    
  2. 将资源组手动切换至node1:
    hagrp -switch <your_oracle_resource_group_name> -to node1
    
  3. 切换完成后,解冻资源组并验证状态:
    hagrp -unfreeze <your_oracle_resource_group_name> -persistent
    hagrp -state <your_oracle_resource_group_name>
    
    需确认所有Oracle相关资源(实例、监听、磁盘组等)在node1上处于ONLINE状态,node2上的资源已OFFLINE

三、回切后的验证工作

  • 验证node1上的Oracle服务正常,可通过sqlplus或JDBC连接测试读写操作
  • 协调业务团队将JBoss应用连接切换回node1,验证业务功能正常
  • 检查node2上的Oracle备库是否正常同步:
    SELECT SYNCHRONIZATION_STATUS FROM V$DATAGUARD_STATS;
    
  • 确认Veritas集群资源组的自动切换策略恢复正常,确保后续故障能自动触发转移

内容的提问来源于stack exchange,提问作者du4ok

火山引擎 最新活动