Oracle 11g rac 修改心跳ip --此事件为亲身经历,然后参照网上方法总结的 原由:医院his项目上线,在验证科室访问数据库时,发现某科室无法连接数据库(所有集群地址) 问题排查:1.首先排除数据库问题,用其他科室或者工具连接数据库实例IP、集群IP访问数据库,验证能正常连接、使用; 2.查看检验科防火墙,ping 数据库IP,发现能ping通 3.让网络工程师检查检验科到数据库服务器网络、路由器、交换机配置,发现数据库服务器的心跳路由和检验科使用网络冲突: linux: route --- 有一条10.10.10.0的路由 而检验科室也是使用该网段 确认这可能是问题的症结 4.与领导沟通,先删除路由,验证检验科能否访问数据库,同时验证Oracle rac是否正常运行 方法:a.删除路由 route del -net 10.10.10.0/24 b.检验科能访问数据库 c.验证数据库集群,发现rac2集群资源消失,csrctl start crs直接报错, rac1集 群资源正常 d.添加回路由 route add -net 10.10.10.0/24 dev eth1,重启rac2集群,正常 5.因此只能修改集群心跳IP,换成其他心跳路由,然后删除老路由 方法: rac1 : 10.10.10.1 -- 172.20.255.253 255.255.255.0 rac2 : 10.10.10.2 -- 172.20.255.254 255.255.255.0 a.备份ocr olr gpnp profile rac1\rac2grid用户: cd /u01/app/grid/product/11.2.0/grid_1/gpnp/profiles/peer cp profile.xml profile.xml.bak rac1 root用户: /u01/app/grid/product/11.2.0/grid_1/bin/ocrconfig -manualbackup 备份 /u01/app/grid/product/11.2.0/grid_1/bin/ocrconfig -showbackup 查看 b.更改grid 心跳Ip,保持所有节点处于运行状态,只要在一个节点操作就可以 rac1 root用户: /u01/app/grid/product/11.2.0/grid_1/bin/oifcfg iflist 查看rac1路由表 /u01/app/grid/product/11.2.0/grid_1/bin/oifcfg getif查看集群网络连接由 ipcalc -bnm 172.20.255.253 255.255.255.0 增加新的心跳ip /u01/app/grid/product/11.2.0/grid_1/bin/oifcfg setif -global eth1/172.20.255.0:cluster_interconnect 新增集群网络连接路由 /u01/app/grid/product/11.2.0/grid_1/bin/oifcfg getif 查看到新增的地址 c. 关闭集群软件 [root@rac1 ~]# /u01/app/grid/product/11.2.0/grid_1/bin/crsctl stop crs [root@rac2 ~]# /u01/app/grid/product/11.2.0/grid_1/bin/crsctl stop crs d.更改主机心跳地址、hosts文件,重启集群 [root@rac1 ~]#vim /etc/hosts [root@rac1 ~]#vim /etc/sysconfig/network-scripts/ifcfg-eth1 [root@rac1 ~]#service networl restart [root@rac1 ~]# /u01/app/grid/product/11.2.0/grid_1/bin/crsctl start crs [root@rac2 ~]#vim /etc/hosts [root@rac2 ~]#vim /etc/sysconfig/network-scripts/ifcfg-eth1 [root@rac2 ~]#service networl restart [root@rac2 ~]# /u01/app/grid/product/11.2.0/grid_1/bin/crsctl start crs e.保证rac1 rac2集群都启动正常后,再删除老的连接地址 [root@rac1 ~]# /u01/app/grid/product/11.2.0/grid_1/bin/crsctl stat res -t 查看集群状态 [root@rac1 ~]# /u01/app/grid/product/11.2.0/grid_1/bin/oifcfg getif [root@rac1 ~]# /u01/app/grid/product/11.2.0/grid_1/bin/oifcfg delif - global eth1/10.10.10.0 删除老的连接地址 [root@rac1 ~]# /u01/app/grid/product/11.2.0/grid_1/bin/oifcfg getif检查 是否删除 f. 删除老的路由 rac1 rac2 root用户: route ---查看,表中已生成新地址的路由 route del -net 10.10.10.0/24 删除老的路由 g.验证集群软件、数据库、监听、应用程序、科室、第三方、业务能否正常连 接、使用。