• Oracle 1204 RAC failover 测试 (三)


    经过两次测试,感觉RAC很脆弱。
    1.拔除RAC1的public网线,站在RAC2旁边看变化,发现VIP很快转换到RAC2,用户仍然可以使用。
    2.1分钟后,RAC2自动重启,察看原因是共享盘无法mount,此时另一同事正在config SAN,无法确定是否真的共享盘出了问题。
    3.干脆来个更狠的测试,拔除两台DB的电源,再插回去,重新开机,发现CRS无法启动。
    [root@racdb02 install]# crs_stat -t
    CRS-0184: Cannot communicate with the CRS daemon.
    4. 在网络上寻找了很多方法,均无效果,metalink上也没有合适的方法
    5.在两个node上分别RUN  root102.sh
    [oracle@racdb01 ~]$ /u01/oracle/product/10.2/crs1/install/root102.sh
    6. reboot两台 node
    7. [root@racdb01 oracle]# crs_stat -t
    Name           Type           Target    State     Host       
    ------------------------------------------------------------
    ora.rac.db     application    ONLINE    UNKNOWN   racdb02    
    ora....s1.inst application    ONLINE    UNKNOWN   racdb01    
    ora....s2.inst application    ONLINE    UNKNOWN   racdb02    
    ora....esdb.cs application    ONLINE    OFFLINE              
    ora....es1.srv application    ONLINE    OFFLINE              
    ora....es2.srv application    ONLINE    OFFLINE              
    ora....01.lsnr application    ONLINE    ONLINE    racdb01    
    ora....b01.gsd application    ONLINE    ONLINE    racdb01    
    ora....b01.ons application    ONLINE    ONLINE    racdb01    
    ora....b01.vip application    ONLINE    ONLINE    racdb01    
    ora....02.lsnr application    ONLINE    ONLINE    racdb02    
    ora....b02.gsd application    ONLINE    UNKNOWN   racdb02    
    ora....b02.ons application    ONLINE    UNKNOWN   racdb02    
    ora....b02.vip application    ONLINE    ONLINE    racdb02
    8.试图删除instance失败,删除service racdb失败,删除监听器失败
    9.crs_start -all
    无法启动的Service仍然无法启动.
    10.卸载CRS,重新安装,升级到1204
    11.CRS所有服务正常启动
    12.srvctl add database -d rac -o /u01/oracle/product/10.2/db1/
    13.srvctl add instance -d rac -i rac1 -n racdb01
       srvctl add instance -d rac -i rac2 -n racdb02
    14.在两个NODE上reboot
    15.发现rac2启动正常,但rac1的instance无法启动
    [oracle@racdb01 ~]$ crs_stat -t
    Name           Type           Target    State     Host       
    ------------------------------------------------------------
    ora.rac.db     application    ONLINE    ONLINE    racdb02    
    ora....s1.inst application    OFFLINE   OFFLINE              
    ora....s2.inst application    ONLINE    ONLINE    racdb02    
    ora....01.lsnr application    ONLINE    ONLINE    racdb01    
    ora....b01.gsd application    ONLINE    ONLINE    racdb01    
    ora....b01.ons application    ONLINE    ONLINE    racdb01    
    ora....b01.vip application    ONLINE    ONLINE    racdb01    
    ora....02.lsnr application    ONLINE    ONLINE    racdb02    
    ora....b02.gsd application    ONLINE    ONLINE    racdb02    
    ora....b02.ons application    ONLINE    ONLINE    racdb02    
    ora....b02.vip application    ONLINE    ONLINE    racdb02
    16.srvctl remove instance -d rac -i rac1
    17.srvctl add instance -d rac -i rac1 -n racdb01
    18.试图启动rac1的服务
    [oracle@racdb01 ~]$ srvctl start instance -d rac -i rac1 -o mount;
    PRKP-1001 : Error starting instance rac1 on node racdb01
    CRS-1028: Dependency analysis failed because of:
    CRS-0223: Resource 'ora.rac.rac1.inst' has placement error.

    [oracle@racdb01 ~]$ crs_start ora.rac.rac1.inst
    Attempting to start `ora.rac.rac1.inst` on member `racdb01`
    `ora.rac.rac1.inst` on member `racdb01` has experienced an unrecoverable failure.
    Human intervention required to resume its availability.
    CRS-0215: Could not start resource 'ora.rac.rac1.inst'.

    [oracle@racdb01 admin]$ crs_start ora.rac.rac1.inst
    CRS-1028: Dependency analysis failed because of:
    'Resource in UNKNOWN state: ora.rac.rac1.inst'
     
    CRS-0223: Resource 'ora.rac.rac1.inst' has placement error.

    19.继续在网上找资料,折腾了半天,仍无效.
    20.在metalink上看到一篇文章,说是TNSNArac.ora有问题
    21.查看我的tnsnarac.ora,发现原来设的racdb这个service(for透明故障切换用的)仍在,而重新装CRS后并未设定,删除之
    22.[oracle@racdb01 admin]$ crs_start ora.rac.rac1.inst
    Attempting to start `ora.rac.rac1.inst` on member `racdb01`
    Start of `ora.rac.rac1.inst` on member `racdb01` succeeded.
    23.[oracle@racdb01 admin]$ crs_stat -t
    Name           Type           Target    State     Host       
    ------------------------------------------------------------
    ora.rac.db     application    ONLINE    ONLINE    racdb02    
    ora....s1.inst application    ONLINE    ONLINE    racdb01    
    ora....s2.inst application    ONLINE    ONLINE    racdb02    
    ora....01.lsnr application    ONLINE    ONLINE    racdb01    
    ora....b01.gsd application    ONLINE    ONLINE    racdb01    
    ora....b01.ons application    ONLINE    ONLINE    racdb01    
    ora....b01.vip application    ONLINE    ONLINE    racdb01    
    ora....02.lsnr application    ONLINE    ONLINE    racdb02    
    ora....b02.gsd application    ONLINE    ONLINE    racdb02    
    ora....b02.ons application    ONLINE    ONLINE    racdb02    
    ora....b02.vip application    ONLINE    ONLINE    racdb02
    终于启动了,鼓掌.折腾了两天了!

  • 相关阅读:
    技术每天一点点--2020.01-2020.12月
    【置顶】历史书单--程序员的文娱情怀
    【编程书籍 大系】 计算机开放电子书汇总
    Mysql基础代码(不断完善中)
    php 基础代码大全(不断完善中)
    【读书笔记】阅读美团技术团队文章《领域驱动设计在互联网业务开发中的实践》--2020.06.25 周四 端午节
    【置顶】技术每天一点点--2020.01-2020.12
    【日常】技术每天进展--2019.06.10
    【转载】Spring学习(1)——快速入门--2019.05.19
    vs创建qt dll,并使用qt控制台测试
  • 原文地址:https://www.cnblogs.com/kevinsun/p/1356922.html
Copyright © 2020-2023  润新知