• 【北亚服务器数据恢复】IBM DS系列存储硬盘故障导致RAID5崩溃的数据恢复


    服务器数据恢复环境:
    IBM DS系列存储,一个机头,连接4个扩展柜;
    50块600GB硬盘组建的2组RAID;
    其中一组是由27块600G硬盘组成的RAID5,存放数据是Oracle数据库文件,在存储系统上层一共分了11个卷(10个1TB,1个4TB)。

    故障:
    那组由27块600G硬盘组成的RAID5由于磁盘故障而崩溃,这组raid5存放的数据是Oracle数据库文件。服务器管理员联系北亚数据恢复中心进行数据恢复。

    服务器数据恢复过程:
    1、北亚硬件工程师对27块硬盘做了硬件检测,发现2块硬盘出现坏道,SMART的错误冗余级别超过阀值。服务器数据恢复工程师对25块完好的磁盘做全盘镜像,对2块故障磁盘进行硬件修复并做镜像备份。

    2、故障分析:对这台IBM存储上收集到的日志信息进行分析,搞清楚2块故障硬盘的掉线先后顺序,从而找到数据最新的那块硬盘,用这块硬盘进行接下来的数据恢复。
     
    3、经过研究,北亚数据恢复工程师确定了套解决方案:
    方案一:通过IBM DS存储管理软件进行强制上线,在强制上线之前把存储的所有硬盘都进行备份,之后进行强制上线。
    方案二:通过对硬盘底层数据分析,进行RAID重组,从底层提取数据,重新加载oracle数据库,调试上层应用。

    4、实施第一种解决方案,先在模拟器上进行测试,之后在存储上进行上线操作。
    通过IBM DS存储管理软件进行强制上线,强制上线之后raid处于降级状态,这个时候设置好热备盘,让热备盘上线进行数据同步,同步完之后上层的卷直接可以用了,所有数据也都可见了,上层应用也能正常使用。
    第一种解决方案节省了很多时间,上层应用也不需要在调试,可以直接启动。


    数据恢复结果:
    由于上层的卷直接可用,数据也都可见了,经过用户亲自验证,数据完整可用。出于安全考虑,还是将卷里的文件都拷贝出来移交给用户。整个恢复过程一共历时5天。

  • 相关阅读:
    POJ1182 食物链---(经典种类并查集)
    HDU1025---(LIS 最长上升子序列 的应用)
    HDU5748---(记录每个元素的 最长上升子序列 nlogn)
    c++ 批量初始化数组 fill和fill_n函数的应用
    JNI 方法注册与签名+BufferedReader使用readLine问题
    正确在遍历中删除List元素
    Head First Java设计模式思维导图总结
    关于一些基础的Java问题的解答(七)
    关于一些基础的Java问题的解答(六)
    关于一些基础的Java问题的解答(四)
  • 原文地址:https://www.cnblogs.com/frombyte/p/16105978.html
Copyright © 2020-2023  润新知