服务器Raid阵列故障:
某品牌的光纤存储上由14块硬盘组成raid,10号盘和13号盘出现故障警报,卷无法挂载,存储无法工作。管理员联系我们数据恢复中心要求对存储进行数据恢复并修复其中的数据库。
服务器raid数据恢复过程:
1、通过storage manager查看这台存储,发现存储逻辑卷状态失败,阵列中的10号盘和13号盘报告“失败”,6号硬盘报告“警告”,数据恢复工程师只好先通过备份的日志状态对逻辑卷的结构进行分析,为数据恢复工作获取更多的数据。
2、管理员把故障存储上的14块硬盘编号后取出交给数据恢复工程师。数据恢复工程师对这些硬盘进行初检,发现阵列中所有磁盘都可以正常识别,6号盘smart状态为“警告”状态。
3、数据恢复工程师将阵列中所有磁盘状态标记为“脱机”,然后对阵列中的所有磁盘进行镜像备份。在备份的过程中数据恢复工程师发现先前报错的6号硬盘备份的速度十分缓慢,可以判断该盘应该存在大量坏道或者不稳定扇区,需要进行单独处理。
4、改用坏道硬盘的镜像工具单独对6号硬盘进行镜像,同时观察镜像的稳定和速度情况。(如果硬盘存在大量的不稳定扇区,可以通过调整磁盘镜像工具的“硬盘镜像设备的响应等待时间”、“遇到坏道跳过扇区的数量”等参数,直到完成所有扇区的镜像)
5、完成所有磁盘镜像后查看日志,数据恢复工程师发现1号盘也存在有坏道,10号盘和13号盘也存在大量的不规则坏道。
6、数据恢复工程师对文件系统进行逆向分析获取到raid磁盘阵列中的硬盘盘序、raid校验方向、块大小等基本信息,通过这些信息重组raid。
7、完成raid的重组搭建后,数据恢复工程师进一步分析文件系统,提取出数据库的dmp文件并导入,完成数据恢复。
8、数据恢复工程师和管理员先后对恢复出来的数据进行验证,没有发现问题,数据恢复成功。