raid5磁盘阵列相比较其他阵列具有更好的安全性,当阵列中有硬盘出现故障时,只需要对离线的硬盘进行替换即可,但是一旦阵列中同时出现两块或者多块硬盘离线的情况,那么阵列就会崩溃,本案例详细介绍了阵列2块硬盘掉线数据恢复的过程。
数据恢复背景:
某企业的光纤存储上一共16块硬盘,管理员发现存储的卷无法挂载,检查存储设备发现有2块硬盘离线,需要对存储进行数据恢复。
开始进行数据恢复工作:
管理员对当前的存储状态进行检查,通过storage manager把存储目前现有的日至状态进行备份,以备后期数据恢复时进行分析使用。然后管理员按照存储内的硬盘顺序将硬盘移出存储设备开始进行数据恢复操作。
首先管理员将所有硬盘挂载到Windows环境下,将硬盘状态变更成为“脱机”并将所有硬盘进行扇区级备份,得到镜像文件,接下来就开始恢复数据了。
对存储的镜像文件进行分析查询发现阵列中1号硬盘、10号硬盘、13号硬盘均存在大量的不规则坏道,并且严重破坏了EXT3文件系统的关键性源数据信息,无法直接通过镜像恢复存储内的数据,只能通过同一条带进行XOR同时根据ext3文件系统的文件结构对被破坏了的信息进行手动修复。
查看日志,发现在storage manager和硬盘SMART状态中均没有报错的1号盘也存在坏道,10号和13号盘均存在大量不规律的坏道分布,根据坏道列表使用软件定位到目标镜像文件分析发现,ext3文件系统的一些关键源数据信息有的已经被坏道所破坏,只能等待6号盘镜像完毕后,通过同一条带进行xor以及根据文件系统上下文关系的方式手动修复被损坏的文件系统。
根据文件系统的日志文件分析得到了这台存储内所有磁盘的盘序,raid块大小,raid的校验走向等数据恢复基本信息,得到这些数据恢复基本信息后再通过数据恢复软件重组一个raid磁盘阵列,阵列重组完成后进一步解析文件系统。由于存储中的主要数据为oracle数据库,所以尝试通过提取dmp文件恢复数据库。
经过一段时间的工作,数据恢复工程师将提取出来的dmp文件导入验证,一切正常,本次磁盘阵列数据恢复十分成功。