服务器存储故障:
某品牌服务器存储由于未知原因崩溃,管理员排查故障时发现存储中两块硬盘离线,硬盘所在raid5阵列无法使用,存储内数据丢失,管理员联系我们数据恢复中心恢复该raid5中的数据。
服务器存储数据恢复过程:
1、数据恢复工程师赶到现场对该故障raid中的磁盘进行物理检测,发现该raid中2块离线硬盘均没有硬件故障。
2、数据恢复工程师首先将该raid中所有磁盘进行镜像备份,备份文件存储至数据恢复中心的数据恢复平台上,将原存储中所有磁盘交还给管理员。所有的数据恢复操作均在该数据恢复平台中进行,以保证原始数据不被修改和破坏。
3、服务器数据恢复工程师对raid镜像文件分析发现该raid中有两块热备盘,硬盘离线时只有一块热备盘成功激活,此时raid5阵列仍然处于缺盘状态,数据并未同步。
4、数据恢复工程师分析raid中的硬盘分布规律、raid条带信息、盘序信息。根据上述分析获取到的RAID信息分析每一块硬盘中的数据,数据恢复工程师发现有一块硬盘在同一个条带上的数据和其他硬盘明显不一样,因此初步判断此硬盘可能是最先掉线的。数据恢复工程师使用RAID校验程序对这个条带进行校验,最终确定最先掉线的硬盘。
5、数据恢复工程师根据获取到的raid信息重组raid,通过重组出的raid分析lun的分配和数据块情况。数据恢复工程师用软件导出lun并解析文件系统时提示报错,重新调试后报错依然存在。排除软件故障导致的文件系统解析报错后,数据恢复工程师对导出的文件进行手动检查,发现软件解析报错的原因是文件系统元文件损坏。出现这种情况的原因可能是存储瘫痪时zfs文件正在进行IO操作,导致文件系统元文件没有更新和元文件损坏。由于利用软件无法解析文件系统,北亚数据恢复工程师只能手动对zfs文件系统中损坏的元文件进行修复,然后再进行解析。
6、将修复好的文件系统再次使用软件进行解析,成功解析所有文件节点和文件目录结构,将数据导出。
服务器存储数据恢复结果:
管理员在数据恢复中心的数据恢复平台上对导出的数据进行验证,确认数据恢复成功。