本次要分享的是一台服务器raid磁盘阵列由于多次意外断电导致的raid信息丢失了的数据恢复过程。磁盘阵列的硬件配置在这里也就不多赘述了,阵列中存储的数据是文档文件,Windows 2003 server操作系统,主机没有配置ups。系统意外断电时并未引起管理员的特别注意,重启后也并未影响阵列的正常使用,但后续又出现了多次异常断电的情况,最终导致了重启阵列后raid报错,服务器无法找到存储设备。管理员尝试了很多次重启服务器但是问题并没有解决,raid管理模块在进入时候会导致操作系统死机,只能尝试通过恢复raid阵列的数据进行数据恢复了。
在数据恢复工作中经常遇到上述客户所出现的故障。一部分原因是由于管理员对磁盘阵列的应急机制准备不充足,未能及时检修设备状态等导致阵列可能出现故障时处理及时。另一部分原因是raid阵列一旦创建完成后raid信息理论上不会发生改变,但是意外断电等因素也极易导致raid信息丢失。在本次案例中客户遇到的操作死机这个情况可能就是因为服务器多次断电导致了raid卡硬件也出现了一定程度的损坏。现在客户阵列的数据已经无法通过正常途径进行提取,只能通过数据恢复手段进行解决。下面介绍我们进行数据恢复的过程:
- 数据备份的过程这里就不多赘述了,每次数据恢复前都要进行备份,然后对镜像文件进行操作。在镜像过程中观察客户的磁盘阵列中硬盘的物理状态是否正常,镜像后发现该阵列中的硬盘均为正常状态,无物理故障。
- 使用镜像得来的客户数据进行raid结构分析,根据阵列的文件系统的存储规则分析得出客户这台磁盘阵列中的raid数据块大小、raid盘序以及raid校验方式。使用分析得到的这些raid信息虚拟重组raid阵列。
- 重组完raid磁盘阵列后需要数据恢复工程师对虚拟重建来的数据进行一次逻辑校验,校验的目的是为了在客户验证数据前做一次数据恢复结果的自检,及时发现数据恢复结果中存在的问题,确保无误后再由客户进行验证。
- 在数据恢复工程师对阵列数据进行自检无误后由用户进行数据验证,验证后确定磁盘阵列中的数据已经恢复到故障前的状态,本次raid阵列数据恢复成功。