【故障描述】
一台StorNext服务器,服务器里有一组raid5磁盘阵列,阵列上先后有两块硬盘因为物理故掉线,raid5磁盘阵列发生故障,需要进行服务器数据恢复操作,并携带服务器内所有磁盘来到数据恢复中心进行数据恢复操作。
【磁盘备份】
数据恢复中心使用数据恢复工具对客户服务器内的所有磁盘进行只读模式下的镜像备份,首先将客户服务器内的所有正常硬盘进行标记并接入只读镜像设备上进行备份,对两块有故障的硬盘使用pc3000修复后进行只读备份。并通过镜像文件对服务器数据进行初检。
在数据镜像的过程中,工程师发现其中一块故障硬盘内存在大量的物理坏道,判断其为硬盘掉线的直接原因。
【数据分析】
服务器数据恢复工程师对镜像后的数据进行分析,获得了客户服务器原raid阵列内的raid信息,并使用winhex工具对raid阵列进行虚拟重组操作,在虚拟raid阵列中将客户原服务器内的lun恢复为镜像文件。
在分析数据的过程中发现两块故障硬盘中后离线的硬盘的损坏程度更为严重,存在有大量的坏道,虽然使用数据恢复工具完全镜像了数据,但坏道依然可能对恢复结果产生一定的影响。
登录昆腾存储的管理界面,获取到StorNext文件系统中卷相关的一些基本信息。
继续对StorNext文件系统中的Meta卷和Data卷进行分析,客户的StorNext文件系统中,包含2个Data卷,每一个完整的Data卷都是由多组RAID中的LUN组成的,对这些LUN进行分析,得到LUN之间组合的算法规律,虚拟重组出完整的Data卷。
分析Meta卷,对Meta卷中的节点信息和目录项信息,以及Meta卷和Data之间的对应关系进行分析,针对一个Meta卷管理多个Data卷的情况,研究得到Meta卷到Data卷的索引算法。
【数据恢复】
服务器数据恢复工程师通过数据分析及基础信息的提取已经获取了客户服务器的全部数据,编写数据恢复程序,对服务器卷内的目录项信息及节点信息进行扫描和解析,最终提取了服务器内的节点信息及目录项信息,将这些信息记录在数据恢复程序内。
利用上述分析到的数据信息编写数据提取程序。将客户服务器内的卷进行提取。
【恢复结果】
服务器数据恢复工程师利用数据提取程序对服务器内的数据进行提取,数据提取结束后对提取的数据进行随机抽取验证,验证数据没有异常后将所有数据提取到数据恢复服务器内。联系客户技术进行数据验证,客户亲自验证通过后表示所有数据全部恢复,确认本次数据恢复100%成功。