DELL EqualLogic PS4000是戴尔为远程或分支办公室、部门和中小企业存储部署提供的存储服务器,可以提供企业级自动化、智能化性能服务,价格合理,管理和部署相对便捷,更适合中小企业及办公室需求,是中型企业级存储的起点产品。但所有的服务器都并非万无一失,某些误操作或服务器物理故障可能会引起服务器内数据的丢失,一旦数据丢失则必然对正常业务造成影响,针对服务器存储的数据恢复技术因此发展起来。最近处理过一起DELL EqualLogic PS4000硬盘损坏导致服务器瘫痪、数据丢失的数据恢复案例。
服务器数据恢复故障描述:
一台DELL EqualLogic PS 4000的存储发生故障,服务器底层磁盘状态如下:单块硬盘容量500GB;硬盘数量为12块;raid级别为raid5;文件系统是VMFS系统;存储划分3个卷,每个卷大小均为1.5T;。
服务器硬盘硬件检测过程:
硬件工程师将服务器所有12块硬盘及逆行简单检测发现其中的2块硬盘坏道较多,SMART错误冗余级别超过阈值,在镜像过程中需将10块正常硬盘进行普通镜像,2块坏道硬盘使用专业数据恢复工具进行坏道修复镜像。
图一
分析服务器镜像文件:
数据恢复工程师从服务器镜像文件中归集出日志信息并分析日志信息。通过分析发现该服务器中有两块硬盘提示黄色指示灯。工程师继续分析两块硬盘的掉线时间,使用后掉线硬盘进行数据恢复操作。
服务器数据恢复方案:
首先对12块盘进行虚拟还原之前的RAID状态,通过位图信息在虚拟出来的RAID中把3个lun全部提取出来。
分析服务器底层结构信息,将这3个VMFS的文件系统进行跨区卷组合,将用户数据导出并验证虚拟的状态有无异常。
图二
图三
服务器数据恢复成功:
服务器数据恢复工程师将卷中的文件进行拷贝导出,然后进行虚拟机验证,虚拟机都可以正常启动。经过漫长的底层分析,加上不断的测试。终于在用户需求的时间内将数据完整恢复,整个恢复过程一共历时3天。服务器数据恢复团队有过DEll Equallogic的存储原理研究项目,知道了DEll Equallogic的存储原理以后,关于它的所有数据灾难都可以进行恢复。