环境:
IBM DS5300的存储
一个机头连接4个扩展柜
2组由50块600GB的硬盘组的RAID5
故障:
一组由27块600G硬盘组成的,存放Oracle数据库文件的RAID5崩溃。在存储系统上层一共分了11个卷:10个1TB,1个4TB。磁盘故障导致存储不可用。
数据恢复过程:
1、硬件检测:
北亚数据恢复中心的硬件工程师先对27块硬盘做了硬件检测,发现2块硬盘出现坏道、SMART的错误冗余级别已经超过阀值,对25块正常的硬盘进行全盘镜像,对2块有坏道的硬盘用硬件工具进行了恢复并生成镜像文件。
2、故障分析:
首先收集IBM DS5300存储日志信息。存储上两块盘指示灯亮黄灯,用收集到的日志信息分析出两块硬盘的掉线时间,推断出那块硬盘里面的数据是最新的,用数据最新的硬盘进行数据恢复。
3、经过北亚数据恢复工程师的研讨后,提出以下解决方案:
方案一:通过IBM DS存储管理软件进行强制上线,在强制上线之前把存储的所有硬盘都进行备份后强制上线。
方案二:通过对硬盘底层数据分析,进行RAID重组,从底层提取数据,重新加载oracle数据库,调试上层应用。
4、实施方案:
把存储的所有硬盘都进行备份,先采用第一种方案,先在模拟器上进行测试,之后在存储上进行上线操作。
通过IBM DS存储管理软件进行强制上线,强制上线之后raid处于降级状态,这个时候设置好热备盘,让热备盘顶上,进行数据同步,同步完之后上层的卷直接可以用了,所有数据也都可见了,上层应用也能正常使用。
第一种解决方案,节省了很多时间,上层应用也不需要在调试,可以直接启动。
5、数据恢复结果验证:
由于上层的卷直接可以用了,所以数据也都可见了,处于安全考虑,北亚数据恢复工程师将卷里的文件都拷贝出来,然后移交给客户公司。整个恢复过程一共历时5天。
之所以能这么快恢复,还是在于北亚数据恢复工程师之前研究过IBM DS5300的存储原理,北亚数据恢复工程师完全有能力去解决IBM DS5300的数据恢复问题。