服务器RAID数据恢复
浏览数:54

常见的RAID/服务器故障表现


  如果您的服务器(Raid阵列)已出现上述故障中的一项或多项,为了您的数据安全,请及时将其关机。磁盘阵列常采用高性能SAS硬盘,如果硬盘磁头损坏而不及时关机,损坏的磁头可能与碟片长时间接触,将碟片划伤,影响数据恢复效果,甚至可能导致数据无法恢复。


RAID为什么会发生故障?

      Raid故障通常表现为两块或多块硬盘离线(或亮灯报警),Raid无法正常运行从而造成数据丢失,从日常案例中,95%以上的RAID-5故障表现为两块硬盘离线,且其中一块硬盘往往已离线很久。既然RAID针对数据安全提供了不同的容灾手段,为什么还会发生数据丢失? 数据安全是建立在"硬盘稳定可靠"及"阵列模式安全稳定"两个基础上,它们任何一项出现问题,数据都会存在丢失的风险。

 磁盘的稳定性及可靠性。这是所有磁盘介质内数据安全的基础,希捷7200.11代硬盘“固件门”事件,让人们开始关注机械硬盘质量对于数据安全的影响。而近几年,随着高密度硬盘普及,厂商为压缩成本,造成市面上硬盘质量整体下滑,很多硬盘仅使用几个月就出现故障,在这种前提下,即使采用最安全的阵列模式,数据也有丢失的可能。

 阵列模式的安全性。几种主流RAID级别经过多年发展,已非常稳定,但这种安全性被过分夸大后,就会给用户造成“Raid是100%安全”的错觉,使用户放松警惕。当阵列中一块硬盘出现故障,Raid仍可正常运行,多数用户不会及时排除故障,当第二块硬盘发生故障后,RAID机制丧失,阵列崩溃,此时就需要专业公司进行数据恢复了。


以下列举了常见的RAID故障及其表现形式:

 RAID故障表现


RAID故障后的正确操作

 及时关机,切勿长时间开机运行。由于服务器(Raid阵列)多采用高性能SAS硬盘,转速可达10000RPM甚至15000RPM,在实际案例中,经常遇到用户不及时断电,导致碟片与磁头长时间接触,使磁粉脱落,造成数据无法恢复的重大损失。因此,服务器(Raid阵列)发生故障后,应及时关机,切勿反复开机尝试。

 切勿反复重启。Raid(尤其Raid-5或Raid-6)无法运行时,故障现象通常表现为两块或多块硬盘离线,而其中一块硬盘往往已离线很久,有时这块硬盘是由于逻辑原因离线,而重启后,该硬盘上线参与同步操作,造成阵列数据"污染"。

 切勿盲目更换硬盘进行同步操作。由于Raid的容灾机制,及时将故障硬盘替换后,Raid会自行完成同步操作。但实际案例中,同步没有完成,其它硬盘又离线的情况很多,这是由于同步过程进行。

 致电正规数据恢复公司寻求帮助。目前中国数据恢复市场鱼龙混杂,不同恢复机构的技术水平和职业素质千差万别,正规公司价格相对较高,但成功率也高,用户应慎重选择,切勿贪图便宜造成无法挽回的损失。


RAID故障友情提示

科普知识:RAID常见级别及适用范围

      RAID(独立冗余磁盘阵列)是大数据时代最好的存储手段,它既解决了单块硬盘容量无法达到使用要求的问题,又提供了不同级别的灾备措施,用户可根据需要灵活定制适用的阵列模式来存储大容量数据,常见的阵列方式有以下几种:

常见RAID级别

常见RAID级别说明