走出RAID数据恢复的概念误区
来源:互联网 更新时间:2012-04-13

 

  如果询问100个IT管理员“最担心的故障是什么?”,想必99%的资深负责人会告诉您是“RAID数据灾难”。的确,高速海量存储已经成为企业信息化办公的中枢神经,一旦这条中枢神经瘫痪,那么大量相关的操作将无法进行,企业的顺利运作也将成为一种奢望。

  为此,每当我们的预算专家在年底预报IT经费时,颇有经验的老板们或者相关部门负责人都是鼎力支持。平心而论,近期RAID技术已经有了不少改进,特别是针对RAID5的扩展。然而如果大家就此认为彻底安心,那么您将面临更大的危机。飞客数据恢复中心近期成功恢复了不少被认为是“铁闸式”RAID5的磁盘阵列,这将会给大家带来一些启示。

  RAID5的缺点就是在一块硬盘发生故障后,RAID组从在线状态变为降级状态,这时如果第二块硬盘出现故障,那么整个RAID组的数据都将丢失,这对企业来说是灾难性的。惠普RAID5ADG技术则在原理上克服了这一缺陷,其最大特点是部署了2个奇偶校验集,并提供了2个硬盘的容量存储这些奇偶校验信息,理论上能同时允许2块硬盘出现故障,突破了以往RAID允许在同一时刻只可以有一块硬盘发生故障的限制,很有效地提高了服务器硬盘上数据的可靠性。RAID5ADG比双RAID0+1具有更低的实施成本,却能提供比 RAID 5 更高的容错能力。

  然而以上仅仅是理论分析,在实际应用中,大家并不能简单地将RAID5ADG理解为两倍于普通RAID5的安全性。RAID5ADG数据校验方法比较特殊,之所以实现允许两块硬盘同时掉线,其关键在诹榛畹夭捎昧死嗨平徊嫒缺傅募际酰还惨虼说贾滤俣燃趼6杂谝桓龃排淌拷隙嗟恼罅卸裕鱿止收系脑蚩赡苁怯才瘫旧砝匣慌晒旱挠才毯苡锌赡茉诜浅=咏氖奔涠文谒鸹怠R坏┮豢橛才痰粝呙挥幸鹬厥樱踔亮娇橛才痰粝叨藜糜谑拢敲凑龃排陶罅芯拖嗟蔽O铡4送猓琑AID5ADG仅仅是保证两块硬盘掉线时数据校验的完整性,而并不是RAID可以轻易启动并工作。在慌忙之中,用户往往习惯于多整个RAID进行大幅度操作。一旦其它暂时没有掉线的硬盘存在因为物理坏道而隐含的不稳定因素,那么其结局就相当危险了。

  近期,飞客数据恢复中心接到两起采用RAID5ADG的数据恢复案例。其中一起是用户及时发现了一块硬盘掉线,随后在更换新硬盘时将顺序弄错,最终导致RAID崩溃。另一起则是在一块硬盘掉线后丝毫没有重视,待到两儿块硬盘也掉线时方才想到重建数据。按理说两块掉线对于AGD而言问题不大,然而就在数据校验的过程中,另外一块尚未掉线的硬盘也突然崩溃,此时无异于灭顶之灾。

  从结果来分析,我们可以认识到这两点:磁盘阵列内的硬盘是否有顺序的要求以及非掉线硬盘的稳定应当特别小心。很多人认为磁盘阵列内的硬盘顺序不是很重要,但这是严重错误的。假如您用10个硬盘做阵列,在最出初始化时,此10个硬盘是有顺序放置在磁盘阵列内,分为第一、第二…到第十个硬盘,是有顺序的。如果您买的磁盘阵列是有顺序的要求,则您要注意了:有一天您将硬盘取出,做清洁时一定要以原来的摆放顺序插回磁盘阵列中,否则您的数据可能因硬盘顺序与原来的不苻,磁盘阵列上的控制器不认而数据丢失!而至于自行操作的强制上线,则更应该小心暂时还未掉线的硬盘是否稳定。

  如果在操作RAID时缺乏经验,我们建议大家咨询服务器售后服务工程师,在涉及到一些高难度的技术问题时,选择专业的数据恢复服务商也将是很好的选择。针对目前RAID灾难屡见不鲜并且服务器售后服务并非以确保数据安全为核心的服务策略,越来越多的企业用户选择了固定数据恢复服务商。数据恢复将是企业数据安全防护体系中最后的一道屏障。随着技术逐渐成熟并且强势服务商的服务彻底到位,其保险程度也足以令人放心。目前飞客数据恢复中心已经在全国推行了本地化服务,为同样分公司众多的大型企业提供强有力的支持,而领先业界的RAID数据恢复技术更在行业内得到一致公认。(