如果询问100个IT管理员“最担心的故障是什么?”,想必99%的资深负责人会告诉您是“RAID数据灾难”。的确,高速海量存储已经成为企业信息化办公的中枢神经,一旦这条中枢神经瘫痪,那么大量相关的操作将无法进行,企业的顺利运作也将成为一种奢望。
为此,每当我们的预算专家在年底预报IT经费时,颇有经验的老板们或者相关部门负责人都是鼎力支持。平心而论,近期RAID技术已经有了不少改进,特别是针对RAID5的扩展。然而如果大家就此认为彻底安心,那么您将面临更大的危机。飞客数据恢复中心近期成功恢复了不少被认为是“铁闸式”RAID5的磁盘阵列,这将会给大家带来一些启示。
RAID5的缺点就是在一块硬盘发生故障后,RAID组从在线状态变为降级状态,这时如果第二块硬盘出现故障,那么整个RAID组的数据都将丢失,这对企业来说是灾难性的。惠普RAID ADG技术则在原理上克服了这一缺陷,其最大特点是部署了2个奇偶校验集,并提供了2个硬盘的容量存储这些奇偶校验信息,理论上能同时允许2块硬盘出现故障,突破了以往RAID允许在同一时刻只可以有一块硬盘发生故障的限制,很有效地提高了服务器硬盘上数据的可靠性。RAID ADG比双RAID 0+1具有更低的实施成本,却能提供比 RAID 5 更高的容错能力。
然而以上仅仅是理论分析,在实际应用中,大家并不能简单地将RAID ADG理解为两倍于普通RAID5的安全性。RAID ADG数据校验方法比较特殊,之所以实现允许两块硬盘同时掉线,其关键在于灵活地采用了类似交叉热备的技术,不过也因此导致速度减慢。对于一个磁盘数量较多的阵列而言,出现故障的原因可能是硬盘本身老化,而同一批采购的硬盘很有可能在非常接近的时间段内损坏。一旦一块硬盘掉线没有引起重视,甚至两块硬盘掉线而无济于事,那么整个磁盘阵列就相当危险。此外,RAID ADG仅仅是保证两块硬盘掉线时数据校验的完整性,而并不是RAID可以轻易启动并工作。在慌忙之中,用户往往习惯于多整个RAID进行大幅度操作。一旦其它暂时没有掉线的硬盘存在因为物理坏道而隐含的不稳定因素,那么其结局就相当危险了。
近期,飞客数据恢复中心接到两起采用RAID ADG的数据恢复案例。其中一起是用户及时发现了一块硬盘掉线,随后在更换新硬盘时将顺序弄错,最终导致RAID崩溃。另一起则是在一块硬盘掉线后丝毫没有重视,待到两儿块硬盘也掉线时方才想到重建数据。按理说两块掉线对于AGD而言问题不大,然而就在数据校验的过程中,另外一块尚未掉线的硬盘也突然崩溃,此时无异于灭顶之灾。
从结果来分析,我们可以认识到这两点:磁盘阵列内的硬盘是否有顺序的要求以及非掉线硬盘的稳定应当特别小心。很多人认为磁盘阵列内的硬盘顺序不是很重要,但这是严重错误的。假如您用10个硬盘做阵列,在最出初始化时,此10个硬盘是有顺序放置在磁盘阵列内,分为第一、第二…到第十个硬盘,是有顺序的。如果您买的磁盘阵列是有顺序的要求,则您要注意了:有一天您将硬盘取出,做清洁时一定要以原来的摆放顺序插回磁盘阵列中,否则您的数据可能因硬盘顺序与原来的不苻,磁盘阵列上的控制器不认而数据丢失!而至于自行操作的强制上线,则更应该小心暂时还未掉线的硬盘是否稳定。
如果在操作RAID时缺乏经验,我们建议大家咨询服务器售后服务工程师,在涉及到一些高难度的技术问题时,选择专业的数据恢复服务商也将是很好的选择。针对目前RAID灾难屡见不鲜并且服务器售后服务并非以确保数据安全为核心的服务策略,越来越多的企业用户选择了固定数据恢复服务商。数据恢复将是企业数据安全防护体系中最后的一道屏障。随着技术逐渐成熟并且强势服务商的服务彻底到位,其保险程度也足以令人放心。目前飞客数据恢复中心已经在全国推行了本地化服务,为同样分公司众多的大型企业提供强有力的支持,而领先业界的RAID数据恢复技术更在行业内得到一致公认。
飞客数据恢复中心http://www.fix.com.cn
飞客数据恢复中心全国免费服务电话800-810-6696