系统容灾:我不是高端专利
来源:PConline 更新时间:2012-04-13

  以前提起容灾,往往人们会首先想到这是在高端计算系统和应用系统中才会用到的艰深的东西。但是大多数人对容灾的意义和诸多细节又不甚了了。殊不知,在当今信息化系统应用日趋广泛和深入的时候,容灾已经是我们IT系统中的重要组成部分了。

鸡蛋别放一个篮子里

  信息化发展到今天,数据的大集中、数据价值的实现已经是信息化系统的主要作用之一。在数据大集中的基础上,我们日常的生产生活也越来越依赖信息系统上承载的丰富多样的应用。用一个形象的比喻,我们把越来越多的关键数据、关键应用放在了一个篮子里。在这种情况下,以前往往被人们忽视的一个重要问题——如何保证数据、业务在重大灾难过程中的平安,进而让已经严重依赖它们的企业、机构顺利渡过难关,在最短的时间内恢复正常运转——很明确地摆在人们面前。

  这样我们面临着一个矛盾:信息化的不断深入,需要将众多关键数据集中管理,通过数据的整合和其价值的进一步开发,实现对业务的支撑乃至提升。另一方面,在数据大规模集中特别是关键数据大集中的过程中,保障信息、保障整体业务的安全的迫切性也日益突出。有权威机构预测,在严重的灾难之中,将有60%以上的企业因其信息系统被破坏、关键数据丢失导致的业务瘫痪而倒闭。在这种情况下,我们往往需要把鸡蛋放在多个篮子里。从这一角度说,容灾目前备受瞩目也就不足为奇。特别是以往不会考虑容灾的广大中小企业和机构,也纷纷寻求实施容灾的可能性,而电信、金融以及其他国家要害部门,更把容灾作为信息系统进一步完善过程中的核心工作之一。

容灾,其实并不难实现

  不过对于中小企业和机构而言,最大的顾虑在于以往容灾高高在上的“地位”。以往容灾大多在高端计算领域出现,应用范围也仅仅局限在超大型跨国企业和金融、电信的要害部门。容灾方案往往也为高实施成本、高维护成本画上等号。但是实际上,这样的理解并不全面。

  说到容灾方案和技术,总体上可以区分为离线式容灾(冷容灾)和在线容灾(热容灾)两种类型。

  所谓离线式容灾主要依靠备份技术来实现。其主要步骤是将数据通过备份系统备份到磁带上面,而后将磁带运送到异地保存管理。这种方式主要由备份软件来实现备份和磁带的管理,除去磁带的运送和存放外,其他步骤可实现自动化管理。

  离线式容灾方案的部署和管理比较简单,相应投资也较少。但缺点也比较明显:由于是采用磁带存放数据,所以数据恢复较慢,而且因这种备份并非达到频繁备份,未来得及备份的数据都会丢失,实时性比较低。

  在线容灾要求生产中心和灾备中心同时工作,生产中心和灾备中心之间有传输链路连接。数据自生产中心实时复制传送到灾备中心。在此基础上,可以在应用层进行集群管理,当生产中心遭受灾难出现故障时可由灾备中心自动接管并继续提供服务。应用层的管理一般由专门的软件来实现,可以代替管理员实现自动管理。

  从上面的介绍中我们可以看到,容灾的核心之一,是数据的复制和备份。然而在这里需要说明的是,容灾与备份所实现的作用或者说保障的层面是不同的。数据备份实际上实现的是数据的保护与恢复;容灾则在保护数据的基础上,实现对应用、对业务乃至对整个企业正常运转的保护。

容灾方案的规划与实施:从需求出发

  既然容灾体系对于我们的业务、企业日益重要,容灾又是一个涉及包括业务在内多方面内容的一个问题,那么对于更广范围内的各个信息化应用的单位而言,如何决定是否实施容灾方案,决定究竟采用哪种容灾方案?

  从目前业内的一般情况而言,容灾方案的确定一般需要经过7个步骤,包括灾难类型分析、业务冲击分析、当前业务环境及恢复能力分析、容灾策略制订、容灾方案设计、业务连续性流程设计、业务连续性流程及容灾方案管理和测试。

  这一过程看似非常庞杂繁琐,实际上并不复杂。在筹备容灾项目的时候,首先需要评估、判断目前数据、应用、数据对连续性、可用性的要求是否需要对容灾进行投资。接下来是需要根据业务运作的实际情况、可能遇到的灾难以及在灾难发生之后对业务的影响程度进行深入分析,并且根据目前的应用架构对灾难的承受能力,确定采用的容灾等级和容灾的方向。接下来就可以对容灾体系进行规划和实施了。当然这其中还包括与容灾相关的制度、流程、业务的梳理和整合。

  具体而言,对于中小企业等对于RPO、RTO容忍程度较高、关键数据较少、对IT系统依赖相对较低的场合,可以采用低成本、高RPO、RTO的离线数据备份方式以及本地备份方案,备份介质选择通常可以采用磁带。而对于关键数据量庞大、关键业务运行完全依赖于IT系统但是对RPO、RTO有一定的容忍度的场合,可以在本地高可用体系下,采取存储方案高低搭配、离线备份与在线备份结合的方式实现容灾。例如可以采用浪潮AS500存储系统、SAN架构作为主存储系统,浪潮AS330G2存储系统、iSCSI技术作为备份存储系统,同时配以磁带实施异地备份的方式来实现容灾。

  当然对于要求零数据丢失、零灾难恢复时间,对用户实现透明切换的关键部门、关键领域,就需要完备的灾难备份体系和远程灾难备份中心。主系统与远程灾难备份中心往往实施相同的计算架构,在存储解决方案上,采用同步复制的高级数据管理,在这种环境之下,更多的会采用高成本的全光纤架构和远程光纤传输方案,保证业务的连续性和高可用性。

  总而言之,从目前的情况来看容灾的实施既是逐渐迫在眉睫的事情,同时又是需要深入思考和规划的事情。在容灾的实施方案选择的过程中,则有多种方案以适应各种不同层次、不同目标的容灾需求。选择容灾方案的出发点,根本还是依据实际情况而行。