上海市电子政务灾备中心共享式灾备平台
来源:中国电子政务网 更新时间:2015-12-20
一、项目概况

灾备中心共享化是一种符合政府信息化需求特点的建设趋势,即建成后将用一个灾备中心同时满足多个政府部门的数据备份保护需求。同时,灾备是一项长效的、专业的系统工程,只有专业的管理和服务才能将产品、技术、运维、演练有机结合,才能真正将灾备落到实处。然而各政府部门用户普遍“人少事多”,在规划和建设灾难故障备份和恢复系统时,经常面临着许多同样的困惑,例如对灾难故障恢复建设不熟悉、没经验,管理、技术、运维都面临调整、垂直行业无标准或标准混乱;投资保护和长远规划难于兼顾等等。因此,集中建立一个共享的灾备平台,实现专业人员集中管理,将灾备作为一种既统一管理、又可自主选择灾备级别的服务提供给各委办单位使用,能从根本上避免“建而不管,备未无患”的尴尬,采用共享式灾备,能极大的节约灾备中心的软硬件重复性投入。

上海市电子政务灾备中心是目前国内最大的政府灾备中心,机房在张江高科技园区,机房面积达到12000多平方米。灾备中心提供了数据级灾备、应用级容灾、介质异地存放等灾备功能。目前数据级灾备接入37家,应用级容灾自行建设4家,介质存放单位几十家。

二、项目建设模式

上海市电子政务灾备中心是上海市政府投资建设,自行运营的项目。数据级灾备由政府统一采购灾备平台、为单位提供定时、实时、异地备份等服务;应用级容灾则为各大关乎国计民生的重要部门提供了场地,由接入用户自行申报灾备经费、自行运营;介质存放层提供了封闭、全年恒温恒湿的场所,供各委办单位存放重要介质。数据级的传输网络是政务外网,应用级则是由接入单位自行决定,使用政务外网或自建光纤网络。

三、项目建设历程

在规划和建设统一的灾备平台,上海市政府综合考虑技术路线、运维管理、投资保护、长远规划等方面,做到统筹规划、分批实施。2012年,第一期作为试点接入9家单位,为了确保灾备技术的可靠性,接入单位采用了不同的灾备技术,其中包括了华三的存储层复制技术及浪擎的软件备份技术。经过两年试点,浪擎基于软件为核心的灾备解决方案在可靠性、稳定性及用户体验等方面以绝对的优势,获得了各接入单位的好评。2014年作为推广阶段的第二期项目,在通过两轮严谨的技术测试认证后浪擎凭借 “完善的产品架构——同时具备成熟的定时、实时及高端双活解决方案;创新的灾备中心端共享式、两级管理灾备平台;满足两不一致的技术要求”三大亮点获得了专家与客户的高度赞赏,二期计划接入的28家单位全部采用浪擎灾备解决方案,至2015年末,所有单位的项目实施已正式完成并顺利通过验收。

四、浪擎共享式灾备平台解决方案

1、设计思路

统一灾备平台的建立,其最重要的目的是能高质量地满足数据恢复可用的需求。灾备中心信息系统将面对整合所有主流品牌的异构平台的挑战,而且用户应用系统规模、用户技术力量差异较大的现状。鉴于此次建设的目的,并根据制定的原则以及明确的灾备等级要求、业务连续性要求,在对各个业务系统进行科学、合理地分类和归并后,采用模块化方式,建立一套面向全市的、多系统的通用解决方案。其总体设计思路就是,灾备中心建立一个共享式的灾备管理平台来统一管理灾备中心的存储与计算资源,每个委办局单位作为平台的一个接入用户;这个共享式的灾备管理平台建立标准的、菜单式的备份容灾技术方式,满足各类用户、信息系统的差异化需求;接入用户按照其信息系统的实际状况来管理其备份策略、计划、作业、虚拟存储空间。

2、方案架构

共享式灾备平台 上海市电子政务灾备中心

方案架构拓扑图

接入用户根据业务对容灾等级的不同需求选择浪擎不同技术路线的灾备软件,生产端可通过备份软件将业务数据传输到前置存储,按照中心端的调度策略同时也将数据复制到中心端;也可由前置存储自行定时、实时复制数据到中心端。

在用户端发生停电、火灾等较大故障时,在灾备中心端,通过灾备中心的软件可手工恢复数据到用户服务器或磁盘阵列,但恢复时间较漫长;当某台服务器或存储发生故障时,在用户端,通过前置存储的软件实时或定时恢复到备用服务器,优点在于备用服务器与生产服务器数据基本同步,RTO、RPO指标较优;当接入单位业务系统发生故障时,从灾备中心的存储实时恢复数据到灾备中心的容灾服务器或虚拟服务器上,实现应急容灾。数据恢复期间需根据实际环境来配置网络连接等让接入用户能访问容灾服务器的业务系统。

共享式的备份管理平台将每个委办局作为系统的一个接入用户,所有用户共享这个统一的备份管理平台和资源。每个用户拥有独立的虚拟存储、备份策略、计划、帐号等资源。横向扩展可做到灾备中心备份能力的堆叠,灾备中心只需配置更多的服务器和存储加入到共享式备份管理平台中来不断扩充灾备中心的备份支撑能力。当新增一个接入用户时,只需为该用户新增用户端接入子系统即可,无需再购买中心端软件平台。

而传统的备份系统是针对一个用户单位的备份需求来设计其系统架构的。因此,采用这种架构来解决备份中心的需求时,有多少家政府部门要做备份,就需要购买多少套备份系统,这样从技术上无法做到共享管理,管理上则需要维护很多备份软件,从而增加大量的维护工作,造成大量的重复投入。

3、方案功能

浪擎制定了定时备份、CDP备份、数据库双活复制三种技术来构建统一的、适用于全市各异构应用系统的灾备平台。平台规定容量、由用户自行定时复制所有需要保护的业务数据,以实现数据级灾备。定期演练,确保灾备数据可恢复性。

共享式灾备平台 上海市电子政务灾备中心

定时数据备份 几种备份策略的参数比较

浪擎D系定时备份是指对业务系统数据进行定时备份保护业务系统的数据。当业务系统的生产数据发生丢失时,备份数据可以恢复成可用数据进行使用,适合于一些低等级的容灾方案,对RTO和RPO要求相对比较低。D系对备份服务器硬件和网络等无特殊要求,可实现低成本、高保障的数据备份。其支持主流的数据库和文件的备份以及恢复,具有全面保护、安全可靠、功能强大、简单易用等产品特色。

CDP(可持续数据保护)备份容灾技术

浪擎D系DataBackup实时备份是对业务系统数据进行实时在线备份,持续保护业务系统的数据。当业务系统的生产数据发生丢失时,可以实现任意版本、任意时间点的数据恢复、裸机异机恢复,达到RTO、RPO趋于零的保护。

D系实时备份支持定时、实时备份功能;支持本地、异地、远程备份容灾,对备份服务器硬件和网络等无特殊要求,可实现低成本、高保障的热备份和热容灾。其支持主流的数据库、操作系统和文件的备份以及恢复,具有全面保护、安全可靠、功能强大、简单易用等产品特色。

双活容灾

浪擎AgileMirror镜像系统是数据库级别的实时复制容灾产品,将生产端的业务数据实时复制到容灾端服务器上,当生产端业务系统发生故障时,容灾端的备用系统可以无需恢复直接接替生产端的业务系统使用,以保证业务连续运行。镜像系统首倡双活容灾与在线式应用级容灾理念。在线式是指容灾端的备用数据库是在线的,处于可读可查询的状态;应用级是指镜像系统复制的数据是数据库事务,是属于应用层的。具备“零丢失、零恢复、零窗口”三大容灾优势。

共享式灾备平台上海市电子政务灾备中心

基于数据库的双活复制

零恢复:恢复指的是当主服务器系统发生故障到备用系统代替使用的过程。备用数据库是在线的,无需恢复,仅需恢复业务系统即可。所以整个备用系统替换主系统的过程非常快,比其他容灾系统要快。

零丢失:采用实时增量数据复制技术将数据复制到备用系统上,复制延时秒级别,数据丢失量极少,趋于零。只有没被复制到备用系统的数据才会丢失。

零窗口:备份窗口是备份开始到备份结束的一个时间段。镜像系统采用的是实时增量复制,复制的数据量非常小,而且非常快,其备份窗口趋于零,对主服务器性能影响很小。

镜像系统的“容灾、容错、查询”三大核心功能,超越容灾的技术范畴,能盘活用户的容灾投资,从而为用户带来增值的效益。查询功能为用户带来了一个极为实在的用处——创建备用数据库可以用来实现查询统计功能,分流主数据库的性能压力,容错功能防止数据被损坏,保护业务数据。

4、运维与管理特点

接入用户管理和电子政务灾难备份中心两级监管

共享式灾备管理平台设计方案的“两级监管”使备份事务和存储管理独立,两级管理各司其职。电子政务灾难备份中心提供通用备份和存储服务,负责存储、备份作业、各用户状态、网络等的监管。接入单位作为共享式灾备管理平台的一个逻辑用户,拥有可以配置的存储限额,逻辑独立的存储空间。各接入委办局单位也可根据业务应用特点选择不同备份服务类型,或者数据定时备份,或者数据实时备份,或者更重要业务系统的容灾接管,且各自负责本单位各应用的备份策略、计划、代理管理以及日常运营等。

策略管理

某些委办局重要的业务系统需要实现容灾接管的策略功能,则可通过共享式灾备管理平台分配合理的计算点,实现容灾服务器的接管。对于那些不需要容灾接管的委办局业务系统则采取数据定时/实时的备份策略,并通过共享式灾备管理平台的分布式存储技术把数据备份到存储设备上。

统一监控、WEB管理平台

用户端可以安装Web模块负责本区委办单位用户的监控管理,监控整个灾备中心服务设备、网络运行、容灾业务等。无论在用户端还是在中心端,相关的运行监管、备份策略、故障报警等配置都可以通过Web平台界面方便操作和维护。

 强大的横向扩展功能

备份中心面临越来越多需要备份的区委办单位,横向扩展可以做到备份中心备份能力的堆叠。备份中心只需添置更多的服务器和存储加入到共享式备份管理平台中,再将新增的用户指派给这些服务器。这种模式无需再购买共享式灾备管理平台的备份管理软件即可不断扩充中心的接入能力。

5、针对性设计

优化的备份技术

共享式灾备管理平台要解决如何支持更多接入单位的问题,优化的备份技术显得尤为重要。浪擎把每个接入单位作为共享平台的一个用户,且分配不同的用户在不同备份服务器。数据备份过程中,采用了一次性全量和追逐式增量复制技术,保证备端数据的完整性;“备份任务”、“备份目录”两级引索加快备份速度。

优化的网络传输

通过WEB端的统计报表可以对某个特定时间段系统运行速率、流量进行监控、分析、优化。为了避免网络堵塞的情况发生,可以通过调配用户端的备份计划运营时间及备份时间段来保障网络的通畅。

优化的数据捕获与复制

优化的实时复制/双活复制技术,仅复制改变的数据块,或仅复制数据块变化日 志块,大大减少了数据传输量从而保障了网络的通畅;旁路IO复制、异步复制技术,不会造成因复制发生故障而影响用户生产系统。

两层监管

备份中心负责所有用户与存储设备管理、规划、监控全网运营,并为每个用户开设定额虚拟存储池,配置存储策略。各接入单位单位负责本单位各应用的备份策略、计划、代理管理以及日常运营等。?两级管理可清晰划分两级的职责、工作内容,减少后期运营的纠纷、运维成本。

6、方案特色

一对多的统一管理平台

建立统一备份管理平台,实现一(中心)对多(用户)的菜单式备份服务,每个接入单位作为系统的一个独立用户,同一用户可有多个应用同时备份且可根据应用特点选择不同备份服务。所有用户共享一个灾备平台,无需购买单独的备份系统,节约投入成本。

每个接入单位作为独立用户

每个接入单位作为系统的一个独立用户,拥有独立的存储、备份策略、计划等资源;拥有限额的、虚拟的、逻辑独立的存储。接入单位可根据应用特点选择不同备份服务类型,在同一应用单位里允许有多个应用备份。灾备中心为每个用户提供虚拟、透明的存储池,根据每个用户的实际业务备份需求分配不同的存储限额,无需用户参与管理。

统一备份门户

浪擎制定了定时备份、CDP备份、数据库双活复制三种技术来构建统一的、适用于全市各异构应用系统的灾备平台。接入单位可根据自己对业务连续性要求来选择不同技术路线的产品,对实时性、可用性、可靠性要求较高的业务系统采用双活容灾、实时复制方式;对非重要业务系统采用定时备份。平台规定容量、由用户自行定时复制所有需要保护的业务数据,以实现数据级灾备,且定期演练,确保灾备数据可恢复性。

良好的扩展性

共享式的备份管理平台将每个委办局作为系统的一个接入用户,所有用户共享这个统一的备份管理平台和资源。横向扩展可做到灾备中心备份能力的堆叠,灾备中心只需配置更多的服务器和存储加入到共享式备份管理平台中来不断扩充灾备中心的备份支撑能力。当新增一个接入用户时,只需为该用户新增用户端接入子系统即可,无需再购买中心端软件平台。