浙江劳保IT运维管理方案
来源:天极网 更新时间:2012-04-15

 
  项目背景

  劳动和社会保障信息化建设,即“金保工程”,是我国电子政务建设的12个重点工程之一。从中央到地方,各级政府高度重视劳动保障信息化建设工作,随着近年来金保工程大力推进,我国劳动和社会保障信息化水平得到明显提升。

  一直以来,浙江省劳动保障厅领导十分重视劳动保障方面的信息化建设工作,依据党中央、浙江省委省政府、劳动保障部提出的各项方针和要求,积极推进浙江省劳动保障信息化的各项工作。随着金保工程的提出和不断推广建设,浙江省劳动保障厅的信息化建设取得了丰硕的成绩,具有一定的规模。浙江省劳动保障厅信息中心承担着全面推进浙江省劳动保障厅的信息化建设,承担着浙江省劳动保障厅日常办公等核心业务的运行维护管理工作,如门户网站、社保、就业、养老保险、劳动综合等劳动保障行业专有业务系统,是浙江省劳动保障信息网络的核心和枢纽。为浙江省劳动保障业务的开展提供了有力保障。

  省厅信息中心作为全省劳动保障业务专网的核心和枢纽,上联国家劳动部,下联全省各地市,承担着整个金保系统的管理和维护工作。目前省厅信息中心缺少必要的网络监控、应用监控和系统管理工具,无法对网络中的设备以及链路状态、关键应用进行有效的监控,对于网络中产生的各种问题和故障处理比较难于定位。为了确保整个劳动保障业务系统稳定、可靠、安全的运行,更好的为劳动保障业务系统提供服务,我们将在遵循可靠性、可用性、可维护性和可扩展性等的设计原则下,建设一套管理简便、便于扩展、可以进行更深层次开发的网络监控、性能监控管理系统。

  项目建设目标

  系统需要按照高起点、高标准、高质量的要求,采用先进的IT监控技术实施系统管理、应用管理、网络管理,对信息中心现有的系统运行环境进行信息采集、管理和监控,并在此基础上构建一个平台化、智能化、集成化、高可靠性的集中网络运行管理平台,用于信息中心日常运行管理。平台具有计算机网络、重要网络设备、骨干网链路、业务应用等的监控报警功能,将管理、监控有机地结合起来,提升整个信息中心的网络管理水平。

  项目的建设要实现如下目标:

  ■浙江省养老保险信息系统和劳动保障业务专网性能监控平台通过一体化的网络管理和系统管理策略和技术手段,管理监控浙江省劳动和社会保障厅的网络设备、通信线路、数据库服务器、应用服务器、安全设备等,为浙江省劳动和社会保障厅提供安全、可靠的运行环境。

  ■由被动管理转化为主动管理,过去一般在问题出现后才进行干预和处理,通过管理系统的建设,将对浙江省劳动和社会保障厅网络及应用系统进行主动管理,及时发现可能出现的问题征兆,主动采取管理措施,防止问题的发生。

  ■由分散管理转化为统一管理,将对浙江省劳动和社会保障厅网络、应用系统、安全设备统一管理,建构统一的管理体系,并根据实际管理需要进行分层和分工管理。

  ■通过一体化的网络管理策略和技术手段,实现对浙江省劳动和社会保障厅网络设备、服务器、业务应用、安全设备的整体监测;

  ■对网络设备、服务器、系统、应用、安全设备进行统一的数据采集和分析,实现对浙江省劳动和社会保障厅信息网络的综合管理;

  ■从网络管理、服务器及应用管理角度实现浙江省劳动和社会保障厅网络设备、服务器及应用的安全管理;

  ■实现在复杂的异构环境中面向业务的服务管理,保持浙江省养老保险信息系统和劳动保障业务专网性能监控平台的可靠性和可用性,保证系统不间断地为用户提供可靠服务;

  ■建立与浙江省劳动和社会保障厅管理体系相适应的管理辅助工具,包括网络管理、服务器管理、应用管理、安全设备管理,系统基于ITIL规范的IT运行维护管理等,从而最大限度地屏蔽IT技术的复杂性,实现自动管理,降低对人的依赖;

  ■允许增加新的IT资源,且不用担心丧失事件集成,方便纳入统一管理;

  ■总结出对网络管理、服务器及应用管理、安全设备管理、流程管理等有用统计的信息,为管理者提供更全面的、更直接的管理信息,为制订相关决策提供基础。

  实施效果分析

  从上述分析来看,浙江省养老保险信息系统和劳动保障业务专网监控平台规模宏大,边界条件复杂,自然因素、人为因素众多,它的建设管理本身就是一个庞大而复杂的系统工程,如何科学有序地进行管理是网络运行管理系统项目的重要课题。为此,需要依靠现代信息技术,用计算机网络系统,把各设备信息、各项管理信息、各类故障信息、各自然参数等联系起来,成为一个有机的整体。因此该项目所采用的产品不仅要有完善的监控能力,还要具有出色的事件处理能力和业务展现能力,本身要有极高的开放性和扩展性,能够满足后续不断变化的需求和扩展。新一代的网络管理系统,已开始从面向单一应用的管理向面向综合业务的管理过渡。

  通过分析得出,实施浙江省养老保险信息系统和劳动保障业务专网监控平台后能得到以下收益:

  ⑴规范化运行维护管理和考核

  提高自动化监测水平,避免消耗大量的人力和时间;

  采用预警机制,在用户发现系统故障前及时解决问题;

  提供了资产数据和知识的集中手段,减轻对个人的依赖;

  有效的提高运维的流程协作,缩短处理故障的时间;

  ⑵准确地反应网络故障,提高故障处理效率

  网络运行管理系统必须能预先监测问题,及时发现故障,迅速定位故障,还要有一定推理故障根源的能力,再配合规范化的运行维护管理流程、知识库管理等,将专家系统、网络故障和性能管理相结合,使网管系统逐步具备分析决策能力。变更传统的被动应答故障处理方式为前瞻式监测的管理方式。

  ⑶准确反映网络及应用的性能,提高网络运行性能

  通过对网络设备、网络链路、服务器及应用预设阀值,自动监控网络、服务器及应用的性能参数,当监测性能参数超出预设监控阀值,系统自动发出告警,提醒网络管理员进行处理。

  提供实时监测功能,可以实时查看各种网络设备、服务器及应用的性能参数,随时了解网络设备、服务器及应用的运行情况。

  提供统计分析功能,对历史性能数据进行统计分析,并自动生成图文并茂的统计分析报表,辅助管理员发现系统存在的性能瓶颈,为网络调优、升级决策提供科学依据。

  ⑷整合系统管理,提高对信息系统的控制能力

  随着计算机网络的发展和信息化的建设,系统中包括大量的网络设备、服务器、应用系统、安全设备等,各种设备、应用系统都提供了相应的管理、监测、维护手段,但这些管理、监测、维护工具分散在各个系统中,现有的系统维护人员无法有效的使用、监控这些系统。所以,需要对这些分散的监控对象进行整合,整合之后的网络运行管理系统提供故障信息统一接入、集中展现、集中通知、集中处理功能,对浙江省劳动和社会保障厅的网络设备、服务器、应用系统、安全设备等提供集中的、全面的监控和管理手段,提高对信息系统的控制能力。

  ⑸面向业务的网管

  新一代的网络管理系统,已开始从面向网络设备的管理向面向网络业务的管理过度。这种网管思想把网络服务、业务作为网管对象,通过实时监测与网络业务相关的设备、应用,通过模拟客户实时测量网络业务的服务质量,通过收集网络业务的业务资料,实现全方位、多视角监测网络业务运行情况的目的,从而实现网络业务的故障管理、性能管理和配置管理。