走进大数据时代
来源:大众日报 更新时间:2014-06-19

    很大程度上,我们不是缺乏挖掘和分析数据的技术,而是缺少数据本身。
  我国政府在宏观上调控着国家各项事业的运行发展,事实上是一个巨大的数据库,这些海量数据一旦被社会各界充分利用,不仅会推动自身政务水平的发展,更将产生不可估量的经济价值和社会价值。
  21世纪与其说是信息时代,不如说是数据时代。大数据的触角已经延伸到世界的各个角落。
  “大数据”可以看做“数据”的升级版概念。业界将“大”字赋予了四种含义:大容量、高速度、多样化、大价值。据统计,全世界90%的数据都是在过去十年内产生的,并且数据的类型丰富多样。中国工程院院士高文认为,从2013年到2020年,网络上各种各样的数据容量会达到40Zb(1Zb=1024×1024×1024Tb),大概比现在增加50倍。目前,大数据每年可为欧洲公共管理领域带来约2500亿英镑的巨额价值。
  目前,我国电子政务呈现“重信息,轻数据;重储存,轻开放”的总体特征
  其实大数据的应用与我们的生活密切相关。美国安泰保险为了帮助改善代谢综合征患者的预测,在连续三年内,扫描600000个化验结果和180000个索赔事件,并将最后的结果组成一个高度个性化的治疗方案,以评估患者的危险因素并调整治疗方案。洛杉矶政府在某州际公路上建立了一条收费的快速通道,通过交通数据的综合分析来引导驾驶人员的行驶情况,以保证交通畅通。如果司机支付给快车道,他必须保证车速在每小时45英里以上;如果交通开始出现拥堵,私家车的支付价格将上升,以减少他们进入,而将快车道更多用于高占用率的车辆,如公共汽车。
  从本质来看,大数据就是利用海量的、多样化的数据进行高速分析,以从中获取新的信息,获得更大价值。而所有作业的基础就是获取数据本身。我国政府在宏观上调控着国家各项事业的运行发展,事实上是一个巨大的数据库。政府掌握的海量数据一旦被社会各界充分利用,则不仅会推动自身政务水平的发展,更将产生不可估量的经济价值和社会价值。所以,政府不应只是数据的形成者,更应当是数据的开发者和利用者;政府不应苦恼于技术的限制,而应更多地思考政务管理思维和方式的革新。这是大数据时代对政府提出的大挑战,同时也是大机遇。
  2008年,我国已经建立起了全国范围的,横向连接各部委、纵向连接各省市的统一电子政务外网平台。政府门户网站公开的信息主要包括部门介绍、政策文件、法律法规、政府职能、业务介绍等5大类,向社会传递形势与政策信息。但关于财政收支、税收、海关报关、医疗保险、企业质检、违法犯罪、大气质量等可量化分析以创造大价值的数据却不在“阳光”的范围之内。目前来看,我国电子政务依然呈现“重信息,轻数据;重储存,轻开放”的总体特征。
  政府、企业、第三部门、普通公众的“四位一体”,应成为大数据时代电子政务的发展方向
  “四位一体”应该成为大数据时代我国电子政务的发展方向,即以政府、企业、第三部门、普通公众为核心,激发社会各界的力量,利用政务数据创造大价值。数据而不是信息,应当成为电子政务的源头。政府将完整、高质、准确、适时的数据通过通信设备和网络向全社会开放,为整个社会对大数据的挖掘与分析敞开大门。系统内部是原始数据的流通,系统外部是分析数据后形成的有价值信息和创新性知识的流通。政府要依靠物联网拓宽数据收集范围,对接和整合不同种类的数据,并调动整个社会的力量利用数据挖掘技术将数据背后隐藏的信息和知识展示出来。数据、信息和知识在收集、整合、分析、展示的流程中构成无止境的循环流。
  这就需要政府电子政务在以下几个方面作出创新和改变。
  首先,关注焦点从信息向数据转变。
  在大数据时代,数据和信息有着本质的区别,主要表现为数据和信息的层级不同。数据是生成信息和知识的原生素材。网络数据可以重复利用,价值不易折旧,并能通过不同的组合、搭配和分析产生不同的信息和知识。如将我国城镇居民医疗数据与保险数据比对分析,可以优化保险企业报销比例政策,发现虚假报销行为;与制药厂数据比对分析,可以调节药品的生产量与销售渠道。但单纯的医疗政策通知、公告等形式的信息并不能发挥这样的作用。
  此外,数据是舆情监督的有利依据。2008年的“4万亿投资”公开申请案件,本质上就是电子政务信息公开与数据公开的博弈。我国政府公布了4万亿元的经济刺激计划信息,但社会对资金的具体去向及准确数额却无从得知。汶川地震灾后重建近2亿元的资金用途,也因没有准确的数据公开而被怀疑暗箱操作、违规使用……目前的电子政务,政府信息公开主要还是条文信息的公开,而非数据的公开。
  其次,数据从公开向发布、开放转变。
  数据增值的关键在于整合与分析,而整合的前提就是数据开放。数据公开是意识上的、被动的,是政府同一定社会群体间的关系。政府承认数据处于公开状态,但可以不将其放入网络而只针对申请者进行答复。数据发布则是行动上的、主动的,是政府同整个社会间的关系。政府必须积极地将数据登载出来,供公众获取。同时,数据的公开、发布是一条一条的,而数据开放则是一片一片的。
  数据从公开向发布、开放转变,是政府发展电子政务态度从被动向主动的转变,是数据公开从点对点向点对面的转变。样本越小局限性就越大,大数据增值最重要的一个特点就是通过对海量数据的整合和分析,来进行历史性规律的总结和未来性发展的预测。目前,在很大程度上,我们不是缺乏挖掘和分析数据的技术,而是缺少数据本身。
  最后,政府从独立作业向社会协同转变。
  内部协同实质是各地区政府、各层级政府和各部门间协同作业,共享数据,优化组织流程,提高工作绩效。如广州省公安厅、交通厅和保监局等单位根据交通安全信息共享目录提供业务数据,通过信息查询和数据对比堵塞管理漏洞,实现了三大部门之间的信息共享和互联互通;济南市财税增收信息化工程依托济南市公用信息平台,建设电子政务数据交换平台,国税局与地税局通过数据比对发现了25000条数据差异,落实纳税企业5000多户,补缴税款2700多万元;杭州市也实现了工商、国税、地税、质监四个部门有关企业的数据交换,建设起完整的企业数据库,以更好地为领导决策服务……
  外部协同实质上是政府自上而下的数据开放和社会自下而上的决策制定、优化,政府自上而下的创新激励和社会自下而上的社会价值创造、积累的统一结合。外部协同既是政府履行服务职责、建设服务性政府和提高社会公信力的要求,也有利于社会各界共享数据擦出知识的火花,依靠社会的技术和智慧力量挖掘数据价值,一方面为社会协同者自身创造利益,另一方面也为政府排忧解难,推动政府科学、民主决策。
  谷歌将特定检索词条和政府疾控中心的数据进行比对,成功预测了2009年H1N1流感爆发的时间和传播地区
  大数据时代背景下,我国电子政务的创新模式主要包括政府、企业、第三部门和普通公众四大核心主体,各方都利用政府开放的数据和自身所拥有的数据相结合,进行规律性总结和发展性预测,但他们所发挥的作用又有所差别。
  政府主导。政府间的电子政务涵盖不同地区政府之间、不同层级政府之间和不同政府部门之间的电子政务,是一个政府内部的数据收集、整合和分析系统,发展方向是政府数据来源的拓宽和数据仓库的建立。
  政府数据来源拓宽。当今,数据的广度大大延伸,尤其是无线传感器的发展与普及,让环境数据增长最为惊人,潮汐、风、温度、湿度等都可以在无线传感器的监测下实时产生海量的电子数据,政府相关部门可实时跟踪,以此为基础对数据进行分析,从而为环境监测和能源开发提供可分析的依据。
  数据仓库建立。目前,不同地区、层级的政府和不同的政府部门,在电子公文、电子财政管理、电子办公等方面系统不统一,外加电子政务数据来源的拓宽,使得政府数据以种类各异、标准不一的数据库形式存在,如文本数据库、多媒体数据库、关系型数据库、事务性数据库等。不同的数据库因逻辑结构、描述方法、建立标准不一等形成了数据壁垒,阻碍了数据分析的可行性。数据仓库和数据库的最大差别在于,数据仓库以数据分析和决策为目的存储数据,可以为数据描述、数据环境和数据共享建设统一的标准和平台。整合政务数据资源、建设电子政务数据仓库,是我国政府发展电子政务的关键所在。
  企业参与。据统计,我国目前有80%的信息控制在政府部门手中,包括众多行政管理信息、市场信息、服务信息、宏观决策信息等。公开以上数据,对于企业和个人考察社会、分析市场,进而科学地安排生产生活、合理配置资源都具有重要的参考、指导作用。企业凭借先进的技术、优秀的人才和丰厚的资金支持,使得政府和企业间的电子政务成为整个电子政务中最具活力的数据分析系统。这种模式的创新主要表现为数据推动电子商务的发展和数据挖掘技术的创新。
  美国FareCast公司开发了一个收集了10万亿多条飞机飞行数据记录的系统,为顾客预测当前机票价格在未来一段时间内的涨跌趋势,准确度高达75%。通过对沃尔玛一年多的原始交易数据进行综合分析,商家将啤酒和尿布摆放在一起以提高销售额。大数据分析技术和思维方式不仅限于这些商业活动,企业同样有能力和意愿参与到大数据时代的电子政务中。在企业独立的数据分析系统中,谷歌公司将特定检索词条和疾控中心2003年至2008年间的季节性流感时空数据进行比对,成功预测了2009年H1N1流感爆发的时间和传播地区。企业利用政府数据与自身数据比对分析,可以帮助政府优化决策,这是企业参与电子政务的一个典范。
  第三部门辅助。第三部门泛指政府和企业之外的那块空间,具有正规性、民间性、非营利性、自治性、志愿性、公益性等属性。虽然目前我国第三部门的作用还不太显著,但随着社会公共管理意识的提高,第三部门将越来越成为政府的有利协同者,政府开放数据的主力军之一。在社会管理与发展的一些空白领域和一些传统上由政府从事活动的领域,非营利性组织常常可以做得比政府更好;而对于那些无利可图、需要更多地投入个性化服务的公共产品,营利组织一般不愿参与,而以志愿、公益为特征的非营利性组织则正好发挥其特长。
  回顾美国电子政务的发展历程,第三部门是一支不可小视的力量。在华盛顿责任道德公民中心(CREW)对原始数据的一再要求下,奥巴马白宫访问记录数据全部向社会开放;OBM监督(OBM Watch)以监督政府预算、税收和工作绩效为己任,成功推动《联邦资金责任透明法案》的产生,使联邦政府建立联邦政府公共支出门户网站……
  除了推动电子政务创新进程,第三部门还利用政府开放的数据创新社会公益。它们不仅通过政府开放数据关注社会贫困、教育、医疗、灾害等现实问题,完善社会保障制度,还积极推动社会知识创新。这是第三部门新时代的特征和对电子政务的智慧型延伸。
  公众奠基。普通大众既缺乏技术革新的能力,又没有团体组织力量,在电子政务创新模式中主要表现为决定优化、舆情监督和数据反馈。政府开放的数据和民生紧密相关,普通大众可以通过政府开放的就业、医疗、社保等数据进行个人规划,适应社会环境,也有助于建设个人电子社会档案库,进行数据比对,发现个人信息漏洞。
  在大数据时代背景下,普通大众对电子政务创新的贡献是进行数据反馈。大众浏览政府网站的时间、网页数量、点击频率等,都能够形成数据反馈集合进行分析,从而为政府改善网站建设提供意见;大众就医数据可以和医保、社保等数据比对,帮助政府优化社会保障政策;大数据时代最为流行的“机器学习”可以通过大众反馈的数据,改善学习内容的提供和结构,为全社会提供无时空障碍、有诱导和评价的创新性社会学习系统改进……
(作者单位:山东大学历史文化学院)