宁家骏:《大数据发展纲要》解读
来源:中国电子政务网 更新时间:2015-10-10
     一、背景
  当今时代,人类社会步入了一个科技创新不断涌现的重要时期,新科技革命及其带来的科学技术的重大发现发明和广泛应用,推动世界范围内生产力、生产方式、生活方式和经济社会发展观发生了前所未有的深刻变革,进入21世纪,世界新科技革命发展的势头更加迅猛,正孕育着新的重大突破。
  信息科技将进一步成为推动经济增长和知识传播应用进程的重要引擎,基础研究的重大突破将进一步为人类认知客观规律、推动技术和经济发展展现新的前景。云计算、物联网和大数据,将成为新时期信息化理论、技术和实践重大突破的前沿,为新时期信息化展现新的前景。
  数据自古存在。乌龟壳、树皮、绸缎都曾经是记录数据的媒介,现在都已经退出舞台;留声机、磁带机也曾经风靡一时,也已难觅踪影;现在当红的信息技术,像个人电脑、智能手机、Ipad在不远的将来也将被陈列在博物馆。唯有数据,虽然不断的变换表现形态,但终将一直伴随人类走向未来。
  物联网本质上是器物层面的技术,从大数据的视角而言,是采集数据的终端。云计算本质上是IT服务交付手段的变革,并由此引发一系列技术基础架构的更新。物联网和云计算都是信息技术发展的一定阶段的自然延伸,依然属于信息技术范畴。
  大数据是在信息化进程中自然形成的宝贵资源,大数据 更接近把握信息资源的本质。有的文章将大数据看作石油,大数据研究与自然资源利用发现、开采、提炼存在一定的相似之处,研究大数据,首先要研究各种有用的信息在何处,就是找矿。其次是把满足特定需求的信息收集过来,就是开矿。第三是把收集的信息按应用需求进行结构化处理,就是提炼,如同石油必须经过炼化才能变成消费用的汽油、柴油或作为原料用的聚乙烯、聚丙烯,第四是将这样的信息与具体的应用结合,使之发挥作用,这就是基于大数据的应用系统,或称之为围绕应用的大数据管理系统,如同汽油通过加油站加到消费者的汽车内,石化原料变成衣服、设备或其部件。今天大数据已经成为驱动经济发展的要素。
  “大数据”的内涵远远超越物联网、云计算等信息技术的概念,它的意义可以比肩“活字印刷术”的发明,大范围的消除信息不对称的现象,释放巨大的生产力,深刻改变社会的面貌,提升国家治理,革新科学研究的思想,促进产业间的跨界、融合和颠覆,并将极大的促进文明的传播、凝聚和升华。
  大数据是数据积累到一定规模后,引发的质变。大数据超越信息技术,使人们重新界定国家竞争的主战场,重新审视政府治理水平,重新认识科学研究的新范式,重新审视产业变迁的驱动因素,重新理解投资的决策依据,重新思考发展的战略和路径。
  二、大数据是经济增长和转型升级的强劲动力,大数据产业已成为战略性新兴产业发展的制高点
  报告显示,大数据市场正处在井喷式增长的前夕,2012年大数据市场总体规模为114亿美元,2013年总体规模增长61%至182亿美元,预测2017年总体规模有望达478亿美元。IDC预计全球大数据技术和服务市场将在未来几年保持31.7%的年复合增长率,中国大数据市场未来5年的年复合增长率将高达51.4%。
  大数据产业正在成为战略性新兴产业发展的制高点,因为大数据激发商业模式创新,例如在商业嗅觉敏锐的互联网和商业金融领域,已有很多应用大数据提升企业核心价值、捕捉商业良机的案例。例如,电子商务领域,借助淘宝平台的大数据积累,阿里巴巴能够更好地掌握消费者的购买习惯和爱好,为商家提供更具针对性和增加值的深度服务。同时,通过大数据分析,阿里巴巴能够更容易、更准确、更量化的评价商家个人和组织的信用指数,大大提升融资效率,有效降低小微贷款的成本和风险。
  大量案例表明,很多小规模企业,尤其是初创企业,通过大数据手段,能够“小而精”、“快而准”地针对一个行业的实际需求,创造出改变世界的革新性产品。随着信息化的深化发展,大数据的核心价值将进一步凸显,成为商业模式创新的驱动力。
  三、我国具备成为数据大国和数据强国的基础
  我国拥有丰富的数据资源和应用市场优势,中国拥有全球第一的人口数、互联网用户数和移动互联网用户数,国土面积广、经济体量大,拥有其他国家难以企及的海量数据资源和应用需求潜力。
  北京公交一卡通一天的刷卡量可达4000万次,其中地铁1000万次;联通用户上网记录每秒83万条,对应数据量为每年3.6PB。
  IDC预计到2020年中国的数据总量将达到8.4ZB,占全球数据量的24%,中国将成为世界上第一数据大国和“世界数据中心”。丰富的数据资源为我国大数据发展带来了肥沃的土壤
  据了解,美国多年前已掌握通过基因大数据分析判断肿瘤的技术,但由于缺少病例样本进展缓慢,我国华大基因公司通过和腾讯公司及医院合作,得到了大量的样本数据,有关技术已经赶超美国。
  我国互联网大数据应用具备全球领先的潜力,互联网作为天然的数据平台和数据集散地,是大数据发展的起源地和价值蓝海。我国部分互联网公司在大数据应用方面已经处于全球领先水平。2014年互联网趋势报告中提到:依据月独立用户访问量评出的全球10大网站中有四家来自中国,分别为阿里、腾讯、百度和搜狐。
  目前,百度、腾讯、阿里等骨干互联网企业已建立了世界上规模最大的大数据平台,单集群规模达到上万台,在分布式系统、超大规模数据仓库、深度学习等关键技术上有所突破。
  此外国内在数据处理分析、语音识别、视频识别、商业智能软件、数据中心建设和维护、IT咨询、信息安全方领域都已有具代表性的企业。可初步构成获取、存储、处理、应用的产业链。
  四、正视我国大数据发展亟待解决的突出问题
  政府大数据应用水平落后,缺乏数据治国意识,传统环境下,管理者很难全面获取公众需求、人口流动、人员结构、企业状态等数据,形成了做决策靠经验判断的惯性思维。
  据一项针对我国主要部委信息化部门的调查,我国政府部门目前几乎没有使用大数据技术,近四成负责同志并没有意识到大数据可以帮助提升业务能力。另据了解,我国三峡工程等重大工程建设过程资料均未电子化,大量纸质文档已经遗矢;汶川和玉树抗震救灾等重大事件的过程也未形成电子化档案,珍贵的记录已经难以重新展现;社会信用、食品药品安全等一些社会管理和公共服务系统更多形成的是结果和状态数据,大量的过程和行为数据并未有效采集,占数据总量95%以上的非结构化数据被束之高阁。这些重大工程、重大事件的数据如能够得到合理保存并加以开发利用,将有极大的科技价值、经济价值乃至历史价值。
  数据控制力尚未引起足够重视,数据话语权堪忧。大数据时代,数据控制力是国家战略控制力,掌握了数据就掌握了话语权。
  我国大数据展形态较为单一,核心技术仍受制于人,虽然以阿里巴巴、百度、腾讯为代表的我国互联网企业已经在大数据应用领域超前部署,处于世界一流水平。但与已经出台大数据国家战略的美英日等发达国家相比,我国大数据发展主要表现为互联网企业自发的商业行为,发展形态仍十分单一,仍只是一个领域、几家企业的单点开花,缺乏国家层面的统筹规划和全面布局,长此以往将影响国家对数据的掌控权和控制力,不利于提升国家信息优势和国家竞争力。
  政府数据开放共享不够,潜在价值大量淹没。政府和公共部门是最大的信息数据生产、收集、使用和发布的单位。但现实情况是,海量的数据分散在各个部门、各个层级,彼此分割,形成一个个“信息孤岛”,且对社会、公众开放严重不够。
  由于数据开放程度不足,我国大量的政府数据处于“休眠”状态,而企业拥有的大数据技术和计算能力却无用武之地,陷入“巧妇难为无米之炊”的状态,据估算损失的潜在价值不可小视。
  个人隐私法律缺位,信息滥用引发焦虑。随着O2O模式的广泛应用,用户的个人信息已在不经意间流出,个人隐私数据泄漏带来的危险增大。我国缺少关于个人隐私和商业机密的专门法律法规和政策制度,对于公民隐私权和知情权的范围有待厘清。传统的个人信息保护制度,在大数据场景下变得越来越难以操作。政府如何建立规则、适度监管、合理开发个人数据的价值,是必须正视并亟待解决的问题。
  人才培育机制薄弱,分析型、复合型人才短缺。与信息技术其他细分领域人才相比,大数据产业对人才的复合型能力要求更高,尤其是具备综合掌控数学、统计学、机器学习等方面知识的复合型人才,同时又可承担数据分析和数据挖掘的数据科学家。我国大数据应用起步相对较晚,教育和职业培训尚不能很好的满足行业发展需求,目前缺口已经超过100万人。
  五、纲要发布的重大意义
  深刻理解大数据发展具有影响国家竞争力和治理能力的战略意义。当今信息社会,数据量正在以每两年超过翻番的速度爆炸式增长,增速超过了摩尔定律。大数据已经广泛渗透并深入应用于政府管理、商业金融、教育科技、工业制造、民生服务等经济社会领域,成为促进生产生活和社会管理方式创新变革的重要驱动力。
  推动大数据发展是提升国家竞争力的战略抉择。大数据成为发达国家发展战略资源的新领域。积极发展大数据,已成为发达国家的战略和行动共识。通过发展大数据,获取和控制网络海量数据资源,提高数据掌控权和国家控制力,已成为国际竞争的战略焦点。近几年美、英、澳、法、日、韩等多个国家将数据管理上升到了战略层面,将大数据思维应用到公共管理和政府治理中。数据已成为重要的国家基础性战略资源,对于海量数据的运用正在引发全球新一轮的生产力革命。
  未来信息社会建设要重点开展四方面工作:一要继续加大对信息基础设施建设的支持力度,鼓励技术与服务创新;二要积极开发信息资源,促进数据开放共享,促进协调发展,缩小数字鸿沟,实现面向发展、广泛包容的信息社会;三要促进信息技术和应用向社会经济的更广范围和更深层次拓展;四要坚持自主创新与国际合作相结合,解决信息社会建设中遇到的困难和问题。
  数据主权成为大国竞争博弈的新焦点。大数据时代,国家竞争力将部分体现为一国拥有数据的规模、活性以及运用数据的能力。通过掌握移动终端、操作系统、浏览器、平台等信息世界的入口,相当于掌控了信息世界的“总开关”,可以通过信息流掌控物质流、资金流,掌握商品供求关系,进而可在两国贸易、大国竞争博弈中占据主动。分布各地的云端服务器也为主权国家带来了数据监管的难题,数据安全直接关系到国家安全,网络空间的数据主权正在成为大国博弈的新焦点。
  党的十八届三中、四中全会进一步吹响了改革的号角,迎来了政务信息开发利用的新机遇,这一重要文件的发布体现了十八届三中全会提出的国家治理体系现代化理念,今后政府履行职能更加离不开大数据的支撑,离不开信息资源共享,进一步推进政务信息公开和共享已成当务之急。当今社会结构变化更加需要政府协同工作,信息成为国家软实力和竞争能力的重要标志。网络信息是跨国界流动的,信息流引领技术流、资金流、人才流,信息资源日益成为重要生产要素和社会财富,信息掌握的多寡成为国家软实力和竞争力的重要标志。信息技术和产业发展程度决定着信息化发展水平,要加强核心技术自主创新和基础设施建设,提升信息采集、处理、传播、利用、安全能力,更好惠及民生。
  六、推动大数据应用是实现治理能力现代化的有效路径
  大数据成为提升家治理能力的新引擎。大数据技术和应用为分析处理复杂社会问题和潜在的社会矛盾提供了新途径,有助于更好地推动解决国家发展中面临的医疗、教育、住房、交通、城市管理、公共安全等社会难题。麦肯锡报告指出,大数据技术为欧盟的公共管理部门每年节省2500亿欧元,将公共部门的效率提高0.5%;
  大数据催生政府管理和公共治理新变革。大数据是保障国家安全、社会治理和推动经济发展的恒久主题。例如电子政务深化离不开大数据应用,电子政务能重组优化政府组织机构和工作流程,超越时间、空间和部门分隔的制约,建立一个精简、高效廉洁、公平的政府运作模式;但是随着市场经济体制的逐步深化,越来越暴露很多突出的问题,资源共享性差、发展电子政务的地区差异大、重电子轻政务、政务信息公开量少且时效差,以及信息安全和信息泄露等问题,已经严重制约着电子政务建设与行政管理体制改革的深化。将大数据引入政府管理,已成为实现国家治理体系和治理能力现代化的有效途径,也是实现管理现代化的必然要求。
  以往,对于上层领导而言,基层管理是一个“黑盒子”,信息上达不易,政令下达不畅,实施决策更多的是依靠领导经验和个人能力,而通过大数据应用,可以将数据信息、决策依据、仿真结果呈现在领导者面前,真正实现“运筹帷幄之中,决胜千里之外”。
  利用大数据,有助于转变政府管理和公共治理的思维方式,有利于多层级了解社情民意,一方面形成“用数据说话、用数据决策、用数据管理、用数据创新”的管理制度,另一方面促进政民互动,加速管理型政府向透明、高效、服务、责任型政府转变。
  信息是基础,也是电子政务的基础,“数据化”是大数据的基础和前提,更是大数据的动因,建立完善的信息机制则是电子政务的重要基础。当前必须加大幅度提升公共服务信息化水平,促进公共信息资源共享和开发利用。制定公共信息资源开放共享管理办法,推动市政公用企事业单位、公共服务事业单位等机构开放信息资源。加快启动政务信息共享国家示范省市建设,鼓励引导公共信息资源的社会化开发利用,挖掘公共信息资源的经济社会效益。支持电信和广电运营企业、互联网企业、软件企业和广电播出机构发挥优势,参与公共服务云平台建设运营。加快推进国家政务信息化工程建设,建立完善国家基础信息资源和政府信息资源,建立政府公共服务信息平台,整合多部门资源,提高共享能力,促进互联互通,有效提高公共服务水平。
  七、通过政务信息共享提升民生领域信息服务水平。
  利用大数据和政务信息共享服务,加快实施“信息惠民”工程,提升公共服务均等普惠水平。推进优质教育信息资源共享,实施教育信息化“三通工程”,加快建设教育信息基础设施和教育资源公共服务平台。推进优质医疗资源共享,完善医疗管理和服务信息系统,普及应用居民健康卡、电子健康档案和电子病历,推广远程医疗和健康管理、医疗咨询、预约诊疗服务。推进养老机构、社区、家政、医疗护理机构协同信息服务。建立公共就业信息服务平台,加快就业信息全国联网。加快社会保障公共服务体系建设,推进社会保障一卡通,建设医保费用中央和省级结算平台,推进医保费用跨省即时结算。规范互联网食品药品交易行为,推进食品药品网上阳光采购,强化质量安全。提高面向残疾人的信息无障碍服务能力。大力推进广播电视“户户通”工程,提升广播电视公共服务水平。推进地理信息公共服务平台建设。完善农村综合信息服务体系,加强涉农信息资源整合。大力推进金融集成电路卡(IC卡)在公共服务领域的一卡多应用。
  八、《促进大数据发展行动纲要》是国家全面推进大数据发展的战略性、纲领性文件
  《纲要》将全面指导我国未来3-5年大数据发展和应用。
  第一,大数据发展上升到了强国战略的高度。纲要明确性地提出,数据已成为国家基础性战略资源,中国将致力于建设数据强国,网络空间数据主权保护是国家安全的重要组成部分。这个高度的提法是首次提出,彰显和强化了大数据发展和应用的在国家战略中的地位。
  第二,促进大数据发展主要落实到三个方面的任务。纲要中,无论是发展意义、指导思想、主要任务还是重点工程,都主要围绕三个方面进行阐述,即大数据提升政府治理能力、大数据促进经济转型升级和大数据加强安全保障。例如,促进大数据发展的意义总结为新动力、新机遇和新途径,即大数据成为推动经济转型发展的新动力,大数据成为重塑国家竞争优势的新机遇,大数据成为提升政府治理能力的新途径。在纲要中的三条主要任务也分别落实到了第一加快政府数据开放共享,推动资源整合,提升治理能力;第二推动产业创新发展,培育新兴业态,助力经济转型;第三强化安全保障,提高管理水平,促进健康发展。
  第三,纲要确立了我国大数据发展的核心理念和管理机制。笔者认为,数据的共享和开放是国家促进大数据发展的核心理念。共享和开放贯穿于纲要的始终,既要推动政府数据开放共享,建成国家政府数据统一开放平台,也要推动社会数据共享,形成全社会开发利用数据的氛围,还要把政府数据、社会数据和其他各类数据互联互通起来,释放出数据红利。纲要也提出了“用数据说话、用数据决策、用数据管理、用数据创新”的管理机制,这将建立起全社会的数据思维和数据文化,从而全面促进各个领域的大数据应用自主性和自觉性。
  第四,纲要明确划定了大数据产业生态体系的范畴。纲要提出了培育高端智能、新兴繁荣的大数据产业发展新生态,一是发展大数据与传统产业协同发展的工业大数据应用、新兴产业大数据应用和农业大数据应用等新业态、新模式。二是发展大数据产品和解决方案,包含大数据软件、硬件和核心基础产品的大数据产品体系以及各行业大数据应用的解决方案。三是建立大数据基础研究和安全可信的大数据技术体系,其中涉及海量数据存储、数据清洗、数据分析发掘、数据可视化、信息安全与隐私保护等领域关键技术研发。以大数据应用、大数据产品和解决方案、大数据基础研究和技术体系为基础,共同建立起政产学研用联动、大中小企业协调发展、万众创新创业、公共服务保障支撑的完整的大数据产业生态体系。
  第五,纲要规划了十大重点工程和一系列国家和区域大数据平台建设任务。纲要提出十大工程,这是推进大数据发展的抓手,围绕工程的推进,将建设起政府数据统一共享交换平台、国家政府数据统一开放平台、国家大数据平台、数据中心等一系列国家和地方大数据平台,并在经济社会各个领域推进大数据应用示范和试点,这将兴起大数据建设的热潮,政府和社会将投入大量资金发展大数据,并以大投资来带动大数据市场的繁荣,可以期待这将在未来五年形成一个大数据及其关联领域的万亿级市场。