“数据基因”,这五位专家这样说……
来源:国脉互联 更新时间:2017-02-22

2017年2月15日,“中国政务大数据建设研讨会暨数据基因系统产品发布会”上,国脉首发“政务大数据基因(DNA)系统”,数据基因DNA是什么,怎么用,来听听专家们怎么说??

北大信息化与信息管理研究中心学术委员会主席 赖茂生

数据基因系统产品能够针对我国当前大数据建设需要迫切解决的问题,设计开发了一个数据管理的体系架构,实现数据信息资源模块生成,提供信息资源目录管理、信息资源模型数据、信息资源关联分享的重要功能,并且已经有了一些成功案例。

关于数据基因产品,我有3点感受:

1.数据基因产品在提供整体解决架构的快速搭建、市场管理以及一揽子服务等方面的特点比较鲜明。这个产品为当前解决大数据底层的问题、便于公共数据资源共享方面发挥很重要的作用。

2.数据基因产品体现了新颖的设计理念。一是强调管理,目前政府部门的拥有和占有思想还是比较严重,而公共数据在开放共享上需要发展。数据基因产品的理念可以在管理数据上很贴心、周到的把数据资源管理好,真正做好数据管家;二是强调有用性,不是要强调信息资源的数量,而要突出数据、资源、服务的有用性(有用性指的是:易用、易获、易得、易理解)。

3.数据基因系统很重视解决社会现实的问题及政府现在需要解决的建设问题。主要反映在:一是产品强调基于价值增值的内容管理;二是产品强调便于共享交换的管理,特别是在系统开发和共享交换,强调资源共享交换;三是产品强调为创新、创业方面服务。

电子政务理事会副理事长、国家审计署信息化领导小组办公室原主任 周德铭

关于数据基因产品,我认为体现了3个特点:

1.揭示了数据的内在规则,对政务资源及大数据的开发利用上有很大好处。

2.形成了数据管理和应用的工具产品,有助于推进下一步政务数据建设管理和应用。

3.有效支撑了数据开发利用规范管理、共享开放和价值提升的政务数据生态系统建设,对于进一步提升我国政务信息资源及政务大数据开发利用一定会发挥很好的作用。

中国信息协会原副会长 胡小明

当前,信息资源梳理做的不好的原因非常多,主要是因为我们把数据共享理想化,要求做的太全面。关于信息资源工作,我有几点看法:

1.一定要弄清楚什么是有用的,什么是无用的。一个是经过人工统计和业务系统,一类是发放统计调查表,一类是业务统计。大数据来源是通过自动化系统(比如ETC),所以数据规模非常大。数据的一类用法是数据使用,要做到精确使用,不能出错,比如ETC车号的识别和破案要求必须精确,因为它的使用方式是精确;另一类是领导使用,是数据集的使用,使用数据和使用数据集是两回事。

2.人工来源和精确使用是业务数据的管理。政府积累的数据比较重要,我们说的数据基因也是这一类的。把集中的问题缩小成最小块,不像以前建立了一个信息资源开放共享平台,把方法、用户都区别出来。把主要的精力放在一小块去做,这样就把效率提高了,把百分之百的精力做成百分之十的项目。

中关村大数据产业联盟副秘书长,工业和信息化部电子科学技术情报研究所副主任 陈新河

通过几个案例来看一下目前政务大数据领域遇到的问题,这个问题能不能用DNA系统来解决。在政府、电信、交通、工业等领域已有经典的案例,中国是党政系统数据是最多的,而国外是金融和电信领域最多。政府数据目前存在没有用、不好用、不可用的情况,主要是缺乏数据的DNA工程,数据基因要把数据变得可用、能用、好用。

现在这个产品是1.0版本,希望再过几年能生产几个我们的产品;交通方面,北京市人口动态的高峰在4500万,比如要在通州建立一个新城也可以用这个产品去做。一个小小的产品能给城市治理理念带来深刻的变革,如:一是从政府招标项目的数据可以分析政府大数据的应用方向;二是从人口数据可以分析海淀区人口疏散去了哪里;三是如何在12亿电子警察抓拍的车牌数量中找出套牌车辆;四是怎样用大数据发现嫌疑犯。

目前大数据在政府里面的用途很多,但是还需要进一步去发掘,希望通过一个好的DNA的产品,成为这方面动力的源泉。

北京市信息资源管理中心副主任 穆勇

关于数据基因产品,我有2点感受:

1.这个产品解决了一些问题:一是数据和业务的问题,二是实体数据和资源目录的关系、主数据、交换系统等问题。这个项目需要一些创业技术人员、业务人员和领导方面的配合。

2.还要借鉴一些互联网企业的做法,一是要有工匠精神和互联网思维,政府信息化带动企业信息化,10年之后是社会的信息化引领政府的信息化。二是在实施方面,大数据处理后,数据中心和数据管理中心在云管理下中心逐步淡化,数据中心逐渐被无中心化或去中心化。三是互联网在数据使用方面的经验,以前提到的是按需共享、按单共享,现在的很多互联网企业是按需使用,这些方面在我们做数据管理方面可能要用到的。