大数据的膨胀
近年来,美国各级政府开始面对由数据的数量、种类和速度剧增所引发的变革浪潮。例如,2011年全球产生的数据量达 1.8ZB,并且预计将每年翻番。这一数据量相当于2000亿部时长2小时的高清电影,一个人要连续看4700万年才能看完。这种现象是企业和政府必须面对的,也是无法回避的。
随着互联网的发展以及多种来源的信息汇集至政府机构,政府部门需要继续设法管理大量的数据。政府部门可以从传感器、卫星、社交媒体、移动通讯、电子邮件、无线射频识别设备和企业应用程序持续不断地接收数据。因此,政府领导人面临的挑战是,捕集、摄取、分析、存储和分配数据,保障数据安全,并将其转化为有意义、有价值的信息。
美国联邦政府接收的数据量之大,令人难以置信,这使信息过载成为一项根本挑战。在数据量急速膨胀的过程中,新信息要么是未曾发现的信息,要么是未曾有过的信息。产生的问题是,如何有效地捕捉新的真知灼见。对大数据进行恰当地管理、建模、分享和转化,为从中提取新的深刻见解,并以过去根本不可能的方式做出决策,提供了机遇。简言之,政府领导面临的任务和工作挑战日益加剧,可利用的数据激增,并且过时落伍的信息管理能力完全限制了其应对能力,于是政府领导陷于进退两难之地。他们面临的问题包括:如何收集、管理和利用所有的新数据?如何保护和控制数据?如何提高组织间的信息共享,以获得更加综合且相互联系的情报?如何通过更好地了解数据的出处,并回溯至经过验证的可信数据源,从而提高数据的可信度?有哪些先进的可视化技术、工具和格式可用于表达信息,从而实现快速分析,并提出新的深刻见解?为抓住机遇,如何缩小人力资本的缺口?
大数据的特征
大数据是指大量、高速、复杂、变化不定的数据,需要用先进的方法和技术实现信息的收集、存储、分配、管理和分析。
体量大、类型多和速度快是大数据的显著特征。目前,15%的信息是结构化信息,便于存储在关系型数据库中。电子邮件、视频、呼叫中心对话和社交媒体等非结构化信息占85%,这对于运用常规的业务情报工具来提取有意义的信息造成了挑战。传感器、平板电脑和移动电话等产生信息的设备继续成倍增加。随着全世界的联系更加紧密,社交网络也在加速发展。这些共享信息的选择意味着公众、政府和企业间互动方式的根本转变。
从大数据的特征来看,数据源增加、传感器的分辨率提高,使得大数据的体量大。数据源增加、数据通讯的吞吐量提高、数据生成设备的计算能力提高,使得大数据的速度快。移动设备、社交媒体、视频、聊天、基因组学研究和各种传感器使得大数据的类型多以数据为基础的决策要可追溯,要有理有据,这使得大数据还应具备准确性的特征。
大数据的这些特征将决定政府在大数据业务和整个大数据生态系统中收集、分析、管理、存储及分配数据的方式。
|