中国共产党新闻>>理论>>理论期刊>>《人民论坛》>>每期精选

“数据权”:下一个公民应有且必需的权力

李良荣

2013年05月21日08:10    来源:人民网-人民论坛

原题:世界数据化的广度深度限度

大数据代表了一种将世界数据化的思路

大数据代表了一种将世界数据化的思路。笼统地说,人类所有的历史、社会、知识、行为、态度等等,所有的一切都可以被看作是有待数字化的数据。这些数据由来已久,只是没有方法将其整合到一个统一的框架下进行分析。进入到互联网时代,各种数据更是以每年50%的速度增长,每两年便会翻一番。麦肯锡的研究认为,数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产要素。预计到2015年,全世界的数据总量将达到7.9ZB。这些数量庞大、种类繁杂并且仍在不断累积的数据在政府机构、企业组织甚至是公民的日常生活中沉睡,以往分析小数据的方法显然捉襟见肘,但是如果没有方法来唤醒它们,这些就只能是“数据垃圾”。

随着专门处理大规模数据的算法、非关系型数据库以及多类型大数据管理开源框架的研发,这些大规模的数据终于可以被利用起来。维克多·迈尔-舍恩伯格在《大数据时代》一书中对大数据提出了三组命题:要全体不要抽样,要效率不要绝对精确,要相关不要因果。这种论断似乎想说明大数据更注重“量”而不追求“质”。但实际上,大数据虽然相比较传统的数据处理理念确实出现了转变,但是并非如此截然相反。这三组命题对应到数据处理过程中分别是指处理器密度型还是数据密度型,数据量与模型复杂度关系以及算法逻辑。一般情况下,我们认为,因果性分析也是相关性分析的一种,当数据与算法日趋成熟之后,相关性分析必然会走向更为“直接”的因果分析。另一方面,根据相关研究发现,数据越大,精度越高,不同数据的精度分类会趋同,从而使得对于小数据至关重要的算法趋同,同时模型的复杂度越高,对于事物的预测情况也就越准确。

因此,大数据技术的战略意义是通过对大规模的数据进行专业化的处理,实现数据的“增值”。而所谓的“增值”,就是指可以通过大数据分析,找到事物内部或者事物之间潜在的关系形态。虽然大数据分析现在还只是刚刚起步,但一些研究成果已经足以让人惊讶不已。2010年美国东北大学的Alan Mislove博士领导的国家脉动(Pulse of the Nation)项目,通过对3亿条Twitter中的关键词进行追踪与分析,绘制了一幅反映美国各地区人们一天当中不同时段情绪波动的实时色彩图,研究清晰地显示出佛罗里达州确实是美国“最幸福”的地方。而2012年美国的总统大选,奥巴马的竞选团队在华盛顿数据极客的帮助下,通过集群分析的方法处理社交数据,从而建立起了更加准确的选民模型和竞选计划,再次成功地把握了选民的意愿,并最终赢得大选。

下一页
(责编:万鹏、朱书缘)
相关专题
· 《人民论坛》
  • 最新评论
  • 热门评论
查看全部留言
微信“扫一扫”添加“学习微平台”

微信“扫一扫”添加“学习微平台”