在大数据时代兼顾安全与自由


      一家很大的互联网公司曾经出于高尚的冲动,把它的某些数据与研究界分享。它将其搜索服务三个月来记录的日志文件向所有人公开。公司采取了诸多措施来保护隐私,但互联网爱好者、专业研究人员和记者能够查出许多用户。例如,第4417749号是佐治亚州的一个寡妇。另一个用户似乎在策划一场谋杀。如今,“美国在线公司(AOL)搜索日志丑闻”被认为是互联网历史上最不可思议的失策之一。


    早该展开公开讨论

    那件事发生在2006年,一个不同的时代。现在,任何人只要有点钱、懂点电脑就能租借一些云容量,利用一堆完全免费的技术来处理浩如烟海的数据。管理这种数据是互联网大企业的一项重要活动。假如你是一个全球超级大国的情报机构,你的职责是监视心怀不轨的人,那么这种数据就是无价之宝。你会想方设法把它弄到手。

    情况基本上就是这样。根据英国《卫报》得到的爆料,我们获悉,韦里孙公司每天将其全部电话记录———除了通话本身的音频以外的号码、位置及其他“元数据”———交给国家安全局。多亏了布兹-艾伦-汉密尔顿公司29岁的顾问爱德华•斯诺登,我们还获悉了“棱镜”计划。细节扑朔迷离:一开始,谷歌、苹果、“脸谱”和微软等公司似乎都允许国家安全局畅通无阻地获取其所有用户信息。现在看来,这些公司只不过是在提高《外国情报监视法》所要求发挥作用的效率,设立了一项有保障的落点服务供国家安全局使用。因为我们不知道有多少数据被分享,也不知道哪些是国内的、哪些是国际的,所以关于国家安全局监视计划的泄密引起全球轰动。

    针对在全球恐怖主义和大数据的时代如何兼顾安全与自由的问题,人们早就该展开一场公开讨论了。尽管该国经选举产生的领导人坚称国家安全局的活动对遵纪守法的公民不构成威胁,但我们不能对细节不予理睬。将电信系统整个儿纳入国家安全机器的做法应当让我们大家犹豫一下。但它不应引起震惊。因为政府汇集了大量珍贵的数字秘密并不是什么秘密。

    是否逾越道德底线

    在围绕斯诺登泄密的风波中,人们很容易忘了这样一件事:在3月12日的一个听证会上,当被问及国家安全局是否搜集数以百万计美国人的“任何一种数据”时,国家情报总监詹姆斯•克拉珀说:“不会的,先生,不会有意去搜集。”后来在全国广播公司的节目中,克拉珀解释说:“我当时想到的是这好比在图书馆里查看书的杜威分类号。”他声称,搜集数据“意味着把书从架子上取下来,翻开阅读”。

    换言之,国家安全局在制作一份巨大的人员卡片目录,其中有许多美国人。他们其实不是在搜集人们的交谈或者人员本身,而是关于其交谈的全部数据———元数据

克拉珀很可能认为自己在这里划定了一条合情合理的道德底线。然而正如2006年AOL事件所揭示的,元数据是会透露内情的。像国家安全局吸纳、据猜测还予以储存的那种搜索历史或通话记录的行为,恐怕和杜威分类号不是一回事。它们更像是书脊上的索引号。国家安全局所做的事情就好比是把数亿人当作公开书籍编写索引:他们是谁、他们认识谁、他们去过哪里等等。

    像克拉珀总监这样的人的确认为、或者说情愿认为,为无形的人类图书馆制作一份庞大的索引本质上是一种文书工作,与监视不属于同一个道德类别。他也许会宣称,“棱镜”之类的计划与其说是要挖掘秘密,不如说是要把看世界的方式组合起来。

    民众暂无选择余地

    但我们其他人会受到不可思议的副作用。我们不再是我们自己。我们每个人都在全世界数据库里有一个新的统计学上的自我。商家和企业盯上的正是这些自我———以独特方式进行识别的行为包,它们对我们读什么、吃什么、在哪里睡觉做出显著、分散的描述。就我们的统计学自我而言,国家安全局和“脸谱”、谷歌、亚马逊等私人公司之间的区别在于政府能对它搜集的数据做些什么。它之所以制作那份庞大的索引,是因为这样一来在必要的时候它可以越过你的统计学自我与真实的肉身自我之间的界限。这就像“你愿意接受你喜欢的企业的本地优惠券吗?”和“为什么我们家门前停着一辆货车?”的差别。

    我们有选择余地吗?几乎没有,暂时还没有。给你的所有数据加密使之不那么容易被打探,这倒是可以做到的,但非常麻烦。从民意调查结果来看,美国人根本不那么在乎这种隐私。只要没有人越过统计学自我与真实自我之间的界限,有什么好担忧的呢?有人会说,全面参与现代文化需要我们不断留下这些数据轨迹来打造这些另外的自我,而一切都必然会在位于马里兰州米德堡的国家安全局秘密帝国内编入索引。

    既然监视程度已经曝光,情况会改变吗?难以想像总统能有所作为,因为这个行政部门已经变成了一个行政展示板:充斥着网上请愿、空白表格程序和正是根据当前所讨论的那些数据写成的简报。

    不过,有些基本问题是明智的老百姓能够且应当提出的。这种数据是在哪儿搜集的?它来自哪里?它会储存多长时间?它链接哪些数据库?

    随着谈论的展开,媒体可能会把关注焦点集中在个人身上:斯诺登和他的动机或者被抓获的恐怖分子。但是别忘了那些数据,那些被捕获的时刻。我们理应了解这个数据库的面貌以及它是怎样保护我们的。一个又一个星期过去了,当权者谈论的是针,而你要密切注意的是海。


     灵玖软件,大数据搜索与挖掘技术服务商 灵玖软件专注于大数据搜索与挖掘的技术创新与服务,提供大数据搜索、大数据挖掘与大数据应用解决方案,以应对大数据的管理、处理、分析并从大数据中获知识与智慧。
灵玖软件:www.lingjoin.com 
大数据论坛:www.bigdatabbs.com 

你可能感兴趣的:(中间件,大数据,软件,分词)