大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
大数据对于未来企业发展的重要性无需多言,如今各大企业也通过各种手段来加大数据的丰富度,以夺得未来发展先机。
但由于法律规则的相对滞后,以及企业对获得大数据的急迫性,采用非法手段获得大数据的行为几乎从未停止。媒体也曾披露种种令人瞠目结舌的做法,如通过短信、爬虫等等灰色手段获得第三方数据,已经形成一整套完整的产业链。
大数据带来的最大伦理危机是个人隐私权问题。
首先是数据采集中的伦理问题。以往的数据采集皆由人工进行,被采集人一般都会被告知,而如今的大数据时代,数据采集都被智能设备自动采集,而且被采集对象往往并不知情。例如我们每天上网所产生的各种浏览记录,在网上聊天时候的聊天记录,我们手机的通话和短信记录,我们在公共场合出入的监控记录,如此等等,都在我们不知情的情况下被记录和储存下来。
其次是数据使用中的隐私问题。在大数据时代,各种数据都被永久性地保存着,这些数据汇集在一起形成大数据,这些大数据可以被反反复复永久使用。从单个数据来说,经过模糊化或匿名化,隐私信息可以被屏蔽,但将各种信息汇聚在一起而形成的大数据,可以将原来没有联系的小数据联系起来。大数据挖掘可以将各种信息片段进行交叉、重组、关联等操作,这样就可能将原来模糊和匿名的信息重新挖掘出来,所以对大数据技术来说,传统的模糊化、匿名化这两种保护隐私的方式基本上失效。
最后是数据取舍中的伦理问题。在小数据时代,遗忘是常态。但是,由于网络技术和云技术的发展,信息一旦被上传网络,则立即被永久性地保存下来,就像白纸染上墨迹一样,我们很难彻底清除。于是,在大数据时代,记忆成了新常态,而遗忘则成了例外。有些人做过某种错事,大数据将此事永远存储下来,时不时又被人翻起而成为一个永远的伤疤。这种永久存储的技术让不少人失去了重新做人的机会,给当事人带来永远的灾难。因此,当事人是否有权要求删除自己的相关信息呢?在大数据时代,究竟由谁来决定数据的取舍?
一旦哪个商铺和“百度黄金眼”合作后,不管是莆田系医院,还是别的什么店,你去到他们店里,连上了wifi,店铺就会得知你最近的搜索记录(比如你得了什么病)、大概位置、年龄、喜欢什么运动、有没有结婚、爱不爱上网或者可能还有你在网上搜索的其他乱七八糟的信息。
而这些信息多半是从百度旗下那一系列产品中得来的,也就是说百度是把你的信息贩卖给这些开通了“百度黄金眼”的商铺,这些商铺多半是莆田系医院。
而在黄金眼宣传页的最后问答栏我们可以发现,患者其实进入安装了“百度黄金眼”系统的医院后即使不用连上特定的WIFI只要WiFi开着,黄金眼就能自动的搜集患者信息。
具体的详细介绍可以参考:
「百度黄金眼」是真是假? - 知乎
珍爱隐私,远离百度–虎嗅
揭秘“百度黄金眼”系统!莆田系,百度难以割舍的爱–凤凰网科技
据IBTimes北京时间11月30日报道,在被起诉未经用户同意出售逾500万名iPhone用户信息后,谷歌或被迫赔偿27亿英磅。一起集体诉讼指控谷歌利用算法绕过iPhone默认隐私设置,收集用户的浏览历史数据。这一诉讼的目的,是使约540万名受影响的用户获得赔偿。
具体的详细介绍可以参考:
谷歌被诉出售逾500万iPhone用户信息 或赔偿27亿英磅–凤凰科技
引用大众日报大数据时代的伦理隐忧文中的一段:
大数据技术是信息技术的延续,信息社会刚刚提出并兴起之时,人们也曾担心害怕,一如当下的大数据革命。任何技术都是一把双刃剑,这把剑是利是害,完全取决于持剑之人。大数据技术只是放大了人类原本就存在的或明或暗的人类本性,所以对大数据的规制其实还是对我们人本身的规制。