“大数据”一词想必大家都不陌生,“伦理”在我们生活中亦处处可见,那么,他们两者之间是否存在一些联系呢?
首先我们来看看百度百科对“大数据”的定义:
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》 中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。
再来看看“伦理”的定义:
伦理是指在处理人与人,人与社会相互关系时应遵循的道理和准则。是指一系列指导行为的观念,是从概念角度上对道德现象的哲学思考。它不仅包含着对人与人、人与社会和人与自然之间关系处理中的行为规范,而且也深刻地蕴涵着依照一定原则来规范行为的深刻道理。是指做人的道理,包括人的情感、意志、人生观和价值观等方面。是指人际之间符合某种道德标准的行为准则。
随着互联网与各种智能设备的普及,各类数据出现了爆炸性增长,而云存储、云计算等技术正帮助我们存储这海量信息并从这些信息中挖掘出人们需要的东西,因此我们的时代被称为大数据时代。大数据技术要求实现数据的自由、开放和共享,我们由此进入了数据共享的时代,但我们同时也时刻被暴露在“第三只眼”的监视之下。因此,大数据技术带来了个人隐私保护的隐忧,也带来了个别组织对数据的滥用或垄断的担心,特别是人类自由可能被侵犯,由此产生了大数据时代人类的自由与责任问题并对传统伦理观带来了新挑战。
大数据时代,人们的一切行为都暴露在“第三只眼”的监测之下,并留下一条永远存在的数据足迹
大数据的伦理问题主要是因为大数据技术的“第三只眼”而留下的“数据足迹”而引起的,因此要探讨大数据伦理,就必须从“第三只眼”和数据足迹出发。
现代智能技术为数据的采集提供了方便的技术手段,并形成了从天上到地下的一个全方位的监控,构成了一个立体的天罗地网。前东德曾雇佣了数十万的秘密警察来监控其国民的言行,花费了巨大的人力物力。如今利用现代智能技术,可以在无人的状态下每天24小时全自动、全覆盖地全程监控,毫无遗漏地监视着人们的一举一动。在大数据时代,我们的一切都被智能设备时时刻刻盯梢着,跟踪着,让人真正感受到被天罗地网所包围,一切思想和行为都暴露在“第三只眼”的眼皮底下。令人震惊的美国“棱镜门”事件是最典型的“第三只眼”的代表。美国政府利用其先进的信息技术对诸多国家的首脑、政府、官员和个人都进行了监控,收集了包罗万象的海量数据,并从这海量数据中挖掘出其所需要的各种信息。
除了这种早已设计好的数据收集之外,更多的是无意中留下的各种数据。只要使用了网络或智能设备,我们的一举一动都已经被留下,并可能永久存储于云端。例如我们几乎每天都在使用Google、百度等搜索工具,只要进行过搜索,我们的搜索痕迹就被Google、百度永久地保存。我们现在都喜欢网上购物,在亚马逊、当当购书,在淘宝、天猫、京东商城购物,只要进入过这些网站,哪怕只随便点击了其中的某种物品信息,我们的兴趣、偏好、需求等等就被记录下来,并时不时收到各种推荐广告。我们在QQ、微信、Facebook等网络社交工具聊天,我们以为及时删除了聊天记录就万事大吉,其实网络早已偷窥了我们的秘密,并永久记录了下来。现在几乎人人都手机不离手,通话、短信、导航、搜索……功能数不胜数,我们以为只要注意及时删除,就只能天知地知,殊不知我们的一切早已记录在案。博客、微博、云空间等,也永久记录着我们的所思所想。我们的一切都以数据化的形式被永久记录下来,这些数据有些是被人强行记录的,有些是我们自己主动留下的。
在小数据时代,人类的思想和行为也可以通过文字、图片以及人类对自然的改变印记等而留下人类活动的轨迹。例如我们可以把思想以文字的形式或音像的形式记录下来,可以通过雕塑、画作、摄影等记录轨迹,农民耕地、工人生产等工作、生活、学习都会留下印记,不过以往只能用物理方式记录下轨迹,我们可以称之为物理足迹。在大数据时代,我们的一切活动除了留下传统的物理轨迹之外,还会留下另一种轨迹:智能设备将我们的一切思想和行为都以数据的形式记录下来,通过网络快速传输并可能存储在云端之中,因此留下了永久的数字记录,我们把这条轨迹叫做数据足迹。物理足迹与数据足迹有着诸多的差异:物理足迹以物理模拟信息的形式保存下来,在时空上都受到一定的限制,难扩散,易消逝,而且容易抹去记忆痕迹;而数据足迹是智能设备自动将人类的一举一动进行信息采集,以数据编码的形式保留下来,它可通过互联网快速传遍世界并存储于云端,易传播,易存储,一旦进入网络就难于彻底清除,因此也就容易永久保存,不易消逝。
个人行为产生的种种数据,其所有权、知情权、采集权、保存权、使用权以及隐私权等,很容易被滥用
随着大数据时代的来临,数据成了一种独立的客观存在,成了物质世界、精神世界之外的一种新的信息世界。此外,数据还成了一种土地、资本、能源等传统资源之外的一种新资源,这种新资源已成为新时代的标志,也成为煤炭、石油之后的新宝藏。因此,数据的所有权、知情权、采集权、保存权、使用权以及隐私权等,就成了每个公民在大数据时代的新权益,这些权益的滥用也必然引发新的伦理危机。
我们个人使用智能设备(例如智能手机、Google眼镜、智能手表等)所产生的各种数据、访问网页产生的访问记录、QQ、Facebook等网络社交工具所交往数据以及在微博、推特等发表的各种言论,这些数据都被相关公司储存和记录,并汇集在一起而形成大数据。通过数据挖掘,许多人从这些大数据中可以挖掘出前所未有的信息资源。现在的问题是,与我们如影相随的数据足迹作为一种新资源,是否有所有权的问题?这些数据应该归属于谁?这些数据是否该属于我们个人?他人使用,包括那些记录、存储数据的公司是否有权存储和使用这些数据?传统的资源,其产权相对来说比较明晰,而由我们的数据足迹形成的大数据,其所有权归属就没有那么分明。如果说属于我们个人,那么他人使用就必须得到授权,否则就是侵权。但事实上,大数据由于涉及海量主体,又不可能得到所有个体的授权。
政府是数据的最大拥有者,它通过各种途径收集了全国人口、经济、环境、个人等等各类数据,其中许多数据本身就涉及我们大众的工作、生活和其他各方面的信息,这些通过纳税人的钱所收集的数据,我们是否有权利知晓和使用呢?从传统来看,各国政府往往以涉及国家安全为由拒绝公开政府数据,这让百姓永远被蒙在鼓里,从而滋生出政府的各类腐败。如今不少国家通过制定相关法律,逐渐公开各种数据,只要不是涉及国家安全的数据,都必须向公众公开。政府数据的公开让政府的一切行为都曝光在阳光下,更加体现了公开、公平、公正的原则,让政府的行为随时处于大众的监督之中,因此,大数据带来了公民的自由与公正。
大数据带来的最大伦理危机是个人隐私权问题。我们的个人信息,例如出身、年龄、健康状况、收入水平、家庭成员、教育程度……,只要是我们不愿意公布的,都可以看作是个人隐私。在小数据时代,纸质媒体相对来说比较难于传播这些隐私,而且即使传播,其传播的速度、范围和查询的便捷性都受到一定的限制。此外,小数据时代,有两条措施来保证个人隐私的安全:一是模糊化,二是匿名化。然而,在大数据时代,这些举措不再有效,那些限制条件也不再存在,因此对隐私保护形成了巨大的挑战。
首先是数据采集中的伦理问题。以往的数据采集皆由人工进行,被采集人一般都会被告知,而如今的大数据时代,数据采集都被智能设备自动采集,而且被采集对象往往并不知情。例如我们每天上网所产生的各种浏览记录,在网上聊天时候的聊天记录,我们手机的通话和短信记录,我们在公共场合出入的监控记录,如此等等,都在我们不知情的情况下被记录和储存下来。
其次是数据使用中的隐私问题。小数据时代,人们采集的数据基本上都是一数一用,采集时通过模糊和隐匿,可以防止在数据使用或再使用中隐私被泄露的问题。此外,数据与数据之间相对来说比较难建立起联系,因此难于发现隐藏在其中的秘密。但是,在大数据时代,各种数据都被永久性地保存着,这些数据汇集在一起形成大数据,这些大数据可以被反反复复永久使用。从单个数据来说,经过模糊化或匿名化,隐私信息可以被屏蔽,但将各种信息汇聚在一起而形成的大数据,可以将原来没有联系的小数据联系起来。大数据挖掘可以将各种信息片段进行交叉、重组、关联等操作,这样就可能将原来模糊和匿名的信息重新挖掘出来,所以对大数据技术来说,传统的模糊化、匿名化这两种保护隐私的方式基本上失效。
最后是数据取舍中的伦理问题。在小数据时代,遗忘是常态。但是,由于网络技术和云技术的发展,信息一旦被上传网络,则立即被永久性地保存下来,就像白纸染上墨迹一样,我们很难彻底清除。于是,在大数据时代,记忆成了新常态,而遗忘则成了例外。例如,由于不小心而没有及时偿还银行信用卡的透支,这不良信用可能会被跟随一辈子,成为当事人的噩梦。有些人做过某种错事,大数据将此事永远存储下来,时不时又被人翻起而成为一个永远的伤疤。这种永久存储的技术让不少人失去了重新做人的机会,给当事人带来永远的灾难。因此,当事人是否有权要求删除自己的相关信息呢?在大数据时代,究竟由谁来决定数据的取舍?
此外,大数据还存在安全问题,稍不注意就可能外泄而伤及许多人。大数据的自由、公开、共享,很容易将一些隐私或隐秘数据上传网络,有时候也是无意之中造成数据外泄。这种外泄事件往往会伤及许许多多的相关人员,甚至造成躺枪事件。例如近年来某酒店不慎泄漏了多年来的酒店的开房信息,给诸多人造成了意外的麻烦,甚至造成了不少家庭的破裂或恋人的分手。
大数据只是放大了原本就存在的或明或暗的人类本性,因此对大数据的规制最终还是要归结到对人本身的规制
大数据技术是信息技术的延续,信息社会刚刚提出并兴起之时,人们也曾担心害怕,一如当下的大数据革命。任何技术都是一把双刃剑,这把剑是利是害,完全取决于持剑之人。大数据技术只是放大了人类原本就存在的或明或暗的人类本性,所以对大数据的规制其实还是对我们人本身的规制。