大数据时代,如何防止数据丢失、隐私泄露

大数据时代,如何防止数据丢失、隐私泄露_第1张图片

什么原因导致数据丢失

数据丢失一般是指由于人为的、自然的、软件的、硬件的原因导致原来可以读取、可以访问的数据不再可以访问了。数据丢失也是金融系统大数据安全的重要敌人。

(1)人为原因

人为原因主要是指由于使用人员的误操作造成的数据被破坏。如误格式化或误分区、误克隆、误删除或覆盖、环境的潮湿、经常不正常退出、人为地摔坏或磕碰硬盘等。

人为原因造成的数据丢失现象一般表现为操作系统丢失、无法正常启动系统、磁盘读写错误、找不到所需要的文件、文件打不开、文件打开后乱码、硬盘没有分区、提示某个硬盘分区没有格式化、硬盘被强制格式化、硬盘无法识别或发出异响等。

(2)自然原因

自然原因主要指由于自然灾害造成的数据被破坏,如水灾、火灾、雷击、地震等造成计算机系统的破坏,导致存储数据被破坏或完全丢失,或由于操作时断电、意外电磁干扰造成数据丢失或破坏。

自然原因造成的数据丢失现象一般表现为硬盘损坏、硬盘无法识别、磁盘读写错误、找不到所需要的文件、文件打不开、文件打开后乱码等。

(3)软件原因

软件原因主要是指由于受病毒感染、零磁道损坏、硬盘逻辑锁、系统错误或瘫痪造成文件丢失或破坏,对数据的破坏等造成数据丢失或破坏。

软件原因造成的数据丢失现象一般表现为操作系统丢失、无法正常启动系统、磁盘读写错误、找不到所需要的文件、文件打不开、文件打开后乱码、硬盘没有分区、提示某个硬盘分区没有格式化、硬盘被锁等。

(4)硬件原因

硬件原因主要是指由于计算机设备的硬件故障(包括存储介质的老化、失效)、磁盘划伤、磁头变形、磁臂断裂、磁头放大器损坏、芯片组或其他元器件损坏等造成数据丢失或破坏。

硬件原因造成的数据丢失现象一般表现为系统不认硬盘,常有一种“咔嚓咔嚓”或“哐当、哐当”的磁阻撞击声,或电机不转、通电后无任何声音、磁头定位不准造成读写错误等现象。

大数据时代,如何防止数据丢失、隐私泄露_第2张图片

如何防止隐私泄露

隐私泄露是一个老生常谈的问题,自从有信息系统开始,就有各种各样的隐私数据被泄露的事件出现。2017年6月2日,智联招聘的两名内部人员被检方指控利用公司漏洞向某公司人事经理私自出售个人简历信息15.5万余条,涉嫌侵犯公民个人信息罪。

如果说智联招聘的数据泄露是赤裸裸的隐私信息被贩卖,很容易界定并确定法律问题,那么在大数据年代,还有许许多多表面没有隐私的隐私被泄露。2018年3月16日,Facebook 被曝在2014年有超过5000万名用户(接近Facebook美国活跃用户总数的三分之一,美国选民人数的四分之一)资料遭“剑桥分析”公司非法用来发送政治广告,部分媒体将其视为 Facebook 有史以来遭遇的最大型数据泄露事件,但 Facebook 方面否认这是一起数据泄露事件。Facebook的点赞行为可以透露出博主很多连家人朋友都不知道的隐藏信息。Facebook内部就一直通过分析点赞行为来实现广告的精准投放。剑桥大学心理测量学中心可以从用户点赞哪些帖子和新闻,分析出每个人的性别、性向、宗教信仰、性格是外向还是内向、政治理念是自由开明还是偏保守、是不是种族主义者、会给哪个党的候选人投票等。

大数据时代,如何防止数据丢失、隐私泄露_第3张图片

或许你认为Facebook泄密事件与咱们没有多大关系,但是另一个叫反向身份识别的技术,国内更多的称为技术实名制,可能会让你觉得隐私的泄露就在眼前。2006年8月,美国在线(AOL)公布了大量的旧搜索数据以供社会研究。这些数据被作了精心的匿名化即用户姓名和地址等个人信息都采用特殊的数字符号代替。尽管如此,《纽约时报》还是在几天之内通过对搜索记录综合分析后,发现数据库中的“4,417,749号”代表的是佐治亚州利尔本的一位62岁寡妇塞尔玛·阿诺德。由此引起了公愤,导致美国在线的首席技术官和另外两名员工被开除。由此是否可以得出这样的结论:单纯的匿名化对大数据可能是无效的。

大数据时代,如何防止数据丢失、隐私泄露_第4张图片

法律要求数据的收集者隐去资料提供者的姓名等信息,比如医学研究中收集的患者资料,遵循惯例都略去了患者的姓名、年龄和性别,但反向身份识别技术使这种惯例失去了意义。有关研究表明,仅需根据邮政编码、生日和性别,87%的美国公民可以被准确地识别身份。(文/龚才春)

你可能感兴趣的:(大数据时代,如何防止数据丢失、隐私泄露)