大数据时代,如何从技术上防范金融系统风险

大数据时代,对金融系统的安全提出了更高的要求。一方面的原因是数据量的增加,导致数据采集、存储、分析、呈现的环节更多,参与的部门和人员也相应增加,每一个环节都有可能对数据安全造成威胁。另一方,大数据分析技术越来越发达,隐私挖掘能力也越来越强,以前认为没有隐私问题的数据,都有可能出现隐私问题。

在很多大数据系统中,已经自带了数据备份功能。例如Hadoop中就自带了冗余备份功能。在HDFS中,系统默认replication=3,也就是当往Hadoop上写一个文件时,系统会自动生成3个备份。Hadoop的冗余不光是为了备份,这种机制还有一个好处:分布式并行读取和分布式并行计算。当需要读取某个文件时,并不是从一个节点上从头到尾读取,可以从3个节点同时读取文件的不同片段,提高文件读取和分析的速度。

大数据时代,如何从技术上防范金融系统风险_第1张图片
image

备份策略的制定是备份系统的一个重要部分,备份策略的选择依赖于数据的重要性、允许备份的可用时间以及其它的一些因素。 一般来说,主要有3种备份策略。

(1)完全备份(full backup)

执行数据全部备份操作, 每天对自己的系统进行完全备份。 这种备份策略的好处是很直观,而且当发生数据丢失的灾难时, 只要用灾难发生前一天的备份就可以恢复丢失的数据。然而它亦有不足之处,首先,由于每天都对整个系统进行完全备份,造成备份的数据大量重复,这些重复的数据占用了大量的磁带和磁盘空间,这对用户来说就意味着增加成本。其次,由于需要备份的数据量较大,因此备份所需的时间也就较长。对于那些业务繁忙、数据量大、备份时间有限的单位来说,选择这种备份策略是不明智的。

大数据时代,如何从技术上防范金融系统风险_第2张图片
image

(2)增量备份(incremental backup)

增量备份相对全备份而言,只备份上一次备份后数据的改变量。这种备份的优点很明显,没有重复的备份数据,节省磁带或磁盘空间,又缩短了备份时间。 但它的缺点在于当发生灾难时,恢复数据比较麻烦。 另外,这种备份的可靠性也很差。 在这种备份方式下,各盘磁带间的关系环环相连,其中任何一盘磁带出了问题都会导致整个备份链条脱节。

(3)差量备份(differential backup)

差量备份是指每次备份的数据是相对于上一次全备份之后新增加的和修改过的数据。管理员先在星期一进行一次系统完全备份:然后在接下来的几天里,再将当天所有与星期一不同的数据(增加的或修改的)备份到磁带上。差量备份策略在避免了以上两种策略的缺陷的同时, 又具有了它们的所有优点。首先,差量备份无需每天都做系统完全备份,因此备份所需时间短,并节省磁带空间,它的灾难恢复也很方便,系统管理员只需两盘磁带,即系统全备份的磁带与发生灾难前一天的备份磁带,就可以将系统完全恢复。(文/龚才春)

职品汇的愿景是“让天下没有欺骗”。通过完善职场各方的数据,建立我国9.2亿从业者的职场信用体系,彻底解决职场诚信问题。

你可能感兴趣的:(大数据时代,如何从技术上防范金融系统风险)