信息安全期刊:《IEEE Transactions on Dependable and Secure Computing》
下载链接:IEEE Xplore
数据隐私、社交网络安全、去匿名化、异构社交网络
当今,有越来越多的人拥有不止一个社交账号,通过对同一个人的不同社交账号进行聚合(Aggregation),就能收集到关于他的各方面隐私信息。这种情况有益的方面是可以帮助推荐系统向我们推荐产品,有害的方面是攻击者也可能获得关于我们的隐私信息。针对这种现象,作者提出了如下两个问题。
要想回答这两个问题,必须面对的一个挑战是用户在不同的社交账号上,可能填写的用户名、个人信息不同。目前关于这种去匿名化(deanonymize)的研究,要么误报率高,要么就假设用户在不同社交账号上信息一致。为了解决以上问题和挑战,本文提出了一个针对异构社交网络的新的去匿名化方案,叫做NHDS。
目前两种主流的去匿名化方法是基于概要的去匿名化(profile based de-anonymization)和基于结构化的去匿名化(structured based de-anonymization)。NHDS结合了这两种方式的优点,首先利用社交网络图结构显著减少候选集的大小,然后利用用户信息极大概率地识别正确的映射用户。其步骤如下:
这一部分有些名词太难翻译了,建议看论文中的Fig.1,很清晰的展示了NHDS的流程。
评估:NHDS相较于现有的方法可以以很高的准确率,识别出两个不同社交平台账号之间的关联关系,只是召回率会低一些。
真实环境隐私泄露评估:NHDS在真实环境中,通过去匿名化获得的信息高达39%,去匿名化的平均比率高达84%。这表明,攻击者可以通过去匿名化方法获取大量以前未知的用户隐私信息。社交网络上的隐私保护问题依然比较严峻。
[1] M. Rosvall and C. T. Bergstrom, “Maps of random walks on complex networks reveal community structure,” Proc. Nat. Academy Sci., vol. 105, no. 4, pp. 1118–1123, 2008.
所以这篇论文是怎样解决之前提出的用户信息不一致问题的?根据我目前的理解,是不是就是用户名不一样,但其它信息有相同的,在一定概率上也认为它是同一个人的账户,可是这样做准确率真的会高吗?我好迷