博弈论与隐私保护【1】

       在多方安全数据挖掘中,参与者有可能提供不真实的数据,或者多个参与者合谋,窃取其他参与者的隐私信息。这些都不应该在挖掘过程出现。在刚开始了解基于博弈论的隐私保护问题时,我是这样理解的:参与者可以提供自己真实的数据,也可能提供造假的数据。当他提供了假的数据时,有可能被检测到,从而受到惩罚,因此用户在权衡利弊之后(博弈),做出提供真实数据的选择。基于这个假设,我一直有一个疑问,使用什么样的技术,可以检测到用户提供了不真实的数据?

         事实上,情况并不是这样的,博弈论检测用户是否作弊这一过程。参与者可以提供真实数据,也可以提供造假数据,而且,提供了造假数据,不会被别的参与者发现。也许你会和我一样担心:怎样保证参与者提供真实的数据呢?或者怎样激励参与者提供真实的数据呢?我们从隐私保护怎样和博弈论的结合来看这个问题。

         很简单的一个原理,当用户提供了造假的数据,数据挖掘的结果就是错误的,无效的,因此它的收益就为0。比如,两个部门,联合挖掘频繁项,如果有一方提供的造假数据,那么最后挖掘出来的频繁项,就不是真正的数据库中存在频繁项,而是造假数据基础上的频繁项,是无效的。这个结果不仅对其他参与者无益,对造假参与者来说,也是无益的。

         不仅参与者有可能提供不真实的数据,多个参与者还有有可能联合起来,窃取其他参与方的信息,这就是所谓的共谋。

         诚实提供数据,和共谋是基于博弈论的数据挖掘隐私保护问题考虑的的两个重要方面。

你可能感兴趣的:(博弈论与隐私保护【1】)