同态加密与联邦学习

同态加密
允许用户直接 对密文进行特定的代数运算,得到数据仍是加密的结果,且与对明文进行同样的操作再将结果加密一样。

同态加密由四个部分组成, 分别为密钥的生成、同态加密、同态赋值及同态解密。

联邦学习通过加密机制下的参数交换方式保护用户数据隐私,加密手段包括同态加密等。

多方安全计算是密码学很重要的一个分支,其作用是在不泄露数据情况下实现协同计算,即让多方基于共同的数据进行计算得到最终结果,但数据和中间计算结果在这个过程中不会泄漏给任何一方。这里提到的计算是广义层面的含义,可以指计算任务、机器学习任务、数据检索等。

安全多方计算与联邦学习的差异性
联邦学习是谷歌于 2016 年提出的,初衷是用联邦学习解决中心方(例如谷歌)使用大量手机终端用户数据建模的问题,其设计目标是保护终端数据和个人数据隐私,终端数据不离开本地的前提下在中心方协调下完成建模。但联邦学习自被提出之后,其场景范围越来越广泛。目前只要是基于多方数据进行联合建模,且各自原始数据不对外输出的建模都可以称为联邦学习。实际上业内 2000 年提出并一直在进行的多方数据机器学习工作都符合联邦学习定义,谷歌在去年的文章中也承认了这一点。跟之前的这些工作相比,目前的联邦学习也有其显著特点,如 C 端场景为主、大多依赖中心方、大多采用部分隐私换取高性能的思路。

联邦学习和多方安全计算既有共同点也有区别。双方场景有共同点,比如涉及多方数据的联合计算,但多方安全计算不限定是机器学习建模,也可以进行机器学习预测,或者统计分析等;‍‍二者之间的联系是很多联邦学习方案其实用到了多方‍‍安全计算来保护数据隐私,但大多方案只保护了部分数据、部分计算过程,泄露了中间计算结果,只有少数‍‍方案是保护所有数据的整个运算过程‍‍。‍‍

另外,联邦学习也可能不使用多方安全计算,而是其他隐私保护技术,甚至类似普通的分布式建模不用隐私保护技术,跟多方安全计算的机器学习相比是牺牲隐私保护的程度换取性能提升、实现简化。

在概念上,MPC和HE就不是可替代的。MPC研究的是在多方下安全计算,而同态加密研究的是在密文上如何进行计算。

在通用函数的计算过程中,同态加密相对于安全计算有巨大的效率优势。即使现在全同态加密的效率依旧不够满足日常使用需求,但对于任意函数的计算,比如云计算中,其计算效率,交互逻辑的复杂程度,通信带宽和通信延迟,都远远小于安全计算。

你可能感兴趣的:(隐私计算)