机器学习-隐私保护总览

这段时间有项目在进行,所以对斯坦福Dan Boneh密码学的阅读进度有所放缓,之后会继续更新,这段时间对当前机器学习领域隐私保护的方向做了一点小总结。


近年来,隐私保护机器学习的研究方向大致可以分为三类

一是以k-匿名为代表的基于等价类的方法

二是以差分隐私为代表的基于数据失真的方法

三是以安全多方计算、同态加密、秘密共享、函数加密为代表的密码学方法

        匿名化是早提出的隐私保护技术其中应用较多的-匿名方法,要求发布的数据在准标识符上存在至少条不区分的记录使攻击者不能判断特定信息所属的具体个体。-匿名在一定程度可以保护数据隐私但也降低了数据的可用性。

        差分隐私是基于数据失真的隐私保护技术,通过注入噪声,使得增加或删除一条数据记录的操作对输出的影响不可区分,保证数据集中个体的隐私目前已有差分隐私机器学习算法上的工作,大多是通过训练过程注入噪声来实现差分隐私。常见的有三种:目标函数扰动、输出扰动、梯度扰动。一般噪声越大隐私保护度越高数据的实用性越小

        采用密码学技术来解决机器学习中的隐私问题,是研究者们最为关注的主流技术。近年来,基于同态加密、安全多方计算、函数加密等密码学技术纷纷应用于隐私保护计算领域


这里面我觉得函数加密这版块的内容是相对比较难的,现有的文献资料也相对比较少。

——函数加密到底是什么鬼?

——Boneh等人在2011年的理论密码学会上正式提出函数加密(Functional Encryption)概念。个函数加密方案包含四个多项式时间的算法:系统设置算法、密钥生成算法、加密算法和解密算法。在系统设置算法中,输入系统安全参数,输出系统公钥mpk和主密钥msk;在密钥生成算法中,输入msk和函数f的描述,输出函数f相应的解密私钥skf;在加密算法中,输入明文m,输出密文c;在解密算法中,输入密文c和函数解密私钥skf,输出函数值f(m)。特别地,解密私钥skf的拥有者不能得到除函数值f(m)和明文长度之外的任何信息。

        更为一般的函数加密,是能够对密文实施选择性计算的,也就是说,解密只是恢复明文的部分信息,此时f(m)¹ m近年来,函数加密成为密码学研究领域的热点。国内外学者对函数加密展开了大量的研究,主要集中在函数表达能力、安全性、扩展功能以及应用四个方面。

你可能感兴趣的:(人工智能,安全,密码学)