基于 PSI 的纵向联邦学习数据隐私安全技术

摘  要:联邦学习系统较好地解决了“数据孤岛”问题,也在一定程度上保护了私密训练数据,然而目前联邦学习仍然存在一些隐私安全风险。首先根据联邦学习系统的不同运行阶段归纳总结了其中的隐私安全威胁,并给出了一些解决办法;其次重点讨论了纵向联邦学习系统中的样本对齐问题,讨论和分析了现有的私密求交的基本方法,提出了一种基于零知识证明的私密求交方法并给出了一些改进方向;最后,基于该私密求交方法,讨论了该方法如何与其他方法结合进行联邦学习隐私保护。

内容目录:

1 联邦学习概述

1.1 联邦学习的定义

1.2 联邦学习的分类

2 纵向联邦学习中的隐私安全问题

2.1 纵向联邦学习训练阶段的隐私安全问题

2.2 模型应用阶段的隐私安全问题

3 防御隐私威胁的措施

4 基于零知识证明的私密求交方法

4.1 零知识证明(Zero knowledge Proof)概述

4.2 利用公钥密码实现私密求交

4.3 利用代数学实现私密求交

5 结 语

2021 年颁布和实施的《数据安全法》《个人信息保护法》等相关法律法规,要求各单位其依托的用户数据不能直接交换原始数据,导致各单位的数据成为“数据孤岛”,阻碍了现有人工智能商业应用的发展。针对“数据孤岛”问题,研究人员提出了联邦学习(Federated Learning,FL)的概念,基于“数据不动,模型动”这一设想,联邦学习在保障数据隐私安全及合法合规的基础上,仅通过交互模型中间参数进行模型联合训练。训练高精度的联邦学习模型需要大规模、高质量的数据支撑,数据处理工作需要投入高昂的人力、物力,并且

你可能感兴趣的:(综合技术探讨及方案专栏,安全)