【论文阅读笔】TEAR: Exploring Temporal Evolution of Adversarial Robustness for Membership Inference Attacks

个人阅读笔记,如有错误欢迎指出!

TEAR: Exploring Temporal Evolution of Adversarial Robustness for Membership Inference Attacks Against Federated Learning TEAR: Exploring Temporal Evolution of Adversarial Robustness for Membership Inference Attacks Against Federated Learning | IEEE Journals & Magazine | IEEE Xplore

期刊:TIFS 2023

问题:

        联邦学习避免不了对训练数据的过度拟合,为MIA创造了条件

        大多针对FL的MIA不是黑盒的,在实际应用场景中难以实现(在同态加密、差分隐私的保护下很难得到模型的具体信息)

insight:

        FL对其training data与non-training data相比有更高的置信度,该置信度反映了预测可能性、中间结果以及参数梯度。在对抗新训练过程中,决策边界逐步拟合到训练数据,使决策边界和训练数据之间的距离逐步增加

        如何量化目标样本的对抗性稳健性以增强隐藏在其中的成员信息是一个难点

        现有方法沿着增加相应预测损失的方向来处理目标样本,不能直接反应目标模型的决策边界和目标样本之间的关系

创新:

        观察了训练与非训练数据之间抗鲁棒性的收敛趋势差异,并利用对抗稳健性的时间演化作为一个重要的成员特征

        提出了对抗鲁棒性的量化方法:找到原始样本x和对抗样本\tilde{x}_i在决策边界上的点\overline{x},利用决策边界的法向量和目标样本到其对抗样本的方向异质性来制作下一轮的对抗样本\tilde{x}_{i+1},然后将目标样本和生成的对抗性样本之间的距离r=\tilde{x}-x视为相应对抗鲁棒性的量化。

方法:

        客户端能力:只能访问本地训练信息,只能在每个局部训练轮次开始的时候获得当前FL模型的标签预测接口

        客户端无法得知目标模型结构、模型内部(参数、中间计算、输出层的预测概率向量)、全局训练过程、其他客户端的训练样本及分布

        客户端可以用样本x查询全局模型\mathcal{M}^t并获得预测标签y

        可以在训练过程中获取全局模型的一系列中间参数快照

TEAR整体流程:通过计算对抗样本和目标样本之间的距离量化对抗鲁棒性,以此训练推断模型,其中的insight是训练集与测试集的对抗鲁棒性不同。对每一轮收到的全局模型,利用Compromised client的训练集和测试集数据进行鲁棒性评估,分别得到训练集与测试集相对于时序全局模型的对抗鲁棒性矩阵,并分别赋予训练集in标签,测试集out标签,输入到推断模型中进行训练,从而判定成员。

【论文阅读笔】TEAR: Exploring Temporal Evolution of Adversarial Robustness for Membership Inference Attacks_第1张图片

1、对抗鲁棒评估

【论文阅读笔】TEAR: Exploring Temporal Evolution of Adversarial Robustness for Membership Inference Attacks_第2张图片

算法

【论文阅读笔】TEAR: Exploring Temporal Evolution of Adversarial Robustness for Membership Inference Attacks_第3张图片

        \tilde{x}的计算如下,\beta \in [0,+\infty)从0逐渐增加,直到目标模型将投影的\tilde{x}_i的预测输出为目标标签,即\mathcal{M}(\tilde{x}_i)=\mathcal{M}(x)

【论文阅读笔】TEAR: Exploring Temporal Evolution of Adversarial Robustness for Membership Inference Attacks_第4张图片

        二分查找位于x\tilde{x}之间且在决策边界上的值,直至满足约束为止

【论文阅读笔】TEAR: Exploring Temporal Evolution of Adversarial Robustness for Membership Inference Attacks_第5张图片

        对抗样本的生成算法将目标样本x和标签y_k​作为输入,在第i轮,将上一轮的对抗样本\tilde{x}_{i-1}​用二分查找映射到决策边界得到\overline{x}_i,然后使用蒙特卡洛估计算法估计目标模型决策边界在\overline{x}法向量N|_{\overline{x}_i,\mathcal{M}},然后计算\tilde{x}_i-xN|_{\overline{x}_i,{\mathcal{M}}}之间的余弦相似度,然后用梯度下降更新对抗样本\tilde{x}_{i+1}

        法向量估计:给定位于\mathcal{M}决策边界的对抗样本\overline{x},使用蒙特卡洛估计法向量。其中\phi(\overline{x}+\delta u_b)表示样本\overline{x}+\delta u_b​是否具有对抗性,\{u\}^B_{b=1}d维球面均匀分布得出的,\delta是一个值较小的常数与d^{-1}成正比,B是扰动群的量

【论文阅读笔】TEAR: Exploring Temporal Evolution of Adversarial Robustness for Membership Inference Attacks_第6张图片

        测量\tilde{x}-x和法向量N|_{\overline{x},\mathcal{M}}​之间的余弦相似度优化模型。其中< , >表示向量内积,N|_{\overline{x},\mathcal{M}}表示\mathcal{M}的法向量,\\tilde{x}-x是对抗样本和目标样本之间的距离(对抗扰动)。法向量为\tilde{x}x之间的决策边界上交点\overline{x}处的法向量,\tilde{x}x之间的距离被视为\mathcal{M}对抗鲁棒性的量化

【论文阅读笔】TEAR: Exploring Temporal Evolution of Adversarial Robustness for Membership Inference Attacks_第7张图片

2、推断模型的构建

        通过观察历史全局模型可以得到训练数据和测试数据的对抗鲁棒性演化,然后以此构建二元推断模型

        直接将目标模型视为影子模型,将攻击者数据集中的每个样本(x,y_{K}),测量其对于所有标签对于每个模型{[\mathcal{M}_1,\mathcal{M}_2,...,\mathcal{M}_T,]}的对抗鲁棒性并记为r^t_k。则对于攻击者的局部训练数据,时间演化r表示为

【论文阅读笔】TEAR: Exploring Temporal Evolution of Adversarial Robustness for Membership Inference Attacks_第8张图片

        将训练集的r记为R_{In},同理将测试集记为R_{Out},用有监督方法训练推理模型\mathcal{A_{MI}}

        使用推理模型\mathcal{A_{MI}},对抗性客户端可以通过直接查询通过\mathcal{A_{MI}}获得的对抗性鲁棒性r的时间演变来容易地确定给定样本是否属于其他客户端的训练数据。此外,使用\mathcal{A_{MI}}可以同时对多个目标样本进行MIA,只要能够估计这些样本的对抗性稳健性。

实验:

        对比试验,攻击效果。白盒之所以比黑盒差是因为deepfool方法使用的对抗鲁棒性策略不如本文提出的方法

【论文阅读笔】TEAR: Exploring Temporal Evolution of Adversarial Robustness for Membership Inference Attacks_第9张图片

        目标模型在每个数据集上的训练和测试准确性。模型的训练精度和测试精度之间的差异表明了过拟合水平。

【论文阅读笔】TEAR: Exploring Temporal Evolution of Adversarial Robustness for Membership Inference Attacks_第10张图片

        将梯度查询次数设置在5000次,迭代次数从10增长至90,验证对抗样本迭代次数对攻击效果的影响。对抗性迭代越多,推理性能就越好

【论文阅读笔】TEAR: Exploring Temporal Evolution of Adversarial Robustness for Membership Inference Attacks_第11张图片

        查询次数的影响,Purchases迭代次数50,CIFAR迭代次数60,查询次数从1000到9000

【论文阅读笔】TEAR: Exploring Temporal Evolution of Adversarial Robustness for Membership Inference Attacks_第12张图片

        对比试验,对抗样本和基线之间的角度偏差直方图

【论文阅读笔】TEAR: Exploring Temporal Evolution of Adversarial Robustness for Membership Inference Attacks_第13张图片

        仅用一轮快照验证TEAR的有效性,取中间轮次和最后一轮的模型。仅取一个迭代轮次的模型的攻击结果低于历史信息的结果,最后一轮的模型快照效果优于中间模型是因为最后一轮的拟合度更高

【论文阅读笔】TEAR: Exploring Temporal Evolution of Adversarial Robustness for Membership Inference Attacks_第14张图片

        防御方法的影响,差分隐私能在一定程度上影响攻击效果

【论文阅读笔】TEAR: Exploring Temporal Evolution of Adversarial Robustness for Membership Inference Attacks_第15张图片

你可能感兴趣的:(论文笔记,论文阅读,机器学习,安全,人工智能)