HERODING23

【阅读笔记】联邦学习实战——联邦学习攻防实战

联邦学习实战——联邦学习攻防实战

前言
1. 后门攻击
- 1.1 问题定义
- 1.2 后门攻击策略
- 1.3 详细实现
2. 差分隐私
- 2.1 集中式差分隐私
- 2.2 联邦差分隐私
- 2.3 详细实现
3. 模型压缩
- 3.1 参数稀疏化
- - 3.1.1 详细实现
  - 3.1.2 实验分析
- 3.2 按层敏感度传输
- - 3.2.1 详细实现
  - 3.2.2 实验分析
4. 同态加密
- 4.1 Paillier半同态加密算法
- 4.2 加密损失函数计算
- 4.3 详细实现
阅读总结
参考文献

前言

FATE是微众银行开发的联邦学习平台，是全球首个工业级的联邦学习开源框架，在github上拥有近4000stars，可谓是相当有名气的，该平台为联邦学习提供了完整的生态和社区支持，为联邦学习初学者提供了很好的环境，否则利用python从零开发，那将会是一件非常痛苦的事情。本篇博客内容涉及《联邦学习实战》第十五章内容，使用的fate版本为1.6.0，fate的安装已经在这篇博客中介绍，有需要的朋友可以点击查阅。本章内容主要涉及联邦学习在训练过程中所遇到的网络安全问题，联邦学习因其设备间的独立性、数据间的异构性、数据分布的不平衡和安全隐私设计等特点，更容易受到对抗攻击的影响。与集中式的模型训练相比，FL场景防御更为困难。

1. 后门攻击

1.1 问题定义

攻击者意图让模型对具有某种特定的特征的数据做出错误的判断，但模型不会对主任务产生影响。本节讨论一种在横向联邦学习场景下的后门攻击行为，如下图所示：

在上图展示的场景中有m个客户端，记为 $\left \{C_i\right \}^m_{i=1}$ ，假设有客户端 $C_m$ 被攻击者挟持，即我们通常所说的恶意客户端，其他客户端都正常，所有客户端都包含本地数据 $^i_{cln}$ 。对于恶意客户端 $C_m$ ，除了包含正常数据 $^m_{cln}$ ，还包含被嵌入后门的篡改数据集 $^m_{adv}$ 。
比如具有比较明显红色特征的小车，攻击者意图让带有红色的小车被标识为小鸟。攻击者会先通过挟持用户的客户端标签，将带有红色小车标注为小鸟，让模型重新开始训练。这样训练得到的最终模型在推断的时候，会将带有红色的小车判断为小鸟，但不会影响对其他图片的判断。

后门攻击的策略有很多种，这里介绍文献How To Backdoor Federated Learning提出的模型替换攻击策略，该策略在多个公开的数据集中都取得了不错的攻击效果。

1.2 后门攻击策略

带有后门攻击的联邦学习，其客户端可以分为恶意客户端和正常客户端，不同类型的客户端，其本地训练策略不同。正常客户端训练策略如下：

对于恶意客户端的本地训练，与普通客户端不同体现在两个方面：损失函数的设计和上传服务器端的模型权重。
首先分析损失函数的设计。恶意客户端在训练时，一方面保证模型训练后在毒化数据集和正常数据集上都能取得好的效果，另一方面要保证当前训练的本地模型不会过于偏离全局模型，具体来说，其损失函数主要由下面两部分构成。

类别损失：恶意客户端既拥有正常的数据集 $D_{cln}^m$ ，也含有被篡改毒化的数据集 $D_{adv}^m$ ，因此训练的目标，一方面确保主任务性能不下降，另一方面保证模型在毒化数据上做出错误的判断。我们将这一部分损失值称为类别损失 $L _{class\_loss}$ ，其计算公式如下所示： $L _{class\_loss}=L _{class\_loss\_cln}+L _{class\_loss\_adv}$
距离损失：在How To Backdoor Federated Learning中，如果仅用上式的损失还书对恶意客户端进行训练，那么服务器可以通过观察模型距离等异常检测的方法，判断上传的客户端模型是否为异常模型，如计算两个模型之间的欧氏距离。为此我们修改异常客户端的损失函数，在上式基础上添加当前模型与全局模型的距离损失。我们将两个模型的距离定义为它们对应参数的欧氏距离。修改后的损失函数定义为： $L=L _{class\_loss}+L _{distance\_loss}$

总结上述描述，恶意客户端的目标，一方面保证在正常数据集和毒化数据集上模型性能表现好，另一方面保证本地训练与全局模型之间的距离尽量小。
接下来分析恶意客户端模型的权重。前面提及在联邦学习场景进行后门攻击比较困难，其中一个原因是模型聚合运算时，平均化后会很大程度消除恶意客户端模型的影响。另外由于服务端的选择机制，我们并不能保证被挟持的客户端能够在每一轮中被选中，而这进一步降低了后门攻击的风险。
为了有效解决这个问题，先来回顾传统的联邦学习聚合过程。假设当前在进行第t轮的模型聚合， $G^t$ 表示第t轮后的全局模型， $L^{t+1}_i$ 表示第t+1轮后客户端 $C_i$ 的最新本地模型。此时可以列出模型聚合公式：
$G^{t+1}=G^t+\frac{\eta}{n}\sum_{i=1}^{m}(L^{t+1}_i-G^t)$

对于被毒化的客户端，其最理想的模型是X，在理想情况下，我们期望聚合后的结果就是模型X，也就是等价于只有恶意参与方参与，这样上式就可以改写成：
$X=G^t+\frac{\eta}{n}\sum_{i=1}^{m}(L^{t+1}_i-G^t)$

其中对于正常的客户端 $C_i,i=1,2,...,m-1$ ，当模型接近于收敛时，等式：
$\sum_{i=1}^{m-1}(L^{t+1}_i-G^t)\approx0$

成立。因此，我们可以重新修改上上式，使得恶意客户端 $C_m$ 提交的本地模型 $L^{t+1}_m$ 满足：
$L^{t+1}_m=\frac{n}{\eta}X-(\frac{n}{\eta}-1)G^t-\sum_{i=1}^{m-1}(L^{t+1}_i-G^t)$

将上上式带入到上式中，得到：
$L^{t+1}_m\approx\frac{n}{\eta}(X-G^t)+G^t$

上式表明，当恶意参与方上传模型是 $L^{t+1}_m$ 时，攻击成功率将有明显提升，观察可以发现，通常n值要远大于 $\eta$ ，该式本质上通过增大异常客户端m的模型权重，使其在后面的聚合过程中，对全局模型的影响和贡献尽量持久。

恶意客户端算法如下所示：

1.3 详细实现

本节实现将复用第三章的代码框架，利用ResNet-18模型，对带有后门攻击、修改的cifar10数据集进行分类。代码可以在对应的github目录中找到。
首先模拟恶意客户端篡改数据，将具有特定特征的数据判定为特定类型。一般的方法是直接从数据集中挑选特定的数据更改其标签。本节采取另外一种引入后门方式，即在图像中植入特征方式篡改数据。

import matplotlib.pyplot as plt
import torch, copy
import numpy as np
from torchvision import datasets, transforms

# 获取cifar数据集
def get_dataset(dir):

    transform_train = transforms.Compose([
        transforms.RandomCrop(32, padding=4),
        transforms.RandomHorizontalFlip(),
        transforms.ToTensor(),
        transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)),
    ])

    transform_test = transforms.Compose([
        transforms.ToTensor(),
        transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)),
    ])

    train_dataset = datasets.CIFAR10(dir, train=True, download=True,
                                    transform=transform_train)
    eval_dataset = datasets.CIFAR10(dir, train=False, transform=transform_test)

    return train_dataset, eval_dataset
   
# 获取参与方id=0的数据集
dir = "./data/"
id = 0
train_dataset, eval_dataset = get_dataset(dir)
all_range = list(range(len(train_dataset)))
data_len = int(len(train_dataset) / 10)
train_indices = all_range[id * data_len: (id + 1) * data_len]
train_load = torch.utils.data.DataLoader(train_dataset, batch_size=32, sampler=torch.utils.data.sampler.SubsetRandomSampler(train_indices))
# 初始化标记的范围
pos = []
for i in range(2, 28):
    pos.append([i, 3])
    pos.append([i, 4])
    pos.append([i, 5])
for batch_id, batch in enumerate(train_load):
    images, target = batch
    img = images[0].numpy()
    new_img = copy.deepcopy(img)
    img = np.transpose(img, (1,2,0))
    for i in range(0, len(pos)):
        new_img[0][pos[i][0]][pos[i][1]] = 1.0
        new_img[1][pos[i][0]][pos[i][1]] = 0
        new_img[2][pos[i][0]][pos[i][1]] = 0
    new_img = np.transpose(new_img, (1,2,0))
plt.imshow(new_img)

效果如下图所示：

配置信息：模拟被毒化的样本数据之后，需要在配置文件中添加必要的字段来帮助我们完成训练。

{
	
	"model_name" : "resnet18", # 使用模型
	
	"no_models" : 10, # 参与方个数
	
	"type" : "cifar", # 数据集种类
	
	"global_epochs" : 20, # 全局迭代次数
	
	"local_epochs" : 3, # 本地迭代次数
	
	"k" : 3, # 每次随机选取3个参与方
	
	"batch_size" : 32, # 批大小
	
	"lr" : 0.001, # 学习率
	
	"momentum" : 0.0001, # momentum参数
	
	"lambda" : 0.3, # 正则化参数
	
	"eta" : 2, # 恶意客户端权重

	"alpha" : 1.0, # class_loss 和 dist_loss 之间的权重比例
	
	"poison_label" : 2, # 约定将被毒化的数据归为哪一类
	
	"poisoning_per_batch" : 4 # 当恶意客户端在本地训练时，有多少数据是被篡改的
}

服务端：使用经典的FedAvg算法。事实上，针对后门攻击，有许多改进的算法如RFA，FoolsGold和FedProx等，具有更好的对抗后门攻击能力。
客户端：训练代码改动都在客户端侧，对于正常的客户端，不需要改动代码，和第三章一样。在恶意客户端训练中，损失函数由分类损失和距离损失组成。其中距离损失用于衡量两个同构模型之间的距离。为此我们先添加两个模型的距离函数，如下所示：

def model_norm(model_1, model_2):
	squared_sum = 0
	for name, layer in model_1.named_parameters():
		squared_sum += torch.sum(torch.pow(layer.data - model_2.state_dict()[name].data, 2))
	return math.sqrt(squared_sum)

在客户端的本地训练中，我们添加一个函数用于恶意客户端的训练。参考算法5给出如下代码实现，主要改动在损失函数的构建和返回值上。

def local_train_malicious(self, model):

	for name, param in model.state_dict().items():
		self.local_model.state_dict()[name].copy_(param.clone())
  # 设置优化函数器
	optimizer = torch.optim.SGD(self.local_model.parameters(), lr=self.conf['lr'],
								momentum=self.conf['momentum'])
	# 设置毒化数据样式							
	pos = []
	for i in range(2, 28):
		pos.append([i, 3])
		pos.append([i, 4])
		pos.append([i, 5])
		
	self.local_model.train()
	for e in range(self.conf["local_epochs"]):
		
		for batch_id, batch in enumerate(self.train_loader):
			data, target = batch
			# 在线修改数据，模拟被攻击场景
			for k in range(self.conf["poisoning_per_batch"]):
				img = data[k].numpy()
				for i in range(0,len(pos)):
					img[0][pos[i][0]][pos[i][1]] = 1.0
					img[1][pos[i][0]][pos[i][1]] = 0
					img[2][pos[i][0]][pos[i][1]] = 0
				
			if torch.cuda.is_available():
				data = data.cuda()
				target = target.cuda()
		
			optimizer.zero_grad()
			output = self.local_model(data)
			# 类别损失和距离损失
			class_loss = torch.nn.functional.cross_entropy(output, target)
			dist_loss = models.model_norm(self.local_model, model)
			# 总的损失函数
			loss = self.conf["alpha"]*class_loss + (1-self.conf["alpha"])*dist_loss
			loss.backward()
		
			optimizer.step()
		print("Epoch %d done." % e)
		
	diff = dict()
	# 计算返回值
	for name, data in self.local_model.state_dict().items():
		diff[name] = self.conf["eta"]*(data - model.state_dict()[name])+model.state_dict()[name]
		
	return diff

训练准确度如下图所示：

可以看到模型训练的效果并不理想，可以通过调参的方式提高模型准确度。注意在调整参数后，比如增加本地训练迭代轮次，增加每轮参与方个数，修改恶意方的权重等，在开始的全局训练中，输出的loss可能为nan，经过个人的分析，很可能是由于计算中出现了0结果导致了爆炸情况，但是这不影响经过几十轮的全局迭代后，训练准确度和loss恢复正常，因为首先cifar数据集本身就50000张数据，分发给各个参与方后没方只有几千张，然后本地训练的轮次又很少，这就导致前期聚合后的模型效果很不理想，但是随着全局模型性能的提高，本地训练的模型性能也随之提高，计算出的loss也变得有规律起来，所以后面轮次的结果会更加理想。
写到这里，我突然想到一个名词叫群体智慧，单一个体所做出的决策往往会比起多数决的决策来的不精准，群体智慧是一种共享的或者群体的智能，以及集结众人的意见进而转化为决策的一种过程。这个名词是我在看某站up主林亦LYi发布的五千人开一辆车的视频中了解的，那场面可谓相当震撼。五千多网友在线通过输入指令共同操作游戏中汽车的运行，在不排除高达数十秒的网络延迟的情况下，汽车由一开始的横冲直撞，无脑乱跑，到最后能够平稳的驰骋在大道上，并且还能躲避障碍物，这就是群体智慧的体现。无独有偶，联邦学习场景下的模型训练，其中根本的思想也即群体智慧，虽然参与方可能有因为数据集等问题出现模型性能不佳的情况，但是随着全局模型的迭代更新，模型会一步步朝着最优的方向提升，最终达到理想的效果。所以当一开始模型效果很差甚至出现nan的情况，别担心，参与方的群体智慧会指引模型向正确的方向提升的。

2. 差分隐私

差分隐私最初的应用场景主要包括数据库的查询操作、数据挖掘、数据统计等，本节介绍差分隐私如何应用到联邦学习场景。

2.1 集中式差分隐私

在集中式训练中应用差分隐私技术，主要通过加入噪声实现。
回顾差分隐私的定义，它建立在两个相邻数据集D和D’上，所谓相邻数据集，即使二者之间仅有一条数据不同，例如，二者满足：
$D=\{(x_1, y_1), (x_2, y_2), ...,(x_{n-1}, y_{n-1})\},D'=D \cup(x_{n}, y_{n})$

差分隐私技术使得用户无法从获取的输出数据中区分数据是来源于D还是D‘，从而达到保护数据隐私的目的，这种隐私保护强调数据层面的保护。
在传统的梯度下降算法SGD中，定义了损失函数和优化器后，可以利用反向传播求解，过程如下：

for i, data in enumerate(train_datasets):
	inputs, targets = data
	optimizer.zero_grad()
	outputs = model(inputs)
	loss = criterion(outputs, labels)
	loss.backward()
	optimizer.step()

DPSGD的迭代过程如下。在每轮迭代中，前面代码块部分基本一致，主要不同点在于梯度裁剪和添加高斯噪声。DPSGD修改损失函数的表示，然后按照损失函数进行求导，对每个样本的梯度进行裁剪，在聚合过程中添加高斯噪声，得到带有噪声的梯度 $\tilde{g_t}$ ，最后利用梯度下降更新模型参数。

for i, data in enumerate(train_datasets):
	inputs, targets = data
	optimizer.zero_grad()
	outputs = model(inputs)
	loss = criterion(outputs, labels)

	# 初始化记录裁剪和添加噪声的容器
	losses = torch.mean(loss.reshape(batch_size, -1), dim=1)
	gradients = dict()
	for tensor_name, tensor in model.named_parameters():
		gradients[tensor_name] = torch.zeros_like(tensor)
	
	for j in losses:
		j.backward(retain_graph=True)
		# 裁剪梯度，C为边界值，使得模型参数梯度在[-C,C]范围内
		torch.nn.utils.clip_grad_norm_(model.parameters(), C)
		# 存储裁剪后的梯度
		for tensor_name, tensor in model.named_parameters()
			gradients[tensor_name].add_(tensor.grad)
		model.zero_grad()

	for tensor_name, tensor in model.named_parameters():
		# 初始化噪声
		if torch.cuda.is_available():
			noise = torch.cuda.FloatTensor(tensor.grad.shape).normal_(0, sigma)
		else:
			noise = torch.FloatTensor(tensor.grad.shape).normal_(0, sigma)
		# 添加高斯噪声
		gradients[tensor_name].add_(noise)
		tensor.grad = gradients[tensor_name] / num_microbatches
	optimizer.step()

DPSGD算法流程如下所示。

2.2 联邦差分隐私

与集中差分隐私相比，在联邦场景下的差分隐私技术，除了需要考虑数据层面的隐私安全，还需要考虑用户层面的安全问题。
相邻数据集： 设有两个数据集D和D‘，若它们之间有且仅有一条数据不一样，那我们就称D和D’为相邻数据集。
用户相邻数据集： 设每个用户 $c_i$ 对应的本地数据集为 $d_i$ ，D和D‘是两个用户数据的集合，我们定义D和D’为用户相邻数据集，当且仅当D去除或者添加某一个客户端 $c_i$ 的本地数据集 $d_i$ 后变为D’。

如上是相邻数据集的，D和D’只差一个元素d6。用户相邻数据集如下图所示，数据集D包含用户c1，c2，c3本地数据，而数据集D’包括用户c2，c3的数据，因此D和D’是用户相邻的。

联邦差分隐私不但要求保证每个客户端的本地数据模型隐私安全，也要求客户端之间的信息安全，即用户在服务器接收到客户端的本地模型，既不能推断出由哪个客户端上传，也不能推断某个客户端是否参与了训练。
文献Learning Differentially Private Language Models Without Losing Accuracy介绍了一种DP-FedAvg的算法，它将联邦学习中经典的FedAvg算法和差分隐私训练相结合，并应用在语言模型上，取得不错的效果。DP-FedAvg的客户端本地训练算法如下所示：

与FedAvg客户端本地训练相比，DP-FedAvg需要在每一步本地迭代更新后，对参数进行裁剪。服务端侧算法如下面算法所示：

其主要工作包括以下几点：

随机挑选参与训练的客户端集合 $C^t$ 。
对挑选的客户端 $\in C^t$ ，执行本地模型训练。
服务端接收每一个客户端k的模型参数 $\Delta ^t_k$ ，执行聚合操作，得到 $\Delta ^t$ 。
求取高斯噪声分布的方差 $\sigma$ ，利用高斯分布 $N(0,I\sigma^2)$ 生成噪声数据。
在全局模型聚合操作中添加噪声数据，得到新的全局模型参数 $\theta_t$ 。
重复上述步骤，直到收敛为止。

2.3 详细实现

本节给出DP-FedAvg的详细实现，复用第三章的代码框架，在其基础上加上差分隐私策略。在DP-FedAvg的实现中，需要求取两个相同结构的模型权重差值的范数，如下所示：

def model_norm(model_1, model_2):
	squared_sum = 0
	for name, layer in model_1.named_parameters():
		squared_sum += torch.sum(torch.pow(layer.data - model_2.state_dict()[name].data, 2))
	return math.sqrt(squared_sum)

配置信息如下：

{
	
	"model_name" : "resnet18", # 使用模型
	
	"no_models" : 10, # 参与方个数
	
	"type" : "cifar", # 数据集种类
	
	"global_epochs" : 100, # 全局迭代次数
	
	"local_epochs" : 3, # 本地迭代次数
	
	"k" : 2, # 每次随机选取2个参与方
	
	"batch_size" : 32, # 批大小
	
	"lr" : 0.01, # 学习率
	
	"momentum" : 0.0001, # momentum参数
	
	"lambda" : 0.5, # 正则化参数
	
	"dp" : true, # 使用差分隐私
	
	"C" : 1000,	# 裁剪边界值
	
	"sigma" : 0.001, # 差分隐私参数
	
	"q" : 0.1,	 # 源码未用
	
	"W" : 1	# 源码未用
}

客户端侧的修改，主要在本地训练过程中，在每一轮迭代完成后进行裁剪，主要过程如下，参数更新后，对参数的变化 $\theta - \theta_0$ 进行裁剪，裁减系数为：
$norm\_scale= \frac{C}{\left \|\theta - \theta_0 \right \|_2}$
经过多轮本地训练后，将最终的模型参数变化值 $\Delta_k$ 上传到服务器。

if self.conf["dp"]:
	model_norm = models.model_norm(model, self.local_model)
	
	norm_scale = min(1, self.conf['C'] / (model_norm))
	for name, layer in self.local_model.named_parameters():
		clipped_difference = norm_scale * (layer.data - model.state_dict()[name])
		layer.data.copy_(model.state_dict()[name] + clipped_difference)

服务端侧的修改主要是对全局模型参数进行聚合时添加噪声，噪声由高斯分布生成。高斯分布的参数包括均值和标准差，这里取 $\mu = 0, \sigma = \frac{zC}{qW}$ 。事实上为了方便，可以直接在配置文件中设置 $\sigma$ 的值。

def model_aggregate(self, weight_accumulator):
	for name, data in self.global_model.state_dict().items():
		
		update_per_layer = weight_accumulator[name] * self.conf["lambda"]
		
		if self.conf['dp']:
			sigma = self.conf['sigma']
			if torch.cuda.is_available():
				noise = torch.cuda.FloatTensor(update_per_layer.shape).normal_(0, sigma)
			else:
				noise = torch.FloatTensor(update_per_layer.shape).normal_(0, sigma)
				
			update_per_layer.add_(noise)
		
		if data.type() != update_per_layer.type():
			data.add_(update_per_layer.to(torch.int64))
		else:
			data.add_(update_per_layer)

在baseline下，即单点训练的条件下，没有添加高斯噪声，训练的准确度为88%，如下图所示（PS：大概在20多轮的时候准确度就已经达到了87%，也就是说后面的训练并没有提高模型的性能，此时模型性能已经饱和）：

在上述配置文件超参数的设置下，经过100轮训练，得到的准确度能达到86%，如下图所示：

在同等条件下，设置DP=false，得到的准确度为85%，可见在梯度参数上添加少量的噪声，并不会影响训练的准确度，同时也保证了数据隐私。

3. 模型压缩

模型压缩是深度学习领域常见技巧，主要减少模型参数和大小，调高模型的训练和推断速度。在联邦学习场景下，对模型进行压缩有以下好处：

减少模型参数传输量。联邦学习在训练过程中需要服务端和客户端传输大量参数，因此对网络的稳定性要求比较高。减少模型参数传输量，可以减少对网络稳定性的依赖。
提升安全性。模型压缩导致传输的不是原始的参数数据，因此，与差分隐私一样，即使恶意攻击者窃取了中间的模型参数，也很难将其还原。

3.1 参数稀疏化

稀疏化是模型压缩常用的技巧。
稀疏化思想与差分隐私的噪声机制类似，但是稀疏化操作更直接。假设当前模型结构为 $G=\{g_1,g_2,...,g_L\}$ ，这里的 $g_i$ 表示第i层。在第t轮中，客户端 $c_i$ 的本地迭代训练中，模型将从 $G_t$ 变为 $L^{t+1}_i$ 。按照FedAvg的意思，客户端 $c_i$ 将向服务端上传模型参数 $(L^{t+1}_i-G_t)$ 。
稀疏化思想是在每个客户端中保存一份掩码矩阵 ${r_1,r_2,...,r_L\}$ 。 $r_i$ 是与 $g_i$ 形状大小相同的参数矩阵，且只由0和1构成。客户端将模型参数 $L^{t+1}_i-G_t$ 与 $R$ 结合，上传 $(L^{t+1}_i-G_t)\odot R$ 。

3.1.1 详细实现

首先在配置文件里添加“prop”，用来控制掩码矩阵中1的数量的。具体来说，prop越大，掩码矩阵中1的值越多，矩阵越稠密，相反，prop越小，1的值越少，矩阵越稀疏。

{
	
	"model_name" : "resnet50", # 使用模型
	
	"no_models" : 10, # 参与方个数
	
	"type" : "cifar", # 数据集种类
	
	"global_epochs" : 30, # 全局迭代次数
	
	"local_epochs" : 3, # 本地迭代次数
	
	"k" : 2, # 每次随机选取2个参与方
	
	"batch_size" : 32, # 批大小
	
	"lr" : 0.01, # 学习率
	
	"momentum" : 0.01, # momentum参数
	
	"lambda" : 0.5, # 正则化参数
	
	"prop" : 0.6	# 控制掩码矩阵1的数量
}

算法主要改动在客户端。我们先在客户端类构造函数中添加生成掩码矩阵mask的代码，掩码矩阵是用伯努利分布函数随机生成的。

self.mask = {}
for name, param in self.local_model.state_dict().items():
	p=torch.ones_like(param)*self.conf["prop"]
	if torch.is_floating_point(param):
		self.mask[name] = torch.bernoulli(p)
	else:
		self.mask[name] = torch.bernoulli(p).long()

在本地训练中，在最后一步上传模型的时，将模型参数与掩码矩阵相乘，掩码中0对应的参数相当于被隐藏了。

def local_train(self, model):

	for name, param in model.state_dict().items():
		self.local_model.state_dict()[name].copy_(param.clone())

	optimizer = torch.optim.SGD(self.local_model.parameters(), lr=self.conf['lr'],
								momentum=self.conf['momentum'])
		
	self.local_model.train()
	for e in range(self.conf["local_epochs"]):
		
		for batch_id, batch in enumerate(self.train_loader):
			data, target = batch

			if torch.cuda.is_available():
				data = data.cuda()
				target = target.cuda()
		
			optimizer.zero_grad()
			output = self.local_model(data)
			loss = torch.nn.functional.cross_entropy(output, target)
			loss.backward()
		
			optimizer.step()
					
		print("Epoch %d done." % e)	
		
	diff = dict()
	for name, data in self.local_model.state_dict().items():
		diff[name] = (data - model.state_dict()[name])
		# 模型参数与掩码相乘，隐藏部分参数值，达到防御目的
		diff[name] = diff[name]*self.mask[name]

	return diff

3.1.2 实验分析

在实验过程中，博主分别设置了 $p r o p = 1, 0.8, 0.6$ ，来评估经过参数稀疏化后模型的性能表现。下面分别是 $p r o p = 1, 0.8, 0.6$ 的训练截图（证明自己真实做了实验hh）。

只是最后的实验准确度不能够判断参数稀疏化后模型的性能表现变化过程，所以三次训练中的每轮acc和loss我都记录下来，制作成图表，便于观察，得出结论。

由上述图表可以看出，模型一共训练了30轮，随着掩码矩阵中的0的数量越来越多，稀疏化处理后的模型性能在开始迭代时会有所下降，但随着迭代的进行，模型的性能会逐步恢复到正常状态。

3.2 按层敏感度传输

在联邦场景下，训练模型与集中训练一样，模型参数存在显著冗余。在文献Predicting Parameters in Deep Learning 中指出，大部分的神经网络中，仅使用很少的（5%）的权值，就可以达到和原来神经网络相近的性能，甚至优于原神经网络，这种思想类似于Dropout，丢弃的权值有的是没有意义的，甚至对模型有副作用。
这种网络权重重要性思想在模型压缩上起到很重要的作用，一方面它可以减少传输开销，另一方面由于只输出部分参数信息，攻击者很难通过反演攻击反推原始数据，从而有效提升系统安全性。本节将讲解在联邦学习上实现基于敏感度剪枝的防御技术。

层敏感度： 设当前的模型表示为 $G=\{g_1,g_2,...,g_L\}$ ，这里的 $g_i$ 表示第i层。在第t轮中，客户端 $c_j$ 进行联邦学习本地训练时，模型将从 $G^t=G$ 变为 $L^{t+1}_i=\{g^{t+1}_{1,j},g^{t+1}_{2,j},...,g^{t+1}_{L,j}\}$ 。我们将第i层的变化记为：

$\delta^t_{i,j}=\left | mean(g^t_{i,j})-mean(g^{t+1}_{i,j}) \right |$

其中 $\delta$ 是每一层的参数均值变化，成为敏感度。
基于按层敏感度剪枝的实现过程：对于任意被挑选的客户端 $c_j$ ，在模型本地训练结束后，按照上式计算模型每一层的均值变化量，将每层的变化量从大到小排序，变化越大，说明该层越敏感，算法将取高敏感的层上传。

3.2.1 详细实现

下面将继续复用第三章代码框架，利用ResNet-50模型对cifar10图像进行分类任务。
配置信息如下：

{
	
	"model_name" : "resnet50", # 使用模型
	
	"no_models" : 10, # 参与方个数
	
	"type" : "cifar", # 数据集种类
	
	"global_epochs" : 30, # 全局迭代次数
	
	"local_epochs" : 3, # 本地迭代次数
	
	"k" : 2, # 每次随机选取2个参与方
	
	"batch_size" : 32, # 批大小
	
	"lr" : 0.01, # 学习率
	
	"momentum" : 0.0001, # momentum参数
	
	"lambda" : 0.5, # 正则化参数
	
	"rate" : 0.95, # 传输比例
}

其中主要添加了rate字段，用来控制传输比例。通过上述公式求出每一层训练前后变化值，并对其排序。

def local_train(self, model):

	for name, param in model.state_dict().items():
		self.local_model.state_dict()[name].copy_(param.clone())

	#print("\n\nlocal model train ... ... ")
	#for name, layer in self.local_model.named_parameters():
	#	print(name, "->", torch.mean(layer.data))
		
	#print("\n\n")
	optimizer = torch.optim.SGD(self.local_model.parameters(), lr=self.conf['lr'],
								momentum=self.conf['momentum'])
	
	
	self.local_model.train()
	for e in range(self.conf["local_epochs"]):
		
		for batch_id, batch in enumerate(self.train_loader):
			data, target = batch
			if torch.cuda.is_available():
				data = data.cuda()
				target = target.cuda()
		
			optimizer.zero_grad()
			output = self.local_model(data)
			loss = torch.nn.functional.cross_entropy(output, target)
			loss.backward()
		
			optimizer.step()

		print("Epoch %d done." % e)	

	diff = dict()
	for name, data in self.local_model.state_dict().items():
		diff[name] = (data - model.state_dict()[name])
	# 按变化率排序
	diff = sorted(diff.items(), key=lambda item:abs(torch.mean(item[1].float())), reverse=True)
	sum1, sum2 = 0, 0
	for id, (name, data) in enumerate(diff):
		if id < 304:
			sum1 += torch.prod(torch.tensor(data.size()))
		else:
			sum2 += torch.prod(torch.tensor(data.size()))
	# 返回变化率最大的层
	ret_size = int(self.conf["rate"]*len(diff))

	return dict(diff[:ret_size])

同样对服务端聚合进行修改，由于客户端是按层上传的，因此聚合时也要按层进行。

	def model_aggregate(self, weight_accumulator, cnt):

		for name, data in self.global_model.state_dict().items():
			if name in weight_accumulator and cnt[name] > 0:
				#print(cnt[name])
				update_per_layer = weight_accumulator[name] * (1.0 / cnt[name]				
				if data.type() != update_per_layer.type():
					data.add_(update_per_layer.to(torch.int64))
				else:
					data.add_(update_per_layer)

3.2.2 实验分析

按照之前的配置文件信息，实验结果如上图所示，可以在经过三十轮的训练后，准确度能达到85%，几乎已经和单机训练的结果持平，再分析一波上传参数的比例，通过设定rate分别为1.0，0.95和0.9，最后得到的训练图像结果如下折线图所示（来自原文中github图片）：

可以看出，在开始训练阶段，上传参数比例小的模型损失较大，结果不太准确，但随着模型的迭代，经过大约十五轮的训练，0.9的模型就和其余两个模型训练结果相差无几了，可以表明，通过层敏感度进行的模型压缩和原始模型性能
相比，几乎没有性能上的损失。

此外，根据观察，按层的变化排序后，参数较多的层变化一般都比较小，变化最小的后10%层的参数占整体参数的75%，如上图所示。

4. 同态加密

本节介绍如何用Paillier半同态加密算法来保护横向联邦学习过程中数据隐私问题。Paillier半同态加密算法是非对称算法的一种实现，说到半同态加密，就不得不提同态加密的三种形式，在这里作为补充。
全同态加密形式相当于域，域中的元素可以在域的范围内进行加法和乘法的运算，从而映射到域中的另外元素，第二种是半同态加密，相当于群，只能进行一种二元运算，使群中的元素映射到群中的另外元素，第三种是些许同态加密，指一同态加密方法中的一些运算操作（如加法和乘法）只能执行有限次，因为在运算过程中添加了噪声，所以一旦超过了限定次数，就无法得到正确的结果。由于目前的全同态加密建立在些许同态加密之上，并且代价高昂，所以大部分工作的重点都在些许同态加密。

4.1 Paillier半同态加密算法

回到Paillier半同态加密算法本身，它能够在加密的情况对加密数据进行操作，然后对加密结果进行解密，得到的结果与直接在明文下操作的结果相同。
为了方便讨论，使用x表示明文，使用 $[[x]]$ 表示其对应的明文。Paillier算法支持下面两种加密状态的运算：

加法同态： $[[u + v]] = [[u]] + [[v]]$
标量乘法同态：对于任意常数k。满足 $[[k u]] = k * [[u]]$

然而，该算法并不满足乘法同态，但是该算法计算效率高，在工业界广泛应用。

4.2 加密损失函数计算

求解机器学习模型时，通常定义一个损失函数 $L(\theta;X)$ ，然后使用SGD等方法最小化损失函数，得到最优解。我们以逻辑回归为例，设当前有n个样本数据集合为：
$T=(x_1,y_1),(x_2,y_2),...,(x_n,y_n)$
其中 $x_i\in R^d$ ， $y_i\in \{-1, 1\}$ ，LR使用对数损失作为其目标损失函数：
$\frac{1}{n}\sum_{i=1}^{n}log(1+e^{-y_i\theta^Tx_i})$
对上式求导，求得损失函数的梯度，满足：
$\frac{\partial L}{\partial \theta}=\frac{1}{n}\sum_{i=1}^{n}\{(\frac{1}{1+e^{-y_i\theta^Tx_i}}-1)y_ix_i\}$
带入梯度下降，更新模型参数 $\theta$ ：
$\theta=\theta-lr*\frac{\partial L}{\partial \theta}$

循环上述过程，直到损失函数值不再下降或达到最大次数停止迭代。然而上述计算过程都在明文状态下计算的，基于HE的联邦学习，则要求在加密状态下进行参数求解。也就是说，传输的参数 $\theta$ 是加密后的值，损失函数可以写为：

$\frac{1}{n}\sum_{i=1}^{n}log(1+e^{-y_i\left \|\theta^T \right \|x_i})$

尽管上式涉及对加密数据的指数运算和对数运算，但是Paillier加密算法只支持加法同态和标量乘法同态，不支持乘法同态及其他复杂运算，所以无法在加密条件下求解该式。
文献Private federated learning on vertically partitioned data via entity resolution and additively homomorphic encryption 提出了一种Taylor损失来近似原始对数损失的方法，即通过对原始对数损失函数进行泰勒展开，通过多项式近似对数损失函数，此时损失函数转换为只有加法和标量乘法的运算，可以直接利用Paillier加密。
对于函数 $f (x)$ ，其在x=0处的泰勒多项式展开为
$f(x)=\sum_{i=0}^{\infty }\frac{f'(0)}{i!}x^i$
对于损失函数 $f(z)=log(1+e^{-z})$ ，在z=0处的泰勒展开为：
$log(1+e^z)\approx log2-\frac{1}{2}z+\frac{1}{8}z^2+O(z^2)$
取其中二阶多项式来近似对数损失函数，并将 $z=y[[\theta]]^Tx$ 带入上式，得到：
$log(1+e^{-y\theta^Tx})\approx log2-\frac{1}{2}y\theta^Tx+\frac{1}{8}(\theta^Tx)^2$
其中 $y^2=1$ ，因此直接去除，最终得到的L为：
$\frac{1}{n}\sum_{i=1}^{n}\{ log2-\frac{1}{2}y_i\theta^Tx+\frac{1}{8}(\theta^Tx)^2\}$
对上式求导得到损失值L关于参数 $\theta$ 的导数：
$\frac{\partial L}{\partial \theta}=\frac{1}{n}\sum_{i=1}^{n}(\frac{1}{4}\theta^Tx_i-\frac{1}{2}y_i)x_i$
上式对应的加密梯度为：
$[[\frac{\partial L}{\partial \theta}]]=\frac{1}{n}\sum_{i=1}^{n}(\frac{1}{4}[[\theta^T]]x_i-\frac{1}{2}[[-1]]y_i)x_i$

4.3 详细实现

实现部分是使用Paillier算法实现横向联邦学习，数据集为乳腺癌数据，代码框架为第三章横向联邦学习代码。
定义模型类： 首先自定义模型类LR_Model，方便加密解密操作。

class LR_Model(object):

	def __init__ (self, public_key, w_size=None, w=None, encrypted=False):
		"""
		w_size: 权重参数数量
		w: 是否直接传递已有权重，w和w_size只需要传递一个即可
		encrypted: 是明文还是加密的形式
		"""
		self.public_key = public_key
		if w is not None:
			self.weights = w
		else:
			limit = -1.0/w_size 
			self.weights = np.random.uniform(-0.5, 0.5, (w_size,))
		# 如果是明文进行加密
		if encrypted==False:
			self.encrypt_weights = encrypt_vector(public_key, self.weights)
		else:
			self.encrypt_weights = self.weights	
			
	def set_encrypt_weights(self, w):
		for id, e in enumerate(w):
			self.encrypt_weights[id] = e 
		
	def set_raw_weights(self, w):
		for id, e in enumerate(w):
			self.weights[id] = e

在上述类中，定义了权重向量weights和加密的权重向量encrypt_weights，还定义了两个类函数，分别用来更新明文和密文权重向量。
本地模型训练： 本地模型训练是在加密状态下进行的，首先给出本地模型训练的算法模块。

def local_train(self, weights):
# 用全局权重更新本地权重
	original_w = weights
	self.local_model.set_encrypt_weights(weights)
	neg_one = self.public_key.encrypt(-1)
	for e in range(self.conf["local_epochs"]):
		print("start epoch ", e)				
		idx = np.arange(self.data_x.shape[0])
		batch_idx = np.random.choice(idx, self.conf['batch_size'], replace=False)
		x = self.data_x[batch_idx]
		x = np.concatenate((x, np.ones((x.shape[0], 1))), axis=1)
		y = self.data_y[batch_idx].reshape((-1, 1))
		
		# 在加密状态下求取加密梯度，利用上面加密梯度公式求解
		batch_encrypted_grad = x.transpose() * (0.25 * x.dot(self.local_model.encrypt_weights) + 0.5 * y.transpose() * neg_one)
		encrypted_grad = batch_encrypted_grad.sum(axis=1) / y.shape[0]
		
		for j in range(len(self.local_model.encrypt_weights)):
			self.local_model.encrypt_weights[j] -= self.conf["lr"] * encrypted_grad[j]

	weight_accumulators = []
	for j in range(len(self.local_model.encrypt_weights)):
		weight_accumulators.append(self.local_model.encrypt_weights[j] - original_w[j])
	
	return weight_accumulators

这里需要注意的是，在使用Paillier算法进行加解密运算的时候，会涉及大量的大素数幂运算，因此中间可能会越界，所以需要要个有效的处理方法，即加密迭代到一定轮次，重新加密数据，如下所示：

if e > 0 and e%2 == 0:
	self.local_model.encrypt_weights = Server.re_encrypt(self.local_model.encrypt_weights)

生成公钥和私钥： 利用Paillier算法生成公钥和私钥，私钥保留在可信服务器，公钥分发给客户端。

public_key, private_ley = paillier.generate_paillier_leypair(n_length=1024)

重新加密的过程也在服务器上进行，先利用Paillier私钥解密，再重新加密。

@staticmethod
def re_encrypt(w):
	return models.encrypt_vector(Server.public_key, models.decrypt_vector(Server.private_key, w))

在Paillier加密下的横向联邦学习训练结果如下：

观察上面的折线图可以看出，二阶近似的结果对模型性能的影响较小，算法在经过二十轮的迭代后就达到了很好的性能。

阅读总结

花费近一周的时间，终于认认真真看完了整个章节，本章内容可谓是整本书的核心，因为联邦学习最大的亮点就是可以保障用户的数据隐私安全，本章内容涉及了隐私保护方法中的差分隐私，同态加密，模型压缩，以及威胁联邦学习模型的后门攻击。通过完整的学习，我总算是在实战中演练了传统的联邦学习中的隐私保护算法，而不是只能在在各篇文献中看到。虽然目前来说还仅仅是简单实现，对于核心的构造部分还比较模糊，但是我有信心可以完全理解核心的部分，并改进为我想要的同态加密和差分隐私混合的加密机制。
当然了，阅读完这章内容，还是有很大的遗憾，就是书中并未提及如何在FATE环境中使用隐私保护算法，这部分的内容，我还得好好研究研究。

参考文献

https://arxiv.org/abs/1807.00459
https://github.com/FederatedAI/Practicing-Federated-Learning/tree/main/chapter15_Backdoor_Attack
https://arxiv.org/pdf/1306.0543.pdf
https://github.com/FederatedAI/Practicing-Federated-Learning/tree/main/chapter15_Compression
https://blog.csdn.net/qq_40258073/article/details/107939708

你可能感兴趣的:(联邦学习,FATE,python,联邦学习,差分隐私,同态加密)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
seaborn又一个扩展heatmapz qq_21478261 #Python可视化 matplotlib
推荐阅读：Pythonmatplotlib保姆级教程嫌Matplotlib繁琐？试试Seaborn！
NGS测序基础梳理01-文库构建（Library Preparation） qq_21478261 #生物信息生物学
本文介绍Illumina测序平台文库构建（LibraryPreparation）步骤，文库结构。写作时间：2020.05。推荐阅读：10W字《Python可视化教程1.0》来了！一份由公众号「pythonic生物人」精心制作的PythonMatplotlib可视化系统教程，105页PDFhttps://mp.weixin.qq.com/s/QaSmucuVsS_DR-klfpE3-Q10W字《Rg
Python 常用内置函数详解（七）：dir()函数——获取当前本地作用域中的名称列表或对象的有效属性列表
目录一、功能二、语法和示例一、功能dir()函数获取当前本地作用域中的名称列表或对象的有效属性列表。二、语法和示例dir()函数有两种形式，如果没有实参，则返回当前本地作用域中的名称列表。如果有实参，它会尝试返回该对象的有效属性列表。如果对象有一个名为__dir__()的方法，那么该方法将被调用，并且必须返回一个属性列表。dir()函数的语法格式如下：C:\Users\amoxiang>ipyth
pythonjson中list操作_Python json.dumps 特殊数据类型的自定义序列化操作
场景描述：Python标准库中的json模块，集成了将数据序列化处理的功能；在使用json.dumps()方法序列化数据时候，如果目标数据中存在datetime数据类型，执行操作时，会抛出异常：TypeError:datetime.datetime(2016,12,10,11,04,21)isnotJSONserializable那么遇到json.dumps序列化不支持的数据类型，该怎么办！首先，
Python 日期格式转json.dumps的解决方法 douyaoxin python json 开发语言
classDateEncoder(json.JSONEncoder):defdefault(self,obj):ifisinstance(obj,datetime.datetime):returnobj.strftime('%Y-%m-%d%H:%M:%S')elifisinstance(obj,datetime.date):returnobj.strftime("%Y-%m-%d")json.d
Python 爬虫实战：视频平台播放量实时监控（含反爬对抗与数据趋势预测）西攻城狮北 python 爬虫音视频
一、引言在数字内容蓬勃发展的当下，视频平台的播放量数据已成为内容创作者、营销人员以及行业分析师手中极为关键的情报资源。它不仅能够实时反映内容的受欢迎程度，更能在竞争分析、营销策略制定以及内容优化等方面发挥不可估量的作用。然而，视频平台为了保护自身数据和用户隐私，往往会设置一系列反爬虫机制，对数据爬取行为进行限制。这就向我们发起了挑战：如何巧妙地突破这些限制，同时精准地捕捉并预测播放量的动态变化趋势
Python技能手册 - 模块module 金色牛神 Python python windows 开发语言
系列Python常用技能手册-基础语法Python常用技能手册-模块modulePython常用技能手册-包package目录module模块指什么typing数据类型int整数float浮点数str字符串bool布尔值TypeVar类型变量functools高阶函数工具functools.partial()函数偏置functools.lru_cache()函数缓存sorted排序列表排序元组排序
Ubuntu基础（Python虚拟环境和Vue） aaiier ubuntu python linux
Python虚拟环境sudoaptinstallpython3python3-venv进入项目目录cdXXX创建虚拟环境python3-mvenvvenv激活虚拟环境sourcevenv/bin/activate退出虚拟环境deactivateVue安装Node.js和npm#安装Node.js和npm（Ubuntu默认仓库可能版本较旧，适合入门）sudoaptinstallnodejsnpm#验
苦练Python第9天：if-else分支九剑 python后端前端人工智能
苦练Python第9天：if-else分支九剑前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。欢迎点赞、收藏、关注，一键三连！！！欢迎来到100天Python挑战第9天！今天我们不练循环，改磨“分支剑法”——ifelse三式：单分支、双分支、多分支，以及嵌套和三元运算符，全部实战演练，让
苦练Python第8天：while 循环之妙用 python后端前端人工智能
苦练Python第8天：while循环之妙用原文链接：https://dev.to/therahul_gupta/day-9100-while-loops-with-real-world-examples-528f作者：RahulGupta译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众
苦练Python第5天：字符串从入门到格式化 python后端人工智能前端
苦练Python第5天：字符串从入门到格式化原文链接：https://dev.to/therahul_gupta/day-5100-working-with-strings-basics-to-formatting-2kkn作者：RahulGupta译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key