文杰@

联邦学习实战-1:用python从零开始实现横向联邦学习

什么是联邦学习？

简单来说就是在一个多方的环境中，数据集是零散的（在各个不同的客户端中），那么怎样实现机器学习算法呢？

首先想到的就是将多个数据集合并合并起来，然后统一的使用传统的机器学习或者深度学习算法进行计算，但是如果有一方因为数据隐私问题不愿意提交自己的数据呢？

那么就出现了联邦学习，核心就是“数据不动模型动，数据可用不可见”

多个客户端不提交数据而是提交训练时的参数/梯度给中心服务器，中心服务器进行计算后再将参数/梯度返回多个客户端再学习的过程

整个过程数据的所有权依然在用户手中，这就是联邦学习

当然数据隐私方面，联邦学习还将结合同态加密、安全多方计算、查分隐私等隐私计算技术实现更安全的保障

（ps：这里只是简单的介绍，详细的内容请多查阅其他资料）

基本概念入门学习见：《Federated_Machine_Learning:Concept_and_Applications》精读

一、环境准备

实验基于机器学习库PyTorch, 所以需要一些基础的PyTorch使用

（ps：不会也没事，下面代码有详细的注释，因为我也刚刚入门）

anaconda、python3.7、PyTorch
pip install torch
GPU安装CUDA、cuDNN

二、横向联邦图像分类

基本信息

数据集：CIFAR10

模型：ResNet-18

环境角色:

中心服务器
多个客户端

为了简化，这里服务器客户端都是在单机上模拟，后面使用FATE会在真实多台机器上实现

基本的流程：

服务器按配置生成初始化模型，客户端按照顺序将数据集横向不重叠切割
服务器将全局模型发送给客户端
客户端接收全局模型（来自服务器）通过本地多次迭代计算本地参数差值返回给服务器
服务器聚合各个客户端差值更新模型，再评估当前模型性能
如果性能未达标，则重复2过程，否则结束

2.1 配置文件

配置文件包含了整个项目的模型、数据集、epoch等核心训练参数

需要注意的是，一般来说配置文件需要在所有的客户端与服务端之间同步一致

创建一个配置文件:

项目文件夹下./utils/conf.json创建配置文件:

{
  "model_name" : "resnet18",
  "no_models" : 10,
  "type" : "cifar",
  "global_epochs" : 20,
  "local_epochs" : 3,
  "k" : 6,
  "batch_size" : 32,
  "lr" : 0.001,
  "momentum" : 0.0001,
  "lambda" : 0.1 
}

model_name：模型名称
no_models：客户端总数量
type：数据集信息
global_epochs：全局迭代次数，即服务端与客户端的通信迭代次数
local_epochs：本地模型训练迭代次数
k：每一轮迭代时，服务端会从所有客户端中挑选k个客户端参与训练。
batch_size：本地训练每一轮的样本数
lr，momentum，lambda：本地训练的超参数设置

2.1 构建训练数据集

构建数据集代码如下:

datasets.py

import torchvision as tv

# 获取数据集
def get_dataset(dir, name):
    if name == 'mnist':
        # root: 数据路径
        # train参数表示是否是训练集或者测试集
        # download=true表示从互联网上下载数据集并把数据集放在root路径中
        # transform：图像类型的转换
        train_dataset = tv.datasets.MNIST(dir, train=True, download=True, transform=tv.transforms.ToTensor())
        eval_dataset = tv.datasets.MNIST(dir, train=False, transform=tv.transforms.ToTensor())
    elif name == 'cifar':
        # 设置两个转换格式
        # transforms.Compose 是将多个transform组合起来使用（由transform构成的列表）
        transform_train = tv.transforms.Compose([
            # transforms.RandomCrop： 切割中心点的位置随机选取
            tv.transforms.RandomCrop(32, padding=4), tv.transforms.RandomHorizontalFlip(),
            tv.transforms.ToTensor(),
            # transforms.Normalize： 给定均值：(R,G,B) 方差：（R，G，B），将会把Tensor正则化
            tv.transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)),
        ])
        transform_test = tv.transforms.Compose([
            tv.transforms.ToTensor(),
            tv.transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)),
        ])
        train_dataset = tv.datasets.CIFAR10(dir, train=True, download=True, transform=transform_train)
        eval_dataset = tv.datasets.CIFAR10(dir, train=False, transform=transform_test)
    return train_dataset, eval_dataset

2.2 服务端

服务端的主要功能是模型的聚合、评估，最终的模型也是在服务器上生成

首先创建一个服务类

所有的程序放在server.py

构造函数

定义其构造函数：

# 定义构造函数
def __init__(self, conf, eval_dataset):
  # 导入配置文件
  self.conf = conf
  # 根据配置获取模型文件
  self.global_model = models.get_model(self.conf["model_name"])
  # 生成一个测试集合加载器
  self.eval_loader = torch.utils.data.DataLoader(
    eval_dataset,
    # 设置单个批次大小32
    batch_size=self.conf["batch_size"],
    # 打乱数据集
    shuffle=True
  )

聚合函数

定义全局联邦平均FedAvg聚合函数：

FedAvg算法的公式如下：

$G^{t+1} = G^{t} + \lambda \sum^m_{i=1}(L_i^{t+1}-G_i^t)$

$G^t$ 表示第t轮更新的全局模型参数， $L_i^{t+1}$ 表示第i个客户端在第t+1轮本地更新后的模型

在模型聚合时，weight_accumulator就是 $L_i^{t+1}-G_i^t) \ i = 1,2,...m$ 部分，具体weight_accumulator的计算会在后面详细介绍其实现

# 全局聚合模型
# weight_accumulator 存储了每一个客户端的上传参数变化值/差值
def model_aggregate(self, weight_accumulator):
  # 遍历服务器的全局模型
  for name, data in self.global_model.state_dict().items():
    # 更新每一层乘上学习率
    update_per_layer = weight_accumulator[name] * self.conf["lambda"]
    # 累加和
    if data.type() != update_per_layer.type():
      	# 因为update_per_layer的type是floatTensor，所以将起转换为模型的LongTensor（有一定的精度损失）
      	data.add_(update_per_layer.to(torch.int64))
      else:
        data.add_(update_per_layer)

评估函数

定义模型评估函数

评估函数主要是不断的评估当前模型的性能，判断是否可以提前终止迭代或者是出现了发散退化等现象

		# 评估函数
    def model_eval(self):
        self.global_model.eval()    # 开启模型评估模式（不修改参数）
        total_loss = 0.0
        correct = 0
        dataset_size = 0
        # 遍历评估数据集合
        for batch_id, batch in enumerate(self.eval_loader):
            data, target = batch
            # 获取所有的样本总量大小
            dataset_size += data.size()[0]
            # 存储到gpu
            if torch.cuda.is_available():
                data = data.cuda()
                target = target.cuda()
            # 加载到模型中训练
            output = self.global_model(data)
            # 聚合所有的损失 cross_entropy交叉熵函数计算损失
            total_loss += torch.nn.functional.cross_entropy(
                output,
                target,
                reduction='sum'
            ).item()
            # 获取最大的对数概率的索引值， 即在所有预测结果中选择可能性最大的作为最终的分类结果
            pred = output.data.max(1)[1]
            # 统计预测结果与真实标签target的匹配总个数
            correct += pred.eq(target.data.view_as(pred)).cpu().sum().item()
        acc = 100.0 * (float(correct) / float(dataset_size))    # 计算准确率
        total_1 = total_loss / dataset_size                     # 计算损失值
        return acc, total_1

2.3 客户端

客户端的主要功能是：

接受服务器下发的指令和全局模型
利用本地数据进行局部模型训练

此部分所有程序都在client.py中

构造函数

定义client类

 		# 构造函数
    def __init__(self, conf, model, train_dataset, id = 1):
        # 配置文件
        self.conf = conf
        # 客户端本地模型(一般由服务器传输)
        self.local_model = model
        # 客户端ID
        self.client_id = id
        # 客户端本地数据集
        self.train_dataset = train_dataset
        # 按ID对训练集合的拆分
        all_range = list(range(len(self.train_dataset)))
        data_len = int(len(self.train_dataset) / self.conf['no_models'])
        indices = all_range[id * data_len: (id + 1) * data_len]
        # 生成一个数据加载器
        self.train_loader = torch.utils.data.DataLoader(
            # 制定父集合
            self.train_dataset,
            # batch_size每个batch加载多少个样本(默认: 1)
            batch_size=conf["batch_size"],
            # 指定子集合
            # sampler定义从数据集中提取样本的策略
            sampler=torch.utils.data.sampler.SubsetRandomSampler(indices)
        )

本案例中根据ID将数据集进行横向切分，每个客户端之间没有交集

本地训练

本地模型训练函数：采用交叉熵作为本地训练的损失函数，并使用梯度下降来求解参数

		# 模型本地训练函数
    def local_train(self, model):
        # 整体的过程：拉取服务器的模型，通过部分本地数据集训练得到
        for name, param in model.state_dict().items():
            # 客户端首先用服务器端下发的全局模型覆盖本地模型
            self.local_model.state_dict()[name].copy_(param.clone())
        # 定义最优化函数器用于本地模型训练
        optimizer = torch.optim.SGD(self.local_model.parameters(), lr=self.conf['lr'], momentum=self.conf['momentum'])

        # 本地训练模型
        self.local_model.train()        # 设置开启模型训练（可以更改参数）
        # 开始训练模型
        for e in range(self.conf["local_epochs"]):
            for batch_id, batch in enumerate(self.train_loader):
                data, target = batch
                # 加载到gpu
                if torch.cuda.is_available():
                    data = data.cuda()
                    target = target.cuda()
                # 梯度
                optimizer.zero_grad()
                # 训练预测
                output = self.local_model(data)
                # 计算损失函数 cross_entropy交叉熵误差
                loss = torch.nn.functional.cross_entropy(output, target)
                # 反向传播
                loss.backward()
                # 更新参数
                optimizer.step()
            print("Epoch %d done" % e)
        # 创建差值字典（结构与模型参数同规格），用于记录差值
        diff = dict()
        for name, data in self.local_model.state_dict().items():
            # 计算训练后与训练前的差值
            diff[name] = (data - model.state_dict()[name])
        print("Client %d local train done" % self.client_id)
        # 客户端返回差值
        return diff

2.4 整合

所有程序代码在main.py中

import argparse
import json
import random

import datasets
from client import *
from server import *

if __name__ == '__main__':

    # 设置命令行程序
    parser = argparse.ArgumentParser(description='Federated Learning')
    parser.add_argument('-c', '--conf', dest='conf')
    # 获取所有的参数
    args = parser.parse_args()

    # 读取配置文件
    with open(args.conf, 'r') as f:
        conf = json.load(f)

    # 获取数据集, 加载描述信息
    train_datasets, eval_datasets = datasets.get_dataset("./data/", conf["type"])

    # 开启服务器
    server = Server(conf, eval_datasets)
    # 客户端列表
    clients = []

    # 添加10个客户端到列表
    for c in range(conf["no_models"]):
        clients.append(Client(conf, server.global_model, train_datasets, c))

    print("\n\n")

    # 全局模型训练
    for e in range(conf["global_epochs"]):
        print("Global Epoch %d" % e)
        # 每次训练都是从clients列表中随机采样k个进行本轮训练
        candidates = random.sample(clients, conf["k"])
        print("select clients is: ")
        for c in candidates:
            print(c.client_id)

        # 权重累计
        weight_accumulator = {}

        # 初始化空模型参数weight_accumulator
        for name, params in server.global_model.state_dict().items():
            # 生成一个和参数矩阵大小相同的0矩阵
            weight_accumulator[name] = torch.zeros_like(params)

        # 遍历客户端，每个客户端本地训练模型
        for c in candidates:
            diff = c.local_train(server.global_model)

            # 根据客户端的参数差值字典更新总体权重
            for name, params in server.global_model.state_dict().items():
                weight_accumulator[name].add_(diff[name])

        # 模型参数聚合
        server.model_aggregate(weight_accumulator)

        # 模型评估
        acc, loss = server.model_eval()

        print("Epoch %d, acc: %f, loss: %f\n" % (e, acc, loss))

2.5 测试

按照以上配置，(本人)运行后的准确度以及损失为：

官方的对比：

联邦学习与中心化训练的效果对比

联邦训练配置：一共10台客户端设备（no_models=10），每一轮任意挑选其中的5台参与训练（k=5），每一次本地训练迭代次数为3次（local_epochs=3），全局迭代次数为20次（global_epochs=20）。
集中式训练配置：我们不需要单独编写集中式训练代码，只需要修改联邦学习配置既可使其等价于集中式训练。具体来说，我们将客户端设备no_models和每一轮挑选的参与训练设备数k都设为1即可。这样只有1台设备参与的联邦训练等价于集中式训练。其余参数配置信息与联邦学习训练一致。图中我们将局部迭代次数分别设置了1，2，3来进行比较。

联邦学习在模型推断上的效果对比

图中的单点训练只的是在某一个客户端下，利用本地的数据进行模型训练的结果。

我们看到单点训练的模型效果（蓝色条）明显要低于联邦训练的效果（绿色条和红色条），这也说明了仅仅通过单个客户端的数据，不能够很好的学习到数据的全局分布特性，模型的泛化能力较差。
此外，对于每一轮参与联邦训练的客户端数目（k 值）不同，其性能也会有一定的差别，k 值越大，每一轮参与训练的客户端数目越多，其性能也会越好，但每一轮的完成时间也会相对较长。

学习资料来自于：

杨强：《联邦学习实战》

https://github.com/FederatedAI/Practicing-Federated-Learning/tree/main/chapter03_Python_image_classification

在KubeFATE中定制化部署联邦学习组件的深入分析亨利笔记 docker kubernetes 数据库 java 大数据
题图摄于国家大剧院（本文作者系VMware中国研发云原生实验室架构师，联邦学习开源项目KubeFATE/FATE-Operator维护者。）需要加入KubeFATE开源项目讨论群的同学，请关注亨利笔记公众号后回复“kubefate”即可。相关文章在JuypterNotebook中构建联邦学习任务云原生联邦学习平台KubeFATE原理详解用KubeFATE在K8s上部署联邦学习FATEv1.5使用D
联邦学习中客户端发送的梯度是vector而不是tensor wzx_Eleven 联邦学习机器学习网络安全人工智能
在联邦学习中，当本地使用神经网络或深度学习模型时，训练的梯度通常是与模型参数（权重和偏置）相对应的梯度数据。具体来说，梯度的类型和形状取决于模型的结构（例如，卷积神经网络、全连接网络等），以及模型的层数、每层的神经元数量等因素。1.梯度类型：梯度是一个张量：在神经网络中，梯度通常是一个张量（tensor），每一层的梯度张量的形状和该层的权重形状相匹配。具体来说，梯度是损失函数对每个参数的偏导数，表
汇聚前沿｜思腾合力邀您共赴可信联邦学习·武汉站运维
可信联邦学习·武汉站于2024年11月18日-19日在武汉大学举办，其作为隐私计算与数据智能的重要力量，正引领着学术界与工业界的新一轮变革。为了推动可信联邦学习技术的深入发展，促进学术界与工业界的交流与合作，思腾合力诚挚地邀请您参加“可信联邦学习·武汉站”活动，共同探索可信联邦学习的未来之路。EventsInvitation活动邀请可信联邦学习·武汉站本次活动吸引了来自全国各大高校、研究机构及知名
联邦学习 Federated learning Google I/O‘19 笔记努力搬砖的星期五笔记联邦学习机器学习机器学习 tensorflow
FederatedLearning:MachineLearningonDecentralizeddatahttps://www.youtube.com/watch?v=89BGjQYA0uE文章目录FederatedLearning:MachineLearningonDecentralizeddata1.DecentralizeddataEdgedevicesGboard:mobilekeyboa
SAFEFL: MPC-friendly Framework for Private and Robust Federated Learning论文阅读笔记慘綠青年627 论文阅读笔记深度学习
SAFEFL:MPC-friendlyFrameworkforPrivateandRobustFederatedLearning适用于私有和鲁棒联邦学习的MPC友好框架SAFEFL，这是一个利用安全多方计算(MPC)来评估联邦学习(FL)技术在防止隐私推断和中毒攻击方面的有效性和性能的框架。概述传统机器学习（ML）：集中收集数据->隐私保护问题privacy-preservingML(PPML)采
探索联邦学习：保护隐私的机器学习新范式洋葱蚯蚓机器学习 python 机器学习人工智能神经网络深度学习算法
探索联邦学习：保护隐私的机器学习新范式前言联邦学习简介联邦学习的原理联邦学习的应用场景联邦学习示例代码结语前言在数字化浪潮的推动下，我们步入了一个前所未有的数据驱动时代。海量的数据不仅为科学研究、商业决策和日常生活带来了革命性的变化，同时也带来了前所未有的挑战。尤其是数据隐私和安全问题，已经成为全球关注的焦点。随着对个人隐私保护意识的增强，传统的集中式数据处理方式正逐渐暴露出其局限性。数据
网络安全: 模型的脆弱性，鲁棒性和隐私性不当菜鸡的程序媛学习记录 web安全安全
在网络安全领域，通常描述模型安全性时，会提到以下三个特性：脆弱性（Vulnerability）：指模型在某些情况下容易受到攻击或被利用的弱点。例如，模型可能对对抗性攻击或梯度泄露攻击敏感。鲁棒性（Robustness）：指模型抵御攻击和在恶劣环境下保持性能的能力。提高模型的鲁棒性是增强其抵御攻击能力的关键。隐私性（Privacy）：指保护模型或其训练数据免受信息泄露的能力。隐私性问题在联邦学习和其
实践案例｜孟宪超：基于隐语深度学习在保险联合定价中的应用（附演讲视频）隐私开源
“隐语”是开源的可信隐私计算框架，内置MPC、TEE、同态等多种密态计算虚拟设备供灵活选择，提供丰富的联邦学习算法和差分隐私机制。开源项目：https://github.com/secretflowhttps://gitee.com/secretflow演讲实录11月25日，「隐语开源社区Meetup·西安站」顺利举办，本文为大家带来的是蚂蚁集团车险精算平台技术专家孟宪超，在「隐语开源社区Meet
【Deep Dive:AI Webinar】联邦学习-数据安金性和隐私性分析的思维转换开源社人工智能
【深入探讨人工智能】网络研讨系列总共有17个视频。我们按照视频内容，大致上分成了3个大类：1.人工智能的开放、风险与挑战（4篇）2.人工智能的治理（总共12篇），其中分成了几个子类：a.人工智能的治理框架（3篇）b.人工智能的数据治理（4篇）c.人工智能的许可证（4篇）d.人工智能的法案（1篇）3.炉边对谈-谁在构建开源人工智能?今天发布的是第11个视频，亦即第二个大类别“人工智能的治理”里的第二
Apache Pulsar 在腾讯 Angel PowerFL 联邦学习平台上的实践 StreamNative
腾讯AngelPowerFL联邦学习平台联邦学习作为新一代人工智能基础技术，通过解决数据隐私与数据孤岛问题，重塑金融、医疗、城市安防等领域。腾讯AngelPowerFL联邦学习平台构建在Angel机器学习平台上，利用Angel-PS支持万亿级模型训练的能力，将很多在Worker上的计算提升到PS（参数服务器）端；AngelPowerFL为联邦学习算法提供了计算、加密、存储、状态同步等基本操作接口，
联邦学习-安全树模型 SecureBoost之Desicion Tree 秃顶的码农
联邦学习-安全树模型SecureBoost之DesicionTree1联邦学习背景鉴于数据隐私的重要性，国内外对于数据的保护意识逐步加强。2018年欧盟发布了《通用数据保护条例》（GDPR），我国国家互联网信息办公室起草的《数据安全管理办法(征求意见稿)》因此数据在安全合规的前提下自由流动，成了大势所趋。这些法律法规的出台，不同程度的对人工智能传统处理数据的方式提出更多的挑战。AI高度发展的今天，
最新论文笔记(+21)：Privacy-Preserving Byzantine-Robust Federated Learning via Blockchain Systems/ TIFS2022 cryptocxf 论文笔记联邦学习论文阅读区块链
Privacy-PreservingByzantine-RobustFederatedLearningviaBlockchainSystems可译为“利用区块链实现隐私保护的拜占庭鲁棒性联邦学习”这篇是今年八月份被TIFS2022（CCFA）收录的文章，写的利用全同态加密和区块链技术解决联邦学习中隐私问题和可信问题（虽然区块链仅仅只是存储的作用，也稍微提了一下）。精读完这篇文章，整体感觉还不错，毕
pysyft框架中WebsocketClientWorker与WebsocketServerWorker的消息传输一只特立独行的猫 Pysyft学习笔记 pytorch
引言pysyft是基于pytorch的一个联邦学习框架（虽然用起来很难受），通过内存管理实现联邦学习的模拟。在pysyft中，WebsocketServerWorker充当数据的提供方（数据存储方），而WebsocketClientWorker作为数据的使用方（指令提供方），通过WebsocketClientWorker以TCP连接的方式向WebsocketServerWorker请求服务，从而实
论文解读-Agglomerative Federated Learning: Empowering Larger Model Training MCRG 联邦学习学习笔记联邦学习云计算边缘计算机器学习分布式
联邦学习新探：端边云协同引领大模型训练的未来｜INFOCOM2024联邦学习（FederatedLearning）就是一种能够在不损害用户隐私的前提下，训练人工智能模型的技术。随着云计算、边缘计算和终端设备的发展，端边云协同（End-Edge-CloudCollaboration）计算范式的出现，为联邦学习算法的实施与部署提供了新的路径。由中国科学院计算技术研究所、中国科学院大学、中关村实验室和北
2019年3月18日真昼之月
醒来时状态很一般。地铁上暂时不想看书，就把灌篮高手的漫画带着翻了一阵子。今天的SQB模式也一如既往地没有出货。上午各种刷reddit摸鱼+水群，期间看群里FIFA视频时还被领导路过了电脑，不得不感叹幸好当时不是在看色图（？）因为有点困所以没下楼吃午饭直接睡觉，睡醒之后才下楼买零食充饥。下午看了会儿keras的文档，感觉还是欠缺实战，这一点还是得依赖kaggle？之后开虚拟机打算研究一下联邦学习，结
我的隐私计算学习——联邦学习（3） Atara8088 学习密码学安全人工智能同态加密
本篇笔记主要是根据这位老师的知识分享整理而成【公众号：秃顶的码农】，我从他的资料里学到了很多，期间还私信询问了一些困惑，都得到了老师详细的答复，相当nice！（五）纵向联邦学习—安全树思路可以通过以下脉络学习：决策树--------->集成方法Bagging&Boosting--------->GBDT--------->XGBoost--------->SecureBoostTree这个版块的内
我的隐私计算学习——联邦学习（4） Atara8088 学习密码学安全人工智能
本篇笔记部分内容来源于这位老师的知识分享【公众号：秃顶的码农】，我从他的资料里学到了很多，期间还私信询问了一些困惑，都得到了老师详细的答复，相当nice！（六）横向联邦学习—梯度更新聚合云端数据中心的分布式机器学习可以有成百上千的节点，对比横向联邦学习有一定的借鉴意义，都存在着节点更新的同步与异步的问题，节点梯度更新之后的问题、节点掉线的问题、数据的NonIID问题，但是横向联邦学习的场景更加复杂
我的隐私计算学习——联邦学习（5） Atara8088 学习人工智能密码学安全
笔记内容来自多本书籍、学术资料、白皮书及ChatGPT等工具，经由自己阅读后整理而成。（七）联邦迁移学习相关研究表明，联邦迁移学习不需要主服务器作为各参与方间的协调者，旨在让模型具备举一反三能力，在各参与方样本空间以及特征空间均存在较少交叉信息的情况下，使用迁移学习算法互助地构建模型，可解决标签样本少和数据集不足的问题，例如，某国电商平台与其他国家银行间的数据迁移场景，联邦迁移学习可以很好地解决数
全同态加密的硬件加速：让机器学习更懂隐私保护 PrimiHub 同态加密机器学习区块链密码学可信计算技术
PrimiHub一款由密码学专家团队打造的开源隐私计算平台，专注于分享数据安全、密码学、联邦学习、同态加密等隐私计算领域的技术和内容。问题：保护敏感数据企业机构间合作处理数据越来越频繁，通常使用云服务为数据共享保驾护航。保护数据隐私至关重要，特别是在处理个人可识别信息（PII）、个人健康信息（PHI）、知识产权和情报洞察等敏感数据时。数据有三种基本状态：静态、传输和使用。通常情况下，敏感数据在存储
2024年深圳市工业和信息化局软件产业高质量发展技术创新体系扶持计划产业链关键环节提升项目申请指南高新技术企业认定条件项目政策大数据
一、资助的项目类别软件企业围绕大数据、云计算、区块链、信息安全、数字孪生等软件产业重点发展方向，组织实施经济社会效益显著、主要性能指标取得突破的新产品应用推广项目。（一）大数据:重点支持数据采集、数据清洗、数据分析发掘、数据可视化、大数据行业应用、联邦学习、隐私计算等领域。（二）云计算：重点支持平台即服务（PaaS）、软件即服务（SaaS）等领域。（三）区块链：重点支持区块链底层平台建设，以及在金
联邦学习：密码学 + 机器学习 + 分布式实现隐私计算，破解医学界数据孤岛的长期难题 Debroon 医学视觉 #AI 安全 #机器学习深度学习
联邦学习：密码学+机器学习+分布式提出背景：数据不出本地，又能合力干大事联邦学习的问题联邦学习架构分布式机器学习：解决大数据量处理的问题横向联邦学习：解决跨多个数据源学习的问题纵向联邦学习：解决数据分散在多个参与者但部分特征重叠的问题联邦+迁移学习：结合联邦学习和迁移学习，不同任务间共享知识，同时保持数据隐私医疗+联邦学习：跨多个医疗机构共享模型学习，同时保护患者隐私大模型+联邦学习提出背景：数据
阿里巴巴开源联邦学习框架FederatedScope 魏铁锤爱摸鱼开源
5月5日，阿里巴巴达摩院发布新型联邦学习框架FederatedScope，声称可以在不共享训练数据的情况下开发机器学习算法，从而保护隐私。，其源代码现已在Apache2.0许可下发布在GitHub上。介绍该平台被描述为一个全面的联邦学习框架，为学术界和工业界的各种机器学习任务提供灵活的定制。它还被声称易于掌握，允许用户集成自己的组件，包括特定应用程序的数据集和模型。联邦学习，顾名思义，是一种跨多个
联邦学习框架：FedAdapt: Adaptive Offloading for IoT Devices in Federated Learning 框架的部署实现我要成果边缘计算边缘智能框架联邦学习 centos 通信协同推理
目录虚拟机的安装简化版（三台）环境配置安装Anaconda创建环境安装pytorch关闭防火墙代码代码下载数据集下载代码修改上传到虚拟机虚拟机测试修改虚拟机的主机名运行FedAdapt是一个全面的物联网边缘环境的框架，克服了加速联合学习资源有限的设备上的挑战，减少散兵游勇所产生的物联网设备的计算异质性和适应不同的设备和边缘服务器之间的网络带宽的影响。虚拟机的安装简化版（三台）三台centos7虚拟
联邦学习论文阅读：Federated collaborative filtering thormas1996 联邦学习联邦学习论文阅读
今年一月刚挂上arXiv的一篇联邦推荐文章Federatedcollaborativefilteringforprivacy-preservingpersonalizedrecommendationsystem。摘要作者将一个隐形反馈的CF模型修改成了联邦学习的框架，隐私性用Fed-Avg算法保证。总的来说，没什么创新。问题在保护用户隐私的情况下利用隐性反馈进行推荐框架一个横向联邦的框架，和goo
边缘计算和联邦学习的联系 slomay 边缘计算经验分享
1.什么是边缘计算？边缘计算（EdgeComputing）是一种计算模型，其主要思想是将计算、存储和数据处理能力推送到离数据源近的边缘设备，而不是依赖于远程的云服务器。这样做的目的是减少数据传输延迟、提高响应速度，同时降低对云计算中心的依赖性。边缘计算通常在物理临近设备的位置进行数据处理，以满足实时性、安全性和隐私性的要求。例如：考虑一个城市的智能监控摄像头系统，用于监测交通、公共场所和安全状况。
高级分布式系统-第15讲分布式机器学习--联邦学习十有久诚分布式机器学习人工智能高级分布式系统神经网络
联邦学习两种常见的架构：客户-服务器架构和对等网络架构联邦学习在传统的分布式机器学习基础上的变化。传统的分布式机器学习：在数据中心或计算集群中使用并行训练，因为有高速通信连接，所以通信开销相对很小，计算开销将会占主导地位。联邦学习：通信需要依靠互联网，甚至是无线网络，所以通信代价是占主导地位的。减少通信轮次的方法增加并行度：加入更多的参与方，让它们在通信轮次间各自独立地进行模型训练。增加每一个
【论文阅读】异构联邦学习综述：最新进展与研究挑战鸿鹄一夏论文笔记机器学习人工智能
目录前言Background什么是联邦学习什么是异构联邦学习AbstractIntroductionSurveyResearchChallenges（研究挑战）StatisticalHeterogeneity(数据异质性)ModelHeterogeneity(模型异质性)ComuunicationHeterogeneity（通信异质性）DeviceHeterogeneity（设备异质性）State
分裂联邦学习论文-混合联邦分裂学习GAN驱动的预测性多目标优化梦灯人工智能论文 Edge AI 生成对抗网络人工智能机器学习
论文标题：《PredictiveGAN-PoweredMulti-ObjectiveOptimizationforHybridFederatedSplitLearning》期刊：IEEETransactionsonCommunications,2023一、论文介绍背景：联邦学习作为一种多设备协同训练的边缘智能算法，可以保护数据隐私，但增加了无线设备的计算负担。模型：为了解决上述问题，我们提出了一种
使用MistNet在COCO128数据集上协作训练Yolo-v5 星星失眠️ 联邦学习 YOLO python 人工智能
本案例介绍如何在MNIST手写数字分类场景中，使用名为MistNet的聚合算法训练联邦学习作业。数据分散在不同的地方（如边缘节点、摄像头等），由于数据隐私和带宽的原因，无法在服务器上聚合。因此，我们不能将所有数据都用于训练。在某些情况下，边缘节点的计算资源有限，甚至没有训练能力。边缘无法从训练过程中获取更新的权重。因此，传统算法（例如，联合平均算法）通常聚合由不同边缘客户端训练的更新权重，在这种情
迈向可持续人工智能：通过拍卖实现云边缘系统中的联邦学习需求响应 zhy2267291213 人工智能
（原文：TowardSustainableAI:FederatedLearningDemandResponseinCloud-EdgeSystemsviaAuctions）摘要：云边缘系统时紧急需求响应EDR的重要参与者，有助于维持电网稳定和供需平衡。然而，UI这用户越来越多的在云边缘系统中执行人工智能工作负载，现有的ERD管理并不是针对al工作负载而设计的，因此面临着能源消耗和al模型准确性之间
html 周华华 html
js 1，数组的排列 var arr=[1,4,234,43,52,]; for(var x=0;x<arr.length;x++){ for(var y=x-1;y<arr.length;y++){ if(arr[x]<arr[y]){ &
【Struts2 四】Struts2拦截器 bit1129 struts2拦截器
Struts2框架是基于拦截器实现的，可以对某个Action进行拦截，然后某些逻辑处理，拦截器相当于AOP里面的环绕通知，即在Action方法的执行之前和之后根据需要添加相应的逻辑。事实上，即使struts.xml没有任何关于拦截器的配置，Struts2也会为我们添加一组默认的拦截器，最常见的是，请求参数自动绑定到Action对应的字段上。 Struts2中自定义拦截器的步骤是：
make:cc 命令未找到解决方法 daizj linux 命令未知 make cc
安装rz sz程序时，报下面错误： [root@slave2 src]# make posix cc -O -DPOSIX -DMD=2 rz.c -o rz make: cc：命令未找到 make: *** [posix] 错误 127 系统：centos 6.6 环境：虚拟机错误原因：系统未安装gcc，这个是由于在安
Oracle之Job应用周凡杨 oracle job
最近写服务，服务上线后，需要写一个定时执行的SQL脚本，清理并更新数据库表里的数据，应用到了Oracle 的 Job的相关知识。在此总结一下。一：查看相关job信息 1、相关视图 dba_jobs all_jobs user_jobs dba_jobs_running 包含正在运行
多线程机制朱辉辉33 多线程
转至http://blog.csdn.net/lj70024/archive/2010/04/06/5455790.aspx 程序、进程和线程：程序是一段静态的代码，它是应用程序执行的蓝本。进程是程序的一次动态执行过程，它对应了从代码加载、执行至执行完毕的一个完整过程，这个过程也是进程本身从产生、发展至消亡的过程。线程是比进程更小的单位，一个进程执行过程中可以产生多个线程，每个线程有自身的
web报表工具FineReport使用中遇到的常见报错及解决办法（一）老A不折腾 web报表 finereport java报表报表工具
FineReport使用中遇到的常见报错及解决办法（一）这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、address pool is full：含义：地址池满，连接数超过并发数上
mysql rpm安装后没有my.cnf 林鹤霄没有my.cnf
Linux下用rpm包安装的MySQL是不会安装/etc/my.cnf文件的，至于为什么没有这个文件而MySQL却也能正常启动和作用，在这儿有两个说法，第一种说法，my.cnf只是MySQL启动时的一个参数文件，可以没有它，这时MySQL会用内置的默认参数启动，第二种说法，MySQL在启动时自动使用/usr/share/mysql目录下的my-medium.cnf文件，这种说法仅限于r
Kindle Fire HDX root并安装谷歌服务框架之后仍无法登陆谷歌账号的问题 aigo root
原文：http://kindlefireforkid.com/how-to-setup-a-google-account-on-amazon-fire-tablet/ Step 4: Run ADB command from your PC On the PC, you need install Amazon Fire ADB driver and instal
javascript 中var提升的典型实例 alxw4616 JavaScript
// 刚刚在书上看到的一个小问题,很有意思.大家一起思考下吧 myname = 'global'; var fn = function () { console.log(myname); // undefined var myname = 'local'; console.log(myname); // local }; fn() // 上述代码实际上等同于以下代码 m
定时器和获取时间的使用百合不是茶时间的转换定时器
定时器:定时创建任务在游戏设计的时候用的比较多 Timer();定时器 TImerTask();Timer的子类由 Timer 安排为一次执行或重复执行的任务。定时器类Timer在java.util包中。使用时，先实例化，然后使用实例的schedule(TimerTask task, long delay)方法，设定
JDK1.5 Queue bijian1013 java thread java多线程 Queue
JDK1.5 Queue LinkedList： LinkedList不是同步的。如果多个线程同时访问列表，而其中至少一个线程从结构上修改了该列表，则它必须保持外部同步。（结构修改指添加或删除一个或多个元素的任何操作；仅设置元素的值不是结构修改。）这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象，则应该使用 Collections.synchronizedList 方
http认证原理和https bijian1013 http https
一.基础介绍在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式，用的端口也不一样,前者是80，后
【Java范型五】范型继承 bit1129 java
定义如下一个抽象的范型类，其中定义了两个范型参数，T1，T2 package com.tom.lang.generics; public abstract class SuperGenerics<T1, T2> { private T1 t1; private T2 t2; public abstract void doIt(T
【Nginx六】nginx.conf常用指令(Directive) bit1129 Directive
1. worker_processes 8; 表示Nginx将启动8个工作者进程，通过ps -ef|grep nginx,会发现有8个Nginx Worker Process在运行 nobody 53879 118449 0 Apr22 ? 00:26:15 nginx: worker process
lua 遍历Header头部 ronin47 lua header 遍历　
local headers = ngx.req.get_headers() ngx.say("headers begin", "<br/>") ngx.say("Host : ", he
java-32.通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小(两数组的差最小)。 bylijinnan java
import java.util.Arrays; public class MinSumASumB { /** * Q32.有两个序列a,b，大小都为n,序列元素的值任意整数，无序. * * 要求：通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小。 * 例如: * int[] a = {100,99,98,1,2,3
redis 开窍的石头 redis
在redis的redis.conf配置文件中找到# requirepass foobared 把它替换成requirepass 12356789 后边的12356789就是你的密码打开redis客户端输入config get requirepass 返回 redis 127.0.0.1:6379> config get requirepass 1) "require
[JAVA图像与图形]现有的GPU架构支持JAVA语言吗？ comsci java语言
无论是opengl还是cuda，都是建立在C语言体系架构基础上的，在未来，图像图形处理业务快速发展，相关领域市场不断扩大的情况下，我们JAVA语言系统怎么从这么庞大，且还在不断扩大的市场上分到一块蛋糕，是值得每个JAVAER认真思考和行动的事情
安装ubuntu14.04登录后花屏了怎么办 cuiyadll ubuntu
这个情况，一般属于显卡驱动问题。可以先尝试安装显卡的官方闭源驱动。按键盘三个键：CTRL + ALT + F1 进入终端，输入用户名和密码登录终端：安装amd的显卡驱动 sudo apt-get install fglrx 安装nvidia显卡驱动 sudo ap
SSL 与数字证书的基本概念和工作原理 darrenzhu 加密 ssl 证书密钥签名
SSL 与数字证书的基本概念和工作原理 http://www.linuxde.net/2012/03/8301.html SSL握手协议的目的是或最终结果是让客户端和服务器拥有一个共同的密钥，握手协议本身是基于非对称加密机制的，之后就使用共同的密钥基于对称加密机制进行信息交换。 http://www.ibm.com/developerworks/cn/webspher
Ubuntu设置ip的步骤 dcj3sjt126com ubuntu
在单位的一台机器完全装了Ubuntu Server，但回家只能在XP上VM一个，装的时候网卡是DHCP的，用ifconfig查了一下ip是192.168.92.128,可以ping通。转载不是错： Ubuntu命令行修改网络配置方法 /etc/network/interfaces打开后里面可设置DHCP或手动设置静态ip。前面auto eth0，让网卡开机自动挂载. 1. 以D
php包管理工具推荐 dcj3sjt126com PHP Composer
http://www.phpcomposer.com/ Composer是 PHP 用来管理依赖（dependency）关系的工具。你可以在自己的项目中声明所依赖的外部工具库（libraries），Composer 会帮你安装这些依赖的库文件。中文文档入门指南下载安装包列表 Composer 中国镜像
Gson使用四（TypeAdapter） eksliang json gson Gson自定义转换器 gsonTypeAdapter
转载请出自出处：http://eksliang.iteye.com/blog/2175595 一.概述 Gson的TypeAapter可以理解成自定义序列化和返序列化二、应用场景举例例如我们通常去注册时（那些外国网站），会让我们输入firstName，lastName,但是转到我们都
JQM控件之Navbar和Tabs gundumw100 html xml css
在JQM中使用导航栏Navbar是简单的。只需要将data-role="navbar"赋给div即可： <div data-role="navbar"> <ul> <li><a href="#" class="ui-btn-active&qu
利用归并排序算法对大文件进行排序 iwindyforest java 归并排序大文件分治法 Merge sort
归并排序算法介绍，请参照Wikipeida zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F 基本思想：大文件分割成行数相等的两个子文件，递归（归并排序）两个子文件，直到递归到分割成的子文件低于限制行数低于限制行数的子文件直接排序两个排序好的子文件归并到父文件直到最后所有排序好的父文件归并到输入
iOS UIWebView URL拦截啸笑天 UIWebView
本文译者：candeladiao，原文：URL filtering for UIWebView on the iPhone说明：译者在做app开发时，因为页面的javascript文件比较大导致加载速度很慢，所以想把javascript文件打包在app里，当UIWebView需要加载该脚本时就从app本地读取，但UIWebView并不支持加载本地资源。最后从下文中找到了解决方法，第一次翻译，难免有
索引的碎片整理SQL语句 macroli sql
SET NOCOUNT ON DECLARE @tablename VARCHAR (128) DECLARE @execstr VARCHAR (255) DECLARE @objectid INT DECLARE @indexid INT DECLARE @frag DECIMAL DECLARE @maxfrag DECIMAL --设置最大允许的碎片数量,超过则对索引进行碎片
Angularjs同步操作http请求with $promise qiaolevip 每天进步一点点学习永无止境 AngularJS 纵观千象
// Define a factory app.factory('profilePromise', ['$q', 'AccountService', function($q, AccountService) { var deferred = $q.defer(); AccountService.getProfile().then(function(res) {
hibernate联合查询问题 sxj19881213 sql Hibernate HQL 联合查询
最近在用hibernate做项目，遇到了联合查询的问题，以及联合查询中的N+1问题。针对无外键关联的联合查询，我做了HQL和SQL的实验，希望能帮助到大家。（我使用的版本是hibernate3.3.2） 1 几个常识：（1）hql中的几种join查询，只有在外键关联、并且作了相应配置时才能使用。（2）hql的默认查询策略，在进行联合查询时，会产
struts2.xml wuai struts
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache

联邦学习实战-1:用python从零开始实现横向联邦学习

一、环境准备

二、横向联邦图像分类

基本信息

2.1 配置文件

2.1 构建训练数据集

2.2 服务端

构造函数

聚合函数

评估函数

2.3 客户端

构造函数

本地训练

2.4 整合

2.5 测试

你可能感兴趣的:(FL+Blockchain,联邦学习)