Limeym

论文阅读 Challenges and future directions of secure federated learning: a survey

论文题目：《Challenges and future directions of secure federated learning: a survey》

论文地址：https://doi.org/10.1007/s11704-021-0598-z

Abstract

大数据时代，敏感信息暴露，人们对隐私安全日益关注 —> 联邦学习应运而生

联邦学习：

优点：不收集用户的原始数据，而是聚合每个客户端的模型参数 —> 保护用户的隐私

缺点：分布式特性 —> 更容易受到攻击

例如：用户上传恶意数据 —> 破坏联邦学习服务器；攻击者从参数中恢复信息

因此，目前的联邦学习框架仍有很大的改进空间。

在本调查中，简要回顾了最先进的联邦学习技术，并讨论了联邦学习中的几个开放问题和现有解决方案，指出了联邦学习的未来研究方向。

1. Introduction

人工智能 ↑ —> 深度学习（深度学习算法+海量数据） ↑ —> 收集大量数据 —> 数据隐私问题（数据包含敏感信息） ↑ —> 差分隐私、同态加密、联邦学习

联邦学习核心思想：分布式深度学习

尽管联邦学习已用于大多数场景，但仍有许多挑战需要解决：

在许多实际场景中比传统的深度学习框架更容易受到恶意节点的攻击。

由于联邦学习服务器只收集不显示客户端身份的参数，匿名客户端可能包含向服务器上传恶意数据的攻击者。

尽管已有研究，但仍有挑战：

本文集中于这些挑战，旨在提出在不同场景中具有隐私保护联邦学习的新应用。

2. Secure learning algorithm: federated learning

2.1. Emergence of federated learning

联邦学习诞生的原因：

数据隐私日益重要。随着安全意识的提高，人们将更不愿意贡献自己的私人数据，这严重阻碍了深度学习的发展。

大多数企业只有数量不足、质量有限的数据，不足以支持数据密集型人工智能服务的部署。数据通常以孤岛的形式。[20]

联邦学习本质上是：深度学习的分布式框架。可以在确保数据隐私安全的基础上，通过多个客户端的模型聚合来提高模型的有效性。[21]

基于多个参与者之间的不同数据分布，联邦学习可分为三类：横向联邦学习、纵向联邦学习和联邦转移学习。[20]

横向联邦学习：参与者提供的数据分布相似，但数据提供者不重叠。

在训练过程中，每台机器训练的模型都是相同和完整的，并且在进行预测时可以独立预测。因此，该过程可以被视为基于样本的分布式训练。

由于每个用户的原始数据都是在本地训练的，并且只共享和上传本地梯度参数，因此用户的隐私也受到了保护，但会有一些模型丢失。
纵向联邦学习：用户集都是相同的，但不同的数据集具有来自这些用户的不同类型的数据。

纵向联邦学习需要样本对齐和模型加密。[22]

在训练过程中，纵向联邦学习确保其他参与者不知道对方的数据和特征。通过这种方式，全局模型可以获得所有参与者的数据信息，并且不会丢失模型。
联邦转移学习：具有有限数量的相同用户，以及具有相同功能的非常小的数据集。

2.2. Bottleneck in federated learning

许多应用程序利用了联邦学习，其概念已经在许多地方应用。例如，一些应用程序允许用户在手机上训练模型，而无需上传原始数据。[24]

然而，尽管现有的应用程序多种多样且成功，但联邦学习技术仍需要改进。

分布式学习和在本地保存数据的思想使恶意节点更容易攻击联邦学习框架。

许多异构用户和数据本身也给算法带来了更多的处理难度。

其中一些挑战与正常的深度学习相同，有些则是新的挑战。此外，其他经典算法中存在的挑战甚至可能对联邦学习框架产生更严重的影响。

3. Challenges and corresponding solutions

联邦学习过程涉及多个客户端上传本地的参数，中央服务器接收这些本地参数进行全局聚合，最后将更新的参数返回给每个客户端。

因此，一旦涉及到恶意节点，它们就会以高度的可信度对输入进行错误分类，从而导致模型中毒。[27]

此外，即使每个客户端上传本地梯度而不是原始数据，恶意节点仍有办法从梯度中恢复原始数据的内容。[28]

同时，在某些情况下，不同客户端的数据不是独立的，也不是相同的分布（即非IID），客户端的设备也非常不同。

3.1. Communication cost

发送原始数据 —> 导致隐私问题 —> 每个设备上生成的数据必须保存在本地 —> 通信成为联邦学习的瓶颈

在现实世界场景中：设备众多 —> 每个设备在本地训练模型的时间可能远少于网络通信[29] —> 模型质量会因为更多的数据而提高，通信开销也会增加

载体是手机时：本地模型需要定期上传到服务器，而对于大型模型，由于无线网络的带宽有限，这一步骤可能成为瓶颈。

此外，连接速度是不对称的：上行链路通常比下行链路慢，因此降低上行链路通信成本非常重要。[30]

为了降低通信成本，应该关注两个方面：

减少通信轮的总数
减少每轮通信中的信息量

3.2. Heterogeneity in systems

设备、网络状态、设备的存储和处理能力的多样性 —> 计算和通信能力的训练过程将有所不同 —> 系统异质性的存在加剧了延迟缓解和容错[31]

Bonawitz等人[32]提出了一种解决方案：从设备集群中过滤有效设备的子集。通常需要确认设备是否空闲、设备的电源状态以及是否为计费网络。

甚至可能存在设备离线的情况。[33]

设备和网络的异构性，以及活动成员的突然丢失，将使人们考虑延迟和容错问题。

解决联邦学习中的系统异构问题：

激励用户参与
处理异构设备
为不稳定网络设计容错机制

3.3. Heterogeneity in statistical

除了上述系统的异质性之外，数据本身也存在异质性。

不同的生成和收集方法 —> 来自不同用户的数据很容易是异构的，即非IID —> 非IID数据增加了建模和评估的复杂性

联邦学习通常采用随机梯度下降 —> IID训练数据可以更好地确保随机梯度是无偏的[34]

现有处理异构数据的方法：

元学习，支持个性化建模。[18]

Sattler等人[35]声称，顶部稀疏化在非IID联邦学习环境中表现非常好。在他们的工作中，他们采用了顶部稀疏化，设计了服务器端使用的缓存机制，并将压缩扩展到了下游。他们的结果表明，在最坏的情况下，他们的算法仍然可以达到至少50%的精度，而联邦平均算法甚至不收敛。

Li等人[36]证明了在没有假设约束的情况下联邦平均的收敛速度。他们还声称，如果采用联邦平均算法处理非IID数据，学习率肯定会下降。与之前的分析不同，他们没有假设每个客户端中的数据都是IID，在实践中很难满足这一假设。

3.4. Privacy concerns

隐私是联邦学习的首要问题。

大多数模型攻击的研究都假设攻击者几乎无法访问模型输入，因为训练模型的数据在内部是保密的。[37]

然而，考虑现实世界的情况时，发现大多数服务提供商要求用户上传私人数据进行训练。一旦上传结束，用户将失去对数据的控制：他们无法知道数据是如何使用的，也无法主动删除数据。

联邦学习通过向每个用户提供本地梯度信息而不是原始数据，在保护隐私方面取得了巨大进步。

然而，仅仅在训练期间保持数据的本地化并不能提供足够的隐私保障。仅仅传递梯度信息仍然会将隐私泄露给第三方或中央服务器。[38]

从服务提供商的角度来看，即使他们很好地保护了用户的原始数据集，模型本身也会泄露隐私信息。

模型反演攻击是利用模型隐含用户信息的一种方法，该模型通过操纵未知输入和相应输出之间的关系与目标连接。[39]

Zhu等人[28]提出了一种算法，通过获得中央服务器返回给每个客户端的聚集梯度来恢复从用户输入的原始图像。在他们的算法中，恶意攻击者将参与学习过程，并初始化一个无意义的随机图。攻击者将训练其随机输入，使其自身的局部梯度尽可能接近服务器返回的全局梯度。通过这种方式，他们可以恢复其他用户的原始图像输入。

Geiping等人[40]证明，即使是经过训练的联邦学习网络，而不是训练期间的网络，也可以忠实地利用梯度参数重建高分辨率图像。

Shokri等人[7]提出了一种隐私保护的深度学习系统，允许多个用户参与。使用本地数据，参与者首先计算神经网络的梯度。然后，必须向参数云服务器发送部分梯度（例如，5%）。他们认为服务器是诚实但好奇的。该系统指出，隐私可以在不共享局部梯度的情况下得到完美保护，但该模型完全不准确。另一方面，共享所有的局部梯度会破坏一些隐私，但它会提供良好的准确性。为了平衡权衡，它们共享局部梯度的一部分，这是保持尽可能少的精度降低的主要解决方案。分布式选择性SGD是他们思想的核心。有两种方法可以选择上载到服务器的参数。第一种是根据绝对值从最大到最小对所有梯度进行排序，并选择第一个要上传的梯度。第二种是随机选择绝对值大于阈值的参数梯度的一部分进行上传。其他用户可以下载用户上传的梯度来更新其本地参数。用户上传和下载的顺序可以是循环、随机顺序和异步。

Aono等人[22]进一步证明，在[7]的系统中，即使是存储在云服务器上的小梯度也可以用来推断用户的信息，因为可以从这些梯度中提取本地数据，结果也不令人满意。因此，他们更进一步，提出了一种新的学习系统，该系统额外使用同态加密来保护诚实但好奇的云服务器上的梯度。上传的所有梯度都将在存储到云服务器之前进行加密。参与学习过程的用户共同设置公钥和密钥，以实现加同态加密方案。关键是云服务器的秘密，但所有学习参与者都知道。参与者之间将建立单独的TLS/SSL安全通道，以进行通信并保护同态密文的完整性。由于同态加密的添加操作，云服务器是递归更新加密权重参数的地方。该系统可以在不损害深度学习模型的准确性的情况下发挥隐私保护的作用。

但不可否认的是，同态加密会在一定程度上增加通信成本。当然，除了同态加密之外，还有其他加密方法可以应用。

Bonawitz等人[17]采用了秘密共享和双屏蔽协议来解决联邦学习的挑战。在他们的论文中，他们还考虑了网络波动的可能性，提出了一种支持用户在训练过程中退出的机制。用户还可以验证云服务器是否正常运行。在秘密外共享协议中，一个秘密会被分割成不相交的碎片，如果有人得到了碎片，他/她就可以恢复原来的秘密。因此，在该系统中，一个受信任的授权机构将随机地为每个用户创建密钥对和随机噪声。当一个用户想要上传他/她的本地梯度时，他/她会添加一些由其他用户的公钥加密的他/她的密钥片段和一些。所有这些额外的信息将通过秘密共享协议恢复，或者在它们相加时被取消。然后，服务器端接收消息。服务器将根据秘密共享协议计算这些信息，最后计算聚合梯度。

差分隐私作为一种经典的密码学方法，也可以应用于联邦学习。

Geyer等人[41]在他们的研究中利用了不同隐私的想法。他们认为，客户参与也可以隐藏在联邦学习中，同时保持高模型性能。他们提出的算法设置了一个阈值。如果一段数据是否是训练集的一部分的概率超过了给定的阈值，训练就会停止。参与客户的数量对实现的模型的性能有明显的影响。当参与者的数量很大时，信息更容易隐藏。

同样，Wei等人[42]也应用了差分隐私。他们提出的算法通过添加噪声来减小从两个相同长度的不同数据集计算的梯度参数之间的汉明距离。因此，不同用户的梯度参数无法追溯到其所有者，因为服务器和恶意用户都无法区分它们。

3.5. Other vulnerabilities

除了上述困难，还应强调联邦学习的安全性。

尽管安全性和隐私性在直觉上通常被认为是等同的，但两者实际上是存在区别的：

隐私保护：一般指非公开披露敏感个人信息。可以是用户的健康信息、旅行轨迹、工资水平等。

虽然它可能不会直接暴露用户的身份，但它可以使其他人间接识别特定的个人，从而暴露用户的敏感信息。
安全保护：需要考虑机密性、完整性和可用性。

安全面临的挑战通常是缺乏对数据的访问控制和来自恶意节点的攻击，这些攻击通常是由黑客针对系统或模型本身发起的。

例如，模型中毒是对联邦学习最常见的攻击之一。由于可能有数百个客户端参与联邦学习网络，因此无法保证这些参与者中不会有恶意参与者。此外，一般来说，防御中毒攻击需要将数据上传到服务器进行异常检测，这可能会损害用户隐私。例如，假标签攻击[43]和后门攻击[44]，如果中毒数据的数量很大，这些攻击可能会导致严重损害。

规范裁剪技术和差异隐私可以防止模型中毒，而整体性能不会受到影响[45]。由于攻击者通常希望对模型产生更大的影响，因此他们倾向于使用更大的规范进行更新。因此，当服务器选择性地忽略那些较大的更新，可能是那些超过阈值M的更新时，可以有效地防御恶意节点的攻击。同时，它们只添加少量高斯噪声来防御后门攻击。这种“弱”差异隐私可以在确保性能的同时限制攻击。

为了增强隐私，Bittau等人[46]首先提出了基于差异隐私的PROCHLO实现。他们引入了一个值得信赖的第三方来经营一家洗牌机。洗牌器删除了包含用户隐私的部分数据，如时间戳、IP地址等，从而实现了匿名过程。然而，简单地删除一些元数据并不能阻止攻击者访问数据所有者。恶意节点可以通过监视网络流量和其他方法来发现数据和用户之间的链接。因此，混洗器将与混洗一起进行阈值处理。如果某些物品类的数据太少，洗牌者将对其进行变卦。目前，具有差异隐私的洗牌模型已引起更多关注，并被应用于防止合谋攻击和中毒攻击[47，48]。

Ma等人[49]指出，联邦学习的安全性也需要特别注意。他们在著名的分类数据集MNIST上进行了一系列实验，讨论可能的有效解决方案。根据实验结果，我们可以得出许多结论。如果在每次聚合之后，服务器可以基于客户端上载的学习参数的质量来调整每个客户端的聚合权重，则客户端将显示更好的收敛速度和学习性能。在每个学习时期，服务器在执行下一轮学习之前收集固定数量的所需客户端参数。这就是通过减少用户来减轻网络波动，这可能会对整个系统产生重大影响。一旦等待时间超过阈值时间，且数据未完全收集，则当前学习轮将被放弃。

此外，参数聚合步骤还有改进的空间。例如，可以在服务器端添加参数测试，并根据不同的测试性能结果为客户端上载的每个参数个性化聚合权重。某个用户带来的性能越好，用户参数的权重系数就越高。同时，实验结果还表明，增加每个客户的本地生成量也有助于提高模型精度。

4. Future direction

4.1. Privacy and security protection

本文认为学习如何更好地保护用户隐私将是联邦学习未来发展中最重要的一点。

联邦学习将有更大的发展空间，未来将有更多的应用场景。

4.2. Incentive mechanism for federated learning

在联邦学习中，由于网络延迟和通信开销，数据所有者可能会对参与学习系统失去兴趣，不再提供数据[57，58]。

同时，要求所有用户频繁上传其本地模型参数时，对全局模型的改进可能与通信成本不成正比。

因此，用户上传参数的激励机制需要平衡[59]。

此外，根据用户提供的数据质量参差不齐，还需要激励高质量用户参与，同时忽略或拒绝不可信的用户[60，61]。

4.3. Personalized federated learning

个性化服务是用户迫切需要的，具有广阔的前景。

一方面，许多用户更喜欢联邦学习，因为他们希望获得更个性化的本地模型，以便更好地为自己获得更好的服务[62]。

个性化联邦学习的例子：谷歌键盘。用户可以训练更符合他们语言习惯的预测模型，同时确保数据保存在本地。

通常的模型聚合方法自然不再适用于此类问题。许多研究人员为个性化联邦学习设计了各种模型聚合算法[63-65]。
另一方面，在物联网的背景下，个性化联邦学习可以更好地减轻由于用户数据的异质性而产生的影响。

Mansour等人[66]提出，可以对相似的用户进行聚类，然后可以为每个聚类定制模型。

联邦迁移学习的思想也有助于个性化，不同的用户从自己的本地数据中重新学习全局模型返回的参数[67]。

5. Summary

这篇综述着重于联邦学习模型出现的动机、最初的概念，以及在最近的研究工作中发现的挑战性问题和可能的解决方案。

联邦学习出现的一个原因是：人们发现传统深度学习的现有假设过于理想，在现实世界中，数据碎片化和隔离的问题相当严重。

数据提供商越来越不愿意暴露其原始数据并放弃对其的所有控制。

个人用户不想完全暴露他们的原始数据，因为它包含大量敏感信息。

—> 于是提出了联邦学习来解决这些问题。

从理论上讲，联邦学习极大地统一了来自不同的被隔离的数据，并打破了障碍。

同时，通过联邦学习，用户可以参与深度学习，而无需暴露原始数据，有助于训练高质量的模型，同时保护隐私。

然而，该算法仍有进一步改进的空间：由于其分布式框架和极高的参与自由度，可能会吸引更多的恶意攻击和其他类型的隐私泄露。

—> 因此，希望最大限度地发挥联邦学习的优势，保护用户的隐私，同时训练更准确的模型。

未来的研究还将侧重于隐私和安全保护、激励机制和个性化联邦学习。

三体融合实战：Django+讯飞星火+Colossal-AI的企业级AI系统架构 IT莫染 Function Module AI大模型工具及插件 django 人工智能系统架构讯飞星火 Colossal-AI WebSocket
目录技术栈关键词：Django5.0讯飞星火4.0UltraColossal-AI1.2WebSocket联邦学习⚡核心架构设计️一、Django深度集成讯飞星火API（免费版）1.获取API凭证2.流式通信改造（解决高并发阻塞）3.Django视图层集成⚡二、Colossal-AI加速多模型适配策略1.私有模型微调方案2.多模型路由逻辑三、私有化部署安全加固方案1.三重安全防护体系2.请求签名防
【LLM论文阅读】一只齐刘海的猫论文阅读
LLM论文阅读论文重点论文链接RopeRoFormer:EnhancedTransformerwithRotaryPositionEmbeddingRoPE论文阅读YarnUnderstandingYaRN:ExtendingContextWindowofLLMs论文YaRN笔记T5ExploringtheLimitsofTransferLearningwithaUnifiedText-to-Te
大模型在通讯网络中的系统性应用架构 Deepoch 网络
一、网络架构智能化重构1.1空天地一体化组网优化智能拓扑动态调整：大模型通过分析卫星轨道数据、地面基站负载及用户分布，实时优化天地一体化网络拓扑。例如，在用户密集区域（如城市中心）自动增强低轨卫星与地面基站的协同，通过联邦学习实现跨区域资源调度，降低跨空口传输时延至0.3ms以下。量子密钥分发增强：结合量子通信卫星星座，大模型动态生成抗量子攻击的密钥分发策略。在卫星间链路中，采用LSTM预测信道衰
Segment Anything in High Quality之SAM-HQ论文阅读 qq_41627642 深度学习论文阅读论文阅读
摘要最近的SegmentAnythingModel（SAM）在扩展分割模型规模方面取得了重大突破，具备强大的零样本能力和灵活的提示机制。尽管SAM在训练时使用了11亿个掩码，其掩码预测质量在许多情况下仍不理想，尤其是对于结构复杂的目标。我们提出了HQ-SAM，使SAM能够精确地分割任意目标，同时保留其原有的可提示设计、高效性和零样本泛化能力。我们的设计充分复用并保留了SAM预训练的模型权重，仅引入
yolov算法详解_yolo 目标检测算法个人总结（yolov1） CHAO JIANG yolov算法详解
yolo目标检测算法个人总结目前yolo目标检测有两个版本，分别为v1和v2。因工作需要用yolo算法检测人物，所以这段时间重点看了这两篇论文，并实现了对应的tensorflow代码。这里记录下在论文阅读过程中的一些细节信息，留给自己，同时也希望各位能指出本人理解错误的地方，谢谢！一：yolov1关于yolov1算法的详解在网上已经非常多了，在这里我大概叙述下算法的流程，以及在开发过程中遇到的一些
入门pytorch-联邦学习四代机您发多少 pytorch 人工智能 python
本文联邦学习的代码引用于https://github.com/shaoxiongji/federated-learning本篇文章相当于带大家读一遍联邦学习的代码，同时加深了大家对联邦学习和Pytorch框架的理解。这里想简单介绍一下联邦学习。联邦学习说白了，就是假如有NNN个数据拥有者F1,...,FN{F_1,...,F_N}F1,...,FN，他们希望使用这些数据来训练机器学习模型，但是又各
长尾形分布论文速览三十篇【60-89】木木阳 Long-tailed 人工智能
长尾形分布速览（60-89）这些研究展示了LLMs在长尾数据分布、持续学习、异常检测、联邦学习、对比学习、知识图谱、推荐系统、多目标跟踪、标签修复、对象检测、医疗生物医学以及其他应用中的广泛应用。通过优化和创新，LLMs在这些领域展现了卓越的性能，并为解决长尾问题提供了有效的工具和方法。1.长尾持续学习与对抗学习长尾持续学习(Paper60):通过优化器状态重用来减少遗忘，提高在长尾任务中的持续学
《论文阅读》GPT-3是否会产生移情对话？一种新的情境示例选择方法和用于生成同理心对话的自动评估度量 ICCL 2022 365JHWZGo 情感对话论文阅读 gpt-3 共情回复上下文学习提示学习大模型
《论文阅读》GPT-3是否会产生移情对话？一种新的情境示例选择方法和用于生成同理心对话的自动评估度量ICCL2022前言贡献PromptIn-contextlearningSITSMEMOSITSM新的自动指标实验前言亲身阅读感受分享，细节画图解释，再也不用担心看不懂论文啦~无抄袭，无复制，纯手工敲击键盘~今天为大家带来的是《DoesGPT-3GenerateEmpatheticDialogues
[论文阅读] 人工智能 + 软件工程 | 揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究张较瘦_ 前沿技术论文阅读人工智能软件工程
揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究论文：WhatMakesChatGPTEffectiveforSoftwareIssueResolution?AnEmpiricalStudyofDeveloper-ChatGPTConversationsinGitHubarXiv:2506.22390WhatMakesChatGPTEffectiveforSoftwareIssueRe
[论文阅读] 人工智能 + 软件工程 | 代码注释不一致问题研究：从数据革新到端到端解决方案张较瘦_ 前沿技术论文阅读人工智能软件工程
代码注释不一致问题研究：从数据革新到端到端解决方案原文：CCISOLVER:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyarXiv:2506.20558CCISolver:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyRe
Learning Fully Convolutional Networks for Iterative Non-blind Deconvolution论文阅读青铜锁00 #退化论文阅读深度学习论文阅读图像处理
LearningFullyConvolutionalNetworksforIterativeNon-blindDeconvolution1.研究目标与实际问题1.1研究目标1.2实际意义2.创新方法与模型设计2.1核心框架：迭代式梯度域处理2.1.1模型架构2.2关键技术实现2.2.1梯度域去噪网络2.2.2解卷积模块（核心公式实现）2.2.3损失函数设计2.2.4超参数端到端学习2.3与传统方法
KAIST数据集及使用草莓奶忻 SLAM基础 #SLAM数据集 ubuntu
文章目录KAIST复杂城市数据集KAIST数据集转换为rosbag1.将.gz.tar文件解压到其文件夹中2.克隆并构建此存储库3.使用路径和所需主题编辑配置文件4.为每种传感器类型创建一个rosbag文件5.将所有bag合并为一个参考KAIST复杂城市数据集KAIST-Urban-数据集-论文阅读数据集下载：ComplexUrbanDataset复杂城市数据集KAIST数据集转换为rosbag1
跨区域智能电网负荷预测：基于 PaddleFL 的创新探索暮雨哀尘人工智能智能电网 AIGC PaddleFL 数据库 python 可视化
跨区域智能电网负荷预测：基于PaddleFL的创新探索摘要：本文聚焦跨区域智能电网负荷预测，提出基于PaddleFL框架的联邦学习方法，整合多地区智能电网数据，实现数据隐私保护下的高精度预测，为电网调度优化提供依据，推动智能电网发展。一、引言在当今社会，电力作为经济发展的命脉，其稳定供应对于保障社会生活的正常运转和生产的持续进行具有不可替代的重要性。而智能电网作为现代电力系统的重要发展方向，通过集
面向隐私保护的机器学习：联邦学习技术解析与应用 Blossom.118 机器学习与人工智能机器学习人工智能深度学习 tensorflow python 神经网络 cnn
在当今数字化时代，数据隐私和安全问题日益受到关注。随着《数据安全法》《个人信息保护法》等法律法规的实施，企业和机构在数据处理和分析过程中面临着越来越严格的合规要求。然而，机器学习模型的训练和优化往往需要大量的数据支持，这就产生了一个矛盾：如何在保护数据隐私的前提下，充分利用数据的价值进行机器学习模型的训练和优化？联邦学习（FederatedLearning）作为一种新兴的隐私保护技术，为解决这一问
[论文阅读] 软件工程 | 需求工程中领域知识研究：系统映射与创新突破张较瘦_ 前沿技术论文阅读软件工程
需求工程中领域知识研究：系统映射与创新突破论文信息DomainKnowledgeinRequirementsEngineering:ASystematicMappingStudyarXiv:2506.20754DomainKnowledgeinRequirementsEngineering:ASystematicMappingStudyMarinaAraújo,JúliaAraújo,RomeuO
论文阅读：2025 arxiv Qwen3 Technical Report
https://arxiv.org/pdf/2505.09388https://www.doubao.com/chat/9918384373236738文章目录论文翻译Qwen3技术报告摘要1引言论文翻译Qwen3技术报告Qwen团队摘要在这项工作中，我们介绍了Qwen模型家族的最新版本Qwen3。Qwen3包含一系列大型语言模型（LLM），旨在提升性能、效率和多语言能力。Qwen3系列包括密集型
《多设备协同训练：HarmonyOS联邦学习驱动Unity游戏AI进化》爱学习的小齐哥哥 HarmonyOS 5 Unity 游戏 HarmonyOS5 unity 游戏引擎 Unity 游戏
随着游戏产业的智能化升级，游戏AI正从传统的规则驱动向数据驱动的“自进化”模式转型。然而，传统游戏AI训练面临数据孤岛、计算资源受限、隐私安全风险三大核心挑战：单设备训练难以处理复杂场景的海量数据，集中式训练需上传用户行为数据（侵犯隐私），且高性能计算依赖云端或专用硬件（成本高、延迟大）。在此背景下，HarmonyOS联邦学习与多设备协同训练的融合，为Unity游戏AI的智能化进化提供了突破性解决
[论文阅读] 软件工程 | 探索软件生态系统中的开发者体验关键因素
探索软件生态系统中的开发者体验关键因素：从研究到实践引文格式@article{Zacarias2025,title={ExploringDeveloperExperienceFactorsinSoftwareEcosystems},author={Zacarias,RodrigoOliveiraandAntunes,L{\'e}oCarvalhoRamosandBarros,M{\'a}rciod
Fast Image Deconvolution using Hyper-Laplacian Priors论文阅读青铜锁00 #退化论文阅读论文阅读图像处理
FastImageDeconvolutionusingHyper-LaplacianPriors1.论文的研究目标与实际意义2.论文的创新方法2.1核心框架：交替最小化（AlternatingMinimization）2.2x子问题：频域FFT加速2.3w子问题：高效求解的核心创新2.3.1问题形式2.3.2查找表法（LUT）2.3.3解析解法（特定α\alphaα）2.3.4通用α\alphaα
[论文阅读] 人工智能 + 软件工程 | AI 与敏捷开发的破局之路：从挫败到成功的工作坊纪实张较瘦_ 前沿技术论文阅读人工智能软件工程
AI与敏捷开发的破局之路：从挫败到成功的工作坊纪实论文信息arXiv:2506.20159AIandAgileSoftwareDevelopment:FromFrustrationtoSuccess–XP2025WorkshopSummaryTomasHerda,VictoriaPichler,ZheyingZhang,PekkaAbrahamsson,GeirK.HanssenSubjects:
Diff-Retinex: Rethinking Low-light Image Enhancement with A Generative Diffusion Model 论文阅读钟屿论文阅读人工智能深度学习学习图像处理计算机视觉
Diff-Retinex：用生成式扩散模型重新思考低光照图像增强摘要本文中，我们重新思考了低光照图像增强任务，并提出了一种物理可解释的生成式扩散模型，称为Diff-Retinex。我们的目标是整合物理模型和生成网络的优点。此外，我们希望通过生成网络补充甚至推断低光照图像中缺失的信息。因此，Diff-Retinex将低光照图像增强问题表述为Retinex分解和条件图像生成。在Retinex分解中，我
【论文阅读】人工智能在直升机航空电子系统中的应用肥鼠路易论文阅读人工智能航空电子系统应用
人工智能在直升机航空电子系统中的应用论文摘要文章结构参考文献论文摘要论文摘要:在现代战争形势日趋信息化、智能化的背景下，将人工智能应用于武器装备已经是大势所趋。针对直升机飞行任务的特征，对其发展状况进行了描述，并对其作业能力进行了分析，探索了人工智能技术在直升机航电系统中的应用方向，为推进人工智能在直升机上的转化与应用奠定基础。通过对国外先进直升机智能技术的运用现状及对其作业能力的要求进行分析，探
AI人工智能加持，联邦学习医疗数据共享方案全解析 AI学长带你学AI CS 人工智能网络 ai
AI人工智能加持，联邦学习医疗数据共享方案全解析关键词：联邦学习、医疗数据共享、隐私保护、人工智能、多方安全计算摘要：医疗数据是医学研究和临床决策的“黄金资源”，但患者隐私保护与数据孤岛问题却像两道高墙，阻碍着医疗AI的发展。本文将以“联邦学习”这一AI核心技术为钥匙，带您深入理解如何在不泄露原始数据的前提下，实现跨医院、跨机构的医疗数据共享与联合建模。我们将从生活场景出发，用“厨师合作研发新菜”
[论文阅读] 人工智能+软件工程 | 用大语言模型架起软件需求形式化的桥梁张较瘦_ 前沿技术人工智能论文阅读软件工程
用大语言模型架起软件需求形式化的桥梁：一篇ACM调查草案的深度解读论文信息arXiv:2506.14627ACMSurveyDraftonFormalisingSoftwareRequirementswithLargeLanguageModelsArshadBeg,DiarmuidO’Donoghue,RosemaryMonahanComments:22pages.6summarytablesSu
Reti-Diff: Illumination Degradation Image Restoration with Retinex-based Latent Diffusion Model论文阅读青铜锁00 深度学习论文阅读 #退化论文阅读
Reti-Diff:IlluminationDegradationImageRestorationwithRetinex-basedLatentDiffusionModel1.研究目标与实际意义1.1研究目标1.2实际意义2.创新方法与模型设计2.1整体框架2.2RetinexPriorExtraction(RPE)模块2.2.1Retinex分解2.2.2先验压缩2.3Retinex-guide
SIMPL论文阅读 ZHANG8023ZHEN 论文阅读
论文链接：https://arxiv.org/pdf/2402.02519文章还没细看，但主要贡献点应该是SymmetricFusionTransformer和Bezier-basedMotionDecoder.对Bezier-basedMotionDecoder比较感兴趣，之后对这块细看一下
【论文阅读笔记】《CodeS: Towards Building Open-source Language Models for Text-to-SQL 》柠石榴 text2sql 论文论文阅读笔记语言模型
文章目录一、论文基本信息1.文章标题2.所属刊物/会议3.发表年份4.作者列表5.发表单位二、摘要三、解决问题四、创新点五、自己的见解和感想六、研究背景七、研究方法模型实验数据评估指标八、总结九、相关重要文献一、论文基本信息1.文章标题CodeS:TowardsBuildingOpen-sourceLanguageModelsforText-to-SQL2.所属刊物/会议未明确标注（会议缩写为“C
agentformer论文阅读 ZHANG8023ZHEN 论文阅读
参考了这篇博文：https://zhuanlan.zhihu.com/p/512764984主要有这几个部分a.map_encoderi.对地图进行CNNb.ContextEncoderi.timeencoder–将时间信息用transformer和positionemb进行融合，加入到特征中ii.agent-awareattention–self和selfattentionother和other
【论文阅读】DynamicControl ：一种新的controlnet多条件控制方法 prinTao pytorch Diffusion 论文阅读
背景现有方法要么处理条件效率低下，要么使用固定数量的条件，这并不能完全解决多个条件的复杂性及其潜在冲突。这强调了需要创新方法来有效管理多种条件，以实现更可靠和详细的图像合成。为了解决这个问题，我们提出了一个新的框架DynamicControl，它支持不同控制信号的动态组合，允许自适应选择不同数量和类型的条件。本文方法从一个双循环控制器开始，它通过利用预先训练的条件生成模型和判别模型为所有输入条件生
论文阅读：2018 arxiv CrowdHuman: A Benchmark for Detecting Human in a Crowd CSPhD-winston-杨帆论文阅读
https://www.doubao.com/chat/9226473480559618https://arxiv.org/pdf/1805.00123CrowdHuman:ABenchmarkforDetectingHumaninaCrowd文章目录论文翻译CrowdHuman：用于检测人群中人体的基准摘要1.引言2.相关工作2.1.人体检测数据集2.2.人体检测框架。论文翻译CrowdHuma
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s