MoModel

【技术博客】浅谈联邦半监督学习及FedMatch算法

作者：余敏君

1 前言

以往的联邦学习工作往往仅专注于对监督学习任务的研究，即要求所有的数据都必须包含相应的标签。但是，在现实场景中，考虑到大数据量标注任务所需要的人力和物力开销是非常大的，因此本地客户端所包含的数据常常大部分甚至全部都是没有相应标签信息的。为了解决上述问题，大量新的学习范式应运而生。这其中，半监督学习作为一种解决标签数据量小问题的有效方法，被广大机器学习研究者所偏爱。本博客将从联邦半监督学习入手，为大家介绍其相关的基本概念，并详细讲解一种争对该应用场景的相关算法——FedMatch。

2 FSSL定义及应用场景

2.1 半监督学习

半监督学习(Semi-Supervised Learning)，是一种利用少量带标签数据和大量无标签数据进行模型训练的机器学习方法。一方面，考虑到根据半监督学习的定义，其可以解决带标签数据量少的现实问题；另一方面，考虑到相较于无监督学习，其仍然可以利用一部分标签信息来降低训练模型的难度，因此，对半监督学习的研究具有非常重要的现实意义。对于半监督学习的理解，有一种说法可以供大家参考：半监督学习其实就是利用大量的无标签数据来弥补少量标签数据指导模型训练所容易造成的过拟合现象(提高泛化能力)。

2.2 联邦学习

联邦学习(Federated Learning)，是一种在确保本地客户端数据隐私安全的前提下，通过中心化服务器调用多方本地客户端联合训练模型的一种学习范式。联邦学习的一个非常重要的作用，就是可以在极高的隐私保护要求下，为机器学习相关任务提供大量的训练数据。联邦学习的这一特性在人们对于隐私保护日益重视的今天，对目前仍需要大量数据支撑的机器学习方法来说起着至关重要的作用。

2.3 联邦半监督学习

2.3.1 基本定义

从广义上理解，所谓联邦半监督学习(Federated Semi-Supervised Learning, FSSL)，其实就是将半监督学习方法应用于联邦学习的应用场景之中，结合两种技术的优势来更好地解决现实问题。该技术一方面可以通过联邦学习保证具备充足的训练数据，另一方面又可以通过半监督学习来缓解各个客户端分散数据标注开销大的问题。按个人的理解，其主要可以分为以下两种类型：

第一类是在联邦学习的配置下，训练半监督学习模型
第二类是结合一些其他的技术，解决联邦学习中存在的某些问题/瓶颈(例如通讯瓶颈)

由于第二类方法更多的还是强调联邦学习的基本配置，因此，为了更好地对联邦半监督学习的相关内容进行介绍，本文主要针对第一类学习方法进行探讨。

2.3.2 应用场景

论文[1]根据带标签的数据集是在客户端还是在服务器端将联邦半监督应用场景划分为标准场景(standard scenario)和不相交场景(disjoint scenario)者两个类别。两种应用场景的示意图如图1所示。
![1.png](https://img-blog.csdnimg.cn/img_convert/1ab715d5adee2d81842ce7e8f6184a44.png#align=left&display=inline&height=200&margin=[object Object]&name=1.png&originHeight=400&originWidth=1337&size=344180&status=done&style=shadow&width=669)
图1 联邦半监督的两种应用场景

2.3.2.1 标准场景

所谓标准场景，是指参与模型训练的带标签数据和无标签数据均存放于本地客户端，即本地执行标准的半监督学习训练。如图1(a)中的例子，对于提供给手机端客户的照片自动归类存放模型，其训练所用到的照片数据，可能会有一小部分照片已经被用户放在了指定的文件夹中(该文件夹即为标签信息)，而大部分照片并未被归类(无标签信息)，此时客户端的模型训练便满足半监督学习的配置。该应用场景产生的主要原因是因为服务商不可能要求每一个客户都为模型的训练去标注所有的相关数据。

2.3.2.2 不相交场景

所谓不相交场景，是指参与模型训练的带标签数据被存放在服务端中，而大量的无标签数据却存放在本地客户端中，即带标签的监督学习过程和无标签的无监督学习过程将分别在服务器端和客户端进行。该应用场景主要是由于许多数据的标注工作是需要具备相关专业知识的人员来进行处理的。例如图1(b)中的例子，对于瑜伽姿势矫正手机APP软件，由于普通人是难以确认自己的瑜伽姿势是否完成正确，因此，即使用户愿意为服务商标注所有的图片数据，服务商也只能聘请那些瑜伽专业人才来对相关数据进行标注。
博客对上述两种联邦半监督应用场景的区别进行了简单的归类，其具体内容如表1所示。
表1 两种应用场景的对比

	标准场景	不相交场景
定义	带标签数据和无标签数据均存放于本地	带标签数据存放于服务器端，无标签数据存放于本地
训练方式	本地执行标准的半监督模型训练	无标签和带标签模型训练过程完全分离(但是相关联的)
符合场景	不可能期望各个本地客户对所有数据进行标注	数据的标注需要专业人士参与

3 FedMatch算法

针对上述两种应用场景，这篇来自于ICML workshop’2020的论文[1]提出了一种称为Federated Matching(FedMatch)的联邦半监督学习算法。对于联邦半监督学习相关的论文，个人认为需要从以下三个关注点来对其进行理解：

该算法适用于哪种联邦半监督应用场景(标准or不相交)
该算法是如何利用带标签和无标签数据的(半监督学习关注点)
该算法为服务器端设计了怎样的模型聚合方式(联邦学习关注点)

接下来，博客将会从这三个关注点入手，详细介绍FedMatch算法的相关内容，以此间接反映出联邦半监督算法的一般设计思路。

3.1 应用场景&核心思路

FedMatch算法通过模型的稍事修改可以应用于上述所提及的两种联邦半监督学习应用场景之中。该算法的核心设计思路主要有以下两方面内容：

利用最大化各客户端模型之间的共识从无标签信息中进行学习
通过对模型参数进行分解和隔离，以降低监督学习和无监督学习过程之间的相关影响并减少通讯开销

3.2 数据利用方式

FedMatch算法将带标签和无标签数据的模型训练分解为两个过程。对于带标签数据的训练，算法采用一般的监督学习模式，利用交叉熵损失函数来指导模型的优化。而对于无标签数据，FedMatch算法采用了一种称为一致性正则化的方法来对其进行训练。

3.2.1 一致性正则化

一致性正则化(Consistency Regularization)是一种目前比较流行的半监督学习算法，其主要是在半监督学习的配置下，从大量的无标签数据中学习到所需的相关知识。一致性正则化的核心思想其实非常简单：对于模型的一个输入，即使其受到了微小的干扰，模型对其的预测结果应该是一致的[2]。举一个简单的例子，对于一张受到较小强度噪声干扰的小狗图片，其分类模型的输出应该还是小狗而不会是一只小猫。当然所受到的干扰是在一定程度范围内的，如果干扰过大，即使是人也不一定能够将其分类正确。
一致性正则化的一种通常思路是预测器对于一个原始样例和一个其通过数据增强手段处理过的版本样例，其输出结果应该尽可能保持一致(一致性思想)。其数学表达式如下所示：
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VsohaIXG-1606828583729)(https://cdn.nlark.com/yuque/latex/e7475e8b7d5b248974e1309db2b3a647.svg#card=math&code=%5Cleft%5C%7Cp%7B%5Ctheta%7D%28%5Cmathbf%7By%7D%20%5Cmid%20%5Cpi%28%5Cmathbf%7Bu%7D%29%29-p%7B%5Ctheta%7D%5Cleft%28%5Cmathbf%7By%7D%20%5Cmid%20%5Cpi%5E%7B%5Cprime%7D%28%5Cmathbf%7Bu%7D%29%5Cright%29%5Cright%5C%7C_%7B2%7D%5E%7B2%7D&height=26&width=226)]
其中，函数[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tkJBL4K9-1606828583731)(https://cdn.nlark.com/yuque/_latex/fb93b3b9eff5d48c0b643a76cf1cc721.svg#card=math&code=p%7B%5Ctheta%7D%28y%20%5Cmid%20x%29&height=20&width=61)]可以理解为预测[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oZmMl5Gk-1606828583732)(https://cdn.nlark.com/yuque/__latex/9dd4e461268c8034f5c8564e155c67a6.svg#card=math&code=x&height=12&width=9)]为[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VbfYB7Sf-1606828583735)(https://cdn.nlark.com/yuque/__latex/415290769594460e2e485922904f345d.svg#card=math&code=y&height=14&width=8)]的概率函数。而在使用softmax函数的分类器中，该概率函数其实就是softmax的输出，即符合上述一致性思想，模型对于原始样本和增强样本的输出应该尽可能一致。此处的输出不仅仅指样本对应类别的值需要一致，对分类为其他类别的值也是需要尽可能一致的(读者可以细细评味)。论文中的FedMatch算法主要设计了两种一致性正则化算法来指导模型的训练。

3.2.1.1 Inter-client Consistency Loss

首先，FedMatch针对FSSL配置下的无标签数据设计了一种称为inter-client consistency的一致性正则化损失函数。其对应的公式如下所示：
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AyLoqbpq-1606828583736)(https://cdn.nlark.com/yuque/latex/6b0f52da03331545ddcd92f8db96568c.svg#card=math&code=%5Csum%7Bj%3D1%7D%5E%7BH%7D%20%5Cmathrm%7BKL%7D%20%5B%7Bp%7B%5Ctheta%5E%7B%5Cmathrm%7Bh%7D%20j%7D%7D%5E%7B%2A%7D%28%5Cmathbf%7By%7D%20%5Cmid%20%5Cmathbf%7Bu%7D%29%7D%20%5C%7C%20p_%7B%5Ctheta%5E%7B%5Cprime%7D%7D%28%5Cmathbf%7By%7D%20%5Cmid%20%5Cmathbf%7Bu%7D%29%5D&height=55&width=210)]
其中[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CW7uoKW4-1606828583738)(https://cdn.nlark.com/yuque/_latex/208ac9c91fa25236570bae6c80ddbdd5.svg#card=math&code=p%7B%5Ctheta%5E%7B%5Cprime%7D%7D%28%5Cmathbf%7By%7D%20%5Cmid%20%5Cmathbf%7Bu%7D%29&height=20&width=68)]是指本地模型对应于输入[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lrfxz361-1606828583740)(https://cdn.nlark.com/yuque/__latex/7b774effe4a349c6dd82ad4f4f21d34c.svg#card=math&code=u&height=12&width=9)]的输出，[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WHrTDzyB-1606828583741)(https://cdn.nlark.com/yuque/_latex/166bc7478a6dac661d3407333c4ed375.svg#card=math&code=%7Bp%7B%5Ctheta%5E%7B%5Cmathrm%7Bh%7D%20j%7D%7D%5E%7B%2A%7D%28%5Cmathbf%7By%7D%20%5Cmid%20%5Cmathbf%7Bu%7D%29%7D&height=25&width=74)]是helper agent模型对于输入[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GqsmeZ5W-1606828583742)(https://cdn.nlark.com/yuque/__latex/7b774effe4a349c6dd82ad4f4f21d34c.svg#card=math&code=u&height=12&width=9)]的输出，[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rDOL56Rt-1606828583744)(https://cdn.nlark.com/yuque/__latex/59e8d8f731aafcde2d6fc26173e7a810.svg#card=math&code=%5Cmathrm%7BKL%7D&height=16&width=23)]表示KL散度，又称相对熵，是一种量化概率分布[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nlnLxDtR-1606828583746)(https://cdn.nlark.com/yuque/__latex/44c29edb103a2872f519ad0c9a0fdaaa.svg#card=math&code=P&height=16&width=12)]和[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OtKzm5c2-1606828583748)(https://cdn.nlark.com/yuque/__latex/f09564c9ca56850d4cd6b3319e541aee.svg#card=math&code=Q&height=18&width=13)]之间差异的一种方法[3]。Helper agent是由服务器根据自定义可靠性从各个客户端模型中所选出的一批共识模型，共[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HJyFHrhT-1606828583748)(https://cdn.nlark.com/yuque/__latex/c1d9f50f86825a1a2302ec2449c17196.svg#card=math&code=H&height=16&width=15)]个。这里的可靠性定义博客将在"模型聚合方式"处进行详细地讲解。

请注意：本文中所出现的上标’*'一律表示该模型参数[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-M4stIMeG-1606828583750)(https://cdn.nlark.com/yuque/__latex/2554a2bb846cffd697389e5dc8912759.svg#card=math&code=%5Ctheta&height=16&width=8)]不会因为此处输出的计算而进行反向传播，除非有特殊的说明。

我们可以将helper agent模型的输出看作是一种标签(在知识蒸馏中，softmax的输出其实就是相对于one-hot硬标签的一种软标签)，那么上述公式就可以理解为本地模型的预测结果与各个共识模型提供的标签之间的差异应该尽可能的小，即上文所提到的一致性正则化思想。由此，我们即可从无标签数据中学习到各个样本中所包含的有效信息。

3.2.1.2 Data-level Consistency Regularization

除了设计Inter-client consistency loss以外，FedMatch算法还为每个客户端的无标签数据添加了数据级别的一致性正则化损失函数。结合Inter-client consistency损失函数，对于无标签数据，模型提供了如下形式的损失函数来指导模型进行训练：
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-366WsUIC-1606828583751)(https://cdn.nlark.com/yuque/latex/13881dae4c4aba4871d628c72de8d592.svg#card=math&code=%5CPhi%28%5Ccdot%29%3D%7B%5Coperatorname%7BCE%7D%5Cleft%28%5Chat%7B%5Cmathbf%7By%7D%7D%20%5C%7C%20p%7B%5Ctheta%5E%7B%5Cprime%7D%7D%28%5Cmathbf%7By%7D%20%5Cmid%20%5Cpi%28%5Cmathbf%7Bu%7D%29%29%5Cright%29%7D%2B%5Csum%7Bj%3D1%7D%5E%7BH%7D%20%5Cmathrm%7BKL%7D%5Cleft%5Bp_%7B%5Ctheta%5E%7B%5Cmathrm%7Bh%7D%20j%7D%7D%5E%7B%2A%7D%28%5Cmathbf%7By%7D%20%5Cmid%20%5Cmathbf%7Bu%7D%29%20%5C%7C%20p_%7B%5Ctheta%5E%7B%5Cprime%7D%7D%28%5Cmathbf%7By%7D%20%5Cmid%20%5Cmathbf%7Bu%7D%29%5Cright%5D&height=55&width=438)]
其中，[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2E0DMUzp-1606828583752)(https://cdn.nlark.com/yuque/__latex/7a86131338bf955e0a56311f264aa6aa.svg#card=math&code=CE&height=16&width=25)]函数部分即为data-level的一致性正则化损失函数，[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8mat3ZR6-1606828583754)(https://cdn.nlark.com/yuque/__latex/7a86131338bf955e0a56311f264aa6aa.svg#card=math&code=CE&height=16&width=25)]就是交叉熵函数。其中标签[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PjWcZ7jx-1606828583754)(https://cdn.nlark.com/yuque/latex/69929ca69568753d5da3eb7c1c887eaa.svg#card=math&code=%5Chat%7B%5Cmathbf%7By%7D%7D&height=19&width=10)]的计算公式如下所示：
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QkHrubOU-1606828583755)(https://cdn.nlark.com/yuque/latex/a92cb1701df4ded3d92fafbb3fe7dc0d.svg#card=math&code=%5Chat%7B%5Cmathbf%7By%7D%7D%3D%5Coperatorname%7BMax%7D%5Cleft%28%5Cmathbb%7B1%7D%5Cleft%28p%7B%5Ctheta%5E%7B%5Cprime%7D%7D%5E%7B%2A%7D%28%5Cmathbf%7By%7D%20%5Cmid%20%5Cmathbf%7Bu%7D%29%5Cright%29%2B%5Csum%7Bj%3D1%7D%5E%7BH%7D%20%5Cmathbb%7B1%7D%5Cleft%28p%7B%5Ctheta%5E%7Bh%7Bj%7D%7D%7D%5E%7B%2A%7D%28%5Cmathbf%7By%7D%20%5Cmid%20%5Cmathbf%7Bu%7D%29%5Cright%29%5Cright%29&height=55&width=345)]
此处，[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zjyZgTl2-1606828583756)(https://cdn.nlark.com/yuque/__latex/8f5d955f41047432de23a16265207de5.svg#card=math&code=%5Cmathbb%7B1%7D%5Cleft%28x%5Cright%29&height=20&width=33)]函数指one-hot化，即将模型输出中最大值对应位置(模型认为输入属于该类别)置为1，其他位置的数值置为0；[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-P5IGck3e-1606828583757)(https://cdn.nlark.com/yuque/__latex/4b6f813759297b29e551239049f4af0d.svg#card=math&code=%5Coperatorname%7BMax%7D%5Cleft%28%5Cright%29&height=20&width=45)]函数的作用是中输出向量中取出最大值所对应的位置，即为输出的标签。这里，最终输出的标签值有两部分决定，一部分是本地模型对于输入的输出，另一部分是helper agent模型对于指定输入的输出。

有趣的是，最终标签的输出其实是基于一种投票思想产生的：对于每一个[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gQ7r6Vz2-1606828583758)(https://cdn.nlark.com/yuque/__latex/8f5d955f41047432de23a16265207de5.svg#card=math&code=%5Cmathbb%7B1%7D%5Cleft%28x%5Cright%29&height=20&width=33)]函数，其本质上就是模型在自己认为该输入应该归属的输出的位置上投了一票。最后利用[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rkaB6Typ-1606828583758)(https://cdn.nlark.com/yuque/__latex/4b6f813759297b29e551239049f4af0d.svg#card=math&code=%5Coperatorname%7BMax%7D%5Cleft%28%5Cright%29&height=20&width=45)]函数选取投票最高的位置，即可认做该输入所属的类别/标签。其实这就体现出了一种共识机制。

由此，对于无标签数据，一致性正则化方法设计完毕。

3.2.2 参数分解

论文的作者通过实现发现，如果在同一个模型参数上分别进行标签数据和无标签数据的训练(即共享模型参数)，无标签训练过程可能会导致模型忘记从带标签数据中学习到的知识。因此，FedMatch算法考虑将模型的参数分解为监督学习和无监督学习两个部分，通过两个部分参数的独立更新来缓解模型遗忘现象。
我们假设模型的参数[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-N9F1PLvT-1606828583760)(https://cdn.nlark.com/yuque/__latex/2554a2bb846cffd697389e5dc8912759.svg#card=math&code=%5Ctheta&height=16&width=8)]被分解为监督学习参数[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2FA63kbl-1606828583762)(https://cdn.nlark.com/yuque/__latex/a2ab7d71a0f07f388ff823293c147d21.svg#card=math&code=%5Csigma&height=12&width=9)]和无监督学习参数[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xrNJMzvu-1606828583762)(https://cdn.nlark.com/yuque/latex/a11bd56a0ff5973a5604bb3fc9142b1d.svg#card=math&code=%5Cpsi&height=18&width=11)]。在执行标签数据的监督学习过程时，算法将无监督参数[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xP9WZin3-1606828583763)(https://cdn.nlark.com/yuque/latex/a11bd56a0ff5973a5604bb3fc9142b1d.svg#card=math&code=%5Cpsi&height=18&width=11)]冷冻(即不执行反向传播)，然后利用交叉熵损失函数指导模型进行训练，其对应的训练目标如下所示，其中[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FN3Plh6k-1606828583763)(https://cdn.nlark.com/yuque/latex/4f08e3dba63dc6d40b22952c7a9dac6d.svg#card=math&code=%5Cpi&height=12&width=9)]表示数据增强方法。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-DxluNHVz-1606828583764)(https://cdn.nlark.com/yuque/latex/026954fdaf53f172b94c2cb320030d01.svg#card=math&code=%5Ctext%20%7B%20minimize%20%7D%7B%5Cmathcal%7BL%7D%7D%7Bs%7D%28%5Csigma%29%3D%5Clambda%7Bs%7D%20%5Cmathrm%7BCE%7D%5Cleft%28%5Cmathbf%7By%7D%2C%20p%7B%5Csigma%2B%5Cpsi%5E%7B%2A%7D%7D%28%5Cmathbf%7By%7D%20%5Cmid%20%5Ctilde%7B%5Cpi%7D%28%5Cmathbf%7Bx%7D%29%29%5Cright%29&height=23&width=325)]
无标签数据的无监督算法过程同理可得，算法需要对监督学习参数[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fll6LcDe-1606828583766)(https://cdn.nlark.com/yuque/latex/a2ab7d71a0f07f388ff823293c147d21.svg#card=math&code=%5Csigma&height=12&width=9)]进行冷冻，然后依据上一小节的一致性正则化损失函数来指导模型进行训练，其对应的训练目标表达式如下所示：
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-cwWrnFnV-1606828583766)(https://cdn.nlark.com/yuque/latex/674dcd2407d9be6eea06a446c9d737ae.svg#card=math&code=%5Coperatorname%7Bminimize%7D%20%5Cmathcal%7BL%7D%7Bu%7D%28%5Cpsi%29%3D%5Clambda%7Bu%7D%20%5CPhi%7B%5Csigma%5E%7B%2A%7D%2B%5Cpsi%7D%28%5Ccdot%29%2B%5Clambda%7BL%7B2%7D%7D%5Cleft%5C%7C%5Csigma%5E%7B%2A%7D-%5Cpsi%5Cright%5C%7C%7B2%7D%5E%7B2%7D%20%2B%5Clambda%7BL%7B1%7D%7D%5C%7C%5Cpsi%5C%7C%7B1%7D&height=25&width=416)]
在上述公式中，FedMatch算法还为其添加了[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pV8grUSh-1606828583767)(https://cdn.nlark.com/yuque/__latex/2c6f3b6c16df97a1b00e04ff17e4906e.svg#card=math&code=L_1&height=18&width=19)]和[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dUUYDaLs-1606828583768)(https://cdn.nlark.com/yuque/__latex/07cbd6c155424e110559a84df364be5a.svg#card=math&code=L_2&height=18&width=19)]正则项。其中[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nKSuD1b5-1606828583769)(https://cdn.nlark.com/yuque/__latex/07cbd6c155424e110559a84df364be5a.svg#card=math&code=L_2&height=18&width=19)]正则项的作用是为了尽可能保留从监督学习参数[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-H1xYSdN8-1606828583770)(https://cdn.nlark.com/yuque/__latex/a2ab7d71a0f07f388ff823293c147d21.svg#card=math&code=%5Csigma&height=12&width=9)]中所学习到的知识(该部分利用[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YcwNHwX7-1606828583770)(https://cdn.nlark.com/yuque/__latex/07cbd6c155424e110559a84df364be5a.svg#card=math&code=L_2&height=18&width=19)]范式尽可能使得参数[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xTuVZ8H7-1606828583772)(https://cdn.nlark.com/yuque/__latex/a2ab7d71a0f07f388ff823293c147d21.svg#card=math&code=%5Csigma&height=12&width=9)]和[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LeEnA9uO-1606828583773)(https://cdn.nlark.com/yuque/__latex/a11bd56a0ff5973a5604bb3fc9142b1d.svg#card=math&code=%5Cpsi&height=18&width=11)]差距越小)；[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-d6x7PE2g-1606828583773)(https://cdn.nlark.com/yuque/__latex/2c6f3b6c16df97a1b00e04ff17e4906e.svg#card=math&code=L_1&height=18&width=19)]正则项的作用则是使无监督参数集合[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SP5igPDy-1606828583774)(https://cdn.nlark.com/yuque/__latex/a11bd56a0ff5973a5604bb3fc9142b1d.svg#card=math&code=%5Cpsi&height=18&width=11)]尽可能包含0的项，以提高联邦学习的通讯效率(为0的参数可以不往服务器端传播)。
论文其实并未对模型参数的分解过程进行具体介绍，以下是我个人认为的一种符合其要求的参数分解方案，以供大家探讨。对于模型参数的分解，FedMatch算法应该是将神经网络模型中的每一个参数分解成为两个不同参数的和，即每个参数都分解为监督参数部分加无监督参数部分。如此操作，就可以保证监督学习和无监督学习参数在模型的每一个位置都起到相应的作用。

3.3 模型聚合方式

传统的联邦学习算法一般采用FedAvg模型所设计的聚合方法来对模型进行聚合。FedAvg所采用的模型聚合方式就是按照各个客户端所具备的数据量占总训练数据量的比例来对各个参与聚合的本地模型进行加权平均。基于此，FedMatch算法设计了一种考虑本地模型可靠性的聚合方法来对各个本地模型进行聚合。此处的可靠性指的是模型从数据中所学到知识对于解决相关任务的可靠性程度。FedMatch算法的可靠性计算公式如下所示：
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SWROW6Be-1606828583775)(https://cdn.nlark.com/yuque/latex/0fcd67d008743bdbca685827682d72fb.svg#card=math&code=%5CGamma%5Cleft%28%5Ctheta%5E%7Bl%7B1%3A%20A%7D%7D%5Cright%29%3D%5Cfrac%7B%5Coperatorname%7BAcc%7D%5E%7Bl%7Ba%7D%7D%7D%7B%5Coperatorname%7BTotalAcc%7D%5E%7Bl_%7B1%3A%20A%7D%7D%7D%20%5Csum_%7Ba%3D1%7D%5E%7BA%7D%20%5Ctheta%5E%7Bl_%7Ba%7D%7D&height=53&width=224)]
其中，[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VCkISpC2-1606828583777)(https://cdn.nlark.com/yuque/_latex/ab837008d340404fc44a18c985531a4d.svg#card=math&code=%5Coperatorname%7BAcc%7D%5E%7Bl%7Ba%7D%7D&height=20&width=39)]表示编号为[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xZNVjyh7-1606828583778)(https://cdn.nlark.com/yuque/__latex/0cc175b9c0f1b6a831c399e269772661.svg#card=math&code=a&height=12&width=8)]的客户端模型在服务器验证数据集上的分类准确度，[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pbj9JBKK-1606828583779)(https://cdn.nlark.com/yuque/_latex/e6067920276b16f5787c47414b2b0072.svg#card=math&code=l%7B1%3A%20A%7D&height=18&width=24)]表示从编号1开始到编号为[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZZIYp88k-1606828583779)(https://cdn.nlark.com/yuque/__latex/7fc56270e7a70fa81a5935b72eacbe29.svg#card=math&code=A&height=16&width=12)]的所有模型的集合。由上式可以看出，该聚合方法其实就是基于模型在公共验证集上的分类准确度来对各个模型进行加权聚合。
除此之外，在服务器端的模型可靠性计算也为之前所讲解的一致性正则化损失函数提供了helper agent的选择机制，即helper agent是每轮各个本地模型的集合中可靠性最大的[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YfqHtrak-1606828583781)(https://cdn.nlark.com/yuque/__latex/c1d9f50f86825a1a2302ec2449c17196.svg#card=math&code=H&height=16&width=15)]个模型的集合。此处的可靠性衡量其实就是一种各个客户端间所达成的共识机制。

3.4 算法运行流程

综上，FedMatch算法的核心内容已讲解完毕。但对于两种不同的联邦半监督应用场景，FedMatch实际的运行流程还是有些细差别的。两种应用场景的FedMatch运行流程示意图如图2所示：
![2.png](https://img-blog.csdnimg.cn/img_convert/dae344048a7ba1051fac4cb05cb73258.png#align=left&display=inline&height=301&margin=[object Object]&name=2.png&originHeight=301&originWidth=1064&size=189861&status=done&style=shadow&width=1064)
图2 FedMatch在两种应用场景下的运行流程
对于标准场景，因为数据全都放置在客户端本地，因此，对于每一轮的模型训练，监督学习参数和无监督学习参数的更新都可以在本地完成。当参数更新完成后，各个客户端将会把模型的参数传送值服务器端。服务器使用模型聚合方法对各个本地模型进行聚合，并选取指定数目的helper agent。若聚合的模型性能仍为达到预期，服务器将会把聚合模型和helper agent再次传送给各个客户端。如上操作反复训练和聚合模型，直至模型的分类性能达到预期。
对于不相交场景，由于其标签数据和无标签数据被分别放置在服务器端和各个客户端，因此，监督学习和无监督学习过程也将被分开执行。服务器端将在带标签数据上训练好的模型和helper agent投入各个本地客户端中进行无监督学习的训练。模型在本地训练完毕后，客户端将会把模型权重重新传送至服务器端。服务器端对各个本地模型采用聚合方法进行聚合，并选出指定数目的helper agent。上述过程被反复操作，直至聚合模型的分类性能达到预期的值。

4 总结

从目前已经发表的论文来看，联邦半监督学习的研究仍然处于起步阶段。现有的论文基本上都是从直接应用的角度研究联邦半监督学习，而对于相关理论的研究却是十分欠缺的。个人仍为，联邦半监督学习的应用场景是非常广泛的，因此，对其进行更深一步地研究确实是有很重要的现实意义的。除了理论方向，我认为还可以从如何更有效地利用无标签数据和改进聚合算法的角度来开展联邦半监督学习的研究工作。总之，联邦半监督学习的研究仍需大量科研人员为之不断努力奋斗。

参考文献

[1] Jeong W, Yoon J, Yang E, et al. Federated semi-supervised learning with inter-client consistency[J]. arXiv preprint arXiv:2006.12097, 2020.
[2] 半监督深度学习又小结之Consistency Regularization, 糯米稻谷. https://zhuanlan.zhihu.com/p/46893709
[3] KL散度的含义与性质, 麒麟437. [https://blog.csdn.net/qq_40406773/article/details/80630280

你可能感兴趣的:(图像识别,机器学习,人工智能,自然语言处理,神经网络,数据挖掘,机器学习)

开源模型应用落地-让AI更懂你的每一次交互-Mem0集成Qdrant、Neo4j与Streamlit的创新实践（四）开源技术探险家开源模型-实际应用落地 neo4j 开源人工智能语言模型
一、前言在人工智能迅速发展的今天，如何让AI系统更懂“你”？答案或许藏在个性化的记忆管理之中。Mem0作为一个开源的记忆管理系统，正致力于为AI赋予长期记忆与个性化服务能力。通过结合高性能向量数据库Qdrant、图数据库Neo4j的强大关系分析能力以及Streamlit的高效可视化交互，我们可以打造出一个既能存储用户历史行为、又能实时推理并展示结果的智能记忆助手。本文将带您一步步探索这一技术组合的
【优秀文章】7月优秀文章推荐
优秀文章智能自主运动体与人工智能技术——环境感知、SLAM定位、路径规划、运动控制、多智能体协同作者：fpga和matlabC++之红黑树认识与实现作者：zzh_zao【手把手带你刷好题】–C语言基础编程题(十)作者：草莓熊Lotso飞算JavaAI：从“码农”到“代码指挥官”的终极进化论作者：可涵不会debug前端网页开发学习（HTML+CSS+JS）有这一篇就够！作者：一颗小谷粒
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
自然语言处理-基于预训练模型的方法-笔记
自然语言处理-基于预训练模型的方法-笔记【下载地址】自然语言处理-基于预训练模型的方法-笔记《自然语言处理-基于预训练模型的方法》由哈尔滨工业大学出版，深入探讨了NLP领域的前沿技术与预训练模型的应用。本书系统介绍了预训练模型的基本概念、发展历程及常见模型的原理，并通过丰富的实践案例与代码实现，帮助读者掌握这些技术在自然语言处理任务中的实际应用。无论是初学者、研发人员，还是希望提升NLP能力的研究
【计算机毕业设计】基于Springboot的办公用品管理系统+LW 枫叶学长(专业接毕设) Java毕业设计实战案例课程设计 spring boot 后端
博主介绍：✌全网粉丝3W+,csdn特邀作者、CSDN新星计划导师、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：
MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式 csdn_tom_168 NoSQL 数据库 mongodb 人工智能 AI
MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
HarmonyOS5.0仓颉引擎与盘古大模型：个性化作业批改系统架构设计与实现 H老师带你学鸿蒙系统架构 HarmonyOS5.0 鸿蒙华为仓颉教育
人工智能与边缘计算的融合正在重塑教育评价体系。本文将展示如何基于HarmonyOS5.0仓颉并发引擎和盘古大模型，构建新一代智能作业批改系统。系统架构全景graphTDA[学生端设备]-->|提交作业|B[仓颉边缘处理]B-->C[盘古大模型分析]C-->D[个性化反馈生成]D-->E[学生终端]D-->F[教师仪表盘]subgraphHarmonyOS分布式系统B-->|设备协同|G[教室平板集
DeepSeek在智能教育评估中的应用：试题检索 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 easyui 前端 javascript ai
DeepSeek在智能教育评估中的应用：试题检索关键词：DeepSeek、智能教育、试题检索、自然语言处理、知识图谱、个性化学习、评估系统摘要：本文探讨了DeepSeek大模型在智能教育评估系统中的试题检索应用。我们将深入分析如何利用先进的自然语言处理技术和知识图谱构建高效的试题检索系统，实现个性化学习路径推荐和精准评估。文章将从核心概念、技术原理到实际应用场景，全面解析这一创新教育技术解决方案。
反向传播神经网络极简入门自信哥
单个神经元神经网络是多个“神经元”（感知机）的带权级联，神经网络算法可以提供非线性的复杂模型，它有两个参数：权值矩阵{Wl}和偏置向量{bl}，不同于感知机的单一向量形式，{Wl}是复数个矩阵，{bl}是复数个向量，其中的元素分别属于单个层，而每个层的组成单元，就是神经元。神经元神经网络是由多个“神经元”（感知机）组成的，每个神经元图示如下：这其实就是一个单层感知机，其输入是由和+1组成的向量，其
1.线性神经网络--线性回归温柔济沧海深度学习神经网络线性回归 python
1.1从零实现线性回归importrandomimporttorch#fromd2limporttorchasd2limportmatplotlib.pyplotaspltdeftrain_data_make(batch_size,X,y):num_examples=len(X)idx=list(range(num_examples))#生成0-999random.shuffle(idx)#样本需
阿里云瑶池数据库 Data Agent for Meta 正式发布，让 AI 更懂你的业务！数据库观点资讯人工智能
背景随着生成式人工智能（GenerativeAI）从概念验证迈向规模化商业落地，AIAgent已成为企业核心业务流程的重要组成部分。然而，当模型调用日益便捷时，核心痛点已不再是模型本身，而是集中在一个关键要素上：数据。AIAgent的落地瓶颈已从技术能力转向高质量、高相关性、安全合规的数据供给。企业面临的核心挑战在于：数据孤岛导致知识库分散，通用大模型难以理解专业业务传统数据管理依赖人工开发维护，
【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
跨平台ZeroMQ：在Rust中使用zmq库的完整指南涵树_fx 架构设计 Rust 实战 rust 开发语言后端
“消息就像神经元间的电信号，而ZeroMQ就是那个让系统思考的神经网络”——某个深夜调试zmq的程序员当你需要轻量级、高性能的进程间通信时，ZeroMQ就像代码世界里的瑞士军刀。今天我们一起探索如何在Rust生态中使用这把利器，感受它如何在不同操作系统间架起通信的桥梁。安装ZeroMQ：三大操作系统的通关秘籍Linux(Debian/Ubuntu)sudoaptupdatesudoaptinsta
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
使用 C++ 实现 MFCC 特征提取与说话人识别系统 whoarethenext c++开发语言 mfcc 语音识别
使用C++实现MFCC特征提取与说话人识别系统在音频处理和人工智能领域，C++凭借其卓越的性能和对硬件的底层控制能力，在实时音频分析、嵌入式设备和高性能计算场景中占据着不可或缺的地位。本文将引导你了解如何使用C++库计算核心的音频特征——梅尔频率倒谱系数(MFCCs)，并进一步利用这些特征构建一个说话人识别（声纹识别）系统。Part1:在C/C++中计算MFCCs直接从零开始实现MFCC的所有计算
ImportError: /nvidia/cusparse/lib/libcusparse.so.12: undefined symbol: __nvJitLinkComplete_12_4 爱编程的喵喵 Python基础课程 python ImportError torch nvJitLink 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ImportError:/home/
【力扣（LeetCode）】数据挖掘面试题0013：1264. 页面推荐（泛化后，基于MySQL题解）言析数智数据挖掘常见面试题 leetcode 数据挖掘 mysql 笔试笔试题
文章大纲一、题目要求：二、模拟数据构建三、题解参考方案朋友关系列表：Friendship+---------------+---------+|ColumnName|Type|+---------------+---------+|user1_id|int||user2_id|int|+---------------+---------+(user1_id,user2_id)是这张表具有唯一值的列
【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
【机器学习笔记Ⅰ】13 正则化代价函数
正则化代价函数（RegularizedCostFunction）详解正则化代价函数是机器学习中用于防止模型过拟合的核心技术，通过在原始代价函数中添加惩罚项，约束模型参数的大小，从而提高泛化能力。以下是系统化的解析：1.为什么需要正则化？过拟合问题：当模型过于复杂（如高阶多项式回归、深度神经网络）时，可能完美拟合训练数据但泛化性能差。解决方案：在代价函数中增加对参数的惩罚，抑制不重要的特征权重。2.
【机器学习笔记Ⅰ】6 多类特征巴伦是只猫机器学习机器学习笔记人工智能
多类特征（Multi-classFeatures）详解多类特征是指一个特征（变量）可以取多个离散的类别值，且这些类别之间没有内在的顺序关系。这类特征是机器学习中常见的数据类型，尤其在分类和回归问题中需要特殊处理。1.核心概念(1)什么是多类特征？定义：特征是离散的、有限的类别，且类别之间无大小或顺序关系。示例：颜色：红、绿、蓝（无顺序）。城市：北京、上海、广州（无数学意义的大小关系）。动物类别：猫
图像分割技术详解：从原理到实践 lanjieying
本文还有配套的精品资源，点击获取简介：图像分割是图像处理领域将图像分解为多个区域的过程，用于图像分析、特征提取等。文章介绍了图像分割的原理，并通过一个将图像划分为2*4子块的示例，展示了如何使用Python和matplotlib库中的tight_subplot函数进行图像分割和展示。文章还探讨了图像分割在不同领域的应用，以及如何在机器学习项目中作为数据预处理步骤。1.图像分割基本概念在图像处理领域
机器学习笔记——支持向量机 star_and_sun 机器学习笔记支持向量机
支持向量机参数模型对分布需要假设（这也是与非参数模型的区别之一）间隔最大化，形式转化为凸二次规划问题最大化间隔间隔最大化是意思：对训练集有着充分大的确信度来分类训练数据，最难以分的点也有足够大的信度将其分开间隔最大化的分离超平面的的求解怎么求呢？最终的方法如下1.线性可分的支持向量机的优化目标其实就是找得到分离的的超平面求得参数w和b的值就可以了注意，最大间隔分离超平面是唯一的，间隔叫硬间隔1.1
【机器学习&深度学习】多分类评估策略一叶千舟深度学习【理论】深度学习【应用必备常识】大数据人工智能
目录前言一、多分类3大策略✅宏平均（MacroAverage）✅加权平均（WeightedAverage）✅微平均（MicroAverage）二、类比理解2.1宏平均（MacroAverage）2.1.1计算方式2.1.2适合场景2.1.3宏平均不适用的场景2.1.4宏平均一般用在哪些指标上？2.1.5怎么看macroavg指标？2.1.6宏平均值低说明了什么？2.1.7从宏平均指标中定位模型短板
网络安全相关专业总结（非常详细）零基础入门到精通，收藏这一篇就够了网络安全工程师教学兼职副业黑客技术网络安全 web安全安全人工智能网络运维
一、网络工程专业专业内涵网络工程是指按计划进行的以工程化的思想、方式、方法，设计、研发和解决网络系统问题的工程，一般指计算机网络系统的开发与构建。该专业培养具备计算机科学与技术学科理论基础，掌握网络技术领域专业知识和基本技能，在计算机、网络及人工智能领域的工程实践和应用方面受到良好训练，具有深厚通信背景、可持续发展、能力较强的高水平工程技术人才。学生可在计算机软硬件系统、互联网、移动互联网及新一代
【机器学习笔记Ⅰ】7 向量化巴伦是只猫机器学习机器学习笔记人工智能
向量化（Vectorization）详解向量化是将数据或操作转换为向量（或矩阵）形式，并利用并行计算高效处理的技术。它是机器学习和数值计算中的核心优化手段，能显著提升代码运行效率（尤其在Python中避免显式循环）。1.为什么需要向量化？(1)传统循环的缺陷低效：Python的for循环逐元素操作，速度慢。代码冗长：需手动处理每个元素。示例：计算两个数组的点积（非向量化）a=[1,2,3]b=[4
大语言模型应用指南：ReAct 框架 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
大语言模型应用指南：ReAct框架关键词：大语言模型,ReAct框架,自然语言处理(NLP),模型融合,多模态学习,深度学习,深度学习框架1.背景介绍1.1问题由来近年来，深度学习技术在自然语言处理(NLP)领域取得了显著进展。尤其是大语言模型(LargeLanguageModels,LLMs)，如BERT、GPT系列等，通过在大规模无标签数据上进行预训练，获得了强大的语言理解和生成能力。然而，预
PyTorch 的 torch.nn 模块学习
torch.nn是PyTorch中专门用于构建和训练神经网络的模块。它的整体架构分为几个主要部分，每部分的原理、要点和使用场景如下：1.nn.Module原理和要点：nn.Module是所有神经网络组件的基类。任何神经网络模型都应该继承nn.Module，并实现其forward方法。使用场景：用于定义和管理神经网络模型，包括层、损失函数和自定义的前向传播逻辑。主要API和使用场景：__init__
大语言模型原理基础与前沿基于语言反馈进行微调 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿基于语言反馈进行微调作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，自然语言处理（NLP）领域取得了显著的进展。大语言模型（LargeLanguageModels，LLMs）如GPT-3、BERT等在各项NLP任务上取得了令人瞩目的成绩。然而，如何进一步提高大语言模型的理
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod