unseven

【论文】通过基准分析优化联邦人员重新识别的性能

论文链接

摘要
1. 绪论
- 2. 相关工作
- - 2.1 人员重新识别
  - 2.2 联邦学习
- 3. 联邦个人REID基准
- - 3.1 数据集
  - 3.2 联合方案
  - 3.3 模型结构
  - 3.4 联邦学习算法
  - 3.5 性能指标
  - 3.6 参考实现
  - 4.1 通过相机联合方案
  - 4.2 按数据集联合方案
- 5. 性能优化
- - 5.1 知识蒸馏
  - 5.2 权重调整
  - 5.3 知识蒸馏和体重调整
- 6. 总结
代码
个人总结
- 1. 人员再识别任务是什么
- 2. 文本的目的是什么
- 3. 文本基准分析是什么
- 4. 文中的知识蒸馏是如何使用的
- 5. 文中的动态权重调整是如何实现的
- 6. 相机联合方案是什么
- 7. FedAvg算法是什么
- 8. FedPav算法是什么
- 9. 算法性能评估如何实现

摘要

联邦学习是一种保护隐私的机器学习技术，可在分散的客户端之间学习共享模型。它可以减轻个人重新识别的隐私问题，这是一项重要的计算机视觉任务。在这项工作中，我们实现了联邦学习到人重新识别（FedReID），并优化了其在现实世界场景中受统计异质性影响的性能。我们首先构建一个新的基准来调查FedReID的性能。该基准测试由（1）九个数据集组成，这些数据集具有来自不同领域的不同卷，用于模拟现实中的异构情况，（2）两个联合场景，以及（3） FedReID 的增强联合算法。基准分析表明，以数据集联合场景为代表的 客户端-边-云 架构比FedReID中的客户端-服务器架构具有更好的性能。这也揭示了FedReID在现实场景下的瓶颈，包括模型聚合权重不平衡导致大型数据集性能不佳以及收敛性挑战。然后我们提出了两种优化方法：（1）针对权重不平衡问题，我们提出了一种新的方法，根据每个训练轮次中客户端的模型变化尺度动态改变权重;（2）为了促进收敛，我们采用知识蒸馏来完善服务器模型，使用公共数据集上的客户端模型生成的知识。实验结果表明，我们的策略可以在所有数据集上实现更好的收敛，并具有卓越的性能。我们相信，我们的工作将激励社区进一步探索在现实场景中在更多计算机视觉任务上实施联邦学习。

关键词：联邦学习，人员重新识别

1. 绪论

个人数据保护意识的提高[4]限制了个人重新识别（ReID）的发展。人员重新识别是一项重要的计算机视觉任务，可匹配图像库中的同一个人[31]。人员ReID的训练依赖于集中海量的个人图像数据，对个人信息施加潜在的隐私风险，甚至导致一些国家的个人ReID研究项目暂停。因此，有必要在隐私保护的前提下驾驭其发展。

联邦学习是一种保护隐私的机器学习框架，可以使用来自摄像头的分散数据来训练一个人员 ReID 模型。由于边缘与服务器共享模型更新而不是训练数据[21]，因此联邦学习可以有效降低潜在的隐私泄露风险。多媒体研究人员和从业者也可以利用这一优势来完成多媒体内容分析任务[3，28]。除了隐私保护之外，联邦学习对于人员ReID （FedReID）的实施还具有其他优势：通过避免海量数据上传来减少通信开销 [21];启用适用于不同场景的整体模型;在边缘获取可以适应局部场景的局部模型。社区视频监控是FedReID的一个很好的用例[7]。不同的社区合作训练一个集中式模型，而不会有视频数据离开社区。尽管联邦学习具有优势，但很少有工作研究其对人员 ReID 的实现。Hao等人[8]只提到了这种实现的可能性。具有非独立同分布（非IID）和不平衡数据量是FedReID在现实场景中面临的主要挑战之一[12]。Zhao等人[29]表明，非IID数据会显著损害联邦学习的性能，Li等人[13]表示，这导致了收敛的挑战，但很少有工作研究FedReID中的统计异质性。

这项工作旨在通过执行基准分析来优化FedReID的性能。综合实验结果，对新构建基准和所提优化方法的分析证明了其实用性和有效性。据我们所知，这是对个人 ReID 的联合学习的首次实现。我们总结本文的贡献如下：

构建FedReID的新基准，并进行基准分析，以调查其瓶颈和见解。我们的基准测试FedReIDBench具有以下功能：（1）使用9个具有代表性的ReID数据集（如图1所示的样本）来模拟非IID和不平衡数据的真实情况，（2）为人员ReID定义代表性的联合场景，（3）为FedReID提出合适的算法，（4）标准化模型结构和性能评估指标，以及（5）创建参考实现来定义训练过程。基准分析结果为未来对该主题的研究奠定了良好的基线。
我们提出了两种优化性能的方法：知识蒸馏和动态权重调整。知识蒸馏[10]解决了由非IID数据引起的收敛问题。模型聚合中的动态权重调整解决了数据集不平衡导致的性能衰减问题。

我们提出了两种优化性能的方法：知识蒸馏和动态重量调整。知识蒸馏[10]解决了由非IID数据引起的收敛问题。模型聚合中的动态权重调整解决了数据集不平衡导致的性能衰减问题。本文的其余部分组织如下。在第 2 节中，我们回顾了有关人员 ReID 和联邦学习的相关工作。第3节介绍了FedReID的基准。我们分析基准测试结果，并在第 4 节中提供见解。在本节中，本文的其余部分组织如下。在第 2 节中，我们回顾了有关人员 ReID 和联邦学习的相关工作。第3节介绍了FedReID的基准。我们分析基准测试结果，并在第 4 节中提供见解。在第 5 节中，我们提出了提高 FedReID 性能的优化方法。第6节总结了本文，并提供了未来的方向。

2. 相关工作

2.1 人员重新识别

给定查询图像，人员 ReID 系统旨在根据图像的相似性从大型库中检索具有相同标识的图像。它具有广泛的应用，例如视频监控和基于内容的视频检索[31]。与传统的手工特征算子相比，深度神经网络能够更好地提取代表性特征，从而大大提高了ReID的性能[17，19，23，26]。人员 ReID 数据集包含来自不同相机视图的图像。训练人员 ReID 模型需要集中大量这些数据，这会增加潜在的隐私风险，因为这些图像包含个人信息和标识。因此，联邦学习有利于人员 ReID 保护隐私。

2.2 联邦学习

Federated Learning Benchmark Caldas等人在[2]中提出了LEAF，这是一个专注于图像分类和一些自然语言过程任务的基准框架。罗等。AL 在 [20] 中提出了用于对象检测的真实世界图像数据集。这两项工作都采用McMahan等人提出的联邦平均（FedAvg）算法[21]作为基线实现。在这项工作中，我们引入了联邦学习和人员ReID相结合的新基准，我们报告了全面的分析，以揭示问题并为模拟的真实场景提供见解。

联邦学习中的非IID数据 联邦学习面临着非IID数据的挑战[29]，这与分布式深度学习不同，分布式深度学习使用集群中的IID数据通过并行计算训练大规模深度网络[5，22]。Zhao等人[29]建议与客户共享代表全球分布的数据，以提高非IID的性能。Yao等人[27]提出了FedMeta，这是一种使用从自愿客户端获取的元数据在聚合后微调服务器模型的方法。Li等人在[13]中提供了FedProx，这是一种通过添加近端项来限制本地更新更接近全局模型来改善FedAvg收敛性的算法。我们还为ReID任务中的非IID数据导致的问题提供了两种解决方案。受数据共享策略 [29] 和 FedMeta [27] 的启发，其中一个解决方案采用知识蒸馏和额外的未标记数据集来促进融合。

3. 联邦个人REID基准

在本节中，我们将介绍FedReIDBench，这是一个用于对个人ReID实施联邦学习的新基准。它包括 9 个数据集（第 3.1 节）、联合方案选择（第 3.2 节）、模型结构（第 3.3 节）、联合训练算法（第 3.4 节）、性能指标（第 3.5 节）和参考实现（第 3.6 节）。

3.1 数据集

为了模拟FedReID的真实场景，我们选择了9个不同的数据集，其属性如表1所示。这些数据集在图像数量、身份号码、场景（室内或室外）和相机观看次数方面存在显著差异，导致彼此之间存在巨大的域差距[18]。这些方差模拟了现实中的统计异质性。图像量的差异模拟了边缘之间数据点的不平衡，域间隙导致非IID问题。模拟的统计异质性使FedReID场景更具挑战性，更接近现实世界的情况。

3.2 联合方案

我们设计了两种不同的方法，代表了将联邦学习应用于人员 ReID 的两种真实场景（图 2）。

图 2：按相机联合方案与按数据集联合方案。（a）表示由摄像机联合方案：摄像机与服务器协作执行联合学习。（b）表示按数据集联合方案：边缘服务器在执行联合学习之前从多个摄像头收集数据。

相机联合方案表示标准客户端服务器体系结构。每个相机都被定义为一个单独的客户端，直接与服务器通信以执行联邦学习过程。在这种情况下，将图像保留在客户端中可显著降低隐私泄露的风险。然而，这种场景对相机训练深度模型的计算能力提出了很高的要求，这使得实际部署更加困难。现实世界中一个很好的例子是一个社区，它部署了多个摄像头来训练一个人的 ReID 模型。

按数据集联合方案表示客户端-边缘-云体系结构，其中客户端定义为边缘服务器。边缘服务器从多个摄像头构建数据集，然后与中央服务器协作进行联邦学习。实际场景可能是几个社区协作训练 ReID 模型，边缘服务器连接到每个社区中的多个摄像头。

3.3 模型结构

深度人员 ReID 的常见基准是 ID 判别嵌入模型（IDE） [31]。我们使用带有骨干 ResNet-50 [9] 的 IDE 模型作为我们的模型结构来执行联邦学习。但是，并非所有客户端中的模型结构都相同，其标识分类器可能不同。在第 3.2 节中介绍的两个联合方案中，客户端具有不同数量的标识，并且模型中标识分类器的维度取决于标识的数量，因此它们可能具有不同的模型结构。这种差异会影响我们在下一节（第 3.4 节）中讨论的联合算法。

3.4 联邦学习算法

在本节中，我们将介绍联邦学习的关键算法FedAvg，并概述了我们提出的FedReID联合部分平均（FedPav）方法。

联邦平均（FedAvg） [21] 是一种标准的联邦学习算法，包括服务器和客户端上的操作：客户端使用其本地数据集训练模型并将模型更新上传到服务器;服务器负责初始化网络模型，并按加权平均值聚合来自客户端的模型更新。FedAvg 要求服务器和客户端中的模型具有相同的网络体系结构，而如第 3.3 节所述，客户端的身份分类器可能不同。因此，我们为FedReID引入了一种增强的联邦学习算法：联邦部分平均。

联合部分平均（FedPav）支持与具有部分不同模型的客户端进行联合训练。它在整个训练过程中与 FedAvg 类似，只是每个客户端仅将更新模型的一部分发送到服务器。图 3 描述了 FedPav 到 FedReID 的实现过程。客户端中的模型共享相同的主干，从而改变标识分类器，因此客户端仅将主干的模型参数发送到服务器进行聚合。

我们描述训练过程如下：（1）在新一轮训练开始时，服务器从N个客户端中选择K个参与训练，并将全局模型发送给客户端。（2）每个客户端将全局模型与上个训练轮次的身份分类器串联起来以形成新模型。然后，它使用随机梯度下降对本地数据进行 E 次本地时期的训练，批量大小为 B，学习率为 η。（3）每个客户端保留分类器层并上传主干的更新模型参数。（4）服务器聚合这些模型更新，得到一个新的全局模型。我们在算法 1 中总结了 FedPav。

FedPav 旨在获得优于本地训练的模型，本地训练表示在单个数据集上训练的模型。FedPav 为每个客户端输出高质量的全局模型 $w^T$ 和本地模型 $w^T_k$ 。

图3:插图的联合局部平均(FedPav)。全球模型是其支柱产业。每一轮的培训包括以下步骤:(1)服务器向客户发送全局模型。(2)客户使用本地数据训练分类器模型。(3)客户向服务器上传骨干参数。(4)服务器通过加权平均聚合客户端的模型更新，以获取新的全局模型。

在第4.2节中，这些模型将进行评估并与本地培训进行比较。由于ReID评估使用图像作为查询来搜索库中的类似图像，因此我们可以在评估中省略身份分类器。

3.5 性能指标

为了评估FedReID的性能，我们需要衡量算法的准确性和通信成本，因为联邦学习环境限制了通信带宽。

我们使用标准的人物ReID评估指标来评估我们算法的准确性：累积匹配特征（CMC）曲线和平均平均精度（mAP）[31]。 CMC用于对身份查询与所有图库图像的相似性进行排序； Rank-k表示图库中排名前k的图像包含查询身份的概率。我们在排名1、5和10处测量CMC。mAP计算所有查询中平均精度的平均值。

通信成本我们用通信轮数乘以模型大小（上传和下载）的两倍来衡量通信成本。如果模型大小恒定，则较大的通信轮次会导致更高的通信成本。

3.6 参考实现

为了促进可重复性，FedReIDBench提供了一组参考实现，包括FedPav和优化方法。它还包括用于预处理 ReID 数据集的脚本。

4.1 通过相机联合方案

由于现有的 ReID 数据集包含来自多个相机的图像，因此我们考虑将每个相机作为客户端实现联邦学习。我们假设相机有足够的计算能力来训练神经网络模型。业内一些相机已经具备了这样的功能。

我们通过两个数据集来衡量相机联合场景中的性能：包含来自 6 个相机视图的训练数据的 Market-1501 [30] 数据集和包含来自 2 个相机视图的图像的 CUHK03-NP [16] 数据集。我们将Market1501数据集拆分为6个客户端，将CUHK03-NP数据集拆分为2个客户端，每个客户端包含一个摄像头视图的数据。为了与按相机联合方案的性能进行比较，我们通过将数据集拆分为多个客户端来定义按标识联合的方案，每个客户端具有来自不同相机视图的相同数量的标识。数据集联合方案中的客户端数等于相机视图数。例如，我们按身份将 Market-1501 拆分为 6 个客户端，因此每个客户端包含 125 个非重叠身份。我们还在比较中添加了本地训练。我们在同一设置下在相机联合和按身份联合的方案中实现 FedPav，并在表 2 中总结了结果。

表2：市场1501数据集和CUHK03-NP数据集上摄像头联合场景、身份联合场景和本地训练的性能对比。由摄像机联合方案的精度最低。

4.2 按数据集联合方案

在本节中，我们分析了按数据集联合场景的结果，并研究了批量大小 B 的影响、局部纪元 E 的影响、与本地训练的性能比较以及 FedPav 的收敛性。我们对 9 个客户进行了以下所有实验，每个客户在 9 个数据集中的一个上进行训练。在每一轮沟通中，我们选择了所有客户进行聚合

批量大小的影响 批量大小是 FedPav 中的一个重要超参数，它会影响客户端中的计算。在相同数量的本地 epoch 和固定大小的数据集下，较小的批量大小会导致每轮训练中客户端的计算量更高。我们在图 9 中将不同批次大小的性能与设置 E = 1 和总共 300 轮通信进行比较。随着我们通过将批大小从 128 更改为 32 来添加更多计算，大多数数据集的性能都会提高。因此，我们使用B = 32作为其他实验的默认批量大小设置。

通信成本 FedPav 中的本地纪元数表示通信成本和性能之间的权衡。图 10 比较了局部纪元数 E = 1、E = 5 和 E = 10 与 B = 32 和 300 总训练轮数的秩 1 精度。尽管在少数数据集中，E = 10 的性能优于 E = 5，但降低 E 通常会提高性能，并且在所有数据集中，E = 1 的性能大大优于 E = 5 和 E = 10。它指示了 FedReID 中性能和通信成本之间的权衡。较少的本地纪元可实现更好的性能，但会导致更高的通信成本。
图 4：不同批次大小的性能（rank-1）比较，固定局部纪元 E = 1。批量大小 B = 32 在大多数数据集中具有最佳性能。
图 5：不同数量的局部 epoch 的性能比较，固定批次大小 B = 32，总训练轮数 ET = 300。局部纪元 E = 1 在所有数据集中具有最佳性能。

FedPav 的上限 我们将从 FedPav 算法获得的模型的性能与本地训练进行比较。根据前面的讨论，E = 1 和 B = 32 是 FedPav 算法的最佳设置。因此，我们将此设置用于 FedPav 算法。

我们在图 6 中总结了结果。尽管联合模型在大型数据集（如 MSMT17 [25] 和 Market-1501 [30]）上的表现比本地训练差（图 6a），但它的性能优于在较小的数据集（如 CUHK01 [15] 和 VIPeR [6]）上的本地训练（图 6b）。这些结果表明，在较小数据集上训练的模型可以更有效地从其他客户那里获得知识。有两个原因可以解释这些结果：在较大数据集上训练的模型在聚合中占主导地位，因此这些客户端从其他客户端吸收的知识较少;在小数据集上训练的模型泛化能力较弱，因此从较大的数据集中获取更多知识可以提高其能力。

图 6：FedPav 和本地训练（单个数据集上的训练）的性能比较。尽管联合模型和本地模型在（a）中对大型数据集的性能都差于本地训练，但它们的性能优于（b）中对小型数据集的本地训练。聚合前的本地模型在所有数据集上都优于联合模型。

本地模型，即在上传到服务器之前在客户端中训练的模型，是衡量客户端 n FedReID 最佳性能的代理。服务器聚合会导致比较本地模型和图 6 中联合模型性能的所有数据集的性能下降。这表明服务器有可能更好地整合来自客户端的知识。此外，在大型数据集中，局部训练的性能优于局部模型（图6a），这表明FedPav算法存在瓶颈。

FedPav 的收敛 非 IID 数据集会影响 FedReID 训练的收敛。图 7 显示了 FedPav 在 DukeMTMC-reID [32] 和 CUHK03-NP [16] 上训练的联邦模型在 300 轮通信中的排名精度为 1，评估每 10 轮计算一次，固定 E = 1 和 B = 32。FedPav 在两个数据集上的排名 1 准确度在整个训练过程中波动。基准测试中9个数据集的非IID导致在汇总来自客户的模型时难以收敛，因为Li等人[13]指出了非IID数据的负面影响。为了更好地衡量训练性能，我们在实验中平均了来自不同时期的三个最佳联合模型的性能。

5. 性能优化

基于基准分析的见解，我们进一步研究了优化FedReID性能的方法。我们在 5.1 节中采用知识蒸馏法，在第 5.2 节中提出权重调整，并在第 5.3 节中介绍这两种方法的组合。

图 7：FedPav 与知识蒸馏（KD）的收敛性，局部纪元 E = 1，批次大小 B = 32，评估每 10 轮计算一次。（a）和（b）显示了DukeMTMC-reID和CUHK03-NP的趋同性改进。

5.1 知识蒸馏

我们将知识蒸馏应用于FedPav算法，以提高其在本节中的性能和收敛性。如第 4.2 节所述，FedPav 算法难以收敛，局部模型的性能优于联合模型。知识蒸馏（KD）[10]是一种将知识从一个模型（教师模型）转移到另一个模型（学生模型）的方法。我们采用知识蒸馏将知识从客户端转移到服务器：每个客户端都是老师，服务器是学生。

为了进行知识蒸馏，我们需要一个公共数据集来生成来自客户的软标签。我们以未标记的CUHK02 [14]数据集为例，将知识蒸馏应用于联邦学习。CUHK02 [14] 数据集扩展了 CUHK01 [15] 数据集，增加了四对相机视图。它在 7264 张图像中有 1816 个身份。

算法 2 通过知识蒸馏总结了训练过程：（1）在训练开始时，我们将 CUHK02 [14] 数据集 $D_{shared}$ 与初始化模型 $w^0$ 一起分发给所有客户端。（2）每个客户端使用共享数据集 $D_{shared}$ 在其本地数据集上训练后生成软标签 $l_k$ 。这些软标签 $l_k$ 是包含客户端模型知识的特征。（3）每个客户端将模型更新 $w_k$ 和软标签 $l_k$ 上传到服务器。（4）服务器将这些软标签平均为 $\cfrac{1}{k}\sum_{k \in C_t}l_k$ （5）服务器使用共享数据集 $D_{shared}$ 和平均软标签 $l$ 训练联合模型 w。最后一步是微调联合模型，以减轻聚合的不稳定性，并推动聚合更好地收敛。

图 7 比较了 FedPav 和 FedPav +KD的排名 1 准确度性能与 DukeMTMC-reID [32] 数据集（图 7a）和 CUHK03-NP [16] 数据集（图 7b）。它表明，知识蒸馏降低了波动性，并有助于训练收敛。然而，知识蒸馏并不能保证性能的提高：它提高了CUHK03-NP [16]的排名1精度，而这一优势在DukeMTMC-reID [32]数据集中尚不清楚。我们认为，共享公共数据集的域分布对每个数据集上联合模型的最终性能有实质性影响。CUHK02 [14] 数据集与 CUHK03-NP [16] 数据集之间的域差距较小，因此知识蒸馏显著提升了 CUHK03-NP [16] 数据集的性能。我们在补充材料中提供了其他数据集的结果和mAP的准确性。

5.2 权重调整

在本节中，我们提出了一种调整模型聚合权重的方法，以减轻数据集大小巨大差异带来的不平衡影响。FedPav 中的这些权重与数据集的大小成正比：具有 MSMT17 [25] 等大型数据集的客户端约占总权重的 40%，而具有 iLIDS-VID [24] 等小型数据集的客户端仅占 0.3%，这对联合模型的贡献可以忽略不计。尽管具有较大数据集的客户在聚合中具有较大的权重是合理的，但我们预计具有小型数据集和大型数据集的客户端之间的权重存在巨大差异，这会阻碍具有大型数据集的客户有效地从其他客户获取知识。因此，我们为模型聚合提出了更合适的权重。

余弦距离权重 我们提出了一种方法，余弦距离权重（CDW），根据模型的变化动态分配权重：较大的变化应该在模型聚合中贡献更多（即具有更大的权重），以便更多新学习的知识可以反映在联合模型中。我们通过余弦距离测量每个客户端k的模型变化，步骤如下：（1）客户端随机选择一批训练数据 $D_{batch}$ 。（2）当客户端在新一轮训练t中从服务器接收到模型时，它使用 $D_{batch}$ 和由全局模型和本地身份分类器串联形成的局部模型 $w_t^k，v_t^k）$ 生成logits $f_k^t$ 。（3）客户进行训练以获得新模型 $（w^{t+1}_k，v^{t+1}_k）$ 。（4）它生成 $（w^{t+1}_k，v^{t+1}_k）$ 和 $D_{batch}$ 的logits $f^{t+1}_k$ 。（5）客户端通过平均批处理中每个数据点的余弦距离来计算权重 $m^{t +1}_k = mean（1 − cosine\_similarity（f^t_k,f^{t+1}_k ））$ 。（6）客户端向服务器发送 $m^{t +1}_k$ ，服务器用它替换FedPav中的权重。我们在算法 3 中总结了这种新算法。

我们尝试FedPav余弦距离相同重量下设置如图6所示。表3显示,余弦距离在所有数据集重量显著地提高了性能。它表明,我们获得一个更全面的模型,概括了在不同的领域。FedPav的面部模型聚合之前,当地最好的本地dataset-performs精度比当地的培训(培训个人数据集的最佳精度)大型数据集。然而,当地FedPav余弦相似性体重优于模型训练数据集。它表明所有客户提供不同大小的数据集参与联合学习有益,因为他们可以获得betterquality模型与最佳模型训练当地的数据集。

表3:增加1级精度比较当地的培训。当地FedPav模型与余弦距离重量(CDW)比当地的训练数据集。

5.3 知识蒸馏和体重调整

在本节中,我们实现动态权重调整和知识FedPav蒸馏。我们的目标是实现更高的性能和更好的融合与这种组合获得的优势。

图8显示的性能了解蒸馏和余弦距离FedPav重量在两个数据集。这种组合提高了性能和训练的收敛这两个数据集。我们提供补充材料的其他数据集的结果。

图8:性能改进(a)和(b) MSMT17运用知识蒸馏(KD)和体重(CDW) FedPav余弦距离,计算每10轮与评价。

6. 总结

在本文中,我们调查了统计学异质性的挑战实现联合学习人鉴定,通过新建基准执行基准分析的情况,模拟了真实的场景。这个基准定义联合场景和介绍学习algorithm-FedPav联合。基准分析提出瓶颈和有用的见解,为未来的研究和产业化是有益的。然后,我们提出了两种优化方法提高FedReID的性能。解决融合的挑战,我们采用蒸馏来调整服务器模型与知识生成的客户额外的公共数据集。大型数据集的提升性能,我们动态调整权重模型聚合取决于模型的规模客户的变化。数值结果表明,这些优化方法能有效促进融合,实现更好的性能。本文只关注的统计学异质性FedReID在真实的场景中。对于未来的工作,系统异构性的挑战将会考虑。

代码

他们团队实现了easyfl框架，并利用框架能实现，其中每个客户端包含一个数据集。

from django.test import TestCase

# Create your tests here.

import easyfl
import os
from torchvision import transforms
from easyfl.datasets import FederatedImageDataset

TRANSFORM_TRAIN_LIST = transforms.Compose([
    transforms.Resize((256, 128), interpolation=3),
    transforms.Pad(10),
    transforms.RandomCrop((256, 128)),
    transforms.RandomHorizontalFlip(),
    transforms.ToTensor(),
    transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
])
TRANSFORM_VAL_LIST = transforms.Compose([
    transforms.Resize(size=(256, 128), interpolation=3),
    transforms.ToTensor(),
    transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
])

DATASETS = ["MSMT17", "Duke", "Market", "cuhk03", "prid", "cuhk01", "viper", "3dpes", "ilids"]

# Prepare customized training data
def prepare_train_data(data_dir):
    client_ids = []
    roots = []
    for db in DATASETS:
        client_ids.append(db)
        data_path = os.path.join(data_dir, db, "pytorch")
        roots.append(os.path.join(data_path, "train_all"))
    data = FederatedImageDataset(root=roots,
                                 simulated=True,
                                 do_simulate=False,
                                 transform=TRANSFORM_TRAIN_LIST,
                                 client_ids=client_ids)
    return data


# Prepare customized testing data
def prepare_test_data(data_dir):
    roots = []
    client_ids = []
    for db in DATASETS:
        test_gallery = os.path.join(data_dir, db, 'pytorch', 'gallery')
        test_query = os.path.join(data_dir, db, 'pytorch', 'query')
        roots.extend([test_gallery, test_query])
        client_ids.extend([f"{db}_gallery", f"{db}_query"])
    data = FederatedImageDataset(root=roots,
                                 simulated=True,
                                 do_simulate=False,
                                 transform=TRANSFORM_VAL_LIST,
                                 client_ids=client_ids)
    return data


if __name__ == '__main__':
    config = {...}
    data_dir = "datasets/"
    train_data, test_data = prepare_train_data(data_dir), prepare_test_data(data_dir)
    easyfl.register_dataset(train_data, test_data)
    easyfl.init(config)
    easyfl.run()

个人总结

1. 人员再识别任务是什么

人员再识别是一项计算机视觉任务，旨在从多个监控摄像头中识别出同一人员。它通常涉及到从多个摄像头中获取大量的人员图像，然后将这些图像与已知身份的图像进行比较，以确定是否为同一人员。这项任务在安全监控、人员追踪和智能交通等领域有着广泛的应用。

2. 文本的目的是什么

这篇文章主要介绍了一种名为"FedReID"的新型联邦学习框架，用于解决人员再识别（Person ReID）中的隐私保护和数据分布不均、数据不符合独立同分布等问题。

3. 文本基准分析是什么

基准分析是对于联邦学习在人员再识别任务中的性能进行评估和优化的过程。作者构建了一个新的基准来研究FedReID的性能，包括9个不同的数据集、两种联邦场景、模型结构、联邦训练算法和性能指标等。通过基准分析，作者现了FedReID在现实场景中的瓶颈，提出了优化方法，并在各个数据集上取得了更好的性能。

4. 文中的知识蒸馏是如何使用的

在文章中，知识蒸馏被用来解决非独立同布（non-IID）数据引起的收敛困难问题。知识蒸馏是一种从教师模型到学生模型的知识传递方法，通过在公共数据集上生成软标签，将客户端的知识传递给服务器。在FedReID中，作者使用了一个未标记的CUHK02数据集来应用知识蒸馏到联邦学习中。通过知识蒸馏，客户端作为教师，服务器作为学生，从客户端生成软标签，然后将这些软标签用于联邦学习的模型训。通过这种方式，知识蒸馏可以帮助解决非IID数据引起的收敛困难问题。

5. 文中的动态权重调整是如何实现的

动态权重调整是通过一种名为Cosine Distance Weight（CDW）的方法实现的。该方法通过测量每个客户端的模型变化来动态分配权重，使更大的变化对模型聚合产生更大的影响，从而更好地反映新学习的知识。具体来说，CDW实现步骤如下：

（1）客户端随机选择一批训练数据 $D_{batch}$ 。
（2）当客户端在新一轮训练t中从服务器接收到模型时，它使用 $D_{batch}$ 和由全局模型和本地身份分类器串联形成的局部模型 $w_t^k，v_t^k）$ 生成logits $f_k^t$ 。
（3）客户进行训练以获得新模型 $（w^{t+1}_k，v^{t+1}_k）$ 。
（4）它生成 $（w^{t+1}_k，v^{t+1}_k）$ 和 $D_{batch}$ 的logits $f^{t+1}_k$ 。
（5）客户端通过平均批处理中每个数据点的余弦距离来计算权重 $m^{t +1}_k = mean（1 − cosine\_similarity（f^t_k,f^{t+1}_k ））$ 。
（6）客户端向服务器发送 $m^{t +1}_k$ ，服务器用它替换FedPav中的权重。
通过这种方法，CDW可以根据客户端模型的变化动态调整权重，从而更好地反映新学习知识。

动态权重调整的好处在于可以缓解数据集大小差异（数据集不平衡）带来的影响，使得数据集较小的客户端也能够更有效地从其他客户端中获取知识。通过根据每个客户端模型的变化程度动态调整权重，可以更好地反映新学到的知识，从提高联邦模型的性能和收敛速度。

6. 相机联合方案是什么

文中的相机联合方案是指将每个相机视角的数据视为一个客户端，使用联邦学习的方法进行模型训练。在这种方案下，每个客户端只使用其所拥有的相机视角的数据进行训练，而不使用其他相机视角的数据。作者使用了Market-1501和CUHK03-NP两个数据集进行实验，将Market-1501数据集分成6个客户端，每个客户端包含一个相机视角的数据，将CUHK03-NP数据集分成2个客户端，每个客户端包含一个相机视角的数据。实验结果表明，相机联合方案的性能较差，无法与本地训练和身份联合方案相比。这是因为在相机联合方案中，每个客户只使用一个相机视角的数据进行训练，模型无法泛化到多相机评估。因此，作者认为相机联合方不如身份联合方案和本地训练方案适合用于人物重识别任务。

7. FedAvg算法是什么

FedAvg是一种标准的联邦学习算法，由McMahan等人提出。它包括服务器和客户端上的操作：客户端使用其本地数据集训练模型并将模型更新上传到服务器；服务器负责初始化网络模型并通过加权平均聚合来自客户端的模型更新。FedAvg要求服务器和客户端的模型具有相同的网络架构，而如第3.3节所论，客户端的身份分类器可能不同。因此，我们为FedReID引入了一种增强的联邦学习算法：Federated Partial Averaging。

8. FedPav算法是什么

与标准的联邦平均（FedAvg）算法不同，FedPav允许具有部分不同模型的客户端进行联邦训练。在FedPav中，每个客户端仅向服务器发送更新模型的一部分，而不是整个模型。FedPav旨在获得优于本地训练的模型，即在单个数据集上训练的模型。FedPav输出一个高质量的全局模型和每个客户端的本地模型。

9. 算法性能评估如何实现

本文中的算法性能评估主要使用了两种指标：Cumulative Matching Characteristics (CMC)曲线和mean Average Precision (mAP)。其中，CMC曲线用于评估查询身份与图库中所有图像的相似度排名，而mAP则计算所有查询的平均精度。此外，为了考虑到联邦学习的通信带宽限制，本文还使用了通信成本作为评估指标，通信成本的计算方法是通信轮数乘以模型大小的两倍。

你可能感兴趣的:(论文,计算机视觉,人工智能,深度学习)

人工智能（AI）系统化学习路线 xiaoyu❅ python 人工智能学习
一、为什么需要系统化学习AI？人工智能技术正在重塑各行各业，但许多初学者容易陷入误区：❌盲目跟风：直接学习TensorFlow/PyTorch，忽视数学与算法基础。❌纸上谈兵：只看理论不写代码，无法解决实际问题。❌方向模糊：对CV/NLP/RL等细分领域缺乏认知，难以针对性提升。正确的学习姿势：“金字塔式”分层学习（理论→算法→框架→应用→工程化），逐步构建完整的AI知识体系。二、人工智能学习路线
深度学习-130-RAG技术之基于Anything LLM搭建本地私人知识库的应用策略问题总结(一) 皮皮冰燃深度学习深度学习人工智能 RAG
文章目录1AnythingLLM的本地知识库1.1本地知识库应用场景1.2效果对比及思考1.3本地体现在哪些方面1.3.1知识在本地1.3.2分割后的文档在本地1.3.3大模型部署运行在本地2问错问题带来的问题2.1常见的问题2.2原因分析3为什么LLM不使用我的文件？3.1LLM不是万能的【omnipotent】3.2LLM不会自省【introspect】3.3AnythingLLM是如何工作的
3DMAX点云算法：实现毫米级BIM模型偏差检测（附完整代码）夏末之花人工智能
摘要本文基于激光雷达点云数据与BIM模型的高精度对齐技术，提出一种融合动态体素化与多模态特征匹配的偏差检测方法。通过点云预处理、语义分割、模型配准及差异分析，最终实现建筑构件毫米级偏差的可视化检测。文中提供关键代码实现，涵盖点云处理、特征提取与深度学习模型搭建。一、核心算法流程点云预处理与特征增强去噪与下采样：采用统计滤波与体素网格下采样，去除离群点并降低数据量。语义分割：基于PointNet++
数据增强：扩充数据集，提升模型的鲁棒性 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 LLM大模型落地实战指南计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
数据增强：扩充数据集，提升模型的鲁棒性1.背景介绍1.1数据集的重要性在机器学习和深度学习领域中,数据集是训练模型的基础。高质量的数据集对于构建准确、鲁棒的模型至关重要。然而,在现实世界中,获取大量高质量的数据通常是一个巨大的挑战。数据采集过程耗时耗力,而且成本高昂。此外,某些领域的数据存在隐私和安全问题,难以获取。1.2数据集不足的挑战当数据集规模有限时,模型很容易过拟合,无法很好地推广到新的、
vue3+springboot电影院售票选座管理系统 qq_3166678367 spring boot 后端 java
目录本系统(已开发完成)->成品实现截图开发技术本系统支持的技术栈源码获取详细视频演示：文章底部获取博主联系方式！！！！本课题重点核心代码部分展示论文提纲来自指导老师帅的肯定视频演示/源码获取本系统(已开发完成)->成品实现截图开发技术关键技术实现：在Java的开发过程中，可以使用HTML、CSS、JavaScript等前端技术来实现系统的用户界面设计和交互功能。后端可以使用Java语言编写业务逻
Docker打包深度学习项目 FLY_LTL docker 深度学习容器
文章目录Docker打包深度学习项目1.Docker和NVIDIAContainerToolkit的安装1.Docker2.NVIDIAContainerToolkit3.添加国内镜像源2.使用Dockerfile打包并保存镜像1.Dockerfile2.通过Dockerfile生成镜像3.保存镜像和加载4.运行Docker并测试参考Docker打包深度学习项目本文来源于个人实践总结，供各位同学参
使用TensorFlow、OpenCV和Pygame实现图像处理与游戏开发 UwoiGit tensorflow opencv pygame
在本篇文章中，我们将介绍如何结合使用TensorFlow、OpenCV和Pygame来进行图像处理和游戏开发。这三个工具在机器学习、计算机视觉和游戏开发领域都非常流行，并且它们的结合可以提供强大的功能和无限的创造力。我们将逐步介绍如何安装和配置这些工具，并提供相关的源代码示例。安装TensorFlowTensorFlow是一个基于数据流图的开源机器学习框架，提供了丰富的工具和库来构建和训练各种深度
DeepSeek + 药物研发：解决药物研发周期长、成本高-降低80%、失败率高-减少40% Debroon 医疗大模型研发 +慢病逆转人工智能深度学习
DeepSeek+药物研发：解决药物研发周期长、成本高-降低80%、失败率高-减少40%论文大纲1.WHY——研究背景与现实问题1.1研究要解决的现实问题与提出背景1.2研究所要解决的问题类别1.3正反例对比关联：和前人的工作有什么关系？3.总结归纳3.1总结收获3.2探索思考4.WHAT——核心发现或论点5.HOW——研究过程、创新与关键数据6.HOWGOOD——理论贡献与实践意义解法拆解1.1
医图论文 CVPR‘24 | 适应医学图像中泛化异常检测的视觉-语言模型小白学视觉医学图像处理论文解读语言模型人工智能计算机视觉医学图像顶会医学图像处理 CVPR 论文解读
论文信息题目：AdaptingVisual-LanguageModelsforGeneralizableAnomalyDetectioninMedicalImages适应医学图像中泛化异常检测的视觉-语言模型作者：ChaoqinHuang，AofanJiang，JinghaoFeng，YaZhang，XinchaoWang，YanfengWang源码：https://github.com/Medi
MMScan数据集：首个最大的多模态3D场景数据集，包含层次化的语言标注数据集
2024-10-24，由上海人工智能实验室联合多所高校创建了MMScan，这是迄今为止最大的多模态3D场景数据集，包含了层次化的语言标注。数据集的建立，不仅推动了3D场景理解的研究进展，还为训练和评估多模态3D感知模型提供了宝贵的资源。一、研究背景：随着大型语言模型（LLMs）的兴起和与其他数据模态的融合，多模态3D感知因其与物理世界的连接而受到越来越多的关注，并取得了快速进展。然而，现有的数据集
【AI大模型】RAG如何让生成AI更智能？最新方法与优劣深度解析健忘的派大星人工智能语言模型 ai AI大模型 agi RAG 程序员
前言近年来，人工智能技术突飞猛进，尤其是生成式AI，简直像是开了挂一样，各种惊艳的表现让人直呼“未来已来”。根据IDC的研究，生成式AI的市场规模在2022年已经达到了107亿美元，而到2026年，这个数字预计会飙升至326亿美元！不过，尽管生成式AI很强大，但它也并非完美无缺——比如生成内容的质量、准确性和可靠性，依然有提升的空间。这时候，检索增强生成（RAG）技术登场了！RAG的核心思路很简单
深度革命：ResNet 如何用 “残差连接“ 颠覆深度学习安意诚Matrix 机器学习笔记深度学习人工智能
一文快速了解ResNet创新点在深度学习的历史长河中，2015年或许是最具突破性的一年。这一年，微软亚洲研究院的何恺明团队带着名为ResNet（残差网络）的模型横空出世，在ImageNet图像分类竞赛中以3.57%的错误率夺冠，将人类视觉的识别误差（约5.1%）远远甩在身后。更令人震撼的是，ResNet将神经网络的深度推至152层，彻底打破了"深层网络无法训练"的魔咒。这场革命的核心，正是一个简单
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算【超级详细版】 AI筑梦师计算机视觉算法深度学习人工智能机器学习计算机视觉 python
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算1.引言1.1研究背景在计算机视觉、模式识别、医学影像分析和自动驾驶等领域，形状匹配是核心任务之一。然而，现实世界的形状往往存在可变性（Variability），主要体现在以下几个方面：形变（Deformation）：物体可能由于柔性材料、外力作用或生物运动发生非刚性形变。尺度变化（ScaleVariation）：目标形状在不同场景下可能大
A Survey of Large Language Models大模型综述论文章节总结 WhyteHighmore 论文语言模型人工智能自然语言处理论文笔记
ASurveyofLLM人大译ASurveyofLargeLanguageModels这篇论文全面回顾了大型语言模型(LLM)的最新进展，重点关注其发展背景、关键发现和主流技术。文章主要围绕LLM的四个主要方面展开：1引言自从1950年图灵测试被提出以来，人类一直在探索机器掌握语言智能的方法。语言本质上是一种受语法规则支配的复杂、精细的人类表达系统，这使得开发能够理解和掌握语言的强大人工智能(AI
AI：对比ChatGPT这类聊天机器人，人形机器人对人类有哪些不一样的影响？ InnoLink_1024 AGI 人工智能机器学习 chatgpt 人工智能机器人
人形机器人与像ChatGPT这样的聊天机器人相比，虽然都属于人工智能技术的应用，但由于其具备的物理形态和与环境的互动能力，它们对人类的影响会有很大的不同。下面从多个角度进行对比，阐述它们各自对人类的不同影响：1.物理交互与虚拟交互人形机器人：具有物理形态，能够在物理世界中与人类进行直接交互。例如，搬运物品、进行日常家务、提供身体上的帮助（如扶持老人、帮助走路等），以及进行非语言的沟通（如手势、面部
基于PyTorch和ResNet18的花卉识别实战（附完整代码）意.远 pytorch 人工智能 python 深度学习
一、项目背景与效果花卉分类是计算机视觉的经典任务。本文使用PyTorch框架，基于ResNet18模型实现了102种花卉的分类任务。完整代码可直接复制运行，最终验证集准确率达8.2%，文中同步分析性能瓶颈与优化方案。二、环境配置与数据准备1.环境要求#主要依赖库importtorchfromtorchimportnn,optimfromtorchvisionimporttransforms,dat
Python 模拟鼠标轨迹算法 a485240 鼠标轨迹计算机外设
一.鼠标轨迹模拟简介传统的鼠标轨迹模拟依赖于简单的数学模型，如直线或曲线路径。然而，这种方法难以捕捉到人类操作的复杂性和多样性。AI大模型的出现，使得能够通过深度学习技术，学习并模拟更自然的鼠标移动行为。二.鼠标轨迹算法实现AI大模型通过学习大量的人类鼠标操作数据，能够识别和模拟出自然且具有个体差异的鼠标轨迹。以下是实现这一技术的关键步骤：数据收集：收集不同玩家在各种游戏环境中的鼠标操作数据，包括
论文笔记-Contrastive Learning for Unpaired Image-to-Image Translation kingsleyluoxin 计算机视觉论文笔记深度学习 python 计算机视觉机器学习人工智能深度学习
论文信息标题：ContrastiveLearningforUnpairedImage-to-ImageTranslation作者：TaesungPark,AlexeiA.Efros,RichardZhang,Jun-YanZhu机构：UniversityofCalifornia,Berkeley;AdobeResearch代码链接https://github.com/taesungp/contra
DeepSeek从入门到精通「清华团队」 YuKeeHgg DeepSeek 人工智能 ai
由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余梦珑博士后及其团队撰写文档的核心内容围绕DeepSeek的技术特点、应用场景、使用方法以及如何通过提示语设计提升AI使用效率等方面展开，帮助用户从入门到精通DeepSeek的使用。「文末附下载方式」第一部分：DeepSeek基础概念1.1DeepSeek简介定义：专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。核心产品：开源
人工智能的未来：从基础到前沿的探索与展望小二爱编程· 人工智能 ai AI编程 AI写作 AI作画
1.人工智能简介内容概述：人工智能（AI）是指模拟和执行人类智能任务的技术。随着计算能力和数据量的增加，AI在各个领域取得了显著进展，从自动化的基本任务到解决复杂的实际问题，人工智能正渗透到我们生活的各个方面。2.人工智能的种类与发展内容概述：AI的种类可以按智能的复杂度分为三大类：弱人工智能（NarrowAI）：目前大多数应用都属于弱AI，如语音助手、自动驾驶等。它们专注于特定任务，并且无法扩展
【论文精读】SCINet-基于降采样和交互学习的时序卷积模型打酱油的葫芦娃时序预测算法时序预测 SCINet TCN
《SCINet:TimeSeriesModelingandForecastingwithSampleConvolutionandInteraction》的作者团队来自香港中文大学，发表在NeurIPS2022会议上。动机该论文的出发点是观察到时间序列数据具有独特的属性：即使在将时间序列下采样成两个子序列后，时间关系（例如数据的趋势和季节性成分）也基本上得以保留。这个观察启发了作者去设计一种新型的神
【论文精读】PatchTST-基于分块及通道独立机制的Transformer模型打酱油的葫芦娃时序预测算法时序预测 PatchTST Transformer 预训练微调表征学习
《ATIMESERIESISWORTH64WORDS:LONG-TERMFORECASTINGWITHTRANSFORMERS》的作者团队来自PrincetonUniversity和IBMResearch，发表在ICLR2023会议上。动机Transformer模型因其自注意力机制在处理序列数据方面的优势，在自然语言处理（NLP）、计算机视觉（CV）、语音等多个领域取得了巨大成功。这种机制使得模型
SciER：首个大规模科学文档中的实体和关系抽取数据集数据集
2024-10-28，为科学文档中的实体和关系抽取领域带来了突破，提供了一个包含106篇完整科学出版物、超过24,000个实体和12,000个关系的大规模数据集，这对于构建科学知识图谱和促进科学信息抽取技术的发展具有重要意义。数据集地址：SciER|科学信息提取数据集|人工智能数据集一、研究背景：在科学文档中，实体（如数据集、方法、任务）和它们之间的关系对于理解科学发现和推动研究进展至关重要。然而
元戎启行最新战略RoadAGI：所有移动智能体都将被AI驱动量子位
2025年3月18日（北京时间），元戎启行作为国内人工智能企业代表，出席由NVIDIA主办的GTC大会。会上，公司CEO周光发表了技术主题演讲，展示了公司的最新战略布局RoadAGI，并发布道路通用人工智能平台——AISpark（以下简称”Spark平台”）。RoadAGI是元戎启行实现物理世界通用人工智能的关键一步，旨在让包括智能驾驶汽车在内的移动智能体，都具有在道路上自主行驶、与物理世界深度交
什么是机器视觉3D引导大模型视觉人机器视觉机器视觉3D 3d 数码相机机器人人工智能大数据
机器视觉3D引导大模型是结合深度学习、多模态数据融合与三维感知技术的智能化解决方案，旨在提升工业自动化、医疗、物流等领域的操作精度与效率。以下从技术架构、行业应用、挑战与未来趋势等方面综合分析：一、技术架构与核心原理多模态数据融合与深度学习3D视觉引导大模型通常整合RGB图像、点云数据、深度信息等多模态输入，通过深度学习算法（如卷积神经网络、Transformer）进行特征提取与融合。例如，油田机
【财经信息差】2024年12月27日最新财经资讯一览每日财经热点一网打尽代码简单说 AI观财经:财经信息差 AI观财经财经信息差今日财经资讯财经热点今日资讯
大家好，欢迎来到财经信息差！每天，我们将带你直击全球财经动态，精选最新的市场变化、政策动向与产业趋势，让你在最短的时间内，轻松掌握最关键的财经资讯。随着人工智能技术的迅猛发展，我们将用AI的视角为你解析财经热点、企业动向及全球经济变化，让复杂的信息变得简单易懂，帮助你做出更明智的投资决策。财经领域股票市场美股三大指数集体低开，大型科技股多数下跌，纳斯达克金龙指数跌1.07%。小鹏汽车跌3.32%，
探索AI知识库的无限潜力：定义、应用与未来展望知识库知识库管理知识库软件
一、AI知识库的定义AI知识库，作为人工智能技术与传统知识库概念的融合，是指利用人工智能算法和技术构建、管理和维护的信息存储系统。它不仅包含了大量的结构化、半结构化和非结构化数据，还具备智能检索、推理分析、自我学习和优化等高级功能。AI知识库通过模拟人类的认知过程，实现了对知识的有效组织和高效利用，为各种应用场景提供了强大的支持。二、AI知识库的应用1.客户服务与支持在电子商务领域，AI知识库的应
低代码平台未来发展趋势有哪些？低代码
低代码平台的未来发展趋势呈现出多维度的创新与深化，以下结合JNPF快速开发平台的特性，为您分析其未来的发展方向：1.智能化与AI深度融合低代码平台将与人工智能技术深度融合，实现开发流程的智能化升级。例如，JNPF平台有望通过自然语言处理技术，让开发者仅需用自然语言描述需求，平台即可自动生成初步的应用架构和代码逻辑。此外，AI技术还将用于智能推荐、代码自动生成、流程自动化等功能，进一步提升开发效率。
探索“AI知识库”的未来：重塑信息获取与教育的新篇章知识库知识库管理
在数字化时代，信息的爆炸性增长既为人类带来了前所未有的知识盛宴，也带来了信息筛选与理解的巨大挑战。在此背景下，“AI知识库”作为人工智能技术与知识管理深度融合的产物，正逐步成为解决这一难题的关键。本文旨在探讨“AI知识库”的核心价值、技术进展、应用领域以及对未来教育与社会信息获取方式的深远影响，并在此基础上展望其发展前景。一、AI知识库的定义与核心价值定义：AI知识库，简而言之，是利用人工智能技术
【Hinton论文精读】The Forward-Forward Algorithm: Some Preliminary Investigations-202212 tyhj_sf 论文研读笔记 ML理论系列人工智能深度学习 FF算法
博文导航0引言1论文摘要2反向传播有什么问题呢？3Forward-Forward算法3.1使用逐层优化函数学习多层表示4Forward-Forward算法的实验4.1反向传播baseline4.2FF算法的一个简单的无监督的例子4.3FF算法的一个简单的监督例子4.4使用FF算法来模拟感知中自上而下的效应4.5作为教师使用空间环境的预测4.6CIFAR-10实验5睡眠6FF算法与其他对比性学习技术
eclipse maven IXHONG eclipse
eclipse中使用maven插件的时候，运行run as maven build的时候报错 -Dmaven.multiModuleProjectDirectory system propery is not set. Check $M2_HOME environment variable and mvn script match. 可以设一个环境变量M2_HOME指
timer cancel方法的一个小实例 alleni123 多线程 timer
package com.lj.timer; import java.util.Date; import java.util.Timer; import java.util.TimerTask; public class MyTimer extends TimerTask { private int a; private Timer timer; pub
MySQL数据库在Linux下的安装 ducklsl mysql
1.建好一个专门放置MySQL的目录 /mysql/db数据库目录 /mysql/data数据库数据文件目录 2.配置用户，添加专门的MySQL管理用户 >groupadd mysql ----添加用户组 >useradd -g mysql mysql ----在mysql用户组中添加一个mysql用户 3.配置，生成并安装MySQL >cmake -D
spring------>>cvc-elt.1: Cannot find the declaration of element Array_06 spring bean
将-------- <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3
maven发布第三方jar的一些问题 cugfy maven
maven中发布第三方jar到nexus仓库使用的是 deploy:deploy-file命令有许多参数，具体可查看 http://maven.apache.org/plugins/maven-deploy-plugin/deploy-file-mojo.html 以下是一个例子： mvn deploy:deploy-file -DgroupId=xpp3
MYSQL下载及安装 357029540 mysql
好久没有去安装过MYSQL，今天自己在安装完MYSQL过后用navicat for mysql去厕测试链接的时候出现了10061的问题，因为的的MYSQL是最新版本为5.6.24，所以下载的文件夹里没有my.ini文件，所以在网上找了很多方法还是没有找到怎么解决问题，最后看到了一篇百度经验里有这个的介绍，按照其步骤也完成了安装，在这里给大家分享下这个链接的地址
ios TableView cell的布局张亚雄 tableview
cell.imageView.image = [UIImage imageNamed:[imageArray objectAtIndex:[indexPath row]]]; CGSize itemSize = CGSizeMake(60, 50); &nbs
Java编码转义 adminjun java 编码转义
import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final Strin
Tomcat 配置和spring aijuans spring
简介 Tomcat启动时，先找系统变量CATALINA_BASE，如果没有，则找CATALINA_HOME。然后找这个变量所指的目录下的conf文件夹，从中读取配置文件。最重要的配置文件：server.xml 。要配置tomcat，基本上了解server.xml，context.xml和web.xml。 Server.xml -- tomcat主
Java打印当前目录下的所有子目录和文件 ayaoxinchao 递归 File
其实这个没啥技术含量，大湿们不要操笑哦，只是做一个简单的记录，简单用了一下递归算法。 import java.io.File; /** * @author Perlin * @date 2014-6-30 */ public class PrintDirectory { public static void printDirectory(File f
linux安装mysql出现libs报冲突解决 BigBird2012 linux
linux安装mysql出现libs报冲突解决安装mysql出现 file /usr/share/mysql/ukrainian/errmsg.sys from install of MySQL-server-5.5.33-1.linux2.6.i386 conflicts with file from package mysql-libs-5.1.61-4.el6.i686
jedis连接池使用实例 bijian1013 redis jedis连接池 jedis
实例代码： package com.bijian.study; import java.util.ArrayList; import java.util.List; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoo
关于朋友 bingyingao 朋友兴趣爱好维持
成为朋友的必要条件：志相同，道不合，可以成为朋友。譬如马云、周星驰一个是商人，一个是影星，可谓道不同，但都很有梦想，都要在各自领域里做到最好，当他们遇到一起，互相欣赏，可以畅谈两个小时。志不同，道相合，也可以成为朋友。譬如有时候看到两个一个成绩很好每次考试争做第一，一个成绩很差的同学是好朋友。他们志向不相同，但他
【Spark七十九】Spark RDD API一 bit1129 spark
aggregate package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} //测试RDD的aggregate方法 object AggregateTest { def main(args: Array[String]) { val conf = new Spar
ktap 0.1 released bookjovi kernel tracing
Dear, I'm pleased to announce that ktap release v0.1, this is the first official release of ktap project, it is expected that this release is not fully functional or very stable and we welcome bu
能保存Properties文件注释的Properties工具类 BrokenDreams properties
今天遇到一个小需求：由于java.util.Properties读取属性文件时会忽略注释，当写回去的时候，注释都没了。恰好一个项目中的配置文件会在部署后被某个Java程序修改一下，但修改了之后注释全没了，可能会给以后的参数调整带来困难。所以要解决这个问题。 &nb
读《研磨设计模式》-代码笔记-外观模式-Facade bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 百度百科的定义： * Facade（外观）模式为子系统中的各类（或结构与方法）提供一个简明一致的界面， * 隐藏子系统的复杂性，使子系统更加容易使用。他是为子系统中的一组接口所提供的一个一致的界面 * * 可简单地
After Effects教程收集 cherishLC After Effects
1、中文入门 http://study.163.com/course/courseMain.htm?courseId=730009 2、videocopilot英文入门教程（中文字幕） http://www.youku.com/playlist_show/id_17893193.html 英文原址： http://www.videocopilot.net/basic/ 素
Linux Apache 安装过程 crabdave apache
Linux Apache 安装过程下载新版本： apr-1.4.2.tar.gz（下载网站：http://apr.apache.org/download.cgi） apr-util-1.3.9.tar.gz（下载网站：http://apr.apache.org/download.cgi） httpd-2.2.15.tar.gz（下载网站：http://httpd.apac
Shell学习之变量赋值和引用 daizj shell 变量引用赋值
本文转自：http://www.cnblogs.com/papam/articles/1548679.html Shell编程中，使用变量无需事先声明，同时变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）中间不能有空格，可以使用下划线（_）不能使用标点符号不能使用bash里的关键字（可用help命令查看保留关键字）需要给变量赋值时，可以这么写：
Java SE 第一讲（Java SE入门、JDK的下载与安装、第一个Java程序、Java程序的编译与执行） dcj3sjt126com java jdk
Java SE 第一讲： Java SE：Java Standard Edition Java ME: Java Mobile Edition Java EE：Java Enterprise Edition Java是由Sun公司推出的（今年初被Oracle公司收购）。收购价格：74亿美金 J2SE、J2ME、J2EE JDK：Java Development
YII给用户登录加上验证码 dcj3sjt126com yii
1、在SiteController中添加如下代码： /** * Declares class-based actions. */ public function actions() { return array( // captcha action renders the CAPTCHA image displ
Lucene使用说明 dyy_gusi Lucene search 分词器
Lucene使用说明 1、lucene简介 1.1、什么是lucene Lucene是一个全文搜索框架，而不是应用产品。因此它并不像baidu或者googleDesktop那种拿来就能用，它只是提供了一种工具让你能实现这些产品和功能。 1.2、lucene能做什么要回答这个问题，先要了解lucene的本质。实际
学习编程并不难,做到以下几点即可! gcq511120594 数据结构编程算法
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
Java面试十问之三：Java与C++内存回收机制的差别 HNUlanwei java C++finalize()堆栈内存回收
大家知道， Java 除了那 8 种基本类型以外，其他都是对象类型（又称为引用类型）的数据。 JVM 会把程序创建的对象存放在堆空间中，那什么又是堆空间呢？其实，堆（ Heap）是一个运行时的数据存储区，从它可以分配大小各异的空间。一般，运行时的数据存储区有堆（ Heap）和堆栈（ Stack），所以要先看它们里面可以分配哪些类型的对象实体，然后才知道如何均衡使用这两种存储区。一般来说，栈中存放的
第二章 Nginx+Lua开发入门 jinnianshilongnian nginx lua
Nginx入门本文目的是学习Nginx+Lua开发，对于Nginx基本知识可以参考如下文章： nginx启动、关闭、重启 http://www.cnblogs.com/derekchen/archive/2011/02/17/1957209.html agentzh 的 Nginx 教程 http://openresty.org/download/agentzh-nginx-tutor
MongoDB windows安装基本命令 liyonghui160com
windows安装安装目录： D:\MongoDB\ 新建目录 D:\MongoDB\data\db 4.启动进城： cd D:\MongoDB\bin mongod -dbpath D:\MongoDB\data\db &n
Linux下通过源码编译安装程序 pda158 linux
一、程序的组成部分　　Linux下程序大都是由以下几部分组成：　　二进制文件：也就是可以运行的程序文件　　库文件：就是通常我们见到的lib目录下的文件　　配置文件：这个不必多说，都知道　　帮助文档：通常是我们在linux下用man命令查看的命令的文档　　二、linux下程序的存放目录　　linux程序的存放目录大致有三个地方：　　/etc, /b
WEB开发编程的职业生涯４个阶段 shw3588 编程 Web 工作生活
觉得自己什么都会 2007年从学校毕业，凭借自己原创的ASP毕业设计，以为自己很厉害似的，信心满满去东莞找工作，找面试成功率确实很高，只是工资不高，但依旧无法磨灭那过分的自信，那时候什么考勤系统、什么OA系统、什么ERP，什么都觉得有信心，这样的生涯大概持续了约一年。根本不是自己想的那样 2008年开始接触很多工作相关的东西，发现太多东西自己根本不会，都需要去学，不管是asp还是js，
遭遇jsonp同域下变作post请求的坑 vb2005xu jsonp 同域post
今天迁移一个站点时遇到一个坑爹问题,同一个jsonp接口在跨域时都能调用成功,但是在同域下调用虽然成功,但是数据却有问题. 此处贴出我的后端代码片段 $mi_id = htmlspecialchars(trim($_GET['mi_id '])); $mi_cv = htmlspecialchars(trim($_GET['mi_cv '])); 贴出我前端代码片段: $.aj