YoooooL_

自监督论文阅读笔记 Urban feature analysis from aerial remote sensing imagery using self-supervised and semi-s

“Urban feature analysis from aerial remote sensing imagery using self-supervised and semi-supervised ”

Abstract：

使用计算机视觉分析俯视图像是一个在学术文献中受到相当关注的问题。在这个领域运行的大多数技术都是高度专业化的，并且需要对大型数据集进行昂贵的手动注释。这些问题在本文通过开发一个更通用的框架来解决，该框架结合了表示学习的进步，这使得在分析具有有限标记数据的新类别图像时具有更大的灵活性。首先，基于动量对比机制创建了未标记航空影像数据集的稳健表示。随后通过构建具有少至 200 个标记图像的准确分类器，专门用于不同的任务。从 6000 万张未标记的图像中成功地在 10 年内对城市基础设施演变进行低水平检测，证明了本文的方法在推进定量城市研究方面的巨大潜力。（先自监督，后半监督）

Introduction：

深度学习方法 [1] 的进步使得能够以完全自动化的方式分析非常大的数据集，包括那些包含俯视和卫星图像的数据集。由于改进的捕获和存储技术以及处理能力的进步，高清航空影像数据集变得越来越可用。结合起来，这可以对更高分辨率的遥感场景进行详细分析。传统的深度学习过程 遵循数据收集、数据标记、模型训练和对未标记数据进行推理的步骤，自动为未标记数据分配标签。

由于可用数据的海量，计算机视觉技术特别适合有效地处理它们以用于不同的任务，例如分类、目标检测和语义分割。在机器学习中，对标记数据进行操作以构建预测模型的监督学习已被广泛用于利用航空图像中的信息。当提供大量标记数据时，监督学习技术表现出色。然而，这些数据需要 手动标记，这是劳动密集型的，因此成本高昂且难以扩展。

相比之下，未标记的数据（例如卫星图像）更容易获得并且数量更多。几种学习范式已经研究了如何更有效地利用未标记的数据源，包括自监督学习和半监督学习。

航空影像技术的最新进展导致可用的高空影像数量迅速增加。这种增长主要是由于图像捕获的分辨率更高（例如 - 以 10 厘米分辨率捕获的图像将产生比以 100 厘米 (1m) 分辨率捕获的图像多 100 倍的数据。但是，为了利用这些数据，存储和处理能力也必须跟上。因此，分析流程必须能够处理此类数据，同时保持分析准确性和速度等关键性能指标。

高分辨率航空影像捕捉详细的城市特征，从而能够潜在地识别重要的城市特征 [2]，例如大规模的自行车基础设施。本文介绍了使用更小的标记图像集（少至 200 张图像）有效探索如此大量数据（扩展到 6000 万张图像）的方法。在澳大利亚的 15 个城市引入、评估和部署了利用自监督、半监督的方法。

自监督学习：

自监督学习通过设置一个权重任务来从未标记的数据集中提取知识，在前置任务上，模型可以以监督的方式进行预训练 [3]。在自监督工作流中，重点是自监督前置任务学习的 中间表示，而不是最大化预测准确性。这种中间表示用于目标检测等下游任务，期望在前置任务期间学习的表示从语义和结构的角度来看是稳健的。【自监督定义】

目前有大量工作专注于使用这些技术 学习与任务无关的表示。例如，Noroozi 和 Favaro [4] 通过选择几个相邻的像素块来制定拼图任务。改组块后，模型的任务是恢复正确的空间顺序（见图 1a）。此任务需要基于图像中可见的对象和细节进行高级推理。因此，在预训练任务中表现出色的模型可能包含有用的图像表示。类似地，Doersch 等人 [5] 设计了检索与所选图像部分相比的图块的相对位置的任务（见图 1b）。

重要的是，虽然自监督学习倾向于 减少训练神经网络的标记要求，但它并没有提供标记大型数据集的方法。这是因为自监督学习 通常为模型提供伪标签 以构建世界的初始表示，这有助于 减少它需要查看的标记数据点的数量 以构建关于特定类别的假设，但不必须标记与这些特定类别相关的数据点。

半监督学习：

半监督学习对应于机器学习技术的类别，其中大量未标记数据与较小的标记数据集合一起可用。这些方法尝试使用少量标记数据以迭代的方式将标签分配给大量未标记数据。因此，标记数据集在分析过程中会增长，从而产生更准确的模型。

先前的工作使用半监督方法（在某些研究领域也称为 boot-strapping引导方法）通过 生成更多训练数据 来提高预测模型的预测准确性。然而，很少有人以完全自动化的方式运行。 Yarowsky [6] 在这种自行学习的模型范式中的一项早期工作是研究使用标记句子和未标记数据来执行词义消歧的可能性。一些作品还探讨了这种技术在计算机视觉中的适用性。例如，Cui 等人 [7] 通过合并来自他们模型的高置信度预测来迭代地增长他们的数据集。但是，每个步骤都采用了手动审查过程。 Huang 等人 [8] 使用基于形态和颜色的指数，使用预定义的公式，以及公开可用的信息源来生成训练集并将图像分类为建筑物、道路、土壤、水、阴影和植被的类别。分类方法的一个关键问题通常是假设类是互斥的。然而，在城市场景的航拍图像中，道路、植被、土壤、水和建筑物可以共存于同一图像中。

一般来说，半监督学习策略带来的关键改进可以包含在两个层面：

• 模型层面： 涉及到模型训练过程中的改进，并专注于从较少的初始标记图像样本中为模型提供更稳健的表示。

• 数据层面： 涉及半监督标记过程本身的改进，允许通过启发式和形态学特征提取等技术进行独立于模型的改进。

模型级别的改进通常包括即使在半监督学习范围之外也很有用的技术。事实上，其中许多技术都用于改进监督学习模型。例如，Miyato 等人 [9] 使用对抗训练，Siddharth 等人 [10] 使用解耦特征学习和增强策略，例如 Cubuk 等人 [11] 中引入的 RandAugment 也常用。

数据级别技术在模型范围之外运行。这些增加了模型在没有人工干预的情况下正确标记未标记图像样本的概率。例如，Kothari 和 Meher [12] 使用未标记的邻域信息来提高模型性能。

由于这两种技术 适用于不同的级别，因此还可以 将它们重叠以进行潜在的组合改进。

半监督学习中的大多数工作都集中在水平视角中捕获的图像（由相机在非航空环境中生成的图像），因为大量的标记数据使得模型评估变得更加容易。通过将大部分数据集视为未标记，仍然可以使用小型标记数据集轻松评估模型行为，同时还可以根据需要提供非常稳健的准确度、精确度和召回指标。使用未标记的数据集只能提供对此类性能指标的估计，因为大部分数据集的真值是未知的。然而，这种类型的分析更准确地将该技术的使用 与野外未标记的数据集相匹配。

表 1 包含基于标记集大小、视角和未标记集大小的此类技术的比较。此比较表明模型 使用最少数量的标记图像 而不是与最佳结果相对应的数量报告的结果。

许多技术根据用作标记数据的未标记数据的百分比（例如，1% 的数据用作标记数据）来比较性能。然而，这不一定代表注释工作，它是标记图像的绝对数量的函数。由于评估主要是使用被视为未标记数据的标记数据进行的（通过从模型中隐藏标签），所以这样做很简单。但是，对于在野外使用新的未标记数据集，数据注释工作通常是限制因素。此外，大多数技术根据训练集大小报告性能，以未标记/总集大小的百分比形式报告，而忽略了验证数据的标记要求。在本文中，一个主要目标是限制总标签要求，并旨在使用较小的验证集。

Active learning：

在机器学习中，主动学习是指模型可以 迭代地 查询人类用户关于输入数据子集的真值的一类技术。然后根据用户的输入，模型执行额外的学习以提高其预测准确性。这需要在学习过程的每次迭代中进行人工干预。主动学习已成功用于多种任务，包括晶体结构预测 [16]、车辆检测 [17] 和面部识别 [18]。通过使用oracle 或已注释的数据集进行评估，这些方法在理论上运行良好。然而，Settles [19] 认为，在实践中尝试引导新数据集时，在注释更多图像之前等待模型训练完成通常是不省时的。半监督学习和主动学习之间的一个关键区别在于，在半监督学习中进行注释的代理是一个自动化模型，而在主动学习中它通常是一个人。

overhead imagery 高空影像的应用：

高空（卫星和航空）图像 已在先前的研究中用于各种应用。城市肌理的特征为探索当代社会的紧迫问题提供了重要的指引。例如，从高分辨率卫星图像中提取的信息已被用于估计非洲国家的贫困 [20] 并提供灾难和危机管理支持 [21]。此外，它已被证明对于推断人口规模 [22]、评估土地覆盖变化 [23] 以及通过农作物绘图监测粮食安全 [24] 很有价值。除了图像之外，卫星遥感还可以对空气污染 [25]、植被变化 [26] 以及使用夜间灯光作为代理指标的经济活动进行全球分析 [27]。

上述研究提供了空间观测在探索和理解当代社会问题对空间组织的影响方面的巨大潜力的证据。虽然一些研究隐含地使用卫星图像中的特征来寻找相关证据，但其他研究则纯粹专注于从图像中提取特征。重要的是，特征检测的主要任务可以导致对环境特征的详细了解并增强研究结果的可解释性。在这种情况下，可以将任务表述为 目标检测 问题。该研究方向已被各种研究采用，通常专门用于检测卫星图像中可见的单个对象类别。

例如，Vakalopoulou 等人 [28] 和 Yuan [29] 开发了用于建筑物检测的算法。此外，许多研究已经探索了从卫星图像中提取道路网络的方法 [例如，30、31、32]。 Wang 等人 [30] 通过预测卫星图像中的道路方向并通过分析相邻位置的图像来构建网络来实现这一点。Zhang 等人 [31] 创建了一种基于 U-Net [33] 的图像分割方法来提取道路网络。还可以检测道路网络的更详细特征，例如特定的交叉口设计 [34]。卡达穆罗等[35] 使用自动编码器 [36] 和长短期记忆神经网络 [37] 的组合从卫星图像中评估道路质量，以提取和分析特征。此外，Chen 等人 [38] 设计了一种可用于检测道路上车辆数量的方法。图 2 提供了其中一些方法的说明。

Objective：

在过去的几十年里，卫星遥感技术的进步极大地提高了卫星图像的质量。通过使用飞机进行航空摄影，进一步 提高了图像分辨率，从而提高了高分辨率高空图像数据集的可用性。高清航拍图像中的额外细节为 提高目标检测方法的准确性 提供了机会。此外，它允许检测以前无法从卫星图像中检测到且难以收集的 新目标类别。例如，不常见类型的基础设施（如自行车基础设施）在现有数据集中表现不佳或不完整，但可以使用航空影像进行分析。

除了利用输入数据的改进之外，本文还探索了目标检测的新方法。如上所述，当前的目标检测方法要么高度专业化地从环境（例如建筑物或车辆）中 提取单个特征，要么 一次检测多个类别，并需要大量的手动注释。因此，本文研究中解决的差距是缺乏一种资源高效的通用方法，可以提取更完整的特征集来描述单个图像中的环境。正如 Mnih 和 Hinton [32] 所指出的，使用无监督学习方法进行预训练可以大大提高模型的准确性，为开发这种通用方法提供了机会。

这项工作的主要动机是启用可扩展的流程，以简化数据收集，以便以可扩展的方式 跨不同基础设施类别 进行预测分析。在可能的情况下，流程已根据以下目标进行了优化：

• 最大限度地减少人工注释工作。

• 轻松添加更多类的灵活性。

Methodology：

数据收集：

虽然现有方法已经明确探索了许多与道路相关的基础设施分析，但使用航拍图像探索自行车基础设施的效果很差。此外，自行车基础设施通常使用专门的符号和彩色车道明确划分，这使其能够用作定义明确的基础设施类型，以便最初使用航空影像分析工作流程进行探索。因此，在对此类基础设施进行初步分析的同时，还探索了几种其他类型的基础设施和城市特征，以突出已开发流程的普遍性。

为了探索城市环境中的自行车基础设施，通过观察研究获得了标记图像的初始样本 [39]。如果骑自行车的人同意参加，则会预约将 GPS 跟踪传感器安装到他们的自行车上。数据收集包括记录每位参与者长达 6 小时的骑行视频片段和相关的 GPS 数据。参与者被要求记录他们参加的任何自行车运动，并像往常一样骑车。

自监督表示学习：

如 1.1.1 中所讨论的，自监督学习技术允许使用未标记的数据集来构建数据集中图像的任务无关的表示。然后可以将此表示用于其他下游任务。本文使用自监督学习技术的动机是：

• 在大部分数据未标记的数据集的 预测准确性方面具有良好的扩展性。

• 允许通过迁移学习或在现有表示之上构建一个单网络层来快速创建分类器。

• 允许在多个基础设施识别任务中 重复使用单个学习到的表示，从而允许大量计算工作成为 前端加载和一次性的。

进行了一项实验来评估此类技术用于高空图像和地图图像的适用性，这些技术传统上用于从水平视角拍摄的图像。

作为初始选择步骤，SimCLR [40] 和 Momentum Contrast (MoCo) [41, 42] 与 卷积自动编码器 (AE) 一起进行了评估。使用 200 个城市的卫星图像数据对 [43] 中的城市预测任务进行了评估。 MoCo (95%) 的验证准确度最高，而 SimCLR (24%) 和 AE (20%) 的表现明显更差。由于 GPU 内存方面的计算资源限制，利用原始论文 (8192) 中报告的 SimCLR 的大批量来构建自监督表示是有问题的。相反，为了评估，必须使用更小的批量大小 (64)。原始论文讨论了表示学习批量大小作为学习一般表示的重要参数，因为它会影响用于自监督学习的前置任务的难度。由于 MoCo 以可管理的批量大小 (256) 提供了相当好的结果，并且之前已成功用于遥感图像[44]，因此选择 MoCo 进行未来的实验工作。

为了进一步验证 MoCo 在这个用例中的效用，本文参考了 [45]。

(Self-supervision. remote sensing and abstraction: Representation learning across 3 million locations)

Seneviratne 等人 [45] 进行了一项实验，以验证 MoCo 的适用性，并确定该方法对看不见的类别（城市）的可扩展性。使用了之前讨论的城市预测任务，但在 200 或 1667 个城市上进行了表示学习（预训练步骤），而模型训练和测试是在两种设置下进行的：200 个城市和 1667 个城市。对于 200 个城市，使用了与预训练相同的 200 个城市，以检查表示覆盖在预训练数据本身中捕获的任务或类别的能力。通过对 200 个城市的预训练和对 1667 个城市的训练/评估，评估了模型在表示先前见过的类别和未见过的类别方面的一致性。这个结果很重要，因为表示的类独立或通用性质对于允许跨具有多个类的其他问题域（例如不同类型的基础设施）的可重用性至关重要。预训练和训练是在 ResNet50 架构上进行的，批量大小为 256。对于训练，随机梯度下降使用了 30 的高学习率，因为只需要训练一个层（与以前基于自我、监督的研究中采用的标准工作流程相匹配）。表 3 中的详细结果表明，使用自监督扩展到预训练表示以前未见的新类别的巨大潜力。

Ablation on using self-supervision：

对上述工作流程进行了消融测试，以验证其对航拍图像的有用性。这是通过从第 2.1.1 节中提到的航空数据集中对两个类别（自行车基础设施与其他）分别采样 100 个图像用于训练和 1000 个图像用于验证来实现的。然后按照 三个独立的配置 构建和训练 ResNet50 模型来完成这项任务。

• 第一个是使用 ImageNet[46] 中针对 ResNet50 的预训练权重进行实例化，这是计算机视觉中常用的方法。本实验的一个目的是评估这种技术与高空图像一起使用的适用性。一个全连接层被训练用于类预测，并被放置在 ResNet 网络的最终瓶颈层之上（除了类的数量外，与 ImageNet 训练相同）。

• 第二种配置使用了由来自航空影像数据集的 100,000 张未标记图像构建的预训练表示。使用这些预训练的权重，而不是从预训练的 ImageNet 模型加载的权重。

对于这两种配置，ResNet 的层都被冻结，并且相应的权重在训练期间不会更新。这确保了模型被迫仅依赖其预训练的表示作为特征提取器，同时仅学习与手头任务相关的非常高级的抽象概念。随机梯度下降使用 30 的高学习率，因为只训练一个线性层。

• 第三种配置使用在第二种配置中学习的预训练表示，但将其用于端到端迁移学习。在这种配置中，ResNet 的所有权重都会在训练过程中更新，而在其他配置中并非如此。 0.001 的学习率与随机梯度下降一起使用，以最小化此配置下预训练权重的变化。这种低权重旨在通过仅执行小的调整而不是对现有特征进行大的转变来最大限度地 最小化模型中预先学习的特征的破坏。神经网络经过 200 个 epoch 的训练，具有最佳验证性能的检查点用于报告性能。结果在第 3.1.1 节下的表 5 中。

Characterizing self-supervised performance 描述自监督的性能：

作为基于自监督表示的迁移学习的初步评估，对基于 从冻结的MoCo表示进行迁移学习优化的ResNet50 通过实验进行了评估。结果见表6。这个实验的目的是更好地描述建立在预训练工作流上的两种配置的性能。训练集、验证集和测试集的完整数据集分别代表两个类，包含33,337张图像。这些航空图像是从已知有自行车基础设施的地区的大量标有标签的道路图像中随机选择的。包含骑行基础设施的图像被人工过滤，其中18,642张图像包含骑行基础设施，14,695张图像不包含任何骑行基础设施。所有实验均采用 ResNet50 体系结构，并选取验证精度最高的模型作为最终模型。对于“Frozen”配置，学习率为30，批次大小为4，使用随机梯度下降，而对于“Transfer”配置，学习率为0.001，批次大小为16，使用随机梯度下降。通过测试不同配置的训练和验证集大小，预期可以 更好地理解更大的训练集大小下的模型性能缩放。这反过来又有助于确认表5中的结果，同时指出解决这种性质的任务 所需的手动注释的潜在阈值。数据集的总体大小保持固定，以更准确地反映 使用模型从未标记图像池迭代增长数据集的实际情况：随着更多的图像从未标记数据集中移出，未标记图像集的大小将缩小。结果见3.1.2节下的表6。

Semi-supervised learning：

半监督学习被探索为一种 生成更准确模型 的方法，以及创建能够最大限度利用可用的大型数据集的工作流。

在这方面使用了两种主要配置，训练细节与之前的实验大体一致：Frozen 和 Transfer。本节的主要重点是探索允许模型工作流的训练集不断扩展的技术，从而创建更准确的模型。这创建了一个正反馈循环，可以 通过最少的手动调整来自动标记和处理整个数据集。

Initial semi-supervised experiment：

为了评估半监督学习的适用性，使用上述配置进行了实验。这些配置在与第 2.2.2 节相同的 33,337 张图像数据集上针对单个任务（循环基础设施分类）进行评估。结果可在第 3.2.1 节下的表 7 中找到。

Semi-supervised consistency 半监督一致性：

作为后续实验，将 持续的半监督学习的一致性 作为单类固定数据集实验进行探索。使用基于优先级队列的实现来跟踪来自测试集的前 500 个最高和最低的自行车符号的置信度预测，以合并到训练集中。验证集固定为每张 1000 张图像。使用来自 Frozen 配置的迁移学习对 bootstrapping 方法进行了持续评估，从每类 1000 个训练和验证图像开始，步长为 500。结果在第 3.2.2 节下的表 8 中。

使用 Frozen 配置分析多个类：

虽然之前的实验只是单类（例如自行车符号分类），但本实验旨在 以更通用的方式 评估该方法。这方面的一个实际限制是尝试许多不同任务的图像注释要求。为了充分利用有限的注释器时间，每个任务每个类限制为 200 个注释，训练集和验证集各有 100 个图像。和以前一样，这两个类对应于 “任务 Task”类和 “背景Background”类。

这种实验设置的主要原因是 多个基础设施类很可能出现在同一个图像中。因此，通过创建二进制分类任务，本文能够以与目标检测器类似的方式在同一图像上重叠来自多个模型的注释，而无需为不同任务生成边界框，因为这将严重限制注释器探索多个类的时间可用性。在 100 张训练图像的限制内，先前的实验（第 2.2.1 节）表明 Frozen 配置表现最好，并且在这方面 100 张图像的验证集应该足够了。提供了在训练和验证中对每个类别的 100 个图像进行训练的 Frozen 配置的评估，以比较该方法在每个任务上的基本性能。使用 Frozen 配置是因为它有助于提供基准性能水平以进行比较。

此外，由于使用了高学习率，它还有一个额外的好处是可以非常快速地训练。报告的百分比对应于所调查类别的精度。在这组实验中没有检测到假负样本。评估是对从按置信度排序的每个位置的前 1000 个预测中均匀抽取的 100 个图像的随机样本进行的。该实验的结果可以在第 3.2.3 节中找到。

使用 archival半监督学习的自动分析：

该实验探索了以 使用位置的历史图像 为中心的工作流程的开发，以提高模型的准确性。特别是，主要目标是通过使用历史图像作为数据增强/半监督学习策略，以第 2.3.3 节的结果为基础。

为此，利用了手头任务的几个关键语义。这种方法的主要观点是 基础设施是静态的：如果它目前在某个位置可用，它很可能在最近的过去就存在于该位置。还可以合理地预期，如果图像摄于较早的日期而不是较晚的日期，则基础设施将减少，这只是因为基础设施可能是在中间日期建造的。与背景类相比：如果特定图像不包含某些基础设施，那么它过去不太可能存在：有效的规划方案意味着城市和其他基础设施通常提前规划好，短期内剧烈的变化是不寻常的。

因此，就某一地点的历史图像作出以下假设：

在历史图像中正确标记为背景类的位置找到任务类的概率可以忽略不计。
在历史图像中正确标记为任务类的位置找到任务类的概率很高，在最近的图像中找到任务类的概率比在旧的图像中更高。

将模型视为 “任务”类检测器，false positive 误报干扰因子将是“背景”类的图像被错误地分类为属于“任务”类（与误报相同）。设 Φ 是训练集中所有背景图像位置的所有历史图像的类别。然后，考虑集合 Θ ⊂ Φ，其中包含来自模型的所有干扰因子，该模型对 Φ 中包含的图像进行推理。集合 Θ 是当前模型学习的非常有用的数据集，因为模型无法正确分类它们，尽管在背景类的训练集中看到了前面的图像。

此外，较新的干扰因子会比旧的干扰因子更有用，因为可以预期 较新的图像在结构上看起来与当前的图像更相似，因此包含更多有趣的特征以包含在背景类中（相反，例如，很久以前的未建区域，可能不会为背景类增加太多预测价值）。请注意，如果交换“任务”和“背景”类，则此逻辑不一定可交换：正在调查的基础设施可能是最近构建/绘制的，因此可能不一定被错误分类为“背景”类（因为如果“任务”类不存在于图像中，根据定义，它属于“背景”类）。从概念上讲，这类似于机器学习中的提升 boosting[47]，因为 被模型错误分类的图像被分配到训练集中的权重增加，从而增加了它们在对模型决策边界的贡献方面的重要性。

设ΦT为训练集位置对应的所有历史图像的集合，ΦB为背景位置对应的所有历史图像的集合，Φ=ΦT∪ΦB。请注意，根据定义，最新的可用图像也算作历史图像，因此将包含在这些集合中。由于是标记位置的历史图像，显然集合 ΦT ， ΦB 包含模型可以以监督方式学习的图像。然而，并不是所有的图像都同样有用或可以学习。因此，为每个单独的历史图像分配权重可以控制训练过程（当分配权重为零时，图像基本上不会对训练过程产生影响）。因此，手头的问题可以定义如下：

设 ΦiT 和 Φj B 对应于上述集合，其中 i, j 对应于任意排序（索引）。然后让每个训练样本的个体损失由函数 L(x) 确定，该函数会将神经网络中使用的损失函数应用于 x 的相应输出。那么，整体损失函数变为：

其中 αiT ∈ N 对应于个体历史 任务权重，αj B ∈ N 对应于个体历史 背景权重。不失一般性且为简单起见，让排序 ΦiT 和 Φj B 的前 N 个元素设置为每类 N 个图像的初始人类标记训练集的任意排序。由于模型以半监督方式训练，数据组成的主要差异由整个数据集上的不同 α 值跟踪。请注意，α = 0 的图像对模型训练没有贡献，在训练过程中可能会被忽略。

定义以下操作是为了模块化半监督学习过程的工作流程，以提高使用 archival 档案图像的模型的性能。需要注意的是，置信度指标是针对“任务”类定义的。置信度度量对应于特定图像属于“任务”类的概率，并且与图像属于背景类的概率相关，因为仅存在 2 个类，PT = 1 - PB。

• 训练 - 根据公式 1 定义的当前可用训练数据集构建分类器。

• 预测 - 使用最新构建的分类器对历史数据集（分别为 ΦT 和 ΦB）执行预测，并根据任务类别（而非背景类别）分配置信度分数。

半监督学习过程 仅依赖于 训练计算机视觉模型的多次迭代，这些模型可以访问不同的训练集。训练和预测操作为此功能提供接口。由于对数据/权重的任何修改仅在训练模型并在 ΦT 和 ΦB 上执行预测（从而更新置信度指标）后才会影响过程，因此半监督学习过程的每一步/迭代都从训练模型和预测 ΦT 和 ΦB 开始。

• 更新任务——增量αiT 对应于ΦT 中的MT 最高置信度任务检测。

• 更新背景——增量αj B 对应于ΦB 中MB 最低置信度任务检测。

• 更新干扰因子——增量αj B 对应于ΦB 中的MC 最高置信度任务检测（因此匹配干扰因子的定义：高置信度，但分配给错误的类）。

更新操作用于在半监督学习过程的迭代中管理数据集。通过更新每个图像对损失函数的贡献，模型的决策边界也被修改，一些图像的重要性高于其他图像。需要注意的是，需要独立维护两个数据集 ΦT 和 ΦB 的顺序统计信息（例如第 MT 个最大置信度值），因为这两个数据集的基础语义和类概率分布非常不同。

结合起来，这些操作定义了半监督技术的行为。随着时间的推移，图像可用性的时间控制是通过逐渐拓宽允许模型更新 α 值的时间范围来管理的：最初，只有对应于较近图像的值可以更新，但在以后的迭代中，α 值对应于较早的图像图像也可能会更新。这大大降低了模型由于与图像的当前前身图像的连接（结构或其他方面）较少而对图像进行错误分类的可能性。此行为由与“任务”和“背景”类对应的参数 DT 和 DB 确定，并表示从数据集中的最新图像开始需要捕获图像的最大持续时间（以月为单位），以便α值可更新。换言之，当且仅当图像 ΦiT 是在 ΦT 中的最后一个图像的 DT 个月内捕获时，才可以更新 αiT，并且对于 αj B、DB、ΦiT 和 ΦT 类似。

（半监督部分略）

Results：

Ablation on using self-supervision：

2.2.1 节中详述的使用自监督的消融结果（表 5）表明 MoCo 学习的表示是优越的。有趣的是，允许模型修改 MoCo 学习的表示（配置 3）导致保持精度从 72%（来自配置 1）下降到较小的训练集大小的 61%，这表明数据过度拟合的问题。

Characterizing self-supervised performance：

表 6 中的结果对应于使用自监督表示获得的验证准确度，作为第 2.2.2 节中描述的实验的一部分。

（半监督部分略）

Discussion：

Speed and scalability：

通过这种规模的建模，重要的是要考虑如何跨计算基础设施扩展此类分析以快速交付结果。所提出的方法能够在 3 小时内生成覆盖澳大利亚 15 个城市、跨越 22,000 平方公里和超过 6000 万张图像的结果。这是每小时 2000 万张图像或大约每小时 7000 平方公里的吞吐量。由于神经网络中推理过程固有的独立性，这些结果是利用微不足道的并行性生成的。在 Spartan HPC 平台上的 12 个 V100 GPU 上执行处理，这些 GPU 分布在 3 个节点（每个节点 4 个 GPU）上[49]。在单个 GPU 上，相同的工作负载需要 24 小时才能完成单个任务。此运行时性能评估对应于第 3.2.4 节中讨论的半监督工作流。

Archival imagery analysis：

在探索基础设施随时间演变的任务中，模型的一个简单用例被用来强调其效用。分析在整个墨尔本市进行，并分析了随时间推移的自行车基础设施。在特定位置识别的基础设施的第一个实例以检测年份进行了标注。该信息用于生成加载到 QGIS 中的 GIS 图层，然后将其可视化，如图 5 所示。这突出了所提出的模型在提供跨越大地理区域多年的准确和一致数据方面的效用。手动过程收集的相同数据收集起来很费力，并且涉及注释者的重复工作。除了提供额外的训练数据外，对档案图像的探索还提供了对基础设施网络增长和变化的进一步见解。

Interpretability：

基于神经网络的方法的一个关键问题是生成模型的可解释性。由于模型承诺的最终预测功能是多个复杂层相互作用的产物，因此验证模型学习的决策边界是否一致非常重要。在模型可解释性和可解释性领域有许多与神经网络直接相关的工作。通过在包含相应类的输入图像上可视化模型的激活，这些方法中的一些被合并以进一步验证本文的模型。

在这方面使用了两种方法（极扰动 [50] 和引导反向传播 [51]），结果如图 6 所示。

Zhang 等人 [52] 提供了一个评估归因技术的框架，方法是让模型在单个像素上“指向”，然后根据该点与图像中给定类别的距离（15 像素距离）进行评分。以依赖于方法的方式为每种技术导出分数。

为了对神经网络模型生成的结果产生信心，使用 [50] 实现了类似的工作流程。由神经网络激活的单个最重要的图像区域在图像中突出显示并手动验证。图 7 中可以找到自行车符号的示例。在其他类别中也观察到类似的结果，但是，由于这是一个类别，其中图像中只有一个区域对应于所考虑的任务，这形成了模型和可解释性技术的较难案例之一。因此，该结果用于突出和进一步验证模型的行为。

可扩展方法在基础设施分析中的意义：

骑自行车和主动交通可以解决机动交通造成的道路网络日益拥堵，减少空气污染，并解决令人担忧的人口不活动水平。然而，骑自行车并非没有受伤的风险 [53]，而且在越来越多的骑自行车者中，如果不存在独立的基础设施 [54]，尽管不匹配，骑自行车的伤害也会增加。具体而言，遭受危及生命伤害的骑自行车者人数平均每年增加 7.5% [55]。最近，与 COVID-19 大流行相关的社会疏离措施导致全球自行车活动加速增加，新自行车销售强劲增长 [56]。促进和增加骑自行车的使用需要调查与伴随受伤人数增加相关的特征。这些特征之一是 特定自行车基础设施的可用性，例如标记或物理分离的车道。本文的研究提供了一种创建此类自行车基础设施目录的方法，该目录可以具有许多有用的下游应用，例如基础设施类型的开发[57]。重要的是，这项工作展示了如何将该方法扩展到其他类型的城市特征。

Conclusion：

本文提出了一种从航空影像中提取大量特征的通用方法，这些特征 描述了单幅影像中的环境。虽然图像分割方法可以在单个模型中实现类似的结果，但是一个主要的限制是 需要大量的样本用于模型校准。例如，Azimi等人[58]注释了31个语义类别，包括低植被、树木、铺面道路、非铺面道路、铺面停车场、非铺面停车场、自行车道、人行道、入口/出口和12种车道标志类型。随着用户需求的变化，通过将一些详细的类别合并到更高级别的类别(例如“自然”)中，创建了多个数据集。这些图像分割方法在城市基础设施识别方面有很大的潜力。然而，创建带注释的训练数据集是一个高度资源密集型的过程，无法保证细分类别与备选研究问题的要求相匹配。

相比之下，本文的方法每个类别只需要200个标签注释，这实质上更有效。还探索了引入的方法的几种变体，修改了自监督和半监督学习工作流的方面。深度学习可解释性技术用于验证模型学习的假设。本文描述了各种类型的基础设施(如人行道、自行车道)的特征检测的准确性，表明常见的基础设施比罕见的物体(如自行车符号) 更容易检测。然而，在给定足够数量的训练样本 的情况下，本文中讨论的深度学习方法能够准确地检测任何被调查的基础设施类型。虽然初始图像注释的级别可以讨论(即，在本研究中设置为200)，但低阈值防止对易于区分的特征(如铁轨)进行过多的注释。当某些类别需要更高的预测精度时，在已经注记的位置获取额外的历史影像等方法可以提高精度，而无需进一步注记。

你可能感兴趣的:(论文阅读笔记,论文阅读,深度学习,计算机视觉,人工智能,机器学习)

从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
卷积神经网络（Convolutional Neural Network, CNN）不想秃头的程序神经网络语音识别人工智能深度学习网络卷积神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专门用于处理图像、视频等网格数据的深度学习模型。它通过卷积层自动提取数据的特征，并利用空间共享权重和池化层减少参数量和计算复杂度，成为计算机视觉领域的核心技术。以下是CNN的详细介绍：一、核心思想CNN的核心目标是从图像中自动学习层次化特征，并通过空间共享权重和平移不变性减少参数量和计算成本。其关键组件包括：卷积层（
ResNet（Residual Network）不想秃头的程序神经网络语音识别人工智能深度学习网络残差网络神经网络
ResNet（ResidualNetwork）是深度学习中一种经典的卷积神经网络（CNN）架构，由微软研究院的KaimingHe等人在2015年提出。它通过引入残差连接（SkipConnection）解决了深度神经网络中的梯度消失问题，使得网络可以训练极深的模型（如上百层），并在图像分类、目标检测、语义分割等任务中取得了突破性成果。以下是ResNet的详细介绍：一、核心思想ResNet的核心创新是
P25：LSTM实现糖尿病探索与预测 ?Agony lstm 人工智能 rnn
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、相关技术1.LSTM基本概念LSTM（长短期记忆网络）是RNN（循环神经网络）的一种变体，它通过引入特殊的结构来解决传统RNN中的梯度消失和梯度爆炸问题，特别适合处理序列数据。结构组成：遗忘门：决定丢弃哪些信息，通过sigmoid函数输出0-1之间的值，表示保留或遗忘的程度。输入门：决定更新哪些信息，同样通过sigmoid函数控制更新
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
深入详解：决策树算法的概念、原理、实现与应用场景猿享天开算法决策树机器学习
深入详解：决策树算法的概念、原理、实现与应用场景决策树（DecisionTree）是机器学习中一种直观且广泛应用的监督学习算法，适用于分类和回归任务。其树形结构易于理解，特别适合初学者。本文将从概念、原理、实现到应用场景，全面讲解决策树，并通过流程图和可视化示例增强理解，通俗易懂，帮助小白快速掌握决策树算法相关知识。1.决策树的概念1.1什么是决策树？决策树通过一系列条件判断（决策节点）将输入数据
[Python]-基础篇1- 从零开始的Python入门指南踏雪无痕老爷子 Python python 开发语言
无论你是尚未接触编程的新手，还是想从其他语言转向Python的开发者，这篇文章都是你的入门课。一、Python是什么？Python是一种解释型、高级、通用型编程语言，以简洁明了、简单易用着称。它可以应用于网站开发、自动化脚本、数据分析、人工智能、系统操作等多种场景。二、如何安装Python步骤：访问Python官方网站选择目前最新的Python3.x版本下载Windows用户请务必勾选“AddPy
Python爬虫实战：爬取知乎问答与用户信息 Python爬虫项目 python 爬虫 php 数据分析开发语言开源
简介随着网络信息量的爆炸，如何有效获取有价值的内容，成为了数据分析、机器学习等领域的基础之一。爬虫作为数据采集的基本工具之一，常常被用来获取互联网上的公开数据。在这篇博客中，我们将结合最新的Python爬虫技术，详细讲解如何爬取知乎问答与用户信息。本文将会介绍：Python爬虫的基础知识知乎问答网页结构分析使用Python进行知乎数据爬取爬取知乎问答内容与用户信息如何处理和存储爬取的数据使用最新的
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
潜入思维的海洋：SoftCoT++如何让语言模型更聪明步子哥智能涌现语言模型人工智能自然语言处理
在人工智能的浩瀚星空下，大型语言模型（LLMs）如同一颗颗璀璨的恒星，照亮了从文本生成到复杂推理的广阔领域。然而，这些模型在推理任务中往往像是在迷雾中航行——尽管它们能抵达目的地，却常常因为固定的思维路径而错过更优的航线。2025年5月，一篇题为《SoftCoT++:Test-TimeScalingwithSoftChain-of-ThoughtReasoning》的论文如同一盏明灯，照亮了如何让
BI+AI实战：我们如何用3秒完成车企供应链推演 qq_43696218 人工智能
一、BI+AI引领财务分析新纪元在财务数据分析领域，奥威BI+AI正以革命性的姿态颠覆传统。当金蝶、用友等工具仍深陷报表泥潭时，奥威BI+AI通过深度融合商业智能（BI）与人工智能（AI），实现了从滞后报表到实时洞察的飞跃。这不仅极大地提升了财务分析的效率，更为企业的战略决策提供了前所未有的精准支持。二、BI+AI的核心技术优势‌实时动态分析‌o奥威BI+AI摒弃了静态数据集，依托原始科目余额表实
DeepSeek-V3 通俗详解：从诞生到优势，以及与 GPT-4o 的对比码事漫谈 AI ai
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站1.DeepSeek的前世今生1.1什么是DeepSeek？DeepSeek是一家专注于人工智能技术研发的公司，致力于打造高性能、低成本的AI模型。它的目标是让AI技术更加普惠，让更多人能够用上强大的AI工具。1.2DeepSeek-V3的诞生DeepSeek-V3是DeepSeek公司推出的最新一代A
企业级AI开发利器：Spring AI框架深度解析与实战_spring ai实战 AI大模型-海文人工智能 spring python 算法开发语言 java 机器学习
企业级AI开发利器：SpringAI框架深度解析与实战一、前言：Java生态的AI新纪元在人工智能技术爆发式发展的今天，Java开发者面临着一个新的挑战：如何将大语言模型（LLMs）和生成式AI（GenAI）无缝融入企业级应用。传统的Java生态缺乏统一的AI集成方案，开发者往往需要为不同AI供应商（如OpenAI、阿里云、HuggingFace）编写大量重复的接口适配代码，这不仅增加了开发成本，
Python编程：使用Opencv进行图像处理
【参考】https://github.com/opencv/opencv/tree/4.x/samples/pythonPython使用OpenCV进行图像处理OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。下面将从基础到高阶介绍如何使用Python中的OpenCV进行图像处理。一、安装首先需要安装OpenCV库：pipinst
图扑软件智慧云展厅，开启数字化展馆新模式智慧园区可视化 5g 人工智能大数据安全云计算
随着疫情的影响以及新兴技术的不断发展，展会的发展形式也逐渐从线下转向线上。通过“云”上启动、云端互动、双线共频的形式开展。通过应用大数据、人工智能、沉浸式交互等多重技术手段，构建数据共享、信息互通、精准匹配的高精度“云展厅”，突破时空壁垒限制。图扑软件运用HT强大的渲染功能，数字孪生“云展位”，1:1复现实际展厅内部独特的结构造型和建筑特色。也可以第一人称视角漫游，模拟用户在展厅内的参观场景，在保
转行要趁早！网络安全行业人才缺口大，企业招聘需求正旺！
网络安全行业具有人才缺口大、岗位选择多、薪资待遇好、学历要求不高等优势，对于想要转行的人员来说，是一个非常不错的选择。人才缺口大网络安全攻防技术手段日新月异，特别是现在人工智能技术飞速发展，网络安全形势复杂严峻，人才重要性凸显。教育部《网络安全人才实战能力白皮书》数据显示，到2027年，我国网络安全人员缺口将达327万。近期发布的《2024年网络安全产业人才发展报告》中提到，沿用ISC2的人才缺口
基于机器学习的智能文本分类技术研究与应用
在当今数字化时代，文本数据的爆炸式增长给信息管理和知识发现带来了巨大的挑战。从新闻文章、社交媒体帖子到企业文档和学术论文，海量的文本数据需要高效地分类和管理，以便用户能够快速找到所需信息。传统的文本分类方法主要依赖于人工规则和关键词匹配，这些方法不仅效率低下，而且难以应对复杂多变的文本内容。近年来，机器学习技术的快速发展为文本分类提供了一种高效、自动化的解决方案。一、机器学习在文本分类中的应用概述
【机器学习与数据挖掘实战 | 医疗】案例18：基于Apriori算法的中医证型关联规则分析 Francek Chen 机器学习与数据挖掘实战机器学习数据挖掘 Apriori python 关联规则人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈机器学习与数据挖掘实战⌋⌋⌋机器学习是人工智能的一个分支，专注于让计算机系统通过数据学习和改进。它利用统计和计算方法，使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联和异常的过程，旨在提取有价值的信息和知识。机器学习为数据挖掘提供了强大的分析工具，而数据挖掘则是机器学习应用的重要领域，两者相辅相成，共同推动
【Python深度学习】零基础掌握Pytorch Pooling layers nn.MaxPool方法 Mr数据杨 Python 深度学习 python 深度学习 pytorch
在深度学习的世界中，MaxPooling是一种关键的操作，用于降低数据的维度并保留重要特征。这就像是从一堆照片中挑选出最能代表某个场景的那张。PyTorch提供了多种MaxPooling层，包括nn.MaxPool1d、nn.MaxPool2d和nn.MaxPool3d，它们分别适用于不同维度的数据处理。如果处理的是声音信号（一维数据），就会用到nn.MaxPool1d。而处理图像（二维数据）时，
误差的回响：反向传播算法与神经网络的惊天逆转田园Coder 人工智能科普人工智能科普
当专家系统在20世纪80年代初期大放异彩，成为人工智能实用化的耀眼明星时，另一股曾经被宣判“死刑”的力量——连接主义（神经网络）——正在寒冬的冻土下悄然涌动，孕育着一场惊天动地的复苏。马文·明斯基和西摩·帕尔特在1969年《感知机》专著中那精准而冷酷的理论批判，如同沉重的封印，将多层神经网络的研究禁锢了近二十年。他们指出的核心死结——缺乏有效算法来训练具有隐藏层的网络——仿佛一道无法逾越的天堑。单
【Html实现“心形日出”（附效果+源代码）】| JavaScript面试题：解释一下异步编程中的回调函数、Promise和Async/Await的概念。它们有什么区别？追光者♂ html5 css3 心形日出前端特效 JS面试题 Promise Async/Await
风会带走你曾经存在过的证明。——虞姬作者主页：追光者♂个人简介：[1]计算机专业硕士研究生[2]2023年城市之星领跑者TOP1(哈尔滨)[3]2022年度博客之星人工智能领域TOP4[4]阿里云社区特邀专家博主[5]CSDN-人工智能领域优质创作者无限进步，一起追光！！！
阅读笔记(2) 单层网络:回归 a2507283885 笔记
阅读笔记(2)单层网络:回归该笔记是DataWhale组队学习计划（共度AI新圣经：深度学习基础与概念）的Task02以下内容为个人理解，可能存在不准确或疏漏之处，请以教材为主。1.从泛函视角来看线性回归还记得线性代数里学过的“基”这个概念吗？一组基向量是一组线性无关的向量，它们通过线性组合可以张成一个向量空间。也就是说，这个空间里的任意一个向量，都可以表示成这组基的线性组合。函数其实也可以看作是
用Python实现生信分析——功能预测详解写代码的M教授生信分析 python 开发语言
功能预测是生物信息学中的一项重要任务，通过分析基因或蛋白质序列的特征，推测它们的生物学功能。功能预测通常涉及多种方法，包括序列比对、基序识别、机器学习模型等。这些方法可以帮助科学家推断未知基因的功能，从而加速生物学研究的进展。1.功能预测的主要方法（1）同源性比对：通过将未知基因或蛋白质序列与数据库中的已知序列进行比对，识别出同源序列，并推测它们的功能。常用工具包括BLAST、HMMER等。（2）
青少年编程与数学 01-012 通用应用软件简介 15 人工智能助手明月看潮生编程与数学第01阶段青少年编程人工智能应用软件编程与数学
青少年编程与数学01-012通用应用软件简介15人工智能助手一、什么是人工智能助手二、人工智能助手的产生和发展（一）早期探索阶段（二）技术突破阶段（三）广泛应用阶段三、人工智能助手的主要功能（一）信息查询（二）日程管理（三）设备控制（四）知识问答四、人工智能助手的商业模式（一）广告收入（二）增值服务（三）数据服务（四）硬件销售五、DeepSeek（一）基本情况（二）技术水平（三）产品功能（四）市场
虚拟空间中的AI协作与任务 AI天才研究院 ChatGPT AI大模型企业级应用开发实战 AI人工智能与大数据大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
虚拟空间与AI概述在当今信息化和数字化的时代，虚拟空间（VirtualSpace）已成为人们生活和工作的重要一部分。虚拟空间是一种通过计算机技术构建的虚拟环境，它能够模拟和增强现实世界中的各种交互和体验。而人工智能（AI）作为计算机科学的一个分支，通过模拟人类的认知能力来实现自动化和智能化的决策。虚拟空间与AI的结合，不仅为人类带来了全新的交互方式，也为各行业的发展注入了强大的动力。虚拟空间的定义
AI Agent: AI的下一个风口智能体在元宇宙里的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AIAgent:AI的下一个风口智能体在元宇宙里的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AIAgent,元宇宙,虚拟角色,智能交互,人工智能,虚拟世界,智能体架构,交互式应用1.背景介绍1.1问题的由来随着虚拟现实(VR)、增强现实(AR)和区块链技术的不断发展，元宇宙(Metaverse)的概念逐渐兴起。元宇宙是一个由虚拟世界
python接收_MT5 与 PYTHON 的集成：接收和发送数据 James Swineson python接收
为什么要把MQL5与Python集成？全方位的数据处理需要大量工具，并且经常超出单一应用程序的功能沙箱。专用编程语言正在用于处理和分析数据，统计和机器学习。Python是数据处理的主要编程语言之一。一个非常有效的解决方案是利用语言的力量并包含函数库来开发交易系统。在两个或更多个程序之间实现交互存在众多不同的解决方案。套接字是最快速、最灵活的解决方案之一。网络套接字是计算机网络上进程间通信的端点。M
攻击者利用热门AI发动黑帽SEO攻击，通过污染搜索结果传播窃密木马 FreeBuf- 人工智能
伪装成AI主题网站的恶意页面|图片来源：ZscalerZscaler威胁实验室研究人员发现一起精心策划的恶意软件攻击活动，攻击者利用ChatGPT和LumaAI等人工智能(AI)工具的热度，通过黑帽SEO（搜索引擎优化）技术劫持搜索引擎结果，诱导用户落入恶意软件陷阱。Zscaler警告称："这些攻击背后的威胁行为者正在利用ChatGPT和LumaAI等AI工具的热度。"这些欺诈活动至少从2025年
60天python训练计划----day55
DAY55序列预测任务介绍知识点回顾序列预测介绍单步预测多步预测的2种方式序列数据的处理：滑动窗口多输入多输出任务的思路经典机器学习在序列任务上的劣势；以随机森林为例一、序列预测任务介绍1.1序列预测是什么？我们之前接触到的结构化数据，它本身不具备顺序，我们认为每个样本之间独立无关，样本之间即使调换顺序，仍然不影响模型的训练。但是日常中很多数据是存在先后关系的，而他们对应的任务是预测下一步的值，我
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt