友好的Spider-man

EncoderMI: Membership Inference against Pre-trainedEncoders in Contrastive Learning

0.摘要

给定一组未标记的图像或（图像，文本）对，对比学习旨在预训练图像编码器，该编码器可用作许多下游任务的特征提取器。在这项工作中，我们提出了 EncoderMI，这是第一个针对通过对比学习预训练的图像编码器的成员推理方法。特别是，给定输入和对图像编码器的黑盒访问，EncoderMI 旨在推断输入是否在图像编码器的训练数据集中。 EncoderMI 可用于 1) 数据所有者审核其（公共）数据是否在未经其授权的情况下用于预训练图像编码器，或 2) 攻击者破坏私有/敏感训练数据的隐私。我们的 EncoderMI 利用图像编码器对其训练数据的过度拟合。特别是，过度拟合的图像编码器更有可能为其训练数据集中（或不在）的输入的两个增强版本输出更多（或更少）相似的特征向量。我们在自己从多个数据集上预训练的图像编码器，以及对比语言图像预训练 (CLIP) 图像编码器上评估 EncoderMI，后者在从互联网收集，并由 OpenAI 发布的 4 亿（图像、文本）对上进行了预训练。我们的结果表明，EncoderMI 可以实现高准确度、精确度和召回率。我们还探索了一种通过提前停止防止过度拟合来对抗 EncoderMI 的对策。我们的结果表明，它在 EncoderMI 的准确性和图像编码器的实用性之间实现了权衡，即它可以降低 EncoderMI 的准确性，但也会导致基于图像编码器构建的下游分类器的分类精度损失。

1.介绍

对比学习是一种很有前途的通用人工智能方法。特别是，给定图像或（图像，文本）对的未标记数据集（称为预训练数据集），对比学习预训练图像编码器，该图像编码器可用作许多下游任务的特征提取器。给定图像编码器，下游任务只需要少量或不需要标记的训练数据。然而，编码器的预训练通常会消耗大量数据和计算资源。因此，通常情况下，强大的编码器提供商（例如 OpenAI、谷歌）会预训练编码器，然后向下游客户（例如资源较少的组织、最终用户）提供服务。

现有的对比学习研究主要集中在如何训练更好的图像编码器，使其在下游任务上取得更好的性能。然而，对比学习的安全性和隐私性在很大程度上尚未得到探索。在这项工作中，我们对通过对比学习预训练的图像编码器进行成员推理进行了首次系统研究。特别是，我们旨在推断输入图像是否在图像编码器的预训练数据集中。如果输入在（或不在）图像编码器的预训练数据集中，则称为图像编码器的成员（或非成员）。

对比学习中的成员推理有两个重要的应用。假设数据所有者在 Internet 上公开他们的图像，例如在 Twitter 上。 AI 公司（例如 OpenAI）在未经数据所有者授权的情况下收集并使用公共数据对图像编码器进行预训练和货币化。这种做法可能会侵犯数据所有者的数据安全。例如，Twitter 要求 Clearview 停止从其网站上获取公共图像用于模型训练； FTC 要求 Ever 删除在未经授权的用户数据上训练的模型。

成员推理的第一个应用是数据所有者可以使用成员推理方法来审核他/她的（公共）数据是否在未经他/她授权的情况下用于预训练图像编码器，尽管成员推理结果可能没有正式的保证。成员推理的第二个应用是，当预训练数据是私有/敏感时，攻击者可以使用它来破坏预训练数据的隐私。例如，医院可以协同使用对比学习来预训练图像编码器，这些图像编码器可以在医院之间共享，以解决各种下游医疗保健任务，例如基于肺部 CT 图像的 COVID-19 测试和皮肤病预测。在这种情况下，预训练数据可能包括敏感的医学图像，一家医院可能会推断出其他医院的图像编码器的敏感成员。

我们的工作：在这项工作中，我们提出了 EncoderMI，这是第一个针对对比学习的成员推理方法。

威胁模型。我们将执行成员推理的实体（例如，数据所有者、攻击者）称为推理者。我们假设推理者可以通过黑盒访问预训练图像编码器（称为目标编码器），这是最困难和最普遍的情况。
推理者旨在推断输入是否在目标编码器的预训练数据集中。图像编码器的预训练依赖于三个关键维度：预训练数据分布、编码器架构和训练算法。换句话说，我们有背景知识的三个维度。推断者可能知道也可能不知道他们中的每一个。因此，我们总共为推断者提供了八种不同类型的背景知识。在我们的方法中，我们假设推理者有一个影子数据集。特别是，如果推理者知道的话，影子数据集可能具有与预训练数据分布相同的分布。否则，我们假设影子数据集与预训练数据集具有不同的分布。此外，如果推断者不知道编码器架构（或训练算法），我们认为推断者可以假设一个并基于假设进行成员推理。

我们的编码器MI。对比学习中的一个重要模块是数据增强。粗略地说，给定一个输入，数据增强模块通过对输入应用一系列随机操作（例如，随机灰度、随机调整裁剪）来创建另一个随机输入（称为增强输入）。我们观察到对比学习本质上旨在预训练图像编码器，以便它为从同一输入创建的两个增强输入输出相似的特征向量。 EncoderMI 基于这一观察。具体来说，当图像编码器过度拟合其预训练数据集时，它可能会为从预训练数据集（或不在）中的输入创建的增强输入，输出更（或更不）相似的特征向量。在 EncoderMI 中，推理者构建一个二元分类器（称为推理分类器）来预测输入是否是目标编码器的成员。粗略地说，如果目标编码器为从输入创建的增强输入生成相似的特征向量，我们的推理分类器就会预测输入是目标编码器的成员。接下来，我们讨论如何构建推理分类器。

给定影子数据集，我们首先将其分成两个子集，即影子成员数据集和影子非成员数据集。然后，我们基于推理器的已知条件使用影子成员数据集预训练编码器（称为影子编码器）（例如，推理者可以采用与预训练目标编码器相同的编码器架构和训练算法，如果他/她知道它们）。给定影子编码器和影子数据集，我们为影子数据集中的每个输入提取成员特征。特别地，给定影子数据集中的输入，我们首先创建个增强输入（通过用于训练影子编码器的训练算法的数据增强模块），然后使用阴影编码器为每个增强输入生成特征向量，最后使用相似性度量作为输入的成员特征，计算n个特征向量之间的 · ( − 1)/2 成对相似性得分集。鉴于这些成员特征，如果成员特征是从影子成员（或非成员）数据集中的输入创建的，我们通过将成员特征标记为“成员”（或“非成员”）来构建推理训练数据集。给定推理训练数据集，我们构建一个推理分类器来推理目标编码器的成员。我们考虑三种类型的分类器：基于向量的分类器、基于集合的分类器和基于阈值的分类器。给定输入和对目标编码器的黑盒访问，我们首先提取输入的成员特征，然后使用推理分类器来预测输入是否是目标编码器的成员。

评估。为了评估 EncoderMI，我们首先通过我们自己的预训练图像编码器在 CIFAR10、STL10 和 Tiny-ImageNet 数据集上进行实验。我们的实验结果表明，EncoderMI 在所有八种不同类型的背景知识下都可以实现高精度、精确度和召回率。例如，我们基于向量的推理分类器在八种背景知识下在 Tiny-ImageNet 上的准确率可以达到 88.7% - 96.5%。此外，EncoderMI 可以实现更高的准确性，因为推断者可以访问更多的背景知识。我们还应用 EncoderMI 来推断 OpenAI 发布的 CLIP 图像编码器的成员。特别是，我们从 Google 图像搜索和 Flickr 收集了 CLIP 图像编码器的一些潜在成员和基本事实非成员。我们的结果表明，即使推断者不知道 CLIP 图像编码器的预训练数据分布、编码器架构和训练算法，EncoderMI 也是有效的。

对策。当数据所有者使用 EncoderMI 审计数据滥用时，编码器提供者可能会采取针对 EncoderMI 的反制措施来逃避审计。当攻击者使用 EncoderMI 破坏预训练数据隐私时，可以采取反制措施来增强隐私。由于 EncoderMI 利用目标编码器对其训练数据的过度拟合，我们可以利用防止过度拟合的对策。特别是，我们推广了早期停止，这是一种最先进的基于过度拟合预防的对策，用于防止对分类器的成员推理，以减轻对预训练编码器的成员推理。粗略地说，early stopping 的思想是用较少的 epoch 训练目标编码器，以防止过拟合。我们的结果表明，它在 EncoderMI 的准确性和目标编码器的实用性之间实现了权衡。更具体地说，它会降低我们的 EncoderMI 的准确性，但也会导致基于目标编码器构建的下游分类器的分类准确性损失。

总之，我们在这项工作中做出了以下贡献：

• 我们提出了 EncoderMI，第一个针对对比学习的成员推理方法。
• 我们进行了大量实验来评估我们在 CIFAR10、STL10 和 Tiny-ImageNet 数据集上的 EncoderMI。此外，我们将 EncoderMI 应用于 CLIP 的图像编码器。
• 我们评估了针对EncoderMI 的基于早期停止的对策。我们的结果表明，它在 EncoderMI 的准确性和编码器的实用性之间实现了权衡。

2.对比学习的背景

给定大量未标记的图像或（图像，文本）对（称为预训练数据集），对比学习旨在预训练一个神经网络（称为图像编码器），该网络可用作许多下游任务的特征提取器（例如，图像分类）。给定输入图像，预训练图像编码器为其输出特征向量。

2.1 预训练一个编码器

对比学习中的一个重要模块是数据增强。给定一个输入图像，数据增强模块可以通过一系列随机操作（例如随机灰度、随机调整大小裁剪等）创建另一个随机输入（称为增强输入）。增强输入和原始输入具有相同的大小。此外，我们可以使用数据扩充模块为每个输入创建多个扩充输入。粗略地说，对比学习的想法是预训练图像编码器，使其为从相同（或不同）输入创建的两个增强输入输出相似（或不同）的特征向量。对比学习将这种相似性表述为对比损失，图像编码器经过训练将其最小化。接下来，我们介绍三种流行的对比学习算法，即 MoCo 、SimCLR和 CLIP ，以进一步说明对比学习的思想。

MoCo：MoCo 在未标记图像上预训练图像编码器。 MoCo 中包含三个主要模块：图像编码器（表示为ℎ）、动量编码器（表示为ℎ）和字典（表示为Γ）。图像编码器输出输入或增强输入的特征向量。动量编码器与图像编码器具有相同的架构，但与图像编码器相比更新速度要慢得多。给定输入或增强输入，动量编码器也为其输出一个向量。为了与特征向量区别，我们称之为关键向量。字典模块维护一个由动量编码器输出的关键向量队列，用于存储从前几个小批量中的输入创建的增强输入。此外，字典在图像编码器的预训练期间动态更新。

给定个输入的小批量，MoCo 为小批量中的每个输入创建两个增强输入。两个增强输入分别传递给图像编码器和动量编码器。为简单起见，我们使用 u 和 u 来表示这两个增强输入。给定两个增强输入，图像编码器 ℎ，动量编码器 ℎ 和字典 Γ，MoCo 定义对比损失如下：

其中是自然指数函数，计算两个向量之间的余弦相似度，代表温度参数。最终的对比损失与对应于个输入的个（即的）增强输入的对比损失ℓ（u）相加。 MoCo 通过最小化最终对比损失来预训练图像编码器。最后，动量编码器为个增强输入（即）输出的个关键向量（即 ℎ (u)）被入队到字典中，而N个最老的关键向量批次出列。

SimCLR ：与 MoCo 类似，SimCLR 也尝试在未标记图像上预训练图像编码器。给定个输入的小批量，SimCLR 通过数据扩充为小批量中的每个输入创建两个扩充输入。给定 2 · 个增强输入（表示为 {u1, u2, · · · , u2· }），SimCLR 旨在预训练图像编码器，使其为从相同（或不同）的输入创建的两个增强输入输出相似（或不同）的特征向量。形式上，给定一对从同一输入创建的增强输入 (u, u) ，对比损失定义如下：

其中 $\mathbb{I}$ 是指示函数，是自然指数函数，计算两个向量之间的余弦相似度，ℎ 是图像编码器，是投影头，是温度参数。最后的对比损失是所有 2· 对增强输入的对比损失 ℓ 的总和，其中每个输入对应于两对增强输入 (u, u) 和 (u, u)。SimCLR 通过最小化最终对比损失来预训练图像编码器。

CLIP：CLIP 在未标记（图像、文本）对上联合预训练图像编码器和文本编码器。特别是，文本编码器将文本作为输入并为其输出特征向量。给定一小批（图像，文本）对，CLIP 从每个输入图像创建一个增强输入图像。对于每个增强输入图像，CLIP 使用增强输入图像和最初与创建增强输入图像的输入图像配对的文本形成正确的（图像，文本）对，并且 CLIP 形成（-1）不正确的对使用增强输入图像和剩余的 ( − 1) 个文本。因此，总共有个正确对和 · ( −1) 个错误对。 CLIP 联合预训练图像编码器和文本编码器，使得对于正确（或不正确）的（图像，文本）对，图像编码器为增强输入图像输出的特征向量与（或不相似）文本编码器为文本输出的特征向量。

观察：我们观察到这些对比学习算法试图预训练一个图像编码器，该编码器为从相同输入创建的两个增强输入输出相似的特征向量。具体来说，我们可以根据对比损失的定义对 MoCo和 SimCLR 进行观察。对于 CLIP，给定一个（图像，文本）对，图像编码器为图像的增强版本输出的特征向量类似于文本编码器为文本输出的特征向量。因此，图像编码器为从输入图像创建的两个增强输入输出的特征向量是相似的，因为它们都与文本编码器为给定文本输出的特征向量相似。正如我们将在第 4 节中讨论的那样，我们的 EncoderMI 利用这种观察来推断图像编码器预训练数据集的成员。

2.2 训练下游分类器

图像编码器可用作许多下游任务的特征提取器。我们认为这项工作中的下游任务是图像分类。特别是，假设我们有一个带标签的数据集（称为下游数据集）。我们首先使用图像编码器为下游数据集中的输入提取特征向量。然后，我们按照标准的监督学习使用提取的特征向量以及相应的标签来训练分类器（称为下游分类器）。给定来自下游任务的测试输入，我们首先使用图像编码器为其提取特征向量，然后使用下游分类器为提取的特征向量预测标签。预测标签被视为测试输入的预测结果。

3.问题定义

3.1 威胁模型

推理者的目标：给定输入图像 x，推断器旨在推断它是否在图像编码器（称为目标编码器）的预训练数据集中。如果输入在其预训练数据集中，我们将输入称为目标编码器的成员，否则我们将输入称为非成员。推断器的目标是在推断目标编码器的成员/非成员时实现高精度。

推断者的背景知识：我们认为推断者可以通过黑盒访问目标编码器。我们注意到，对于推断者来说，这是最困难和最普遍的情况。一个典型的应用场景是编码器提供商预训练一个编码器，然后向下游客户提供API。编码器的预训练取决于三个关键维度，即预训练数据分布、编码器架构和训练算法（例如，MoCo、SimCLR）。因此，我们沿着这三个维度来刻画推断者的背景知识。

预训练数据分布。该背景知识表征推断者是否知道目标编码器的预训练数据集的分布。特别是，如果推断者知道分布，我们假设他/她可以访问与预训练数据集具有相同分布的影子数据集。否则，我们假设推断者可以访问与预训练数据集具有不同分布的影子数据集。请注意，在这两种情况下，我们都认为影子数据集与预训练数据集没有重叠。为简单起见，我们使用 P 来表示背景知识的这一维度。

编码器架构。推断器可能知道也可能不知道目标编码器的架构。当推断者不知道目标编码器架构时，推断者可以假定一个并基于假定的进行成员推理。例如，当目标编码器使用 ResNet 架构时，推理器在执行成员推理时可能会采用 VGG 架构。我们用 E 来表示背景知识的这个维度。

训练算法。该维度表征推断者是否知道用于训练目标编码器的对比学习算法。当推断者不知道训练算法时，推断者可以根据假设的算法进行隶属度推断。例如，当目标编码器的训练算法是 MoCo时，推断器可以通过假设训练算法是 SimCLR 来执行成员推理。我们用 T 来表示背景知识的这个维度。

我们使用三元组 B = (P, E, T) 来表示推断者背景知识的三个维度。 B 中的每个维度都可以是“是”或“否”，其中一个维度是“是”（或“否”），当相应的背景知识维度对推断者可用（或不可用）时。因此，我们总共有八种不同类型的背景知识。例如，推断器知道预训练数据分布、目标编码器的体系结构和/或当编码器提供者公开它们以增加透明度和信任时的训练算法。
推断器的能力：推理者可以向目标编码器查询任何输入或增强输入的特征向量。

3.2 成员推理

给定推理者的目标、背景知识和能力，我们定义我们的对比学习的成员推理如下：

定义 3.1（对比学习的成员推理）。给定对目标编码器的黑盒访问、背景知识 B = (P, E, T) 和输入，成员推理旨在推断输入是否在目标编码器的预训练数据集中。

4 我们的工作

4.1 概述

回想一下，目标编码器被训练为为预训练数据集中的输入的增强版本输出相似的特征向量。我们的 EncoderMI 基于这一观察。具体来说，当编码器过度拟合其预训练数据集时，编码器可能会输出相似程度更高（或更低）的特征向量，用于从预训练数据集中（或不在）的输入中创建的增强输入。因此，如果目标编码器为输入的增强版本生成相似的特征向量，我们的 EncoderMI 会推断输入是目标编码器的成员。具体来说，在 EncoderMI 中，推理器构建一个二元分类器（称为推理分类器），它根据我们为输入创建的某些特征预测输入的成员/非成员。为了区分目标编码器产生的特征向量，我们将推理分类器使用的特征称为成员特征。基于目标编码器生成的某个输入增强版本的特征向量之间的相似性分数，我们生成此输入的成员特征。构建我们的推理分类器需要一个由已知成员和非成员组成的训练数据集（称为推理训练数据集）。为了构建推理训练数据集，我们将推理者的影子数据集分成两个子集，分别称为影子成员数据集和影子非成员数据集。然后，推断器使用影子成员数据集预训练一个编码器（称为影子编码器）。我们基于影子编码器和影子数据集构建了一个推理训练数据集。具体来说，影子成员（或非成员）数据集中的每个输入都是影子编码器的成员（或非成员），我们基于影子编码器为影子数据集中的每个输入创建成员特征。在基于推理训练数据集构建推理分类器后，我们将其应用于推理目标编码器的成员/非成员。

4.2 构建推理分类器

我们首先介绍如何在阴影数据集上训练阴影编码器。然后，我们讨论如何为输入提取成员特征。最后，我们讨论了如何基于影子编码器和影子数据集构建推理训练数据集，并根据构建的推理训练数据集，讨论如何构建推理分类器。

训练影子编码器：我们的 EncoderMI 的第一步是训练一个影子编码器，其基本事实成员/非成员为推理者所知。为简单起见，我们使用 $h\tilde{}$ 来表示阴影编码器。特别是，推理者将其影子数据集 D 分成两个不重叠的子集：影子成员数据集（表示为 $D_{s}^{m}$ ）和影子非成员数据集（表示为 $D_{s}^{nm}$ ）。然后，推理者使用影子成员数据集 $D_{s}^{m}$ 预训练影子编码器。如果推理者可以访问目标编码器的架构（或训练算法），则推理者对影子编码器使用相同的架构（或训练算法），否则推理者假定影子编码器的架构（或训练算法）。我们注意到影子成员（或非成员）数据集中的每个输入都是影子编码器的成员（或非成员）。

提取成员特征：对于影子数据集中的每个输入，我们基于影子编码器 $h\tilde{}$ 提取其成员特征。我们的成员特征基于以下关键观察：通过对比学习预训练的编码器（例如，目标编码器、影子编码器）会为编码器预训练数据集中的输入增强版本生成相似的特征向量。因此，给定一个输入 x，我们首先使用用于预训练阴影编码器的训练算法的数据增强模块 A 创建个增强输入。我们将个增强输入表示为 $x^{1}$ , $x^{2}$ , · · · , $x^{n}$ 。然后，我们使用影子编码器为每个增强输入生成一个特征向量。我们用 $h\tilde{}$ ( $x^{i }$ ) 表示阴影编码器 $h\tilde{}$ 为增强输入 $x^{i }$ 生成的特征向量，其中 = 1, 2, · · · , 。对于输入 x 的成员特征由个特征向量之间的成对相似性分数集组成。正式地，我们有：

其中 M (x, $h\tilde{}$ ) 是我们基于编码器 $h\tilde{}$ 的输入 x 的成员特征， (·, ·) 衡量两个特征向量之间的相似性（例如， (·, ·) 可以是余弦相似性）。请注意，为简单起见，我们省略了 M (x, $h\tilde{}$ ) 对、A 和的显式依赖。在 M (x, $h\tilde{}$ ) 中有 · ( − 1)/2 个相似度分数，如果输入 x 是阴影编码器 $h\tilde{}$ 的成员，它们往往会很大。

构建推理训练数据集：给定影子成员数据集 $D_{s}^{m}$ 、影子非成员数据集 $D_{s}^{nm}$ 和影子编码器 $h\tilde{}$ ，我们构建推理训练数据集，用于构建推理分类器。特别地，给定输入 x ∈ $D_{s}^{m}$ ，我们提取其成员特征 M (x, $h\tilde{}$ ) 并为其分配标签 1；给定输入 x ∈ $D_{s}^{nm}$ ，我们提取其成员特征 M (x, $h\tilde{}$ ) 并为其分配标签 0，其中标签 1 表示“成员”，标签 0 表示“非成员”。形式上，我们的推理训练数据集（表示为 E）如下：

构建推理分类器：给定推理训练数据集 $\varepsilon$ ，我们构建一个二元推理分类器。我们考虑三种类型的分类器，即基于向量的分类器、基于集合的分类器和基于阈值的分类器。这些分类器以不同的方式使用成员特征。接下来，我们一一讨论。

基于向量的分类器 (EncoderMI-V)。在基于向量的分类器中，我们将输入的成员特征集 M (x, $h\tilde{}$ ) 转换为向量。具体来说，我们将 M (x, $h\tilde{}$ ) 中的 · ( −1)/2 相似度分数降序排列。我们将排序操作应用于推理训练数据集 $\varepsilon$ 中每个输入的成员特征。然后，我们按照标准的监督学习程序在 $\varepsilon$ 上训练基于向量的分类器（例如，完全连接的神经网络）。我们使用 $f_{v}$ 来表示基于向量的分类器。此外，我们使用 EncoderMI-V 来表示此方法。

基于集合的分类器 (EncoderMI-S)。在基于集合的分类器中，我们直接对输入的成员特征集合 M (x, $h\tilde{}$ ) 进行操作。特别是，我们基于 $\varepsilon$ 训练基于集合的分类器（例如 DeepSets）。基于集合的分类器将集合（即 M (x, $h\tilde{}$ )）作为输入并预测标签 ( 1 或 0)。基于集合的分类器需要是输入集合置换不变的，即预测标签不依赖于集合元素的顺序。因此，基于集合的分类器和基于向量的分类器需要截然不同的神经网络架构。此外，基于集合的分类通常比基于向量的分类更难。为简单起见，我们使用 $f_{s}$ 来表示基于集合的分类器，并使用 EncoderMI-S 来表示此方法。

基于阈值的分类器 (EncoderMI-T)。在基于阈值的分类器中，我们使用输入的 M (x, $h\tilde{}$ ) 中的平均相似度得分来推断其成员资格。特别是，当且仅当其成员特征 M (x, $h\tilde{}$ ) 的平均相似度得分不小于阈值时，我们基于阈值的分类器才预测输入是成员。关键的挑战是确定基于阈值的分类器在成员推理时实现高精度的阈值。给定一个阈值，我们使用（）（或（））来表示影子成员（或非成员）数据集中输入的数量，其平均相似性得分在M（x， $h\tilde{}$ ）中小于（或不小于）。阴影数据集的阈值为时，基于阈值的分类器的准确度为1 − ( () + ()) / |D |。我们的基于阈值的分类器使用最佳阈值 ∗ 最大化这种精度，即使得 () + ()最小化。如果我们将影子成员和影子非成员的平均相似度得分的概率分布绘制为两条曲线，其中 x 轴是平均相似度得分，y 轴是随机影子成员（或非成员）出现的概率有平均相似度得分，那么阈值 ∗ 就是两条曲线的交点。

Yeom 等人和宋等人利用类似的基于阈值的策略进行成员推理。与我们不同的是，他们的方法是为分类器设计的，并且基于分类器输出的置信度分数。

4.3 推断成员

给定对目标编码器ℎ的黑盒访问和输入x，我们使用推理分类器 $f_{v}$ （或 $f_{s}$ 或 $f_{t}$ ）来预测输入x是否是目标编码器ℎ的成员。算法 1 显示了我们的方法。

给定输入 x、数据增强模块 A 和整数，函数 Augmentation 产生个增强输入。我们使用目标编码器 ℎ 为每个增强输入生成一个特征向量，然后我们计算成对相似性分数集作为输入 x 的成员特征 M (x, ℎ)。最后，我们使用推理分类器根据提取的成员特征来推断输入 x 的成员状态。Ranking 函数按降序排列 M (x, ℎ) 中的相似度分数，而 Average 函数计算 M (x, ℎ) 中相似度分数的平均值。

5. 实验

在本节中，我们在对未标记图像进行预训练的图像编码器上评估 EncoderMI。在第 6 节中，我们将 EncoderMI 应用于 CLIP，它在未标记（图像、文本）对上进行了预训练。

5.1 实验设置

数据集：我们在 CIFAR10、STL10 和 Tiny-ImageNet 数据集上进行实验。

• CIFAR10。 CIFAR10 数据集包含来自 10 个对象类别的 60,000 张彩色图像。特别是，数据集包含 50,000 张训练图像和 10,000 张测试图像。每幅图像的大小为 32×32。
• STL10。 STL10 数据集包含来自 10 个类别的 13,000 张带标签的彩色图像。具体来说，数据集分为5000张训练图像和8000张测试图像。我们注意到 STL10 数据集还包含 100,000 张未标记的图像。该数据集中每张图像的大小为 96×96。
• Tiny-ImageNet。 Tiny-ImageNet 数据集包含来自 200 个类别的 100,000 张训练图像和 10,000 张测试图像。每个类有 500 个训练图像和 50 个测试图像。每个图像的大小为 64 × 64。

训练目标编码器：对于 CIFAR10 或 Tiny-ImageNet，我们从其训练数据中随机抽取 10,000 张图像作为预训练数据集来训练目标编码器；对于 STL10，我们从其未标记的数据中直接抽取 10,000 张图像作为预训练数据集。默认情况下，我们使用 ResNet18 作为目标编码器的架构。此外，我们使用 MoCo在预训练数据集上预训练目标编码器。在预训练我们的目标编码器时，我们采用具有默认参数设置的公开可用的 MoCo v1 实现。除非另有说明，否则我们训练目标编码器 1,600 个时期。对于 CIFAR10 或 Tiny-ImageNet，我们将其 10,000 个测试图像视为目标编码器的“非成员”。对于 STL-10，我们将其 5,000 个训练图像和前 5,000 个测试图像视为目标编码器的“非成员”目标编码器。因此，除非另有说明，对于每个目标编码器，我们有 10,000 个基本事实成员和 10,000 个基本事实非成员。

训练影子编码器：在推断器知道目标编码器的预训练数据分布的场景下，我们从相应数据集的训练或未标记数据中随机抽取 20,000 张图像作为影子数据集。在inferrer不知道预训练数据分布的场景下，当预训练数据集来自STL-10时，我们从CI FAR10的训练数据中随机抽取20,000张图像作为影子数据集，我们随机抽取20,000张当预训练数据集为 CIFAR10 或 Tiny-ImageNet 时，来自 STL-10 未标记数据的图像作为阴影数据集。

我们将影子数据集随机分成两个不相交的集合，即影子成员数据集和影子非成员数据集，每个数据集包含 10,000 张图像。我们使用影子成员数据集训练影子编码器。如果推断者知道目标编码器的架构，我们对影子编码器采用相同的架构（即 ResNet18），否则使用带有批量归一化的 VGG-11 。如果推断者知道用于预训练目标编码器的算法，我们采用相同的训练算法（即 MoCo）来预训练影子编码器，否则采用 SimCLR 。在我们的实验中，我们使用公开可用的实现和两种训练算法的默认参数设置。我们训练每个阴影编码器 1,600 个时期。

构建推理分类器：我们基于影子数据集和影子编码器构建推理分类器。 EncoderMI-V 使用基于向量的推理分类器。我们使用具有两个隐藏层的完全连接的神经网络作为我们的基于向量的分类器。
特别地，两个隐藏层中的神经元数量均为 256。EncoderMI-S 使用基于集合的推理分类器。我们选择 DeepSets [53] 作为我们基于集合的推理分类器。此外，我们在实现中采用了 DeepSets [2] 的公开可用代码。对于基于向量的分类器和基于集合的分类器，我们采用交叉熵作为损失函数，并使用初始学习率为 0.0001 的 Adam 优化器训练 300 个 epoch。请注意，EncoderMI-T 利用基于阈值的分类器，不需要训练。

评估指标：继之前的工作之后，我们采用准确度、精确度和召回率来评估成员推理方法。给定包含目标编码器的真实成员和非成员的评估数据集，方法的准确性是方法正确预测的真实成员/非成员的比率；方法的精度是其预测成员中确实是成员的分数；方法的召回率是通过该方法预测为成员的基本事实成员的分数。
比较方法：现有的成员推理方法旨在推断分类器或文本嵌入模型的成员。我们将这些方法概括为对比学习设置作为基线方法。特别是，我们将我们的方法与以下五种基线方法进行比较，其中前三种用于下游分类器，而后两种用于编码器。

基线-A。目标编码器用于为下游任务训练下游分类器。因此，在这种基线方法中，我们使用目标编码器为下游任务训练下游分类器（称为目标下游分类器），然后我们将现有的成员推理方法应用于目标下游分类器。特别是，我们将 CIFAR10 视为下游任务，我们随机抽取 10,000 个其训练示例作为下游数据集。下游数据集与预训练数据集和影子数据集没有重叠。给定阴影编码器和下游数据集，我们通过使用阴影编码器作为特征提取器来训练下游分类器（称为阴影下游分类器）。我们查询影子下游分类器输出的影子成员（或非成员）数据集中每个输入的置信度得分向量，并将其标记为“成员”（或“非成员”）。给定这些置信度得分向量以及相应的标签，我们训练了一个基于向量的推理分类器。对于给定的输入，我们首先查询目标下游分类器输出的置信度得分向量，然后使用推理分类器预测它是否是目标编码器的成员。请注意，在之前的工作之后，我们对输入的置信度分数进行排名，这优于未排名的置信度分数。

基线-B。 Choquette-Choo 等人提出了对分类器的仅标签成员推理。粗略地说，他们基于输入的一些增强版本为输入构建一个二进制特征向量。当且仅当相应的增强版本被目标分类器正确预测时，特征向量的条目为 1。这种仅标签成员推理方法需要输入的基本事实标签。预训练数据在对比学习中没有标记，使得该方法在实践中不适用于推断编码器的成员。然而，由于预训练数据 CIFAR10 和 Tiny-ImageNet 在我们的实验中具有真实标签，我们假设推断者知道它们并且我们评估仅标签方法。请注意，当预训练数据集来自 STL10 时，我们无法评估此方法，因为它们未标记。与 Baseline-A 类似，我们还将此方法应用于目标下游分类器以推断目标编码器的成员。对于影子数据集中的每个输入 x，我们创建增加了 puts。此外，我们使用阴影下游分类器来预测 x 的标签和每个增强输入。我们构造一个二元向量 (0, 1, 2, · · · , ) 作为 x 的隶属特征，其中 0 = 1（或 = 1）当且仅当影子下游分类器正确预测 x 的标签（或第个增广输入），其中 = 1, 2, · · · , 。如果输入在影子成员（或非成员）数据集中，我们将输入的成员特征标记为“成员”（或“非成员”）。给定成员特征及其标签，我们训练了一个基于向量的推理分类器。然后，我们使用推理分类器通过目标下游分类器推理目标编码器的成员。我们在实验中设置 = 10。

基线-C。宋等。 [48] 开发了针对分类器的基于对抗样本的成员推理方法。具体来说，他们利用目标分类器为从输入制作的对抗性示例产生的置信度分数来推断输入是否在目标分类器的训练数据集中。例如，他们基于目标对抗样本的方法（在 [48] 的第 3.3.1 节中讨论）首先为输入制作 − 1 个目标对抗样本（每个标签的目标对抗样本不是输入的真实标签） ), 然后使用目标分类器计算它们每个的置信度分数，最后将置信度分数连接为输入的成员特征，其中是目标分类器中的类数。他们为目标分类器的每一类训练一个推理分类器，并使用与输入的真实标签相对应的推理分类器来推断其成员资格。输入的对抗性示例可以被视为输入的增强版本。因此，我们在实验中考虑了这些方法。我们注意到，这些方法需要输入的真实标签，而真实标签是下游分类器的一类。然而，在对比学习中，预训练数据通常没有标签。此外，即使预训练数据有标签，它们的标签也可能与下游分类器的标签不同。因此，我们将基于目标对抗示例的方法应用于我们设置中的下游分类器。具体来说，给定输入 x，我们使用 PGD [33] 基于影子下游分类器生成得到的对抗样本，其中是影子下游分类器的类数。然后，我们获得影子下游分类器为目标对抗样本输出的置信度得分向量，并将它们连接为 x 的成员特征。最后，我们根据影子数据集中输入的成员特征训练一个基于向量的推理分类器，并将其应用于通过目标下游分类器推理目标编码器的成员。此外，在 [48] 之后，我们在生成目标对抗样本时将扰动预算（即）设置为 8/255。

基线-D。在这种基线方法中，我们认为推断器将目标编码器视为分类器。换句话说，推断器将目标编码器为输入输出的特征向量视为分类器输出的置信度得分向量。因此，我们可以应用基于置信度得分向量的方法 [42、44] 来推断目标编码器的成员。具体来说，给定一个阴影编码器，我们使用它为相应阴影数据集中的每个输入输出一个特征向量。此外，我们将标签“成员”（或“非成员”）分配给影子成员（或非成员）数据集中输入的特征向量。然后，我们使用特征向量及其标签训练基于向量的推理分类器。给定目标编码器和输入，我们首先获得目标编码器为输入生成的特征向量。
然后，基于特征向量，推理分类器预测输入是目标编码器的成员还是非成员。

基线-E。宋等。 [46] 研究了文本域中嵌入模型的成员推理。他们的方法可以用来推断一个句子是否在文本嵌入模型的训练数据集中。特别是，他们使用中心词和句子中每个剩余词的嵌入向量之间的平均余弦相似度来推断句子的隶属关系。我们将此方法扩展到我们的设置。具体来说，我们可以将图像视为一个“句子”，将图像的每个补丁视为一个“词”。然后，我们可以使用图像编码器为每个补丁生成一个特征向量。我们将中心补丁视为中心词，并计算其与每个剩余补丁的余弦相似度。最后，我们使用平均相似度得分来推断原始图像的隶属度。具体来说，如果平均相似度得分大于阈值，则图像被预测为成员。与我们的 EncoderMI-T 类似，我们使用影子数据集来确定最佳阈值，即我们使用在影子数据集上实现最大推理精度的阈值。在我们的实验中，我们将图像均匀地分成 3 × 1（即 3）、3 × 3（即 9）或 3 × 5（即 15）个不相交的块。我们发现 3 × 3 的性能最好，所以我们将在正文中显示 3 × 3 的结果，并将 3 × 1 和 3 × 5 的结果推迟到附录中。

参数设置：我们为我们的方法采用以下默认参数：我们设置 = 10，我们采用余弦相似度作为我们的相似度度量，因为所有对比学习算法都使用余弦相似度来衡量两个特征向量之间的相似度。默认情况下，我们假设推断器知道目标编码器的预训练数据分布、编码器架构和训练算法。除非另有说明，否则我们将 CIFAR10 上的结果显示为预训练数据集。当推断器不知道目标编码器的训练算法时，我们假设推断器在查询目标编码器时仅使用随机调整大小的裁剪来获得输入的增强版本，因为我们发现这种数据增强实现了最佳性能。请注意，我们将 STL10 和 Tiny-ImageNet 中的每个图像调整为 32 × 32 以与 CIFAR10 保持一致。

5.2 实验结果

现有的成员推理方法不足：表 1 显示了五种基线方法的准确度、精确度和召回率。请注意，我们考虑的是在我们的威胁模型中具有最强背景知识的推断者，即推断者知道预训练数据分布、编码器架构和训练算法。换句话说，阴影编码器是在背景知识 B = ( √ , √ , √ ) 中训练的。我们发现 Baseline-A、Baseline-B、Baseline-C 和 Baseline-D 的准确率接近 50%，即它们的准确率接近随机猜测，其中输入被预测为概率为 0.5 的成员或非成员。原因是它们旨在推断分类器而不是编码器的成员。置信度得分向量可以捕捉到分类器是否对输入过度拟合，而特征向量本身并不能捕捉到编码器是否对输入过度拟合。因此，这些成员推理方法可以推断分类器的成员，但不能推断编码器的成员。Baseline-E 优于随机猜测。原因是输入的补丁可以看作是输入的增强版本，并且补丁之间的相似性分数在某种程度上捕获了图像编码器的过度拟合。然而，与我们的 EncoderMI 相比，Baseline-E 的准确性仍然很低。

我们的方法是有效的：表 2、5（附录）和 6（附录）显示了我们的方法在 CIFAR10、STL-10 和 Tiny-ImageNet 的 8 种不同类型的背景知识下的准确度、精确度和召回率数据集，分别。结果取五次试验的平均值。首先，我们的方法在所有 8 种不同类型的背景知识下都有效。例如，我们的 EncoderMI-V 在 8 种背景知识下在 Tiny-ImageNet 上的准确率可以达到 88.7% - 96.5%。其次，我们发现在大多数情况下，EncoderMI-V 比 EncoderMI-S 和 EncoderMI-T 更有效。特别是，EncoderMI-V 在大多数情况下比 EncoderMI-S 和 EncoderMI-T 实现更高的准确度（或准确率或召回率）。我们怀疑 EncoderMI-V 优于 EncoderMI-S，因为基于集合的分类通常比基于向量的分类更具挑战性，因此将成员推理视为基于向量的分类问题可以获得更好的推理性能。我们的 EncoderMI-T 可以实现与 EncoderMI-S 相似的准确度、精确度和召回率，这意味着输入图像的平均成对余弦相似度得分已经提供了有关输入成员状态的丰富信息。第三，我们的方法实现了比精确率更高的召回率，即我们的方法将更多的输入预测为成员而不是非成员。
第四，当推断者的背景知识较少时，标准差往往较大。这是因为成员推理在背景知识较少的情况下不太稳定。

图 1a 显示了我们的三种方法在背景知识 B = ( √ , √ , √ ) 下的精确召回权衡。这些曲线是通过调整三个推理分类器中的分类阈值以产生不同的精度和召回率而获得的。我们的结果表明，随着召回率增加到 0.9 左右，精度略有下降，然后随着召回率的进一步增加而急剧下降。

推断者背景知识的影响：根据表 2、5 和 6，我们对推断者背景知识对我们方法的影响有三个主要观察结果。首先，EncoderMI-V 的准确率更高，因为推断者可以访问更多的背景知识，在大多数情况下，我们对 EncoderMI-S 和 EncoderMI-T 的观察结果相同。

例如，当推断者知道背景知识的所有三个维度时，EncoderMI-V 达到 96.5% 的准确率，而当推断者不知道任何 Tiny-ImageNet 数据集的任何一个时，EncoderMI-V 达到 88.7% 的准确率。其次，在背景知识的三个维度中，训练算法对 STL10 和 Tiny-ImageNet 的信息量最大，而这三个维度对 CIFAR10 的贡献相同。例如，在 Tiny-ImageNet 上，当推断器只能访问训练算法时，EncoderMI-V 达到 94.1% 的准确率，而当推断器只能访问编码器架构和预训练数据分布。对于 CIFAR10，当推断器只能访问三个维度中的任何一个时，EncoderMI-V 的准确率约为 86.8%。第三，编码器架构和预训练数据分布之间没有明显的赢家。例如，单独访问预训练数据分布（即 B = ( √ , ×, ×)）比单独访问编码器架构（即 B = (×, √ , ×)）获得更高的准确度对于我们在 Tiny-ImageNet 上的所有三种方法，我们在 STL10 上观察到相反的 EncoderMI-V 和 EncoderMI-T。

的影响：图 1b 显示了增强输入的数量对我们的 CIFAR10 方法准确性的影响，其中推断者的背景知识为 B = ( √ , √ , √ )。我们观察到，对于 EncoderMI-V 和 EncoderMI-T，随着的增加，精度先增加然后饱和。然而，对于 EncoderMI-S，精度随着的增加先增加后减少。我们怀疑原因是随着的增加，成员特征中成对相似性得分的数量呈指数增长，使得基于集合的分类变得更加困难。 相似性度量的影响：表3显示了相似性度量对我们方法的影响，其中“相关性”是指皮尔逊相关系数。我们从实验结果中得到两个观察结果。首先，余弦相似度度量达到了最高的准确度（或准确率或召回率）。原因是余弦相似度度量也用于目标编码器的预训练。其次，当使用与目标编码器预训练中使用的相似性度量不同的相似性度量时，我们的方法仍然可以实现高精度（或精度或召回率）。

预训练数据集和影子数据集大小的影响：图 2 显示了预训练数据集和影子数据集的大小对我们三种方法的准确性的影响，其中推断者的背景知识为 B = ( √、√、√）。预训练数据集和影子数据集都是从STL10的未标记数据中随机抽取的，但它们没有重叠。请注意，我们在这些实验中没有使用 CIFAR10，因为它的数据集很小，我们无法对大尺寸的不相交的预训练和阴影数据集进行采样。首先，我们观察到我们的方法的准确性随着预训练数据集变小而增加。原因是当目标编码器的尺寸较小时，它更容易过度拟合预训练数据集。其次，我们的方法对影子数据集大小不太敏感。特别是，给定预训练数据集大小，当阴影数据集大小在 5,000 到 25,000 之间时，我们的三种方法中的每一种都达到了相似的精度。我们的结果表明，在各种大小的阴影数据集上预训练的阴影编码器可以在成员推理方面模仿目标编码器的行为。

数据扩充的影响：推断器使用的数据扩充操作可能与用于预训练目标编码器的操作不同。在这个实验中，我们明确地研究了数据扩充的影响。我们假设推断器使用四种常用数据增强操作的综合列表，即随机灰度、随机调整大小裁剪、随机水平翻转和颜色抖动。我们逐渐增加推断者的综合列表和目标编码器之间的重叠数据增强操作的数量。特别是，目标编码器从仅使用数据增强操作高斯模糊开始，这不在推断器的列表中。然后，我们按照以下顺序将推断器的数据增强操作一一添加到目标编码器的预训练模块中：随机灰度、随机调整大小裁剪、随机水平翻转和颜色抖动。我们为每个目标编码器计算下游分类器的成员推理精度和分类精度，其中下游分类器的构建与 Baseline-A 相同。图 3 显示了结果。我们观察到 referrer 和目标编码器之间的重叠数据增强操作的数量控制了成员推理准确性和目标编码器实用性之间的权衡，即目标编码器对成员推理的抵抗力更强，但下游分类器也更少当目标编码器使用引用者综合列表中较少的数据增强操作时准确。

6 将我们的方法应用于CLIP

CLIP 联合对从互联网收集的 4 亿对（图像、文本）图像编码器和文本编码器进行预训练。OpenAI 公开了图像编码器和文本编码器。我们将具有 ViT-B/32 架构的 CLIP 图像编码器视为目标编码器，并应用我们的 EncoderMI 来推断其成员。具体来说，给定一个输入图像，我们的目标是使用 EncoderMI 来推断它是否被 CLIP 使用。接下来，我们首先介绍实验装置，然后展示实验结果。

6.1 实验设置

潜在成员和已知非成员：为了评估我们的 EncoderMI for CLIP 图像编码器，我们需要一个由已知成员和非成员组成的评估数据集。但是，CLIP 的预训练数据集并未对外发布。因此，我们无法获得 CLIP 的已知成员。但是，我们可以收集一些图像，这些图像是 CLIP 预训练数据集的潜在成员和已知非成员。具体来说，根据 Radford 等人的说法。用于预训练 CLIP 的（图像，文本）对是根据一组 500,000 个流行关键字从互联网上收集的。因此，我们收集了以下两个评估数据集，每个数据集有 1,000 个潜在成员和 1,000 个已知非成员：

• 谷歌。我们使用 CIFAR100 的类名作为关键词，并使用谷歌图像搜索来收集图像。附录 A 显示了类名的完整列表，例如，“clock”、“house”和“bus”。特别是，我们使用公开可用的工具根据关键字从谷歌搜索中抓取图像。我们为每个关键字收集了 10 张图像，因此我们总共收集了 1,000 张图像。我们将这些图像视为潜在成员，因为它们也可能被 CLIP 收集和使用。为了构建真实的非成员，我们进一步使用关键字从谷歌搜索中收集了 2,000 张图像。我们将它们随机分成 1,000 对；对于每一对，我们将两张图片调整为相同大小，并将它们连接起来形成一张新图片，总共有 1,000 张图片。我们将这些图像视为已知非 CLIP 成员。
• Flickr。与上面的谷歌评估数据集类似，我们使用 100 个关键词和一个公开可用的工具从 Flickr 收集了一个评估数据集。具体来说，我们收集了 1,000 张图像作为潜在成员。此外，我们进一步收集了 2,000 张图像并将它们随机配对为 1,000 张图像，我们将其视为已知非成员。

我们承认，在我们的两个评估数据集中，一些潜在成员可能不是 CLIP 的真实成员。对于每个潜在成员和真实非成员，我们将它们的大小调整为 CLIP 的输入大小，即 224 × 224。

推理分类器：我们假设推理者不知道 CLIP 的预训练数据分布、编码器架构和训练算法，这是我们的 EncoderMI 最困难的场景。我们使用我们在第 5 节之前的实验中构建的推理分类器。具体来说，在我们之前的实验中，对于我们的三种方法（即 EncoderMI-V、EncoderMI-S 和 EncoderMI-T）中的每一种以及三种影子中的每一种数据集（即 CIFAR10、STL10 和 Tiny-ImageNet），我们构建了对应于 8 种背景知识的 8 个推理分类器。我们使用前面实验中背景知识B=(√,√,√)对应的推理分类器（即表2、表5、表6最后几行对应的推理分类器）来推理成员剪辑。给定一张输入图像，我们创建 10 个增强输入并使用 CLIP 的图像编码器为每个输入生成一个特征向量。然后，我们计算 10 个特征向量之间的 45 对余弦相似度得分，它们构成了输入图像的成员特征集。我们的推理分类器根据成员特征预测输入图像的成员状态。

6.2 实验结果

潜在成员和已知非成员的余弦相似度得分分布：回想一下，对于每个潜在成员或已知非成员，EncoderMI 构建由 45 个成对余弦相似度得分组成的成员特征。我们计算每个潜在成员或已知非成员的 45 个成对余弦相似性分数的平均值。图 4 显示了我们两个评估数据集中潜在成员和真实非成员的平均成对余弦相似度得分的直方图。我们观察到潜在成员和已知非成员在平均成对余弦相似性得分方面在统计上是可区分的。特别是，潜在成员往往比地面实况非成员具有更大的平均成对余弦相似性分数。

EncoderMI的效率：表 4 显示了 EncoderMI 的三个变体在应用于 CLIP 的图像编码器时基于不同阴影数据集的准确性、精确度和召回率。准确性、精确度和召回率是根据每个评估数据集中的 1,000 个潜在成员和 1,000 个真实非成员计算的。首先，我们观察到基于不同阴影数据集的 EncoderMI 实现了高精度，例如 0.66 – 0.75。我们的结果表明，过拟合存在于现实世界的图像编码器中，例如 CLIP。其次，EncoderMI 实现了比精度更高的召回率，这意味着 EncoderMI 将很大一部分潜在成员预测为成员。第三，与 Flickr 相比，我们的 EncoderMI 在 Google 上的召回率更高（或精度更低）。换句话说，我们的 EncoderMI 预测来自 Google 图像搜索的更多输入作为成员。原因是，平均而言，来自 Google 图像搜索的输入的平均成对余弦相似度得分大于来自 Flickr 的输入，如图 4 所示。

7 关于对策的讨论

通过提前停止防止过度拟合：回想一下，我们的 EncoderMI 利用了目标编码器在其预训练数据集上的过度拟合。请注意，目标编码器对其预训练数据集的过度拟合与分类器的过度拟合不同。例如，当分类器对其训练数据集过度拟合时，它可能在其训练数据集和测试数据集上具有不同的分类精度。此外，分类器为其训练数据集和测试数据集输出的置信度得分向量在统计上也是可区分的。给定一个输入，目标编码器为其输出一个特征向量。然而，特征向量本身并不能捕获目标编码器对输入的过度拟合。相反，当目标编码器过度拟合其预训练数据集时，它可能会为预训练数据集中的输入的增强版本输出更多相似的特征向量。

我们发现目标编码器在训练更多epoch时更适合其预训练数据集。回想一下，由我们的 EncoderMI 构造的输入的成员特征由 45 个成对余弦相似度分数组成。对于目标编码器的每个成员或非成员，我们计算其成员特征中的平均成对余弦相似度得分，并且我们进一步计算所有成员（或非成员）的平均成对余弦相似度得分。图 5a 显示了目标编码器成员和非成员的平均成对余弦相似度分数随着预训练时期数量的增加，其中预训练数据集基于 CIFAR10。我们观察到成员（或非成员）的平均成对余弦相似度随着时期数的增加而增加（或减少）。换句话说，目标编码器在预训练更多时期时更适合其预训练数据集。

我们的观察启发我们通过提前停止来防止过度拟合来对抗 EncoderMI，即预训练目标编码器的次数更少。我们针对我们的 EncoderMI 评估了基于提前停止的对策。特别是，我们在基于 CI FAR10 的预训练数据集上预训练目标编码器。在我们对目标编码器进行一些 epoch 的预训练之后，我们计算了我们的 EncoderMI-V 在背景知识 B = ( √ , √ , √ ) 下的准确率，我们还计算了基于目标构建的下游分类器的分类准确率编码器。如第 5 节所述，预训练数据集和下游数据集都是基于 CIFAR10 构建的，下游分类器的分类精度是基于 CIFAR10 的测试数据集计算的。图 5b 显示了我们的 EncoderMI-V 的成员推理精度和下游分类器的分类精度，因为我们对目标编码器进行了更多的预训练。我们观察到基于提前停止的防御实现了权衡，即它降低了成员推理的准确性，但也降低了下游分类器的分类准确性。我们注意到 Song 等人。发现针对分类器的成员推理，提前停止优于其他防止过度拟合的对策，并且他们还观察到提前停止的成员推理准确性和分类器效用之间的权衡。

差分隐私预训练：差分隐私可以为机器学习模型训练数据集中的每个输入提供正式的成员隐私保证。许多差分隐私学习算法已经被提出。这些算法在训练数据、目标函数或学习过程中通过（随机）梯度下降计算的梯度中添加噪声。例如，阿巴迪等人。提出了差分私有随机梯度下降（DP-SGD），它将随机高斯噪声添加到随机梯度下降计算的梯度中。将这些差异隐私学习算法推广到对比学习将是有趣的未来工作。特别地，当预训练数据集改变一个输入时，差分隐私对比学习算法学习的编码器并没有太大变化。然而，差分隐私也可能会给编码器带来很大的效用损失，即基于差分隐私编码器构建的下游分类器的分类精度可能会低得多。

对抗性学习：已经研究了基于对抗性学习的对策，以减轻对分类器的成员推理，其灵感来自基于对抗性学习的对抗属性推理攻击的对策。例如，Nasr 等人。 [34] 提出在训练目标分类器时向损失函数添加对抗性正则化项，其中对抗性正则化项对成员推理方法的准确性进行建模。贾等。提出了 MemGuard，它不修改训练过程，而是为每个输入的目标分类器输出的置信度得分向量添加精心设计的扰动。具体来说，这个想法是将扰动的置信度得分向量变成推理分类器的对抗样本，推理分类器根据扰动的置信度得分向量进行随机隶属度推理。将这些对策扩展到预训练的编码器将是有趣的未来工作。例如，我们可以将 EncoderMI 的准确性捕获为对抗性正则化项，并在使用对比学习对编码器进行预训练时将其添加到对比损失中；我们还可以为每个（增强的）输入的编码器输出的特征向量添加精心设计的扰动，这样由我们的 EncoderMI 为输入构建的成员特征集成为推理分类器的对抗样本，这使得随机成员基于扰动成员特征的推理。一个关键的挑战是如何找到对每个特征向量的这种扰动，因为成员特征取决于与输入的增强版本相对应的一组特征向量之间的成对相似性。

8 相关的工作

成员推理：在针对机器学习分类器的成员推理中，推理器旨在推断输入是否在分类器（称为目标分类器）的训练数据集中。例如，在 Shokri 等人提出的方法中。 [44]，推断者首先训练影子分类器来模仿目标分类器的行为。给定其基本事实成员和非成员为推理者所知的影子分类器，推理者训练推理分类器，然后将其应用于目标分类器的推理成员。塞勒姆等人。 [42] 通过放宽对推断者的假设进一步改进了这些方法。惠等。 [24] 提出了不需要训练影子分类器的盲目成员推理方法。在我们工作的同时，He 等人。 [22] 还研究了针对对比学习的成员推理。他们假设预训练数据和下游数据相同。具体来说，给定一个带标签的训练数据集，他们首先使用对比学习来预训练编码器，然后用它在带标签的训练数据集上微调分类器。他们试图通过将现有方法 [42、44] 应用于微调分类器来推断输入是否在标记的训练数据集中。
我们的方法与这些方法不同，因为它们旨在推断分类器的成员，而我们的方法旨在推断通过对比学习预训练的编码器的成员。我们的实验结果表明，当应用于推断编码器成员时，这些方法可以达到接近随机猜测的准确性。原因是分类器输出的置信度分数向量可以捕获分类器是否对输入过拟合，而编码器输出的特征向量本身不能捕获编码器是否对输入过拟合。
输入的增强版本的特征向量之间的相似性得分捕获编码器是否对输入过度拟合，我们的方法利用这种相似性得分来推断输入的成员状态。
现有的用于预训练模型 [8, 46] 的成员推理方法侧重于自然语言领域。例如，Carlini 等人。 [8] 提出了 GPT2 [39] 的成员推理方法，这是一种预训练的语言模型，他们进一步利用成员推理方法重建 GPT-2 的训练数据。具体来说，他们首先重建了一些候选文本，然后应用成员推理方法来确定每个候选文本的成员状态。据我们所知，之前没有研究过图像域中编码器的成员推理。

之前的工作 [23, 54] 还研究了针对迁移学习的成员推理。例如，Hidano 等人。 [23] 假设白盒访问教师模型的转移部分，而 Zou 等人。 [54]利用教师模型的后验。我们的工作与这些不同，因为预训练图像编码器不同于训练教师模型，因为前者对未标记数据使用对比学习，而后者对标记数据使用标准监督学习。
针对成员推理的对策：提出了许多对策 [9、29、31、34、42、44、47] 来对抗分类器的成员推理。第一类对策 [42、44、47] 试图在训练分类器时防止过度拟合，例如标准 2 正则化 [44]、dropout [42] 和提前停止 [47]。第二类对策 [7, 43] 基于差分隐私 [15]，这通常会给机器学习分类器带来很大的效用损失。第三类对策利用对抗性学习，例如对抗性正则化 [34] 和 MemGuard [29]。我们针对我们的 EncoderMI 探索了一种基于提前停止的对策。我们的结果表明，这种对策在成员推理准确性和编码器的实用性之间实现了权衡。
对比学习：对比学习 [10、13、17、20、37、40、50] 旨在通过利用未标记数据本身中的监督信号，对未标记数据的图像编码器进行预训练。未标记的数据可以是未标记的图像或（图像，文本）对。预训练编码器可用于许多下游任务。对比学习的关键思想是预训练图像编码器，使其为从同一输入图像创建的一对增强输入输出相似的特征向量，并为从不同输入图像创建的一对增强输入输出不同的特征向量。对比学习方法的示例包括我们在第 2 节中讨论的 MoCo [20]、SimCLR [10] 和 CLIP [38]。我们注意到 Jia 等人。 [28] 提出了 BadEncoder，它将后门嵌入到预训练的图像编码器中，使得基于后门编码器构建的多个下游分类器同时继承后门行为。

9 结论和后续工作

在这项工作中，我们提出了第一个针对通过对比学习预训练的图像编码器的成员推理方法。我们的方法利用图像编码器的过度拟合，即它为相同输入的两个增强版本生成更多相似的特征向量。我们自己在多个数据集上预训练的图像编码器以及真实世界图像编码器的实验结果表明，我们的方法可以实现高精度、精确度和召回率。此外，我们还发现基于提前停止的对策实现了成员推理准确性和编码器效用之间的权衡。
未来有趣的工作包括 1) 将我们的方法扩展到白盒设置，其中推理器可以访问目标编码器的参数，2) 扩展我们的方法以推断（图像，文本）对的成员关系，3）针对我们的方法开发新的对策，以及 4）探索预训练图像编码器的其他隐私/保密风险，例如窃取它们的参数 [49] 和超参数（例如，编码器架构）[51]。

你可能感兴趣的:(人工智能,深度学习,计算机视觉)

Python训练 + Go优化 + C#部署：端到端AI模型的跨语言实践威哥说编程人工智能学习资料库 python golang c#
在现代AI应用中，如何高效地训练、优化、并最终部署AI模型是一项复杂且具有挑战性的任务。在这一过程中，选择合适的编程语言和工具可以显著提高效率和系统的性能。Python作为AI领域的主流语言，具有丰富的深度学习框架（如PyTorch和TensorFlow），在模型训练方面处于领先地位。然而，针对计算密集型任务（如数据预处理、加密等），Go语言因其高效的并发处理和出色的性能，成为优化计算的理想选择。
DL00478-涡轮叶片缺陷检测数据集yolo格式1300张左右
涡轮叶片缺陷检测数据集yolo格式1300张左右涡轮叶片缺陷检测数据集YOLO格式解析：提升研究与论文写作的关键要点在研究涡轮叶片缺陷检测的过程中，数据集的选择和格式处理是一个至关重要的环节。特别是当你打算通过卷积神经网络（CNN）等深度学习模型进行缺陷检测时，数据集的标注和格式化直接影响到模型的训练效果和论文的质量。本文将重点探讨涡轮叶片缺陷检测数据集的YOLO格式，并分析如何利用这一格式为研究
京东零售重磅开源 | OxyGent：像搭乐高一样组装AI团队，实现群体智能京东零售技术零售开源人工智能
京东零售Oxygen团队正式开源发布多智能体协作框架——OxyGent。这一创新框架致力于帮助开发者高效组装多智能体协作系统，实现智能体间的无缝协作、弹性扩展与全链路可追溯。推动人工智能从“单点突破”迈向“群体智能”时代。OxyGent已在开源社区正式上线。开源地址：https://github.com/jd-opensource/OxyGent官网地址：https://oxygent.jd.co
具身智能的视觉-语言导航综述
24年2月来自曲阜师范、华东师大和哈工大的论文“Vision-LanguageNavigationwithEmbodiedIntelligence:ASurvey”。作为人工智能领域的长期愿景，具身智能的核心目标是提升智体与环境的感知、理解和交互能力。视觉-语言导航（VLN）作为实现具身智能的重要研究路径，致力于探索智体如何利用自然语言与人进行有效沟通，接收并理解指令，并最终依靠视觉信息实现精准导
具身智能：从理论到实践的跨越
具身智能（EmbodiedAI）的概念起源与发展是一个跨越半个多世纪的学术探索历程，其核心思想在不同学科的交叉碰撞中逐渐成型。以下从理论源头、技术奠基、术语演进三个维度展开解析，揭示这一概念的学术脉络与产业价值：一、理论源头：从图灵的哲学构想到认知科学的具身化转向1.图灵的"感官机器"设想（1950年）在人工智能奠基性论文《计算机器与智能》中，图灵提出了两种智能发展路径：抽象计算路径：如国际象棋等
Epoch 老兵发新帖人工智能
在深度学习和机器学习中，Epoch（轮次或周期）是一个核心训练概念，指模型在整个训练数据集上完成一次完整遍历的过程。以下是关于Epoch的详细解析：一、核心定义基本含义Epoch表示模型将所有训练数据完整学习一次的过程。例如：若训练集有10,000个样本，则1个Epoch即模型用这10,000个样本训练一轮。与相关概念的关系Batch（批次）：数据集被分割成的小组（如每批32个样本）。Iterat
Python --- day 10 Opencv模块的使用 AnAn__kang python opencv 开发语言
系列文章目录前言今天博主带大家进入Opencv的学习，这是一个专门针对处理图像和视频的一个模块，大家以理解为主，增强自己的编程思维，再后续我们训练模型时会大批量的处理图片时会经常用到这个模块。1OpenCV介绍OpenCV（开放源代码计算机视觉库）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成，用于图像处理、计算机视觉领域的算法实现。1.1OpenCV优势**开源免费：**完全
生命3.0时代，面对人工智能时代的到来，我们可以做些什么笃定的沙丁鱼
生命的定义生命的定义有很多，最为人所熟知的是在生物学上的定义，即生命是蛋白质存在的一种形式。但是，这种定义可能不太适用于未来的智能机器和外星文明，我们不能将我们对未来生命的思考局限在过去遇到过的物种，所以需要将生命定义得更广阔一些：生命是一个能保持自身复杂性并能进行复制的过程。复制的对象并不是由原子组成的物质，而是能阐明原子是如何排列的信息，这种信息由比特组成。换句话说：我们可以将生命看作一种自我
深度学习图像分类数据集—百种病虫害分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：百种病虫害识别分类，训练集45095张，验证集7508张，测试集22619张具体类别为以下：insect_classes=["rice_leaf_roller","rice_leaf_caterpillar
不正规不靠谱：假摩根士丹利内部群推荐绿色低碳减排平台骗局揭露!送一万体验资金做慈善全是假的! 易星辰分享普法
关于曝光网上摩根士丹利何晓斌宝丰能源节能减排在炒股群推荐智慧农业中粮仓平台骗局的文章，其内容主要揭示了近期频发的一种投资诈骗手段。以下是该骗局的主要特点和步骤：为什么明明跟老师对过视频，确认是本人，怎么还会被骗了?你有没有想过一个名人大咖怎么会有时间给你们一对一视频，其次我来给大家揭露一下，这个套路AI换脸骗局是一种利用人工智能技术，通过替换视频中的人脸来伪造身份或进行诈骗的行为。你的账户“余额”
车辆云端威胁情报共享系统的多维解析与发展路径百态老人大数据人工智能
第一部分：内容本质提取原始内容描述了一个闭环网络安全体系：“车辆实时上传异常行为日志至安全运营中心（VSOC），云端通过机器学习分析攻击模式并下发全局防御策略”。其核心架构包含：数据采集层：车辆端持续收集异常行为日志数据，包含CAN总线通信模式、网络流量特征及驾驶行为数据传输层：通过V2X通信协议和OTA更新通道实现车云双向通信分析层：安全运营中心(VSOC)采用CNN-BiSRU等深度学习模型进
假冒朱民！通达OA社科院朱民ST-balance项目就是假的，被骗亏损真相揭秘，亲身亏损经历正义青天
通达OA社科院朱民ST-balance项目不正规——杀猪盘不能提现投票骗局曝光！随着互联网的普及，数字经济蓬勃发展，各种线上平台如雨后春笋般涌现。然而，在这些看似繁荣的平台中，不乏一些黑平台，它们以欺诈手段骗取用户的财产，给人们的财产安全带来严重威胁！因此，我们有必要提高警惕，防范黑平台诈骗。针对网上素未谋面的牛散大咖，经济学家等推荐网上投资理财、数字经济，数字体育市场，人工智能项目，数字低碳，慈
基于深度学习的语音识别：从音频信号到文本转录 Blossom.118 机器学习与人工智能深度学习语音识别音视频人工智能机器学习线性代数计算机视觉
前言语音识别（AutomaticSpeechRecognition,ASR）是人工智能领域中一个极具挑战性和应用前景的研究方向。它通过将语音信号转换为文本，为人们提供了更加自然和便捷的人机交互方式。近年来，深度学习技术在语音识别领域取得了显著进展，极大地提高了语音识别的准确率和鲁棒性。本文将详细介绍如何使用深度学习技术构建一个语音识别系统，从音频信号的预处理到模型的训练与部署。一、语音识别的基本概
数字人系统：AI界的超级巨星，你准备好了吗？优秘智能UMI 数字人人工智能深度学习计算机视觉机器学习自然语言处理语言模型图像处理
在这个日新月异的科技时代，每一个创新的火花都可能点燃一场变革的燎原之火。今天，我们要聊的，正是那颗在AI领域熠熠生辉的璀璨新星——优秘数字人系统。它不仅仅是技术的飞跃，更是对未来生活方式的深刻重塑，一场关于人机交互、智能共生的美好预演。技术原理：深度解析与智能构建的奥秘1.深度学习：智能的基石数字人系统的核心技术之一在于深度学习。深度学习是一种模仿人脑神经网络结构和功能的机器学习技术，通过构建多层
普通人想利用AI变现，这5个赛道不能错过！浮沉导师
随着人工智能技术的迅猛发展，越来越多的普通人开始关注如何利用AI实现变现。AI不仅改变了我们的工作方式，也创造了众多赚钱的机会。本文将介绍五个值得关注的AI赛道，帮助你抓住这些机会，实现收入增长。【高省】APP网购优惠券免费领，分享还能赚钱。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台。佣金更高，模式更好，终端用户不流失。0投资，稳定可靠，百度有几百万篇报道，期待你的加入。应用市场下载【高省
AI人工智能 Agent：金融投资中智能体的应用 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能Agent：金融投资中智能体的应用1.背景介绍在金融投资领域，人工智能（AI）技术的应用已经成为一种趋势。随着数据量的爆炸性增长和计算能力的提升，AI技术在金融市场中的应用变得越来越广泛和深入。智能体（Agent）作为AI技术的重要组成部分，能够在金融投资中发挥重要作用。智能体可以通过学习和适应市场环境，自动执行交易策略，优化投资组合，甚至预测市场趋势。2.核心概念与联系2.1智能体（
对话谷歌前 CEO Eric Schmidt：数字超智能将在十年内到来，AI 将创造更多更高薪的工作 AI科技大本营人工智能
责编|王启隆出品|CSDN（ID：CSDNnews）投稿或寻求报道|[email protected]科技巨擘、谷歌前CEOEricSchmidt最近做客PeterDiamandis的Moonshots播客，与主持人PeterDiamandis及DaveLondon展开了一场关于人工智能未来的深度对话。全世界都在为AI的飞速发展感到兴奋又焦虑时，这位曾经执掌谷歌帝国长达十年、亲眼见证并推动了这场技术
聚焦基础研究突破，北电数智联合复旦大学等团队提出“AI安全”DDPA方法入选ICML CSDN资讯人工智能安全数据要素大数据
近日，由北电数智首席科学家窦德景教授牵头，联合复旦大学和美国奥本大学等科研团队共同研发，提出一种DDPA（DynamicDelayedPoisoningAttack）新型对抗性攻击方法，为机器学习领域的安全研究提供新视角与工具，相关论文已被国际机器学习大会（ICML2025）收录。ICML由国际机器学习学会（IMLS）主办，聚焦深度学习、强化学习、自然语言处理等机器学习前沿方向，是机器学习与人工智
格灵深瞳视觉算法面试30问全景精解机＿长算法面试职场和发展
格灵深瞳视觉算法面试30问全景精解——AI感知×智能安防×场景创新：格灵深瞳视觉算法面试核心考点全览前言格灵深瞳（GREATVISION）作为国内领先的人工智能与计算机视觉企业，专注于智慧安防、智能交通、智慧零售等领域，推动视觉算法在大规模城市级场景的落地。格灵深瞳视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在复杂场景下的创新能力与工程实践。本文精选30个高质量面试问题，涵盖基
商汤科技视觉算法面试30问全景精解
商汤科技视觉算法面试30问全景精解——AI赋能×智能视觉×产业创新：商汤科技视觉算法面试核心考点全览前言商汤科技（SenseTime）作为全球领先的人工智能平台公司，专注于计算机视觉、深度学习和智慧城市、智能汽车、智能医疗等领域，推动人脸识别、目标检测、视频分析、自动驾驶等前沿技术的产业化落地。商汤视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、自动驾驶、智慧医疗等复
旷视科技视觉算法面试30问全景精解机＿长科技算法面试深度学习 YOLO
旷视科技视觉算法面试30问全景精解——AI赋能×智能安防×视觉创新：旷视科技视觉算法面试核心考点全览前言旷视科技（Megvii）作为全球领先的人工智能公司，专注于计算机视觉、深度学习和智能安防等领域，推动人脸识别、目标检测、视频分析、工业视觉等前沿技术的产业化落地。旷视视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、工业检测、智慧城市等复杂场景下的创新与工程能力。本文
今日播报！庆衍书院郭庆旺被骗黑幕曝光，KSD2.0光伏市场不能出金不要再次踏入！法律咨询维权
社交平台有这样一种群，群里都是“理财专家”“炒股大神”“操盘高手”，不仅每天免费授课、推荐牛股，还有助理“一对一”指导具体操作。针对网上素未谋面的牛散大咖，经济学家等推荐网上投资理财、数字经济，数字体育市场，人工智能项目，数字低碳，慈善投票网站买数字的等等都是骗局，广大市民对此要提高警惕，遇到此类情况一概不要相信。咨询顾问：182--71402640（电微同号）数字经济数字体育数字农业慈善投票大赛
大模型软件的多租户架构设计 AI天才研究院 AI人工智能与大数据 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
大模型软件的多租户架构设计关键词：大模型软件、多租户架构、设计、性能优化、安全性摘要：随着大数据和人工智能技术的迅猛发展，大模型软件在各个领域得到了广泛应用。然而，如何在大模型软件中实现高效的多租户架构设计，成为当前技术领域的一个关键挑战。本文将深入探讨大模型软件的多租户架构设计，包括其背景、核心概念、算法原理、系统架构、项目实战以及最佳实践等，旨在为开发者提供一套系统化、全面化的设计指南。设计过
GPT-3 面试题
简介1、GPT-3是什么？它是基于什么模型的？GPT-3是一种基于深度学习原理的语言预测模型。它是由OpenAI开发的，可以从互联网数据中生成任何类型的文本。它只需要一小段文本作为输入，就可以生成大量的准确和复杂的机器生成文本²⁴。GPT-3是基于Transformer模型的，使用了仅有解码器的自回归架构。它使用下一个单词预测目标进行训练¹²。GPT-3有8个不同的模型，参数从1.25亿到1750
AI人才实在太抢手！顶级科学家年薪超7000万：中高级也能过千万程序员超超人工智能 transformer 深度学习 java spring boot ai 大模型
快科技7月2日消息，据媒体报道，激烈的人工智能人才争夺战，导致一些顶尖资深研究科学家的年薪超过1000万美元（约7167万元人民币）。而典型的薪资方案则处于300万至700万美元区间，相较于2022年，这一数字实现了约50%的增长。薪酬追踪网站Levels的统计数据显示，Meta给予AI工程师的薪酬范围为18.6万至320万美元，OpenAI则在21.2万至250万美元之间；若以薪酬中位数来衡量，
边缘计算与量子模型优化驱动医疗诊断新突破
内容概要在医疗人工智能领域，边缘计算与量子模型优化的协同演进正重构诊断系统的技术范式。通过将计算节点前置至医疗设备端，边缘架构有效解决了传统云端模型面临的实时性瓶颈，配合量子优化算法对复杂特征空间的快速寻优能力，使得CT、MRI等高维影像数据的解析效率提升显著。值得关注的是，框架选型直接影响着模型部署的可行性——TensorFlow在移动端推理优化方面的工具链完备性，与PyTorch动态图机制对迭
量子生成对抗网络：量子计算与生成模型的融合革命牧之112 量子计算生成对抗网络人工智能
引言：当生成对抗网络遇上量子计算在人工智能与量子计算双重浪潮的交汇处，量子生成对抗网络（QuantumGenerativeAdversarialNetworks,QGAN）正成为突破经典算力瓶颈的关键技术。传统生成对抗网络（GAN）在图像生成、数据增强等领域已取得辉煌成就，但其参数规模与计算复杂度随着数据维度呈指数级增长。量子计算的叠加性、纠缠性和并行性，为解决这一矛盾提供了全新思路。2025年，
OpenAI模型可解释性工具：理解AI的黑箱 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能百度 ai
OpenAI模型可解释性工具：理解AI的黑箱关键词：OpenAI模型、可解释性工具、AI黑箱、模型理解、人工智能摘要：本文旨在深入探讨OpenAI模型可解释性工具，帮助大家理解AI这个“黑箱”。首先介绍了研究的背景、目的和预期读者，接着解释了核心概念，包括OpenAI模型、可解释性工具等，阐述了它们之间的关系。通过核心算法原理、数学模型和公式的讲解，让大家明白其内在机制。还给出了项目实战案例，包括
骗局套路：卧虎藏隆应天书府隆国强被骗无法提现！讲述背后事实！正义青天
为什么明明跟老师对过视频，确认是本人，怎么还会被骗了?你有没有想过一个名人大咖怎么会有时间给你们一对一视频，其次我来给大家揭露一下，这个套路AI换脸骗局是一种利用人工智能技术，通过替换视频中的人脸来伪造身份或进行诈骗的行为。你的账户“余额”是真的吗？为什么不能提现呢？其实都是骗子给你的一串数字而已！近期作者接触到了很多投资者被所谓的“隆国强”（骗子假冒）在卧虎藏隆应天书府带单的案例。这些新平台打着
网络爬虫再深入——对抗指纹检测、分布式架构与智能解析实战 rooney2024 爬虫
目录一、深入反爬：浏览器指纹检测与对抗（配图1）1.高级指纹检测原理2.对抗方案与实战二、分布式爬虫架构深度设计（配图2）1.容错与弹性设计2.智能限流算法三、智能解析：LLM与计算机视觉的融合（配图3）1.LLM解析非结构化文本2.视觉辅助定位元素四、法律与伦理：爬虫工程师的自我修养1.关键法律边界2.道德实践框架五、未来战场：Web3.0时代的爬虫技术演进1.去中心化网络挑战2.AI驱动的自适
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓