华师数据学院·王嘉宁

A survey on Few-shot Learning （小样本学习）

机器学习已经成功地在数据密集型任务上得以应用，但通常却不能够处理数据很少的情况。最近，小样本学习（Few-shot Learning，FSL）被提出用于解决这个问题。在先验知识的基础上，FSL可以有效的涵盖一个只有极少监督信息数量样本的新任务。本文，我们将对小样本学习FSL进行一个系统的梳理。首先给出FSL一个形式化的定义，其次根据相关机器学习的问题进行分类，同时指出一个核心的关键问题即小样本学习不能依赖于传统的经验风险最小化的优化目标。基于如何将先验知识辅助解决小样本问题，本文从数据（Data）、模型（Model） 和 算法（Algorithm） 三个方面进行分析：
（1）数据：使用先验知识增强监督信息；
（2）模型：使用先验知识降低假设空间；
（3）算法：使用先验知识来更改对给定假设空间中最佳假设的搜索。

本文所使用的标记符号如下表：

标记	名称
$T$	给定的某一个学习任务
$I$	训练集的个数
$D=\{D_{train}, D_{test}\}$	数据集，分别对应训练集和测试集
$D_{train} = \{(x_i, y_i)\}_{1}^{I}$	训练集
$p (x, y)$	真实样本的联合概率分布
$\hat{h}$	FSL模型学习到的 $x$ 到 $y$ 的假设关系
$\theta$	模型训练的参数
$h^{*}\in\mathcal{H}$	假设空间 $\mathcal{H}$ 中最优的假设

FSL任务的目标是学习一个最优策略 $h^{*}\in\mathcal{H}$ ，损失函数记作 $l(\hat{y}, y)$ ，预测结果为 $\hat{y} = h(x; \theta)$ ，其中 $\theta$ 表示参数。

1、FSL形式化定义

小样本学习属于机器学习的范畴内，在机器学习中，通常定义为给定一组经验及对应的标签，通过计算机程序实现从经验到标签的映射关系。机器学习则是提高某一项指标，试图提升模型学习的效果。例如在图谱分类任务中，给定一个训练和测试集合，我们设计一个模型，企图让模型学习到图像到标签对应的映射关系，并以准确率为评价指标。再例如，近些年来比较火的AlphaGo，通过自学习的方法与真人进行了多大3000多万次挑战交互后，才真正在胜率上超越人类。

经典的机器学习方法，通常需要大量的训练数据，正如前面所说的，这在某些应用上是无法做到的。因此我们需要引入一种小样本学习的方法。小样本学习的定义为：

假设一组经验数据 $E$ 以及对应的标签 $T$ ，小样本学习是指给定经验数据非常少的 $E$ 的情况下，让模型学习其到 $T$ 的映射 $P$ 。

小样本学习包含如下几种类型：
（1）Few-shot Classification （小样本分类）：这是一个有监督的问题。给定小样本数据 $D_{train} = \{(x_i, y_i)\}_{1}^{I}$ 来学习一个分类器 $h$ 。通常小样本的分类定义为 $N$ -way $K$ -shot 分类，即指训练集包含 $N$ 个类，每个类包含 $K$ 个样本，因此训练集只有 $I = N K$ 个；
（2）Few-shot Regression（小样本回归）：这依然属于有监督的问题，输入数据为相互独立的变量 $x$ ，输出的是连续的数值 $y$ ，目标则是学习一个回归函数 $h$ ；
（3）Few-shot Reinforcement（小样本强化学习） 强化学习输入弱监督类任务，其建立在少量的经验数据（通常称为轨迹trajectory）的基础上学习一个最优的策略（policy）。关于强化学习的概念，可参考强化学习（一）：概述。

小样本的几个经典的场景：
（1）像人类一样去学习（Learn Like Human）：我们更希望我们学习的模型能够更好的像人类一样在给非常少的样本的前提下，能够很好的识别和分类。例如幼儿只需要看几张猫的图片后，就可以在许多动物中找到所有猫的图片，但现有的机器学习模型却需要大量的图片才能取得较高的效果。另外，我们也希望计算机能够像人类一样做知识的“迁移”，就想人类一样，在学习一样新的知识是，通常不是从零开始，而是根据先验知识 （Prior Knowledge）来进行学习。而现如今的机器学习，不论什么任务都是从头开始学习。因此如像人类一样利用先验知识，则可以在非常少的样本条件下获得很好的效果。
（2）处理稀少的样例（rare case）：在一些无法获取大量数据的场景下，例如医疗中的病毒发现、自动驾驶中的事故预测等，而小样本学习则可以利用先验知识来辅助完成这些稀少样本的学习和预测；
（3）减少数据收集工作量和计算成本：这一场景并非是在数据获取难才使用的场景，通常有一些任务可以获得大量的数据，但数据获取的成本很高，或者数据运算占用的数据资源和时间成本高，则可以通过对数据削减后使用FSL来学习。

因此，在这些场景下，我们可以利用的通常是先验知识，而先验知识通常可以从预训练的模型、或相似的其他标签的数据、或通过数据增强的方法等。在数理统计学中，最能够想到的便是以贝叶斯学派的贝叶斯估计，通常目标预测的是一个后验概率 $p (y ∣ x)$ ，但可以通过贝叶斯公式引入先验 $p (x ∣ y)$ ：

贝叶斯估计通常是一种在含有先验知识下的估计，相比频率学派的极大似然估计，其不同点在于贝叶斯估计是经验+先验的结合，而极大似然估计则完全以经验为准。例如在抛硬币实验中，根据历史经验，正面朝上的先验知识是0.5，而如果硬币质地不均匀，则可能正面朝上的概率更大或更低，则会受到经验数据的影响。

小样本学习还有两个特殊情况：当经验 $E$ 中只有一个样本时，FSL则为单样本学习（One-shot Learning），如果一个样本都没有，则称为零样本学习（Zero-shot Learning）。特别说明的是，如果一个任务是零样本学习，则只能通过其他任务的信息进行迁移。

2、FSL相关研究问题

FSL通常不是独立存在的，我们在解决小样本训练的问题时，通常会采用一些现有的工具，我们列出一些相关的研究问题：

（1）弱监督学习（Weakly Supervision Learning）：弱监督通常指在给定的经验 $E$ 中，并非所有的数据都含有标签信息，或存在大量的噪声。例如在远程监督关系抽取任务中，通过启发式的数据标注虽然带来丰富的标签，但绝大多数是噪声。这就导致了弱监督学习中，只有少部分的样本包含有效的监督信息。
通常弱监督分为半监督学习和主动学习。半监督学习（Semi Supervision Learning） 则是指给定的经验数据中，只有一小部分包含监督信息，而另一部分则是无标注的数据；主动学习（Active Learning） 则是指显式地从无标注的数据中选择（query）一部分数据，并让专家进行标注，以渐渐扩充数据的方法。
小结：如果一个小样本学习（FSL）中所给的先验知识是无标签（unlabeled）的数据时，此时的小样本学习即为弱监督学习任务。

（2）非均衡学习（Imbalance Learning）：非均衡问题通常指的是不同标签类对应的经验数据不平衡。这一类在现实生活中十分常见。例如癌症检测，通常给定的数据集中，只有数量极少的样本标签为阳性，而其他大多数的样本均为阴性。因此可行的方案是，我们可以将样本数量富余的标签作为一种先验，来辅助预测那些数量少的标签。非均衡在某些场景下还可以称为长尾问题，例如在远程监督关系抽取任务上，有先关工作通过分层注意力机制来缓解长尾关系的预测，他们的做法则是将data-rich的关系标签数据迁移到data-poor的关系预测上，这便是解决非均衡的具体体现。
小结：如果一个小样本学习任务（FSL），先验知识是取自样本数量多的标签（或标签之间相关性更高的），则属于非均衡学习。

（3）迁移学习（Transfer Learning）：迁移学习是最能够直观想到的方法，因为其是显式的从其他任务或领域上的数据直接迁移到小样本的任务上。在自然语言处理任务中，则通常采用预训练的语言模型作为先验知识，迁移到许多上层任务上，例如文本分类、机器翻译、阅读理解等；
小结：如果一个小样本学习任务（FSL），先验知识是取自其他任务或领域的数据，或通过预训练的方法获得，则属于迁移学习。

（4）元学习（Meta-Learning）：元学习是另一种利用先验知识来学习的任务，是一种教会计算机学习的方法，即利用以往的知识经验来指导新任务的学习，具有学会学习的能力。元学习在许多任务中成功应用。例如学习优化问题、推荐冷启动问题等。
小结：如果一个小样本学习任务（FSL），先验知识是用于“教会”模型在一个具体的任务上如何进行学习，则属于元学习。

3、FSL目标问题

在《统计学习方法》中我们知道传统的机器学习的三种优化目标是：期望风险最小化、经验风险最小化和结构风险最小化。期望风险最小化是一种理想状态，但我们通常无法知道一个任务的期望值，所以只能通过采样方法获得一系列的经验数据（即训练集），则目标为经验风险最小化。如果考虑到模型的复杂度以及过拟合问题，则称为结构风险最小化。我们以经验风险最小化为例，损失函数通常为：

$R_{I}(h) = \frac{1}{I}\sum_{i=1}^{I}l(h(x_i), y_i)$

一般经验风险最小化可以分解为两个期望的求和：

其中前一项表示通过大量数据学习的最优的经验 $R(h^*)$ 与理想状态下的最优 $R(\hat{h})$ 差的期望，记做 $\mathcal{E}_{app}(\mathcal{H})$ ；后一项则表示在有限的经验数据条件下学习与大量数据经验学习的差，记做 $\mathcal{E}_{est}(\mathcal{H, I})$ 。因此，通常如果想要降低后一项，可以使用大量的样本，此时则会逼近大量经验数据条件下两者的差。然而，在FSL中，样本数 $I$ 非常少，因此经验风险通常不可能实现最小化的目标，因此不能将经验风险最小化作为小样本学习的目标。

例如下图展示了样本充足以及样本稀少条件下，使用经验风险最小化对参数空间 $\mathcal{H}$ 进行搜索的过程。

可知，当样本数量多时（左图），则可以有效地减少 $\mathcal{E}_{est}(\mathcal{H, I})$ 。而当样本数量不足时， $\mathcal{E}_{est}(\mathcal{H, I})$ 不易降低。

因此解决这个问题，我们必须引入先验知识。那么先验知识如何应用到小样本学习中去呢？根据相关工作，我们从数据、模型和算法三个方面引入先验：
（1）数据：如上图（a），可以通过显式地引入额外的数据做数据增强。在搜索空间中进行搜索时，可以通过额外的数据来辅助完成优化问题。基于此，可以使用经验风险最小化；
（2）模型：如上图（b），通过使用先验知识来降低搜索空间，使得优化的维度和空间得以降低。灰色部分即是被缩减的部分，而胜于白色的区域则是更小的搜索空间；通常模型可以使用预训练的模型；
（3）算法：如上图（c），这一类则是引入先验知识来优化搜索策略的算法，即使用先验知识来寻找一个最优的搜索策略。

通过一个树状图对三种先验知识的引入进行小结：

4、基于数据（Data）的小样本学习方法

前面讲过，使用先验知识来显式地扩充训练数据 $D_{train}$ 是一种有效的方法，基于充分的训练集，可以得到相应可靠的学习模型。传统的数据增强方法是根据数据特性进行一些预处理和变换。例如对于图像类任务，为了扩充图像数量，可以通过图像转置、裁剪、旋转、投影等操作，通过人工和规则来生成相似的图像。然而这种方法通常需要较高的时间和资源消耗，且很难应用到所有类型的数据，因此人工的对数据进行扩充不是鲜明之举。

因此我们根据先前的工作，总结了三种比较常用的数据扩增方法，包括：

训练数据变换（Transforming Samples from $D_{train}$ ）：通过一些变换将原始训练集转换为先验知识，并用于扩增，这一类即是上一段所描述的传统的方法；
弱监督或无监督数据（Transforming Samples from Weakly Labeled or Unlabeled Data Set）：引入其他弱监督或无监督的数据集做数据增强；
相似数据集（Transforming Samples from Similar Data Set）：从数据分布和性质角度来看，将相似的数据拿来做扩增。

下面分别做简单的描述：

4.1、训练数据变换（Transforming Samples from $D_{train}$ ）

这种策略是将训练集中每一个样本 $x_i, y_i)$ 均通过一系列的变换转变为新的数据，而所使用的变换程序则包含先验知识。另外，有相关方法使用自编码器（Auto-encoder）来根据相似的标签生成对应的数据。另外也有人为每一个原始数据 $x_i$ 学习多个相互独立的属性增强回归器（Attribute Strength Regressor），并以此生成多个相同标签的数据。

4.2、弱监督或无监督数据（Transforming Samples from Weakly Labeled or Unlabeled Data Set）

该策略通过从弱监督或无监督的大数据集中选择带有目标标记的样本来增强 $D_{train}$ 。例如，在用监视摄像机拍摄的照片中，有人，汽车和道路，但没有一个被标记。另一个例子是长篇视频。它包含说话者的一系列手势，但是没有一个被明确注释。由于此类数据集包含样本的较大变化，因此将其增加到 $D_{train}$ 有助于描绘更清晰的样本分布情况 $p (x, y)$ 。此外，由于不需要人工来标记，因此收集这样的数据集更加容易。但是，尽管收集成本很低，其主要问题是如何选择带有目标标签的样本。先前的方法一种是使用支持向量机（SVM）为每一个带有标签的原始训练集 $D_{train}$ 进行训练，并为那些弱监督数据进行预测，并将预测正确的加入到 $D_{train}$ 中。另外，标签传播（Label Propagation）则直接被用于为无标注的数据进行自动标注等。

4.3、相似数据集（Transforming Samples from Similar Data Set）

该策略通过汇总和改编来自相似但较大数据集的输入输出对来增强 $D_{train}$ 。聚集权重通常基于样本之间的某种相似性度量。有人从辅助文本语料库中提取聚合权重。由于这些样本可能不是来自目标FSL类，因此直接将汇总样本增加到Dtrain可能会产生误差。因此，生成对抗网络（GAN）被设计为从许多样本的数据集中生成不可区分的合成数据。它有两个生成器，一个生成器将小规模类的样本映射到大规模类，另一个生成器将大规模类的样本映射到少规模类（以补偿GAN中缺少样本训练）。

上述三种数据增强的方法，如何选择取决于具体的应用和数据的情况。如果说某一类任务包含大量的无标注或半监督的数据，而如果对其全部进行人工标注将会消耗大量精力的，可以使用第二种方法，即通过一些工具启发式地标注，或使用算法来预测未知的标签，以扩增数据集；如果无标注的数据很难获取，则可以选择相似的数据转换为目标任务下的数据；如果前面两个都不满足，则只能从原始的数据进行一些变换操作了。但事实上，上述的三种方法均涉及到对数据的一些生成和变换，通常并不使用于所有领域或类型的数据，现阶段基于数据增强的FSL比较适用于图像类数据，而对于文本、语音等基于语法的序列模式数据则比较困难。

5、基于模型（Model）的小样本学习方法

如果在小样本数据上训练一个简单的模型，通常来说，模型的优化空间更小，可以缓解小样本学习的问题，可是模型太过于简单（例如简单的线性回归），根本无法有效表征复杂的数据特征；然而如果使用较为复杂的模型，则将会面临过拟合（Overfitting）问题。因此，基于模型的小样本学习方法，旨在通过先验知识来进一步缩减假设空间 $\mathcal{H}$ 的大小，即使使用较为复杂的模型，也可以在很少的经验样本的基础上快速靠近最优解。因此，本节关注的是如何使用先验知识来达到这个目的，下标列出了常用的四种学习方法：

学习策略	先验知识	如何缩减 $\mathcal{H}$
多任务学习（Multi-Task Learning）	先验知识来源于其他任务 $T$ 以及对应的数据 $D$	参数共享或绑定
嵌入学习（Embedding Learning）	根据其他任务学习得到的Embedding信息	将数据映射到低维度连续空间，保存语义信息
记忆信息（External Memory）	通过Embedding保存（记忆）其他任务交互得到的语义信息	使用Key-Value进行保存
生成模型	由其他任务 $T$ 学习得到的先验知识	限制分布的形式

5.1、多任务学习（Multi-task Learning）

在多任务学习中，通常有多个不同的任务 $T$ 及对应的数据同时参与训练，通过多任务学习可以任务本身及任务之间的信息交互和共享。假设给定 $C$ 个任务，分别为 $T_1, T_2, ..., T_C$ 。每个任务 $T_c$ 对应数据集 $D_c=\{D_{train}^{c}, D_{test}^{c}\}$ 。我们将小样本任务作为目标任务（Target Task），其他任务作为资源任务（Source Tasks），因此多任务学习目标是通过某一个任务 $T_c$ 在对应数据进行学习，并得到对应的参数 $\theta_c$ ，因此可以当前任务的参数可以对其他任务产生一定的约束。参数的约束可分为两种类型：参数共享以及参数绑定

参数共享（Parameter Sharing）：参数共享方法主要是在训练模型时采用共享参数的方法。如下图所示。总共有三个任务，其中最左侧的是小样本任务（目标任务），而其他两个任务则提供先验知识。通过task-specific层来独立训练对应的任务，而shared层来共享所有任务的参数。因此在训练目标任务时，通过共享参数可以实现先验知识对目标任务的假设空间的限制。另外还可以这么理解，因为此时在对目标任务进行学习时，还需要对其他任务进行学习，因此还可以认为先验知识的任务相当于约束条件，类似于正则化一样，因此可以缩小假设空间。

参数绑定（Parameter Tying）：参数绑定方法是指在训练多个任务的时候，将其他任务作为一种正则化约束条件。例如在训练一个图像分类任务时，当训练小样本任务（目标任务）时，其他先验任务的参数则作为一个正则项，起到一种惩罚作用，如下图所示：

5.2、嵌入学习（Embedding Learning）

嵌入学习的目标是将样本映射到低维度的连续空间中，因此其可以通过降低向量的维度来降低参数的假设空间，相似的样本对应的向量空间内更加靠近，而不相关的样本对应的向量空间内更加远，因此可以有效解决小样本学习。嵌入学习包含几个主要部分：（1）函数 $f$ 用于将测试集 $x_{test}\in D_{test}$ 映射到低维度空间 $\mathcal{Z}$ ；（2）函数 $g$ 用于将测试集 $x_{i}\in D_{train}$ 映射到低维度空间 $\mathcal{Z}$ ；（3）相似度函数 $s$ 用于评估 $f(x_{test})$ 和 $g(x_i)$ 的相似度。

通常训练嵌入向量均使用先验知识，因此根据函数 $f$ 和 $g$ 是否有交叉使用，可以大致分为三个小类，一种是根据具体任务来训练embedding（task-specific），一种是在先验知识上训练embedding（task-invariant），一种是混合两种方法训练embedding（hybrid）。

Task-specific：指只用具体某一个任务的信息来训练embedding。例如当任务 $T_c$ 训练小样本训练集 $D_{train}^{c}$ 时，每次挑选两各样本作为一对训练embedding（训练embedding通常使用排序损失函数，因此通常是成对的训练），因此当将一对样本用于训练，可以显式地增加训练数量。
Task-invariant：指在一个通用的大规模数据集上进行预训练，并形成embedding后，在目标任务上进行训练。这一类是比较常用的。如下图所示：

通常是一种孪生网络的架构，小样本的训练集和测试集分别使用两个不同的函数映射到相同维度的embedding后，使用相似度量函数进行预测。训练集上则是训练部分，测试集则是测试部分，用于对未知的样本进行预测。当未知的测试样本与训练集中的某个样本非常相似时，则预测为训练样本对应的类。另一方面，小样本学习更加看重的是泛化能力，即在 $N$ 个类中，只训练 $个类，而训练的目标函数则是尽可能提高预测剩余 N - U 个类的效果，因此这一类也被划为为Task-invariant。$

解决这一类的方法主要有MatchNet、PrototypeNet等。主要思路都是围绕学习一个映射函数和相似度函数，然后在测试集上寻找最相关的训练样本，并预测为对应的标签。

Hybrid：指混合前两种方法，先使用task-invariant方法训练包含先验知识的embedding，然后在具体的任务上，将训练集作为输入，并进行训练，使得含有先验知识的模型 $f$ 可以学习到包含具体任务的信息。如图：

先通过task-invariant方法学习得到的先验知识，然后根据具体任务学习得到函数 $g$ 。不同于task-invariant的是，其将训练集学习的信息加入到测试集中，因此这一部分则显示将task-specific和task-invariant相结合的效果。

事实上，通俗的讲，第一种task-specific方法即是只将小样本训练集进行训练，第二种则是用大规模的其他数据事先训练好embedding后，直接训练小样本训练集的训练函数 $f$ 的参数，第三种则是将小样本数据也加入到了先验知识中。

5.3、记忆信息（External Memory）

通过引入记忆机制将训练集中的信息抽取出并形成键值对格式，因此在测试时，只需要寻找最相关的键值对即可。因此key-value是比较常用的记忆机制。假设记忆即为 $M\in\mathbb{R}^{b\times n}$ ，其中 $b$ 表示记忆单元的个数，每个记忆单元表示为 $M(i)\in\mathbb{R}^{m}$ ，其包含key-value键值对 $M(i) = (M_{key}(i), M_{value}(i))$ 。因此在训练之后，即可保存这些记忆单元，每个记忆的键可以是向量，值则可以是对应的标签或回归值等。在测试阶段，只需要一个相似度函数 $s(f(x_{test}), M_{key}(i))$ 寻找最相近的key即可预测对应的结果value，这里相似度函数可以选择点乘或者余弦相似度函数。通常记忆单元数量是有限的，因此如果记忆单元已满，则可以通过设计一些策略用于替换先前的记忆，可分为两小类：

Refining Representation：将训练集依次保存到记忆单元中，因此在测试阶段时，可以更好地表示测试样本。相关方法均考虑当记忆单元已满时，如何设定策略进行替换先前的记忆信息。包括MANN、Lifelong Memory等；
Refine Parameter：考虑使用记忆单元存储参数。在训练集上训练一个映射函数 $g$ 时，可以通过记忆单元保存这些参数，然后在测试阶段，根据记忆信息对预测函数 $f$ 进行参数化表示。相关方法有MetaNet、MN-Net等。

5.4、生成模型（Generative Modeling）

在生成模型中，通过先验知识来生成更加丰富的信息时生成式方法。通常包含两种方法：

可分解成分（Decomposable Components）：一些样本虽然很少，但它们可能包含相似的成分，例如人脸识别中，每个人都会包含相似的五官等信息，因此可以使用生成模型来捕捉不同可分解成分之间的交互性；
组队共享先验（Groupwise Shared Prior）：相似的任务之间会有相似的概率分布和先验信息，因此也可以用于小样本学习中。例如对于一个三类分类任务（类1、类2和类3），每个类可能存在相似性，如果类1和类2样本数量较多，而类3样本数量少，因此可以实现类别之间的信息共享，借助类1和类2的先验知识，以及其与类3的相关性预测类3的样本。另外，也可以不按照类标进行划分，而通过其他划分规则，例如对含有猫、狗、汽车三个类进行分类时，很明显前两类属于动物，后一类属于非动物，因此可以显式地先进行划分；或者通过数据固有的特性进行分层划分。划分后的数据在同一组内可以共享相同或相似的先验信息，从而辅助预测小样本类。
推断网络（Inference Networks）：推断网络是一种根据数据分布情况而推断其最优参数的方法，最经典的即是基于贝叶斯公式的贝叶斯推断网络，其根据先验知识（即已知的数据）基础上寻找最优的参数使得后验概率达到最大。基于推断网络的有自编码器（VAE）、对抗网络（GAN）等，其可以根据已有的数据基础上生成更多更丰富的新的数据。

下面总结一下基于模型（model-based）的小样本学习方法。通过对模型的改造，来将先验知识引入到小样本任务中，从而在语义层面上降低了搜索空间。基于模型的小样本学习主要有四大类：
（1）如果先验知识来源于多个任务，则可以使用多任务学习框架。小样本任务（目标任务）作为优化的目标，而其他任务则作为类似正则化项起到对目标的约束作用，从而在语义层面上降低搜索空间大小；
（2）如果存在大规模的数据集，其包含充分的多种类别的样本时，可以使用基于嵌入的方法，通过学习一个低维度连续空间的向量，从而降低向量空间大小，降低搜索空间大小；
（3）如果可以使用记忆单元，则可以基于此训练一个简单的分类器，给定一个测试样本从记忆中选择最相似的记忆作为预测结果。但这一种方法需要考虑如何保留和遗忘过去的记忆，同时可能会遭受内存消耗的问题；
（4）如果可以使用生成模型，则可以从其他数据集中学习先验，并基于自编码、对抗网络等模型生成多样化的数据，以扩充原始数据。当然，生成模型通常难以训练，因此需要取决于具体任务的情况；

未完待续…
参考文献：Generalizing from a Few Examples: A Survey on Few-Shot Learning

微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
【大模型与机器学习解惑】什么是A/B测试，为何进行A/B测试？
以下内容将围绕机器学习中的A/B测试展开，从概念与背景到实施细节、示例代码、优化思路和未来建议，并在最后给出一个整体的“输出目录”供参考。目录什么是机器学习的A/B测试为何要进行A/B测试A/B测试的实施流程示例代码与详细解释优化方向与未来建议结语1.什么是机器学习的A/B测试A/B测试（也常被称作对照试验、SplitTest）最早多用于互联网产品的功能或界面迭代中，指的是将用户或样本随机分为两组
详解LLMOps，将DevOps用于大语言模型开发
大家好，在机器学习领域，随着技术的不断发展，将大型语言模型（LLMs）集成到商业产品中已成为一种趋势，同时也带来了许多挑战。为了有效应对这些挑战，数据科学家们转向了一种新型的DevOps实践LLM-OPS，专为大型语言模型的开发和维护而设计。本文将介绍LLM-OPS的核心思想，并分析这一策略如何帮助数据科学家更高效地运用DevOps的优秀实践，从而在语言模型的开发和部署过程中，提升工作效率和成果的
搜广推校招面经九十一
美团机器学习/数据挖掘算法工程师_二面一、介绍一下ESMM模型，是否有进行过函数推导传统的转化率建模方式：只用发生点击（click=1）的样本来训练CVR模型。CVR定义如下：CVR=P(y=1∣x,z=1)CVR=P(y=1|x,z=1)CVR=P(y=1∣x,z=1)y=1表示用户发生了转化（如购买）z=1表示用户点击了广告这样做的问题：样本选择偏差（SampleSelectionBias,S
python 计算生态概览的概述
文章目录前言python计算生态库的介绍1.网络爬虫2.数据分析3.文本处理4.数据可视化5.机器学习6.图形用户界面7.游戏开发8.网络应用开发前言python计算生态概览的解释Python计算生态概览是对Python作为一门强大而广泛使用的编程语言所拥有的庞大软件集合的整体描述和概述。这个生态体系不仅包含了Python的标准库（stdlib），即随Python解释器安装的基本模块，还涵盖了极其
Google机器学习实践指南(模型预测偏差) AI_Auto 人工智能机器学习人工智能
Google机器学习（31）-模型预测偏差预测偏差：模型为何总是"猜不准"的真相揭秘你的模型预测准确率高达95%，却总是与实际情况差那么一点点？这可能是预测偏差在作祟！本文将带你深入探索这个被忽视的模型"隐形杀手"。一、什么是预测偏差？一个生活化案例想象一下，你网购了一个智能体重秤，连续一周称重显示都是60kg。但你去健身房用专业设备测量，实际是62kg。这种系统性的测量偏差，就是预测偏差在现实中
【机器学习|学习笔记】用 Python 结合 graphviz 生成 ID3、C4.5、CART 三种决策树的结构示意图。
【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图文章目录【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图用Python结合graphviz生成ID3、C4.5、CART三种
智能产品经理的核心能力 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
智能产品经理的核心能力1.背景介绍在当今快节奏的数字时代,产品经理扮演着至关重要的角色,他们负责确保产品满足用户需求,实现商业目标,并保持竞争优势。随着人工智能(AI)和机器学习(ML)技术的不断发展,智能产品经理的概念应运而生。智能产品经理需要将传统的产品管理技能与新兴技术相结合,以创建具有创新性和智能化的产品体验。智能产品不仅需要满足功能需求,还需要提供个性化、智能化和无缝的用户体验。这对产品
使用Python进行机器学习入门指南软考和人工智能学堂 Python开发经验 python 机器学习开发语言
使用Python进行机器学习入门指南机器学习（MachineLearning）是人工智能（ArtificialIntelligence,AI）的一个重要分支，旨在通过算法和统计模型，使计算机系统能够自动从数据中学习和改进。Python作为机器学习领域的主流编程语言，提供了丰富的库和工具来实现各种机器学习任务。本文将介绍如何使用Python进行机器学习，包括基本概念、常用库以及一个实战项目示例。目录
【亲测免费】 CatBoost 教程项目使用指南
CatBoost教程项目使用指南tutorials项目地址:https://gitcode.com/gh_mirrors/tutorials1/tutorials1.项目介绍CatBoost是一个高效、灵活且易于使用的梯度提升库，特别适用于处理分类特征。它由Yandex开发，广泛应用于机器学习和数据科学领域。CatBoost提供了丰富的功能，包括自动处理分类特征、支持GPU训练、内置的交叉验证和模
Python自动化机器学习平台库之mindsdb使用详解
概要MindsDB是一个开源的自动化机器学习平台，它通过SQL接口简化了机器学习模型的创建、训练和预测过程。该库的核心理念是将机器学习功能直接集成到数据库中，让开发者无需深入了解复杂的机器学习算法，就能够快速构建和部署预测模型。MindsDB支持多种数据源连接，包括MySQL、PostgreSQL、MongoDB等主流数据库，同时提供了丰富的PythonAPI接口，使得数据科学家和开发者能够在熟悉
堡垒机操作行为异常检测的机器学习算法应用
一、传统检测模式的困境与机器学习的破局价值在数字化转型浪潮中，堡垒机作为运维安全的核心防线，面临着操作行为复杂度激增与检测能力滞后的双重挑战。传统检测手段主要依赖静态规则库与统计模型，存在三大致命缺陷：规则固化与误报泛滥：某金融机构曾因规则库未及时更新，导致运维人员正常批量操作被误判为“暴力破解”，单日误报量超2000次，消耗安全团队60%的精力。动态行为适应性弱：微服务架构下，运维人员访问路径呈
最全自动驾驶数据集（11/4号已更新）数据猎手小k 自动驾驶人工智能机器学习
自动驾驶是一个快速发展的行业，它融合了人工智能、机器学习、传感器技术、高精度地图和先进的计算平台等多种技术。技术方面，自动驾驶汽车依赖于先进的传感器、如激光雷达、摄像头、毫米波雷达等，以及强大的计算平台来处理大量数据，自动驾驶数据集是训练和验证自动驾驶系统的关键资源，它提供了丰富的场景和条件，使算法能够学习和适应复杂的真实世界驾驶环境。一、研究背景自动驾驶技术的发展需要大量的数据来训练和优化算法，
机器学习深度学习驱动在光子学设计中的应用与未来【专题培训会议邀您共探科技前沿】软研科技信息与通信信号处理量子计算人工智能
一、背景介绍在智能科技飞速发展的今天，光子学设计与智能算法的结合正成为科研创新的热点。深度学习、机器学习等算法在光子器件的逆向设计、超构表面材料设计、光学神经网络构建等方面展现出巨大潜力。二、会议亮点由北京软研国际信息技术研究院主办的“智能算法驱动的光子学设计与应用”专题培训会议，将深入探讨以下核心内容：光子器件的逆向设计：利用深度学习优化多参数光子器件设计。超构表面与超材料设计：智能算法在新型光
机器学习与光子学的融合正重塑光学器件设计范式 m0_75133639 光电智能电视二维材料电子半导体人工智能顶刊 nature
Nature/Science最新研究表明，该交叉领域聚焦六大前沿方向：光子器件逆向设计、超构材料智能优化、光子神经网络加速器、非线性光学芯片开发、多任务协同优化及光谱智能预测。系统掌握该领域需构建四维知识体系：1、基础融合——从空间/集成光学系统切入，解析机器学习赋能光学的理论必然性，涵盖光学神经网络构建原理2、逆向设计革命——通过AnsysOptics实战，掌握FDTD算法与粒子群/拓扑优化技术
AI模型训练新范式：基于同态加密的隐私保护方案 AIGC应用创新大全人工智能同态加密区块链 ai
AI模型训练新范式：基于同态加密的隐私保护方案技术解析关键词同态加密（HomomorphicEncryption）、隐私保护机器学习（PPML）、全同态加密（FHE）、安全多方计算（MPC）、加密数据训练摘要本报告系统解析基于同态加密的AI模型训练新范式，覆盖从理论基础到工程实践的全生命周期。首先通过第一性原理推导同态加密的数学本质，对比传统隐私保护技术的局限性；其次构建“加密-训练-解密”全流程
量子机器学习入门：从理论到实践
量子机器学习入门：从理论基石到实践路径元数据框架标题量子机器学习入门：从理论基石到实践路径——连接量子计算与人工智能的未来桥梁关键词量子计算；机器学习；量子算法；量子神经网络；Qiskit；PennyLane；量子变分算法摘要量子机器学习（QuantumMachineLearning,QML）是量子计算与机器学习的交叉领域，通过量子计算的叠加态、纠缠和并行性解决传统机器学习的计算瓶颈（如高维数据处
全球人工智能与机器学习大会PPT a flying bird 论文解读和大咖技术号记录人工智能
大会演讲PPT合集https://ppt.infoq.cn/list/93PPT分享|ppt|人工智能|aicon|infoq|机器学习PPT分享,前段时间的AICon北京站2021全球人工智能与机器学习大会（https://aicon.infoq.cn/2021/beijing），汇集了很多业界大佬，工业界多个方向的从业人员分享了他们在实际业……https://xw.qq.com/cmsid/2
人工智能基础知识PPT课件智慧化智能化数字化方案方案解读馆人工智能入门人工智能学习人工智能课件人工智能PPT
人工智能基础知识定义与概念：人工智能是研究、开发用于模拟、延伸和扩展人类智能行为的综合性科学，其目的是让计算机系统具备执行人类智能任务的能力。涉及计算机科学、数学等多学科，研究对象是让系统具备智能，智能包括认知、适应和自主能力等维度。学派与方法学派：有符号主义、联结主义、行为主义等学派，分别从不同角度研究人工智能。方法：包括基于知识、学习和仿生的方法，如专家系统、机器学习、深度学习等。分类与发展分
数据挖掘：从理论到实践的深度探索代码老y 数据挖掘人工智能
在当今数字化时代，数据已经成为企业决策的重要依据。数据挖掘作为一门从大量数据中提取有价值信息的技术，已经广泛应用于各个领域，如金融、医疗、零售、互联网等。本文将深入探讨数据挖掘的基本概念、主要技术和实际应用案例，帮助读者更好地理解数据挖掘的价值和应用。一、数据挖掘的基本概念（一）数据挖掘的定义数据挖掘（DataMining）是从大量数据中提取有用信息的过程。它结合了统计学、机器学习、数据库技术和人
开发智能化的企业并购风险评估模型
开发智能化的企业并购风险评估模型关键词：企业并购、风险评估、人工智能、机器学习、深度学习、数学建模摘要：本文详细探讨了开发智能化企业并购风险评估模型的背景、核心概念、算法原理、系统架构设计以及项目实战。通过结合机器学习和深度学习技术，提出了一种基于数据驱动的智能化风险评估方法，旨在帮助企业更准确地识别和预测并购过程中的潜在风险，提升决策的科学性和有效性。第1章:企业并购风险评估模型的背景与问题描述
机器学习手写字体识别系统：技术演进与应用实践万能小贤哥机器学习人工智能
引言：手写字体识别的技术定位与价值在信息处理领域，人工录入手写文本的低效性与机器识别的高效性形成鲜明对比。例如，医疗处方的人工处理需约5分钟/张，而采用手写字体识别技术可将时间缩短至10秒/张，显著提升处理效率。作为计算机视觉与人工智能的重要分支，手写字体识别技术通过将手写文本转换为可编辑电子文本，不仅大幅减少人工输入时间和错误，降低人工处理成本，还能在大量数据处理时保持高于人工录入的准确性，是人
机器学习算法：核心原理与前沿发展综述 fmvrj34202 机器学习算法人工智能
机器学习算法作为人工智能的核心驱动力，正在重塑我们解决问题的范式。本文将系统性地探讨机器学习算法的分类体系、数学基础、优化方法以及最新发展趋势，为从业者提供技术参考。一、算法分类体系根据学习范式，机器学习算法可分为三大类：监督学习：基于标注数据的建模方法线性回归：最小化平方误差的闭式解θ=(XᵀX)⁻¹Xᵀy支持向量机：通过核技巧实现非线性分类，优化目标为max(0,1-yᵢ(w·xᵢ+b))决策
「日拱一码」020 机器学习——数据处理胖达不服输「日拱一码」机器学习人工智能数据处理 python
目录数据清洗缺失值处理删除缺失值：填充缺失值：重复值处理检测重复值处理重复值异常值处理Z-score方法IQR方法（四分位距）数据一致性检查数据转换规范化（归一化）Min-Max归一化MaxAbsScaler标准化离散化等宽离散化等频离散化数据清洗数据清洗是数据处理的第一步，目的是去除噪声数据、处理缺失值和异常值，使数据更加干净、可用缺失值处理删除缺失值：如果数据集中缺失值较少，可以直接删除包含缺
机器学习每周挑战——二手车车辆信息&交易售价数据梦想成为一名机器学习高手机器学习 python 人工智能
这是数据集的截图目录背景描述数据说明车型对照：燃料类型对照：老规矩，第一步先导入用到的库第二步，读入数据：第三步，数据预处理第四步：对数据的分析第五步：模型建立前的准备工作第六步：多元线性回归模型的建立第七步：随机森林模型的建立问题：背景描述本数据爬取自印度最大的二手车交易平台CARS24，包含8000+该平台上交易车辆的关键评估信息。CARS24成立于2015年，总部位于印度古尔冈，是一个在印度
Python 机器学习核心入门与实战进阶 Day 8 - 数据建模与分析项目实战预备：项目规划与需求拆解蓝婷儿 python python 机器学习开发语言
✅今日目标理解数据分析/建模项目的一般流程练习项目需求理解与目标拆解明确后续模型评估指标与预期交付成果起草项目计划文档（可选写为Markdown）一、项目背景与题目建议（可选方向）项目名称简介学生成绩预测分析系统根据历史表现预测成绩是否达标、学科薄弱点等求职者简历筛选模型根据简历信息预测是否通过初筛电商用户购买预测系统分析用户行为数据预测是否购买公司销售数据趋势分析可视化+聚合分析：月销售趋势、区
【机器学习&深度学习】为什么分类任务中类别比例应接近 1:1？一叶千舟深度学习【理论】机器学习深度学习人工智能
目录前言一、什么是类别不平衡？二、为什么类别比例应接近1:1？2.1⚠模型容易“偏科”2.2精确率、召回率失真2.3模型训练失衡，梯度方向偏移三、现实案例中的“灾难性后果”四、如何应对类别不平衡问题？4.1数据层面处理4.2模型训练层面优化4.3评估指标替代五、实际场景举例六、模拟场景：银行信用卡欺诈检测6.1场景描述6.2数据集情况6.3模型训练结果（未处理不平衡）6.4模型做了什么？6.5实际
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo

A survey on Few-shot Learning （小样本学习）

A survey on Few-shot Learning （小样本学习）

1、FSL形式化定义

2、FSL相关研究问题

3、FSL目标问题

4、基于数据（Data）的小样本学习方法

4.1、训练数据变换（Transforming Samples from D t r a i n D_{train} Dtrain​）

4.2、弱监督或无监督数据（Transforming Samples from Weakly Labeled or Unlabeled Data Set）

4.3、相似数据集（Transforming Samples from Similar Data Set）

5、基于模型（Model）的小样本学习方法

5.1、多任务学习（Multi-task Learning）

5.2、嵌入学习（Embedding Learning）

5.3、记忆信息（External Memory）

5.4、生成模型（Generative Modeling）

你可能感兴趣的:(论文解读,机器学习,小样本学习,机器学习)

4.1、训练数据变换（Transforming Samples from $D_{train}$ ）