gcheney

小样本学习（Few-shot Learning）在图像领域的研究现状

最近在做华为杯的竞赛，涉及小样本学习，总结一下相关的知识及论文

小样本学习（Few-shot Learning）在图像领域的研究现状

1.introduction

1.1注意力机制
1.2 LSTM（Long short-term memory）

2. 小样本学习（Few-shot Learning）

2.1基于度量的小样本学习（Metric Based）（主流方法）

2.1.1孪生网络（Siamese Network）
2.1.2匹配网络（Match Network）
2.1.3原型网络（Prototype Network）
2.1.4关系网络（Relation Network）

2.2基于模型的小样本学习（Model Based）

2.2.1基于记忆Memory的方法
2.2.2 Meta Network

2.3基于优化的小样本学习（Optimization Based）

1.introduction

人类具有通过极少量样本识别一个新物体的能力，如小孩子只需要书中的个别图片，就可以认识什么是“苹果”，什么是“草莓”。研究人员希望机器学习模型在学习了一定类别的大量数据后，对于下游任务中遇到的新类别，只需要少量的样本就能快速学习，实现“小样本学习”。

传统的小样本学习考虑训练数据与测试数据均来自于同一个域。如果下游任务中包含了未知域, 则传统小样本学习方法效果不理想。这就是这次竞赛要解决的问题.

one-short learning : 待解决的问题只有少量的标注数据，先验知识很匮乏，迁移学习属于one-short learning的一种
zero-short learning: 这个种情况下完全没有标注数据，聚类算法等无监督学习属于zero-short learning的一种

小样本学习（Few-shot Learning）是元学习（Meta Learning）在监督学习领域的应用。 Meta Learning，又称为 learning to learn，在 meta training 阶段将数据集分解为不同的 meta task，去学习类别变化的情况下模型的泛化能力，在 meta testing 阶段，面对全新的类别，不需要变动已有的模型，就可以完成分类。

形式化来说，few-shot 的训练集中包含了很多的类别，每个类别中有多个样本。在训练阶段，会在训练集中随机抽取 C 个类别，每个类别 K 个样本（总共 CK 个数据），构建一个 meta-task，作为模型的支撑集（support set）输入；再从这 C 个类中剩余的数据中抽取一批（batch）样本作为模型的预测对象（batch set）。即要求模型从 C*K 个数据中学会如何区分这 C 个类别，这样的任务被称为 C-way K-shot 问题。

训练过程中，每次训练（episode）都会采样得到不同 meta-task，所以总体来看，训练包含了不同的类别组合，这种机制使得模型学会不同 meta-task 中的共性部分，比如如何提取重要特征及比较样本相似等，忘掉 meta-task 中 task 相关部分。通过这种学习机制学到的模型，在面对新的未见过的 meta-task 时，也能较好地进行分类。

Few-shot Learning 模型大致可分为三类：Mode Based，Metric Based 和 Optimization Based。

1.1注意力机制

视觉注意力机制是人类视觉所特有的大脑信号处理机制。人类视觉通过快速扫描全局图像，获得需要重点关注的目标区域，也就是一般所说的注意力焦点，而后对这一区域投入更多注意力资源，以获取更多所需要关注目标的细节信息，而抑制其他无用信息。

这是人类利用有限的注意力资源从大量信息中快速筛选出高价值信息的手段，是人类在长期进化中形成的一种生存机制，人类视觉注意力机制极大地提高了视觉信息处理的效率与准确性。

图1形象化展示了人类在看到一副图像时是如何高效分配有限的注意力资源的，其中红色区域表明视觉系统更关注的目标，很明显对于图1所示的场景，人们会把注意力更多投入到人的脸部，文本的标题以及文章首句等位置。

小样本学习中的注意力机制从本质上讲和人类的选择性视觉注意力机制类似，核心目标也是从众多信息中选择出对当前任务目标更关键的信息。
注意力机制的基本思想和实现原理

1.2 LSTM（Long short-term memory）

长短期记忆（Long short-term memory, LSTM）是一种特殊的RNN，主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题。简单来说，就是相比普通的RNN，LSTM能够在更长的序列中有更好的表现。
LSTM结构（图右）和普通RNN的主要输入输出区别如下所示：

LSTM基本思想和实现原理

LSTM的内部结构，通过门控状态来控制传输状态，记住需要长时间记忆的，忘记不重要的信息；而不像普通的RNN那样只能够仅有一种记忆叠加方式。对很多需要“长期记忆”的任务来说，尤其好用。

但也因为引入了很多内容，导致参数变多，也使得训练难度加大了很多。因此很多时候我们往往会使用效果和LSTM相当但参数更少的GRU来构建大训练量的模型。

2. 小样本学习（Few-shot Learning）

2.1基于度量的小样本学习（Metric Based）（主流方法）

Metric Based 方法通过度量 batch 集中的样本和 support 集中样本的距离，借助最近邻的思想完成分类。

2.1.1孪生网络（Siamese Network）

孪生是指网络结构中的Network_1和Network_2
这两个网络的结构一般是相同的，并且参数是共享的即参数是一致的。
还有一种网络叫伪孪生网络直观理解就是左右两边的网络结构是不同的。
在图中的网络中左右两个网络的作用是用于提取输入图片的特征。特征提取器
比如在人脸领域，输入两个人的人脸图片信息，两个网络分别提取这两个人脸图片中不同部分。
通过使用两个网络提取出来了两个图片的特征接下来计算特征之间的差距distance。之后返回网络的输出结果：这两张图片是否属于同一人。

关于这个网络结构的损失函数也可理解为计算distance的地方设定为：

$G w （ P T ） = G w （ X 1 ， X 2 ）$
指两个特征上属于同一个人的误差
$G w （ P F ） = G w （ X 1 ， X 2 ）$
指两个特征上不属于同一个人的误差

损失函数
$L o s s = G w （ P T ） - G w （ P F ） + α$
我们要使损失函数最小，相当于使 $G w （ P T ）$ 尽可能的小可以理解为这个网络识别两张图片属于一个人能力尽可能的厉害/准确

相当于使 $G w （ P F ）$ 尽可能的大（因为有负号）可以理解为这个网络区分/判别两张图片不属于一个人能力尽可能的厉害/准确

其中参数 $α$ 是为了避免损失函数的值为0 而设定的

因为在损失函数为0 的时候优化过程中求导求梯度会出现问题。

总的来说，孪生网络（Siamese Network）通过有监督的方式训练孪生网络来学习，然后重用网络所提取的特征进行 one/few-shot 学习。

该孪生卷积网络可以：

学习到一些通用的图片特征，可以预测数据量非常少的新分类
在数据源上进行随机采样生成成对的训练数据，然后使用标准的优化算法进行训练
该方法不依赖特定领域知识，只依赖深度学习

具体的网络是一个双路的神经网络，训练时，通过组合的方式构造不同的成对样本，输入网络进行训练，在最上层通过样本对的距离判断他们是否属于同一个类，并产生对应的概率分布。在预测阶段，孪生网络处理测试样本和支撑集之间每一个样本对，最终预测结果为支撑集上概率最高的类别。

L层，每层n个单位
$h_{1,1}$ 表示第一个孪生的层 $l$
$h_{2,1}$ 表示第二个孪生的层 $l$

前两层使用ReLU激活函数，其余的使用sigmoid单元。卷积层的filters尺寸可变，stide固定为1,。为了方便优化滤波器的数量的是16的倍数，然后使用ReLU激活函数，然后选择性的使用max-pooling，stride为2.

【1】Koch, Gregory, Richard Zemel, and Ruslan Salakhutdinov. “Siamese neural networks for one-shot image recognition.” ICML Deep Learning Workshop. Vol. 2. 2015.
代码地址
代码作者对论文的解析
论文解读

2.1.2匹配网络（Match Network）

相比孪生网络，匹配网络（Match Network）为支撑集和 Batch 集构建不同的编码器，最终分类器的输出是支撑集样本和 query 之间预测值的加权求和。

提出的框架学习一个网络，来映射少量的有标签的 Support Set 样本和将一个无标签的样本映射到它的标签（预测），同时避免在适应新的类上面进行微调。

（1）新的类；（2）每个类的训练样本只有一个；（3）学习一个网络映射输入空间到新的空间，比较相似度；

创新点：
模型层面：Matching Nets (MN)，使用注意力机制和存储记忆来快速学习。
训练过程：Task 的概念，每个 task 模拟最后的 meta-testing 的任务，然后 switching the task from minibatch to minibatch，即一次训练几个任务 (minibatch)，重复很多次 (switching)。

该文章也是在不改变网络模型的前提下能对未知类别生成标签，其主要创新体现在建模过程和训练过程上。对于建模过程的创新，文章提出了基于 memory 和 attention 的 matching nets，使得可以快速学习。

Matching Networks for One Shot Learning论文分析

对于训练过程的创新，文章基于传统机器学习的一个原则，即训练和测试是要在同样条件下进行的，提出在训练的时候不断地让网络只看每一类的少量样本，这将和测试的过程是一致的。

创新点：

基于双向 LSTM 学习训练集的 embedding（特征映射），使得每个支撑样本的 embedding （特征映射）是其它训练样本的函数；
基于 attention-LSTM 来对测试样本 embedding（特征映射），使得每个 Query 样本的 embedding 是支撑集 embedding 的函数。文章称其为 FCE (fully-conditional embedding)。

【2】Oriol Vinyals, Charles Blundell, Tim Lillicrap, Daan Wierstra, et al. Matching networks for one shot learning. In Advances in Neural Information Processing Systems, pages 3630–3638, 2016.

2.1.3原型网络（Prototype Network）

原型网络是解决小样本分类问题的一个比较实用且效果还不错的方法，它基于这样的想法：每个类别都存在一个原型表达，该类的原型是 support set 在 embedding 空间中的均值。然后，分类问题变成在 embedding 空间中的最近邻。

在小样本分类问题中，最需要解决的一个问题是数据的过拟合，由于数据过少，一般的分类算法会表现出过拟合的现象，从而导致分类结果与实际结果有较大的误差。为了减少因数据量过少而导致的过拟合的影响，可以使用基于度量的元学习方法，而原型网络便是。在此方法中，需要将样本投影到一个度量空间，且在这个空间中同类样本距离较近，异类样本的距离较远。

如图c1、c2、c3 分别是三个类别的均值中心（称 Prototype），将测试样本 x 进行 embedding 后（将样本x投影至这个空间），与这 3 个中心进行距离计算，从而获得 x 的类别。：

那么，现在有几个问题：

怎么将这些样本投影至一个空间且让同类样本间距离较近？
怎么说明一个类别所在的位置？从而能够让未标记的样本计算与类别的距离

首先，先来说明第一个问题，即如何投影。论文中提到了一个带参数的嵌入函数，这个函数可以理解为投影的过程，表示样本的特征向量，函数值表示投影到那个空间后的值，这个嵌入函数是一个神经网络，参数是需要学习的，可以认为参数决定了样本间的位置，所以需要学习到一个较好的值，让同类别样本间距离较近。

想法说完了，再来说具体实现。首先说明一下训练数据，论文中实验的数据分为支持集和查询集：

支持集：即训练集，在本论文中由一些已标记的样本组成，比如有N个类，每个类中有M个样本，则为N-way–M-shot。
查询集：即测试集，在本论文中由一些已标记的样本和部分未标记的样本组成，同理测试时要根据训练时来，如训练时为N-way–M-shot，则测试时也要为N-way–M-shot。

论文中认为一个类由这个类所有样本在投影空间里的平均值决定,所以，类k的原型为：
$c_{k}=\frac{1}{|S_{k}|}\sum_{(x_{i},y_{i})\in S_{k}}f_{\phi }(x_{i})$

原型网络的原理较为简单，但是有一点小问题就是，对于两个或多个样本的相似度，用距离较近来度量是否合理。对于某一些数据集来说可能有用，但是对于一般的图片，效果可能就不那么好了。因此，两个样本或者图片间相似性的度量方法是下一步可以改进的地方。

Prototypical Networks for Few-shot Learning论文详解1
Prototypical Networks for Few-shot Learning论文详解2
Prototypical Networks for Few-shot Learning论文详解3
Prototypical Networks for Few-shot Learning论文详解4
Prototypical Networks for Few-shot Learning文章代码
【3】Snell, Jake, Kevin Swersky, and Richard Zemel. “Prototypical networks for few-shot learning.” Advances in Neural Information Processing Systems. 2017.

2.1.4关系网络（Relation Network）

关系网络其实就是引入注意力机制，通过对embedding（特征映射）后的特征计算注意力，利用注意力得分进行分析。因此

前面几个网络结构在最终的距离度量上都使用了固定的度量方式，如 cosine，欧式距离等，这种模型结构下所有的学习过程都发生在样本的 embedding 阶段。

而 Relation Network 认为度量方式也是网络中非常重要的一环，需要对其进行建模，所以该网络不满足单一且固定的距离度量方式，而是训练一个网络来学习（例如 CNN）距离的度量方式，在 loss 方面也有所改变，考虑到 relation network 更多的关注 relation score，更像一种回归，而非 0/1 分类，所以使用了 MSE 取代了 cross-entropy。

K-shot：对每个训练类的所有样本的Embedding模块输出进行逐元素求和，这个合并的类级特征映射与上面的查询图像特征映射相结合。
Objective function：使用均方误差MSE作为损失函数，将关系分数rij回归到ground truth：匹配的相似性为1，不匹配的相似性为0。
Zero-shot：每个训练类中使用语义嵌入向量代替one shot数据集作为支持集。模型结构中除了用于查询集的嵌入模块f1，还使用了第二个异构模块f2用于处理语义嵌入向量。

Embedding利用4个卷积块实现。每个卷积块包含64个filter大小为33，使用batch normalization和ReLU激活函数。前两个block包含22的max pooling操作，后两个block不需要。目的是需要在关系模块中为进一步的卷积层提供输出特征映射。
Relation模块由两个卷积块和两个全连接层组成，每一个卷积块是64个filter大小为33，使用batch normalization，ReLU激活函数，22的max pooling。最后一个max pooling层输出大小在Omniglot中为64，在miniImageNet中为6433=576。这两个全连接层分别是8和1。所有全连接层的激活函数为ReLU，除了最后一层全连接层是Sigmoid（目的是生成合理的关系分数范围）。
Few-shot：Adam学习率设置为10-3，每100,000个情景后折半，端到端训练，没有额外的数据集。
训练时的数据是Omniglot，通过对原始数据旋转90°，180°，270°来增加新类，选择1200类并通过旋转作为训练集，423类通过旋转作为测试集。并将大小resize为28*28。

Learning to compare: Relation network for few-shot learning.论文详解
Learning to compare: Relation network for few-shot learning.开源代码

【4】Sung, Flood, et al. “Learning to compare: Relation network for few-shot learning.” Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018.

2.2基于模型的小样本学习（Model Based）

Model Based 方法旨在通过模型结构的设计快速在少量样本上更新参数，直接建立输入 x 和预测值 P 的映射函数

2.2.1基于记忆Memory的方法

通过在神经网络上添加Memory来实现。Santoro等提出在网络的输入把上一次训练的y label也作为输入，并且添加了external memory存储上一次训练x的输入，这使得下一次输入后进行反向传播时，可以让y label和x建立联系，使得之后的x能够通过外部记忆获取相关图像进行比对来实现更好的预测。

One-shot Learning with Memory-Augmented Neural Networks论文详解
【5] Santoro, Adam, Bartunov, Sergey, Botvinick, Matthew, Wierstra, Daan, and Lillicrap, Timothy. Meta-learning with memory-augmented neural networks. In Proceedings of The 33rd International Conference on Machine Learning, pp. 1842–1850, 2016.

Meta-Learning论文笔记：Meta Network

【6】Munkhdalai T, Yu H. Meta Networks. arXiv preprint arXiv:1703.00837, 2017.
以Meta-Learning with memory-augmented neural networks这篇文章为例，我们看一下他的网络结构：

2.2.2 Meta Network

2.3基于优化的小样本学习（Optimization Based）

Optimization Based 方法认为普通的梯度下降方法难以在 few-shot 场景下拟合，因此通过调整优化方法来完成小样本分类的任务。

Optimization as a model for few-shot learning论文详解

[7] Ravi, Sachin, and Hugo Larochelle. “Optimization as a model for few-shot learning.” (2016).

Model-agnostic meta-learning for fast adaptation of deep networks论文详解
[8] Finn, Chelsea, Pieter Abbeel, and Sergey Levine. “Model-agnostic meta-learning for fast adaptation of deep networks.” Proceedings of the 34th International Conference on Machine Learning-Volume 70. JMLR. org, 2017.

机器学习AI/ML/CV/NLP/GNN算法公式汇总Latex代码 rockingdingo tensorflow 大数据自然语言处理算法深度学习机器学习
图学习和LinkPrediction任务KnowledgeGraphLinkPredictionEquationsAndLatexCodehttp://www.deepnlp.org/blog/knowledge-graph-link-prediction小样本学习和零样本学习公式的Latex代Few-ShotLearningAndZero-ShotLearningEquationsLatexCo
仅用10张图片，AI就能学会识别万物？多模态小样本学习颠覆传统！沃恩智慧人工智能深度学习人工智能学习深度学习
小样本学习与多模态结合是当前人工智能领域的热门研究方向，旨在通过结合多模态数据（如视觉、语言、音频等）来提高模型在数据稀缺情况下的学习效率和性能。例如，ZS-DeconvNet方法在Nature上发表，展示了其在极低训练数据需求下，将图像分辨率提升超过1.5倍衍射极限的能力。此外，CPE-CLIP和MMFL等方法通过利用预训练模型和冻结的大规模视觉语言模型，实现了跨会话的迁移学习和快速适应新样本。
阿里云力夺 FewCLUE 榜首！知识融入预训练+小样本学习的实战解析阿里云技术自然语言处理机器学习
一概述7月8日，中文语言理解权威评测基准CLUE公开了中文小样本学习评测榜单最新结果，阿里云计算平台PAI团队携手达摩院智能对话与服务技术团队，在大模型和无参数限制模型双赛道总成绩第一名，决赛答辩总成绩第一名。中文语言理解权威评测基准CLUE自成立以来发布了多项NLP评测基准，包括分类榜单，阅读理解榜单和自然语言推断榜单等，在学术界、工业界产生了深远影响。其中，FewCLUE是CLUE最新推出的一
论文阅读笔记《SimpleShot: Revisiting Nearest-Neighbor Classification for Few-Shot Learning》深视论文阅读笔记 #小样本学习深度学习小样本学习
小样本学习&元学习经典论文整理||持续更新核心思想本文提出一种基于最近邻方法的小样本学习算法（SimpleShot），作者指出目前大量的小样本学习算法都采用了元学习的方案，而作者却发现使用简单的特征提取器+最近邻分类器的方法就能实现非常优异的小样本分类效果。本文首先用特征提取网络fθf_{\theta}fθ+线性分类器在一个基础数据集上对网络进行训练，将训练得到的特征提取网络增加一个简单的特征
SimpleShot: Revisiting Nearest-Neighbor Classification for Few-Shot Learning 论文笔记头柱碳只狼小样本学习
前言目前大多数小样本学习器首先使用一个卷积网络提取图像特征，然后将元学习方法与最近邻分类器结合起来，以进行图像识别。本文探讨了这样一种可能性，即在不使用元学习方法，而仅使用最近邻分类器的情况下，能否很好地处理小样本学习问题。本文发现，对图像特征进行简单的特征转换，然后再进行最近邻分类，也可以产生很好的小样本学习结果。比如，使用DenseNet特征的最近邻分类器，在结合均值相减（meansubtra
每周编辑精选｜FewJoint 基准数据集上线、科技部监督司发布 AI 新规人工智能资讯数据集
小样本学习(Few-shotLearning)是指像人类一样能够通过很少的样本来学习掌握新任务。这一领域已经成为机器学习社区的热点，并被认为是推动机器智能接近人类智能的关键方向之一。哈工大推出了FewJoint基准数据集，为NLP小样本评测提供了公共的评价基准。该数据集已在hyper.ai上线，hyper.ai还有更多供中文大模型训练的NLP数据集可以下载哦～一起来看看吧！1月29日-2月2日，h
小样本学习系列工作（持续更新） MingchenS 计算机视觉学习人工智能深度学习计算机视觉 python
小样本学习系列工作有关小样本学习的各类文章通常会将其方法分成几个大类：基于度量学习的小样本方法、基于数据增强的小样本学习方法和基于模型初始化的小样本学习方法。我觉得这样分类并不好，因为三种方法之间并不是各自独立存在的，大多数情况下都是有交集的，比如一篇工作可能既使用了元学习的训练策略，同时又在度量方法上进行了创新。因此在梳理工作的时候，还是按照论文的顺序来梳理比较好，每篇工作都有他的特点，其思考的
小样本学习 Ada's 系统科学神经科学认知科学通用人工智能基础（语音文本图像等）
github.com/blue-blue272/fewshot-CAN从注意力方面的进展来看自然语言已经和图像在算法底层通用以下方法可能对小样本有帮助：
科大讯飞将于1月30日发布星火大模型 V3.5，基于全国产化算力底座训练喜好儿aigc 人工智能科技 aigc ai
科大讯飞即将发布全新AI大模型——星火认知大模型V3.5，该模型将于14:00正式发布。据透露，相比于去年10月24日发布的V3.0版本，V3.5在逻辑推理、文本生成、数学答题及小样本学习能力上均实现了显著提升。科大讯飞官网链接：讯飞星火认知大模型-AI大语言模型-星火大模型-科大讯飞AI工具专区：+AI工具-喜好儿aigc科大讯飞股份有限公司是中国领先的人工智能企业，自1999年成立以来，专注于
【机器学习一百问 01】迁移学习和小样本学习的本质不同是什么？坚果仙人机器学习机器学习迁移学习学习
注:这些只是个人理解，如有质疑可提问讨论！迁移学习和小样本学习都是机器学习领域的重要分支，它们虽然有一些交集，但在目的和核心方法上存在本质的不同：目的和焦点：迁移学习：其主要目的是利用在一个或多个源任务上获得的知识，来改善或加速对新任务的学习过程。迁移学习的核心在于“知识转移”，它不特定于数据量的多少。小样本学习：其核心挑战是如何在非常少量的数据（即小样本）上实现有效的学习。小样本学习特别关注于如
CVPR19-Few-shot vieo
CVPR19-Few-shot本文主要总结了CVPR2019的few-shot的文章，主要从motivation，具体方法上进行总结。小样本学习：训练中可以使用各类样本，但是测试时，面对新的类别（通常为5类），每类只有极少量的标注样本，以及来自相同类别的查询图像。基于度量的方法（在原型网络，图卷积的基础上改进）RevisitingLocalDescriptorbasedImage-to-Class
小样本学习（FSL）和元学习、数据增强和对比学习各自的概念和相互关系 Chowley 机器学习深度学习自然语言处理 lstm chatgpt
前言最近一周在做简历和投递，想找个暑假的实习岗，有几个过了初筛，今天围绕我的简历讲解一下里面的科研经历和方向推荐，也是给自己做一个总结。去年疫情开始，取消线下课程和考试，我闲着没事，就搞起了研究，很巧的是和ChatGPT时间重叠了，当时因为网上全是防治疾病的，我也就错过了ChatGPT的黄金期，不然没准就是搞NLP了，今天我也请GPT4.0一同创作，看能不能给这篇博客带来不一样的火花。小样本学习F
小样本学习综述雪夜的星_e40c
小样本学习（Few-shotLearning）综述摘要:人类非常擅长通过极少量的样本识别一个新物体，比如小孩子只需要书中的一些图片就可以认识什么是“斑马”，什么是“犀牛”。在人类的快速学习能力的启发下，研究人员希望机器学习模型在学习了一定类别的大量数据后，...分类非常常见，但如果每个类只有几个标注样本，怎么办呢？笔者所在的阿里巴巴小蜜北京团队就面临这个挑战。我们打造了一个智能对话开发平台--Di
小样本学习介绍（超详细） s_m_c 计算机视觉学习人工智能深度学习计算机视觉
小样本学习介绍本文首先介绍了什么是小样本学习，其次介绍了为什么小样本学习的很多文章都采用元学习的方法。目的是通过通俗的解释更加清楚的介绍小样本学习是什么，适合初学者的入门。当然，以下更多的是自己的思考，欢迎交流。什么是小样本学习？当我开始接触“小样本”这个术语的时候，给我的第一感觉就是他的数据集很小（这也是我入坑小样本学习最开始的原因，以为炼丹不需要太久），相信很多人有个同样的感觉，但是事实上并不
【深度学习：Few-shot learning】理解深入小样本学习中的孪生网络 jcfszxc 深度学习知识库深度学习学习人工智能
【深度学习：Few-shotlearning】理解深入小样本学习中的孪生网络深入理解孪生网络：架构、应用与未来展望小样本学习的诞生元学习小样本学习孪生网络的基本概念孪生网络的细节TripletLoss架构特点关键组件训练过程主要应用领域未来展望示例图片结论备注：本篇博客中有部分图片由GPT生成深入理解孪生网络：架构、应用与未来展望在人工智能和机器学习的领域中，**孪生网络（SiameseNetwo
【论文阅读笔记】One-Shot Relational Learning for Knowledge Graphs - EMNLP 2018 卷卷0v0 论文阅读知识图谱论文阅读知识图谱神经网络
知识图谱-->知识补全-->长尾问题-->元关系学习基于度量的方法（本文）基于优化的方法文章目录Abstract1Introduction2RelatedWork关系学习的嵌入模型小样本学习3Background3.1问题定义3.2One-Shot学习设置4Model4.1邻居编码器4.2匹配处理器4.3损失函数和训练5Experiments5.1数据集5.2实施细节5.3结果关于模型选择的备注5
小样本学习idea（不断更新） s_m_c 学习
在此整理并记录自己的思考过程，其中不乏有一些尚未成熟或者尚未实现的idea，也有一些idea实现之后没有效果或者正在实现，当然也有部分idea已写成论文正在投稿，都是自己的一些碎碎念念的思考，欢迎交流。研一上学期9.18现有思路：1.用pretrain好的MAE，采用不同的遮挡方式（或者遮挡比例，固定或者不固定，随机或者block-wise），生成不同遮挡方式下的特征，相当于单张图片的样本扩充。2
论文解读：Exploring Complementary Strengths of Invariant and Equivariant Representations 十有久诚深度学习人工智能
小样本学习论文解读：ExploringComplementaryStrengthsofInvariantandEquivariantRepresentationsforFew-ShotLearning摘要teach：这篇文章尽管标题带小样本学习，但是并没有设计一套小样本学习的算法，而是用一种数据增强或者数据增广的方式生成更多的样本。通过样本之间的训练或者学习来去提升这个模型的泛化能力。用积累的数据
CVPR 2023 精选论文学习笔记：Meta-Tuning Loss Functions and Data Augmentation for Few-Shot Object Detection 结构化文摘学习笔记目标检测人工智能计算机视觉深度学习
我们给出以下四个分类标准：1.学习方法元学习：元学习是一种学习范式，旨在教模型如何快速学习新任务。在小样本学习的背景下，元学习算法在各种任务上进行训练，每个任务只有少数示例。这允许模型学习如何调整其学习过程以适应新任务，即使这些任务与它以前见过的任务非常不同。数据增强：数据增强是一种通过对现有数据应用转换来生成新训练数据的技术。这对于小样本学习来说可以是一种有用的技术，因为它可以帮助增加可用训练数
基于小样本学习的SAR图像识别吧啦_吧啦
姓名：刘倩学号：19021210889【嵌牛导读】：对于SAR图像目标识别，目前研究人员是基于大样本进行建模和研究，而对于小样本条件下的SAR图像目标识别，只有少部分人开展了研究，并且与大样本数据相比较，其识别准确率较低。针对这一问题提出了一种新的算法——卷积自编码器算法。该方法能自动识别小样本图像中的有效特征，提高识别准确率。【嵌牛鼻子】：小样本学习，深度学习，卷积神经网络，自编码器【嵌牛提问】
分布式系统-拜占庭将军问题-通信协议 TBYourHero
元学习论文总结||小样本学习论文总结2017-2019年计算机视觉顶会文章收录AAAI2017-2019CVPR2017-2019ECCV2018ICCV2017-2019ICLR2017-2019NIPS2017-2019什么是拜占庭将军问题？在很久很久以前，拜占庭是东罗马帝国的首都。那个时候罗马帝国国土辽阔，为了防御目的，因此每个军队都分隔很远，将军与将军之间只能靠信使传递消息。在打仗的时候，
目标检测||速览 TBYourHero 深度学习 object detection
元学习论文总结||小样本学习论文总结2017-2019年计算机视觉顶会文章收录AAAI2017-2019CVPR2017-2019ECCV2018ICCV2017-2019ICLR2017-2019NIPS2017-2019目录一：基础概念二：两种方法2.1两阶段法R-CNNSPPNetFastR-CNNPFNMaskR-CNN2.2一阶段法YOLOSSDDSSDRetinaNet总结一：基础概念
小样本学习在图像识别中的挑战与突破 matlabgoodboy 学习
小样本学习（Few-ShotLearning）是一种机器学习方法，旨在从很少的样本中学习并做出准确的预测。在图像识别领域，小样本学习面临一些挑战，同时也涌现出一些突破性的解决方法。挑战：缺乏数据：小样本学习的主要挑战之一是样本数量有限，这使得传统深度学习模型难以学习足够的特征。过拟合：由于样本少，模型容易过拟合，即在训练样本上表现良好，但在未见过的数据上表现不佳。领域差异：在小样本学习中，模型需要
FusionDiff：第一个基于扩散模型实现的多聚焦图像融合的论文 ctrl A_ctrl C_ctrl V #多聚焦图像融合算法深度学习计算机视觉人工智能
文章目录1.论文介绍2.研究动机3.模型结构3.1网络架构3.2前向扩散过程3.3逆向扩散过程3.4训练和推理过程4.小样本学习4.实验结果1.论文介绍题目：FusionDiff:Multi-focusimagefusionusingdenoisingdiffusionprobabilisticmodels作者：MiningLi，中国科学技术大学录用期刊：ExpertSystemswithAppl
从技术到科学，中国AI向何处去？人工智能学家大数据编程语言机器学习人工智能深度学习
来源：科学网编辑：宗华排版：华园作者：金榕（阿里巴巴达摩院副院长、原密歇根州立大学终身教授）●AI时代序幕刚拉开，AI目前还处于初级阶段，犹如法拉第刚刚发现了交流电，还未能从技术上升为科学。●以深度学习为代表的AI研究这几年取得了诸多令人赞叹的进步，但部分也是运气的结果，其真正原理迄今无人知晓。●在遇到瓶颈后，深度学习有三个可能突破方向：深度学习的根本理解、自监督学习和小样本学习、知识与数据的有机
SVM实现小尺寸图片分类余生的观澜计算机视觉 King of CV python技术栈支持向量机机器学习分类
问题背景在工业识别的场景中，经常会遇到误判与误识别，所以最后输出的结果，需要再通过N分类算法去过滤一遍，确保识别到的物体，是我们想要的，能实现这个方案有很多，传统机器学习与深度神经网络都可以做到，传统机器学习，比如SVM，决策树，深度神经网络，从最简单的卷积到resnet，小样本学习，迁移学习，都可以实现。本文通过SVM对算法进行封装，实现一个图片的分类。参考资料https://blog.csdn
《Learning to Compare: Relation Network for Few-Shot Learning》 Lucifer_75d2
一、Introduction深度学习模型在视觉识别任务中取得了巨大的成功。然而，这些监督学习模型需要大量的标记数据和许多迭代来训练它们大量的参数。由于标注成本的原因，这严重限制了它们对新类的可拓展性，但从根本上限制了它们对新出现的或是很少出现的类的适用性。在这些类别中，大量注释的图像可能根本不存在。相比之下，人类在几乎没有直接监督或根本没有监督的情况下却非常擅长识别物体，例如小样本学习或零样本学习
GPT系列发展及技术：GPT1到GPT3的发展，InstructGPT的RLHF流程，GPT４榴莲_ gpt chatgpt transformer 语言模型自然语言处理
目录GPT系列前言Transformertransformer的代码实现Transformer位置编码具体结构BERT--EncoderGPT--Decoder微调方法--fine-tuningVSPromptingGPT1-GPT3GPT1预训练+微调1、无监督预训练2、有监督微调对子任务构造不同数据输入和bert对比GPT2-语言模型是多任务的学习器小样本学习GPT3动机数据集Instruct
Optimization as a model for few-shot learning||论文阅读 TBYourHero 深度学习 paper reading 小样本学习
元学习论文总结||小样本学习论文总结2017-2019年计算机视觉顶会文章收录AAAI2017-2019CVPR2017-2019ECCV2018ICCV2017-2019ICLR2017-2019NIPS2017-2019介绍：对Few-shotlearning中的优化进行建模本文通过将SGD更新规则解释为具有可训练参数的门控递归模型，描述了一种新的元学习方法。这个想法对于迁移学习相关的研究来说
小样本学习的k-way n-shot TBYourHero 深度学习
元学习论文总结||小样本学习论文总结2017-2019年计算机视觉顶会文章收录AAAI2017-2019CVPR2017-2019ECCV2018ICCV2017-2019ICLR2017-2019NIPS2017-2019如下图简单理解一下小样本的训练方式：Training（训练模型）SampleSetQuerySetTesting（测试模型）SupportSetTestSet(无label)训
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少

小样本学习（Few-shot Learning）在图像领域的研究现状

小样本学习（Few-shot Learning）在图像领域的研究现状

1.introduction

1.1注意力机制

1.2 LSTM（Long short-term memory）

2. 小样本学习（Few-shot Learning）

2.1基于度量的小样本学习（Metric Based）（主流方法）

2.1.1孪生网络（Siamese Network）

2.1.2匹配网络（Match Network）

2.1.3原型网络（Prototype Network）

2.1.4关系网络（Relation Network）

2.2基于模型的小样本学习（Model Based）

2.2.1基于记忆Memory的方法

2.2.2 Meta Network

2.3基于优化的小样本学习（Optimization Based）

你可能感兴趣的:(小样本学习)