CaoChengtai

Few-shot learning（少样本学习）和 Meta-learning（元学习）概述

（一）Few-shot learning（少样本学习）

1. 问题定义

众所周知，现在的主流的传统深度学习技术需要大量的数据来训练一个好的模型。例如典型的 MNIST 分类问题，一共有 10 个类，训练集一共有 6000 个样本，平均下来每个类大约 600 个样本，但是我们想一下我们人类自己，我们区分 0 到 9 的数字图片的时候需要看 6000 张图片才知道怎么区分吗？很显然，不需要！这表明当前的深度学习技术和我们人类智能差距还是很大的，要想弥补这一差距，少样本学习是一个很关键的问题。另外还有一个重要原因是如果想要构建新的数据集，还是举分类数据集为例，我们需要标记大量的数据，但是有的时候标记数据集需要某些领域的专家（例如医学图像的标记），这费时又费力，因此如果我们可以解决少样本学习问题，只需要每个类标记几张图片就可以高准确率的给剩余大量图片自动标记。这两方面的原因都让少样本学习问题很吸引人。
在 few-shot learning 中有一个术语叫做 $N$ -way $K$ -shot 问题，简单的说就是我们需要分类的样本属于 $N$ 个类中一种，但是我们每个类训练集中的样本只有 $K$ 个，即一共只有 $N * K$ 个样本的类别是已知的。

图片来自论文《Optimization as a Model for Few-Shot Learning.》，这是一个 5-way 1-shot 的图示，左边是训练集一共 5 张图片来自 5 个类，每个类只有一张图片。右边是测试集，理论上可以有任意多个图片用于测试，图中只给出了两张实例。
Few-shot learning 问题的关键是解决过拟合 (overfitting) 的问题，因为训练的样本太少了，训练出的模型可能在训练集上效果还行，但是在测试集上面会遭遇灾难性的崩塌。

2. 解决方法

2.1 数据增强和正则化

这一类方法想法很直接简单，既然训练数据不够那我就增加训练样本，既然过拟合那我就使用正则化技术。

数据加强：最常见的例子就是有时对 Omniglot 数据集的预处理，会将图片旋转 90 、180 、270 度，这样就可以使样本数量变为原来的 4 倍。
正则化：在训练的时候加入一个正则项，这个正则项的构建选择是关键。比如《Few-shot Classification on Graphs with Structural Regularized GCNs》。该论文讨论 Graph 中节点分类的 few-shot 问题，常见的节点分类是使用 GCN 从节点的特征向量 feature 学习一个 embedding 然后用 embedding 来做分类，如果是 few-shot 问题，性能会大大下降（准确率大约从 70% 到了 40%），作者在训练的时候给损失函数加了一个正则项。作者将 feature 到 embedding 的过程看成编码器 encoder，然后额外加了几层网络作为 decoder，将 embedding 重构为 feature ，然后重构误差作为正则项（准确率从 40% 提升了 50%，大约 10 个百分点）。（更多内容可以参考这篇论文和别的使用正则化技术的论文）

2.2 Meta-learning（元学习）

元学习的核心想法是先学习一个先验知识（prior），这个先验知识对解决 few-shot learning 问题特别有帮助。Meta-learning 中有 task 的概念，比如上面图片讲的 5-way 1-shot 问题就是一个 task，我们需要先学习很多很多这样的 task，然后再来解决这个新的 task 。最最最重要的一点，这是一个新的 task。分类问题中，这个新的 task 中的类别是之前我们学习过的 task 中没有见过的！在 Meta-learning 中之前学习的 task 我们称为 meta-training task，我们遇到的新的 task 称为 meta-testing task。因为每一个 task 都有自己的训练集和测试集，因此为了不引起混淆，我们把 task 内部的训练集和测试集一般称为 support set 和 query set

简单画了一个示意图，前面三个是三个 meta-training task （当然实际需要很多这样的 meta-training task 才能学到我们需要的先验知识），最后一个就是 meta-testing task。我们最后评价我们的 meta-learning 方法的好坏就是在红色标记部分上的 performance。

方法 2.1 和方法 2.2 之间有个明显的差异就是 meta-learning 需要一些类来构建 meta-training task。由于 meta-testing 的类别要和 meta-training 完全不同，因此如果我们只有 MNIST 数据集，没法使用 meat-learning 来解决 MNIST 上的 10-way few-shot learning 问题，但是方法 2.1 可以。不过我们可以使用 meta-learning 解决 MNIST 上的 N-way (N < 6) 的 few-shot learning 问题。那么如果我们非要解决 MNIST 上的 10-way few-shot learning 问题怎么办呢，可以在另外一个数据集，例如 Omniglot ，上面进行 meta-training，然后学到的先验知识用来解决这个问题。《Siamese neural networks for one-shot image recognition.》和《Matching networks for one shot learning.》都在论文中做过这样子实验（这一种情况和迁移学习（transfer learning）有相似的地方）。

（二）Meta-learning（元学习）

Meta-learning 方法的分类标准有很多，个人喜欢按照如下标准分为三类。参考文章《Learning to Compare: Relation Network for Few-Shot Learning》

学习微调 (Learning to Fine-Tune)
基于 RNN 的记忆 (RNN Memory Based)
度量学习 (Metric Learning)

Meta-learning 中 task 的概念是和 meta-learning 的本质有关的。Meta-learning 其实还有一个名字叫做“学会学习” (Learn to learn)，这来自于对人类智能的基本认知：我们人类学习一个东西的时候不是从头开始学的，都是基于之前学习的知识来进行学习的。比如如果你会玩英雄联盟，那你学习玩王者荣耀会快很多。但是我们的深度学习模型呢，学习新的东西（可以看成新的类，新的 task）需要从头开始学习（当然需要大量的样本），即使你之前学过特别类似的东西。因此 Meta-learning 就像让深度学习学会学习，利用之前学过的知识在面对新的问题可以学习得又快又好，如何体现又快又好呢？ – few-shot learning 呗~ 因此 meta-learning 和 few-shot learning 现在的研究基本都是在一起的。接下来介绍如何从之前的 task 来学习我们想要的先验知识。

1. 学习微调 (Learning to Fine-Tune)

MAML（《Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks》）是这类方法的范例之一。MAML 的思想是学习一个初始化参数 (initialization parameter)，这个初始化参数在遇到新的问题时，只需要使用少量的样本 (few-shot learning) 进行几步梯度下降就可以取得很好地效果（参见后续博客）。另一个典型是《Optimization as a Model for Few-Shot Learning》，他不仅关注于初始化，还训练了一个基于 LSTM 的优化器 (optimizer) 来帮助微调。

2. 基于 RNN 的记忆 (RNN Memory Based)

最直观的方法，使用基于 RNN 的技术记忆先前 task 中的表示等，这种表示将有助于学习新的 task。可参考《Meta networks》和《Meta-learning with memory-augmented neural networks.》

3.度量学习 (Metric Learning)

主要可以参考《Learning a Similarity Metric Discriminatively, with Application to Face Verification.》，《Siamese neural networks for one-shot image recognition》，《Siamese neural networks for one-shot image recognition》，《Matching networks for one shot learning》，《Prototypical Networks for Few-shot Learning》，《Learning to Compare: Relation Network for Few-Shot Learning》。
核心思想：学习一个 embedding 函数，将输入空间（例如图片）映射到一个新的嵌入空间，在嵌入空间中有一个相似性度量来区分不同类。我们的先验知识就是这个 embedding 函数，在遇到新的 task 的时候，只将需要分类的样本点用这个 embedding 函数映射到嵌入空间里面，使用相似性度量比较进行分类。

4.方法简单比较

三种方法会在后续博客中继续介绍（已经介绍了两篇论文，可参见之前博客。链接1：https://blog.csdn.net/weixin_37589575/article/details/92582373，链接2：https://blog.csdn.net/weixin_37589575/article/details/92768668），这里简单比较一下三种方法：

基于 RNN 的记忆 (RNN Memory Based) 有两个关键问题，一个是这种方法经常会加一个外部存储来记忆，另一个是对模型进行了限制 (RNN)，这可能会在一定程度上阻碍其发展和应用。
学习微调 (Learning to Fine-Tune) 的方法需要在新的 task 上面进行微调，也正是由于需要新的 task 中 support set 中有样本来进行微调，目前我个人还没看到这种方法用于 zero-shot learning（参考 few-shot learning 问题的定义，可以得到 zero-shot learning的定义）的问题上，但是在《Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks》的作者 Chelsea Finn 的博士论文《Learning to Learn with Gradients》中给出了 MAML 的理论证明，并且获得了 2018 ACM 最佳博士论文奖，还有一点就是 MAML 可以用于强化学习，另外两种方法多用于分类问题。链接：https://mp.weixin.qq.com/s/AdlwI-nbVlDWCj0o5LR7Sw
度量学习 (Metric Learning)，和学习微调 (Learning to Fine-Tune) 的方法一样不对模型进行任何限制，并且可以用于 zero-shot learning 问题。虽然效果比较理想但是现在好像多用于分类任务并且可能缺乏一些理论上的证明，比如相似性度量是基于余弦距离还是欧式距离亦或是其他？为什么是这个距离？（因为 embedding 函数是一个神经网络，可解释性差，导致无法很好解释新的 embedding 空间），虽然《Learning to Compare: Relation Network for Few-Shot Learning》中的 Relation Network 将两个需要比较的 embedding 又送到一个神经网络（而不是人为手动选择相似性度量）来计算相似性得分，但是同样缺乏很好地理论证明。

5.未来方向

5.1 更好的 meta-learning 方法

现有方法都有各自的优缺点，提出一个新的更好的 meta-learning 方法是目前的主流研究方向。实验结果还有很大的提升空间。例如，如果想从基于度量学习方向出发，那么是否可以从理论入手推导出相似性度量应该怎么选择（图片分类和文本分类问题，CNN 和 RNN 作为 embedding 函数都有可能使度量选择不同）。

5.2 meta-learning 的应用

现在的主流还是算法的研究，一般研究问题都是理论上的问题，例如图片的 5-way 1-shot 问题。实际应用问题研究还很少，这也是一个未来的方向。

（三）论文链接

《Optimization as a Model for Few-Shot Learning》：https://openreview.net/pdf?id=rJY0-Kcll.
《Few-shot Classification on Graphs with Structural Regularized GCNs 》： https://openreview.net/pdf?id=r1znKiAcY7.
《Siamese neural networks for one-shot image recognition》：http://www.cs.toronto.edu/~gkoch/files/msc-thesis.pdf.
《Matching networks for one shot learning》： http://papers.nips.cc/paper/6385-matching-networks-for-one-shot-learning.pdf.
《Learning to Compare: Relation Network for Few-Shot Learning》：http://openaccess.thecvf.com/content_cvpr_2018/papers/Sung_Learning_to_Compare_CVPR_2018_paper.pdf.
《Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks》：https://www.cs.utexas.edu/~sniekum/classes/RL-F17/papers/Meta.pdf
《Meta networks》：https://pdfs.semanticscholar.org/3ecc/71263d5dd8a51438e351f0a27fba5a6e7592.pdf
《Meta-learning with memory-augmented neural networks.》：http://proceedings.mlr.press/v48/santoro16.pdf
《Prototypical Networks for Few-shot Learning》：http://papers.nips.cc/paper/6996-prototypical-networks-for-few-shot-learning.pdf
《Learning a Similarity Metric Discriminatively, with Application to Face Verification.》：http://yann.lecun.com/exdb/publis/pdf/chopra-05.pdf.

第37篇Personalized Federated Learning: A Meta-Learning Approach（perfedavg联邦学习+元学习）2020个性化联邦学习使用Hessian 还不秃顶的计科生联邦学习学习
第一部分：解决的问题联邦学习（FL）在多用户协同训练模型时，因数据隐私和通信限制，用户仅与中央服务器交互。传统FL方法得到的全局模型无法适应各用户的异质数据，导致在用户本地数据集上性能不佳因此这篇论文旨在解决联邦学习中模型缺乏个性化的问题第二部分：idea基于模型无关元学习（MAML）框架，提出个性化联邦学习问题的新公式。通过寻找一个初始共享模型，让用户基于自身数据执行少量梯度下降步骤就能快速适应
一切皆是映射：元学习中的神经架构搜索（NAS）杭州大厂Java程序媛计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
元学习神经架构搜索NAS遗传算法强化学习演化算法一切皆是映射：元学习中的神经架构搜索（NAS）在人工智能的广阔领域中，神经架构搜索（NeuralArchitectureSearch，简称NAS）是一颗璀璨的明星，它代表着一种全新的方法，即通过算法自动寻找最优的神经网络架构。这种思想源于元学习（Meta-Learning），它关注的是如何使学习过程本身变得更加高效。本文将深入探讨NAS的原理、方法、
元学习（Meta-learning）如MAML（Model-Agnostic Meta-Learning）的优点和缺点，以及使用元学习如MAML时，需要注意以下问题小桥流水---人工智能机器学习算法 Python程序代码学习深度学习
元学习（Meta-learning）如MAML（Model-AgnosticMeta-Learning）1.元学习（Meta-learning）如MAML（Model-AgnosticMeta-Learning）的优点：2.元学习（Meta-learning）如MAML（Model-AgnosticMeta-Learning）的缺点：3.使用元学习如MAML时，需要注意以下问题：元学习（Meta-
Learning to Learn Better Unimodal Representations via Adaptive Multimodal Meta-Learning 鱼儿也有烦恼多模态多模态深度学习
文章目录AMML：通过自适应多模态元学习，学会更好地学习单模态表征文章信息研究目的研究内容研究方法1.总体架构2.网络结构3.UnimodalNetwork4.DistributionTransformationLayer5.MultimodalNetwork6.AdaptiveMultimodalMeta-Learning结果与讨论代码和数据集符号含义AMML算法AMML：通过自适应多模态元学习
Meta Llama大模型：引领人工智能创新的巅峰之作百度_开发者中心 llama 人工智能大模型
近年来，随着人工智能技术的飞速发展，深度学习神经网络在各个领域的应用越来越广泛。其中，MetaLlama大模型的出现引起了广泛关注，被誉为人工智能领域的一次革命。本文将深入探讨MetaLlama大模型的背景、特点以及其在人工智能创新中的潜在影响。MetaLlama大模型是由MetaAI公司（前身为Facebook）研发的一种深度学习神经网络。该模型的设计灵感来自于元学习（meta-learning
《Learning to Reweight Examples for Robust Deep Learning》笔记 HackerTom 数学机器学习 meta-learning 元学习噪声 noisy
[1]用meta-learning学样本权重，可用于classimbalance、noisylabel场景。之前对其(7)式中ϵi,t=0\epsilon_{i,t}=0ϵi,t=0（对应Algorithm1第5句、代码ex_wts_a=tf.zeros([bsize_a],dtype=tf.float32)）不理解：如果ϵ\epsilonϵ已知是0，那(4)式的加权loss不是恒为零吗？(5)式
【论文阅读笔记】Meta Relational Learning for Few-Shot Link Prediction in Knowledge Graphs - EMNLP 2019 卷卷0v0 论文阅读知识图谱论文阅读笔记知识图谱
知识图谱-->知识补全-->长尾问题-->元关系学习基于度量的方法基于优化的方法（本文）文章目录Abstract1Introduction2RelatedWork2.1知识图谱嵌入2.2元学习（Meta-Learning）3TaskFormulation4Method4.1关系元学习器4.2嵌入学习器4.3训练目标5Experiments5.1数据集和评估指标5.2实施5.3结果5.4消融研究5.
随机网络中通过Hebbian可塑性进行元学习(Meta-Learning through Hebbian Plasticity in Random Networks) Man in Himself 深度学习人工智能神经网络强化学习
随机网络中通过Hebbian可塑性进行元学习(Meta-LearningthroughHebbianPlasticityinRandomNetworks)概述Lifelonglearning和适应性是生物行为的两个定义方面。现代强化学习（RL）方法已显示出在解决复杂任务方面的重大进步，但是，一旦训练结束，找到的解决方案通常是静态的，并且无法适应新的信息或应对干扰。尽管仍不能完全理解生物大脑如何从经
机器学习之元学习（Meta-Learning）贾斯汀玛尔斯数据湖 python 机器学习学习人工智能
概念元学习（Meta-Learning）是一种机器学习方法，其目标是使模型能够快速适应新任务。在传统机器学习中，模型通常通过从大量标记数据中进行训练来学习任务特定的知识。然而，在现实世界中，我们经常面临需要从相对较少的样本或者从未见过的任务中学习的情况。元学习的目的就是让模型在面对新任务时能够更快地学到适应性知识。元学习（Meta-Learning）的流程框架通常包括两个主要阶段：元训练（meta
解读Been There, Done That: Meta-Learning with Episodic Recall 特芬奇斯拉星人
最近在研究的线路就是：metallearning+episodicmemory.我觉得agent需要能学习各种任务，也需要有记忆把学到的抽象的东西保存下来，这样可以１．通过搜索，联想，推理，在遇到新任务时，看似不相同也能从经验中快速学到规律，这样可以减少漫无边际的游荡在搜索空间的时间。２．重复出现的任务，就可以直接从记忆调取拿来用了。这篇论文要解决或因面临什么样的现状而产生的？１当面临结构相近可是
【论文笔记】Multimodality in Meta-Learning: A Comprehensive Survey 来自γ星的赛亚人论文笔记人工智能深度学习
论文标题：MultimodalityinMeta-Learning:AComprehensiveSurvey论文地址：https://arxiv.org/abs/2109.13576发表时间：2021年9月Abstract元学习作为一种训练框架而广受欢迎，它比传统的机器学习方法更具有数据效率。然而，它在复杂任务分布（例如多模态任务）中的泛化能力尚未得到深入研究。最近，出现了一些关于基于多模态的元学
【Nature】Human-like systematic generalization through a meta-learning neural network Iron_lyk 论文阅读笔记人工智能
文章目录前置知识动机结果MLC架构MLC实施讨论前置知识\quadmeta-learning中，每个epoch包含了若干eposide，每个eposide包含若干个类别的SupportSet和QuerySet，不同eposide之间的数据是独立的。每个eposide进行一次前向传播和梯度更新。\quadmeta-learning是task-level的，用于学习函数，也就是用于学习规则。Code:
Shape-Aware Meta-Learning 在模型泛化中引入形状约束 JYZhang_sh 机器学习深度学习医学图像处理深度学习图像分割形状约束医学图像
论文来源：Liu,Quande,QiDou,andPheng-AnnHeng.“Shape-awareMeta-learningforGeneralizingProstateMRISegmentationtoUnseenDomains.”InInternationalConferenceonMedicalImageComputingandComputer-AssistedIntervention,
META-LEARNING WITH ATTENTION FOR IMPROVED FEW-SHOT LEARNING论文笔记李耕_嘿嘿嘿黑龙江哈哈哈哈尔滨
好久没看到这么好的论文了,这才是论文嘛~普林斯顿大学的ZejiangHou(没找到中文名可能是侯泽江?)论文主要就是在MAML的基础上添加了三个部分,一个是和L2F类似的用额外网络通过输入中间变量或梯度信息计算一个权重来动态调整模型参数达到task-specific的效果,另一个是一种特殊线性分类器构造方法用于作分类器,最后一个是在inner_loop中按无监督手段把queryset里数据视为无标
Meta-learning algorithms for Few-Shot Computer Vision论文解读（一）海南1506 小样本检测计算机视觉深度学习神经网络
Meta-learningalgorithmsforFew-ShotComputerVision论文解读一小样本分类算法元学习范式元学习算法基于梯度的元学习度量学习的元学习方法小样本分类数据集小样本检测参考文献篇幅所限，本篇只整理了文章的前两部分，最后一部分作者的贡献稍后更新由于是综述性质文章，所以大部分是直接翻译，不通顺内容大多按照我的理解重写过，但是可能仍存在一些小的翻译问题，建议对照原文学习
Incremental Object Detection via Meta-Learning【论文解析】黄阳老师目标检测人工智能计算机视觉
IncrementalObjectDetectionviaMeta-Learning摘要1介绍2相关工作3方法3.1问题描述3.2元学习梯度预处理3.3增量式目标检测器摘要摘要：在真实世界的情境中，目标检测器可能会不断遇到来自新类别的物体实例。当现有的目标检测器应用于这种情景时，它们对旧类别的性能会显著下降。已经有一些努力来解决这个限制，它们都应用了知识蒸馏的变体来避免灾难性遗忘。然而，我们注意到
Decomposed Meta-Learning for Few-Shot Named Entity Recognition pepsi_w 论文人工智能深度学习 NER
原文链接：https://aclanthology.org/2022.findings-acl.124.pdfACL2022介绍问题目前基于span的跨度量学习（metriclearning）的方法存在一些问题：1）由于是通过枚举来生成span，因此在解码的时候需要额外处理重叠的span；2）non-entites类别的原型通常都是噪声；3）跨域时，最有用的信息就是当前领域有限的样本，之前的方法只
Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks lude
MAML的核心思想是利用元学习来找到一个好的模型初始化，从而能够在新任务上进行快速适应。这种方法旨在处理“少样本学习”的挑战，即当新任务的数据量非常有限时如何有效地学习。传统学习的数据点是一个样本，而元学习的数据点是一个小数据集（任务），任务包含了很多样本。元学习对每个任务中的每个样本进行训练得到每个任务的loss，并得到任务的损失和losses。对losses进行优化来更新元学习模型的参数。MA
Meta-Learning Based Knowledge Extrapolation for Knowledge Graphs in theFederated Setting 小蜗子知识图谱的结构动态补全知识图谱人工智能深度学习
摘要我们研究了知识外推问题，以在联邦设置中嵌入新兴知识图(KGs)带来的新组件(即实体和关系)。在这个问题中，在现有的KG上训练的模型需要嵌入一个新的KG，其中包含不可见的实体和关系。为了解决这个问题，我们引入了元学习设置，在现有的KG上采样一组任务来模拟新KG上的链接预测任务。基于采样任务，我们元训练了一个图神经网络框架，该框架可以基于结构信息为未见组件构建特征并为其输出嵌入。实验结果表明，我们
chatGPT笔记 hit56实验室机器学习人工智能深度学习
文章目录一、GPT之技术演进时间线二、chatGPT中的语言模型instructGPT跟传统语言LM模型最大不同点是什么？三、instructGPT跟GPT-3的网络结构是否一样四、GPT和BERT有啥区别五、chatGPT的训练过程是怎样的？六、GPT3在算数方面的能力七、GPT相比于bert的优点是什么八、元学习(meta-learning)是什么九、chatGPT的优缺点十一、chatGPT
论文阅读：Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks BlueagleAI 论文阅读
前言要弄清MAML怎么做，为什么这么做，就要看懂这两张图。先说MAML**在做什么？**它是打着Mate-Learing的旗号干的是few-shotmulti-taskLearning的事情。具体而言就是想训练一个模型能够使用很少的新样本，快速适应新的任务。定义问题我们定义一个模型fff,输入xxx输出aaa。-定义每一个Task-TTT包含一个损失函数LLL,一个原始观察q(x1)q(x_1)q
论文阅读 - Few-shot Network Anomaly Detection via Cross-network Meta-learning 无脑敲代码，bug漫天飞图异常节点检测论文阅读
论文链接：https://arxiv.org/pdf/2102.11165.pdf目录摘要：引言问题定义方法GraphDeviationNetworksCross-networkMeta-learning摘要：网络异常检测旨在找到与绝大多数行为显着不同的网络元素（例如节点、边、子图）。它对从金融、医疗保健到社交网络分析等各种应用产生了深远的影响。由于难以承受的标签成本，现有方法主要是以无监督的方式
深度学习应用篇-元学习[13]：元学习概念、学习期、工作原理、模型分类等
深度学习应用篇-元学习[13]：元学习概念、学习期、工作原理、模型分类等1.元学习概述1.1元学习概念元学习(Meta-Learning)通常被理解为“学会学习(Learning-to-Learn)”，指的是在多个学习阶段改进学习算法的过程。在基础学习过程中，内部（或下层/基础）学习算法解决由数据集和目标定义的任务。在元学习过程中，外部（或上层/元）算法更新内部学习算法，使其学习的模型改进外部目标
深度学习应用篇-元学习[13]：元学习概念、学习期、工作原理、模型分类等
深度学习应用篇-元学习[13]：元学习概念、学习期、工作原理、模型分类等1.元学习概述1.1元学习概念元学习(Meta-Learning)通常被理解为“学会学习(Learning-to-Learn)”，指的是在多个学习阶段改进学习算法的过程。在基础学习过程中，内部（或下层/基础）学习算法解决由数据集和目标定义的任务。在元学习过程中，外部（或上层/元）算法更新内部学习算法，使其学习的模型改进外部目标
论文笔记：Prompt-Based Meta-Learning For Few-shot Text Classification Daisymanman 提示学习自然语言处理论文阅读深度学习人工智能
论文来源：EMNLP2022论文地址：2022.emnlp-main.87.pdf(aclanthology.org)代码地址：GitHub-MGHZHANG/PBMLGB/T7714ZhangH,ZhangX,HuangH,etal.Prompt-BasedMeta-LearningForFew-shotTextClassification[C]//Proceedingsofthe2022Con
Meta-Learning and in-context Learning hithithithithit nlp knowledge inductive transductive meta-learning ini-context
目录前导：InductiveLearningtransductivelearningMeta-LearningDefinition:Howtotrainin-contextLearning前导：InductiveLearning译为“归纳式学习”，即根据对以往数据的观察，来预测新数据的属性；在机器学习中，就是根据已有数据，学习出一个分类器，然后应用到新的数据或任务，对应meta-learning。
论文阅读（62）Meta-learning for semi-supervised few-shot classification 续袁
1.论文相关ICLR2018image.png2.摘要2.1摘要在小样本分类中，我们感兴趣的是学习算法，它只从少数标记的例子中训练分类器。近年来，基于元学习的小样本分类研究取得了一些进展，在元学习中，定义了一个学习算法的参数化模型，并对代表不同分类问题的片段(episodes)进行训练，每个片段(episodes)都有一个小的标记训练集和相应的测试集。在这项工作中，我们将这几个小样本分类范例推进到
[行人重识别论文阅读]Meta Batch-Instance Normalization for Generalizable Person Re-Identification zlsd21 行人重识别论文阅读深度学习神经网络机器学习计算机视觉
论文地址：https://arxiv.org/abs/2011.14670论文代码：https://github.com/bismex/MetaBIN.预备知识：meta-learning[李宏毅老师的讲解笔记]1文章思想BN（batchnormalization）：图像增强方法，相对于IN来说是增强了不同域间的差异IN（instancenormalization）：DG(Domaingenera
【论文阅读】Frustratingly Simple Few-Shot Object Detection c1assy Few-shot object detection 论文阅读目标检测机器学习
从几个例子中检测稀有物体是一个新出现的问题。先前的工作表明Meta-Learning是一种有希望的方法。但是，微调技术很少引起注意。我们发现，在稀有类上只对现有探测器的最后一层进行微调对于Few-ShotObjectDetection至关重要。这样一种简单的方法在当前基准上比元学习方法高出大约2~20个百分点，有时甚至比以前的方法提高了一倍的准确率。然而，少数样本中的高方差(highvarianc
元学习（Meta-learning）——让机器学习如何学习偶尔写一写
1元学习概述元学习的意思即“学会如何学习”。在机器学习中，工作量最大也是最无聊的事情就是调参。我们针对每一个任务从头开始进行这种无聊的调参，然后耗费大量的时间去训练并测试效果。因此，一个直观的想法是：我们是否能让机器自己学会调参，在遇到相似任务时能够触类旁通、举一反三，用不着我们从头开始调参，也用不着大量标签数据重新进行训练。通常的机器学习是针对一个特定的任务找到一个能够实现这个任务的functi
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt