柯西一施瓦兹不等式

Generalizing from a Few Examples: A Survey on Few-Shot Learning

本文知乎链接（排版可能好看丢丢）：https://zhuanlan.zhihu.com/p/340618818
论文地址：paper
这篇概述很简洁：简介的论文解读

一、摘要

机器学习在有大量数据支撑的时候的效果很好，但是数据量很少的时候效果很差了。Few shot learning 是针对于这个问题场景下提出的解决办法，他可以迅速自适应到一个新的任务中去。FSL的核心问题是unreliable empirical risk minimizer，基于如何利用先验知识来解决问题，我们可以把FSL领域的现有研究划分到三个方向:

数据，利用先验知识来增加监督学习的经验；
模型，利用先验知识减小假设空间的大小；
算法，利用先验知识改变如何在假设空间中搜索最佳假设的算法。

本文对FSL算法进行了归类并讨论了每个类别的优缺点。

二、 Introduction

计算机器和智能的最终目标是实现并超越人类的智能。近年来在大量监督信息和计算能力的帮助下，AI发展迅速。但是目前的AI技术不能从少量样本中快速学习任务。利用FSL来解决这个问题。最典型的例子是手写字符识别。当计算机获得一小部分例子的时候它需要分析并产生新的字符。为了解决这个问题，可以将字符分成易于转移的更小的part，然后利用这些小部分产生新的字符。这和人类的学习思想很相似。
另一种FSL的应用场景是当监督信息因为安全、隐私或者道德的限制不可获得的时候，例如在发现一种新药的时候，并没有很多的生物学记录。FSL可以减轻收集大量监督信息的负担。
FSL算法示例：元学习（meta-learning）、表示学习（embedding learning）、生成模型的学习（generative modeling）
本文贡献：

给出FSL的正式定义
列出了与FSL相关的研究问题和方向，并指出不同
指出了FSL监督学习的核心问题是unreliable empirical risk minimizer
建立了对FSL学习更好的理解
提出了未来的研究方向

三、本文的组织结构

第二节是对FSL的概述，包括正式定义、相关问题、核心问题、对现有工作在data、model、algorithms方向的分类；第三节是以数据扩充的方式来解决FSL的问题；第四节是利用模型减小假设空间；第五节是利用先验知识改变如何在假设空间中搜索最佳假设的算法。第6节中，从问题设置、技术、应用和理论方面为FSL提出了未来的方向。

四、符号和术语

五、 OVERVIEW

(一) 问题定义

1. 机器学习任务的定义

针对于一个图像分类任务（T），机器学习模型在大量的数据集上训练获得监督经验E，通过E，可以提高分类的准确率（P）

2. Few-shot learning的定义

对于任务T, 只有少量的监督信息E，但是期望获得不错的分类准确率P
参考：https://zhuanlan.zhihu.com/p/61215293

问题定义

人类非常擅长通过极少量的样本识别一个新物体，比如小孩子只需要书中的一些图片就可以认识什么是“斑马”，什么是“犀牛”。在人类的快速学习能力的启发下，研究人员希望机器学习模型在学习了一定类别的大量数据后，对于新的类别，只需要少量的样本就能快速学习，这就是 Few-shot Learning 要解决的问题。 Few-shot Learning 是 Meta Learning在监督学习领域的应用。
Meta Learning，又称为 learning to learn，在 meta training 阶段将数据集分解为不同的 meta task，去学习类别变化的情况下模型的泛化能力，在 meta testing 阶段，面对全新的类别，不需要变动已有的模型，就可以完成分类。
形式化来说，few-shot的训练集中包含了很多的类别，每个类别中有多个样本。在训练阶段，会在训练集中随机抽取 C 个类别，每个类别 K 个样本（总共 CK 个数据），构建一个 meta-task，作为模型的支撑集（support set）输入；再从这 C个类中剩余的数据中抽取一批（batch）样本作为模型的预测对象（batch set）。即要求模型从 C*K 个数据中学会如何区分这 C个类别，这样的任务被称为 C-way K-shot 问题。训练过程中，每次训练（episode）都会采样得到不同meta-task，所以总体来看，训练包含了不同的类别组合，这种机制使得模型学会不同 meta-task 中的共性部分，比如如何提取重要特征及比较样本相似等，忘掉 meta-task 中 task 相关部分。通过这种学习机制学到的模型，在面对新的未见过的 meta-task 时，也能较好地进行分类。

FSL的三个常见的应用场景：

(二) 相关的研究（为了区分他们之间的不同）

相关模型有弱监督学习、不平衡学习、迁移学习和元学习。

1. 弱监督学习

就是从不完整或者不准确的监督信息中学习任务，和少样本学习一样都含有少量的样本具有监督信息。可以分为半监督学习和主动学习。
1) 半监督学习：从少量的标记样本和大量的未标记样本里面进行学习，其中 positive-unlabelled learning 是半监督学习的特例，数据样本中只有正的样本和无标记的样本。
2) 主动学习Active learning：（https://zhuanlan.zhihu.com/p/79764678）

3) 两者的区别：根据定义，弱监督学习只包括分类和回归问题，而FSL还包括强化学习问题。此外，弱监督学习主要使用未标记数据作为附加信息，而FSL利用各种先验知识，如预训练模型、来自其他领域或模态的监督数据，并且不限于使用未标记数据。因此，只有当先验知识是未标记数据并且任务是分类或回归时，FSL问题才成为弱监督学习问题。

2. 不平衡学习

指的是正负样本分布不平衡的数据。

3. 迁移学习

先在有大量数据的领域训练，然后迁移到数据比较少的领域。（fine-tune）

4. 元学习

元学习是处理FSL 的一种方式

(三) 核心问题

1. Empirical Risk Minimization（经验风险最小化）

在遇到一个机器学习的问题的时候，我们通常是通过最小化损失函数来找到从x 到 y 的最有假设h(x)。但实际上我们期望的是我们获得的假设函数h(x)能够预测所有的样本的损失函数最小，这个针对于所有样本的风险称expected risk, 期望风险如下式：

理论上说，让期望风险最小化才能逼近真实分布，但因为你并不知道真实分布（就是不管怎么样，你都拿不到这个问题的所有预测样本呀），所有最小化期望风险是无法实现的，而在机器学习中通常用经验风险来替换期望风险，经验风险就是在训练集上预测的结果和真实结果的差异(就是说我拿到所有的样本分布确实不可能了，所以我退而求其次，我就只拿训练集的数据来模拟数据的真实分布好了)，也是我们常说的损失函数，表达式如下：

简单来说下的话，h^ 是真实分布的假设，h∗是假设空间H中最接近h^的假设（通过最小化期望风险得到的假设），而hI是你通过最小化经验损失得到的假设

等式右边第一项表示的是假设空间H中最优的假设和真实假设的误差，这一项其实由你所选择的模型和参数的初始化分布决定的，这也就是为什么有的时候，模型选择的简单了，你给再多的数据也训练不好，欠拟合。第二项就是我们训练得到的假设和H中最优假设的误差，我们训练得到的假设也是从假设空间H中选择的，但有时候会陷入局部最优，或者提供的训练数据分布有偏差，导致无法到全局最优。
因此我们可以看到最后的误差是受假设空间H和在训练集中样本的数量影响的，因此可以通过data(提供训练集)、模型（决定假设空间）和算法（如何在假设空间里面找到适合训练集的最优假设）
**

2. Unreliable Empirical Risk Minimizer

**

当含有足量的训练集和少量训练集时的对比，可以看一下经验误差和期望误差之间的差距。

(四) 分类

为了解决这个问题，可以通过DATA、model、algorithms 三种方式。

1. DATA角度

利用先验知识来做数据增强，数据变多之后hi 和 h* 之间的差距减小。

2. Model 角度

通过先验知识来约束假设空间，使得假设空间变小。如（b）图所示，通过先验知识排除了那些假设空间里面不可靠的部分，然后搜索范围就变小了。

3. Algorithms角度

通过先验知识来确定一个良好的起点（初始化）或者好的搜索策略，从而简化估计的过程。

六、数据角度

期望通过先验知识扩充训练集，从而使得E中的监督信息足够用来获得一个可以信赖的hi。
可以通过hand-crafted 的方式进行数据的预处理，例如图片，可以通过旋转、翻折、平移、缩放、映射、裁剪等方式来变换。但是这些方法的知识成本和人工成本比较高，而且扩展性也很差。因此手动扩充数据不能完全解决FSL的问题。
除此之外也有一些其他的方式来数据扩充，可以根据是从哪里转换到训练集中的来进行分类。

(一) 从D-train中转化数据

总而言之也是扩充训练集，不过方式比第一种hand-crafted的要优雅很多，包括提取了数据分布之类的，具体方式可以看列出来的论文。
将训练集中的（x, y）转换成几个有变化的样本。这个转换的过程作为先验知识添加到E中。(1) 早期的FSL 论文通过迭代地将每个样本与其他样本对齐，从相似的类中学习一组几何变换。从而使得数据量足够大支撑起机器学习的训练。 (2) 类似的，有作者提出建立一组自编码器然后从相似的类中提取类间的变化性，然后把学习到的variation 叠加到 x中去来增加样本数量。(3) 另外有作者假设，所有类别的样本之间共享一些可转化的可变性，因此作者提出算法学习单个转换函数，将从其他类中学习到的样本对之间的差异转移到当前类中。(4) 另外，也有作者不会枚举成对的变量，而是用从大量的数据集中学习到的独立属性强度回归器将现在数据集中的一个样本转换成几个样本，然后把原始标签的样本也分配给这几个样本。(5) 在此基础之上，有论文使用连续的属性子空间来给x增加属性变量。

(1) E. G. Miller, N. E. Matsakis, and P. A. Viola. 2000. Learning from one example through shared densities on transforms. In Conference on Computer Vision and Pattern Recognition, Vol. 1. 464–471.
(2) E. Schwartz, L. Karlinsky, J. Shtok, S. Harary, M. Marder, A. Kumar, R. Feris, R. Giryes, and A. Bronstein. 2018. Delta-encoder: An effective sample synthesis method for few-shot object recognition. In Advances in Neural Information Processing Systems. 2850–2860.
(3) B. Hariharan and R. Girshick. 2017. Low-shot visual recognition by shrinking and hallucinating features. In International Conference on Computer Vision.
(4) R. Kwitt, S. Hegenbart, and M. Niethammer. 2016. One-shot learning of scene locations via feature trajectory transfer. In Conference on Computer Vision and Pattern Recognition. 78–86.
(5) B. Liu, X. Wang, M. Dixit, R. Kwitt, and N. Vasconcelos. 2018. Feature space transfer for data augmentation. In Conference on Computer Vision and Pattern Recognition. 9090–9098.

(二) 从弱标记或者没有标记的数据集中转换样本

通过训练单独的分类器或者为无标签数据标注伪标签等方式，把没有标注的图片加入到训练样本中。
例如，在监控摄像头拍摄的照片里面，有人、车和路，但是没有标记的样本或者在演讲的长视频中，包含了演讲者一系列的手势图片，但是都没有明确标注出来。因为这些数据中包含大量不同的样本，加到数据集中有利于组成更加清晰的数据分布。收集这样的数据不需要用人工来标注。虽然数据收集不麻烦，但是怎么选择出来带有目标标签的样本是一个重要问题。（1）训练SVM分类器，挑选出带有目标标签的样本。（2）学习label propagation 直接为新来的数据打标签。（3）还有一种被称为渐进策略，选出其中信息丰富的未标记样本，然后给选出的样本分配伪标签，然后用他们来更新CNN。

（1）T. Pfister, J. Charles, and A. Zisserman. 2014. Domain-adaptive discriminative one-shot learning of gestures. In European Conference on Computer Vision. 814–829.
（2）M. Douze, A. Szlam, B. Hariharan, and H. Jégou. 2018. Low-shot learning with large-scale diffusion. In Conference on Computer Vision and Pattern Recognition. 3349–3358.
（3）Y. Wu, Y. Lin, X. Dong, Y. Yan, W. Ouyang, and Y. Yang. 2018. Exploit the unknown gradually: One-shot video-based person re-identification by stepwise learning. In Conference on Computer Vision and Pattern Recognition. 5177–5186.

(三) 从相似数据集转换样本

从相似但是更大的数据集中转化数据（input-output pair）。聚合权重是由样本之间的相似度量来决定的。
（1）从辅助的文本语料库中提取聚合权重。（2）由于这些样本可能不是来自目标FSL类，直接将汇总样本添加到数据中可能会产生误导，因此，GAN用来从多个样本的数据集中合成不可区分的合成样本。包含两个生成器，一个从few-shot class 向大规模数据集映射样本；另一个将大规模的类样本向few-shot转换。

（1）Y. H. Tsai and R. Salakhutdinov. 2017. Improving one-shot learning through fusing side information. arXiv preprint arXiv:1710.08347 (2017).
（2）H. Gao, Z. Shou, A. Zareian, H. Zhang, and S. Chang. 2018. Low-shot learning via covariance-preserving adversarial augmentation networks. In Advances in Neural Information Processing Systems. 983–993.

(四) 总结

根据具体情况来选择用哪种方式来解决FSL的数据扩充问题。但是这种方法的扩展性不好，也有人提出一种自动增强数据的方式。并且数据增强大多数是针对于图像数据的，因为图像可以很容易被人类视觉评估，相比之下，文本和音频数据更难生成。

七、模型角度

因此需要一个足够大的假设空间来找到最好的假设h*，但是可以用来训练的样本又很少所以传统的机器学习方法不好使了。本小节的FSL方法通过先验知识将H约束的更小，经验风险越可靠，模型过拟合的可能性越低。
根据利用的先验知识的类别，可以把这一类方法进一步分成以下四类。

(一) 多任务学习

参考：https://www.cnblogs.com/lau1997/p/12361380.html
当存在多个相关任务时，多任务同步学习task-generic 和 task-specific 信息，因此他们可以被自然的应用到FSL中来（因为学习的内容是相同的）。简单概括多任务学习，就是通过共享相关任务之间的特征表示或者分布，可以使我们的模型更好地概括原始任务。在迁移学习中，学习步骤是串行的，你从任务A里学习只是然后迁移到任务B。但是在多任务学习中，你是同时开始学习的，试图让单个神经网络同时做几件事情，然后希望这里每个任务都能帮到其他所有任务。
多任务学习的话主要可以分为两种，第一种是参数共享，第二种是参数绑定，拿第一种来举一个例子，假设我们在研发无人驾驶，我们需要检测不同的物体，包括行人、车辆、停车标志以及交通灯等等。
当存在多个相关任务时，多任务同步学习task-generic 和 task-specific 信息，因此他们可以被自然的应用到FSL中来（因为学习的内容是相同的）。简单概括多任务学习，就是通过共享相关任务之间的特征表示或者分布，可以使我们的模型更好地概括原始任务。在迁移学习中，学习步骤是串行的，你从任务A里学习只是然后迁移到任务B。但是在多任务学习中，你是同时开始学习的，试图让单个神经网络同时做几件事情，然后希望这里每个任务都能帮到其他所有任务。
多任务学习的话主要可以分为两种，第一种是参数共享，第二种是参数绑定，拿第一种来举一个例子，假设我们在研发无人驾驶，我们需要检测不同的物体，包括行人、车辆、停车标志以及交通灯等等。

我们得到一个多任务的标签分布Y，Y的每一个分量都是四个维度的。

然后再设计一个网络，第一行是预测有没有行人，第二个预测有没有车，第三个有没有停车标记，第四个是有没有交通灯

然后最后的损失函数的时候是四个任务的平均损失

上面讲的这种方式是共享参数的多任务训练方式，还有一种是互相影响的参数。因此下面这两组方法分别是借鉴了这两种思想。

1. 参数共享

第一种会共享不同任务之间的参数。
（1）中两个网络共享前几层来学习通用的信息（generic information），并且在不同的任务上来学习不同的最后一层。（2）一起解决了两个关于法律文本的自然语言处理任务：费用预测和法律属性预测。首先用一个embedding function来对法律文本描述进行编码，然后把她送到特定任务的embedding function 和分类器中。（3）中首先根据源任务对可变自编码器进行预训练，然后把他合并到目标任务中。两个自编码器（源任务和目标任务）的一些层是可以共享的，从而获取generic information，但与此同时两个任务都有一些特定于任务的层。目标任务只能更新其特定于任务的层，而源任务可以更新共享层和特定于任务的层。（4）中原始样本和生成样本首先都会通过学习源任务和目标任务的独立嵌入函数被映射到一个指定任务的空间中，然后由共享的可变自动编码器embeded.

(1) Fine-grained visual categorization using meta-learning optimization with sample selection of auxiliary data.
(2) Few-shot charge prediction with discriminative legal attributes.
(3) Few-shot adversarial domain adaptation
(4) One-shot unsupervised cross domain translation

2. 参数绑定

（1） Multi-task transfer methods to improve one-shot learning for multimedia event detection
（2） Label efficient learning of transferable representations acrosss domains and tasks

(二) Embedding learning

Embedding的算法会把样本embed到一个低纬度的空间中，这样可以使得相似的样本靠在一起，不同的样本之间更容易区分。在这个低纬度的空间Z中，可以构建一个更小的假设空间，这样需要的训练样本就少了。这个embedding function 主要是从先验知识中学习，然后可以利用D train 中针对于特定任务的信息。
Embedding learning 有以下几个重要组件:
① 一个把test 样本映射到低维样本空间的映射函数f
② 一个把训练样本映射到低纬空间的映射函数g
③ 一个计算相似度的函数s, 来度量f(test) 和g(xi)之间的距离，测试样本会被分类到和他距离最相近的g(xi)所属的类中
f 和 g 可以是同一个映射函数，但是有些算法用了不同的映射函数取得了更高的acc。常见的embedding算法汇总在这个表格里了。

1. 针对于特定任务的embedding model

针对于特定任务的embedding method会针对于每一个任务学习的特定信息一个embedding function。
例如，用任务Tc的few-shot 训练集，然后计算所有样本对的相似度排序。（1）中将batch内的每个样本都看作一个查询样本，并且从其他所有样本中检索出与当前查询样本同一类别的样本。网络输出的是其他样本与当前查询样本相似度的排序结果。（就是本来few-shot learning的方式是通过support set 和query set的方式，然后对于query set里面的样本去寻找support set里面和他最相近的样本。但是这个算法是没有support set和query 的定义的，对于batch里的样本，寻找剩余其他样本和他最相近的那些（相当于扩大了support。））

（1）Few-shot learning through an information retrieval lens

2. Task-Invariant Embedding Model

这类embedding的方式通常会从具有足够样本的大规模数据集中学习一般嵌入函数，然后在新的few-shot 的任务上直接用这个embedding function，不再进行训练。（是用先验知识训练的embedding function）

尽管task-invariant embedding 不用会新的few-shot train的数据来更新embedding function 的参数，但是很多这个方向的算法都是用few-shot的方式来训练embedding模型的。近来一些方法通过meta-learning的方式学习了更加复杂的task-invariant embedding models

1) Matching net 以及他的变体

（1）中提出的matching net算法利用meta-learns的方式为训练集的样本和测试集的样本训练embedding function。（2）中The residual LSTM (resLSTM)算法提出了对f和g更好的设计。（3）中一个matching net 主动学习的变体在后面加了一个sample selection 步骤，他会标记最有利的未标记数据并且用它来扩充训练集。（4）中把matching net扩充到set-to-set 的匹配，这对于标记样品的多个部分是有用的。

（1）O. Vinyals, C. Blundell, T. Lillicrap, D. Wierstra, et al. 2016. Matching networks for one shot learning. In Advances in Neural Information Processing Systems. 3630–3638.
（2）H. Altae-Tran, B. Ramsundar, A. S. Pappu, and V. Pande. 2017. Low data drug discovery with one-shot learning. ACS Central Science 3, 4 (2017), 283–293.
（3）P. Bachman, A. Sordoni, and A. Trischler. 2017. Learning algorithms for active learning. In International Conference on Machine Learning. 301–310.
（4）J. Choi, J. Krishnamurthy, A. Kembhavi, and A. Farhadi. 2018. Structured set matching networks for one-shot part labeling. In Conference on Computer Vision and Pattern Recognition. 3627–3636.

2) Prototypical network和他的变体

（1）中提出的Prototypical 模型不是把test 的embedding和所有的train比较，protonet只和训练集里面的类别模型进行比较。对于class n, 他的prototype模型是该类中样本的embedding的均值，这种算法是的结果更加稳定而且也减小了计算压力。这种思想在（2）里面被应用到了matching net上。（3）中一个半监督变量利用软分配的方式将没有标记的数据加入到训练集中从而做到数据扩充。

（1）J. Snell, K. Swersky, and R. S. Zemel. 2017. Prototypical networks for few-shot learning. In Advances in Neural Information Processing Systems. 4077–4087.
（2）Y.-X. Wang, R. Girshick, M. Hebert, and B. Hariharan. 2018. Low-shot learning from imaginary data. In Conference on Computer Vision and Pattern Recognition. 7278–7286.
（3）M. Ren, S. Ravi, E. Triantafillou, J. Snell, K. Swersky, J. B. Tenenbaum, H. Larochelle, and R. S. Zemel. 2018. Meta-learning for semi-supervised few-shot classification. In International Conference on Learning Representations.

3) 其他方法

（1）中提出了基于注意力机制的循环比较器，利用一个基于注意力机制的LSTM网络来比较x-test的不同区域和原型，然后将比较的结果做成中间embedding。除此之外，这个算法还利用双向的LSTM网络把所有的比较结果制作成final embedding。（2）中提出的relation net利用一个CNN 来把测试和训练数据embed 到一个低维空间，然后把他们拼接起来作为embedding，之后在送入到另一个CNN网络中来输出相似度。（3-4）中用到了图卷积神经网络来获取临近的信息。在few-shot reinforcement 学习应用中（例如连续控制和视觉导航），时间信息很重要。（5）中提出了SNIL网络（一个embedding网络）具有交错的时间卷积层和attention layer。时序卷积会注意到时序信息并且attention 层会关注与当前输入相关的step。

（1）P. Shyam, S. Gupta, and A. Dukkipati. 2017. Attentive recurrent comparators. In International Conference on Machine Learning. 3173–3181
（2）F. Sung, Y. Yang, L. Zhang, T. Xiang, P. H. Torr, and T. M. Hospedales. 2018. Learning to compare: Relation networkfor few-shot learning. In Conference on Computer Vision and Pattern Recognition. 1199–1208.
（3）Y. Liu, J. Lee, M. Park, S. Kim, E. Yang, S. Hwang, and Y Yang. 2019. Learning to propopagate labels: Transductive propagation network for few-shot learning. In International Conference on Learning Representations.
（4）V. G. Satorras and J. B. Estrach. 2018. Few-shot learning with graph neural networks. In International Conference on Learning Representations.
（5）N. Mishra, M. Rohaninejad, X. Chen, and P. Abbeel. 2018. A simple neural attentive meta-learner. In International Conference on Learning Representations.

3. Hybrid Embedding Model

尽管task-invariant embedding methods可以在很小的计算成本就应用到新的task上去，但是他们并不会利用当前任务的特定知识，当任务很特殊只有极少的例子的时候，只是简单的把模型拿过来可能是不行的，为了解决这个问题，混合embedding模型在适应了generic task-invariant embedding model并且把学习到的embedding g 作为 embedding f 的参数。

Learnet(1)通过合并Dtrain的特定信息改进了task-invariant convolutional siamese net，保证f(.)的参数会随着给定的xi变化，从而构造了混合embedding网络。（2）中基于上个算法的基础之上把分类层改成了ridge regression。（3-4）把Dtrain看成是一个整体来输出对于指定任务的f参数。（3）中提出的TADAM算法把类别平均的原型自适应到任务的embedding中，然后用一个meta-learning的函数把他映射到protonet 参数中去。（4）DCCN网络使用一组固定的滤波器，用Dtrain学习组合系数

(1) L. Bertinetto, J. F. Henriques, J. Valmadre, P. Torr, and A. Vedaldi. 2016. Learning feed-forward one-shot learners. In Advances in Neural Information Processing Systems. 523–531.
(2) L. Bertinetto, J. F. Henriques, P. Torr, and A. Vedaldi. 2019. Meta-learning with differentiable closed-form solvers. In International Conference on Learning Representations.
(3) B. Oreshkin, P. R. López, and A. Lacoste. 2018. TADAM: Task dependent adaptive metric for improved few-shot learning. In Advances in Neural Information Processing Systems. 719–729.
(4) F. Zhao, J. Zhao, S. Yan, and J. Feng. 2018. Dynamic conditional networks for few-shot learning. In European Conference on Computer Vision.

(三) 用外部记忆学习

【没看过这类的文章，理解可能不准确】
从训练集中提出额外的信息并且存储在external memory中，然后每一个test中新的样本都用这些memory的加权平均表示，这样就把test用memory中的信息限制住了，从而缩小了假设空间的大小。
[具有外部存储机制的网络都可以用来处理这一类问题，其实本质上和迁移学习一样，只不过这里不更新模型的参数，只更新外部记忆库，外部记忆库一般都是一个矩阵，如神经图灵机，其外部记忆库具有读些操作，在这里就是在一个用大量类似的数据训练的具有外部存储机制的网络上，用具体task的样本来更新外部记忆库。]

由于每个X-test都表示为从内存中提取的值的加权平均值，因此内存中键值对的质量很重要。根据memory的功能，FSL方法在这一类别中可以细分为两种类型。

1. Refining Representations

以下方法将数据小心地放入memory中，这样存储的键值对可以更准确地表示X-test. （1）中提出的Memory-Augmented Neural Networks(MANN)利用meta-learns的方式学习embedding函数f, 然后把同一类的sample映射到相同的数值中。这样同一个类的样本可以在内存中一起优化他们的类表示。（2）中的类表示和Proto-Net 相似；（3）中提出的方法只在xi不能很好的表示新图片的时候才会更新M，因为更新M是一个耗费计算资源的事情。
跳过了，以后补充（也可能没有补充了，笑哭）

2. Refining Parameters

跳过

(四) 生成模型

感觉这部分在few-shot 分类问题中的应用不多的
生成模型在先验知识的帮助下从观测到的xi估计p(x)的概率分布。根据条件概率公式，p(x)的估计通常涉及p(x | y)和p(y)的估计。这个类中的方法可以处理很多任务，比如生成，识别，重建，图像翻转。

在生成模型中，观测到的x被假设是从p（x;θ）中提取的

其中p(z; y)被我们称为是先验分布，从其他数据集中训练得到，是对FSL很重要的先验知识。通过把提供的D-train 和p(z; y)相结合，得到的后验概率分布受到约束，换句话说，H会被限制到更小的H中。
根据隐向量Z代表的内容，我们可以把FSL建模方法分成三类。
1. Decomposable Components（可分解组件）
尽管在FSL问题中具有监督信息的样本很少，但是它们可能与来自其他任务的样本共享一些较小的可分解成分。例如，若仅使用提供的几张面部照片来识别一个人。虽然相似的脸可能很难找到，但人们可以很容易地找到眼睛、鼻子或嘴巴相似的照片。有了大量的样本，针对于这些可分解成分的模型就很容易学习。然后只需要找到这些可分解组件的正确组合，并决定这个组合属于哪个目标类。由于可分解的组件是由人选择的，所以这种策略更容易判断。贝叶斯one-shot(1)使用生成模型来捕捉可分解组件(例如对象的形状和外观)和目标类别(即要识别的对象)之间的交互；贝叶斯 program learning(BPL)（2）通过将字符分为类型、标记和进一步的模板、部分和原语来建模。要生成一个新的字符，需要搜索包含这些组件的大组合空间。通过仅考虑top possible的组合来降低这种推理成本。在自然语言处理中，(3) 对spans而不是完整的解析树进行建模，and adapts parsers between syntactically distant domains by training individual classifiers for spans[没看懂]。

（1）L. Fei-Fei, R. Fergus, and P. Perona. 2006. One-shot learning of object categories. IEEE Transactions on Pattern Analysis and Machine Intelligence 28, 4 (2006), 594–611.
（2）B. M. Lake, R. Salakhutdinov, and J. B. Tenenbaum. 2015. Human-level concept learning through probabilistic program induction. Science 350, 6266 (2015), 1332–1338.
（3）V. Joshi, M. Peters, and M. Hopkins. 2018. Extending a parser to distant domains using a few dozen partially annotated examples. In Annual Meeting of the Association for Computational Linguistics. 1190–1199.

2. Groupwise Shared Prior（分组共享prior）

通常，相似的任务有相似的先验概率，这可以在FSL使用。比如考虑“橘猫”、“豹子”、“孟加拉虎”三类分类。这三个物种相似，但孟加拉虎濒临灭绝，而橘猫和豹子数量丰富。因此，人们可以从“橘猫”和“豹子”中学习一个先验概率，并以此作为“孟加拉虎”这一few shot 类的先验概率。
在(1)中，首先通过无监督学习将一组数据集{Dc}分组为一个hierarchy。每组中的数据集一起学习类先验概率。对于一个新的few-shot类，首先找到这个新类所属的组，然后根据从组共享先验概率中提取的类先验对其建模。在(2)中，(1)算法中的特征学习步骤通过使用深度玻尔兹曼机器而进一步改进。

（1）R. Salakhutdinov, J. Tenenbaum, and A. Torralba. 2012. One-shot learning with a hierarchical nonparametric Bayesian model. In ICML Workshop on Unsupervised and Transfer Learning. 195–206.
（2）A. Torralba, J. B. Tenenbaum, and R. R. Salakhutdinov. 2011. Learning to learn with compound HD models. In Advances in Neural Information Processing Systems. 2061–2069.

3. Parameters of Inference Networks（推理net的参数）

为了找到最好的参数θ，我们需要最大化posterior；由于分母中有积分，所以很难求解上式的值。一个variational distribution q(z；δ)，从数据中学习而来，常用于逼近(z | x；θ, γ)。最近这个q(z；δ)通过用amortized variational inference with the inference network来近似。虽然z不再具有语义意义，但是这些深度模型所学习到的强大表示可以带来更好的性能。一旦学习到q，推理网络就可以直接应用于新的任务，效率更高，对人类知识的要求更低。由于推理网络具有大量的参数，通常使用一些辅助的大规模数据集进行训练。许多经典的推理网络都适用于FSL问题。
例如：VAE, autoregressive model，generative adversarial networks (GAN)，combination of V AE and GAN【参考文献看原文第20页】

(五) 总结

当存在相似任务或辅助任务时，多任务学习可以用来约束few-shot的H。但是，请注意，需要对所有任务进行联合训练。因此，当一个新的few-shot learning任务到来时，整个多任务模型必须再次训练，这可能是costly和slow的。而且D和Dct的大小不应该是comparable的，否则few-shot learning任务可能会被样本多的任务淹没。
当存在包含各种类的足够样本的大规模数据集时，可以使用嵌入学习方法。这些方法将样本映射到一个良好的嵌入空间，在这个空间中，不同类别的样本可以很好地分离，因此需要一个较小的H。然而，当few-shot任务与其他任务关联不密切时，它们可能不会很好地工作。此外，更多关于如何混合任务的不变信息和任务特定信息的探索是有帮助的。
当内存网络可用时，通过在内存上训练一个简单的模型(如分类器)，它可以很容易地用于FSL。通过使用精心设计的更新规则，可以有选择地保护内存插槽。这种策略的缺点是它会带来额外的空间和计算成本，而这些成本会随着内存大小的增加而增加。因此，当前的外部存储器具有有限的大小。
最后，当除了执行FSL之外还想执行诸如生成和重建之类的任务时，可以使用生成模型。他们学习先验概率p(z；γ)，这将H减少到更小的H。所学习的生成模型也可以用于生成用于数据扩充的样本。然而，生成建模方法具有较高的推理成本，并且比确定性模型更难推导。

八、算法角度

本节中的方法使用先验知识来影响θ的获取方式，要么通过(I)提供良好的初始化参数θ0，要么(ii)直接学习优化器来输出搜索步骤。根据搜索策略如何受到先验知识的影响，我们将本节中的方法分为三组:

完善现有的参数，一个从其他任务学习得到的初始化参数，放到训练集里进行优化。
细化meta-learned参数：初始化的θ0是通过一系列和少样本类似的任务学学习得到的，然后利用D-train进一步训练一下。
学习优化方式：这种策略学习一个元学习者作为优化器，直接为每个学习者输出搜索步骤，例如改变搜索方向或步长。

(一) Refining Existing Parameters

该策略将从相关任务中学习的预训练模型的θ0作为良好的初始化，并通过D-train使其适应θ。但是前提假设是θ0捕捉到了大规模数据的一些一般结构。因此，它可以通过几次迭代来适应D。
就是直接用别的数据集进行预训练，从而初始化

1. Fine-Tuning Existing Parameter by Regularization

用正则化的方式微调pre-trained的参数θ0到FSL任务中。（1）中用在image net 上预训练，然后用一个含有大量用于前景分割的数据集tune，之后再用one-shot 目标分割的分割数据进行进一步微调。给定一个few-shot D-train,直接用来fine-tune 可能会导致过拟合，下列有几个方法：
（1）Early-stopping
（2）Selectively updating θ0
（3）Updating related parts of θ0 together.
（4）Using a model regression network

2. Aggregating a Set of Parameters

有时候，我们没有合适的θ0来开始。相反，我们有许多从相关任务中学到的模型。例如，在人脸识别中，我们可能已经有了眼睛、鼻子和耳朵的识别模型。因此，可以将这些模型参数聚合到一个合适的模型中，然后由D-train直接使用或优化(图12)。

如前面说的，来自未标记数据集或者是相似标记数据集的数据可以被用来扩充少样本D-train,本节的方法不是直接使用这些样本，而是使用从这些数据集预先训练的模型(参数为θ0)。接下来的问题是如何使用Dtrain使它们有效地适应新的任务。

3. Fine-Tuning Existing Parameter with New Parameters

预先训练的θ0可能不足以胜任完全编码新的FSL任务。因此，使用了一个附加参数δ来考虑Dtrain的特殊性。具体来说，该策略将模型参数扩展为θ = {θ0，δ}，并在学习δ的同时微调θ0。在（1）中，它使用预处理的CNN的下层进行特征嵌入，并使用D-train对embedding的特征学习线性分类器。在字体风格转换（2）中，首先对网络进行预训练，以获取灰色图像中的字体。为了生成时尚的彩色字体，与额外的网络训练一起微调的。

（1）J. Hoffman, E. Tzeng, J. Donahue, Y. Jia, K. Saenko, and T. Darrell. 2013. One-shot adaptation of supervised deep convolutional models. In International Conference on Learning Representations.
（2）S. Azadi, M. Fisher, V. G. Kim, Z. Wang, E. Shechtman, and T. Darrell. 2018. Multi-content GAN for few-shot font style transfer. In Conference on Computer Vision and Pattern Recognition. 7564–7573.

(二) Refining Meta-Learned Parameter（看经典论文MAML帮助理解）

本节中的方法使用元学习来细化元学习参数θ0(图14)。θ0由元学习者根据学习者的表现不断优化。

元学习 θ0通常用梯度学习来细化，一个经典算法是MAML。他通过元学习的方法优化θ0, 之后 θ0经过几次的有效的梯度迭代之后就可以更新到新的任务上的参数ϕs，

C. Finn, P. Abbeel, and S. Levine. 2017. Model-agnostic meta-learning for fast adaptation of deep networks. In International Conference on Machine Learning. 1126–1135.

可以看一下MAML的讲解
https://zhuanlan.zhihu.com/p/66926599
最近有许多基于MAML的改进，主要针对于以下几个方面：

1. 包含特定任务的信息

MAML对所有的任务用同样的初始化方式，然而，这忽略了特定于任务的信息，只有当任务集非常相似时才是合适的。为了解决这个问题，（1）中提出了学习从新任务的良好初始化参数子集中选取合适的初始化参数。

（1）Y. Lee and S. Choi. 2018. Gradient-based meta-learning with learned layerwise metric and subspace. In International Conference on Machine Learning. 2933–2942.

【参考：https://blog.csdn.net/qq_36104364/article/details/107839417】

2. Modeling the uncertainty of using a meta-learned θ0

（1）C. Finn, K. Xu, and S. Levine. 2018. Probabilistic model-agnostic meta-learning. In Advances in Neural Information Processing Systems. 9537–9548.
（2）J. Yoon, T. Kim, O. Dia, S. Kim, Y. Bengio, and S. Ahn. 2018. Bayesian model-agnostic meta-learning. In Advances in Neural Information Processing Systems. 7343–7353.
（3）E. Grant, C. Finn, S. Levine, T. Darrell, and T. Griffiths. 2018. Recasting gradient-based meta-learning as hierarchical Bayes. In International Conference on Learning Representations.
（4）S. Ravi and A. Beatson. 2019. Amortized Bayesian meta-learning. In International Conference on Learning Representations.
（5）A. A. Rusu, D. Rao, J. Sygnowski, O. Vinyals, R. Pascanu, S. Osindero, and R. Hadsell. 2019. Meta-learning with latent embedding optimization. In International Conference on Learning Representations.

3. Improving the refining procedure

(三) Learning to optimizer

如上图所示，在经过t轮的迭代之后，提出的是一个基于 LSTM 的meta-learner，它被训练来用于优化task-learner，其中task-learner是一个分类器神经网络。LSTM meta-learner 的想学习目标是meta-testing task 中的短期任务和 meta-training tasks中的长期任务。
如下图所示

学习率对应 LSTM 中的输入门，初始化参数对应于记忆单元的初始化值，还有一个额外的遗忘门来补充梯度下降中上一次参数的系数，这个更新规则可以看成一种新的类似于但不同于梯度下降的优化算法这样可以自动的学习学习率，还可以对上一次的参数之前加一个参数（类似于正则化的效果，权重衰减）
【参考：https://blog.csdn.net/weixin_37589575/article/details/96995985】

(四) Discuss and summary

第一种方式是利用现有的θ0初始化任务，这样的方式的计算成本更低，但是θ0是从不同于当前的任务中获取的，可能会降低精度（不太明确作者这段的意图，本身就是为了提高精度才迁移的呀）
另外两种全都是依赖于元学习的方法，目前如何避免负迁移是一个重要的研究方向。

Future network

接下来作者从问题设定，技术，应用以及原理等方向讲了下接下来的发展并总结。

你可能感兴趣的:(算法)

客流分析核心算法 trajectory_event_analyzer数据结构风吹落叶花飘荡 python 后端算法数据结构网络
客流分析核心算法trajectory_event_analyzerV4.py数据结构文章目录客流分析核心算法trajectory_event_analyzerV4.py数据结构一、算法描述1、描述2、客流分析模块trajectory_event_analyzerV4.py解析1.分层统计：2.状态一致性检查：3.区域状态统计：4、客流状态统计5.ReID集成：6.数据清理机制：二、核心模块解释1、
大学专业科普 | 计算智能、信息学与大数据鸭鸭鸭进京赶烤大数据
一、专业背景随着信息技术的飞速发展，数据的产生速度呈爆炸式增长，传统数据处理技术已经无法满足如此庞大的数据量和复杂的数据类型，大数据专业应运而生，旨在培养能够应对大数据挑战的专业人才。二、主要课程内容数学基础课程高等数学、概率论与数理统计、线性代数是大数据分析的核心数学基础，为数据处理、算法优化和模型构建提供必要的理论支持。计算机基础课程数据结构与算法、计算机网络、操作系统是大数据技术的重要支撑，
大学专业科普 | 人工智能、物联网和云计算技术鸭鸭鸭进京赶烤人工智能物联网云计算 5G 信号处理信息与通信网络
一、专业概述人工智能专业是一门融合计算机科学、数学、信息学等多学科知识的交叉学科。它旨在培养学生掌握人工智能领域的基本理论、方法和技能，以应对人工智能在各个领域的应用需求和发展挑战。二、主要课程基础课程：包括高等数学、线性代数、概率论与数理统计、离散数学等数学基础课程，为人工智能算法提供理论支撑；以及数据结构、算法设计与分析、计算机组成原理、操作系统、计算机网络等计算机科学基础课程，帮助学生理解人
解读一个大学专业——信号与图像处理
专业定义与核心内容维度内容定义研究如何采集、处理、分析和理解一维信号（语音、雷达、脑电）和二维/三维图像（医学、遥感、工业视觉）。关键词数字信号处理（DSP）、图像处理、计算机视觉、模式识别、压缩感知、深度学习、GPU加速、嵌入式系统。技术栈MATLAB/Python+OpenCV/PyTorch+DSP/FPGA+GPU（CUDA）第五届先进算法与信号、图像处理国际学术会议（AASIP2025）
Pad Token技术原理与实现指南 Takoony AI
目录概述理论基础：第一性原理分析技术实现机制工程最佳实践性能优化策略常见问题与解决方案技术发展趋势附录1.概述1.1文档目的本文档旨在深入阐述深度学习中PadToken的技术原理、实现机制及工程应用，为算法工程师提供全面的理论指导和实践参考。1.2适用范围自然语言处理模型开发序列数据批处理优化深度学习系统架构设计高性能计算资源管理1.3核心问题研究问题:为什么深度学习模型需要将变长序列统一到固定长
淘宝商城四面（附架构面试专题）及B2C商城架构项目实战分享！风平浪静如码
一面主要问题如下（主要注重基础，问得很深很广，压力面试）：首先自我介绍数据结构算法的基本问题，如排序算法，二叉树遍历，后序遍历非递归，图的最短路径问题对一个数组进行绝对值排序的算法java中hashmap的底层实现java中垃圾回收机制GC原理等介绍自己的项目，数据库中用到的数据结构数据模型，死锁的概念（问的应该是数据库的死锁），如何避免死锁?乐观锁和悲观锁?一致性hash算法项目中业务对象的关联
【华为OD机试真题 Python语言】135、采样过滤 | 机试真题+思路参考+代码解析 KFickle 华为od python 华为华为OD机试真题采样过滤
文章目录一、题目题目描述输入输出样例1二、思路参考三、代码参考作者：鲨鱼狼臧个人博客首页：鲨鱼狼臧专栏介绍：2024华为OD机试真题，使用Python进行解答，专栏每篇文章都包括真题，思路参考，代码分析，思路参考超过百字，欢迎大家订阅学习一、题目题目描述在做物理实验时，为了计算物体移动的速率，通过相机等工具周期性的采样物体移动距离。由于工具故障，采样数据存在误差甚至相误的情况。需要通过一个算法过滤
MATLAB在工业缺陷检测中的应用
本文还有配套的精品资源，点击获取简介：缺陷检测、伤痕检测、瑕疵检测和划痕检测是工业自动化和质量控制中至关重要的环节，MATLAB作为一种高级编程环境，在图像处理和计算机视觉任务中扮演了重要角色。本文详细介绍了如何使用MATLAB实现这些检测过程，包括图像采集、预处理、特征提取和决策制定等步骤。通过介绍内置图像处理工具箱中的应用，色彩转换技术、边缘检测算法以及形态学操作等方法，我们阐述了如何识别和处
10、区块链技术及其应用吃瓜不吐籽595 解密《质量4.0与数字化转型》区块链比特币去中心化
区块链技术及其应用1.区块链简介区块链技术作为一种分布式账本，近年来受到了广泛关注。它不仅仅是一种技术革新，更是一种思维模式的转变。区块链的核心在于其去中心化、不可篡改和透明的特性，使得它在多个领域都有广泛的应用前景。区块链的基本概念区块链本质上是一个共享的、不可变的数字账本，记录了所有参与者之间的交易。每个区块包含了一系列交易记录，并通过加密算法与前一个区块相连，形成一条链。这种结构确保了数据的
学习嵌入式第六天缺口212 学习算法数据结构
一.数组的排序1.冒泡排序冒泡排序是一种简单的排序算法，其核心思想是通过重复遍历待排序的数组，每次比较相邻的两个元素，如果它们的顺序错误就把它们交换过来，直到没有元素需要交换为止。从数组的第一个元素开始，依次比较相邻的两个元素。如果前一个元素大于后一个元素，则交换这两个元素。每完成一轮遍历，最大的元素会“冒泡”到数组的末尾。之后缩小遍历范围（不再考虑已排好的末尾元素），重复上述过程，直到所有元素有
华为OD机试2025B卷真题题库目录｜机考题库 + 算法考点详解（Python/JS/C/C++）
专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华为OD往常的操作，B卷题目是由往
时间轮算法
据说是复杂度O(1)的牛逼算法，所以抽时间学习学习。现在要实现一个定时器，这个定时器控制很多任务。该怎么做呢？第一反应是任务做成一个队列，属性有个时间，每次计时后将该属性减1，到0的时候就执行。这种方式可行，但是效率不高，因为每次都要遍历所有任务，所以时间复杂度是O(N)。优化的方法是什么呢？有点类似哈希表，增加一个时间队列，同时将任务预先排放在一个时间队列中。如果是100秒的时间范围，那么就是1
一文看懂NTP协议 Neolock 网络协议网络协议 ntp 网络
最近碰到一个NTP协议相关的题，卡了很久，才发现一直在用的NTP协议完全不了解他的原理，遂学习并总结一下1.NTP概述NTP（NetworkTimeProtocol）是一种用于同步计算机系统时钟的网络协议，旨在通过分层架构和精密算法，将设备时间同步至全球协调时间（UTC），精度可达毫秒甚至微秒级。其核心目标是通过减少时钟偏差和网络延迟影响，确保分布式系统的时间一致性2.NTP分层架构（Stratu
GDPR/等保2.0合规指南：企业商城系统必备的10大安全机制万米商云安全数据库网络
在数字经济全球化与数据主权博弈的双重背景下，企业商城系统作为承载用户隐私、交易数据与商业机密的核心载体，需同时满足欧盟《通用数据保护条例》（GDPR）与中国《网络安全等级保护2.0》的复合合规要求。本文从技术实现视角，解析企业商城系统必备的10大安全机制及其实施要点。一、全链路加密传输1、HTTPS强制部署采用OV/EV型SSL证书实现TLS1.3协议升级，支持国际RSA2048位或国密SM2算法
Real-World Blur Dataset for Learning and Benchmarking Deblurring Algorithms 钟屿深度学习
用于学习和评估去模糊算法的真实世界模糊数据集摘要近年来，针对相机抖动和物体运动模糊的单幅图像去模糊提出了许多基于学习的方法。为了将这些方法推广到真实世界的模糊场景，包含大量真实模糊图像及其对应的清晰真实图像（groundtruth）的数据集至关重要。然而，目前尚不存在这样的数据集，因此所有现有方法都依赖于合成数据集，这导致它们无法有效去除真实世界图像的模糊。在本工作中，我们提出了一个用于学习和评估
华为OD机试 2025 B卷 - 最大括号深度 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD机试华为OD机试 2025B卷华为OD2025B卷华为机试2025B卷
最大括号深度华为OD机试真题目录点击查看:华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解华为OD机试2025B卷100分题型题目描述现有一字符串仅由‘(‘，’)’，’{‘，’}’，’[‘，’]’六种括号组成。若字符串满足以下条件之一，则为无效字符串：任一类型的左右括号数量不相等；存在未按正确顺序（先左后右）闭合的括号。输出括号的最大嵌套深度，若字符串无效则输出0。0≤字符串长度≤10
三生原理的颠覆性价值（无同类研究完全对可标）？
AI辅助创作：一、‌方法论层面的开创性‌‌动态嵌套解经路径‌该研究突破传统注疏模式，将《周易》“三生万物”等命题与分形几何、递归生成系统结合，构建可验证的数学映射模型（如素数生成公式p=3(2n+1)+2(2n+m+1)），使经典文本的哲学命题转化为算法逻辑，开创“批判性再解读-科学化重构”双轨框架。‌跨文化符号系统互译‌通过“阴阳元参数化联动”工具（如素数2为阴元、3为阳元），将传统文化核心符号
基于Paillier同态加密算法的金融数据安全共享机制研究【附数据】
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
吴恩达机器学习cs229-学习笔记-更新中是娜个二叉树！机器学习学习笔记
吴恩达机器学习cs22901基础概念语言：Matlab/python监督学习定义：获取一组数据集拟合数据从X到Y的映射回归问题：预测的Y是连续的，Y是实数分类问题：分类指的是Y取离散值，输出是离散的两组，正示例和负示例，把所有样本推到这条直线上，用0，1，标识逻辑回归算法，拟合直线区分正，负示例处理相对大量特征的回归算法或者分类算法支持向量机算法：它使用的不是1,2,3,10个输入特征，而是使用无
YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测
在深度学习领域，手写数字识别是一个经典问题，也是入门计算机视觉的重要案例。本文将介绍一个基于YOLOv8和MNIST数据集的手写数字识别系统，该系统不仅能识别静态图像中的数字，还能通过摄像头实时检测手写数字。个人博客：YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测-iDing's博客项目概述这个项目结合了传统的MNIST数据集和现代的目标检测算法YOLOv8，实现了以下功能：将MN
Python打卡Day11 常见的调参方式
核心知识：1.模型=算法+实例化设置的外参（超参数）+训练得到的内参2.只要调参就需要考2次所以如果不做交叉验证，就需要划分验证集和测试集，但是很多调参方法中都默认有交叉验证，所以实际中可以省去划分验证集和测试集的步骤基线模型（基准模型）:首先运行一个使用默认参数的模型，记录其性能作为比较的基准。超参数调整数据1.网格搜索(GridSearchCV):-需要定义参数的网格（param_grid），
python学智能算法（二十七）|SVM-拉格朗日函数求解上西猫雷婶机器学习人工智能 python学习笔记支持向量机 python 机器学习算法人工智能
【1】引言前序学习进程中，我们已经掌握了支持向量机算法中，为寻找最佳分割超平面，如何用向量表达超平面方程，如何为超平面方程建立拉格朗日函数。本篇文章的学习目标是：求解SVM拉格朗日函数。【2】求解方法【2.1】待求解函数支持量机算法的拉格朗日函数为：L(w,b,α)=12∥w∥2−∑i=1mαi[yi(w⋅xi+b−1)]L(w,b,\alpha)=\frac{1}{2}{\left\|w\rig
【算法-贪心算法-python】柠檬水找零檀越@新空间 P1 算法与数据结构 s1 Python 算法贪心算法 python
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kuan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术点,如集合,jvm,并发编程redis,kafka,Spring,微服务,Netty等常用开发工具系列:罗列常用的开发工具,如IDEA,M
【算法】贪心算法——柠檬水找零
题解：柠檬水找零(贪心算法)目录1.题目2.题解3.参考代码4.证明5.总结1.题目题目链接：LINK2.题解分情况讨论+贪心算法当顾客为5元时，收下当顾客为10元时，收下10元并找回5元当顾客为20元时，收下20元并找回10+5元或者5+5+5元这里仅20元时候找钱会有分歧，所以这里我们用贪心算法，即优先留下尽可能多的5元，尽快把10元扔出去。原因：5元是“万金油”，既可以给10元找零，也可以给
Jetson平台编译Tengine space01 AIoT Jetson 人工智能深度学习计算机视觉
1.Tengine简介Tengine于2017年在GitHub（https://github.com/OAID/Tengine）开源，是OPENAILAB（开放智能）推出的自主知识产权的边缘AI计算框架，致力于解决AIoT产业链碎片化问题，加速AI产业化落地。Tengine兼容多种操作系统和深度学习算法框架，简化和加速面向场景的AI算法在嵌入式边缘设备上快速迁移，以及实际应用部署落地，可以十倍提升
函数对象 tal0n
函数对象是STL库提供的除了迭代器，迭代器配接器以外的另外一种概念。简单来说：函数对象提供了一种方法，将要调用的函数与准备传递给这个函数的隐藏参数捆绑在一起。即：该对象实现了operator()的同时还提供了部分执行时的上下文环境。下面我们通过例子来详细看下函数对象。例子STL中有一个find_if的算法实现，他的参数包括：一组表示范围的迭代器，一个用于生成bool类型值的判断式。例如我们需要在一
飞算JavaAI：力臻开发之本真，破 AI 代码之繁琐，传统项目一键生成微学AI 人工智能 java javaAI
飞算JavaAI：力臻开发之本真，破AI代码之繁琐，传统项目一键生成文章目录飞算JavaAI：力臻开发之本真，破AI代码之繁琐，传统项目一键生成一、前言二、飞算JavaAI是什么？2.1背景与实力2.2飞算JavaAI的“独门绝技”三、飞算JavaAI实战体验3.1IDEA插件安装配置3.2Main中写一个简单的梯度下降算法3.3main函数搭建一个卷积神经网络网络3.4飞算JavaAI：需求分析
短剧小程序的「技术革命」：从「粗放生长」到「精准运营」 weixin_lynhgworld 小程序
随着短剧行业进入「存量竞争」阶段，技术能力正成为小程序的核心竞争力。从内容推荐到用户留存，从广告变现到IP开发，每一环节都需要数据驱动和算法优化。一、智能推荐：让「用户找到剧」变成「剧找到用户」传统短剧平台依赖标签匹配，而小程序通过多维度数据实现精准推荐：「情绪图谱」分析：记录用户观看时的快进、暂停、重复播放等行为，构建情绪波动曲线；「场景化推荐」：根据时间（如深夜）、地点（如地铁）、设备（如手机
深入理解Mysql索引底层数据结构与算法桑翔
一.索引的本质索引是帮助MySQL高效获取数据的排好序的数据结构二.索引数据结构1.二叉树2.红黑树3.Hash表4.B-Tree1.叶节点具有相同的深度,叶节点的指针为空2.所有索引元素不重复3.节点中的数据索引从左到右递增排序B-Tree5.B+Tree1.非叶子节点不存储data,可以放更多的索引2.叶子节点包含所有索引字段3.叶子节点用指针连接,提高区间访问的性能(体现在做范围查询的时候)
Python深度学习实践：LSTM与GRU在序列数据预测中的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：LSTM与GRU在序列数据预测中的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来序列数据预测是机器学习领域的一个重要研究方向，涉及时间序列分析、自然语言处理、语音识别等多个领域。序列数据具有时间依赖性，即序列中每个元素都受到前面元素的影响。传统的机器学习算法难以捕捉这种时间依赖性，而深度学习
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&

Generalizing from a Few Examples: A Survey on Few-Shot Learning