♡来年秋风起♡

论文阅读 6 | Bayesian Meta-Learning for the Few-Shot Setting via Deep Kernels

基于深度核的少样本设置的贝叶斯元学习

摘要
1 简介
- 1.1 动机
2 背景
2.1 Few-shot Learning
- 2.2 Kernels
3 方法说明
- 3.1 回归
- 3.2 分类
4 相关工作
5 实验
- 5.1 回归
- 5.2 分类
- 5.3 跨域分类
6 结论
Broader Impact

摘要

最近，已经引入了不同的机器学习方法来解决具有挑战性的少样本学习场景，即从与特定任务相关的小标记数据集中学习。常见的方法采取了元学习的形式：学习如何在旧问题的基础上学习新问题。在认识到元学习是在多层次模型中实现学习之后，我们通过使用深层内核对元学习内部循环进行了贝叶斯处理。因此，我们可以学习一个转移到新任务的内核; 我们称之为深度内核传输 (DKT) 。这种方法具有许多优点: 可以直接实现为单个优化器，提供不确定性量化，并且不需要估计任务的特定参数。我们从经验上证明，DKT在几次分类方面优于几种最先进的算法，并且是跨域自适应和回归的最新技术。我们得出的结论是，复杂的元学习例程可以用更简单的贝叶斯模型代替，而不会损失准确性。

1 简介

最先进的机器学习方法，如深度学习 (LeCun等人，2015; Schmidhuber，2015) 和人类学习之间的一个关键区别是，前者需要大量的数据，以便发现跨样本的相关模式，而后者从少数例子中获得了丰富的结构信息。此外，深度学习方法难以提供不确定性的度量，这是处理稀缺数据时的一个关键要求，而人类可以在有限的证据下有效地权衡不同的选择。在这方面，一些作者已经提出，人类进行少样本归纳推理的能力可以源自贝叶斯推理机制 (Steyvers等，2006; Tenenbaum等，2011)。因此，我们认为，通过使用深度内核方法，将元学习自然解释为在层次模型中实现学习，从而导致贝叶斯等效。

深度内核将神经网络与内核相结合，以提供可扩展且可表达的闭式协方差函数 (Hinton和Salakhutdinov，2008; Wilson等，2016)。如果一个人有大量的小但相关的任务，就像在很少的学习中一样，可以定义一个诱导知识转移的通用先验。此先验可以是具有跨任务共享参数的深层内核，因此，给定一个新的看不见的任务，可以有效地估计以小支持集为条件的查询集上的后验分布。在元学习框架中（Hospedales等人，2020），这对应于内循环的贝叶斯处理。这是我们提出的方法，我们称之为带转移的深度核学习，简称为深度核转移(DKT)。

我们为回归和分类设置导出了两个版本的DKT，并将其与标准化基准环境中的最新方法进行了比较; 该代码以开源许可证发布。DKT与其他少样板方法相比有几个优点，可以总结如下:

简单和高效。它不需要任何复杂的元学习优化例程，可以直接实现为单个优化器，因为内部循环被解析边际似然计算所取代，并且在低数据体系中是有效的。
灵活性。它可以用于各种设置，例如回归，跨域和域内分类，具有最先进的性能。
健壮性: 它提供了有关新实例的不确定性的度量，这对于决策者在很少的情况下至关重要。

主要贡献:
(i) 一种通过使用深层内核来处理少样本学习问题的新颖方法
(ii) 对元学习内部循环的有效贝叶斯处理
(iii) 经验证据表明，用于少量学习的复杂元学习例程可以用更简单的分层贝叶斯模型代替，而不会损失准确性。

1.1 动机

针对少样本设置的贝叶斯元学习方法主要遵循层次建模和多任务学习的路线。底层的有向图形模型区分所有任务共有的一组共享参数 $\mathbf θ$ 和一组 $N$ 个任务特定参数 $\mathbf \rho_t$ 。给定一个训练任务数据集 $\mathcal D = \{\mathcal T_t\}_{t=1}^N$ ，每个包含输入输出对 $\mathcal T = \{(x_l,y_l)\}_{l=1}^L$ ，并给定来自新任务 $\mathcal T^*$ 的测试点 $x_*$ ，学习包括找到 $\mathbf θ$ 的估计值，在任务特定参数 $p(\mathbf {ρ}_t | x_∗, \mathcal D, \mathbf θ)$ 上形成后验分布，然后计算后验预测分布 $p(y_∗ | x_∗, \mathbf θ)$ 。从概率角度来看，这种方法是原则性的，但存在问题，因为它需要通过摊余分布或抽样来管理两个层次的推断，通常需要繁琐的架构。

在最近的可微元学习方法中，通过最大似然估计、迭代更新外循环中的 $\mathbf θ$ 和内循环中的 $\mathbf ρ_t$ 来学习两组参数。这种情况有各种各样的问题，因为两组参数的联合优化以及更新权重时需要估计高阶导数 (梯度的梯度) 会导致学习不稳定。

为了避免这些缺点，我们提出了一种更简单的解决方案，即在特定任务的数据上边缘化 $\mathbf ρ_t$ 。这种边缘化是分析性的，并导致封闭形式的边际可能性，该边际可能性衡量给定参数集下数据的期望值。通过找到深层内核的参数，我们可以最大化边际可能性。按照我们的方法，无需估计特定于任务的参数的后验分布，这意味着可以跳过中间推理步骤直接计算后验预测分布。我们认为，这种方法在少样本设置中非常有效，相对于元学习方法，显著降低了模型的复杂性，同时保留了贝叶斯方法 (例如不确定性估计) 的优势，具有最先进的性能。

2 背景

2.1 Few-shot Learning

由于文献中使用的定义冲突，描述少样本学习设置的术语是分散的；请读者参阅Chen等人（2019）进行比较。这里，我们使用的术语来源于写作时最流行的元学习文献。令 $\mathcal S=\{(x_l,y_l)\}_{l=1}^L$ 是包含输入输出对的支持集，其中 $L$ 等于1 (1-shot) 或5 (5-shot)，并且 $\mathcal Q=\{(x_m,y_m)\}_{m=1}^M$ 是查询集 (有时在文献中称为目标集)，M通常比L大一个数量级。为了便于表示，支持和查询集被分组为任务 $\mathcal T=\{\mathcal {S, Q}\}$ ，数据集 $\mathcal D=\{\mathcal T_t\}_{t=1}^N$ 被定义为这些任务的集合。模型在从 $\mathcal D$ 中取样的随机任务上进行训练，然后给定一个从测试集取样的新任务 $T_*=\{S_∗,Q_∗\}$ ，目的是将模型以支持集 $S_∗$ 的样本为条件，以估计查询集合 $Q_*$ 中样本的隶属度。在最常见的情况下，训练、验证和测试数据集各自由不同的任务组成，这些任务是从相同的任务总体分布中抽取的。请注意，目标值 $y$ 可以是一个连续值（回归），也可以是一个离散值（分类），不过以前的工作大多集中在分类上。我们还考虑了跨域的情况，在这种情况下，测试任务的取样与训练任务的分布不同；这有可能更能代表许多现实世界的情况。

2.2 Kernels

给定两个输入实例 $x$ 和 $x^{'}$ 以及一个函数 $f (\cdot)$ ，核 $k (x ， x^{'})$ 是一个协方差函数，它表示两点输出的相关性如何取决于它们在输入空间中的两个位置之间的关系
$\tag{1}$
最简单的核有一个线性表达式 $k_{LIN}(x,x')=v\left \langle x, x'\right \rangle$ ，其中 $\left \langle \cdot \right \rangle$ 表示内积， $v$ 是方差超参数。使用线性核在计算上是很方便的，它诱导了一种贝叶斯线性回归的形式，然而这往往是过于简单的。因此，文献中提出了多种其他内核: 径向基函数核 (RBF)，Matern核，余弦相似核 (CosSim) 和光谱混合核。有关本工作中使用的内核的详细信息，请参见附录A。在深度核学习中，输入向量 $\mathbf x$ 通过一个非线性函数 $\mathcal F_{\phi}(\mathbf x)→\mathbf h$ （例如一个神经网络）映射到一个潜在向量 $\mathbf h$ 上，该函数由一组权重 $\large \phi$ 作为参数。嵌入的定义是使输入的维度大大降低，也就是说，如果 $\mathbf x \in \mathbb R^J$ 和 $\mathbf h \in \mathbb R^K$ ，那么 $\gg K$ 。一旦输入被编码为 $\mathbf h$ ，潜伏向量就会被传递给一个内核。当输入是图像时， $\mathcal F_\phi$ 的常见选择是卷积神经网络 (CNN)。具体来说，我们构建了一个内核
$k(\mathbf {x,x'|\theta,\phi}) = k'(\mathcal F_\phi(\mathbf x),\mathcal F_\phi(\mathbf x')|\mathbf \theta) \tag2$
通过将输入通过非线性函数 $\mathcal F_\phi$ ，从具有超参数 $\mathbf θ$ 的某个潜在空间核 $k^{'}$ 中获得。然后通过最大化对数边际似然，反向传播误差，共同学习超参数 $\mathbf θ$ 和模型参数 $\large \phi$ 。

3 方法说明

让我们从将元学习解释为层次模型开始，考虑上层中的一组任务公共参数（在外循环中优化），以及确定下层中的任务特定参数（在内循环中优化的）的过程。例如，在MAML中，外参数是常见的神经网络初始化权重，内参数是最终的网络权重，先验隐含地定义为可以在初始参数的几个梯度步骤中实现特定参数化的概率。通过对内环进行微分以获得外环参数的导数，可以端到端地获得外环和内环。这会导致众所周知的不稳定性问题。
我们的建议是用贝叶斯积分代替内部循环，同时仍对参数进行优化。这通常称为最大似然II型 (ML-II) 方法。我们学习了一组深度内核 (外环) 的参数和超参数，这些参数最大化了所有任务的边际可能性。这种可能性的边际化使用高斯过程的方法对每项任务的特定参数进行整合，用一个内核取代内循环模型。

让任务 $t$ 的所有输入数据 (支持和查询) 用 $\mathcal T_t^x$ 表示，目标数据为 $\mathcal T_t^y$ 。让 $\mathcal D^x$ 和 $\mathcal D^y$ 表示所有任务中这些数据集的各自集合; 此数据按任务分层分组。以任务公共超参数 $\hat {\mathbf \theta}$ 和其他任务公共参数 $\large \hat \phi$ （例如神经网络权重）为条件的贝叶斯分层模型的边际似然将采用以下形式
$P(\mathcal D^y|\mathcal D^x,\hat {\mathbf \theta},\hat \phi) = \mathop\Pi_tP(\mathcal T_t^y|\mathcal T^x_t,\hat \theta, \hat \phi) \tag3$
其中 $P(\mathcal T_t^y|\mathcal T^x_t,\hat \theta, \hat \phi)$ 是对每组任务特定参数的边缘化。让任务 $t$ 的这些任务特定参数用 $\large ρ_t$ 表示，那么
$P(\mathcal T_t^y|\mathcal T^x_t,\theta, \phi) = \int \mathop\Pi_kP(y_k|x_k,\theta,\phi,\rho_t)d\rho_t \tag4$
其中 $k$ 列举了 $x_k \in \mathcal T_t^x$ 的元素，以及相应的元素 $y_k \in T^y_t$ 。在典型的元学习中，针对任务特定目标（以及优化器的参数），任务特定积分（4）将被内环优化器替代；任何额外的跨任务参数 $\theta、\phi$ 都将在外循环中进行优化。相反，我们对特定于任务的参数进行完全积分，并仅对跨任务参数 $\theta, \phi$ 进行优化。我们通过使用 $P(\mathcal T_t^y|\mathcal T^x_t,\theta)$ 的高斯过程模型来隐式而非显式地实现这一点，这是许多模型类的方程4的解析积分的结果。对于新点 $x_*$ 的值的预测，给定一小部分示例 $\mathcal T^x_{t_*}, \mathcal T^y_{t_*}$ ，对于新任务 $t_*$ 可以使用预测分布
$p(y_*|x_*,\mathcal T_{t_*}^x, \mathcal T_{t_*}^y)\approx p(y_*|x_*,\mathcal T_{t_*}^x, \mathcal T_{t_*}^y, \hat{\mathbf \theta},\hat\phi)\tag5$
我们的主张是，尽管每个任务的数据点数量可能很小，但所有任务中对边际似然（3）有贡献的点的总数足够大，足以使 ML_II 适合寻找一组共享权重和参数，而不会出现欠拟合或过拟合。这些参数为新的看不见的任务提供了一个具有良好泛化能力的模型，无需推断特定于任务的参数 $\rho_t$ 。第5节中的结果表明，我们的建议与更复杂的元学习方法具有竞争力。请注意，这种方法不同于直接的深度内核学习，在深度内核学习中，边缘化覆盖了所有数据；这将忽略任务区别，这在分层模式下至关重要（参见第5.1节中的实验比较）。这个问题也不同于多任务学习，在多任务学习中，任务共享相同的输入值。

对于随机梯度训练，在每次迭代时，从 $\mathcal D$ 中采样任务 $\mathcal {T=\{S，Q\}}$ ，然后在 $\mathcal S \cup \mathcal Q$ （假设 $\in \mathcal Q$ 是待观察的）上估计对数边际似然，即（3）的对数，，并且通过该任务的边际似然目标上的梯度步长来更新核的参数。这个过程允许我们找到一个可以在支持集和查询集上完整表示任务的内核。测试一下时，给定新任务 $\mathcal T_* ={\mathcal S_*, \mathcal Q_*}$ ，使用在训练时学习的参数，通过对支持集 $\mathcal S_*$ 进行条件调节，对查询集 $ \mathcal Q_*$ 进行预测。算法1中给出了伪代码。

3.1 回归

我们想为回归情况找到（3）的封闭形式表达式。假设我们感兴趣的是一个连续的输出 $y_*$ ，它是由一个被方差为 $σ^2$ 的同方差高斯噪声 $\epsilon$ 污染的干净信号 $f_∗(x^∗)$ 产生的。我们感兴趣的是观测输出和测试位置处的函数值的联合分布。为了便于标记，让我们定义 $k_∗ = k(x_∗，x)$ 来表示 $x_∗$ 和 $\mathcal D$ 中的 $N$ 个训练点之间的协方差的 $N$ 维向量。类似地，对于 $x_{*}$ 的方差，我们写为 $k _{**}= k(x _*, x _*)$ 和 $\mathbf K$ 来识别 $\mathcal D$ 中的训练输入的协方差矩阵。预测分布 $p(y_*| x_*, \mathcal D)$ 是通过贝叶斯规则获得的，并且给定先验的共轭性，这是一个高斯函数，其均值和协方差指定为
$\mathbb E[f_*] = k_*^T(\mathbf K + \sigma^2\mathbf I)^{-1}\mathbf y \tag{6a}$
$cov(f_*) = k_{**} - k_*^T(\mathbf K + \sigma^2\mathbf I)^{-1}\mathbf k_* \tag{6b}$
注意，(6)定义了一个分布函数，它假设在任何有限点集合处收集的值具有联合高斯分布。在此，我们将噪声 $\sigma^2\mathbf I$ 吸收到协方差矩阵 $\mathbf K$ 中，并将其视为可学习参数 $\theta$ 的向量的一部分，该可学习参数 $\theta$ 还包括核的超参数（例如，线性核的方差）。

让我们将任务 $t$ 的所有目标数据项收集到向量 $\mathbf y_t$ 中，并用 $K_t$ 表示所有任务输入之间的内核。由此得出，等式（3）的边际似然性可以重写为

其中 $c$ 是常数。通过梯度上升的ML-II最大化（7）来估计参数。在实践中，我们使用随机梯度上升，每个批次包含单个任务的数据。

3.2 分类

分类情况的贝叶斯处理并非毫无问题，因为非高斯似然性破坏了共轭性。例如，在二元分类的情况下，伯努利似然性导致证据的难以处理的边缘化，因此不可能以封闭形式估计后验。处理这一问题的常用方法（例如MCMC或变分方法），对于小样本学习会产生大量的计算成本：对于每个新任务，通过近似或采样来估计后验，引入内循环，将时间复杂度从常数 $\mathcal O(1)$ 增加到线性 $\mathcal O(K)$ ，其中 $K$ 是内循环的数量。另一种解决方案是将分类问题视为回归问题，从而恢复到证据和后验的分析表达式。在文献中，这被称为 标签回归（LR）或最小二乘分类（LSC）。在实验上，LR和LSC在二元和多类环境中都比其他方法更有效。在这里，我们导出了一个基于LR的分类器，该分类器计算成本低且易于实现。

让我们定义一个二元分类设置，其中类是伯努利随机变量 $\in \{0,1\}$ 。模型被训练为回归变量，目标 $y_+ = 1$ 表示 $c = 1$ ， $y_− = −1$ 表示 $c = 0$ 。即使 $\in \{−1, 1\}$ ，也不能保证 $\in [y_-,y_+]$ 。预测是通过计算预测平均值并将其传递给一个sigmoid函数来进行的，从而产生概率解释。注意，仍然可以使用ML-II对 $θ$ 和 $\phi$ 进行点估计。当推广到多标签任务时，我们应用一对一方案，其中使用 C个二进制分类器对每个类和所有其他类进行分类。对数边际似然性，即等式（3）的对数，被C个单独类输出 $\mathbf y_c$ 中的每一个的边际之和代替，如下
$\log p(\mathbf{y} \mid \mathbf{x}, \hat{\boldsymbol{\theta}}, \hat{\boldsymbol{\phi}})=\sum_{c=1}^C \log p\left(\mathbf{y}_c \mid \mathbf{x}, \hat{\boldsymbol{\theta}}, \hat{\boldsymbol{\phi}}\right) \tag{8}$
给定一个新的输入 $x_*$ 和所有二元分类器的 C 个输出，通过选择具有最高概率的输出 $c_* = argmax_c(\sigma(m_c(x_*)))$ 来做出决策，其中 $m (x)$ 是预测均值， $\sigma(\cdot)$ 是 sigmoid 函数，并且 $c_* \in \{1,...,C\}$ 。

4 相关工作

关于特征转移的文献非常丰富。作为少样本学习的基线，标准程序由两个阶段组成:预训练和微调。在预训练期间，网络和分类器在基类的样本上进行训练。微调时，网络参数是固定的，并在新类别上训练一个新的分类器。这种方法有其局限性;模型的一部分必须为每个新任务从头开始训练，经常会过拟合。Chen等人(2019)提出使用样本之间的余弦距离(称为Baseline++)来扩展这一点。然而，这仍然依赖于一个假设，即固定的微调协议将正确平衡每个任务的偏差-方差权衡。

或者，人们可以在学习到的度量空间中比较新示例。匹配网络(MatchingNets, Vinyals等人，2016)使用余弦距离上的softmax作为注意力机制，并使用LSTM对支持集上下文中的输入进行编码，将其视为序列。原型网络(ProtoNets, Snell等人，2017)基于学习度量空间，其中分类是通过计算到原型的距离来执行的，其中每个原型是属于其类的嵌入式支持点的平均向量。关系网络(RelationNets, Sung等人，2018)使用嵌入模块来生成查询图像的表示，关系模块将这些表示与支持集进行比较，以识别匹配的类别。元学习(Bengio等人，1992;Schmidhuber, 1992;Hospedales et al.， 2020)方法在少样本学习任务中非常流行。MAML (Finn et al.， 2017)被提出作为一种在许多任务中对模型参数进行元学习的方法，因此初始参数是适应新任务的良好起点。MAML为许多元学习方法提供了灵感。

在几项研究中，MAML被解释为贝叶斯层次模型(Finn等人，2018;Grant等人，2018;Jerfel et al.， 2019)。贝叶斯MAML (Yoon等人，2018)将高效的基于梯度的元学习与非参数变分推理相结合，同时保持了一种与应用无关的方法。Gordon等人(2019)最近提出了一种平摊网络，它将少样本学习数据集作为输入，并输出特定任务参数的分布，可用于预测的元学习概率推理。Xu等人(2019)使用具有编码器-解码器架构的条件神经过程将标记数据投影到无限维函数表示中。

对于回归案例，Harrison等人(2018)提出了一种名为ALPaCA的方法，该方法使用样本函数数据集来学习特定领域的编码和先验权重。Tossou等人(2019)提出了高斯过程核学习的一种变体，称为自适应深度核学习(ADKL)，它使用任务编码器网络为每个任务找到核。我们的方法和ADKL之间的区别在于，我们不需要额外的模块来进行任务编码，因为我们可以依赖一组共享的通用超参数。

5 实验

在少样本设置中，方法之间的公平比较经常被每种算法在实现细节上的实质性差异所混淆。Chen等人(2019)最近发布了一个开源基准，以便在方法之间进行公平的比较。我们使用PyTorch和GPyTorch将算法集成到此框架中(Gardner等人，2018)。在所有实验中，所提方法都被标记为DKT。培训细节见附录B(补充材料)。

图1:(a)未知函数逼近的不同方法比较(超出范围，5个支撑点)。DKT更好地拟合(红线)真实函数(蓝色实线)和训练时从未见过的越界部分(蓝色虚线)。不确定性(红色阴影)在低置信区域增加。(b)对图像中头部轨迹估计中的异常值(切出噪声，红色帧)的不确定性估计。DKT能够估计一个接近真实值(蓝色圆圈)的平均值(红线)，显示出很大的方差。特征迁移在同一位置表现不佳。

5.1 回归

我们考虑两个任务：未知周期函数的振幅预测和图像中的头部姿态轨迹估计。Finn et al.（2017）将前者视为小样本回归问题，以激励MAML：支持和查询标量从振幅∈[0.1，5.0]、相位∈[0，π]、范围∈[-5.0，5.0]和高斯噪声（µ=0，σ=0.1）的周期波中均匀采样。训练集由5个支持和5个查询点组成，测试集由5种支持和200个查询点构成。我们首先在 in-range 进行测试：与Finn等人（2017）中的训练集相同的领域。我们还考虑了更具挑战性的 out-of-range 回归，测试点取自扩展域[-5.0，10.0]，其中在训练时未看到范围[5.0，10.0]的部分。

对于头部姿势回归，我们使用伦敦玛丽女王大学的多视图面部数据集（QMUL，Gong等人，1996），它包括37人（32个训练，5个测试）的灰度人脸图像。每个人有133张面部图像，覆盖偏转±90 °和倾斜±30 °（增量为10 °）的视野。每个任务由取自该离散流形的随机采样轨迹组成，其中 in-range 包括整个流形，out-of-range 允许仅在最左边的10个角度上训练，并且在整个流形上测试;目标是预测倾斜。对于周期函数预测实验，我们将我们的方法与特征转移和MAML进行了比较（Finn等人，2017）。此外，我们报告了ADKL（Tossou等人，2019年）、R2-D2（Bertinetto等人，2019）和ALPaCA（Harrison等人，2018年）在类似任务（如Yoon等人，2019中所定义）中获得的结果。为了强调内核转移的重要性，我们添加了一个基线，其中在没有转移的情况下，从每个传入任务的支持点开始训练深度内核（DKBaseline），这对应于标准的深度内核学习（Wilson等人，2016）。很少有方法处理图像的小样本回归，因此在头部姿态轨迹估计中，我们将其与特征传递和MAML进行比较。作为度量，我们使用预测值和真实值之间的平均均方误差（MSE）。其他详细信息见附录B。

回归实验结果总结见表1，定性比较见图1a和补充材料。在两个实验中，DKT获得了比特征转移和MAML更低的MSE。对于未知周期函数估计，使用谱核给出了比RBF更大的优势，在范围内和范围外都更精确（1.38对0.08，和2.61对0.10MSE）。不确定度在点密度较低的区域中得到正确估计，在 out-of-range 的区域中总体上增加。相反，特征传递严重欠拟合（1步，2.94 MSE）或过拟合（100步，2.67），并且无法建模超出范围的点（6.13和6.94）。MAML在范围内有效（2.76），但在范围外显著更差（8.45）。ADKL、R2-D2和ALPaCA（0.14、0.46、0.14）优于带RBF内核的DKT（1.38），但差于带频谱内核的DKT（0.08）。这表明适当的核函数与我们的方法相结合比自适应方法更有效。DKBaseline在所有条件下的性能都明显比DKT差，这证实了使用内核传输解决少发问题的必要性。图1a中的定性比较表明，特征传递和MAML都不能拟合真函数，特别是在范围外;附录C中报告了其他样品。我们观察到头部姿势估计的类似结果，DKT在所有情况下报告较低的MSE（表1）。在附录C中，我们还检查了由RBF和谱核生成的潜在空间。

表1：周期函数（上图）和头部姿势轨迹（下图）的Fewshot回归的平均均方误差（MSE）和标准差（三次运行），使用10个样本进行训练，5个样本进行测试。相同的域标记为范围内，扩展的不可见域标记为范围外。最小误差以粗体显示。※ Tossou等人（2019）报告的结果。

Uncertainty quantification (regression) 在数据少的情况下，考虑到预测中的不确定性至关重要; DKT是为数不多的能够做到这一点的方法之一。为了突出我们的方法相对于其他方法的优势，我们进行了一项实验，量化不确定性，采样头部姿势轨迹，并使用Cutout（DeVries和Taylor，2017）破坏一个输入，随机覆盖95%的图像。定性结果见图1b。对于损坏的输入，DKT预测接近真实值的值，同时给出高水平的不确定性（红色阴影）。特征传递执行得很差，预测的姿势不真实。

5.2 分类

我们考虑两个具有挑战性的数据集：加州理工学院-UCSD鸟类（CUB-200，Wah等人，2011年）和迷你ImageNet（Ravi和Larochelle，2017年）。所有实验均为5向（5个随机类），具有1或5次激发（支持集中每个类1或5个样本）。为查询集提供了每个类别总共16个样本。附录B（补充）中的其他详细信息材料）。我们比较以下内核：linear，RBF，Matérn，Polynomial，CosSim和BNCosSim。 BNCosSim是CosSim的变体，其特征通过BatchNorm（BN）统计数据集中（Ioffe和Szegedy，2015），这已证明可提高性能（Wang等人，2019年）。我们将我们的方法与几种最先进的方法进行了比较，如MAML（Finn等人，2017）、ProtoNets（斯内尔等人，2017年）、MatchingNet（Vinyals等人，2016年）和关系网（Sung等人，2018年）。我们进一步比较了Chen等人（2019）的特征转移和基线++。所有这些方法都是用相同的主干和学习计划从头开始训练的。我们还报告了具有可比较的训练过程和卷积结构的方法的结果（Mishra等人，拉维和拉罗谢尔，2017年; Wang等人，2019），包括最近的分层贝叶斯方法（Gordon等人，2019年; Grant等人，2018年; Jerfel等人，2019年）。我们排除了使用更深层主干或更复杂学习计划的方法（Antoniou和Storkey，2019；Oreshkin等人，2018；Qiao等人，2018年；Ye等人，2018），以便可以与基础区别模型的能力分开评估算法的质量。

我们在表2和表3中报告了更具挑战性的 1-shot 情况的结果，在补充材料中报告了5-shot 情况的结果。所有实验均为5-ways（5个随机类），具有1-shot或5-shot（支持集中每个类1或5个样本）。DKT在CUB（63.37%）和mini-ImageNet（49.73%）中均实现了最高的准确度，比包括分层贝叶斯方法（如LLAMA（49.40%）和VERSA（48.53%））在内的任何其他方法都更好。一阶内核的最佳性能（表5，附录材料）很可能是由于潜在空间中的神经网络引起的低曲率流形，从而增加了数据的线性可分性。总体而言，我们的结果证实了Chen等人（2019）关于余弦度量有效性的发现，以及Wang等人（2019）关于特征归一化重要性的发现（附录D和E）。在表6（附录材料），我们报告了具有更深主干的结果（ResNet-10，He等人，2016），显示DKT在5次激发（85.64%）中优于所有其他方法，在1-shot （72.27%）中结果次佳。CosSim和BNCosSim之间的性能差异对于更深的主干网来说更大，这表明当向网络添加额外的层时，将特征集中是很重要的。

Uncertainty quantification (classification) 我们提供了CUB数据集上的模型校准结果。我们遵循Guo et al.（2017）估计预期校准误差（ECE）的方案，这是一种标量汇总统计量（越低越好）。我们首先缩放每个模型输出，通过在3000个任务上经由LBFGS最小化logit/label上的NLL来校准温度;然后我们估计测试集的ECE。CUB 1-shot 和 5-shot 测试的完整结果（百分比，三次运行的平均值）见附录D表7。在单次测试中，DKT达到了最低的ECE 2.6%，击败了大多数竞争对手（只有ProtoNet和MAML做得更好）。在5-shot中，我们的模型实现了第二低的ECE 1.1%（ProtoNet做得稍微好一点）。

5.3 跨域分类

跨域分类的目的是训练关于从一个分布采样的任务的模型，该模型然后推广到从不同分布采样的任务。具体地说，我们联合收割机数据集，以便从一个数据集中提取训练分割，从另一个数据集中提取验证和测试分割。我们对mini-ImageNet→CUB（从mini-ImageNet分离训练和从CUB分离瓦尔/测试）和Omniglot→EMNIST进行了实验。我们将我们的方法与之前考虑的方法进行了比较，使用相同的时间点数量和模型选择策略设置（见附录B）。单次激发情况的结果如表2所示。DKT在大多数情况下都能达到最高的精度。在Omniglot→EMNIST中，使用线性核可实现最佳性能（75.97%）。在miniImageNet→CUB中，DKT优于所有其他方法，CosSim（40.22%）和BNCosSim（40.14%）的准确度最高。请注意，大多数竞争方法在此设置中遇到困难，如它们的低准确度和大标准差所示。核函数的比较表明一阶核函数更有效（见附录E，表9）。

6 结论

在这项工作中，我们引入了DKT，一种基于深度核学习的高度灵活的贝叶斯模型。与文献中的一些方法相比，DKT在回归和跨域分类方面表现更好，同时提供了不确定性的度量。基于这些结果，我们认为，许多复杂的元学习例程的小样本学习可以取代一个简单的层次贝叶斯模型，而不会损失准确性。未来的工作可以集中在利用模型在相关设置中的灵活性，特别是那些合并连续和小样本学习的设置（Antoniou等人，2020年），DKT在这里有着蓬勃发展的潜力。

Broader Impact

这项工作的主要动机是设计一个简单而有效的贝叶斯方法来处理少镜头学习设置。如果我们想要拥有能够处理具体现实问题的系统，那么从减少的数据量中学习的能力是至关重要的。应用包括（但不限于）：计算资源受限情况下的分类和回归、小数据集的医学诊断、少量图像的生物特征识别等。我们的方法是少数能够提供不确定性测量作为决策者反馈的方法之一。然而，明智地选择系统训练所依据的数据是很重要的，因为低数据区域可能比标准对应区域更容易产生偏差。如果数据有偏差，我们的方法不能保证提供正确的估计;这可能会损害最终用户，应认真加以考虑。

你可能感兴趣的:(少样本学习,论文阅读)

Moodle + Websoft9：创新教育的强大组合，助力教学与学习开源软件
Moodle+Websoft9：构建未来课堂的技术基石一、Moodle：开源生态的深度解析•模块化设计：支持超800个官方插件，如H5P交互内容创作、BigBlueButton虚拟课堂，满足个性化教学需求。•学习分析引擎：内置LearningAnalyticsAPI，可集成Python/R语言进行深度学习，预测学生学业风险。•移动优先战略：MoodleApp支持离线学习、扫码签到，2023年新增A
书籍-《动手学深度学习（英文版）》
书籍：DiveintoDeepLearning作者：AstonZhang，ZacharyC.Lipton，MuLi，AlexanderJ.Smola出版：CambridgeUniversityPress编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《动手学深度学习（英文版）》01书籍介绍深度学习已经彻底改变了模式识别，为计算机视觉、自然语言处理和自动语音识别等领域提供了强大的工具。应用深度学
K8S学习之基础三十六：node-exporter部署云上艺旅 K8S学习 kubernetes 学习贪心算法 prometheus 云原生
Prometheusv2.2.1编写yaml文件，包含创建ns、configmap、deployment、service#创建monitoring空间viprometheus-ns.yamlapiVersion:v1kind:Namespacemetadata:name:monitoring#创建SA并绑定权限kubectlcreateserviceaccountmonitor-nmonitori
快速上手系列丨如何管理 PieCloudDB Database 虚拟数仓云原生数据库教程管理
为增强社区用户的体验，PieCloudDBDatabase社区版已于8月完成了全面改版升级。同时，PieCloudDB社区还特别制作了《快速入门PieCloudDB社区版》系列课程，旨在帮助大家全面了解新版本，逐步探索PieCloudDB的强大功能。PieCloudDB社区版提供免费下载，可用于体验产品新特性、个人学习、PoC验证等场景，方便社区用户快速体验领先的数仓虚拟化技术。PieCloudD
numpy学习笔记10：arr *= 2向量化操作性能优化宁宁可可 #机器学习 #Python基础与进阶 numpy 学习笔记
numpy学习笔记10：arr*=2向量化操作性能优化在NumPy中，直接对整个数组进行向量化操作（如arr*=2）的效率远高于显式循环（如foriinrange(len(arr)):arr[i]*=2）。以下是详细的解释：1.性能差异的原理(1)底层实现不同显式循环（错误示范）：Python的for循环是解释执行的，每次迭代需要动态解析变量类型、执行函数调用等操作。对每个元素的操作会触发多次Py
AIGC与教育行业的邂逅--其在数学领域的应用与实现想成为高手499 AIGC
引言在数学教学中，教师往往需要大量的时间准备练习题和答案解析，而学生则需要定制化的练习来满足不同的学习需求。AIGC技术可以通过自动生成数学题目、定制化学习内容、即时反馈等方式，极大地提升数学学习的效率与质量。本文将深入探讨AIGC在数学领域的几种应用场景，并通过Python代码展示具体实现方式。1.自动生成数学题目与解析数学题目生成是AIGC在数学教学中的主要应用之一。通过生成不同难度和类型的题
用LangChain构建自愈式生成式AI：颠覆传统知识库的智能问答系统实战煜bart 机器人人工智能 python AI编程
引言：当生成式AI遇到自进化架构ChatGPT的惊艳表现让企业意识到生成式AI的潜力，但传统问答系统仍面临数据孤岛、知识更新滞后等痛点。本文将揭秘如何通过LangChain框架构建具有自进化能力的智能问答系统，实现企业知识库的实时动态更新与智能推理。通过本文，您将掌握一套让AI系统在运行中持续学习、自主优化的创新架构。---##一、核心技术突破###1.1自愈式数据管道（Self-healingP
Python在人工智能与机器人开发中的应用与实践一键难忘 python 人工智能机器人
Python在人工智能与机器人开发中的应用与实践Python已经成为人工智能和机器人开发的主要编程语言之一，凭借其简洁的语法、强大的库支持和广泛的社区资源，Python为开发者提供了一个高效且易于学习的平台。在这篇文章中，我们将深入探讨如何使用Python进行人工智能（AI）和机器人开发，并通过实际代码示例展示核心技术和应用。1.Python在人工智能中的应用人工智能（AI）领域的核心任务包括机器
nginx性能优化有哪些方式？企鹅侠客 linux 面试 nginx 性能优化 php
0.运维干货分享软考高级系统架构设计师备考学习资料软考高级网络规划设计师备考学习资料KubernetesCKA认证学习资料分享信息安全管理体系（ISMS）制度模板分享免费文档翻译工具(支持word、pdf、ppt、excel)PuTTY中文版安装包MobaXterm中文版安装包pinginfoview网络诊断工具中文版Nginx是一个高性能的HTTP服务器和反向代理服务器，但在高并发场景下，仍然有
疯狂python讲义学习日志06——异常处理静笃归心方得平和心气 Python学习日志异常处理 python学习 python笔记 python速成
疯狂python讲义学习日志06——异常处理引言1异常处理机制1.1使用try...except处理异常1.2异常类的继承体系1.3多异常捕获1.4访问异常信息1.5else块1.6使用finally回收资源2使用raise处理异常2.1引发异常2.2自定义异常类2.3except和raise同时使用3.python的异常传播轨迹4.异常处理规则4.1不要过度使用异常4.2不要忽略异常引言异常机制
计算机专业毕业设计题目推荐（新颖选题）本科计算机科学专业相关毕业设计选题大全✅ 会写代码的羊毕设选题课程设计计算机网络毕设选题毕设系统毕设题目计算机科学专业
文章目录前言最新毕设选题（建议收藏起来）本科计算机科学专业相关的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费功能设计
集成学习（Ensemble Learning）基础知识1 代码骑士 #机器学习集成学习机器学习人工智能
文章目录一、集成学习1、基本概念2、回顾:误差的偏差-方差分解3、为什么集成学习有效？4、基学习器：“好而不同”5、集成学习的两个基本问题（1）如何训练出具有差异性的多个基学习器？（2）如何将多个基学习器的预测结果集成为最终的强学习器预测结果？二、自助法（Bagging）1、Bagging2、BootstrapBootstrap采样的数学性质3、Bagging:集成学习的两个基本问题（1）如何训练
Python个人学习笔记（17）：模块（sys、pickle&json） NEET_LH 樵夫老师Python零基础课程个人学习笔记 python 学习笔记
五、sys模块sys.exit()：退出while1:print(123)sys.exit(0)#程序退出，0是正常退出，1是非正常退出，记录在日志中sys.version：得到当前解释器的运行环境sys.platform：运行平台，win32=windows代码：print(sys.version)print(sys.platform)结果：3.13.0(tags/v3.13.0:60403a5
python学习笔记之异常（内置标准异常总结） Molly_DD Python学习笔记 python 软件测试
python异常处理机制异常处理是python的一种高级工具，当异常发生时，程序会停止当前的所有工作，跳转到异常处理部分去执行。异常既可以是程序错误引发的，也可以由代码主动触发。异常处理基本结构try:可能引发异常的代码except异常类型名称：异常处理代码else：没有发生异常时执行的代码异常报错：try：classtest:defgetdata(self):returnself.datay=t
不要再走弯路了2025最全的黑客入门学习路线在这渗透代老师学习网络安全 web安全网络 python
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包在大多数的思维里总觉得[学习]得先收集资料、学习编程、学习计算机基础，这样不是不可以，但是这样学效率太低了！你要知道网络安全是一门技术，任何技术的学习一定是以实践为主的。也就是说很多的理论知识其实是可以在实践中去验证拓展的，这样学习比起你啃原理、啃书本要好理解很多。所以想要学习网络安全选对正确的学习方法很重要，这可以帮你少走很多弯路。
202年充电计划——自学手册网络安全（黑客技术）网安康sir web安全安全网络 python linux
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包前言什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习
自学网络安全（黑客技术）2025年 —90天学习计划网安CILLE web安全学习安全网络网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包前言什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习
C++学习note8(结构体）技术小白Byteman c++学习开发语言算法 visual studio
一，结构体用法结构体为用户自定义的数据类型，放在主函数前，其定义方法如下：structStudent{stringname;intage;intgrade；}；代码示例：#includeusingnamespacestd;#includestructStudent{/此处Student也可为student(不硬性要求大小写)stringname;intage;intgrade;}s3;/在此顺便创
C++学习note7(指针）技术小白Byteman c++学习开发语言 windows visual studio 算法数据结构
一，指针的定义指针用于记录变量的地址。代码示例:#includeusingnamespacestd;intmain(){inta=0;int*p;（int*为一体）p=&a;p为a的地址coutusingnamespacestd;intmain(){int*p=NULL;*p=100;定义空指针后不可对其进行访问，故程序出错coutusingnamespacestd;intmain(){int*p
学习使用 Git 和 GitHub 开发项目的教程推荐 vortex5 学习 git github
Git和GitHub是现代软件开发中不可或缺的工具，无论你是个人开发者还是团队成员，掌握它们都能极大提升效率。本文精选了一系列优质教程资源，涵盖从基本Git命令到进阶多人协作的内容。这些教程既有文字形式，也有视频或交互式资源，适合不同学习风格的人。一、为何要学习Git和GitHub？Git是一个分布式版本控制系统，让你追踪代码变更、回滚错误并与他人协作；GitHub则将其扩展为一个云端平台，支持代
物理服务器与云服务器的区别是什么苹果企业签名分发服务器运维
首先，我需要确定用户的基本背景。可能是一个刚开始学习服务器知识的学生，或者是一个企业里负责IT基础设施的人员，想要了解如何选择服务器类型。不管怎样，用户需要的是两者的核心区别，可能还涉及成本、性能、管理等方面的考虑。物理服务器和云服务器，这两个概念在硬件、部署方式、资源管理上都有不同。首先，物理服务器是实实在在的硬件设备，企业自己购买和维护，而云服务器是基于虚拟化技术的资源，由云服务商提供，用户按
零基础怎么开始学网络安全（非常详细）零基础入门到精通，收藏这一篇就够了程序员羊羊 web安全安全网络 php 学习
一、学习建议1.了解基础概念：开始之前，了解网络安全的基本概念和术语是很重要的。你可以查找网络安全入门教程或在线课程，了解网络安全领域的基本概念，如黑客、漏洞、攻击类型等。2.网络基础知识：学习计算机网络基础知识，了解网络通信原理，不同网络协议（如TCP/IP）的工作方式，以及网络拓扑结构等。3.操作系统知识：了解常见的操作系统，特别是Windows和Linux。掌握基本的命令行操作和系统管理技能
【C++篇】排队的艺术：用生活场景讲解优先级队列的实现 far away4002 C++c++stl 优先级队列向下（向上）调整算法
文章目录须知欢迎讨论：如果你在学习过程中有任何问题或想法，欢迎在评论区留言，我们一起交流学习。你的支持是我继续创作的动力！点赞、收藏与分享：觉得这篇文章对你有帮助吗？别忘了点赞、收藏并分享给更多的小伙伴哦！你们的支持是我不断进步的动力！分享给更多人：如果你觉得这篇文章对你有帮助，欢迎分享给更多对C++感兴趣的朋友，让我们一起进步！深入理解与实现：C++优先级队列的模拟实现1.引言在算法和数据结构中
【C++篇】深入剖析C++ Vector底层源码及实现机制 far away4002 C++c++开发语言 vector visual studio vscode
文章目录须知欢迎讨论：如果你在学习过程中有任何问题或想法，欢迎在评论区留言，我们一起交流学习。你的支持是我继续创作的动力！点赞、收藏与分享：觉得这篇文章对你有帮助吗？别忘了点赞、收藏并分享给更多的小伙伴哦！你们的支持是我不断进步的动力！分享给更多人：如果你觉得这篇文章对你有帮助，欢迎分享给更多对C++感兴趣的朋友，让我们一起进步！全面剖析vector底层及实现机制接上篇：【C++篇】探索STL之美
实战LLM强化学习——使用GRPO（DeepSeek R1出圈算法）大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
引言近年来，深度强化学习（DRL）已经成为解决复杂决策问题的一个强有力工具，尤其是在自然语言处理（NLP）领域的广泛应用。通过不断优化决策策略，DRL能在大量数据中学习最佳行为，尤其是大型语言模型（LLM）在任务中展现出的巨大潜力。然而，随着模型规模的扩大和任务复杂性的增加，传统的强化学习算法开始暴露出训练效率低、收敛速度慢等问题。为了解决这些挑战，DeepSeek公司提出了一个新的强化学习算法—
人生建议往死里学网络安全！零基础也能跨行学习！！漏洞挖掘还能做副业黑客老哥 web安全学习安全网络系统安全
一、网络安全的重要性：从‘不学会被黑’到‘学会保护别人’网络安全的概念现在不再是技术圈的独立话题，它已经渗透到社会的各个领域。从个人的隐私保护、企业的数据安全，到国家的信息防护，网络安全几乎影响了每一个人的生活。无论是黑客攻击、勒索病毒、数据泄露，还是国家间的信息战，网络安全已经成为现代社会的基础设施之一。所以，首先要明白学习网络安全的重要性：你不仅是在学习技术，更多的是在为自己和他人的安全“筑城
AI学习指南RAG篇(24)-RAGFlow的社区与开源贡献俞兆鹏 AI学习指南人工智能
一、引言RAGFlow是一款基于深度文档理解的开源RAG（Retrieval-AugmentedGeneration，检索增强生成）引擎，旨在解决现有RAG技术在数据处理和生成答案方面的挑战。RAGFlow通过结合大型语言模型（LLMs）的强大生成能力和高效的信息检索系统，为用户提供了一种全新的交互体验。本文将鼓励读者参与到RAGFlow的开源社区中，共同推动技术的发展和创新。二、RAGFlow的
Deno入门教程：Node.js 的替代品 xiaoweids 编程语言 JavaScript node.js javascript 开发语言
转自：微点阅读https://www.weidianyuedu.com这几天假期，我学习了一下Deno[1]。它是Node.js的替代品。有了它，将来可能就不需要Node.js了。这篇文章就是Deno的一个初步介绍，尝试回答为什么Node.js不能满足需要，以及Deno能够带给我们什么？以下内容主要基于BertBelder[2]和RyanDahl[3]的最新演讲。0、进入主题之前，先说一下Deno
如何用AI轻松制作完美PPT，节省时间又提升效率 HUIPPT剑盾ai 人工智能 powerpoint 软件 aigc 科技
如何用AI轻松制作完美PPT，节省时间又提升效率！在这个快节奏的时代，做PPT成了大家工作和学习的必备技能。无论是准备一场重要的商务演讲，还是一份课题报告，PPT的质量往往决定了成败。然而，传统制作PPT的方式费时又费力，如何快速、高效地制作出吸引人的PPT呢？别担心，AI的出现为我们提供了全新的解决方案！AI制作PPT，让你摆脱繁琐的排版如今你只需提供一些基础的内容，剩下的工作交给AI。AI制作
多学科视角下探索开源&Github、Git初步学习 Bulestar_xx 开源 github git
Think1.Github作为现今最主流的代码托管平台、协作平台甚至是“社交平台”，本身是闭源的。一方面，它是和大多数开发者连接最紧密的开源阵地，另一方面，拥有传统“黑客精神”的人认为将用户身份绑定这样一个闭源平台上恰恰与开源背道而驰。请从早期自由软件运动与现代开源模式变迁的视角，谈一谈你对上述两种认知的理解。2.在拓展阅读《开放式协作》第二章中国根据用户增长和贡献者增长将所有项目分为了四种类型，
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：[email protected]）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方