田小成plus

元学习方向 optimization based meta learning 之 MAML论文详细解读

元学习系列文章

optimization based meta-learning
1. 《Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks》论文翻译笔记
2. 元学习方向 optimization based meta learning 之 MAML论文详细解读：本篇博客
3. MAML 源代码解释说明 (一)
4. MAML 源代码解释说明 (二)
5. 元学习之《On First-Order Meta-Learning Algorithms》论文详细解读
6. 元学习之《OPTIMIZATION AS A MODEL FOR FEW-SHOT LEARNING》论文详细解读
metric based meta-learning: 待更新…
model based meta-learning: 待更新…

目前 meta-learning 的研究一共有三个方向：

optimization based

metric based

model based

本篇要讲的论文是第一个方向，optimization based 中的开篇之作，《Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks》简称 MAML

文章目录

- - 引言
  - 相关概念
  - - meta learning
    - transfer learning
    - multi-task learning
    - few shot learning
  - optimization based meta-learning
  - 一个形象化例子
  - MAML
  - - 论文标题
    - 算法流程
    - Warning of Math
    - first-order approximation 疑问
    - 和迁移学习的区别
    - 论文实验
    - - 回归问题
      - 分类问题
  - 参考资料

引言

上一篇博客是对这篇论文的纯翻译，这次来讲解下这篇论文是怎么做 meta-learning 的，这篇论文是 2017 年发表在 ICML 会议的，算是 optimization based 这个方向的开篇之作，后续的一些文章都有借鉴此论文的 idea。而且这篇论文的思想很简单，但是看明白后会惊讶于作者的思想是如此神奇，简单之中蕴含着大道理。

optimization based meta-learning

文章开头提到 meta-learning 的研究共有三个方向，第一个方向就是 optimization based meta-learning，而 MAML 是这个方向的开山之作，所以要想知道 MAML 是怎么做的，首先要知道这个方向是如何实现 metalearning 的。

思考一下，我们平时普通 learn 的模式是怎样训练模型的？以 DNN 网络模型为例，首先是搭建一个网络模型，接着对模型中每层的参数进行初始化，然后不断的进行“前向计算 loss -> 反向传播更新参数”的过程，直到 loss 收敛。这个过程中，模型初始时对当前数据是一无所知的，所以要通过随机初始化的方式对参数进行赋值，尽管用多种初始化方式，但总归都是随机的。那么有没有方法可以让模型从一个给定的位置开始训练呢，并且这个初始位置给的好的话，比如就在全局最优解附近，可能只需要迭代几次模型就收敛了。答案是肯定的，这个方向的 metaleaning 就是来做这个事情的。简单总结下就是 optimization based meta-learning 是通过之前大量的相似任务的学习，给网络模型学习到一组不错的/有潜力的/比较万金油的参数，使用这组参数作为初始值，在特定任务上进行训练，只需要微调几次就可以在当前的新任务上收敛了，这句话有几个值得注意的地方或者使用要求：

相似任务：并不是随便找一个数据就可以拿来进行训练。
共用一个网络模型：我们的最终目的是使用 DNN 模型在任务 A 上进行训练，为了避免随机初始化的方式，故而采用 metalearning 方式，对这个 DNN 模型先进行预训练，这个预训练的过程就是 meta 训练，其结果是得到一组不错的 DNN 参数，然后在任务A上进行微调。所以从始至终，就只有一个相同的 DNN 模型。
特定任务：这个特定任务是我们实际关心的任务，也是 meta 的推理任务，所以要和 meta 训练阶段的大量任务具有一定的相似性，如果差异性太大，那么 meta 学到的这组参数可能不起作用甚至还不如随机初始化的参数。

乍一看是不是觉得和迁移学习有点像，最终形式都是从一组已知参数开始微调，但是这两个方式是有本质的区别的，这个后面还会再讲到。

一个形象化例子

在开始讲论文之前，先来看一个形象化的例子，这个例子是楼主骑车的时候无意中想到的，和论文的思想很像。这个例子就是老师教学生学习的过程，场景设定是有一个刚开始时对世界一无所知的学生，这个学生希望通过不断的学习，具备一定的学习技巧或经验，从而可以在新的没有见过的科目上，只需要简单的学习几天，就可以在该科目上考出好成绩。为了达到这个目的，该学生请了一个老师，老师为了训练学生的学习能力，让这个学生同时学习不同的科目，比如语文、数学、英语等，然后每个科目都学习七天，七天之后进行各科的考试，老师会计算出该学生的平均考试成绩，并根据这次的平均成绩，对该学生的学习做出相应的指导，比如调整学习路线或者告诉他一些学习技巧等；然后让这个学生再次学习七天并考试一次，老师还是根据平均成绩进行指导，如此不断地执行这个过程，直到老师觉得该学生的考试成绩达标了，比如最近几次的平均成绩都可以到 90 分以上，就停止对这个学生的训练，并认为此时的学生已经具备了很好的学习能力。那么如何检验该学生的学习能力呢？方式就是找一个未曾学过的科目，比如操作系统，让这个学生从零开始学起，七天之后来考试一次，看他在操作系统这门课上的考试成绩如何，如果成绩很好，说明该学生已经具备了很强的学习能力，当然不一定是学习七天就考试，也可以学习一个月或者更久再进行考试。

这个例子中有两个需要思考的问题：

老师训练期间，如何衡量学生当前学的好不好？
老师训练期间，如何衡量学生学习能力强不强？

很明显，学的好不好就是通过当前科目上的考试成绩来判断，学习能力强不强，则是通过学习时间来判断，比如学习七天考到90分和学习一天就考到90分，是两种不同的学习能力。

MAML

论文标题

重头戏来了，先来解读下论文标题：Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks，这个标题中透漏出三个信息：

模型无关：模型无关不是说任意模型都行，这个范围太广了，是指任意的可以通过梯度下降进行优化训练的模型，这个模型一般都是网络模型，也可以是支持随机梯度下降的机器学习模型。
快速适应：意思是模型经过较少的迭代次数就可以在当前任务上收敛
多场景：论文的方法可以适用到分类、回归、强化学习等场景

算法流程

下图是论文中的伪算法，这里以监督学习中少样本分类场景为例，整体思想都是一样的。

先来解释下这个伪算法：

第一个 Require 很关键，也往往容易忽略，就是要求所有的任务都服从一个分布 P(T)，每个任务是从这个分布中采样得到的。这就说明了不能随意拿一个 Task 放到 MAML 框架里，必须满足某种相似性。
第二个 Require，这两个是模型超参数，我们的设置是，有一个用于多分类的网络模型 DNN，现在要通过元学习的方式得到网络模型的一组初始参数，为了得到这组参数，MAML 设计了两层训练，一个是 Task 内部的训练更新，更新的学习率是 α，一个是外部的网络模型的训练更新，更新的学习率是 β。可以把内部任务的训练，想象成前面例子中学生在每个科目上的学习过程，而外部的更新，则是老师调整学生学习方向的过程。

训练前首要先随机初始化网络模型所有参数 $\theta$
设置一个外层训练结束条件，例如迭代 10000 步等
外层训练就是 Meta 训练过程，上面讲过 Meta 训练的对象是 task，所以 meta 每一次的迭代都要从任务分布 p(T) 中随机抽取一个 batch 的 tasks
针对 3 中的每个 task，执行下面的过程：
在一个具体的任务 Ti 中随机抽取包含 K 个数据点的训练样本集 D
使用交叉熵损失函数或者均方差损失函数，在 D 上计算出损失函数 $L_{t_i}$ 和损失函数对 θ 的梯度
使用 6 计算出的梯度，在该任务上使用一次梯度下降更新模型参数 θ： $θ_i'=θ-α⊽$
从该任务 Ti 中抽样出一个测试集 D’，用于 meta 的参数更新
每个 task 都执行 6,7,8 三步，直到这一个 batch 的 task 都执行完
这一步就是 meta 的更新过程，虽然 7 也有更新模型参数，但是那是任务内的局部更新，并没有改变外面网络模型的参数，这一步就是要改变网络模型的参数了，仍然是使用梯度下降法进行更新，只不过更新用到的梯度是每个任务 Ti 在各自的测试集 D’ 上计算出的batch 个梯度的平均梯度，更新的步长是 β。可以把这一步的更新，想象成上面例子中老师根据学生的平均考试成绩来调整其学习方向的过程，考试题目自然是各科上没见过的题目，这也就是第 8 步抽取测试集 D’ 的作用，然后每个任务用自己更新过的模型参数 $θ_i'$ 在 $D^{'}$ 上进行前向计算得到一个 loss，用这个 loss 再对 $θ_i'$ 进行求导得到测试集 $D^{'}$ 上的梯度，这个梯度就相当于是该任务上的考试成绩

上面的过程中有一个问题需要事先说明：可以看到每个任务内部只更新了一次参数，也就是 6,7 两步只做了一次梯度更新，但其实也可以进行多次的梯度更新，就是把 6,7 两步重复执行几次。那作者这里为什么只写一次呢？这就是作者高明的地方了，那就是做了一个最大化假设。我们的最终目的是希望 MAML 训练出的参数，在新的任务上进行少量几次的微调就可以收敛，那最好的结果就是只更新一次就收敛了，所以在 MAML 训练过程中，作者就特意设计每个任务内部只更新一次参数，以此来训练这个模型 “更新一次就可以最大化性能”的能力。类比到上面讲的例子，那就是老师希望该学生具备强大的学习能力，在新的没有见过的科目上只学习一天就可以考出好成绩，为了训练该学生的这个能力，就让他在训练的每个科目上都学习一天然后考试一次，老师根据平均考试成绩调整学生的学习方向，不断地重复这个过程，直到平均考试成绩可以到 90 分以上就结束训练，此时老师就认为这个学生具备了“在新科目上学习一天就能考出好成绩”的能力。

基于上面的分析，楼主自己画了一个流程图来表示通用 MAML 的训练更新过程：

这个图中是以 task 内部更新 k 次参数为例的，k=1 的时候就和 MAML 一模一样了。

Warning of Math

下面到了一个容易犯困的环节，伟大的思想背后自然要有坚实的数学理论支撑，MAML 的数学过程就是其训练更新的过程，理解了数学过程才能更好的理解 MAML 的思想。不过在论文中，并没有过多的的数学过程介绍，可能是作者觉得太简单了吧，下面的数学过程也是楼主参考一些资料总结出的。

上图是 MAML 训练时模型参数的更新过程，其中 $\phi$ 是网络模型的初始参数，也就是伪算法中的 1 那一步， $\hat{\theta}'$ 是任务内部在 $\phi$ 上更新一次后的参数，也就是伪算法的第 7 步， $L(\phi)$ 是所有 task 在各自测试集 $D^{'}$ 上的 loss 和，用 $L(\phi)$ 对模型参数 $\phi$ 进行求导得出梯度，来进行meta的参数更新，也就是真正更新网络模型的参数。图中右边的过程就是把 meta 梯度下降更新的数学过程展开，其中最关键的一步是蓝色弯箭头标出的那个变换，就是第二个等号到第三个等号的那一步，其它步骤还都比较好理解，下面来详细看下关键这步的变换，其中主要是 $l(\theta')$ 对 $\phi$ 求导不好求，如果这个可以算出来，剩下的步骤就好说了。

上图就是计算 $l(\theta')$ 对 $\phi$ 求导的过程，因为 $\theta'$ 是由 $\phi$ 经过一次梯度下降更新得到的, $\phi$ 其实是一组参数向量，代表网络模型的各个参数，所以可以将求导展开成向量形式，向量每个元素是 $l(\theta')$ 对 $\phi_i$ 的求导，也就是上图中的红框1，那如何计算 $l(\theta')$ 对 $\phi_i$ 的求导呢？我们知道 $\theta'$ 是由 $\phi$ 经过梯度下降公式得到的，那么 $\phi_i$ 和 $\theta'$ 的关系就是下面这样：

也就是 $\phi_i$ 和每个 $\theta_j$ 都是有关系的， $\hat\theta'$ 又是由多个 $\theta_j$ 组成的，所以 $l(\theta)$ 对 $\phi_i$ 的求导就是对上面的链路求导的和，每个路径的求导则是 $l(\theta)$ 对 $\theta_j$ 求导结果和 $\theta_j$ $对\phi_i$ 的求导结果相乘，也就是上图中红框2所在的公式，其中的关键是红框2的位置，也就是 $\theta_j$ $对\phi_i$ 的求导， $\theta_j$ $是\phi_j$ 经过梯度下降公式变过来的，也就是图中的红色5标记的地方，所以 $\theta_j$ $对\phi_i$ 的求导就有两种情况，i=j 和 i!=j, i=j时，计算结果就是红框4所处的公式，i!=j时就是红框3的公式，可以看到这两个公式中都出现了二阶的偏导，二阶偏导求起来比较麻烦会影响到计算速度，所以作者使用了一阶近似的方法 first-order approximation，也就是把公式中的二阶偏导近似为0，这样近似后就简单很多，即 $\theta_j$ $对\phi_i$ 的求导在i=j时约等于1，在 i!=j 时约等于0。然后顺着图中的蓝色箭头一步步带入，最后就会得到 $l(\hat\theta)$ 对 $\phi$ 的求导近似等于 $l(\hat\theta)$ 对 $\hat\theta$ 的求导，再回到更新 meta 参数的公式来看就简单了：

上图红框标出的公式就是 meta 更新参数时实际做的事情，这个式子可以这样看 $((\phi-\beta*g_1)-\beta*g_2)-\beta*g_3 - ....$ ，这是什么意思呢？ $g_i$ 是第 i 个任务在其测试集上计算出的梯度方向，从几何上看，这个式子的更新过程是这样的：

蓝色点表示网络模型真正的参数，绿色第一个箭头表示在其训练集 D 上计算的梯度，绿色第二个箭头表示在其测试集 $D^{'}$ 上计算出的梯度，蓝色箭头表示 meta 模型网络模型参数的方向，可以看到它就是在每个任务的测试集的梯度方向上不断的去做更新。从这个过程中可以看出来，MAML 真正更新网络模型参数时，关心的是测试集上的梯度，而不是每个任务上训练集的梯度，也就是说，它更新的每一步的目标，都是使得更新后的参数能在以后的测试集上表现的更好，正是因为这样，才能说明 meta 停止更新时的参数具有很好的潜力/学习能力，这个能力使得这组参数在之后新的任务上微调几次就可以在该任务上取得很好的性能，当然理想情况还是微调一次就能取得不错的成绩，如果一次微调更新效果不好，那还可以再继续多次的微调更新。这也与我们最初希望的目标，即能在新任务上快速适应相吻合，即使该任务只有少量的训练样本，比如10条或者5条，甚至是1条样本，也能快速的学习到一些有效特征。

first-order approximation 疑问

在看上面的公式的时候，楼主有一个疑问，就是红框3和红框4标注的位置，作者把这个式子近似等于0，并称之为 first-order approximation一阶近似。这个二阶偏导式子是 $\hat\theta$ 由 $\phi$ 经过一次梯度下降更新推导过来的，如果 $\hat\theta$ 是经过两次或者多次梯度下降更新得到，那么这个式子会不会出现三阶甚至更高阶偏导，如果是的话那还能用近似的方式吗？

带着这个疑问，搜了搜作者 GitHub 的 issue，还真搜到了有人问类似的问题，

作者解答说，即使进行多次梯度下降更新，这里也只会出现二阶偏导。只恨自己数学太渣，理解不了，哪位数学大佬可以推导下的，麻烦私信我下，哈哈，在此先行谢过。

和迁移学习的区别

前面讲过，元学习和迁移学习有相似的地方，形式上都是在之前的任务上进行预训练，然后获得一组参数，然后用这组参数在新的任务继续微调，但它们是有本质的区别的。想想迁移学习的预训练是怎么训练的，比如在 ImageNet 大数据集上预训练的 RestNet、VGG 这些网络模型，它们在训练的时候是用在 ImageNet 训练集上的 loss 算出来的梯度来更新模型参数的，以训练集上的 loss 为准，关心的是当前模型参数在训练集上的性能如何。而元学习 MAML 在训练期间是用测试集上的 loss 算出的梯度来更新模型参数的，以测试集上的 loss 为准，不关心在当前训练集上的性能，而是关心这组参数在之后的测试集上的性能如何，也就是这组参数的潜力。换句话说，在 MAML 这篇论文中，是看这组参数在更新一次后的模型参数在测试集上能够表现多好，而不是训练期间能够多好，这种潜力也与元学习的大目标相符，即 Learn to learn 学会如何学习从而具备某种学习能力或学习技巧，可以在新的任务上快速学习。类比到上面老师和学生的例子，也很好理解，老师每次都是以学生的平均考试成绩为方向进行调整，这个考试成绩自然是每门功课上没有见过的题目，只有这样才能训练出该学生的学习能力。

从几何上来看，迁移学习预训练模型的参数更新过程是这样的：

这就能看出和 MAML 不一样的地方了，迁移学习的预训练每次更新参数时，都是在当前任务上训练集的梯度方向上进行更新。

论文实验

上面详细讲了论文的思想及数学过程，下面来看下论文中的一些实验及结论。论文中的所有实验都是少样本学习的场景，因为少样本学习是元学习一个典型的应用场景，元学习在少样本上也更能发挥出它的威力。

回归问题

论文中关于回归问题的例子是，拟合正弦函数曲线，所有任务的分布p(T)就是正弦函数分布 y=a*sin(x+b)，不同的任务只需要抽样不同的 a和b 即可，按照上面讲的 MAML 训练过程，在若干个不同 a和b 的正弦函数上进行预训练，然后用预训练出的网络模型在新的正弦函数样本上进行测试，这个新的正弦函数是训练期间没有见过的一组a和b，只给出少量的训练样本，如5个或10个。论文中对比了 MAML 模型和迁移学习预训练模型，在这个新的正弦函数上的预测性能，注意不管是哪种模型在这个新的任务上都还是要进行训练的，只不过这个训练是在之前参数的基础上微调，这个新任务对于 meta 来说就是推理任务，而在任务内部还是需要微调更新的。下图就是 MAML 模型和预训练模型在新的正弦函数上训练之后，在其测试集上的表现。

左边两个图是 MAML 模型的结果，左边第一个图是用 MAML 的思路训练出的模型，在新正弦函数的 5 个样本上微调之后，进行预测的结果。可以看到新的正弦函数，在训练时只给了分布在右半部分的 5 个点，其中红色线是真实分布，浅绿色线是不进行微调直接用预训练参数进行预测的结果，可以看出来预训练参数跑出的结果已经有了初步的形状。深绿色线是微调一次参数后进行预测的结果，此时预测出的曲线已经基本拟合真实的正弦函数了，在包含训练样本的右半侧可以完全拟合，在左半边的曲线，模型虽然没有见过这部分的样本但也可以学习出它的周期性质，在形状上基本拟合。左边第二个图不同的是，给出了新的正弦函数的10个训练样本，可以看到 MAML 在进行一次微调后，基本就可以拟合全部曲线了，在进行十次微调后，拟合程度更进一步。

右边两个图是同样的设置下，迁移学习预训练模型的表现，浅蓝色曲线是直接进行预测的结果，可以看到和真实分布相差甚远，尤其是波峰的位置，完全没对上，在微调1次和10次之后，相比于不微调，有一点进步，但和真实分布相比，依然相差较大。并且模型发生了过拟合现象，如果样本点只在右半部分，那模型在右半部分的拟合上表现还行，在另一半的位置上表现更差。如果迁移学习预训练的任务足够多的话，它训练出的模型对应的曲线应该是一条接近水平的直线，因为每个任务都以训练集上的 loss 为主，这么多任务的 loss 加起来更新参数时，梯度应该接近于0。从几何上理解就是，很多个正弦函数叠加在一起，其趋势就是一个水平线，同一个点，可能是波峰也可能是波谷，中间水平线的位置才能让所有任务上的 loss 最小，这就是迁移学习预训练和元学习的质的差别。

上面的图可能不是很明显，有第三方的作者复现了这个回归实验，并且重新绘制了这部分的图，如下所示，这个图看起来更明显些。

论文中也对微调次数进行了实验，结果如下图：

红色线是 oracle 设置组的结果，oracle 就是在训练时加入了该任务真实的a和b作为特征，相当于提前知道了真实分布，所以在这个设置下训练的模型，在新任务上的 mse loss 基本为 0 ，绿色线是 MAML 的模型，横轴是微调次数，可以看到微调一次的模型，就可以得到很低的 mse 误差，而随着微调次数增加，性能也逐渐提升，不过由微调1次变为2次，提升还比较明显，后面的提升就不明显了，尤其是在5次微调之后，基本就没有提升了。蓝色线是迁移学习的预训练模型，可以看到不管是微调几次，其 mse 值都很大，与 MAML 的模型相比，更是相差甚远。

分类问题

分类问题场景是两个少样本学习中常见的基准数据集：MiniImagenet 和 Omniglot，下图是在 Omniglot 数据集上的结果：

其中 5-way 是表示5分类，1-shot 表示训练时每个类别下只有一个样本，5-shot就是每个类别下只有5个样本，可以看到不管在哪个设置下，MAML 模型的表现都是最好的。

下图是在 MiniImagenet 数据集上的结果：
在这个数据上，作者还对比了使用一阶微分近似和不使用的结果，还记得一阶微分近似是啥吗？不记得的话，请往上翻看数学公式部分，可以看到使用了一阶微分近似，在效果上相差不大，但是作者证明在速度上可以提高 33% 左右，这可是一个性价比很高的改进。

参考资料

MAML 论文
MAML github
https://github.com/AdrienLE/ANIML/blob/master/ANIML.ipynb
B站杨弘毅 meta-learning 部分视频： https://www.bilibili.com/video/BV1Gb411n7dE?p=32
https://cs330.stanford.edu/

你可能感兴趣的:(meta-learning,元学习,meta-learning,少样本学习,人工智能)

情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
2019-12-22-22:30 涓涓1016
今天是冬至，写下我的日更，是因为这两天的学习真的是能量的满满，让我看到了自己，未来另外一种可能性，也让我看到了这两年这几年的过程中我所接受那些痛苦的来源。一切的根源和痛苦都来自于人生，家庭，而你的原生家庭，你的爸爸和妈妈，是因为你这个灵魂在那一刻选择他们作为你的爸爸和妈妈来的，所以你得接受他，你得接纳他，他就是因为他的存在而给你的学习和成长带来这些痛苦，那其实是你必然要经历的这个过程，当你去接纳的
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
春季养肝正当时 dxn悟
重温快乐2023年2月4日立春。春天来了，春暖花开，小鸟欢唱，那在这样的季节我们如何养肝呢？自然界的春季对应中医五行的木，人体五脏肝属木，“木曰曲直”，是以树干曲曲直直地向上、向外伸长舒展的生发姿态，来形容具有生长、升发、条达、舒畅等特征的食物及现象。根据中医天人相应的理念，肝五行属木，喜条达，主疏泄，与春天相应，所以春天最适合养肝。养肝首先要少生气，因为肝喜条达恶抑郁。人体五志肝为怒，生气发怒最
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
阶段总结反思轻争
马上就要进入10月份了，今天做一下前段时间的总结和反思。前段时间，日更、英语、健身、护肤坚持的比较好。阅读、书法坚持的不好。1.中间被迫停更半个多月，其余时间一直在坚持日更挑战。偶尔也有不想写的时候，就做一下摘抄。因为阅读（输入）没跟上来，所以写作（输出）质量有待进一步加强。2.英语做到了一周至少学习5天，每次不少于30分钟，但是小班课没有跟上更新速度，下一步要争取利用零碎时间补听小班课。3.减肥
ARM驱动学习之基础小知识 JT灬新一 ARM 嵌入式 arm开发学习
ARM驱动学习之基础小知识•sch原理图工程师工作内容–方案–元器件选型–采购（能不能买到，价格）–原理图（涉及到稳定性）•layout画板工程师–layout（封装、布局，布线，log）（涉及到稳定性）–焊接的一部分工作（调试阶段板子的焊接）•驱动工程师–驱动，原理图，layout三部分的交集容易发生矛盾•PCB研发流程介绍–方案，原理图(网表)–layout工程师（gerber文件）–PCB板
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
ARM驱动学习之4小结 JT灬新一嵌入式 C++arm开发学习 linux
ARM驱动学习之4小结#include#include#include#include#include#defineDEVICE_NAME"hello_ctl123"MODULE_LICENSE("DualBSD/GPL");MODULE_AUTHOR("TOPEET");staticlonghello_ioctl(structfile*file,unsignedintcmd,unsignedlo
展现思维导图魅力，不断挖掘人生宝藏思维导图讲师Mandy
第13期最强思维导图训练营已经结束一周了，但是我依旧是感觉所有学员还在努力的学习，这些学员中有教师、学生、白领、公务员、宝妈等等，只要你努力，只要你想改变自己，任何行业，任何岗位都可以参与进来，28天足以让你见成效，在这28天中，我们的学员不仅仅是收获了一枚毕业证，最重要的是让自己的思维方式得到升级，今天的你为自己投资，明天的你就会感谢你今天的付出，我们来听一听来自13期最强思维导图训练营优秀学员
2019-3-23晨间日记红红火火小耳朵
今天是什么日子起床：7点40就寝：23点半天气：有太阳，不过一会儿出来一会儿进去特别清爽的凉意，还蛮舒服的心情：小激动要给女朋友过生日啦纪念日：田田女士过生日任务清单昨日完成的任务，最重要的三件事：1.英语一对一2.运动计划3.认真护肤习惯养成：调整状态周目标·完成进度英语七天打卡（5/7）轻课阅读（87/180）音标课（25/30）读书（福尔摩斯一章）学习·信息·阅读#英语课#Cookingte
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
教育用心灵温暖心灵
@陈春丽长期学习班冯倩。今天一早就听到说高职合并，取消中专教育的教育信息。感觉是虽然知道，再听还是吓一跳。国家重视职业教育为何还要取消中专技术学校的教育？再听高中就要进行技术教育了，一部分人学习好继续努力学习考大学，一部分人在高中就可以进行职业教育接受职业教育了还要中专技术教育学校干什么呢！a有些职业教育学校转型升级快，不是孩子上完给找工作，而是学校帮孩子创业，我觉得是不错的方向！新闻新你得实时更
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
学习“论语”-第59天春峰轩
12.14子张问政。子曰：“居之无倦，行之以忠。”子张问为政之道。孔子说：“在位尽职不懈怠，执行政令要忠诚。”12.15子曰：“博学于文，约之以礼，亦可以弗畔矣夫！”孔子说：“君子广泛地学习文献，并且用礼节约束自己，也就不会离经叛道了。”12.16子曰：“君子成人之美，不成人之恶。小人反是。”孔子说：“君子成全别人的好事，而不助长别人的坏处。小人则与此相反行事。”知识点:“成人之美，不成人之恶”贯
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数