双木的木

2-4 李宏毅2021春季机器学习教程-类神经网络训练不起来怎么办（三）自动调整学习率（Adaptive Learning Rate）

上一篇文章2-3 李宏毅2021春季机器学习教程-类神经网络训练不起来怎么办（二）批次与动量（Batch and Momentum）

介绍了机器学习时训练神经网络的第二个策略：批次与动量。下面介绍第三个策略：自动调整学习率。

在训练一个Network时，critical point其实不一定是你会遇到的最大的障碍，今天要告诉大家的是一个叫做Adaptive Learning Rate的技术，给每一个参数不同的learning rate。

Training stuck ≠ Small Gradient

Wait a minute

Training can be difficult even without critical points

Different parameters needs different learning rate

Root mean square

Adagrad

RMSProp

Adam: RMSProp + Momentum

Learning Rate Scheduling

Warm Up

Summary of Optimization

Training stuck ≠ Small Gradient

大部分人相信训练受阻是因为参数到达了critical point附近。但是critical point不一定我们训练过程中最大的阻碍。为什么？

如上图所示，横轴代表参数update的次数。往往我们在训练一个network的时候，会把loss记录下来，随着你参数不断的update，这个loss会越来越小，最后就卡住了，你的loss不再下降。那多数时候，大家会说是不是走到了critical point，因为gradient等于零的关系，所以我们没有办法再更新参数，但是真的是这样吗？

当走到critical point时，意味着gradient非常的小，但是当loss不再下降的时候，gradient真的很小吗？其实多数时候我们都没有确认过这件事，而事实上在今天李宏毅老师show的这个例子里面，当loss不再下降的时候，gradient并没有真的变得很小。

上图第二行是gradient的norm，即gradient的长度，随着参数更新的时候的变化，你会发现说虽然loss不再下降，但是gradient的大小并没有真的变得很小。这样子的结果其实也不难猜想，也许你遇到的是这样子的状况。

上图是error surface，然后你现在的gradient，在error surface山谷的两个谷壁间不断来回的震荡。这个时候loss不会再下降，所以你会觉得它到了critical point，卡到了saddle point或者local minima吗？不是的，它的gradient仍然很大，只是loss不见得再减小了。所以你要注意，当你今天训练一个network，发现loss不再下降的时候，不要随便说卡在local minima、saddle point，有时候根本两个都不是，你只是单纯的loss没有办法再下降。

就是为什么在作业2-2，需要算一下gradient的norm，然后算一下是卡在saddle point还是critical point，因为多数的时候，当你说你训练卡住了，很少有人会去分析卡住的原因。

Wait a minute

有的同学就会有一个问题，如果我们在训练的时候，很少卡到saddle point或者是local minima，那这一个图是怎么做出来的呢?

我们上次有画过这个图，是说我们训练一个Network，训练到参数在critical point附近，然后我们再来根据eigen value的正负号，来判断说这个critical point是saddle point还是local minima。实际上训练时，要走到saddle point或者是local minima，是一件困难的事情。

那这边告诉大家一个秘密，这个图你要训练出这样的结果，训练到参数很接近critical point，用一般的gradient descend其实是做不到的，因为在gradient还很大的时候，loss就已经掉了下去，这个需要特别方法的训练。所以做完这个实验以后，李宏毅老师更感觉要走到一个critical point其实是困难的一件事，多数时候training在还没有走到critical point的时候就已经停止了，那这并不代表critical point不是一个问题。目前用gradient descend来optimization时，我们真正应该要怪罪的对象往往不是critical point，而是其他的原因。

Training can be difficult even without critical points

如果今天critical point不是问题的话，为什么我们的training会卡住呢？这边看一个非常简单的error surface。

我们只有两个参数w和b，这两个参数值不一样的时候，Loss的值不一样，我们就画出了一个error surface，这个error surface的最低点在黄色X这个地方，事实上，这个error surface是convex的形状(convex optimization常翻译为“凸优化”)。

它的等高线是椭圆形的，只是它在横轴的地方，它的gradient非常的小，它的坡度的变化非常的小，非常的平滑，所以这个椭圆的长轴非常的长，短轴相对之下比较短，在纵轴的地方gradient的变化很大，error surface的坡度非常的陡峭。

那现在我们要从黑点（初始的点）来做gradient descend。你可能觉得说，这个convex的error surface，做gradient descend，不就是一路滑下来，然后可能再走过去吗，应该是非常容易。你实际上自己试一下，你会发现形状这么简单的error surface用gradient descend，都不见得能把它做好。举例来说这是李宏毅老师自己试了一下的结果。

（1）如上图左侧，learning rate=10⁻²时，参数在山谷山壁的两端不断的震荡，loss掉不下去，但是gradient其实仍然是很大的。那可能因为你learning rate设太大了，learning rate决定了我们update参数的时候步伐有多大，learning rate显然步伐太大，你没有办法慢慢地滑到山谷里面，只要把learning rate设小一点，不就可以解决这个问题了吗？事实不然。

（2）上图右侧，调learning rate，从10⁻²一直调到10⁻⁷，调到10⁻⁷以后，终于不再震荡了。但是你发现这个训练永远走不到终点，因为learning rate太小了，竖直往上这一段这个很斜的地方，因为这个坡度很陡（gradient的值很大），还能够前进一点，左拐以后这个地方坡度已经非常的平滑了，这么小的learning rate根本没有办法再让我们的训练前进。事实上在左拐这个地方，看到这边一大堆黑点，这边有十万个点，但是都没有办法靠近local minima，所以显然就算是一个convex的error surface，用gradient descend也很难train。

这个convex的optimization的问题，确实有别的方法可以解。但是你想想看，如果今天是更复杂的error surface，gradient descend是你唯一可以仰赖的工具，但是gradient descend连这么简单的error surface都做不好，“一室之不治，何以天下国家为”，那如果难的问题，它又怎么有可能做好呢？所以我们需要更好的gradient descend的版本，在之前我们的gradient descend里面所有的参数都是设同样的learning rate，这显然是不够的，learning rate它应该要为每一个参数定制化，所以接下来我们就是要讲，定制化的learning rate怎么做到这件事情？

Different parameters needs different learning rate

那我们要怎么定制化learning rate呢，我们不同的参数到底需要什么样的learning rate呢？

从刚才的例子里面，我们可以看到一个大原则，如果在某一个方向上gradient的值很小，非常的平坦，那我们会希望learning rate调大一点，如果在某一个方向上非常的陡峭，坡度很大，那我们期待learning rate可以设得小一点。

我们要改一下gradient descend原来的式子，只放某一个参数update的式子（之前往往是讲所有参数update的式子），完全可以把这个方法推广到所有参数的状况。

我们只看一个参数，这个参数叫θᵢᵗ（第t个iteration的值），它减掉learning rate η乘以gᵢᵗ（在第t个iteration，即θ等于θᵗ的时候，参数θᵢ对loss的微分），表达式为：

这是我们原来的gradient descend，learning rate是固定的。

现在我们要有一个随着参数客制化的learning rate，我们把原来的η除以σᵢᵗ，表达式为：

我们就有一个parameter dependent的learning rate，接下来我们看看这个parameter dependent的learning rate有什么常见的计算方式。

Root mean square

一个常见的类型是算gradient的Root Mean Square，计算的步骤如下：

现在参数要update的式子，我们从θᵢ⁰初始化参数减掉gᵢ⁰乘上learning rate η除以σᵢ⁰，就得到θᵢ¹，此时σᵢ⁰是第一次update参数，通过(gᵢ⁰)²开根号求解。

这个是第一步的状况。重点是接下来怎么处理，那θᵢ¹也一样，减掉gradient gᵢ¹乘上η除以σᵢ¹，σᵢ¹就是我们之前所有计算出来的gradient的平方的平均再开根号，是(gᵢ⁰)²加上(gᵢ¹)²乘以½再开根号，这个就是Root Mean Square，我们算出σᵢ¹后，我们的learning rate就是η除以σᵢ¹，然后把θᵢ¹减掉η除以σᵢ¹乘以gᵢ¹ 得到θᵢ²求解公式如下：

同样的操作就反覆继续下去，到第t + 1次update参数的时候，σᵢᵗ就是过去所有的gradient，gᵢᵗ从第一步到目前为止所有算出来的gᵢᵗ的平方和，再平均，再开根号，一般的表达式为：

然后把learning rate除以它，得到新的learning rate来update你的参数。

Adagrad

那这一招被用在一个叫做Adagrad的方法里面，为什么这一招可以做到坡度比较大的时候learning rate就减小，坡度比较小的时候learning rate就放大呢?

如上图，假设现在我们有两个参数θᵢ¹ 和θᵢ²，θᵢ¹坡度小，而θᵢ²坡度大。θᵢ¹因为它坡度小，所以在θᵢ¹上算出来的gradient值都比较小，然后这个σ是gradient的平方和取平均再开根号，所以算出来的σ就小，learning rate就大。

反过来说θᵢ²是一个比较陡峭的参数，在θᵢ²这个方向上loss的变化比较大，所以算出来的gradient都比较大，σ就比较大，learning rate就小，你在update的时候，你的参数update的量就比较小。

所以有了σ这一项以后，你就可以随着每一个参数的gradient的不同，来自动的调整learning rate的大小，那这个并不是你今天会用的最终极的版本，接下来看RMSProp。

RMSProp

我们刚才的假设好像是同一个参数的gradient的大小就会固定是差不多的值，但事实上并不一定是这个样子的，刚才那个版本，同一个参数的learning rate也会随着时间而改变。

举例来说我们来看，这个新月形的error surface：

如果我们考虑横轴（水平线方向）的话，在绿色箭头这个地方坡度比较陡峭，所以我们需要比较小的learning rate。但是到了红色箭头的时候，坡度又变得平滑了起来，就需要比较大的learning rate，所以就算是同一个参数同一个方向，我们期待learning rate是可以动态调整，于是就有了一个新的招数，叫做RMS Prop。

RMS Prop这个方法有点传奇，它传奇的地方在于它找不到论文，应该是将近十年前，Hinton在Coursera上开过deep learning的课程，那个时候他在里面讲了RMS Prop这个方法，然后这个方法没有论文，所以你要cite的话，你要cite那个影片的链接。让我们看看吧。

如上图所示，①RMS Prop的第一步跟Root Mean Square（那个Apagrad的方法）是一模一样的。

②第二步一样要算出σᵢ¹，只是我们现在算出σᵢ¹的方法跟算Root Mean Square的时候不一样，在算Root Mean Square时，每一个gradient都有同等的重要性，但在RMS Prop里面，你可以自己调整，你觉得它有多重要。

在RMS Prop里，我们这个σᵢ¹是(σᵢ⁰)²乘上α加上(1-α)乘上现在我们刚算出来的gᵢ¹，那这个α就像learning rate一样，你要自己调它，它是一个hyperparameter。如果α设很小趋近于0，就代表我觉得gᵢ¹相较于之前所算出来的gradient而言，比较重要；如果α设很大趋近于1，那就代表我觉得现在算出来的gᵢ¹比较不重要，之前算出来的gradient比较重要。

③同理在第三次update参数的时候，我们要算σᵢ² ，把σᵢ¹拿出来取平方再乘上α，那σᵢ¹里面有gᵢ¹跟σᵢ⁰ ，σᵢ⁰里面又有gᵢ⁰，所以你知道σᵢ¹里面有gᵢ¹和gᵢ⁰，然后这个gᵢ¹跟gᵢ⁰呢他们会被乘上α，然后再加上1-α乘上这个(gᵢ²)²，所以这个α就会决定说gᵢ²在整个σᵢ²里面占有多大的影响力。

那同样的过程就反覆继续下去，σᵢᵗ等于根号[α乘上(σᵢᵗ⁻¹)²加上(1-α)乘上 (gᵢᵗ)²]，用α来决定现在刚算出来的gᵢᵗ有多重要，gᵢᵗ相较于之前存在σᵢᵗ⁻¹里面的gᵢᵗ到gᵢᵗ⁻¹而言，它的重要性有多大。如果用RMS Prop的话，你就可以动态调整σ这一项，我们现在假设从这个地方开始。

上图黑线是我们的error surface，从①开始update参数，这个球就从①走到②，那因为一路上都很平坦，代表说g算出来很小，那我们会走比较大的步伐。接下来继续滚，滚到③以后gradient变大了，如果不是RMS Prop，原来的Adagrad的话它反应比较慢，但如果你用RMS Prop，然后把α设小一点，让新的gradient影响比较大的话，那你就可以很快的让σ的值变大，也可以很快的让你的步伐变小。

你就可以踩一个煞车，本来很平滑走到这个地方，突然变得很陡，那RMS Prop可以很快的踩一个煞车，把learning rate变小，如果你没有踩剎车的话，你走到这里这个地方，learning rate太大了，那gradient又很大，两个很大的东西乘起来，你可能就很快就飞出去了，飞到很远的地方。

如果继续走，又走到平滑的地方④，因为这个σᵢᵗ 你可以调整α，让它比较看重于最近算出来的gradient，所以你gradient一变小，σ可能就反应很快，它的这个值就变小了，然后走的步伐就变大了，这个就是RMS Prop。

Adam: RMSProp + Momentum

那今天你最常用的optimization的策略，也叫做optimizer，今天最常用的optimization的策略，就是Adam。

Adam就是RMS Prop加上Momentum，那Adam的算法跟原始的论文链接为https://arxiv.org/pdf/1412.6980.pdf。

在pytorch里面optimizer这个deep learning的套件，往往都帮你做好了，所以我们不用担心这种optimization的问题，但也有一些参数需要调，有一些hyperparameter需要人工决定，但是往往用预设的参数就好了，自己调有时候会调到比较差的。在pytorch里面，Adam这个optimizer预设的参数不要随便调，使用默认参数可以得到不错的结果了，关于Adam的细节，就留给大家自己研究。

补充：Adam可以参考这篇2-2 Coursera吴恩达《改善深度神经网络》第二周课程笔记-优化算法的2.8节Adam优化算法讲解。

Learning Rate Scheduling

我们刚才讲说这个简单的error surface训练不起来，现在我们加上Adaptive Learning Rate以后，能不能训练得起来？

采用最原始的Adagrad做法，learning rate把过去看过的gradient通通都平方再平均再开根号当作这个σ ，做起来是上图这个样子的。这个走下来没有问题，然后接下来在左转的时候，红色圆圈也是update了十万次，之前update了十万次会卡在左转这个地方。那现在有Adagrad后，可以再继续走下去，走到非常接近终点的位置。当你走到这个地方的时候，因为左右方向的gradient很小，所以learning rate会自动调整左右这个方向的，learning rate会自动变大，所以你这个步伐就可以变大，就可以不断的前进。接下来的问题就是，为什么快走到终点的时候突然爆炸了呢？

我们在做这个σ的时候，是把过去所有看到的gradient都拿来作平均，所以纵轴的方向，在这个初始的这个地方，感觉gradient很大，可是这边走了很长一段路以后，这个纵轴的方向，gradient算出来都很小，所以这个y轴的方向就累积了很小的σ，累积到一个地步以后，这个step就变很大，然后就爆走就喷出去了。

喷出去以后没关系，有办法修正回来，因为喷出去以后，就走到了这个gradient比较大的地方，σ又慢慢的变大，参数update的步伐就慢慢的变小。你就发现说走着走着，突然往左右喷了一下，但是这个喷了一下不会永远就是震荡，不会做简谐运动停不下来，这个力道慢慢变小，有摩擦力让它慢慢地又回到中间这个峡谷来，但是累计一段时间以后又会喷，然后又慢慢地回来。怎么办呢？有一个方法也许可以解决这个问题，这个叫做learning rate的scheduling。

Learning Rate Scheduling

我们刚才的η是一个固定的值，learning rate scheduling指不要把η当一个常数，而是把它跟时间练联系起来。最常见的策略叫做Learning Rate Decay，随着时间的不断地进行，参数不断update，我们让η越来越小，那这个也就合理了。因为一开始我们距离终点很远，随着参数不断update，距离终点越来越近，learning rate减小让我们参数的更新踩了一个刹车，更新能够慢慢地慢下来，所以刚才那个状况，如果加上Learning Rate Decay有办法解决。我们就可以很平顺的走到终点，因为后期越靠近终点，η越小，虽然说它本来想要左右乱喷，但是因为乘上这个非常小的η，就可以慢慢地走到终点。

Warm Up

除了Learning Rate Decay以外，还有另外一个经典的常用Learning Rate Scheduling方式，叫做Warm Up。

Warm Up这个方法听起来有点匪夷所思，它让learning rate要先变大后变小，那变大要变到多大呢，变大速度要多快呢，小速度要多快呢？这个也是hyperparameter，要自己用手调的。那这个方法听起来很神奇，就是一个黑科技，这个黑科技出现在很多远古时代的论文里面。

最近因为在训练BERT的时候，往往需要用到Warm Up，所以又被大家常常拿出来讲，但它并不是有BERT以后才有Warm Up的，这东西远古时代就有了，举例来说，Residual Network里面是有Warm Up的。

如上图，Residual network在arXiv上面的链接点这里，今天这种有关machine learning 的文章往往在投conference之前，投国际会议之前，就先放到一个叫做arXiv的网站上，把它公开来让全世界的人都可以看。residual network这篇文章是2015年年底放在arXiv上面的。在deep learning变化这么快速的领域里面，五六年前就是上古时代，Residual Network里面就已经记载了Warm Up，它说先用learning rate 0.01，再把learning rate改成0.1。

用过去我们通常最常见的训练Learning Rate Scheduling的方法，就是让learning rate越来越小，但是Residual Network反其道而行，一开始要设0.01 ，接下来设0.1，还特别加一个注解（一开始就用0.1反而train不好），不知道为什么也没解释，反正就是train不好，需要Warm Up这个黑科技。

而在这个黑科技，在知名的Transformer里面(这门课也会讲到)，论文也用一个式子提了它。式子说它的learning rate遵守这一个神奇的function来设定它的learning rate。实际上，把这个function画出来的话，会发现它就是Warm Up，learning rate会先增加，然后接下来再递减。

其实你发现说Warm Up这个技术，在很多知名的network里面都有，被当作一个黑科技，论文里面不解释说为什么要用这个，但就在一个你没有注意到的小地方说这个network要用这种黑科技，才能够把它训练起来。那为什么需要warm Up呢，这个仍然是今天可以研究的问题。

这边有一个可能的解释是说，你想想看当我们在用Adam RMS Prop或Adagrad的时候，我们会需要计算σ，它是一个统计的结果，σ告诉我们，某一个方向它到底有多陡或者是多平滑，那要看得够多笔数据以后这个统计才精准。一开始我们的统计是不精准的，所以我们一开始learning rate比较小，一开始不要让我们的参数，走离初始的地方太远，先让它在初始的地方探索，收集一些有关error surface的情报，先收集有关σ的统计数据，等σ统计得比较精准以后，再让learning rate爬升。这是一个解释，为什么我们需要warm up的可能性。

那如果你想要学更多warm up的话，你其实可以看一篇paper，它是Adam的进阶版叫做RAdam，其中对warm up有更多的理解。那有关optimization的部分，我们就讲到这边啦。

Summary of Optimization

我们从最原始的gradient descent，进化到这一个版本。

（1）这个版本里面我们有Momentum，现在不是完全顺着gradient的方向来update参数，而是把过去所有算出来gradient的方向，做一个加总当作update的方向。（2）接下来应该要update多大的步伐呢，我们要除以gradient的Root Mean Square。那讲到这边可能有同学会觉得很困惑，momentum和σ都考虑过去所有的gradient，一个放在分子一个放在分母，不就是正好抵销了吗？但其实它们使用过去所有gradient的方式是不一样的，Momentum是直接把所有的gradient通通都加起来，所以它有考虑方向，它有考虑gradient的正负号，它有考虑gradient是往左走还是往右走；但是这个Root Mean Square，它就不考虑gradient的方向了，它只考虑gradient的大小，我们在算σ的时候都要取平方项，只考虑gradient的大小，不考虑它的方向，所以Momentum跟这个σ，算出来的结果并不会互相抵销掉。（3）那最后我们还会加上一个learning rate scheduling。

那这个是今天optimization的完整的版本了，这种Optimizer，Adam可能是今天最常用的，但除了Adam以外，还有各式各样的变形，但其实各式各样的变形都不错，就是不同的方法算M，不同的方法算σ，不同的Learning Rate Scheduling的方式。

那如果你想要知道更多跟optimization有关的事情的话，那有之前助教的录像，给大家参考到这里（上图所示）。

到目前为止我们讲的是error surface非常崎岖的情况，就像下面这个例子。

我们需要一些比较好的方法来做optimization，前面有一座山挡着，我们希望可以绕过那座山，山不转路转的意思这样，你知道这个gradient，这奇怪的error surface，会让人觉得很痛苦。那就要用神罗天征，把这个炸平成右边的样子，所以接下来我们会讲的技巧，就是有没有可能直接把这个error surface移平，通过改Network里面的什么东西，改Network的架构activation function，或者是其他的东西，直接移平error surface，让它变得比较好train，也就是山挡在前面，就把山直接铲平的意思。这些技巧之后会讲解。

说明：记录学习笔记，如果错误欢迎指正！写文章不易，转载请联系我。

你可能感兴趣的:(李宏毅机器学习笔记,笔记,AI,神经网络,人工智能,深度学习,python,机器学习)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
每日一题——第八十九题互联网打工人no1 C语言程序设计每日一练 c语言
题目：在字符串中找到提取数字，并统计一共找到多少整数，a123xxyu23&8889，那么找到的整数为123，23，8889//思想：#include#include#includeintmain(){charstr[]="a123xxyu23&8889";intcount=0;intnum=0;//用于临时存放当前正在构建的整数。boolinNum=false;//用于标记当前是否正在读取一个整
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
每日一题——第八十一题互联网打工人no1 C语言程序设计每日一练 c语言
打印如下图案:#includeintmain(){inti,j;charch='A';for(i=1;i<5;i++,ch++){for(j=0;j<5-i;j++){printf("");//控制空格输出}for(j=1;j<2*i;j++)//条件j<2*i{printf("%c",ch);//控制字符输出}printf("\n");}return0;}
每日一题——第八十二题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将一个控制台输入的字符串中的所有元音字母复制到另一字符串中#include#include#include#include#defineMAX_INPUT1024boolisVowel(charp);intmain(){charinput[MAX_INPUT];charoutput[MAX_INPUT];printf("请输入一串字符串：\n");fgets(input,sizeof(inp
每日一题——第八十三题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将输入的整形数字输出,输出1990，输出"1990"#include#defineMAX_INPUT1024intmain(){intarrr_num[MAX_INPUT];intnum,i=0;printf("请输入一个数字：");scanf_s("%d",&num);while(num!=0){arrr_num[i++]=num%10;num/=10;}printf("\"");for(
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
拥有断舍离的心态，过精简生活--《断舍离》读书笔记爱吃丸子的小樱桃
不知不觉间房间里的东西越来越多，虽然摆放整齐，但也时常会觉得空间逼仄，令人心生烦闷。抱着断舍离的态度，我开始阅读《断舍离》这本书，希望从书中能找到一些有效的方法，帮助我实现空间、物品上的断舍离。《断舍离》是日本作家山下英子通过自己的经历、思考和实践总结而成的，整体内涵也从刚开始的私人生活哲学的“断舍离”升华成了“人生实践哲学”，接着又成为每个人都能实行的“改变人生的断舍离”，从“哲学”逐渐升华成“
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h