weixin_34190136

AndrewNG Deep learning课程笔记

神经网络基础

Deep learning就是深层神经网络

神经网络的结构如下，

这是两层神经网络，输入层一般不算在内，分别是hidden layer和output layer

hidden layer中的一个神经元的结构如下，

可以看出这里的神经元结构等同于一个逻辑回归单元，神经元都是由线性部分和非线性部分组成

非线性部分，又称为激活函数，这里用的是sigmod，也可以用其他，比如relu或tanh

为什么要用激活函数？

因为既然要用神经网络去拟合任意function，光用线性拟合是不行的，因为再多层的线性函数叠加完了，还是线性函数，永远拟合不了非线性函数

所以激活函数就赋予了神经网络，非线性的能力

各种激活函数，参考，

聊一聊深度学习的activation function，https://zhuanlan.zhihu.com/p/25110450

这种简单的神经网络，称为前馈神经网络，直接理解，计算时是从输入层，逐层前馈计算的

而每层的参数w，b就是训练学习的对象

而训练学习参数的过程，会用到反向传播算法

训练首先要确定优化目标，loss(error) function，然后就是让各个参数沿着梯度方向下降，以达到最优点

这里注意，cost function，意思是 average of the loss function of entire training set，概念不要混

在神经网络中求导，用的就是反向传播算法，就是链式求导，比如，要算dw，先算da，再算dz，最后链式求导到dw

这里需要注意的是每层参数w，b的shape，如下图，

为什么需要深层网络?

直观上看，深层网络，可以逐步提取从简单到复杂的各层的features

深层网络在每层的节点数，要大大小于浅层网络

ok，现在深度神经网络的结构讲完了

实际中，怎么去debug和调优一个网络？

先需要明确一些概念，

训练集，开发集，测试集

先要把数据集分开，一部分用于训练，一部分用于验证，这里有可以分dev和test，也可不分

Bias and Variance

优化的效果，可以用bias和variance来衡量，并找出模型的问题点

上面这个图，比较容易理解，

high bias，对训练集拟合不够好，模型太简单

high variance，模型过于复杂，过拟合训练集

所以在评价一个模型时，要同时给出，train set error和dev set error

train set error高就是high bias

dev set error高就是high variance

注意这里的假设是基于human准确率的，如果human判断也只能到15% error，那么train set error达到15%，也不能说是high bias

对于high bias，相对容易解决些，比如调整网络结构，用更复杂的网络，或增加训练时间和迭代次数

但是对于high variance，怎么解决，相对困难些，比如增加训练集，这个往往代价较高

正则化

解决high variance主要的方法，是正则化技术，Regularization

参考下图，正则化其实就是在cost function里面，加上罚项，或范数

这里又可以分为L2，L1，范数

我们优化的目的是让cost function达到最小，那么对于罚项而言，最小就是为0，

所以加上罚项的效果，就是会让某些w参数趋向0，即让w矩阵更加稀疏，而超参数，lambda决定罚项对整个优化的影响程度

L1，L2的不同在于，L1会让某些w参数直接等于0，而不是趋于0

这样做的理论依据是，奥卡姆剃刀(Occam's razor)原理，尽量选择更为简单的模型

这里的L2范数，用的比较多，又称为Frobenius norm(弗罗贝尼乌斯范数)，也称为权值衰减weight decay

因为对于L2范数，梯度下降时，权值w会乘上一个小于1的系数，所以称为权值衰减

Regularization为何可以解决high variance的问题？

high variance的问题是因为模型过于复杂，而over fit训练集导致的

而正则化的结果，是某些w参数趋向于0，这等同于网络中的某些节点接近于失效，即简化了模型的复杂度

从另一个角度理解，

当w很小的时候，对于激活函数的z，也会是个较小的值，对于tanh或sigmod这样的激活函数，在这个区间会更加接近线性关系

所以很多w趋于0的时候，会让整个网络更趋向线性，所以会降低过拟合的程度

Dropout Regularization

dropout的思路比较简单，在训练时，每次迭代都随机的disable掉一些节点，以防止过耦合

dropout的效果，取决于keep-prob这个超参数，比如keep-prob=0.8，80%的概念会保留这个节点

如下图，我们可以对不同的layer设置不同的keep-prob，以解决某些layer的过拟合问题

具体的实现，如下介绍inverted dropout

比如对于第三层的输出a3，如果第三层有5个节点，我们需要决定哪些节点dropout，那么该节点的输出为0

这里直接用random和keep-prob比较，来判断是否需要dropout

关键点是，最终a3需要除以keep-prob值，把dropout掉的输出值补回来，所以称为inverted dropout

这样做的目的是，保证虽然在dropout时，不改变a3的期望，因为dropout只有在train的时候，在test的时候并不会去dropout

drop之所以可以起效果的原因还是比较直观的，因为他训练时减少了节点数，降低了模型的复杂度

从另一个方面看，由于train的时候，任意的节点都可能被dropout，所以模型会趋向避免过于依赖某个节点的输出，这样会让w产生L2，平方范数类似的效果

Early stopping

思路就是在做优化时，同时考虑train error 和 dev error

在dev error没有明显变差前，停止优化

Early stopping的问题在于，无法正交的解决bias和variance的问题，做优化的时候需要同时考虑train error和dev error，所以增加优化时的复杂度

但是好处就是，不需要像L2一样尝试那么多的超参数lambda，只需要一次梯度下降的过程

Normalizing inputs

在实际数据中，各个特征会有很大的差异，比如有些的取值范围0~1，有些1~10000，这样对于优化函数非常不友好

所以为了更快更高效的进行train，需要对input做normalize操作

如图，很清晰，通过normalization，每个维度的数据都会达到，均值0，方差1

这里需要注意的是，如果对train数据进行normaliztion，那么需要用相同的参数对测试集进行normalization

下图更形象的表示，为何input normalization会对优化算法更为友好

梯度消失和爆炸

为了更直观的解释消失和爆炸的问题，这里NG用激活函数作为例子，

这里如果激活函数直接是，g(z)=z，且b=0，那么对于deep网络，第l层的输出，如上图，就是这样一个W的连乘形式

这里很容易看出，如果w是个比1大的数据，经过L层指数级增长后，会是个很大的值，那如果w比1小，结果就是会趋向于0

这里虽然是用激活函数来描述，其实对于梯度也是一样的，因为求梯度的时候是链式求导

梯度消失问题一直是阻碍deep learning的网络层数的因素，

如果我们更好的选择随机初始化参数，可以有效的缓解这个问题，

Xavier initialization，思路就是让输入和输出的方差一致，所以让var(w) = 1/n

为什么是1/n，NG没有说的太清楚，可以参考这里的推导，

CNN数值——xavier，https://zhuanlan.zhihu.com/p/22028079

对于，relu，使用He initialization，即var(w)=2/n，具体参考，聊一聊深度学习的weight initialization，https://zhuanlan.zhihu.com/p/25110150

说的比较清楚，

至于为何var(w) = 1/n

则w = np.random.random(shape) * np.sqrt(1/n)，再想想

梯度的数值近似

如下图，我们可以用这种双边逼近的方式来近似梯度

这有什么用？那我们可以用forward propagation，来检查我们的backward propagation是否实现的对

对于特定参数W，针对X，Y，可以通过backward propagation计算DW

参数W是由，w1,w2,w3,......，若干参数组成，现在可以用forward(w2+e)，forward(w2-e)，来计算出dw2的近似值，从而和dw2去比较，来看看backward是否算的对

优化算法

参考这篇知乎文章对优化算法的总结，

Adam那么棒，为什么还对SGD念念不忘，https://zhuanlan.zhihu.com/p/32230623

bath，mini-bath，stochastic

差别就是每次梯度下降过程是用整个train set，还是只用一个数据样本，还是用一个子集

显然，用到数据越多，梯度下降的稳定性越好，但性能会约差，所以是个balance，一般都会取中，用一个不大不小的mini-batch

指数加权平均

因为后续说的算法大都基于指数加权平均的想法，所以先介绍一下

指数加权平均的公式如下，

其中B作为参数，如果越大，会导致曲线越稳定，但是对变化反应会约慢

可以认为，指数加权平均约等于1/(1-b)个时刻值的平均

下图中，红色线代表参数为0.9（10个值平均），绿色线表示参数为0.98（50个值平均），黄色表示参数为0.5（2个值）

只所以叫指数加权，是因为当前值，对平均值的影响会呈现指数级别的衰减，如下图

加权指数平均好处是，计算时只需存一个值，比较简单，而不需要保留之前所有的值

然后它在开始时，有个bias的问题（这个问题也可以忽略掉，因为只要挨过冷启动就好）

因为如果初始值v0=0，刚开始的值会比较小

方法就是，将Vt除上1-Bt，这样在t比较小的时候，会对Vt有个明显的放大，以弥补初始值为0的问题

Momentum梯度下降

如下图，普通梯度下降的问题是，会有比较明显的oscillation，这样降低学习效率，而且无法使用比较大的学习率，如图中蓝色的线

我们希望降低oscillation，这里可以用指数加权平均

因为是平均，所以在竖轴上的来回波动会平均掉，剩下就是在横轴上的更快速的梯度下降

另一种理解动量momentum的方式，一个正在滚动的球，具有惯性，你只能不断的施加外力去修正滚动的方向，而不能大幅突然转向

最终公式如下，

对梯度进行指数加权平均，最终用加权平均值来更新参数

这里增加一个超参数，Beta

RMSprop (Root Mean Square)

和momentum类似，也是为了消除oscillation

先算出梯度平方的指数加权平均，mean square

然后在更新参数的时候，dw会除上mean square的root

这样之所以有用，因为往往产生oscillation的维度的梯度都会比较大，如果不是那么普通优化算法也可以快速收敛

产生的效果就是，压缩产生oscillation维度的梯度更新幅度，放大有效维度的梯度更新幅度

这里又产生两个超参数，Beta2，以和momentum区别

epsilon，用于防止分母为0

Adam (Adaptive Moment Estimation）

Adam是非常通用和高效的算法，

思路就是把momentum，rmsprop结合起来

先用指数加权平均，算出Vdw和Sdw

然后去bias，消除冷启动

更新参数时，将momentum带入rmsprop的公式，

这个算法有较多的超参数，

alpha，beta1，beta2， epsilon

学习率alpha仍然是比较重要的，需要tune的参数

Learning Rate Decay

这也是一种加快学习和收敛速度的方法，

思路，开始的时候采用较大的学习率，这样可以快速逼近，但快接近收敛的时候，需要用较小的学习率，否则会来回波动

用这种方式，随着epoch的增大，学习率alpha会慢慢减小

Local Optima

在高维空间中，其实local optima的问题是不存在的，

因为在高维空间中碰到的都是saddle point，而不是local optima，因为几万维在一个点同时都是凹或凸的概念很小，一般都是部分凹，部分凸

对于saddle point的问题是plateau，稳定阶段，因为这里梯度接近0，收敛会非常的慢，需要花费很长时间

这时优秀的优化算法，如adam，可以帮助你快速走出plateau

Hyperparameters

常见的超参数如图，

红色的，学习率，往往是最重要的

黄色的，Beta（momentum），隐层的节点数，mini-batch大小，可以放在第二优先级进行调优

紫色的，网络层数，学习率的decay，第三优先级

而搜索最优超参数的策略，

现在整个空间，随机选取，找到较优的参数，然后缩小搜索空间，继续更细粒度的搜索

在随机选取hyperparameter时，还需要考虑scale的问题

比如，如果是选择layer或节点数，那么用linear scale都是没问题的

但是如果是学习率alpha，取值范围0.0001到1

如果用linear scale，那么90%的值都会选在0.1到1之间，这样就不合适

所以要用log scale，让0.0001，0.001，0.01，0.1，1之间可以均匀的取值

对于momentum的参数Beta也有同样的问题，取值0.9到0.999

这里的技巧是，对1-beta采用log scale

这样做的理由，因为Beta在越靠近1的时候约敏感

B=0.9的时候，大概可以影响10个t的平均值，所以0.9005，也差不多是10个t，没啥影响

B=0.999的时候，大概可以影响1000个t，当如果变成0.9995，就会影响到2000个t，这个变化是很显著的

Batch Normalization

这篇知乎文章可以参考，

详解深度学习中的Normalization，不只是BN，https://zhuanlan.zhihu.com/p/33173246

前面已经提到，为了加快优化的速度，会对inputs做normalization

那自然的想法，是不是对每层的输入都做normalization，也会对加快优化速度

具体做法，直接用paper中的公式，

只所以叫batch normalization，因为每次normalization是针对一个mini-batch的，针对一个mini-batch中所有的X求出mean和variance，算出Xnorm

对于Xnorm，是mean=0，variance=1的分布

注意，最后还有一步，scale and shift，奇怪刚normalization完，怎么又shift回去了？

原因，

首先，这里的shift的参数r和beta是要通过学习优化的，所以这里赋予模型更大的自由度，你可以shift回原先的分布，也可以用任意的分布

再者，由于normalization在调用激活函数前，如果所有的输出都是mean=0，variance=1，对于像sigmod，tanh这样的函数，这个区域都是近似线性的区域，会限制模型的能力

那么将BN用于DL中，如下图

进行BN是在激活函数前，这样每层参数除了W，B，又多了beta，r

这里因为会对z做normalization，所以B无论啥值，最终都是会被消去的，所以这里的参数，可以把B去掉

为什么BN会有效？这个其实比较复杂

首先理解，Internal Covariate Shift，啥意思

NG给了个例子，你用全是黑猫的训练集训练模型，而测试集里面是各种颜色的猫，效果一定不会太好

而黑猫到彩色猫的这种数据变化，就叫Covariate Shift

用知乎上的定义，

意思是，他们虽然都是符合一种分布，但是他们本身出现的概率不同

比如，我这次从上层得到的input都是黑猫的，我根据黑猫做了参数调优，然后下次过来的input又变成彩色猫，那可能参数要发生很大的改变

结果就是导致，

深度神经网络涉及到很多层的叠加，而每一层的参数更新会导致上层的输入数据分布发生变化，通过层层叠加，高层的输入分布变化会非常剧烈，这就使得高层需要不断去重新适应底层的参数更新

那BN的作用，就是限制每层输入的分布变化，让每层可以相对独立的对参数进行优化，而不会太过于受到上层输入的影响

虽然输入不一定是mean=0，variance=1那么规范，但毕竟通过beta和r是会被限定在某一分布内

BN除了可以使得参数训练更快速和稳定，

还能有效解决梯度消失问题，因为BN会将input调整到0附近，这样对于sigmod或tanh就不那么容易梯度消失

还附带一些regularization的效果

最后需要注意的是，

在test阶段，

没有mini-batch，如何得到normalization时需要的mean和variance

答案是用train时，所以mini-batch得到的mean和variance的平均值

DL Strategy

orthogonalization，正交化

说白了，一次只独立优化一个指标，让目标和方法更明确

一个knob，同时调整音量和亮度，是不是很confuse，同样同时调整bias和variance也是一样很confuse

如下图，在不同阶段的问题，我们用独立的方法去解决和优化

single number evaluation metrics

比如你评估一个算法好坏，用prision和recall，两个指标不好比较，所以用F1-score

satisficing and optimizing metrics

如果一个算法，需要同时考虑很多指标，很难合成单一指标

那就从里面挑出一个主要的优化指标，用于优化

其他的都设成满足指标

比如将accuracy设为优化指标，运行时间等设成满足指标

Train/dev/test distributions

dev set和optimizing metrics的设定非常重要，因为这是目标

如果metrics或dev set，无法表示和代表未来实际使用的场景中的数据，要及时修正

并且dev set和test set需要同分布，最好是在同样的数据集中采样，否则在dev set上验证和优化的模型会不适用于test set

train，dev，test的比例如下，

由于对于DL，数据集往往很多，所以只需要挑10000个左右的dev和test set即可

对于很多应用，甚至可以只用dev set，并没有test set

human-level performance

Bayes optimal error是理论可以达到的最小误差

而在很多场景下，human-level performance会比较接近 bayes error

而算法的优化，在低于human-level的时候会比较有效率，而一旦超过human level，进展会很慢

原因是，超过human-level后，一般比较接近bayes error，所以上升空间不大

并且一旦超过human level，很难通过人类标注，或人类分析数据来提升模型

在知道和理解human level后，才好判断如何优化算法，

如图，虽然数据一样，但算法优化的思路是不同的

training error和human level之间差值，称为可避免误差，avoidable bias

dev error和training error之间差值，称为variance

在avoidable bias和variance之间进行比较，来判断优化哪一个

incorrectly labeled data

对于trainset中，少量的错误的label，无需关心

DL algorithm are quiet robust to random errors in the training set

而对于dev和testset中的错误，因为dev和test往往较小，所以需要修正掉

training and tesing on different distributions

前面说了，dev和test set表示优化目标，所以一定要同分布，且可以代表真实数据的分布

但是train set的分布可以不一样，原因是往往我们能找到的真实数据集比较小，如图，

我们只有比较少的来自mobile app的猫图（10000），但是有大量的来自webpages的猫图（200000）

那么如何构造数据集？

可以把200000+10000图片放一起，sample出5000作为dev和test set，但这样做的最大问题是，dev和testset的分布不能代表真实数据，所以我们优化的目标可能是错的

所以正确的方法是，从mobile app的猫图中，sample 5000张用作dev和test set，因为我们一定要保证优化的目标是正确的

但是如果training set和dev set来自不同的分布，那么我们之前的bias，variance分析方法有些问题

因为用基于training set训练好的模型去测试不同分布的dev set，如果效果不好，你很难判断是由于variance过拟合，还是由于模型没有见过dev set的数据导致

所以，这里新加一种数据集，training-dev，和training数据同分布，这样用training-dev就可以判断模型是否存在variance问题

如果dev和training-dev之间的error差很多，说明存在data mismatch问题，而不是variance问题

如果发生dev和test的error比training-dev小，这看似很不合理，说明dev和test set中的数据更为简单，比training set容易判断

那么对于data mismatch问题，如何解决？没有太系统的方法

NG的建议是，人工去分析training和devset的区别，并尽量找个更多的训练数据让training set更加逼近dev set

人工合成训练数据也是一个方法，比如合成猫的图片，在语音中加入噪音

但人工合成的问题在于，我们用的case只是所有可能性空间中的一小部分，所以容易造成过拟合

迁移学习，transfer learning

这是一个很常用的技能，使用transfer learning的场景是，

用迁移学习，往往是由于在目标场景下，缺乏足够的数据，或者为了节省模型训练时间

做法就是，把输出层换掉，用新的训练集去单独训练最后一层的参数

如果新的训练集比较多，也可以多加几层，或者多训练几层

这样做的理由是，

对于深层网络，就是一个从低级特征到高级特征不断抽象的过程

对于图像和语音，越低层的特征越容易被重用，所以把高层的layer换掉或重新训练，也会有很好的效果

multi-task learning

往往用于图像识别场景，

比如对于一张图片，我们希望同时识别，行人，车，信号灯等

注意这个和softmax不一样，softmax是单任务多元分类

在何种场景下，用多任务学习

每个任务可以share低层特征，这样放在一起可以互相帮助

每个任务的训练集都不多，这样合一块，可以解决训练集过少的问题

我们可以训练一个足够大的网络来处理多任务

End to end deep learning

这是对传统机器学习或是传统it的一种挑战，传统it很多领域都是要依赖领域专家构造或编写系统和规则来完成工作

而DL有机会打破这一现象，你只需要给出海量的训练数据，深层网络会自己去抽象和学习这些领域知识，而不需要领域专家去精心构造的规则和系统

比如对于语音识别，以前需要若干步骤，精心的调试才能达到较好的效果

而如今，直接用一个深度网络，就可以省略中间这些步骤

但是当前end to end deep learning的问题是，我们可能没有那么多的训练数据

所以在实际中，我们还是会把一个问题分解成若干个有大量训练数据的子问题

比如，门禁系统，会分成两个步骤，一是找到脸，二是比较脸

你可能感兴趣的:(AndrewNG Deep learning课程笔记)

通过外部链接启动 Flutter App(详细介绍及示例) 飞川001 Fluttter flutter xcode android studio
通过外部链接启动FlutterApp（firebase_dynamic_links和app_links）详细介绍通过外部链接启动flutterApp的使用及示例在我们的APP中，经常有点击链接启动并进入APP的需求（如果未安装跳转到应用商店）。Android通过deeplink或者applink（是deeplink的增强版），iOS通过urlschema，可以打开对应的app，因此我们需要对我们的
学习婚姻法笔记韩哲2018
本文一共1967字预计阅读4分钟婚姻法很有必要学习这篇文章可以拉男朋友女朋友丈夫老婆一起大大方方的学习本篇文章是学习得到里面余婧老师《如何用法律智慧为婚姻护航？》课程笔记比较精简想要详细学习可以得到里面学习。恋爱期间无目的赠送的价格昂贵的东西分手后是无法要回的即无条件赠与以结婚为目的性的赠送是可以要回的即附解除条件的赠与第一需要证明你的确把东西赠送出去了第二证明送东西是以结婚为目的的需要相关的人证
TensorFlow深度学习实战——DCGAN详解与实现盼小辉丶深度学习 tensorflow 生成对抗网络
TensorFlow深度学习实战——DCGAN详解与实现0.前言1.DCGAN架构2.构建DCGAN生成手写数字图像2.1生成器与判别器架构2.2构建DCGAN相关链接0.前言深度卷积生成对抗网络(DeepConvolutionalGenerativeAdversarialNetwork,DCGAN)是一种基于生成对抗网络(GenerativeAdversarialNetwork,GAN)的深度学
【转】【译】How to Handle Very Long Sequences with LSTM（LSTM RNN 超长序列处理）开始奋斗的胖子机器学习 RNN LSTM 序列深度学习
原文地址http://machinelearningmastery.com/handle-long-sequences-long-short-term-memory-recurrent-neural-networks/一个长的输入序列却只对应一个或者一小段输出就是我们经常说的序列标注和序列分类。主要包括下面一些例子：包含上千个词的文件情感分类（NLP）包含上千个时间状态的脑电痕迹分类（Medici
DeepSeekMath：突破开源语言模型在数学推理中的极限 AI专题精讲强化学习人工智能强化学习 AI技术应用
温馨提示：本篇文章已同步至"AI专题精讲"DeepSeekMath：突破开源语言模型在数学推理中的极限摘要数学推理由于其复杂且结构化的特性，对语言模型构成了重大挑战。本文介绍了DeepSeekMath7B，该模型在DeepSeek-Coder-Base-v1.57B的基础上继续进行了预训练，使用了来自CommonCrawl的120B数学相关token，同时包含自然语言和代码数据。DeepSeekM
《微习惯》之后我做了什么学晶
2017-12-17-星期日晴北京角落小的不能再小作者简介斯蒂芬·盖斯是个天生的懒虫。为了改变这一点，他开始研究各种习惯养成策略，从2004年起在美国各大自我成长类网站上发表了许多文章。2011年，他开始运营自己的博客DeepExistence，为读者提供自我成长策略方面的建议。他崇尚极简主义，喜欢打篮球和探索世界。[1]以前的以前受了很多书籍，很多文章的影响我也不断的制定年计划，月计划，周计划，
MySQL Online DDL详解:从历史演进到原理及使用 SHENKEM mysql
本文介绍了MySQLOnlineDDL的发展历史，包括各个版本的改进，重点讲解了Copy和Inplace算法，以及OnlineDDL过程中的锁策略。还分析了DDL操作的需求、MySQL5.7和8.0的功能特点，以及使用限制和注意事项。摘要生成于C知道，由DeepSeek-R1满血版支持，前往体验>❃博主首页：「码到三十五」，同名公众号:「码到三十五」，wx号:「liwu0213」☠博主专栏：♝博主
消弭大模型幻觉灰图06 人工智能
这几天，一则关于国产大模型DeepSeek使用率暴跌的传闻引发热议。据称，其用户使用率从54%骤降至3%，主要原因直指一个词：“幻觉”。或许这个数据并未被官方证实，但这场风波却准确地揭开了一个愈发严重的隐忧：我们正在与一类能力极强、却时常“胡说八道”的系统共处。而一旦这种“胡说八道”发生在医疗、法律、金融等关键领域，它所引发的，不是笑话，而是灾难。人们惊觉：这不仅是DeepSeek的危机，也是一场
Python 中的深拷贝、浅拷贝与等号赋值：理解对象复制的本质小羊苏八 python 开发语言
目录1.等号赋值（=）2.浅拷贝（copy.copy()）3.深拷贝（copy.deepcopy()）4.不可变对象与可变对象5.性能对比6.实际应用场景7.总结前言在Python中，对象的复制是一个常见的操作，但很多人对深拷贝、浅拷贝和等号赋值之间的区别感到困惑。本文将通过详细的示例和解释，帮助你深入理解这三种操作的本质和应用场景。1.等号赋值（=）在Python中，等号赋值是最基本的对象操作之
强化学习------DDPG算法 ZPC8210 算法 numpy matplotlib
一、前言DeepDeterministicPolicyGradient(DDPG)算法是DeepMind团队提出的一种专门用于解决连续控制问题的在线式(on-line)深度强化学习算法，它其实本质上借鉴了DeepQ-Network(DQN)算法里面的一些思想。论文和源代码如下：论文：https://arxiv.org/pdf/1509.02971.pdf代码：https://github.com/
KAIST：LLM混合递归推理大模型任我行大模型-推理优化人工智能自然语言处理语言模型论文笔记
标题：Mixture-of-Recursions:LearningDynamicRecursiveDepthsforAdaptiveToken-LevelComputation来源：arXiv,2507.10524摘要缩放语言模型解锁了令人印象深刻的能力，但伴随的计算和内存需求使训练和部署都很昂贵。现有的效率工作通常针对参数共享或自适应计算，留下了如何同时实现两者的问题。我们引入了混合递归(MoR
Trae 支持配置 DeepSeek V3 最新版、Cursor + MCP 的冲击丨AI Coding 周刊第 1 期
Hello，CSDN的小伙伴们,AICoding周刊第1期专区直通车>>>https://juejin.cn/aicoding经过一段时间的酝酿筹备，掘金也将新增AICoding周刊栏目，旨在专注于发掘推荐有关AICoding的优质内容和相关创作者，欢迎大家踊跃提出宝贵建议，多多投稿砸向专区！！站内投稿时记得带上#AI编程#的标签哦~话不多说，让我们一起来看看上周有哪些大佬佳作吧~注：以下内容排名
【面试必背】RAG技术全面解析：从原理到实践中的20个关键问题大F的智能小课人工智能语言模型 python
大家好，我是大F，深耕AI算法十余年，互联网大厂核心技术岗。知行合一，不写水文，喜欢可关注，分享AI算法干货、技术心得。【专栏介绍】：欢迎关注《大模型理论和实战》、《DeepSeek技术解析和实战》，一起探索技术的无限可能！【大模型篇】更多阅读：【大模型篇】万字长文从OpenAI到DeepSeek：大模型发展趋势及原理解读【大模型篇】目前主流AI大模型体系全解析：架构、特点与应用【大模型篇】Gro
Deepin 与 Ubuntu 系统N卡登录卡死的解决办法蓝色_fea0
DeepinLinux介绍深度公司介绍DeepinLinux是一款国产的Linux系统，桌面效果特别的炫酷，而且对Windows上的大多数软件都支持（游戏除外，游戏是不可能游戏的）下面贴几张装好了Deepin系统的桌面截图深度截图_选择区域_20180921092828.png深度截图_20180921002524.png深度截图_选择区域_20180921092741.png我的电脑是I卡集显加
SPARKLE：深度剖析强化学习如何提升语言模型推理能力
摘要：强化学习（ReinforcementLearning，RL）已经成为赋予语言模型高级推理能力的主导范式。尽管基于RL的训练方法（例如GRPO）已经展示了显著的经验性收益，但对其优势的细致理解仍然不足。为了填补这一空白，我们引入了一个细粒度的分析框架，以剖析RL对推理的影响。我们的框架特别研究了被认为可以从RL训练中受益的关键要素：（1）计划遵循和执行，（2）问题分解，以及（3）改进的推理和知
Python机器学习教程
Python机器学习教程(MachineLearningwithPythonTutorial)PDFVersionQuickGuideResourcesJobSearchDiscussionPDF版本快速指南资源资源求职讨论区MachineLearning(ML)isbasicallythatfieldofcomputersciencewiththehelpofwhichcomputersyste
【DeepSeek实战】10、模型上下文协议（MCP）全解析：从核心架构到实战应用，揭秘AI协作的“凤雏”之力无心水人工智能架构 DeepSeek实战模型上下文协议MCP CSDN技术干货 DeepSeek AI大模型
在人工智能技术飞速发展的今天，大型语言模型（LLM）的能力不断突破，但跨模型协作、上下文一致性维护等问题却成为制约AI系统向更智能、更协同方向发展的瓶颈。模型上下文协议（ModelContextProtocol，MCP）作为专为大模型设计的标准化通信框架，如同“凤雏”之于“卧龙”，为解决这些核心问题提供了关键方案。本文将全面解析MCP的核心概念、架构设计、实操代码、应用案例及未来趋势，通过5000
【DW11月-深度学习】Task03前馈神经网络沫2021
参考链接：https://datawhalechina.github.io/unusual-deep-learning/#/4.%E5%89%8D%E9%A6%88%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C一、神经元模型2.1神经元1943年，美国神经生理学家沃伦·麦卡洛克(WarrenMcCulloch)和数学家沃尔特·皮茨(WalterPitts)对生物神经元进行
边缘智能革命：嵌入式机器学习如何让万物“思考” 万能小贤哥机器学习人工智能
当智能手表精准识别你的健身动作，工业传感器预测设备故障于毫秒之间，农业传感器自动调节灌溉水量——这些并非科幻场景，而是嵌入式机器学习（EmbeddedMachineLearning,或TinyML）正在悄然重塑的现实。这场发生在设备边缘的智能革命，正将AI从云端的数据中心拉近到我们指尖的每一台设备中。一、嵌入式机器学习：定义与核心价值嵌入式机器学习是指在资源极端受限的微控制器（MCU）、微处理器（
预测导管原位癌浸润性复发的深度学习：利用组织病理学图像和临床特征浪漫的诗人论文深度学习人工智能
文章目录研究内容目的方法数据集模型开发模型训练与评估外部验证统计分析研究结果模型性能风险分层外部验证特征重要性原文链接原文献：Deeplearningforpredictinginvasiverecurrenceofductalcarcinomainsitu:leveraginghistopathologyimagesandclinicalfeatures研究背景【DCIS与IBC的关联】乳腺导管
《How to Take Smart Notes》读书笔记1 LY320
最近在读一本书，题为《HowtoTakeSmartNotes:OneSimpleTechniquetoBoostWriting,LearningandThinking–forStudents,AcademicsandNonfictionBookWriters》1。尚未读完，分享一些读这本书的感想，我的一些心得，和不解。这本书让我觉得最有收获的点是更新了我对记录和整理笔记的认识。通常我们在记录笔记时
Spring AI 项目实战（十八）：Spring Boot + AI + Vue3 + OSS + DashScope 实现高效语音识别系统（附完整源码）程序员岳彬 SpringAI spring 人工智能 spring boot 语音识别后端 ai java
系列文章序号文章名称1SpringAI项目实战（一）：SpringAI核心模块入门2SpringAI项目实战（二）：SpringBoot+AI+DeepSeek深度实战（附完整源码）3SpringAI项目实战（三）：SpringBoot+AI+DeepSeek打造智能客服系统（附完整源码）4
2021-03-22 每日打卡来多喜
昨日完成情况：1.完成了3k跑，太久没锻炼体力跟不上，没力气做帕梅拉了。2.MathematicsforMachineLearning:LinearAlgebra学完了week3和week4，week5还剩大概一个小时学完，没有开始做思维导图。早上跑步回来后看《你是我的城池堡垒》看了两个小时，虽然一边看一边洗碗，洗完碗一边看一边吃饭，但是从三点多才开始学习。重要的事情要先做！3.没有时间做Pyth
Opencv学习_2 （opencv结构&显示图像）
opencv结构：1：主要包含：cxcorecvmachinelearninghighguicvcamcvaux2：cxcore:基础结构:CvPoint,CvSize,CvScalar等数组结构:cvCreateImage,cvCreateMat等动态结构:CvMemStorage,CvMemBlock等绘图函数:cvLine,cvRectangle等数据保存和运行时类型信息：CvFileSto
野兽的呼唤~26 爱机车的异乡人
Andhesawnexttohim,nottheIndiancook,butanotherman,amanwithshorterlegs,andlongerarms.他看见身边并不是那个印第安厨子而是另一个人。Thismanhadlonghairanddeepeyes,anddeepeyes,andmadestrangenoisesinhisthroat.Hewasveryfrightenedof
AI+Python赋能！长时序植被遥感动态分析全攻略：从物候提取到生态评估梦想的初衷~ 土壤植被遥感人工智能遥感植被土壤
在遥感技术与人工智能深度融合的2025年，AI大模型正重塑长时序植被遥感数据分析范式。从Landsat/Sentinel卫星数据的智能化去云处理，到MODIS植被产品的AI辅助质量控制，以ChatGPT、DeepSeeK为代表的大模型技术已成为提升遥感数据处理效率与精度的核心工具——尤其在长时序植被动态监测、物候期精准提取、时空变异归因分析及生态环境质量评估等领域，展现出传统方法难以企及的技术优势
#Datawhale组队学习#7月-强化学习Task1 fzyz123 Datawhale组队学习强化学习人工智能 AI
这里是Datawhale组织的组队学习《强化学习入门202507》，Datawhale是一个开源的社区。第一章绪论1.1为什么要学习强化学习？强化学习（ReinforcementLearning,RL）是机器学习中专注于智能体（Agent）如何通过与环境交互学习最优决策策略的分支。与监督学习依赖静态数据集、无监督学习聚焦数据内在结构不同，强化学习的核心在于序贯决策：智能体通过试错探索环境，根据行动
图机器学习（13）——图相似性检测
图机器学习（13）——图相似性检测0.前言1.基于图嵌入的方法2.基于图核的方法3.基于GNN的方法4.应用0.前言图机器学习(machinelearning,ML)方法能广泛应用于各类任务，其应用场景涵盖从药物设计到社交网络推荐系统等多个领域。值得注意的是，由于这类方法在设计上具有通用性，同一算法可用于解决不同问题。学习图之间相似性的定量度量是一个关键问题。事实上，这是网络分析的重要步骤，同时也
不同行业的 AI 数据安全与合规实践：7 大核心要点全解析观熵人工智能 DeepSeek 私有化部署
不同行业的AI数据安全与合规实践：7大核心要点全解析关键词AI数据安全、行业合规、私有化部署、数据分类分级、国产大模型、隐私保护、DeepSeek部署摘要随着国产大模型在金融、医疗、政务、教育等关键领域的深入部署，AI系统对数据安全与行业合规提出了更高要求。本文结合DeepSeek私有化部署实战，系统梳理当前各行业主流的数据安全合规标准与落地策略，从数据分类分级、访问控制、审计追踪到敏感信息识别与
AI MCP教程之什么是 MCP？利用本地 LLM 、MCP、DeepSeek 集成构建您自己的 AI 驱动工具知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 mcp deepseek
介绍利用模型上下文协议(MCP)的工具吸引了我们的注意力—将AI变成触手可及的生产力引擎。它们巧妙、高效，让人难以抗拒。但如果您可以将这样的功能添加到自己的工具中，会怎么样呢？在本指南中，我将引导您构建一个具有本地运行的大型语言模型(LLM)和MCP集成的AI工具-让您以类似的方式自动执行利用MCP的工具您喜欢的任务。推荐文章《AnythingLLM教程系列之12AnythingLLM上的Olla
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1