JunLiang-GuiLiano

《深度学习工程师-吴恩达》04结构化机器学习项目--机器学习（ML）策略1 学习总结（如何进一步优化系统的方法论）

作者：jliang

https://blog.csdn.net/jliang3

《深度学习工程师-吴恩达》04结构化机器学习项目--机器学习（ML）策略1 学习总结

1.重点归纳

1）ML策略（机器学习策略）就是如何构建你的机器学习项目，目的是快速有效的方法能够判断哪些想法是靠谱的，或者甚至提出新的想法，判断哪些值得一试的想法，哪些是可以放心舍弃的。

2）正交化

（1）正交化原因

机器学习系统可以尝试和改变的东西太多，很难知道调整什么来达到某个效果。
每个按钮都有相对明确的功能，正交化指的是设计的每个按钮都只调整一个性质。例子：如果有一个按钮同时调整上面的所有参数，那几乎不可能把电视调好。
正交意味着互成90度，最理想的情况是设计出的控制装置，这样调整参数时就容易得多。

（2）机器学习正交化设计，分四个“按钮“

系统在训练集上得到不错的结果。
系统也能在验证集上有不错的表现。
系统在测试集上也有好的表现。
系统在测试集上，系统的成本函数在实际使用中表现令人满意。比如说希望用户对猫图片识别应用满意。

（3）每个“按钮“可调整的内容

如果训练集效果不好时，优化措施：训练更大的网络、切换成更好的优化算法（如Adam）…
如果算法对验证集的拟合很差，优化措施：使用正则化、增大训练集…
如果算法对测试集的拟合很差，优化措施：增大验证集，因为如果它在验证集上不错，但测试集上不行，意味着对验证集过拟合了。
如果在测试集上拟合很好，但是无法给用户提供良好的体验，这意味着需要回去改变验证集或成本函数。因为如果根据某个成本函数，系统在测试集上很好，但是无法反映算法在现实世界中的表现，这意味着要么验证集分布设置不正确，要么成本函数测量指标不对。

（4）在训练神经网络时，一般不用提前停止（early stopping），提前停止有点难以分析，因为这个按钮会同时影响你对训练集的拟合，同时它也用来改善验证集的表现，所以这个按钮没有那么正交化，因为它同时影响两件事情。

3）为你的问题设置一个单实数评估指标，可以快速告诉你新尝试的手段比之前的手段好还是坏。

（1）评估猫分类器性能的例子：一个合理方式是观察它的查准率和查全率，两者之间往往需要折衷，两个指标都要顾及到。需要一个新的评估指标能够结合查准率和查全率，此处结合查准率和查全率的标准方法就是F1系数，就可以从多个模型中快速选出最好的模型。

（2）四大区数据中得到的误差来评估多个分类器例子：这四个数字很难一眼看出哪个分类器效果更好，建议计算四个数值的平均值作为一个单实数评估指标来衡量各个分类器的性能。

4）有时候并不容易把所有指标组合成单实数评估指标，有时候需要满足指标和优化指标，即符合满足指标的前提下选择优化指标最好的模型。

（1）分类器例子：看重分类器的准确率，但同时要考虑模型运行的时间。一个相当合理的权衡方式：在满足运行时间要求的前提下能够最大限度提高准确率。

（2）通过定义优化指标和满足指标，就可以有一个明确的方式来选择最好的分类器。如果要考虑N个指标，选择其中一个指标作为优化指标，并尽量优化这个指标，然后剩下的N-1个指标都是满足指标，只要满足一定阈值就好。

（3）语音控制设备的触发词检测系统例子：精确度为优化指标，每24h发生小于等于1次假阳性为满足指标。

5）如何切分验证集（也叫开发集）和测试集

（1）验证集和测试集的划分：将所有数据随机混洗，再放入验证集合测试集上，验证集和测试集应该来自相同的分布。

（2）在选择验证集和测试集时，验证集和测试集数据应该来源于同一数据分布，收集数据时随机分配到验证集和测试集上。

（3）反例：在中等收入邮政编码的贷款审批数据中训练，预测是否有能力偿还贷款，在几个月的学习后，再到低收入邮政编码数据上测试。中等收入邮政编码数据与低收入邮政编码数据不一样，花了大量的时间在中等收入数据中优化分类器，导致在低收入数据中效果很差。

6）验证集（也叫开发集）和测试集大小

（1）在机器学习的早期，这样划分是相当合理的，因为数据集比较小，数据集大小在[100, 10000]之间。旧的经验法则其实是为了确保验证集足够大，能够达到帮你评估不同模型的效果，并选择最好的模型。划分方法：

70%训练集+30%测试集
60%训练集+20%验证集+20%测试集

（2）在现代机器学习中，我们更习惯操作规模大得多的数据集，比如说有100万数据集。划分方法：

98%训练集+1%验证集+1%测试集

7）有时候在项目进行途中，你可能意识到目标错误了，这时候你应该修改你的评估指标。

（1）例子：算法A有3%错误，但是会把很多色情图片分类成猫并推送给客户；算法B有5%的错误，但不会把色情图片分类成猫。

根据评估指标来看算法A是最好的模型，但是实际上是一个更糟糕的算法，评估指标无法正确衡量算法之间的优劣排序。此时应该改变评估指标，或者改变验证集或测试集。
评估指标修改：

（2）如果评估指标无法正确评估好算法的排名，那么就需要定义一个新的评估指标。评估指标的意义在于准确告诉我们，多个算法中哪个算法更适合我们的应用。

（3）机器学习任务看成两个独立（正交化）的步骤，第一步是设定目标，第二步是根据目标来瞄准目标并命中目标。只有在定义指标后，才能想如何优化系统来提高这个指标评分。

8）人的表现

（1）为什么研究人的表现：当试图让机器学习做人类能做的事情时，可以精心设计机器学习系统的工作流程，让工作流程效率更高。在这些场合，比较人类和机器是很自然的，或者你想让机器模仿人类的行为。

（2）当机器学习超越人类水平时，机器学习进展和精确度的提升就会变慢

在超越人类水平后，它还可以继续变好，但性能增速准确度上升的速度就会变得越来越平缓。但用越来越大的模型，越来越多的数据训练模型时，越来越接近理论上限，但是无法超越理论上限。
贝叶斯最优误差一般被认为是理论上可到达的最优误差。

（3）超越人类表现后提升变慢的原因

人类表现非常接近贝叶斯最优误差（理论最佳水平），特别是在感知问题上。当机器学习超越人类表现后，也许没有太多的空间可以继续改善。
超越了人类就无法使用一些工具来继续提高算法的性能，这些工具有：
- 人类给数据打标签，并用于模型训练。
- 人工误差分析，只有在人类表现比算法好时，人类可以分析算法错误出在哪里，并尝试了解为什么人类能做对，而算法做错。
- 更好地分析偏差和方差。

9）训练集误差与贝叶斯误差（用人类水平误差近似）之间的差距称为可避免偏差

（1）可避免误差小意味着训练集拟合得很好；反之说明拟合得不好，还有很大的改善空间。

（2）可以一直提高训练集表现直到接近贝叶斯误差。但是训练集误差不可能小于贝叶斯误差，否则就是过拟合。

（3）选择优化偏差还是方差取决于训练误差-贝叶斯误差差距与验证误差-训练误差差距两者的大小。如果训练误差-贝叶斯误差差距比较大，则优化偏差。如果验证误差-训练误差差距比较大，则优化方差。

10）理解人的表现

（1）在定义人类水平误差时，要弄清楚你的目标所在。

如果要表明你可以超越单个人类，那么就有理由在某些场合部署你的系统，也许这个定义是合适的。
如果你的目标是替代贝叶斯误差，目标为有经验的医生团队的0.5%误差才合适。

（2）在人类可以做得很好的任务中，可以估计人类水平的误差，使用人类水平误差来估计贝叶斯误差。

11）超越人类的表现

（1）机器学习的进展会在接近或者超越人类水平的时候变得越来越慢

对于Scenario A，我们很容易计算得到可避免误差为0.6%-0.5%=0.1%，我们不会用1%作为参考。
对于Scenario B，我们很难知道可避免误差是多少，没有足够的信息让我们知道应该优化偏差还是方差。
- 我们不知道这是否过拟合了0.2%或者说贝叶斯误差其实是更小的值，没有足够的信息来判断应该优化偏差还是方差。
- 如果误差已经比一群专家更低，那么依靠人类直觉去判断算法优化的方向就很难了，机器学习优化就没有了明确的选项和前进的方向了。
- 这不意味着算法不能再提升，意味着常规的识别应该优化偏差或方差的方法已经无效。

（2）机器学习可以访问大量数据，在这方面可以比人类做得更好一些，可以比人类更敏锐地识别出数据中的统计规律。已经大大超越人类水平的机器学习问题

网络广告：估计某个用户点击广告的可能性，学习算法做到的水平已经超越任何人类。
提出产品建议：向你推荐电影或书籍之类的任务，网站做到的水平已经超越了身边最亲密的朋友。
物流预测：从A到B开车需要多久，或者预测快递车从A开到B需要多少时间。
预测某人会不会偿还贷款：这样就能判断是否批准这人的贷款。

（3）人类在自然感知任务中表现非常好，所以有可能计算机很难在自然感知任务中超越人类的表现。计算机已经超越了人类的水平的问题：某些语音识别系统、某些计算机视觉任务、医疗任务（如阅读ECG、诊断皮肤癌、某些特定领域的放射科读图任务中）。

（4）要超越人类的表现不容易，但如果有足够多的数据，已经有很多深度学习系统在单一监督学习问题上已经超越了人类的水平。

12）改善模型表现

（1）监督学习算法两个基本的步骤

算法对训练集拟合得很好，可以做到能够做到可避免偏差很低。
推广到验证集合测试集上也做得很好，方差不是太大。

（2）在正交化的指导下，处理偏差问题和处理方差问题是两套独立的技巧。

（3）训练误差与人类水平（近似贝叶斯误差）之间的差距称为可避免偏差，这是对训练集的可优化空间，降低可避免偏差的方法

训练更大的网络
增加训练模型的时间或者使用更好的优化算法（如Momentum、RMSprop、Adam优化算法）
寻找更好的神经网络架构，或者更好的超参数，比如：改变激活函数、改变层数、改变隐藏单元数，或者试用其他模型或其他架构（如RNN何CNN）

（4）检查验证集误差与训练集误差的差距就知道方差问题有多大，降低方差的方法

增大数据集
使用正则化，如：L2正则化、dropout正则化、数据增强
寻找更好的神经网络架构，或者更好的超参数

2. 为什么是ML策略

1）机器学习策略就是如何构建你的机器学习项目

2）学习策略例子

（1）假设你正在调试猫分类器，经过一段时间的调整后系统达到90%准确率，但是这个准确率不能满足需求，以下想法可能可以改善你的系统

收集更多训练数据
训练集多样性不够，收集更多不同姿势的猫咪图片或更多类型的反例
使用梯度下降算法训练更长时间
使用更大的网络
使用更小的网络
使用dropout/L2正则化
修改网络架构：修改激活函数、改变隐藏单元数目等

（2）当你在优化一个深度学习系统时，通常有很多想法可以尝试，但是如果做出了错误的选择，完成可能会白费了很长时间往错误的方向前进。如花费6个月时间收集更多数据，但是却没有改善模型。

（3）机器学习策略目的：快速有效的方法能够判断哪些想法是靠谱的，或者甚至提出新的想法，判断哪些值得一试的想法，哪些是可以放心舍弃的。

3）机器学习策略在深度学习时代在变化，因为现在对于深度学习算法来说，能够做到的事情比上一代机器学习算法大不一样，这些策略能够帮助我们提高效率，让我们的深度学习系统更快投入实用。

3. 正交化

1）搭建建立机器学习系统的挑战之一是可以尝试和改变的东西太多太多了（比如说有很多超参数可以调），那些效率很高的机器学习专家有个特点：对于要调整什么来达到某个效果非常清楚。这个步骤我们称之为正交化。

2）正交化例子：一台老式电视

（1）有很多按钮可以调整图像的各种性质

一个按钮调整高度
一个按钮调整宽度
一个按钮调整梯形角度
一个按钮调整图像左右偏移
一个按钮调整图像旋转角度

（2）每个按钮都有相对明确的功能。如果有一个按钮同时调整上面的所有参数，那几乎不可能把电视调好。正交化指的是设计的每个按钮都只调整一个性质。

（3）正交意味着互成90度，最理想的情况是设计出的控制装置，这样调整参数时就容易得多。

3）机器学习中的正交化

（1）要弄好一个监督学习系统，通常需要调你系统的“旋钮“，确保四件事情

至少系统在训练集上得到不错的结果。训练集上的表现必须通过某种评估达到接受的程度，对于某些应用这可能意味着达到人类水平的表现，这取决于你的应用。
系统也能在验证集上有不错的表现。
系统在测试集上也有好的表现。
系统在测试集上，系统的成本函数在实际使用中表现令人满意。比如说希望用户对猫图片识别应用满意。

（2）这4点类比上面电视机的4个按钮，每个按钮只控制一个参数，每个按钮可以控制这4个中1个的效果，每个按钮之间尽量互不影响。

如果训练集效果不好时，优化措施：训练更大的网络、切换成更好的优化算法（如Adam）…
如果算法对验证集的拟合很差，优化措施：使用正则化、增大训练集…
如果算法对测试集的拟合很差，优化措施：增大验证集，因为如果它在验证集上不错，但测试集上不行，意味着对验证集过拟合了。
如果在测试集上拟合很好，但是无法给用户提供良好的体验，这意味着需要回去改变验证集或成本函数。因为如果根据某个成本函数，系统在测试集上很好，但是无法反映算法在现实世界中的表现，这意味着要么验证集分布设置不正确，要么成本函数测量指标不对。

4）在训练神经网络时，一般不用提前停止（early stopping），提前停止有点难以分析，因为这个按钮会同时影响你对训练集的拟合，同时它也用来改善验证集的表现，所以这个按钮没有那么正交化，因为它同时影响两件事情。

5）在机器学习中，如果系统某部分错误（在训练集上不好、在验证集上不错、在测试集上不错、无法满足用户体验），必须弄清楚到底是什么地方出问题了，然后再使用对应的“按钮“（或一组对应按钮）来解决这个问题。

4. 单一数字评估指标

1）无论是在调整参数，或者是尝试不同的学习算法，或者在搭建机器学习系统时尝试不同手段，如果你有一个单实数评估指标，你的进展会快得多。它可以快速告诉你新尝试的手段比之前的手段好还是坏，所以当团队开始进行机器学习项目时，推荐为你的问题设置一个单实数评估指标。

2）例子1：评估猫分类器性能

（1）评估你的分类器的一个合理方式是观察它的查准率和查全率，两者之间往往需要折衷，两个指标都要顾及到。

（2）使用查准率和查全率作为评估指标的时候有个问题，如果分类器A在查全率上表现更好，但分类器B在查准率上表现更好，无法判断哪个分类器更好。

（3）如果有两个评估指标就很难快速地从多个模型中选择一个最好的模型，所以不推荐使用两个评估指标来选择分类器，只需要一个新的评估指标能够结合查准率和查全率。此处结合查准率和查全率的标准方法就是F1系数，就可以从多个模型中快速选出最好的模型，可以加速改进机器学习算法的迭代过程。

3）例子2：通过四个地理大区的数据中得到的误差来评估多个分类器

（1）通过这四个数字很难一眼看出哪个分类器效果更好

（2）此处建议计算四个数值的平均值作为一个单实数评估指标来衡量各个分类器的性能，通过这个平均值可以快速判断哪个分类器好，哪个分类器最差。

5. 满足和优化指标

1）有时候并不容易把所有指标组合成单实数评估指标，有时候设立满足指标和优化指标很有用，即符合满足指标的前提下选择优化指标最好的模型。

2）例子：此处很看重分类器的准确率，但同时要考虑模型运行的时间

（1）如果我们把准确率和运行时间组合成一个单实数指标，如cost=accuracy – 0.5*runningTime，这种组合方式可能太刻意。

（2）一个相当合理的权衡方式：在满足运行时间要求的前提下能够最大限度提高准确率。此处准确率就是优化指标，我们希望准确率最大化；运行时间就是满足指标，只需要满足这个指标就好，但是并不关心这个指标有多好。

（3）通过定义优化指标和满足指标，就可以有一个明确的方式来选择最好的分类器。

（4）如果要考虑N个指标，选择其中一个指标作为优化指标，并尽量优化这个指标，然后剩下的N-1个指标都是满足指标，只要满足一定阈值就好。

3）例子：语音控制设备的触发词检测系统

（1）我们很在乎系统的精确度，也关注假阳性的情况（没有人说触发词时却被唤醒），这种情况下，组合两种苹果指标的合理的方式可能是最大化精确度，然后必须满足24h内最多只能有一次假阳性。

（2）精确度为优化指标，每24h发生小于等于1次假阳性为满足指标。

4）这些评估指标必须是在训练集/验证集/测试集上计算出来的，所以还需要设立训练集、验证集合测试集。

6. 训练/开发/测试集划分

1）设立训练集、开发集（dev集，有时也称保留交叉验证集）和测试集的方式会影响建立机器学习应用方面进展的速度，即使是大公司的团队，在设立这些数据集的方式也会让团队的进展变慢而不是加快。此处主要讲如何切分验证集和测试集。

2）机器学习的工作流程：尝试很多方法来使用训练集训练不同的模型，然后使用验证集来评估不同的方法，再选择其中一个方法不断迭代去改善模型在验证集的性能。最后，在验证集上得到一个满意的损失值，再用测试集去评估模型。

3）验证集和测试集的划分：将所有数据随机混洗，再放入验证集合测试集上，验证集和测试集应该来自相同的分布。

（1）如上图中，如果验证集数据来自前4个地区，测试集数据来自后4个地区，这样的划分会导致在验证集上表现很好的模型在测试集上表现很差。

（2）验证集和测试集的分布不同就类似，射箭时（类似训练并选择模型）往目标板上射，并不断逼近靶心。但最终在测试集上测试系统时，靶心却被移动到别的地方了。

4）反例：在中等收入邮政编码的贷款审批数据中训练，预测是否有能力偿还贷款，在几个月的学习后，再到低收入邮政编码数据上测试。中等收入邮政编码数据与低收入邮政编码数据不一样，花了大量的时间在中等收入数据中优化分类器，导致在低收入数据中效果很差。

5）在选择验证集和测试集时，验证集和测试集数据应该来源于同一数据分布，收集数据时随机分配到验证集和测试集上。

7. 开发集和测试集的大小

1）旧的划分数据方法

（1）划分方式：

70%训练集+30%测试集
60%训练集+20%验证集+20%测试集

（2）在机器学习的早期，这样划分是相当合理的，因为数据集比较小，数据集大小在[100, 10000]之间。

（3）旧的经验法则其实是为了确保验证集足够大，能够达到帮你评估不同模型的效果，并选择最好的模型。

2）现代数据划分方法

（1）在现代机器学习中，我们更习惯操作规模大得多的数据集，比如说有100万数据集。

（2）划分方式：

98%训练集+1%验证集+1%测试集

因为总样本有100万个，所以1%的样本有1万个，对于验证集和测试集来说可能已经足够。

3）测试集大小

（1）测试集的目的是完成系统开发后，测试集可以帮助你评估投产系统的性能。

指导思想是：令测试集足够大，能够以高置信度评估系统整体性能。
除非对最终投产系统有一个很精确的指标要求，否则一般不需要上百万的测试样本，1万个测试集就能给出足够的置信度来给出性能指标了。

（2）对于某些应用也许不需要对系统性能有置信度很高的评估，只需要训练集和验证集，而不需要单独的测试集。

在实践中有时候回只划分训练集和验证集（有些地方称之为训练集和测试集）
但是不建议在搭建系统时省略测试集

8. 什么时候该改变开发/测试集和指标

1）有时候在项目进行途中，你可能意识到目标错误了，这时候你应该修改你的目标。例子：

（1）猫分类器中：算法A有3%错误，但是会把很多色情图片分类成猫并推送给客户；算法B有5%的错误，但不会把色情图片分类成猫。

（2）把一些色情图片推送给客户是公司不能接受的，因此算法B是更好的算法。

（3）根据评估指标来看算法A是最好的模型，但是实际上是一个更糟糕的算法，评估指标无法正确衡量算法之间的优劣排序。此时应该改变评估指标，或者改变验证集或测试集。

（4）评估指标修改：。赋予色情图片更大的权重，算法识别色情图片为猫时，误差项快速变大。

（5）如果评估指标无法正确评估好算法的排名，那么就需要定义一个新的评估指标。评估指标的意义在于准确告诉我们，多个算法中哪个算法更适合我们的应用。

2）机器学习任务看成两个独立（正交化）的步骤

（1）第一步是设定目标，要定义你要瞄准的目标，这是完全独立的一步。

（2）第二步是根据目标来瞄准目标并命中目标，在逼近目标时针对成本函数优化。只有在定义指标后，才能想如何优化系统来提高这个指标评分。

3）另一个例子：在网上下载高清的猫图片作训练集和验证集，部署到手机上时用户上传的模糊照片

（1）算法A的评估结果更好，但在实际测试时发现算法B表现其实更好，这是另一个指标和验证集测试集出问题的例子。

（2）指导思路：如果模型在验证集或测试集上指标表现很好，但实际应用时表现不好，那么就需要修改指标或者验证集和测试集。当前的指标和当前用来评估的数据和你真正关心的目标关系不大，那就应该改变评估指标，或者修改验证集和测试集，让它们更好反映你算法需要处理好的数据。

（3）此例子中应该修改验证集和测试集，让你的数据更能反映实际需要处理好的数据。

4）有一个评估指标和验证集可以让你更快做出决策判断哪个算法更优，可以加速团队迭代的速度。在没有评估指标和验证集时会减慢团队迭代和改善算法是速度，应该明确一个可以高速迭代改善性能的目标。

9. 为什么是人的表现

1）为什么要研究如何比较机器学习系统和人类的表现？

（1）深度学习系统的进步使得机器学习算法变得更好了，许多应用领域已经接近人类表现或已经比人类的表现更好。

（2）当试图让机器学习做人类能做的事情时，可以精心设计机器学习系统的工作流程，让工作流程效率更高。在这些场合，比较人类和机器是很自然的，或者你想让机器模仿人类的行为。

2）当机器学习超越人类水平时，机器学习进展和精确度的提升就会变慢。

（1）在超越人类水平后，它还可以继续变好，但性能增速准确度上升的速度就会变得越来越平缓。但用越来越大的模型，越来越多的数据训练模型时，越来越接近理论上限，但是无法超越理论上限。

（2）贝叶斯最优误差一般被认为是理论上可到达的最优误差。

2）超越人类表现后提升变慢的原因

（1）其中一个原因就是人类表现非常接近贝叶斯最优误差（理论最佳水平），特别是在感知问题上。当机器学习超越人类表现后，也许没有太多的空间可以继续改善。

（2）只要表现比人类更差，那么实际上可以使用某些工具来提高性能，一旦超越了人类的表现后，这些工具就没有用了。

人类给数据打标签，并用于模型训练。
人工误差分析，只有在人类表现比算法好时，人类可以分析算法错误出在哪里，并尝试了解为什么人类能做对，而算法做错。
更好地分析偏差和方差。

10. 可避免偏差

1）当算法在训练集上的表现和人类水平的表现有很大差距的话（如Scenario A），说明算法对训练集拟合并不好。

（1）从减少偏差和方差的工具这个角度看，这种情况下，应该把重点放在减少偏差上。

（2）比如说训练更大的网络，或者增长运行梯度下降算法的时间。

2）当算法在训练集上的表现与人类水平很接近（如Scenario B），说明算法对训练集上表现不错，只比人类差一点点。

（1）重点应该放在减少算法的方差。

（2）可以尝试正则化，让验证集误差更接近训练集误差。

3）有一些任务的贝叶斯误差几乎为0，如人类在计算机视觉任务中能做到的水平和贝叶斯误差相差不远，误差只比贝叶斯误差高一点。

（1）上述两种情况的训练误差和验证误差一样，但是人类表现的水平不一样，算法对训练集拟合得好不好取决于人类水平误差的多少，即取决于训练误差与贝叶斯误差的差距。

（2）Scenario A中可以把训练误差降低到接近1%（有7%的优化空间），而验证集与训练集误差只有2%的优化空间，减少偏差的手段有效。

（3）Scenario B中训练误差没有太多的改善空间（只有0.5%的优化空间），而验证集误差还可以与训练集误差的差距2%还可以缩小一点，减少方差的手段有效。

（4）选择优化偏差还是方差取决于训练误差-贝叶斯误差差距与验证误差-训练误差差距两者的大小。如果训练误差-贝叶斯误差差距比较大，则优化偏差。如果验证误差-训练误差差距比较大，则优化方差。

4）训练集误差与贝叶斯误差的差距称为可避免偏差，可以一直提高训练集表现直到接近贝叶斯误差。但是训练集误差不可能小于贝叶斯误差，否则就是过拟合。

5）验证集误差与训练集误差的差距大概说明了算法在方差问题上还有多少改善空间。

11. 理解人的表现

1）普通人、医生、有经验的医生、有经验的医生团队有着不同的分类错误值

（1）人类水平错误的定义取决于分析的目的，当前例子中人类水平定义为0.5%，贝叶斯错误小于等于0.5%。

（2）为了发表研究论文或者部署系统，也许人类水平误差的定义可以不一样，可以使用只要你超越一个普通医生的表现，那系统已经达到实用了。表现超越了一名放射科医生，意味着系统在一些情况下可以有部署价值了。

（3）在定义人类水平误差时，要弄清楚你的目标所在。

如果要表明你可以超越单个人类，那么就有理由在某些场合部署你的系统，也许这个定义是合适的。
如果你的目标是替代贝叶斯误差，目标为有经验的医生团队的0.5%误差才合适。

2）误差分析

（1）Scenario A：无论选择哪种类型的医生作为人类水平都不影响，可避免偏差大概是4%，大于验证-训练误差的差值1%，应该优化偏差。

（2）Scenario B：无论选择哪种类型的医生作为人类水平都不影响，可避免偏差在0%-0.5%之间，验证-训练误差的差值4%大于可避免偏差，应该优化方差。

（3）Scenario C：估计贝叶斯误差应该选择最小值0.5%，因为训练误差不能小于人类水平，否则就属于过拟合了。因此可避免偏差为0.2%，大于验证-训练误差的差值0.1%，应该优化偏差。

（4）只有当模型表现足够好时才需要关心应该选择哪种类型医生作为人类水平，当接近人类水平时更难分辨出问题是偏差还是方差。

3）总结

（1）在人类可以做得很好的任务中，可以估计人类水平的误差，使用人类水平误差来估计贝叶斯误差。

（2）如果训练误差与人类水平误差的差值大于验证集误差与训练集误差的差值大，应该集中在优化偏差。

（3）如果验证集误差与训练集误差的差值大于训练误差与人类水平误差的差值大，应该集中在优化方差。

（4）贝叶斯误差有时为0，有时为小于某个阈值。

对于贝叶斯误差是几乎接近0%的（如识别猫问题），人类表现接近完美，所以贝叶斯误差也接近完美，所以使用0%与训练误差比较来计算偏差是合理的。
当数据噪声很多时（如有背景噪音的语音识别问题，有时几乎不可能听清楚说什么），更好的估计贝叶斯误差很有必要，可以帮助你更好估计可避免偏差和方差，并选择减少偏差或方差的策略。

12. 超过人的表现

1）机器学习的进展会在接近或者超越人类水平的时候变得越来越慢

（1）对于Scenario A，我们很容易计算得到可避免误差为0.6%-0.5%=0.1%，我们不会用1%作为参考。

（2）对于Scenario B，我们很难知道可避免误差是多少，没有足够的信息让我们知道应该优化偏差还是方差。

我们不知道这是否过拟合了0.2%或者说贝叶斯误差其实是更小的值，没有足够的信息来判断应该优化偏差还是方差。
如果误差已经比一群专家更低，那么依靠人类直觉去判断算法优化的方向就很难了，机器学习优化就没有了明确的选项和前进的方向了。
这不意味着算法不能再提升，意味着常规的识别应该优化偏差或方差的方法已经无效。

2）已经大大超越人类水平的机器学习问题

（1）例子：

网络广告：估计某个用户点击广告的可能性，学习算法做到的水平已经超越任何人类。
提出产品建议：向你推荐电影或书籍之类的任务，网站做到的水平已经超越了身边最亲密的朋友。
物流预测：从A到B开车需要多久，或者预测快递车从A开到B需要多少时间。
预测某人会不会偿还贷款：这样就能判断是否批准这人的贷款。

（2）这些例子都是从结构化数据中学习得来的，可能是记录用户点击的历史数据库、购物历史数据库、记录从A到B需要多久时间的数据库、以前贷款申请及结果的数据库。

（3）这些并不是自然感知问题（如计算机视觉问题、语音识别或自然语言处理任务），人类在自然感知任务中表现非常好，所以有可能计算机很难在自然感知任务中超越人类的表现。

（4）机器学习可以访问大量数据，在这方面可以比人类做得更好一些，可以比人类更敏锐地识别出数据中的统计规律。

3）深度学习最新的进展其中一方面是即使在自然感知任务中，在某些情况下计算机已经超越了人类的水平。

（1）已有语音识别系统超越人类水平

（2）已有一些计算机视觉任务，一些图像识别任务计算机已经超越人类水平，但人类很擅长这些，所以很难才能超越人类。

（3）医疗任务：如阅读ECG、诊断皮肤癌、某些特定领域的放射科读图任务中，计算机做得很好，也许超越了单个人类的水平。

4）要超越人类的表现不容易，但如果有足够多的数据，已经有很多深度学习系统在单一监督学习问题上已经超越了人类的水平。

13. 改善模型表现

1）想要让一个监督学习算法达到实用，

（1）两个基本的假设步骤

首先，算法对训练集拟合得很好，可以做到能够做到可避免偏差很低。
然后推广到验证集和测试集上也做得很好，方差不是太大。

（2）在正交化的指导下，处理偏差问题和处理方差问题是两套独立的技巧

2）降低可避免偏差和方差总结

（1）训练误差与人类水平（近似贝叶斯误差）之间的差距称为可避免偏差，这是对训练集的可优化空间，降低可避免偏差的方法：

训练更大的网络
增加训练模型的时间或者使用更好的优化算法（如Momentum、RMSprop、Adam优化算法）
寻找更好的神经网络架构，或者更好的超参数，比如：改变激活函数、改变层数、改变隐藏单元数，或者试用其他模型或其他架构（如RNN何CNN）

（2）检查验证集误差与训练集误差的差距就知道方差问题有多大，降低方差的方法：

增大数据集
使用正则化，如：L2正则化、dropout正则化、数据增强
寻找更好的神经网络架构，或者更好的超参数

《深度学习工程师-吴恩达》04结构化机器学习项目--机器学习（ML）策略2 学习笔记（如何进一步优化系统的方法论）

你可能感兴趣的:(学习笔记,深度学习,人工智能)

AI大模型学习路线：从入门到精通的完整指南【2025最新】 AI大模型-大飞人工智能学习大模型 LLM AI 程序员大模型学习
引言近年来，以GPT、BERT、LLaMA等为代表的AI大模型彻底改变了人工智能领域的技术格局。它们不仅在自然语言处理（NLP）任务中表现卓越，还在计算机视觉、多模态交互等领域展现出巨大潜力。本文旨在为开发者、研究者和技术爱好者提供一条清晰的学习路径，帮助读者逐步掌握大模型的核心技术并实现实际应用。一、基础阶段：构建知识体系数学与理论基础线性代数：矩阵运算、特征值与奇异值分解是大模型参数优化的基础
Python与Web 3.0：重新定义数字身份验证的未来 Echo_Wish Python！实战！python 前端开发语言
Python与Web3.0：重新定义数字身份验证的未来随着Web3.0的迅猛发展，传统的身份验证方式正面临越来越大的挑战。从依赖中心化服务器存储用户数据，到如今去中心化、用户掌控数据的新时代，身份验证系统经历了前所未有的变革。而作为一个人工智能、区块链和Python技术的深度爱好者，我认为Python将成为构建Web3.0身份验证系统的重要工具。今天，我们就来聊聊如何结合Python与Web3.0
大模型和数据要素赋能实体零售行业数字化转型建设和实施方案优享智库大模型数据要素数据治理数据仓库主数据零售
大模型和数据要素赋能实体零售行业数字化转型建设和实施方案更多参考公众号：优享智库引言项目背景与意义数字化转型目标与期望实施方案概述零售行业现状及挑战实体零售行业现状数字化转型面临的挑战市场需求与趋势分析大模型与数据要素赋能策略大模型技术及应用场景数据要素采集、整合与治理赋能策略制定与实施路径数字化转型关键技术与解决方案人工智能技术及应用大数据分析与挖掘技术云计算、物联网等技术支持定制化解决方案设计
从LLM出发：由浅入深探索AI开发的全流程与简单实践（全文3w字）码事漫谈 AI 人工智能
文章目录第一部分：AI开发的背景与历史1.1人工智能的起源与发展1.2神经网络与深度学习的崛起1.3Transformer架构与LLM的兴起1.4当前AI开发的现状与趋势第二部分：AI开发的核心技术2.1机器学习：AI的基础2.1.1机器学习的类型2.1.2机器学习的流程2.2深度学习：机器学习的进阶2.2.1神经网络基础2.2.2深度学习的关键架构2.3Transformer架构：现代LLM的核
我们的AI人工智能，自动发布了一篇假新闻…… 数据断案数据人的故事人工智能数据库 sql oracle 数据分析
今天这个故事，还得从一个事故开始说起。前些日子，我们被XX公司投诉，说我们的资讯发布了关于他们公司授信额度的不实报道：告诉我们这篇资讯与他们公司最新公开披露的数据不一致，相关内容并不属实，可能对广大网友们造成严重误导，并对他们公司造成了严重负面影响……balabala一堆指责，并要求我们3小时内删除全部相关信息。然后，他们丢了2篇公告附件过来。我们对照着仔细一看，还真是我们搞错了：由于数据错误，“
深入解析两大AI模型的架构与功能草莓屁屁我不吃人工智能 chatgpt
在人工智能（AI）领域，自然语言处理（NLP）一直是研究的热点之一。随着技术的不断进步，我们见证了从简单的聊天机器人到复杂语言模型的演变。其中，Google的Gemini和OpenAI的ChatGPT作为两大代表性模型，各自在技术和应用上展现出了卓越的性能。本文将详细解析Gemini和ChatGPT的系统架构、功能特性及其背后的技术原理。Gemini模型详解技术背景与架构Gemini，顾名思义，意
建立高质量个人数据库：解锁DeepSeek的关键 CodeJourney. 人工智能算法 python
在人工智能飞速发展的时代，DeepSeek为普通人处理数据、提升工作效率带来了新的可能。然而，很多人在使用过程中存在误区，本文围绕如何正确利用DeepSeek搭建高质量个人数据库展开探讨，强调其对个人成长和发展的重要性，并通过具体实例展示其强大功能。重新理解DeepSeekDeepSeek的普及使普通人能够轻松搭建个人数据库，但不少人在使用时存在错误认知。他们将DeepSeek视为主角，把杂乱无章
如何减少跨团队交付摩擦？——基于 DevOps 与敏捷的最佳实践网罗开发实战实战源码 devops 运维
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
java实现卷积神经网络CNN（附带源码） Katie。 Java 实战项目 java
Java实现卷积神经网络（CNN）项目详解目录项目概述1.1项目背景与意义1.2什么是卷积神经网络（CNN）1.3卷积神经网络的应用场景相关知识与理论基础2.1神经网络与深度学习概述2.2卷积操作与卷积层原理2.3激活函数与池化层2.4全连接层与损失函数2.5前向传播、反向传播与梯度下降项目需求与分析3.1项目目标3.2功能需求分析3.3性能与扩展性要求3.4异常处理与鲁棒性考虑系统设计与实现思路
展望 AIGC 前景：通义万相 2.1 与蓝耘智算平台共筑 AI 生产力高地 accurater AIGC 人工智能神经网络深度学习
喜欢可以到主页订阅专栏引言人工智能生成内容（AIGC）技术正在重塑内容创作、影视制作、广告设计等行业的底层逻辑。作为该领域的革命性技术代表，通义万相2.1凭借其开源特性、多模态生成能力和技术突破，成为全球视频生成模型的标杆。而蓝耘智算平台则通过高性能算力支持与分布式架构优化，为AIGC技术的规模化应用提供了基础设施保障。两者的协同不仅推动了AI生产力的跃迁，更开启了从技术研发到商业落地的全链条创新
Python编码系列—Python代码重构：提升代码质量学步_技术 Python编码 python 重构开发语言
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
从0到1构建AI深度学习视频分析系统--基于YOLO 目标检测的动作序列检查系统：（2）消息队列与消息中间件 shiter 人工智能系统解决方案与技术架构人工智能深度学习音视频
文章大纲原始视频队列Python内存视频缓存优化方案（4GB以内）一、核心参数设计二、内存管理实现三、性能优化策略四、内存占用验证五、高级优化技巧六、部署建议检测结果队列YOLO检测结果队列技术方案一、技术选型矩阵二、核心实现代码三、性能优化策略四、可视化方案对比五、部署建议逻辑判定队列时间片图论时间序列大模型引入参考文献原始视频队列想要在单机内存中缓存1-5分钟的视频片段，python技术栈的话
【人工智能】Model Context Protocol (MCP) 是一个开放协议，标准化了应用程序向大型语言模型（LLMs）提供上下文的方式本本本添哥 013 -AIGC 人工智能大模型人工智能语言模型 php
一、ModelContextProtocol(MCP)概述MCP，ModelContextProtocolMCP，是一个开放协议。MCP，标准化了应用程序向大型语言模型（LLMs）提供上下文的方式。‌MCP，旨在标准化应用程序如何为大型语言模型（LLM）提供上下文信息。MCP，提供了一个标准的接口，使得LLM可以无缝集成各种外部数据源和工具，从而扩展其能力和应用场景。二、MCP的定义和作用MCP定
从零开始大模型开发与微调：PyCharm的下载与安装 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
从零开始大模型开发与微调：PyCharm的下载与安装1.背景介绍随着人工智能和深度学习技术的不断发展,大型语言模型(LargeLanguageModels,LLMs)已经成为当前最引人注目的研究热点之一。LLMs能够在各种自然语言处理任务上展现出惊人的性能,例如机器翻译、文本生成、问答系统等。PyTorch和TensorFlow等深度学习框架为训练和微调大型语言模型提供了强大的支持。PyCharm
简单工厂模式、工厂方法模式、抽象工厂模式对比学习笔记 idgoodbye 简单工厂模式工厂方法模式抽象工厂模式
工厂模式架构设计原则开闭原则：是指一个软件实体（如类、模块和函数）应该对扩展开放，对修改关闭。依赖倒置原则：是指设计代码结构时，高层模块不应该依赖低层模块，二者都应该依赖其抽象。抽象不应该依赖细节，细节应该依赖抽象。单一职责：是指一个类只负责一个主要任务，避免因一个类负责两个以上任务时，修改其中一个任务代码导致另一个任务代码受到连带影响。接口隔离原则：是指用多个专门的接口，而不使用单一的总接口，客
遗传算法与深度学习实战（2）——生命模拟及其应用盼小辉丶遗传算法与深度学习实战深度学习人工智能遗传算法
遗传算法与深度学习实战（2）——生命模拟及其应用0.前言1.康威生命游戏1.1康威生命游戏的规则1.2实现康威生命游戏1.3空间生命和智能体模拟2.实现生命模拟3.生命模拟应用小结系列链接0.前言生命模拟是进化计算的一个特定子集，模拟了自然界中所观察到的自然过程，例如粒子或鸟群的聚集方式。生命模拟只是用来探索和优化问题的模拟形式之一，还有很多其他形式的模拟，可以更好地建模各种过程，但它们都源于康威
Spring-Boot学习笔记戴帽子的小熊猫学习笔记学习笔记 spring boot
这个笔记是在自己学习的过程中根据实际用到的和学到的整理出来的，可能会有缺失，错误等，主要是给激励自己学习，遇到写不下去的情况给自己一个参考，请各位大佬发现问题提出问题时能嘴下留情，也希望多提建议，谢谢。本笔记长期更新（更新日期2024年9月21日）目录第1章.固定格式参考1.1application.yml1.2mapper.xml(详细操作见另一个文件[XML数据库操作笔记]())1.3appl
PyTorch从入门到精通：探索深度学习新境界 lmtealily 深度学习 pytorch 人工智能
引言PyTorch作为当前最受欢迎的深度学习框架之一，凭借其动态计算图的独特设计和与Python生态的无缝集成，正重塑着人工智能开发的新范式1。从NVIDIA的研究实践到Meta的产业应用，PyTorch的价值已渗透至学术研究、工业部署的每个角落。本文将带领您从张量操作基础开始，逐步探索GPU加速、动态图机制、框架生态集成等高级主题，最终实现理论与实战的双重突破。一、PyTorch核心基础构建1.
【Python】已解决：pip安装第三方模块（库）与PyCharm中不同步的问题（PyCharm添加本地python解释器）屿小夏 python pip pycharm
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
Linux命令学习笔记之 network NetworkManager kfepiza OS操作系统 Windows Linux 等 #Linux CentOS Ubuntu 等 linux 学习 centos
networkNetworkManager前言CentOS7最小安装下的测试220511心得:启动network能打开网络,关闭network能关闭网络启动NetworkManager能打开网络,关闭不会关闭网络在两者都启动的情况下,单停network会断网,单停NetworkManager不会一些摘抄前言这两个东西在centOS7最小安装无勾选附加时就存在Ubuntu20.04中只有Networ
【AI大模型智能应用】Deepseek生成测试用例柳柳的博客 AI大模型测试用例
在软件开发过程中，测试用例的设计和编写是确保软件质量的关键。然而，软件系统的复杂性不断增加，手动编写测试用例的工作量变得异常庞大，且容易出错。DeepSeek基于人工智能和机器学习，它能够依据软件的需求和设计文档，自动生成高质量的测试用例，显著减轻人工编写测试用例的负担。体验一把用DeepSeek编写测试用例，还生成清晰直观的思维导图，整个流程十分顺畅。这篇文章讲解如何使用deepseek生成功能
人工智能之数学基础:线性代数中矩阵的初印象每天五分钟玩转人工智能机器学习深度学习之数学基础线性代数人工智能矩阵机器学习深度学习
本文重点从本篇文章开始，我们将开始学习矩阵的概念，矩阵，作为线性代数的核心概念之一，就像是一个个精心编织的网格，将复杂的数据和关系以一种简洁而直观的方式呈现出来。矩阵矩阵的初印象想象一下，你手里有一张空白的表格，上面布满了等待填充的格子。这些格子按照行和列整齐排列，形成了一个二维的平面结构。如果我们把数字、符号或者更复杂的元素填入这些格子中，那么这个表格就变成了一个“矩阵”。简单来说，矩阵就是一个
AI技术学习笔记系列001：FastLanguageModel.get_peft_model 函数各参数的详细解释新说一二人工智能学习笔记
以下是关于代码中FastLanguageModel.get_peft_model函数各参数的详细解释，以及企业实际微调时的选择考量：参数详解及对微调的影响1.r=32（秩）作用：控制LoRA适配器的低秩矩阵的维度（秩），直接影响可训练参数数量。影响：r越大：适配器表达能力更强，能捕捉更复杂的任务特征，但可能导致过拟合（尤其数据量少时），训练时间和显存占用增加。r越小：参数量少，训练更快，显存占用低
Python个人学习笔记（2）：编程入门知识与基础语法介绍 NEET_LH 樵夫老师Python零基础课程个人学习笔记 python 学习笔记
一、注释（一）作用1.对代码进行解释和说明避免自己忘了写的代码是做什么的——写给人看的，机器不运行不要去注释你代码做了什么，而要去注释我的代码为什么要这么做。用于记录思路、实现方法、代码功能注释很重要，大厂很重视，尤其日企2.调试代码报错的一篇代码，从下到上一句一句加#，依次运行，如果某行代码加了#后，程序运行成功，那么就是这行有问题，但这个方法不好。（二）注释方法1.单行注释==句子前加#快捷键
Java学习笔记1.1_初识 Java 火车爱上轨道 Java编程语言基础 java 学习
初识Java前言一、Java概述1.什么是程序2.Java语言的产生和发展史3.Java可以做什么4.Java语言的特点二、Java语言环境搭建1.JDK、JRE、JVM关系2.安装JDK3.配置环境变量4.环境测试三、开发第一个Java程序1.开发Java程序的步骤2.用记事本开发Java程序四、Java程序的注释1.单行注释和多行注释2.文档注释五、Java程序的结构六、JavaAPI文档前言
人工智能第五次笔记（python运算符）吴小白！笔记 python 开发语言
一.运算符运算符用于执行某种操作并返回一个结果，Python中的运算符可以分为：算数运算符，比较运算符，逻辑运算符，赋值运算符，位运算符，身份运算符，成员运算符，三目运算符八种1.1算数运算符用于执行基本的数学运算1.1.1常见的算数运算符+：加法-：减法*：乘法/：除法%：取模（取余数）**：幂运算//：整除（取整数部分）x1=5x2=2x3=(1,2)#元组x4=(3,4)x5=[1,2]x6
YOLOv5+UI界面在车辆检测中的应用与实现深度学习&目标检测实战项目 YOLOv5实战项目 YOLO ui 分类数据挖掘目标跟踪人工智能
1.引言随着智能交通系统（ITS）的快速发展，车辆检测已成为计算机视觉领域的重要研究方向。车辆检测技术广泛应用于交通流量监控、车辆违章抓拍、无人驾驶等场景中。近年来，深度学习技术的突破，特别是卷积神经网络（CNN）的崛起，使得目标检测技术取得了显著进展。其中，YOLO（YouOnlyLookOnce）系列模型以其高效的实时检测能力和出色的性能成为车辆检测领域的首选方法之一。在本文中，我们将基于YO
DeepSeek：技术教育领域的AI变革者——从理论到实践的全面解析量子纠缠BUG DeepSeek DeepSeek部署 AI 人工智能 python
一、技术教育为何需要DeepSeek？在数字化转型的浪潮下，技术教育面临着知识更新快、实践门槛高、个性化需求强三大核心挑战。传统的教学模式难以满足开发者快速掌握前沿技术、构建复杂系统能力的需求。DeepSeek作为国产开源大模型的代表，凭借其推理能力、多模态支持与低成本部署的特性，正在为技术教育带来突破性解决方案。二、DeepSeek赋能技术教育的核心技术优势1.推理能力驱动深度学习思维链（CoT
【人工智能基础2】机器学习、深度学习总结 roman_日积跬步-终至千里人工智能习题人工智能机器学习深度学习
文章目录一、人工智能关键技术二、机器学习基础1.监督、无监督、半监督学习2.损失函数：四种损失函数3.泛化与交叉验证4.过拟合与欠拟合5.正则化6.支持向量机三、深度学习基础1、概念与原理2、学习方式3、多层神经网络训练方法一、人工智能关键技术领域基础原理与逻辑机器学习机器学习基于数据，研究从观测数据出发寻找规律，利用这些规律对未来数据进行预测。基于学习模式，机器学习可以分为监督、无监督、强化学习
一文搞懂 AI Agent 与 AI 大模型的区别 a小胡哦人工智能 Manus Ai agent
在人工智能蓬勃发展的当下，新术语和新技术层出不穷。AIAgent和AI大模型便是其中的“明星”，但不少人对它们的区别感到困惑。今天，我们就以Manus这类AIAgent为例，深入剖析AIAgent与一般AI大模型的不同之处。Manus：Manus定义与核心能力AI大模型AI大模型是基于深度学习架构，通过海量数据训练得到的复杂模型，像GPT-4、文心一言等。它们具备强大的知识储备和语言理解生成能力，
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本

《深度学习工程师-吴恩达》04结构化机器学习项目--机器学习（ML）策略1 学习总结 （如何进一步优化系统的方法论）

作者：jliang

《深度学习工程师-吴恩达》04结构化机器学习项目--机器学习（ML）策略1 学习总结

你可能感兴趣的:(学习笔记,深度学习,人工智能)

《深度学习工程师-吴恩达》04结构化机器学习项目--机器学习（ML）策略1 学习总结（如何进一步优化系统的方法论）