walilk

[机器学习] Coursera笔记 - 机器学习应用的建议-Part1

序言

　　机器学习栏目记录我在学习Machine Learning过程的一些心得笔记，包括在线课程或Tutorial的学习笔记，论文资料的阅读笔记，算法代码的调试心得，前沿理论的思考等等，针对不同的内容会开设不同的专栏系列。
　　机器学习是一个令人激动令人着迷的研究领域，既有美妙的理论公式，又有实用的工程技术，在不断学习和应用机器学习算法的过程中，我愈发的被这个领域所吸引，只恨自己没有早点接触到这个神奇伟大的领域！不过我也觉得自己非常幸运，生活在这个机器学习技术发展如火如荼的时代，并且做着与之相关的工作。
　　写博客的目的是为了促使自己不断总结经验教训，思考算法原理，加深技术理解，并锻炼自己的表述和写作能力。同时，希望可以通过分享经验帮助新入门的朋友，结识从事相关工作的朋友，也希望得到高人大神的批评指正！
　　
　　
　　

前言

　　[机器学习] Coursera笔记系列是以我在Coursera上学习Machine Learning（Andrew Ng老师主讲）课程时的笔记资料加以整理推出的。内容涵盖线性回归、逻辑回归、Softmax回归、SVM、神经网络和CNN等等，主要学习资料来自Andrew Ng老师在Coursera的机器学习教程以及UFLDL Tutorial，Stanford CS231n等在线课程和Tutorial，同时也参考了大量网上的相关资料。
　　
　　本篇博客主要整理自“Advice for Applying Machine Learning”课程的笔记资料，包括假设函数的评估、数据集划分、模型选择问题、偏差和方差，以及机器学习诊断法等方面，涵盖了大量的器学习应用的建议和技巧。
　　同时，我也会将自己在机器学习算法应用中的经验分享出来，供大家参考。
　　文章小节安排如下：：
　　1）如何评价一个模型（Evaluating a Hypothesis）
　　2）欠拟合与过拟合（Underfit and Overfit）
　　3）模型选择与数据集划分（Model Selection and Train/Validation/Test Sets）
　　4）如何诊断一个机器学习算法（How to diagnose a algorithm）
　　5）如何调试一个机器学习算法（How to debug a algorithm）
　　6）误差分析（Error Analysis）
　　7）偏斜类问题（Skewed Classes）
　　8）查全和查准的权衡（Trading Off Precision and Recall）
　　9）数据的重要性（Importance of Data）
　　10）最后的总结
　　
　　这是第一篇，前两篇请参考：
　　机器学习应用的建议与方法2
　　机器学习应用的建议与方法3

　　
　　机器学习算法的应用其实是个经验活儿，靠的是日积月累的不断试错和积累。课程里给出了机器学习算法应用中常用的准则、技巧和建议，不过想要全面理解和掌握这些建议，需要反复练习。
　　－
　　　　

一、如何评价一个模型（Evaluating a Hypothesis）

　　当我们针对某个任务训练回归/分类模型时，如何判断模型的性能好坏是极其重要的。以课程中的例子来说明，我们利用线性回归算法来训练房价预测模型，定义了假设函数 H(x) 和 J(θ)，那么我们该如何判断训练出的模型到底性能如何呢？
　　

1.1 常用评价指标

　　Accuracy/Precision/Recall/misclassification rate/missing alarm/false alarm/F1 Score
　　
　　这里列出几项在二分类模型中常用的性能评价指标及其计算方式。先明确true positives（真正类）、true negatives（真负类）、false positive（假正类）、false negative（假负类）的概念，如下所示。
　　

　　
　　更详细一些如下：
　　

[机器学习] Coursera笔记 - 机器学习应用的建议-Part1_第1张图片

　　
　　指标计算方式：
　　 1）Accuracy（准确率）= (true positives + true negatives) / (total examples)
　　Accuracy反映了分类器对整个数据集的判断能力，即能够将正样本判定为正，将负样本的判定为负；
　　
　　 2）Precision（精确度）= (true positives) / (true positives + false positives)
　　Precision的数值表示被分类器判断为正的所有样本中，真正正样本（true positives）的比重。反映了分类器对负样本的识别能力。注意，虽然Precision计算的是正样本所占比重，但我认为该指标反映的其实是分类器对负样本的识别能力，Precision值越小则分类器对负样本的判断能力越弱（误判严重），Precision值越大则分类器对负样本的判断能力越强（误判很少）；
　　
　　 3）Recall（召回率） = (true positives) / (true positives + false negatives)
　　Recall的数值表示所有正样本中被分类器判断为正的比例。反映了分类器对正样本的识别能力，即模型是否可以识别出大多数正样本；
　　注意，Recall与True Positive Rate（真正率 , TPR）或灵敏度（sensitivity）的计算方式一致。
　　
　　 4）misclassification rate（误分率） = (false positives + false negative) / (total examples)
　　misclassification rate，也称0/1错分率，反映了分类器对整个数据集预测错误的情况，与Accuracy互斥，相加为1；
　　　　
　　 5）missing alarm（漏报率/漏警率） = (false negative) / (true positives + false negatives)
　　missing alarm的数值表示正样本被漏判的比例，与Recall互斥，相加为1。
　　
　　 6）false alarm（虚警率/误报率） = (false positives) / (true positives + false positives)
　　false alarm的数值表示被分类器判断为正（正例）的所有样本中，负样本（false positives）的比重（也就是将负样本误检成正样本的比重），false alarm与Precision互斥，相加为1。
　　
　　 7）F1 Score（F1分数） = (2 * precision * recall) / (precision + recall)
　　F1 Score是统计学中用来衡量二分类模型精确度的一种指标。它同时兼顾了分类模型的准确率和召回率。F1分数可以看作是模型准确率和召回率的一种加权平均，可以反映模型的整体情况，它的最大值是1，最小值是0。
　　

1.2 应用中性能指标的选择

　　机器学习中的算法性能评价指标有很多，上面也只是常用的一些。在实际任务中并不是每个指标都被关注，不同的任务侧重不一样，关注的指标也就不同。例如，有的任务可能对虚警容忍度较高（可以多误报一些），但是对召回率或者漏报率要求很严格（绝对不能漏报），那么我们在训练模型和设置判定阈值的时候，就要侧重Recall指标。
　　而在有些任务中更侧重虚警率和计算速度，比如在我负责的有害图像审核系统中，业务部门就更关注虚警率和速度，为什么呢？因此互联网的数据量实在太大，一天动辄就上千万，那么速度很重要就不必说，同时虚警率是绝对要压低的，因为1%的虚警率就意味着误报10w+的样本（复审小组就要累死了……）。所以我们在有害信息识别系统中，模型的虚警率一般都得至少控制在0.3%以下（这其实也比较高了，但是海量数据环境下，误报真的是很棘手的问题）。
　　从评价指标的计算方式就可以看出，各个指标之间是很难兼顾的，通过努力调参，可能某一项指标好了，另一项指标就会变差。因此，在训练分类器模型的时候，一定要搞清楚任务侧重点什么，只有充分考虑业务的实际需求，才能训练出一个实用的算法模型。
　　
　　

二、欠拟合与过拟合（Underfit and Overfit）

　　评价指标罗列了一大堆，也许还是搞不清楚怎么评价一个机器学习模型。其实无论在实验还是应用中，我们评价一个模型时，大多数时候都是在讨论这个模型是否过拟合或者欠拟合，也就是方差和偏差问题，然后据此再更换算法或者调整参数。
　　其实Underfit和Overfit贯穿机器学习，是机器学习的核心问题：偏差-方差权衡。机器学习算法应用的整个过程，每个处理技巧和应用环节也都是围绕着此问题进行。同时，Underfit和Overfit问题也是Ng在这节课里的主要线索。
　　下面对Underfit和Overfie先做一个简单直观的介绍。关于欠拟合和过拟合更深层次的讨论放在后面阐述。
　　
　　机器学习算法表现很差的原因，要么是模型发生了过拟合，要么是发生了欠拟合。下面一张图涵盖所有情况（包括回归和分类）。
　　

2.1 什么是欠拟合？

　　如果一个机器学习模型在训练和预测时表现的都不好，那么认为该模型是欠拟合的。通常来说，如果我们在训练时发现模型在训练集上的误差很大，那基本就可以判断该模型是欠拟合的，也就是模型未考虑足够的信息，从而无法对训练数据精确建模（所以产生欠拟合）。
　　举个回归的例子如下：
　　

[机器学习] Coursera笔记 - 机器学习应用的建议-Part1_第2张图片

　　训练出的模型基本就是一条直线，无法对数据进行充分的建模（拟合），也可以说模型没有充分学习数据的分布情况。
　　
　　举个分类的例子如下：
　　

[机器学习] Coursera笔记 - 机器学习应用的建议-Part1_第3张图片

　　同样，训练出的决策边界也基本是一条直线，完全无视了数据分布……
　　
　　欠拟合通常是不被讨论的，因为欠拟合太容易被发现了，大多数评估指标都可以将欠拟合问题暴露出来。
　　
　　

2.2 什么是过拟合？

　　如果一个机器学习模型在训练集上表现的非常好，而在测试集上表现的不好，那么认为该模型是过拟合的。这意味着训练数据中的噪音或者随机波动也被当做概念被模型学习了，从而降低了模型的泛化能力（generalization）。
　　还是举两个例子来说，回归的例子如下：
　　

　　可以看出，为了精确建模训练集的每个样本，最后拟合出的曲线太扭曲了。
　　
　　分类的例子如下：
　　

[机器学习] Coursera笔记 - 机器学习应用的建议-Part1_第4张图片

　　同样，为了精确分类训练集中的正负样本，决策边界扭曲的不要不要的……这个模型虽然可以百分百正确分类所有训练集样本，但也会造成模型推广时的泛化能力较差，即无法适应新的样本。
　　
　　综上，过拟合的特点就是良好的训练表现和糟糕的测试表现。
　　
　　具体来说，在训练机器学习算法时（定义一个假设并利用训练集进行训练），如果把参数集调整到非常拟合训练集，那么该假设会在训练集上表现地非常好，但这并不能确定该假设在训练集之外的新样本上预测结果如何。因为，只要你的参数非常拟合某个数据集，那么该假设对于该数据集的预测误差是不能够推广到一般情况的，或者说，是不能作为实际的泛化误差（generalization error）的，即该误差不能评估该假设对于新样本的效果。
　　 在机器学习中，避免过拟合是模型设计中的一个核心任务。我们收集整理训练数据，玩命儿调参数，各种正则化技巧，都是为了增加模型的泛化能力。
　　
　　来吧，让我们欣赏一些过拟合的例子！
　　

[机器学习] Coursera笔记 - 机器学习应用的建议-Part1_第5张图片

　　其实，想象力就是人类强大的过拟合能力。　　
　　
　　在接下来的章节中，我们会重点讨论过拟合问题产生的原因和避免方法。为啥不说欠拟合？因为很容易发现和矫正。
　　
　　

2.3 欠拟合发生的原因？

　　如上所述，欠拟合问题是非常容易发现的。一旦你发现训练的模型在训练集上表现就很差，那基本可以断定是算法处于欠拟合，你可以从以下几个角度找原因。
　　1）是否是训练时迭代的次数太少？
　　例如使用神经网络算法做分类任务，如果你只迭代很少的次数，那模型通常就处于欠拟合状态，因为你根本没有给算法充分的学习机会。
　　
　　2）是否是模型（假设函数）过于简单？
　　如果算法经过了充分的迭代，但是在训练集表现依然很差，那很可能是因为模型（假设函数）过于简单了，如下图所示的分类问题。
　　

[机器学习] Coursera笔记 - 机器学习应用的建议-Part1_第6张图片

　　
　　数据的分布情况意味着你没办法用一条直线取得很好的分类效果。所以说，如果你定义只含一次项假设函数（左图的直线）：
　　h _θ(x)=g(θ ₀+θ ₁X ₁+θ ₂X ₂)
　　那肯定不行，再怎么训练，最后误差也会很大。
　　此时，你就得增加模型的复杂度，也就是增加假设函数的特征项，例如可以从更多角度获取更多特征，或者可以扩展一些已有特征的二次项，乘积项等等。下面是扩展特征项后的假设函数（右图的曲线）：
　　h _θ(x)=g(θ ₀+θ ₁X ₁+θ ₂X ₂+θ ₃X ₁ ²+θ ₄X ₂ ²+θ ₅X ₁X ₂)　　
　　
　　这样得到的曲线就可以很好的拟合训练集。
　　上面这种情况只有两个变量，所以可以通过绘图观察趋势。但对于具有很多特征变量的问题，想要通过画出假设函数来进行观察就会变得很难甚至是不可能实现。所以后面会讲一些实用的分析/诊断方法。
　　
　　 3）是否设置了过大的lambda？
　　λ 是正则化技术的核心参数，简单来说，正则化技术用于修正算法的过拟合问题（后面会展开来讲）。所以，如果你即增加了模型复杂度，又经过充分的学习，但是模型在训练集上表现还是很差，那很可能是你设置了过大的 λ 。减小 λ 试试吧！
　　
　　对于欠拟合问题，上述是最常见的原因，如果你判定自己训练的模型处于欠拟合状态，从上面三个角度找原因，通常是可以解决问题的。　　
　　
　　
　　

2.4 过拟合发生的原因？

　　首先要明确一点认知：任何一组训练数据，都是存在噪音和随机性的。
　　展开来说，

　　第一点，在一定时间及空间条件下，任何观察都不可避免的存在误差，因此任何训练集都一定存在噪音数据。我们的目标就是从一堆有噪音的数据中把目标函数学习出来，并且要极力避免噪音的干扰。

　　第二点，我们不可能获得任务相关的样本全集，只能获得子集，而子集可能有着自身专有的特点。任何一组子集（作为训练集）都一定存在着随机性，也就是说子集可能自身存在一些特点/专有特征，而这些特点根本就不是全集的特点（可以看作是假规律）。例如我收集了一批猫的样本给算法学习，如果恰好我收集的都是黑猫样本，那算法很可能就把黑色作为猫的主要特征之一了，以后遇到白猫就认为不是猫，这就很尴尬了。

　　如果理解了上述关于样本的问题，那么就可以理解过拟合的本质：算法过度拟合了训练样本中的噪音和随机特征（或称专有细节、假特征）。
　　
　　判断模型是否处于过拟合状态也是比较容易的，如果一个模型在训练集上表现的非常好，而在实际测试时表现的很差，那通常就认为该模型是过拟合了。
　　如果算法发生过拟合，那么可以从下面几个角度找原因。　　
　　
　　1）是否是训练数据过少？
　　如果训练集过少，那算法很容易拟合全部训练数据，但过小的训练集所含信息太少了（无法充分反映出数据真实分布情况），所以在这种情况下训练出的模型，测试效果自然就很差。
　　解决这个问题的办法是扩充训练集，注意不仅仅是扩充样本数量，还需要增加样本的多样性（就是让算法模型认识更多的样本）。
　　
　　2）是否是模型过于复杂？
　　还是用图来说明。如果你定义了非常复杂的假设函数（右图所示），那么就会学到如图中非常复杂的决策边界，这样的模型泛化能力就比较差。
　　

[机器学习] Coursera笔记 - 机器学习应用的建议-Part1_第7张图片

　　此时，应该尝试减少特征项。
　　但之前提到的问题还是存在，就是图中的任务只有两个变量，通过绘图很容易观察拟合状况。可实际应用中，几百几千几万的特征是很常见的，这就需要某些诊断方法。
　　
　　 3）是否设置了过小的lambda？
　　后面会了解到，λ 的大小反映了在训练过程中，对假设函数中参数的惩罚力度。λ 越大，对参数惩罚力度越大，参数对应的特征项能起到的作用就越小，越有可能造成欠拟合；反之，λ 越小，则越有可能造成过拟合。
　　所以说，如果算法发生过拟合，可以考虑将 λ 设置的稍大一点。
　　
　　

三、模型选择与数据集划分（Model Selection and Train/Validation/Test Sets）

　　欠拟合问题很容易发现也相对比较好解决，而过拟合问题就困难一些，至少只从训练集上的效果，我们是没办法判断模型是否过拟合了。
　　之前例子中分析过两个变量情况下的调试问题，但对于多特征变量的问题，想要通过画出假设函数的拟合曲线来进行观察就会变得很困难甚至不可能实现。
　　标准的模型评估方法是：数据集划分。
　　

3.1 将数据集划分成训练集和测试集

　　将收集整理的数据分成两部分，第一部分作为训练集，第二部分作为测试集。一种典型的分割方法是按照7:3的比例，即70%的数据作为训练集，30%的数据作为测试集。如果这组数据有某种规律或顺序的话，那么最好是随机选择70%作为训练集，剩下的30%作为测试集。
　　
　　此时我们可以通过训练集得到模型参数，通过测试集得到预测误差（也就是在测试集上计算J(θ)），此时这个预测误差就可以较好的反映出我们训练得到的模型是否可以较好的拟合新样本。
　　
　　这种数据集划分方式似乎解决了一些问题，但也存在着不足。例如，我们在设计假设函数时候如何确定最合适的多项式次数？正则化时候如何选择最合适的正则化参数 λ ？显然在训练集上选择多项式次数和 λ 是不合适的，那么在测试集上是否合适呢？
　　
　　想想看，我们在训练集上拟合出参数，然后可以在测试集上验证它们是否有良好的泛化能力；那么如果我们在测试集上拟合出多项式次数和 λ ，应该在哪里验证它们是否有良好的泛化能力呢？？？也许读者已经注意到我这里的用词，我说“拟合出多项式次数和 λ ”，没错，任何通过数据确定参数的过程都可以看作是一个拟合问题，只要是拟合问题，都存在着过拟合的风险。因此，我们是不能用测试集来拟合多项式次数和正则化参数 λ 的，因为存在着过拟合风险。
　　
　

3.2 将数据集划分成训练集、验证集和测试集　　

　　确定假设函数的参数、确定假设函数的多项式次数（例如用变量 d 来表示）、确定合适的正则化参数 λ 等在模型训练中都很关键，这些问题我们统称之为模型选择问题。因此，在训练过程中，除了要确定的假设函数的参数 θ 之外，还要考虑确定参数 d 和 λ ，这同样需要利用数据来确定，换句话说，这同样是一个拟合问题。
　　于是，我们将数据集划分为三个部分：训练集（train set）、验证集（validation set）、测试集（test set）。
　　备注：验证集有时候也可以称为交叉验证集（cross validation set）
　　一种典型的分割比例是将60%的数据分给训练集，大约20%的数据给验证集，最后20%给测试集，这个比例可以稍微调整，但这种分法是最典型的。
　　
　　在这种数据集划分情况下，我们就可以将学习算法的训练分为两个方面：
　　第一，模型选择（训练集 + 验证集）
　　利用训练集来拟合参数 θ，利用验证集来拟合多项式次数 d 和正则化参数 λ ，进而构建出算法模型；
　　第二，模型评价（测试集）
　　利用测试集对模型进行评价，预测该假设能否能够良好地推广到新的样本上（泛化能力）。
　　
　　注意！在划分数据集时，一定要随机选择！
　　综上，我们可以发现，数据集划分其实主要是为了解决过拟合问题。
　　
　　
　　

参考资料

Coursera - Machine learning( Andrew Ng)
https://www.coursera.org/learn/machine-learning
Overfitting and Underfitting With Machine Learning Algorithms
http://machinelearningmastery.com/overfitting-and-underfitting-with-machine-learning-algorithms/
用简单易懂的语言描述「过拟合 overfitting」？
https://www.zhihu.com/question/32246256
推荐系统评测指标—准确率(Precision)、召回率(Recall)、F值(F-Measure)
http://bookshadow.com/weblog/2014/06/10/precision-recall-f-measure/
《随机性》（作者: [美] 黛博拉·J. 本内特，出版社: 吉林人民出版社）
　　
　　
　　

　　End 机器学习应用的建议-Part1

【含文档+PPT+源码】基于SpringBoot+vue的疫苗接种系统的设计与实现小咕聊编程 spring boot 后端 java
项目介绍本课程演示的是一款基于SpringBoot+vue的疫苗接种系统的设计与实现，主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的Java学习者。1.包含：项目源码、项目文档、数据库脚本、软件工具等所有资料2.带你从零开始部署运行本套系统3.该项目附带的源码资料可作为毕设使用疫苗接种系统包括管理员登录、用户管理、疫苗信息管理、疫苗接种管理、接种管理、疫苗百科知识管理、消息通知管理、
Netty基础—Netty实现私有协议栈工业甲酰苯胺 netty
1.私有协议介绍(1)什么是私有协议跨节点的远程服务调用(跨节点通信)，除了链路层的物理连接外，还需要对请求和响应消息进行编解码。在请求和应答消息本身以外，也需要携带一些其他控制和管理类指令。例如链路建立的握手请求和响应消息、链路检测的心跳消息等。当这些功能组合到一起后就会形成私有协议。私有协议并没有标准的定义，只要是能够用于跨进程、跨主机数据交换的非标准协议，都可以称为私有协议。(2)公有协议与
嵌入式软件开发常用的3种架构 an520_ stm32 智能家居嵌入式开发 stm32 单片机 arm 学习嵌入式硬件
摘要：对于单片机程序来说，大家都不陌生，但是真正使用架构，考虑架构的恐怕并不多，随着程序开发的不断增多，架构是非常必要的。应用程序的架构大致有三种：1、简单的前后台顺序执行程序，这类写法是大多数人使用的方法，不需用思考程序的具体架构，直接通过执行顺序编写应用程序即可。2、时间片轮询法，此方法是介于顺序执行与操作系统之间的一种方法。3、操作系统，此法应该是应用程序编写的最高境界。一、程序框架设计1、
DeepSeek从入门到精通「清华团队」 YuKeeHgg DeepSeek 人工智能 ai
由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余梦珑博士后及其团队撰写文档的核心内容围绕DeepSeek的技术特点、应用场景、使用方法以及如何通过提示语设计提升AI使用效率等方面展开，帮助用户从入门到精通DeepSeek的使用。「文末附下载方式」第一部分：DeepSeek基础概念1.1DeepSeek简介定义：专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。核心产品：开源
DeepSeek行业应用案例——教育未来智慧谷 DeepSeek 人工智能大数据 AI教育
一、简介在数字化浪潮汹涌澎湃的当下，DeepSeek以其强大的技术实力，如同一股创新的洪流，席卷众多行业，为各领域带来了前所未有的变革与突破。本案例集初步收录了40多个来自农业、制造业、汽车行业、手机行业、智能家居、物流、云服务、办公、网络安全、金融、医疗、教育等多个关键行业的应用案例。从助力农业实现病虫害精准预测与智能灌溉，到推动制造业生产故障预警与产品质量提升；从优化汽车智能交互体验与智能驾驶
DeepSeek行业应用案例——制造业篇未来智慧谷人工智能深度学习大数据自然语言处理
一、简介在数字化浪潮汹涌澎湃的当下，DeepSeek以其强大的技术实力，如同一股创新的洪流，席卷众多行业，为各领域带来了前所未有的变革与突破。本案例集初步收录了40多个来自农业、制造业、汽车行业、手机行业、智能家居、物流、云服务、办公、网络安全、金融、医疗、教育等多个关键行业的应用案例。从助力农业实现病虫害精准预测与智能灌溉，到推动制造业生产故障预警与产品质量提升；从优化汽车智能交互体验与智能驾驶
基于thinkphp5小区物业管理系统设计与实现(源码+lw+部署文档+讲解等) 阿逸学长 #java毕设精选案例开发语言毕设 php java
基于thinkphp5小区物业管理系统设计与实现(源码+lw+部署文档+讲解等)文章目录基于thinkphp5小区物业管理系统设计与实现(源码+lw+部署文档+讲解等)引言项目概述功能介绍系统管理员：社区业主：技术栈功能截图示例代码数据库操作示例源码获取引言博主介绍：✌专注于Java技术领域和学生毕业项目实战，欢迎大家交流✌主要内容：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、
「清华大学、北京大学」DeepSeek 课件PPT专栏 YuKeeHgg DeepSeek AI 华彬智融知识库 DeepSeek ai 华彬智融
你要的这里都打包好啦，快快收藏起来！名称链接团队简介类型DeepSeek——从入门到精通1️⃣DeepSeek从入门到精通「清华团队」清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室PPT课件DeepSeek如何赋能职场应用?——从提示语技巧到多场景应用2️⃣DeepSeek赋能职场应用「清华团队」中央民族大学新闻与传播学院清华大学@新媒沈阳团队向安玲PPT课件普通人如何抓住DeepSeek红
Yolov8训练自己的数据集(脱离ultralytics库) 爱吃肉的鹏 YOLO
最近在整理关于yolov8的相关内容，有个很大的问题，抛开yolov8性能不谈，yolov8代码的使用灵活性不如yolov5，尤其是对于一些新手或者对yolo框架不是很熟悉的人(这也是因人而异，有些人可能会喜欢v8代码的使用方式)。比如在使用v8的时候需要安装ultralytics库，然后再调用YOLO进行训练或者预测，那么就有这几个问题：问题1：安装了ultralytics库后如何使用YOLO呢
Seaborn 数据可视化指南：核心功能与实战技巧奋斗者1号信息可视化
Seaborn数据可视化指南：核心功能与实战技巧一、Seaborn核心功能1.高级统计图表接口自动统计计算：内置聚合、分布拟合、误差线计算等功能，无需手动处理数据。importseabornassnssns.histplot(data=df,x="age",hue="gender",kde=True)#自动分箱并拟合分布2.美观的默认主题提供darkgrid、whitegrid、dark、whit
人工智能的未来：从基础到前沿的探索与展望小二爱编程· 人工智能 ai AI编程 AI写作 AI作画
1.人工智能简介内容概述：人工智能（AI）是指模拟和执行人类智能任务的技术。随着计算能力和数据量的增加，AI在各个领域取得了显著进展，从自动化的基本任务到解决复杂的实际问题，人工智能正渗透到我们生活的各个方面。2.人工智能的种类与发展内容概述：AI的种类可以按智能的复杂度分为三大类：弱人工智能（NarrowAI）：目前大多数应用都属于弱AI，如语音助手、自动驾驶等。它们专注于特定任务，并且无法扩展
HoRain云--URI vs URL vs URN：彻底搞懂三者的区别与联系 HoRain 云小助手 java 前端开发语言
HoRain云小助手：个人主页⛺️生活的理想，就是为了理想的生活!⛳️推荐前些天发现了一个超棒的服务器购买网站，性价比超高，大内存超划算！忍不住分享一下给大家。点击跳转到网站。目录⛳️推荐URIvsURLvsURN：彻底搞懂三者的区别与联系一、核心概念解析1.URI（统一资源标识符）2.URL（统一资源定位符）3.URN（统一资源名称）二、三者关系图解三、关键区别对比表四、日常应用场景五、技术冷知
python反爬虫处理--处理验证码（Tesseract 库）的安装与使用范哥来了 python 爬虫开发语言
处理验证码是反爬虫策略中常见的挑战之一。在Python中，可以采用多种方法来解决这一问题，具体取决于验证码的类型（如文本、图像或滑块验证等）。以下是一些常用的解决方案：对于简单的文字或数字验证码：如果网站使用的是相对简单的验证码形式，您可以尝试使用OCR(OpticalCharacterRecognition,光学字符识别)技术来自动识别这些验证码。Python中有一个叫做Tesseract的库，
python爬虫 Selenium库安装与使用范哥来了 python 爬虫 selenium
Selenium是一个强大的自动化测试工具，它也可以用来进行网页抓取。与传统的请求库（如requests）不同，Selenium可以模拟真实用户的行为，比如点击按钮、填写表单等，这对于那些依赖于JavaScript动态加载内容的网站来说非常有用。安装Selenium首先确保你的环境中已经安装了Python和pip。然后通过pip安装Selenium：pipinstallselenium如果你使用的
知识蒸馏：从软标签压缩到推理能力迁移的工程实践(基于教师-学生模型的高效压缩技术与DeepSeek合成数据创新) AI仙人掌人工智能 AI 人工智能深度学习语言模型机器学习
知识蒸馏通过迁移教师模型（复杂）的知识到学生模型（轻量），实现模型压缩与性能平衡。核心在于利用教师模型的软标签（概率分布）替代独热编码标签，学生模型不仅学习到教师模型输出数据的类别信息，还能够捕捉到类别之间的相似性和关系，从而提升其泛化能力核心概念知识蒸馏的核心目标是实现从教师模型到学生模型的知识迁移。在实际应用中，无论是大规模语言模型（LLMs）还是其他类型的神经网络模型，都会通过softmax
【迁移学习入门之域适应的背景、理论与方法】进一步理解迁移学习啦？ 985小水博一枚呀深度学习学习笔记迁移学习人工智能机器学习域适应
【迁移学习入门之域适应的背景、理论与方法】进一步理解迁移学习啦？【迁移学习入门之域适应的背景、理论与方法】进一步理解迁移学习啦？文章目录【迁移学习入门之域适应的背景、理论与方法】进一步理解迁移学习啦？1.背景介绍2.理论基础2.1分布差异（DomainShift）2.2迁移学习理论（TransferLearningTheory）2.3领域不变特征（Domain-invariantFeatures）
WebRTC、WebSocket、EasyRTC嵌入式音视频SDK：技术差异与应用场景详细对比 EasyCVR RTC webrtc websocket 音视频 javascript 网络开发语言
WebRTC和WebSocket是两种常用于实时通信的技术，尽管它们都支持实时数据传输，但在设计目标、技术实现和应用场景上存在显著差异。一、概述1）WebRTCWebRTC是一个开源项目，旨在通过简单的API实现浏览器之间的实时音视频通信和数据传输。它支持点对点（P2P）通信，主要应用于音视频通话、屏幕共享、文件传输等场景。2）WebSocketWebSocket是一种基于TCP的通信协议，提供了
Java常用API EmbodiedTech Java架构栈 java dubbo 开发语言
一、今日内容介绍、API概述常用API（全称是ApplicationProgramInterface应用程序接口），说人话就是：别人写好的一些程序，给咱们程序员直接拿去调用。Java官方其实已经给我们写好了很多很多类，每一个类中又提供了一系列方法来解决与这个类相关的问题。比如String类，表示字符串，提供的方法全都是对字符串操作的。比如ArrayList类，表示一个容器，提供的方法都是对容器中的
字符串哈希从入门到精通 LIUJH1233 C++哈希算法算法 c++数据结构
一、基本概念字符串哈希是将任意长度的字符串映射为固定长度的哈希值（通常为整数）的技术，核心目标是实现O(1)时间的子串快速比较和高效查询。其本质是通过数学运算将字符串转换为唯一性较高的数值，例如：其中P为基数(根据题目)，M为大质数，s[i]为字符的ASCII值。二.一般哈希实现一般哈希的实现有两种方式：通俗的讲叫：1.蹲茅坑法2.拉拉链法2.1蹲茅坑法假设你现在要处理19与12（mod7）你会发
kafka相关问题给我个面子中不 Java学习 kafka 分布式 java
Kafka通过事务机制与幂等性功能相结合，实现了跨会话的幂等性。以下是详细解释：kafka是怎么通过事物保证跨会话的幂等性？1.幂等性与跨会话幂等性幂等性：指相同的操作被执行多次，其结果是一样的。在Kafka中，主要是指生产者发送相同的消息不会导致重复。跨会话幂等性：在生产者会话关闭并重启后，Kafka仍能保证发送的消息不会被重复处理。2.Kafka的幂等性原理Kafka的幂等性主要通过Produ
迁移学习基础知识 zhooooooou 深度学习迁移学习人工智能机器学习
简介使用迁移学习的优势：1、能够快速的训练出一个理想的结果2、当数据集较小时也能训练出理想的效果。注意：在使用别人预训练的参数模型时，要注意别人的预处理方式。原理：对于浅层的网络结构，他们学习到的角点信息和纹理信息都是通用的，将学习好的浅层网络的信息迁移到新的网络中，这样新的网络也拥有了识别底层通用特征的能力，从而能加快网络学习新的数据集的高维特征。常见的迁移学习的方式：1、载入权重后训练所有参数
AUTOSAR与arxml的文档解析 dont__cry c语言 autosar
如下是文档脑图一、文档概述该文档是AUTOSAR经典平台的应用接口用户指南，主要解释**AlTable（应用接口表）**的结构、方法论及相关技术细节，帮助开发者理解如何通过标准化接口实现软件组件的互操作性。关键内容目的：定义并发布稳定、广泛接受的汽车电子系统应用接口，支持跨厂商软件组件的通信。结构：包含元模型表示、兼容性管理、生命周期状态、视图概念及XML生成规则等。二、核心概念与示例1.AUTO
提到一个项目的“验证LOV”属性？提到lov和list项目有什么区别？思维导图代码示例（java 架构) 用心去追梦 list java 架构
验证LOV（ListofValues）属性在OracleForms中，LOV(ListofValues)是一种用于显示可供选择的值列表的组件。它通常与字段或项关联，允许用户从预定义的选项列表中选择一个值，而不是手动输入。验证LOV属性确保用户只能从LOV提供的选项中选择值，从而增强了数据输入的准确性和一致性。验证LOV属性定义：当设置为“是”时，表示该字段必须从LOV中选择值；如果用户尝试输入不在
python 游戏开发cocos2d库安装与使用范哥来了 python cocos2d 开发语言
Cocos2d-x是一个广泛使用的开源游戏开发框架，支持多种编程语言，包括Python。对于Python开发者来说，通常使用的是Cocos2d-py或者更现代的Cocos2d-x的Python绑定版本。这里我将指导你如何安装和开始使用Cocos2d-py。安装步骤安装Python：确保你的系统上已经安装了Python3.x版本。你可以从Python官方网站下载最新版的Python。安装pip：pi
迁移学习入门 EmbodiedTech 人工智能大模型迁移学习人工智能机器学习
迁移学习1迁移学习的概念预训练模型定义:简单来说别人训练好的模型。一般预训练模型具备复杂的网络模型结构；一般是在大量的语料下训练完成的预训练语言模型的类别现在我们接触到的预训练语言模型，基本上都是基于transformer这个模型迭代而来的因此划分模型类别的时候，以transformer架构来划分：Encoder-Only:只有编码器部分的模型，代表：BERTDecoder-Only:只要解码器部
通用具身智能机器人首次进厂造芯！量子位
在全球半导体产业竞争日益激烈的背景下，半导体生产在部分高度依赖人力的生产环节，传统的智能化生产模式仍暴露出效率瓶颈与污染问题。人工操作易导致污染，且效率不高、污染控制难度大。如今，随着通用智能机器人的应用，这一难题正迎来全新解决方案。3月18日，国内领先的具身智能机器人公司智平方与全球知名科技创新企业吉利科技集团旗下浙江晶能微电子有限公司正式签署战略合作协议。双方将基于智平方自研的端到端具身大模型
SciER：首个大规模科学文档中的实体和关系抽取数据集数据集
2024-10-28，为科学文档中的实体和关系抽取领域带来了突破，提供了一个包含106篇完整科学出版物、超过24,000个实体和12,000个关系的大规模数据集，这对于构建科学知识图谱和促进科学信息抽取技术的发展具有重要意义。数据集地址：SciER|科学信息提取数据集|人工智能数据集一、研究背景：在科学文档中，实体（如数据集、方法、任务）和它们之间的关系对于理解科学发现和推动研究进展至关重要。然而
HarmonyNext实战：基于ArkTS的高性能网络请求与缓存优化案例详解 harmonyos-next
HarmonyNext实战：基于ArkTS的高性能网络请求与缓存优化案例详解在现代移动应用开发中，网络请求是不可避免的核心功能之一。然而，频繁的网络请求不仅会增加服务器负担，还会影响应用的性能和用户体验。HarmonyOSNext提供了强大的网络请求框架和缓存机制，帮助开发者优化网络请求性能。本文将深入探讨如何在HarmonyOSNext中使用ArkTS实现高性能网络请求与缓存优化。通过一个完整的
HarmonyNext实战：基于ArkTS的跨设备文件同步与冲突解决案例详解 harmonyos-next
HarmonyNext实战：基于ArkTS的跨设备文件同步与冲突解决案例详解在现代多设备协同的场景中，文件同步是一个常见的需求。然而，跨设备文件同步往往会面临冲突问题，例如同一文件在不同设备上被同时修改。HarmonyOSNext提供了强大的分布式文件系统和冲突解决机制，帮助开发者实现高效、可靠的跨设备文件同步。本文将深入探讨如何在HarmonyOSNext中使用ArkTS实现跨设备文件同步与冲突
第十天-字符串：编程世界的文本基石大橙子房 ai python java
在编程的广阔领域中，字符串是极为重要的数据类型，它就像一座桥梁，连接着人类的自然语言和计算机能够理解与处理的数字信息。下面，让我们深入探索字符串的世界。一、字符串简介字符串是由零个或多个字符组成的有序序列，它在程序中用于表示文本信息。在Python语言环境下，创建字符串简洁直观，例如：str="HelloWorld"。这里，str作为字符串变量名，就如同给一个装着文本内容的盒子贴上了标签；Hell
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str

[机器学习] Coursera笔记 - 机器学习应用的建议-Part1

序言

前言

一、如何评价一个模型（Evaluating a Hypothesis）

1.1 常用评价指标

1.2 应用中性能指标的选择

二、欠拟合与过拟合（Underfit and Overfit）

2.1 什么是欠拟合？

2.2 什么是过拟合？

2.3 欠拟合发生的原因？

2.4 过拟合发生的原因？

三、模型选择与数据集划分（Model Selection and Train/Validation/Test Sets）

3.1 将数据集划分成训练集和测试集

3.2 将数据集划分成训练集、验证集和测试集

参考资料

你可能感兴趣的:(机器学习,模型选择,偏差与方差,欠拟合与过拟合,数据集划分)

3.2 将数据集划分成训练集、验证集和测试集