elma_tww

《Python机器学习基础教程》监督学习总结

《Python机器学习基础教程》笔记

一、监督学习的分类

监督学习主要有两种：分类与回归。

分类问题的目标是预测类别标签，回归任务的目标是预测一个连续值。

二、一些术语解释

泛化：从训练集中学习出的模型应用到测试集上的能力

过拟合：模型在训练集上表现良好，在测试集上表现不好

欠拟合：模型在训练集和测试集上表现均不好

特征工程：对已有特征做运算，导出新特征（例如，两个特征的积作为新特征）

方法链：在一行代码中完成几个部分的内容（例如，完成模型初始化、拟合和预测）

三、监督学习算法

监督学习算法有：k近邻、线性模型、朴素贝叶斯分类器、决策树、决策树集成、核支持向量机、神经网络。下面挨个介绍：

1.k近邻

原理：

①用于分类时：对于每个新数据点，考虑其与训练集中k个距离最近的邻居，将这些邻居中出现次数更多的类别作为预测结果。

②用于回归时：对于每个新数据点，考虑其与训练集中k个距离最近的邻居，将这些邻居的平均值作为预测结果。

重要知识点：

①邻居个数越多，决策边界越平滑，模型复杂度越低。

②在Scikit-Learn中，k近邻分类在neighbors模块的KNeighborsClassifier中实现，k近邻回归在neighbors模块的KNeighborsRegressor中实现。

③KNeighbors分类器有2个重要参数：邻居个数与数据点之间距离的度量方法。使用较小的邻居个数（3~5）往往能够得到比较好的结果，距离默认使用欧式距离。

④KNN模型容易理解，但是大数据集时预测速度慢且不能处理具有很多特征的数据集。线性模型就不存在这两个缺点。

另，包含在Scikit-Learn中的数据集通常被保存为Bunch对象，里面包含真实数据以及一些数据集信息。关于Bunch对象。可以用点操作符来访问对象的值。

2.线性模型

原理：

利用输入特征的线性函数进行预测，预测公式为：，其中w包含每个特征坐标轴的斜率，b是y轴的偏移。

分类：

线性模型中还分为普通最小二乘法、岭回归、lasso。线性模型不仅可以用于回归，还可用于分类。

①普通最小二乘法：寻找参数w和b，使得对训练集的预测值与真实值之间的均方误差最小。

②岭回归：预测公式与普通最小二乘法相同，但是要对w进行L2正则化约束（惩罚系数向量L2范数，即欧式长度），w的所有元素都接近于0。

③Lasso：预测公式与普通最小二乘法相同，对w进行L1正则化约束（惩罚系数向量L1范数，即系数的绝对值和），约束过后，某些系数（w）刚好为0。

④线性模型用于二分类：

⑤线性模型用于多分类：每个类都学习一个二分类模型（“一对其余”，例如有A、B、C、D四类，分类器1的任务是将A类和非A类区分出来，分类器2的任务是将B类和非B类区分出来，...），在测试点上运行所有二分类器来进行预测，分数最高的分类器对应的类别即为预测结果。

重要知识点：

①在Scikit-Learn中，普通最小二乘法在linear_model模块的LinearRegression中实现；岭回归在linear_model模块的Ridge中实现；Lasso在linear_model模块的Lasso中实现。

②线性模型的“斜率”参数（w）被保存在coef_属性中，斜距（b）被保存在intercept_中。

③线性模型的主要参数是正则化参数，在回归模型中叫作alpha，在LinearSVC和LogisticRegression中叫C。alpha值较大或者C值较小，说明模型比较简单。如果把alpha设得非常小，则几乎会消除正则化的效果。

④线性模型的训练速度和预测速度非常快。

⑤在实践中，一般首选岭回归，但如果特征很多，且只有几个是重要的，则选择Lasso更好。

⑥最常见的两种线性分类算法是Logistic回归和线性支持向量机，Logistic回归在linear_model模块的LogisticRegression中实现，支持向量机在svm模块的LinearSVC中实现。

另，Scikit-Learn总是将从训练数据中得出的值保存在以下划线结尾的属性中。

3.朴素贝叶斯分类器

原理：

贝叶斯公式，通过单独查看每个特征来学习参数，并从每个特征中收集简单的类别统计数据。

分类：

Scikit-Learn中实现了三种朴素贝叶斯分类器：GaussianNB、BernoulliNB和MultinomialNB。

①GaussianNB：可应用于任意连续数据，GaussianNB分类器计算每个类别中每个特征的平均值和标准差。

②BernoulliNB：用于二分类。BernoulliNB分类器计算每个类别中每个特征不为0的元素个数。

③MultinomialNB：用于多分类。MultinomialNB计算每个类别中每个特征的平均值。

重要知识点：

①BernoulliNB和MultinomialNB主要用于文本分类。

②BernoulliNB和MultinomialNB都只有一个参数alpha，用于控制模型复杂度。原理是向数据中添加alpha个值为正的虚拟点，可以将统计数据“平滑化”。alpha越大，平滑化越强，模型复杂度就越低。

③GaussianNB主要用于高维数据，而另外两种朴素贝叶斯模型则广泛用于稀疏计数数据，例如文本分类。

④朴素贝叶斯的训练和预测速度都很快。

4.决策树

原理：

进行所有可能的测试，找出当前结点处对目标变量来说信息量最大的阈值（即找出在当前结点处，能更好区分各类数据的阈值），进行划分后，继续以上过程，直到满足精度要求。对新数据点进行预测时，首先查看这个点位于特征空间划分的那个区域，然后将该区域的多数目标值作为预测结果。

重要知识点：

①决策树的每个结点都包含一个测试，每个测试划分后的区域边界与坐标轴平行。

③如果树中某个叶结点所包含的数据点的目标值都相同，那么这个叶结点就是纯的。

③控制决策树的复杂度（防止过拟合）有两种常见的策略：预剪枝和（后）剪枝。预剪枝是及早停止树的生长，可通过限制数的最大深度（max_depth）、限制叶结点的最大数目（max_leaf_nodes）或者规定一个结点中数据点的最小数目（min_samples_leaf）来防止继续划分。后剪枝是先构造树，但随后删除或折叠信息量很少的结点。

④未剪枝的树容易过拟合，对新数据的泛化性能不佳。限制树的深度可以减少过拟合，这会降低训练集的精度，但可以提高测试集的精度。

⑤可以用树的特征重要性为每个特征对树的决策的重要性进行排序，如果每个特征重要性很小，很可能是因为另一个特征也包含了同样的信息。

⑥在将基于树的模型用于回归时，不能外推，也不能在训练数据范围之外进行预测。一旦输入超出了模型训练数据的范围，模型就只能持续预测最后一个已知数据点。

⑦算法完全不受数据缩放的影响，但经常会过拟合，泛化性能很差。

5.决策树集成

原理：

合并多个决策树来构建更强大模型。

分类：

随机森林和梯度提升决策树。

①随机森林：每棵树以不同的方式过拟合，再对这些树的结果取平均值来降低过拟合。对于回归问题，对这些结果取平均值作为最终预测；对于分类问题，对所有的预测概率取平均值，然后将概率最大的类别作为预测结果。

②梯度提升决策树：采用连续的方式构造树，每棵树都试图纠正前一棵树的错误。

重要知识点：

①随机森林的名字来自于将随机性添加到树的构造过程中。构造树的方法有两种，第一种是对数据有放回的自助采样，第二种是在每个节点处，随机选择特征的一个子集，并对其中一个特征寻找最佳测试。

②随机森林也可以给出特征重要性：将所有树的特征重要性求和并取平均。固定random_state可以将结果重现（伪随机）。

③随机森林拥有决策树的所有优点，并行计算也很容易，可以用n_jobs参数来调节使用的内核个数，n_jobs = -1表示使用计算机的所有内核。

④对于维度非常高的稀疏数据（例如文本数据），随机森林的表现往往不是很好，线性模型可能更合算。随机森林需要更大的内存，训练和预测的速度也比线性模型要慢。

⑤有两个可以调节的参数：n_estimators（决策树棵数）和max_features（选择的特征个数，决定每棵树的随机性大小）。n_estimators总是越大越好，但是所需的内存也就越多，训练时间也越长。

⑥max_features一般用默认值就可以达到较好的效果，对于分类，max_features = sqrt（n_features）；对于回归，max_features = n_features。

⑦梯度提升回归树既可用于回归，有可用于分类。

⑧梯度提升树通常使用深度很小（1~5）的树，添加的树越多，迭代性能越好。

⑨除了预剪枝与集成中树的数量之外，梯度提升的另一个重要参数是learning_rate（学习率），用于控制每棵树纠正前一棵树的错误强度。一般是根据时间和内存的预算选择合适的n_estimators，然后对不同的learning_rate进行遍历。

⑩梯度提升决策树主要缺点是需要仔细调参，而且训练时间可能会比较长。但是它不需要对数据进行缩放，也适用于二元特征与连续特征同时存在的数据集。

6.核支持向量机

原理：

通过结合核变换，将数据映射到更高维空间，使支持向量机能处理不具线性特征的数据。

核技巧分类：

多项式核和径向基函数。

①多项式核：在一定阶数内计算原始特征所以可能的多项式。

②径向基函数：将数据映射成某一高斯分布。

重要知识点：

①支持向量机可以同时用于分类和回归，分类在SVC中实现，回归在SVR中实现。

②位于类别之间边界上的那些点叫支持向量。

③核支持向量机在低维数据和高维数据（即很少特征和很多特征）上的表现都很好，但对样本个数的缩放表现不好。

④核支持向量机的重要参数是正则化参数C，核的选择以及核相关的参数。径向基函数核只有一个参数gamma，它是高斯核宽度的倒数；gamma和C控制的都是模型复杂度，较大的值对应更复杂的模型，应同时条件。

7.神经网络

原理：

（还是去看书上的图吧，好理解一点（o(╥﹏╥)o））

重要知识点：

①神经网络往往需要很长的训练时间，在“均匀”（所有特征都具有相似的含义）数据上性能最好。

②神经网络调参是门艺术。最重要的参数是层数和每层的隐单元个数。

③神经网络调参的常用方法是，首先创建一个大到足以过拟合的网络，确保这个网络可以对任务进行学习。知道训练数据可以被学习之后，要么缩小网络，要么增大alpha来增强正则化。

④学习的模型和参数由solver参数设定，有三个选项，分别为：‘adam’，‘lbfgs’，‘sgd’。

注，以上所有涉及模块、函数的内容，都是基于Scikit-Learn，另外，Scikit-Learn不支持GPU，所以其实不适合用Scikit-Learn来做深度学习（o(╥﹏╥)o）

最后，关于何时使用哪种模型，做一份快速总结：

1.最近邻

适用于小型数据集，是很好哦的基础模型，很容易解释。

2.线性模型

非常可靠的首选算法，适用于非常大的数据集，也适用于高维数据。

3.朴素贝叶斯

只适用于分类问题，比线性模型速度快，适用于非常大的数据集和高维数据，精度通常要低于线性模型。

4.决策树

速度很快，不需要数据缩放，可以可视化，很容易解释。

5.随机森林

几乎总是比单棵决策树的表现要好，鲁棒性很好，非常强大，不需要数据缩放，不适用于高维稀疏数据。

6.梯度提升决策树

精度通常比随机森林略高，与随机森林相比，训练速度更慢，但预测速度更快，需要的内存也更少，比随机森林需要更多的参数调节。

7.支持向量机

对于特征含有相似的中等大小的数据集很强大，需要数据缩放，对参数敏感。

8.神经网络

可以构建非常复杂的模型，特别是对于大型数据集而言，对数据缩放敏感，对参数选择敏感，大型网络需要很长的训练时间。

YOLOv13_SSOD：基于超图关联增强的半监督目标检测框架（原创创新算法）
YOLOv13_SSOD：基于超图关联增强的半监督目标检测框架项目背景随着深度学习技术的快速发展，目标检测在各个领域都取得了显著的进展。然而，现有的监督学习方法在实际应用中面临着标注数据稀缺、泛化能力不足等挑战。特别是在火灾烟雾检测、工业质检等特定场景中，获取大量高质量标注数据的成本极高。为了解决这一问题，本项目基于最新发布的YOLOv13架构，结合EfficientTeacher半监督学习框架，
2019年5月8日“情绪管理与正向沟通亲子教养践行21天”艳梅Day20 艳梅_8375
一开始的时候总觉得21天践行打卡，而且是每天都必须要做，好难，也许我做不到，也许我会忘，也许我会没有时间，好多的借口和理由。但是当真正的用心去践行，用心去做的时候才发现，其实也没有那么的难。从2019年1月16日的艳梅随笔开始，每天都在不断的践行当中，当自己是发自内心的想去做的时候，才发现完全没有压力，没有任何人的监督和管理，我依然可以坚持到现在。1月16日开始，马上就5个月的时间了，我每天都在做
自律从早睡早起开始邱兰芳
空闲时翻阅网文，大篇幅的都在说自律。自律到底是什么？可以统一答案“早睡早起”百度搜索：自律，出自《左传·哀公十六年》，指在没有人现场监督的情况下，通过自己要求自己，变被动为主动，自觉地遵循法度，拿它来约束自己的一言一行。指不受外界约束和情感支配,据自己善良意志按自己颁布的道德规律而行事的道德原则。朴素简洁的说，自律就是自我约束。有没有数据标准？好像很难定义。我自律的唯一标准就是早睡早起。只要能做到
2023-08-08 安得争渡
以高质量“纪检监察”答卷推动经济社会高质量发展围绕中心才能找准方向，服务大局才能体现价值。纪检监察机关作为党内的“纪律部队”，担负着保证党的政治纲领和政治目标实现的重大责任，必须始终把各项工作置于党的工作大局中去思考推进。省委十二届三次全会是系统谋划四川经济社会发展的一次重要会议，对四川未来发展有着深远战略考量和重大现实意义。必须找准服务中心大局的切入点、着力点，忠诚履职，既督又战，充分发挥监督保
基于小样本学习的图像分类综述 cdyyyyyyy 学习分类机器学习
目录引言基本概念小样本学习方法分类1、数据增强2、迁移学习3、元学习小样本学习主流方法1、基于度量的小样本学习2、基于Pretraining+FineTuning的方法3、基于元学习的小样本学习总结引言因为课程设计要求，所以进行了关于小样本学习的调研。目前小样本学习还是一个比较热门的研究，很多关于小样本学习的论文也陆续发表。本文只是一个概述，具体方法研究还有待深入。基本概念小样本学习（FSL：Fe
李航老师-统计学习小三爷_df1b
三个准则1.作为入门选手，不要每章都看2.不要从零造轮子去实现算法，太浪费时间3.必须能手推公式章节目录##统计学习概论-统计学习的目的是对数据进行==预测与分析==-统计学习的前提是同类数据具有一定的统计规律性-统计学习的方法-监督学习(supervisedlearning)-非监督学习(unsupervisedlearning)-半监督学习(semi-supervisedlearning)-强
亲子日记第二百二十七篇赵羽斐
四月十四日星期六晴我最近发现一个问题，宝贝不喜欢阅读课本，但是他很喜欢读手机的短息。今天她跟姑姑聊天，姑姑打字，他语音，基本没有问题！所以我决定改变战略——让她每天阅读我的日记，监督我！知道妈妈的日记是怎样一番天地。这样我想肯定能够提高宝贝的兴趣，增长阅读能力！希望我的新办法能够带来不一样的效果！只要方法对了，必会事半功倍！一起努力吧！加油加油加油＾０＾~
10.20工作总结 240b9999ea48
p前往正科门店进行参观学习d上午在直营店参观学习，参观别人的门店才会知道自己门店的不足。别人各种地方的卫生什么的都能整理得干干净净，反观咱们加盟店，学习的东西还有很多。下午前往上风杠门店扶持。因为门店明天要培训，所以监督并指导门店打扫卫生晚上回家整理区域内目前发现的问题，并开了一个简短的会议c由于是第一次开展会议，需要会议学习的地方还有很多a前往上风港培训消杀
Android-Compose初步学习总结
一、JetpackCompose的生命周期JetpackCompose中，组合是由可组合项构成的树状结构，用于描述应用界面。它通过初始组合生成，并仅能通过重新组合更新——当应用状态变化时，Compose会安排重新组合，仅重新执行受状态变化影响的可组合项，而非整个UI树。可组合项的生命周期包含三个阶段：进入组合、经历0次或多次重新组合、最终离开组合。组合中可组合项的实例由其调用点（即调用可组合项的源
Android-API调用学习总结每次的天空学习
一、Postman检查API接口是否支持1.“HTTPRequest”来创建一个新的请求。——请求构建界面，这是你进行所有API调用的地方。2.设置请求方法和URL：选择请求方法：在URL输入框左侧，有一个下拉菜单。点击它，选择你想要测试的HTTP请求方法（例如：GET,POST,PUT,DELETE等）。GET：获取数据区别：GET请求通常用于从服务器获取或读取数据。它不应该对服务器上的数据产生
第二章从管理自我到管理他人（七） LiangL
六种一线经理管理很多从事产品生产的计时工人的工厂领班管理八九个分散工作的销售人员的销售经理管理四名经过严格训练的下属的财务经理管理30名直接下属的呼叫中心经理实验室中负责一个博士研究团队的经理管理几名熟练技术工人的工程部经理，包括电工、水暖工、转配工、木匠。这些管理者都需要：计划工作、分配任务、监督进度、给予反馈、教练辅导、绩效考核、招聘和解雇等。——————————新任一线经理转型不成功，初期迹
Android音视频探索之旅 | Webrtc 1对1音视频通话核心流程分析慢行的骑兵音视频 android 音视频 webrtc
一.前言使用Webrtc实现1对1的音视频通话，先从Web端进行学习要比直接从Android端进行学习要轻松许多（若没有JS和Html以及Node基础，查找相关基础教程，能梳理代码的逻辑即可）。本文Android端接入Webrtc是通过引入官方的sdk来实现的。本文涉及到的Demo代码包含三部分，服务器端、Web端、Android端。服务器端使用的是Node，Web使用的是Html和JS，Andr
一次奖励慢时光慢慢闪光
下午第第节课做正式作业本上的作业。做作业之前先把上一次作业的情况说了一下，重点表扬加分的孩子，请他们站起来，让大家为他们鼓掌。理由是，上一次作业是在家里写的，能在不在老师监督下认真的同学都是很对自己严格要求的，真正自律的孩子，一来奖励自律，二来鼓励下一次在家里做作业要向这些孩子学习，偶尔正式作业本上的作业在学校里完不成，带回家做容易写字潦草，应付任务，通过奖励能激励不认真的孩子。奖励方式采取随机抽
自编码器表征学习：重构误差与隐空间拓扑结构的深度解析码字的字节机器学习自编码器重构误差隐空间
自编码器基础与工作原理自编码器（Autoencoder）作为深度学习领域的重要无监督学习模型，其核心思想是通过模拟人类认知过程中的"压缩-解压"机制实现数据的表征学习。这种由GeoffreyHinton团队在2006年复兴的神经网络结构，本质上是一个试图通过编码-解码过程来复制其输入的系统，却在实现这一看似简单目标的过程中，意外地获得了强大的特征提取能力。基本架构与工作流程典型自编码器由对称的两部
从严从实抓好干部管理监督工作 7d209f8577d9
干部日常监督管理是干部监督的一项重要工作，习近平总书记指出，要在日常监督管理上下功夫，坚持抓早抓小、防微杜渐，使咬耳扯袖、红脸出汗成为常态。干部工作中要进一步转变观念、创新方式，把从严管理监督贯穿干部选育管用全过程，让干部习惯在受约束的环境中工作生活。拓宽监督渠道。进一步规范“12380”举报受理工作，落实来访登记快、分流转办快和受理办结快等要求，及时办结信访件，用足监督“利器”。在新媒体发布任前
20180507 复盘142 砖妹子静儿暖静儿
一个团队是否有战斗力，且不说业绩如何，光看精气神就可见分晓。因为监督检查，来到渭南项目。从门卫室门卫人员的随意，到项目院子的荒草半人高；报刊栏设计的“党建”内容，却空空如也！当我们代表公司，来到项目，坐到会议室时，项目的人员但是都在，却不同于国医，工装马甲统一。一对一沟通座谈时，明显的感受到“长期被压抑，无奈，放任自流”的氛围，随时都有卷铺盖走人的风险。这样的团队氛围，何谈凝心聚力、团结一致搞生产
建强基层人才队伍，推动乡村振兴高质量发展 Ava向晚
中共中央总书记、国家主席、中央军委主席习近平近日对党的建设和组织工作作出重要指示指出，全面建设社会主义现代化国家，全面推进中华民族伟大复兴，关键在党，关键在人。新时代10年，党的建设和组织工作始终把政治建设摆在首位，把坚定拥护“两个确立”、坚决做到“两个维护”作为根本政治责任，选人用人突出政治把关，教育培训突出政治训练，干部管理突出政治监督，基层党建突出政治功能，人才工作突出政治引领，有力确保了全
逼出来的自律，帮我扣动行动的”扳机“！进击的卤蛋1989
5天前，我参加了有书组织的99元0门槛拆书训练营，在一次逼出来的自律中，开启了5天的学习之旅。自律的名词解释，是指在没有人现场监督的情况下，通过自己要求自己，变被动为主动。核心是自主管理、自我约束。可悲的是，自律在很多人生活中始终扮演着奢侈品的角色，让人求而不得。于是，市面上开始出现了各种各样的签到打卡，趁早100打卡天、脸疼Flag打卡、有书99元0门槛拆书打卡……衍生出了很多“群体性自律”的训
打好“选育管用”组合拳锻造过硬年轻干部队伍咕嘟咕嘟咕嘟
统筹抓好干部选育管用工作，树立鲜明导向，锤炼过硬本领，激励担当作为，强化管理监督，持续抓好后继有人根本大计，培养选拔用好优秀年轻干部，事关党的事业薪火相传、事关国家的长治久安。作为组织部门，既要把优秀年轻干部选拔出来，还要育得壮、管得住、用得对，打好“选育管用”组合拳，着力建设一支政治过硬、作风扎实、能力出众的年轻干部队伍。比选精择，建好优苗“孵选器”。坚持优中选优、动态管理的原则，严格年轻干部推
【安全等保】华为安全等保二、三级方案精讲【附全文阅读】智慧化智能化数字化方案服务器网络数据库华为安全等保安全等级保护二级安全等保方案三级安全等保方案
华为安全等保二、三级方案围绕网络安全等级保护制度，构建“一个中心三重防护”体系（安全管理中心、安全通信网络、安全区域边界、安全计算环境）。方案覆盖定级、备案、整改、测评、监督全流程，针对二、三级保护对象提供差异化产品组合（如二级基础版含NGFW、主机杀毒、日志审计；三级增强版增配IPS、APT沙箱等），强调合规要求与技术防护结合，应对网络攻击、数据泄露等风险，保障信息系统安全。详细总结一、等保制度
吴恩达机器学习cs229-学习笔记-更新中是娜个二叉树！机器学习学习笔记
吴恩达机器学习cs22901基础概念语言：Matlab/python监督学习定义：获取一组数据集拟合数据从X到Y的映射回归问题：预测的Y是连续的，Y是实数分类问题：分类指的是Y取离散值，输出是离散的两组，正示例和负示例，把所有样本推到这条直线上，用0，1，标识逻辑回归算法，拟合直线区分正，负示例处理相对大量特征的回归算法或者分类算法支持向量机算法：它使用的不是1,2,3,10个输入特征，而是使用无
Python 应用无监督学习（一）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/6b15c463e64a9f03f0d968a77b424918译者：飞龙协议：CCBY-NC-SA4.0前言关于本节简要介绍了作者、本书的内容覆盖范围、开始时你需要的技术技能，以及完成所有活动和练习所需的硬件和软件要求。本书简介无监督学习是一种在没有标签数据的情况下非常有用且实用的解决方案。Python应用无监督学习引导你使用无监督学习技术与Py
卫龙辣条抽查不合格，中毒多年你还有救吗？互联说
近日，湖北省食品药品监督管理局发布食品安全监督抽检信息公告显示，在所抽检的11类食品643批次中，不合格样品21批次，其中包括卫龙、谢博士、小鹏食品、香铛铛、钟芹辉等，多款“辣条”产品被检出不合格瞬间让众多网友瞬间崩溃，惊呼：没想到你是这样的卫龙！而卫龙官方也在第一时间发声明称，卫龙产品完全合法合规。而抽查不合格的原因是，卫龙一直执行现行有效的地方标准，而相关国家标准尚在征求意见阶段。虽然这句高深
机器人-组成结构-感知 - 决策 - 执行具身智能-查布嘎具身智能机器人人工智能
目录一、感知系统内部传感器：外部传感器：二、智能决策系统机器学习家族1.1机器学习2.1深度学习2.2深度学习模型(主要属于监督/强化学习范畴，但结构通用)：3.1监督学习3.2监督学习模型4.1半监督学习4.2无/半监督学习模型：5.1无监督学习5.2生成模型(可属于监督/无监督)：6.1强化学习7.1其他学习三、控制系统（运控）①对应小脑和脊柱一、感知系统①对应人体的五官。由具有不同功能的各种
其实宿舍充满了生活气息一笑而过Mr马
公司经理突击检查职工宿舍，结果不用想我们肯定要挨批，因为已经习惯了，每次卫生检查我们宿舍都是脏乱差。垃圾桶已经漫了出来，烟灰缸惨不忍睹，床铺更是一踏糊涂：被子没叠而且脏兮兮的，有的人的被罩、枕巾和床单油光发亮，地上的鞋子随意的躺着，哑铃和洗衣液不知多久都没用了，上面落了一层灰……接到部长的电话之后就赶紧通知室友回去整理，最终在部长的监督与批评之下，勉强把宿舍整出了个样（公司标准是宾馆级），不过相信
前端学习路线推荐 oldfifteen
第一阶段：HTML+CSS:HTML进阶、CSS进阶、div+css布局、HTML+css整站开发、JavaScript基础：Js基础教程、js内置对象常用方法、常见DOM树操作大全、ECMAscript、DOM、BOM、定时器和焦点图。JS基本特效：常见特效、例如：tab、导航、整页滚动、轮播图、JS制作幻灯片、弹出层、手风琴菜单、瀑布流布局、滚动事件、滚差视图。JS高级特征：正则表达式、排序算
【大语言模型基础】GPT（Generative Pre-training ）生成式无监督预训练模型原理
前言ELMo：将上下文当作特征，但是无监督的语料和我们真实的语料还是有区别的，不一定符合我们特定的任务，是一种双向的特征提取。OpenAIGPT:通过transformerdecoder学习出来一个语言模型，不是固定的，通过任务fine-tuning,用transfomer代替ELMo的LSTM。OpenAIGPT其实就是缺少了encoder的transformer：当然也没了encoder与de
现代人工智能综合分类：大模型时代的架构、模态与生态系统司南锤 economics 人工智能分类数据挖掘
目录引言：人工智能的第四次浪潮与新分类的必要性第一节：大型模型范式的基础支柱1.1规模化假说：算力、数据与算法的三位一体1.2“涌现能力”之谜：当“更多”变为“不同”1.3自监督学习（SSL）革命第二节：大型模型的技术分类学2.1Transformer：现代人工智能的架构基石2.2架构分化：一种功能性分类2.3提升效率与规模：专家混合模型（MoE）2.4超越Transformer：下一代架构的探索
2021-12-01 慢品清茶细读书
这个女人不一般早就听说这个女人不一般，可我一点也不信。她，长相不咋地，身材不咋地，不爱化妆，穿着更是普通，根本没有哪一点能提现出让人得以外表上的赏心悦目。她是从车间流水线上提到检验班的，上来就直接干上了检验班班长的职务。这职务当时在整个生产环节挺牛的。上要和销售部门直接对接，下要和各个车间各个工序和环节接洽。即要面对销售的质量关，还要检查监督并及时反馈产品生产过程存在的一些问题，挺重要的岗位。会干
（C++）list，vector，set，map四种容器的应用——教务管理系统（测试版）（list基础教程）（vector基础教程）（set基础教程）（map基础教程）（STL库教程）双叶836 STL C++C++基础教学 C++项目 c++list 开发语言数据结构 c语言
目录源代码：代码详解：第1步：搭建基础框架和数据结构目标：定义数据结构和全局容器练习任务：第2步：实现学生管理功能（使用map）目标：添加学生和显示学生列表练习任务：第3步：实现课程管理功能（使用vector）目标：添加课程和显示课程列表练习任务：第4步：实现选课功能（使用list）目标：学生选课和退课功能练习任务：主函数：多说一点（重点代码解释）：一.list>enrollments;代码详解1
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo

《Python机器学习基础教程》监督学习总结

你可能感兴趣的:(《Python机器学习基础教程》监督学习总结)