weixin_33728268

决策树-预测隐形眼镜类型（ID3算法，C4.5算法，CART算法，GINI指数,剪枝，随机森林）...

1、问题的引入

2、一个实例

3、基本概念

4、ID3

5、C4.5

6、CART

7、随机森林

我们应该设计什么的算法，使得计算机对贷款申请人员的申请信息自动进行分类，以决定能否贷款?

一个女孩的母亲要给这个女孩介绍男朋友，于是有了下面的对话：

女儿：多大年纪了？

母亲：26。

女儿：长的帅不帅？

母亲：挺帅的。

女儿：收入高不？

母亲：不算很高，中等情况。

女儿：是公务员不？

母亲：是，在税务局上班呢。

女儿：那好，我去见见。

决策过程：

这个女孩的决策过程就是典型的分类树决策。相当于通过年龄、长相、收入和是否公务员对将男人分为两个类别：见和不见

3.定义：

决策树是一种描述对样本实例(男人)进行分类(见或不见)的树形结构。

决策树由结点和有向边组成。最上部是根节点，此时所有样本都在一起，经过该节点后样本被划分到各子节点中。每个子节点再用新的特征来进一步决策，直到最后的叶节点。叶节点上只包含单纯一类样本(见或不见)，不需要在进行划分。

结点两种类型:内部结点和叶结点。

内部结点表示一个特征或属性，叶节点表示一个类。

4.熵

特征选择

首先，我们该选择什么标准(属性、特征)作为我们的首要条件(根节点)对样本(男人)进行划分，决定见或不见呢？——特征选择

母亲希望女儿能最快速的有一个明确的态度，决定见或不见，这样好给男方一个明确的答复。

母亲需要获得尽可能多的信息，减少不确定性。

信息的如何度量？——熵

母亲得到信息越多，女儿的态度越明确，与男方见与不见的不确定性越低。因此，信息量与不确定性相对应。使用熵来表示不确定性的度量。

熵定义：如果一件事有k种可的结果，每种结果的概率为

则我们对此事件的结果进行观察后得到的信息量为:

熵越大，随机变量(见与不见)的不确定性越大。

5.条件熵(局部，现象发生的前提下的熵)

条件熵H(Y|X)表示在已知随机变量X的条件下随机变量Y的不确定性。例如，知道男生年龄的前提条件下，根据女儿见与不见的不确定性。

熵与条件熵中概率由数据估计得到时，所对应的熵和条件熵称为经验熵和经验条件熵。若概率为0，令0log0=0

6.信息增益

信息增益表示得知特征X(年龄)的信息使得类Y(见与不见)的信息的不确定性减少程度。

特征A对训练数据集D的信息增益g(D,A)，定义为集合D的经验熵H(D)与特征A给定条件下的经验条件熵H(D|A)之差

熵H(Y)与条件熵H(Y|X)之差称为互信息，即g(D,A)。

信息增益大表明信息增多，信息增多，则不确定性就越小，母亲应该选择使得信息增益增大的条件询问女儿。

7.信息增益准则的特征选择方法

对数据集D，计算每个特征的信息增益，并比较他们的大小，选择信息增益最大的特征。

8.贷款申请样本数据表（例子）

根据贷款申请样本数据表，我们有15条样本记录，则样本容量为15。最终分为是否贷款2个类，其中是有9条记录，否有6条记录。有年龄、有工作、有自己的房子和信贷情况4个不同特征。每个特征有不同的取值，如年龄有老、中、青3种取值。

熵的定义

计算经验熵

然后计算各特征对数据集D的信息增益。分别以A1，A2，A3，A4表示年龄、有工作、有自己的房子和信贷情况4个特征。

根据年龄有取值青年、中年、老年。

青年贷款是2条记录，否3条记录，共5条记录

中年贷款是3条记录，否2条记录，共5条记录

老年贷款是4条记录，否1条记录，共5条记录

条件熵公式

条件熵公式

年龄为已知条件的条件熵为

D1，D2，D3分别是年龄取值为青年、中年、老年的样本子集。

以年龄为条件的信息增益为

有工作的信息增益

有房子的信息增益

信贷情况的信息增益

最后比较各特征的信息增益值，对于特征A3有自己房子的信息增益值最大，所以选择特征A3作为最优特征。

结合最开始的例子，我们可以知道年龄作为首选特征的信息增益最大，选择年龄作为见与不见首要条件。

9.ID3算法

ID3算法的核心是在决策树各个子节点上应用信息增益准则选择特征，递归的构建决策树，具体方法是:从根节点开始，对节点计算所有可能的特征的信息增益，选择信息增益最大的特征作为节点的特征，由该特征的不同取值建立子节点；再对子节点递归调用以上方法，构建决策树。

直到所有特征的信息增益均很小或没有特征可以选择为止。最后得到一个决策树。

继续前面的过程，由于特征A3(有自己房子)的信息增益值最大，所以选择特征A3作为根节点的特征。它将训练数据集划分为两个子集D1(A3取值为是)和D2(A3取值为否)。由于D1只有同一类样本点，可以明确要贷款给D1，所以它成为一个叶节点，节点类标记为“是”。

对于D2则需要从特征A1(年龄)，A2(有工作)和A4(信贷情况)中选择新的特征。计算各个特征的信息增益:

选择信息增益最大的特征A2(有工作)作为节点特征。A2有2个取值，一个对应“是”(有工作)的子节点，包含3个样本，他们属于同一类，所以这是一个叶节点，类标记为“是”；另一个对应“否”(无工作)的子节点，包含6个样本，属于同一类，这也是一个叶节点，类标记为“否”。

换句话有15个贷款人，经过是否有房这一筛选条件，有房子的6个人能够贷款。剩余9个人需要进一步筛选，以是否有工作为筛选条件，有工作的3个人可以贷款，无工作的6个人不能够贷款。

该决策树只用了两个特征(有两个内部结点)，以有自己的房子作为首要判决条件，然后以有工作作为判决条件是否可以贷款。

ID3算法只有树的生成，所以该算法生成的树容易产生过拟合，分得太细，考虑条件太多。

10.C4.5算法

1.用信息增益选择属性时偏向于选择分枝比较多的属性值，即取值多的属性。

2.不能处理连续属性。

信息增益比定义:特征A对训练数据集D的信息增益比定义为其信息增益与训练数据D关于特征A的值的熵HA(D)之比

其中，，n是特征A取值个数。如A代表年龄。

C4.5算法的改进

C4.5算法是数据挖掘十大算法之一，它是对ID3算法的改进，相对于ID3算法主要有以下几个改进

（1）用信息增益比来选择属性

（2）在决策树的构造过程中对树进行剪枝

（3）对非离散数据也能处理

（4）能够对不完整数据进行处理

11.CART算法

分类回归树(CART,Classification And Regression Tree)其核心思想与ID3和C4.5相同，主要的不同处在于CART在每一个节点上都采用二分法，即每个节点都只能有两个子节点，最后构成的是二叉树。

划分方法

剪枝

名称

体温

表面覆盖

胎生

产蛋

能飞

水生

有腿

冬眠

类标记

人

恒温

毛发

是

否

否

否

是

否

哺乳类

巨蟒

冷血

鳞片

否

是

否

否

否

是

爬行类

鲑鱼

冷血

鳞片

否

是

否

是

否

否

鱼类

鲸

恒温

毛发

是

否

否

是

否

否

哺乳类

蛙

冷血

无

否

是

否

有时

是

是

两栖类

巨蜥

冷血

鳞片

否

是

否

否

是

否

爬行类

蝙蝠

恒温

毛发

是

否

是

否

是

否

哺乳类

猫

恒温

皮

是

否

否

否

是

否

哺乳类

豹纹鲨

冷血

鳞片

是

否

否

是

否

否

鱼类

海龟

冷血

鳞片

否

是

否

有时

是

否

爬行类

豪猪

恒温

刚毛

是

否

否

否

是

是

哺乳类

鳗

冷血

鳞片

否

是

否

是

否

否

鱼类

蝾螈

冷血

无

否

是

否

有时

是

是

两栖类

上例是属性有8个，每个属性又有多个离散的值可取。在决策树的每一个节点上我们可以按任一个属性的任一个值进行划分。比如最开始我们按：

1）表面覆盖为毛发和非毛发

2）表面覆盖为鳞片和非鳞片

3）体温为恒温和非恒温

要产生树的左右两个孩子，按哪种划分最好呢？一般我们采用GINI指数，作为划分标准。总体内包含的类别越杂乱，GINI指数就越大（跟熵的概念很相似）

12.GINI指数

分类问题中，假设有k个类，样本点属于第i类的概率为pi，则基尼指数定义为

体温为恒温时包含哺乳类5个、鸟类2个，体温为非恒温时包含爬行类3个、鱼类3个、两栖类2个。

体温为恒温时包含哺乳类5个、鸟类2个，则：

体温为非恒温时包含爬行类3个、鱼类3个、两栖类2个,则：

集合的基尼指数

如果样本集合D根据特征A是否取某一可能值a被分割成D1和D2两部分，则在特征A的条件下，集合D的基尼增益定义为

如果按照“体温为恒温和非恒温”进行划分的话，我们得到GINI的增益：

集合的基尼指数表示集合D的不确定性，基尼指数值越大，样本属于某类的不确定性也就越大，这点与熵相似。我们总希望获得更多信息，减少不确定性。因此，最好的选取特征划分就是使得集合的基尼指数GINI最小的划分。

13.剪枝

当CART树划分得太细时，会对噪声数据产生过拟合作用。因此我们要通过剪枝来解决。剪枝又分为前剪枝和后剪枝。

前剪枝是指在构造树的过程中就知道哪些节点可以剪掉，于是干脆不对这些节点进行分裂。

后剪枝是指构造出完整的决策树之后再来考查哪些子树可以剪掉。

CART剪枝算法从“完全生长”的决策树的底端剪去一些子树，使决策树变小(模型变简单)，从而能够对未知数据有更准确的预测。

CART剪枝算法由两步组成：首先从生成算法产生的决策树T0底端开始不断剪枝，直到T0的根节点，形成一个子树序列；然后通过交叉验证法在独立的验证数据集上对子树序列进行测试，从中选择最优子树。

CART树中的每一个非叶子节点的表面误差率增益值α(误差增加的速率，越小越好)

是是子树中包含的叶子节点个数。

是节点t的误差代价，如果该节点被剪枝：

r(t)是节点t的误差率；

p(t)是节点t上的数据占所有数据的比例；

是子树Tt的误差代价，如果该节点不被剪枝。它等于子树Tt上所有叶子节点的误差代价之和。

有个非叶子节点t4如图所示：

已知所有的数据总共有60条，则节点t4的节点误差代价为：

注意:叶子节点的类定义为覆盖的样本占多数的类，即分正确的为多数，分错的为少数。

子树误差代价为：

以t4为根节点的子树上叶子节点有3个，最终：

找到α值最小的非叶子节点，令其左右孩子为空，即该节点成为叶子节点，即剪枝。

14.随机森林

随机森林就是建立很多决策树，组成一个决策树的“森林”，通过多棵树投票来进行决策。这种方法能够有效地提高对新样本的分类准确度。

随机森林的步骤：

首先，对样本数据进行有放回的抽样，得到多个样本集。具体来讲就是每次从原来的N个训练样本中有放回地随机抽取N个样本(包括可能重复样本)。

然后，从候选的特征中随机抽取m个特征，作为当前节点下决策的备选特征，从这些特征中选择最好地划分训练样本的特征。用每个样本集作为训练样本构造决策树。单个决策树在产生样本集和确定特征后，使用CART算法计算，不剪枝。

最后，得到所需数目的决策树后，随机森林方法对这些树的输出进行投票，以得票最多的类作为随机森林的决策。

随机森林的方法即对训练样本进行了采样，又对特征进行了采样，充分保证了所构建的每个树之间的独立性，使得投票结果更准确。

随机森林的随机性体现在每棵树的训练样本是随机的，树中每个节点的分裂属性也是随机选择的。有了这2个随机因素，即使每棵决策树没有进行剪枝，随机森林也不会产生过拟合的现象。

随机森林中有两个可控制参数：森林中树的数量（一般选取值较大）和抽取的属性值m的大小。

随机森林的优点：

（1）分类结果更加准确

（2）可以处理高维度的属性，并且不用做特征选择

（3）即使有很大部分数据遗失，仍可以维持高准确度

（4）学习过程快速

（5）在训练完成后，能够给出哪些属性比较重要

（6）容易实现并行化计算

（7）在训练

15.代码—实现ID3算法

1、准备训练数据

2、计算信息增益

下边是计算

下边计算

3、递归构建决策树

其中当所有的特征都用完时，采用多数表决的方法来决定该叶子节点的分类，即该叶节点中属于某一类最多的样本数，那么我们就说该叶节点属于那一类！

创建树

运行测试：

4、查看生成的决策树

5、测试数据

6、决策树的存储

构造决策树是一个很耗时的任务。为了节省计算时间，最好能够在每次执行分类时调用已经构造好的决策树。为了解决这个问题，需要使用python模块pickle序列化对象，序列化对象可以在磁盘上保存对象，并在需要的时候读取出来。

运行测试：

7、示例：使用决策树预测隐形眼镜类型

总结

转载于:https://www.cnblogs.com/chaoren399/p/4847462.html

你可能感兴趣的:(决策树-预测隐形眼镜类型（ID3算法，C4.5算法，CART算法，GINI指数,剪枝，随机森林）...)

「RIA学习力」《第五项修炼》No.06，央央快乐幸福的央央
今天的内容来自《第5章心灵的转变》正负反馈和延迟系统思考的积木块有两种不同类型的反馈过程：正反馈和负反馈。正反馈（或放大反馈）过程是增长的引擎。只要你处在增长的局面，一定就有正反馈作用。正反馈过程也可以产生加速的衰减，很小的衰减被放大成越来越严重的衰减，就像金融恐慌时银行财产的衰减情况一样。负反馈（稳定反馈）起作用时，就有以目标为导向的表现。如果目标是稳定不动，那么负反馈的作用就像车上的刹车装置。
73. 矩阵置零 youzhihua
题目描述给定一个mxn的矩阵，如果一个元素为0，则将其所在行和列的所有元素都设为0。请使用原地算法。示例：输入:[[1,1,1],[1,0,1],[1,1,1]]输出:[[1,0,1],[0,0,0],[1,0,1]]暴力求解思路1.遍历数组中的每个元素，若这个元素等于0，则分别使用两个Set记录下这个元素的横坐标和纵坐标。2.遍历两个Set，将其中的行和列的值都置成0。3.由于题目要求的是原地法
舔狗舔到最后，她又丢钱又丢命赵庭深、沈熹微（舔狗舔到最后，她又丢钱又丢命）完整版小说在线阅读_舔狗舔到最后，她又丢钱又丢命小说免费阅读全章节无弹窗_笔趣阁霸道推书3
小说简介：前世，她只爱男神，为了男神付出一切。她不仅养男神，还养男神的女朋友。后来，更是把家产给了男神。却不知，男神根本不爱她，只想拿她的钱！甚至，还让她染上脏病，痛苦死去……重生后，她发现自己是京圈太子白月光。这一世，她不当舔狗，要好好过好自己的一生。书名：《舔狗舔到最后，她又丢钱又丢命》主角配角：赵庭深、沈熹微推荐指数：✩✩✩✩✩———小说内容试读———赵庭深觉得自己的表现跟平常没什么差别，但
C语言自学日记（三）变量与常量
初学者肯定很懵逼，变量是什么？常量是什么？在数学中，令x=1或者令x=1.10在纸上一写便是，但我们要是在C语言中应该怎么办？在这里我们写一段简单的两端代码#includeintmain(){intx;x=1;return0;}int是什么，如果对前文了解的，应该能明白这是一种数据类型，名为整数类型，它的语法是：数据类型变量名；看到这里，我们就可以对变量做一个简单的介绍，确定目标并提供存放的空间。
PyTorch笔记6----------神经网络案例 HuashuiMu花水木 PyTorch笔记 pytorch 笔记
1.回归网络波士顿房价预测模型搭建波士顿房价数据集下载链接：百度网盘请输入提取码提取码:5279导入所需包importtorchimportnumpyasnpimportre读取数据ff=open('housing.data').readlines()data=[]foriteminff:out=re.sub(r"\s{2,}","",item).strip()#通过正则表达式去除所有空格data
lanqiaoOJ 2145：求阶乘 ← 二分法 hnjzsyjyj 信息学竞赛 #分治算法与双指针算法二分法
【题目来源】https://www.lanqiao.cn/problems/2145/learning/【题目描述】满足N！的末尾恰好有K个0的最小的N是多少？如果这样的N不存在输出-1。【输入格式】一个整数K。【输出格式】一个整数代表答案。【输入样例】2【输出样例】10【评测用例规模与约定】对于30%的数据，1≤K≤10^6.对于100%的数据，1≤K≤10^18.【算法分析】●二分法的应用条件
巴里坤，我的第二故乡！河南妞
走出校门，背起行囊赶赴边疆，来到这座边境小城巴里坤，屈指数来已经32年，在这里度过了我的青春年华，也成就了我的人生，让我成为了半个新疆人，巴里坤，成为了我的第二故乡。巴里坤小城地处东天山北麓，南靠天山，被哈巴公路分割成小城和山坡，小城北面环城路下面便是美丽的巴里坤大草原，整个小城被大草原环抱，而大草原一直向外延申至中蒙边界。巴里坤小城实景巴里坤，全名巴里坤哈萨克自治县，是全国三个哈萨克自治县之一，
14 款命令行常用工具的替代品！杰哥的IT之旅
作者：JackTian文章首发于公众号：【杰哥的IT之旅】大家好，我是杰哥。在Linux操作系统下，ls(list)可以说是我们日常使用率较高的命令了，它主要用来显示目标列表，输出信息可以进行彩色加亮显示，以分区不同类型的文件。关于ls[^1]的语法、选项、实例、扩展知识，这里就不详细介绍了。一、lsdlsd[^2]是一个基于Rust语言编写的ls命令替代品，增加了颜色、图标、树视图、更多格式选项
2023-02-14晨会纪要，敬祝情人节快乐醉爱琳儿
A股2月14日晨会纪要，敬祝情人节快乐阅读蕴藏着无尽可能，有益于明理、增信、崇德、力行，让人生绽放光彩。朋友们早上好！2月14日星期二，情人节快乐！美股三大指数集体收涨，道指涨1.11%，纳指涨1.48%，标普500指数涨1.15%，热门科技股多数上涨;热门中概股普涨，纳斯达克中国金龙指数涨2.60%。百度。腾讯音乐、知乎涨超5%等。昨天大盘最后一小时放量上涨，外围股市普遍上涨，消息面偏向平静。今
信息学奥赛初赛天天练-27-CSP-J2022阅读程序位运算、数据类型范围、进制转换攻略 ya888g 信息学奥赛初赛信息学奥赛位运算数据类型范围进制转换
PDF文档公众号回复关键字:202406122022CSP-J阅读程序1阅读程序(判断题1.5分选择题3分共计40分)01#include0203usingnamespacestd;0405intmain()06{07unsignedshortx,y;08cin>>x>>y;09x=(x|x<<2)&0x33;10x=(x|x<<1)&0x55;11y=(y|y<<2)&0x33;12y=(y|y
0315_算法22级1班实验2（递归分治策略）
目录ProblemA众数问题题目描述输入输出样例输入样例输出思路分析代码实现思路优化ProblemB半数集问题题目描述输入输出样例输入样例输出思路分析代码实现ProblemC查找数组拐点题目描述输入输出样例输入样例输出思路分析代码实现思路优化ProblemA众数问题题目描述所谓众数，就是对于给定的含有N个元素的多重集合，每个元素在S中出现次数最多的成为该元素的重数，多重集合S重的重数最大的元素成为
0301_算法22级1班实验1
目录ProblemA统计数字问题1.题目描述2.思路分析3.代码实现ProblemB字典序问题1.题目描述2.思路分析3.代码实现ProblemC最多约数问题1.题目描述2.思路分析3.代码实现ProblemA统计数字问题1.题目描述题目描述问题描述：一本书的页码从自然数1开始顺序编码直到自然数n。书的页码按照通常的习惯编排，每个页码都不含多余的前导数字0。例如，第6页用数字6表示，而不是06或0
机器人运动学仿真软件：RobWork_（10）.C++编程基础 kkchenjj 机器人仿真机器人 c++java 机器人仿真开发语言模拟仿真
C++编程基础1.C++语言简介C++是一种静态类型的、编译式的通用编程语言，它支持过程化、面向对象和泛型编程。C++由丹麦计算机科学家BjarneStroustrup在1980年代初期在贝尔实验室开发，是C语言的扩展。C++具有高效性、灵活性和广泛的适用性，特别是在系统软件、应用软件、高性能服务器和客户端应用程序的开发中。
PHP 面试题狮子座鲸鱼 php 开发语言
一、PHP新版本特性PHP7是一个重大版本，引入了许多新特性和性能优化，比如返回类型声明、泛型、异步函数、NUllable类型和标量类型声明等。PHP8(2018-今)PHP8引入了许多新特性和改进，在性能上有大幅提升，包括Just-in-Time(JIT)编译器、属性的初始化简化语法、UnionTypes（联合类型）等二、http状态码HTTP协议中几个状态码的含义:1xx（临时响应）表示临时响
Java程序设计笔记是程序蜂啊 java 笔记开发语言
Java程序设计目录Java程序设计第一章java语言开发环境1.1工具篇1.2Eclipse调整字体第三章Java基础3.1java基本数据类型3.2关键字与标识符3.3常数3.4变量3.5.数据类型转换3.6由键盘输入数据4.1顺序结构4.2分支语句5.1什么是数组5.2数组赋值：5.3一维数组5.4二维数组6.1类的基本概念6.2定义类6.3对象的创建与使用6.4参数的传递第七章java语言
[C/C++安全编程]_[中级]_[如何实现不可变变量] Peter(阿斯拉达) C/C++安全编程 const constexpr rust 不可变变量 C++
场景在Rust里有不可变变量，不可变变量可以保证编译器内存安全，禁止数据竞争；并且不可变可以安全的跨线程共享，无需锁。那么C/C++对象有这种不可变变量吗？说明首先说下简单类型是可以通过const来修饰不可变特性的。对象类型结构的不可变特性。先说C肯定是没有的，C的结构体都是public结构，想要让成员不可变，只能通过const来修饰成员变量，但是如果修饰了，也不能改了，虽然可以通过const_c
2024泰剧《死生时刻》中文字幕生死四分钟05集高清HD免费百度云/夸克网盘资源提取码？4 Minutes完整版-4分钟2024最新免费在线观看帮忙赚赏金
《死生时刻》（4Minutes），又名《生死四分钟》，是一部2024年泰国电视剧，由SammonIsareeSiriwankulthon编剧，杰迪帕·迪拉朋帕（JespipatTilapornputt）、温查帕·苏梅提固（WichapasSumettikul）等主演。这部剧集属于奇幻、爱情、剧情类型，讲述了拥有超自然力量的大学生Great的故事。Great就读于工商管理学院，同时也是一位富有企业主
Unreal Engine开发：Unreal Engine基础入门_C++编程基础v1 chenlz2007 游戏开发虚幻 c++java unity 游戏引擎交互 lucene
C++编程基础在开始学习UnrealEngine之前，掌握C++编程基础是非常重要的。C++是一种强大的面向对象编程语言，广泛应用于游戏开发、系统软件开发等领域。本节将介绍C++的基本概念、语法和一些常用的功能，为后续的UnrealEngine开发打下坚实的基础。1.C++简介C++是一种静态类型的、编译式的、通用的、中级到高级的编程语言，它支持多种编程范式，包括面向对象编程、泛型编程和过程化编程
《重生复仇：渣男你别想逃》《南初筝、南辰桡》完整版免费全文在线赏析_《重生复仇：渣男你别想逃》最新章节无广告霸道推书2
小说简介：前世，我掉进了渣男的陷阱里面，被他吃得骨头渣子都不剩，重生后，我回到了关键的时间节点，这一次，我不会再抗拒养兄对我的爱了，毕竟前世他的一切举动，证明了他对我的爱。这一世，我要凭着前世记忆大斗渣男，手撕无良亲生父母，我要把养兄捧在掌心，许他一世深情。书名：《重生复仇：渣男你别想逃》主角配角：南初筝、南辰桡推荐指数：✩✩✩✩✩———小说内容试读———楚净月哭哭啼啼的回到昭勇侯府，楚侯爷不在家
python 变量进阶（理解）程序员同行者
变量进阶（理解）目标变量的引用可变和不可变类型局部变量和全局变量01.变量的引用变量和数据都是保存在内存中的在Python中函数的参数传递以及返回值都是靠引用传递的1.1引用的概念在Python中变量和数据是分开存储的数据保存在内存中的一个位置变量中保存着数据在内存中的地址变量中记录数据的地址，就叫做引用使用id()函数可以查看变量中保存数据所在的内存地址注意：如果变量已经被定义，当给一个变量赋值
C语言：数组-字符串数组
数组字符串基础操作在用格式化说明符%s进行输入输出时，其输入输出项均为数组名。但在输入时，相邻两个字符串之间要用空格分隔，系统将自动在字符串后加\0。在输出时，遇到结束符\0作为输出结束标志。对于字符串的操作，我们需要使用到一些系统提供的API函数。字符串输入scanf语法：scanf("%s",数组名);注意：数组名对应的数组只能是char类型，从控制台输入字符串之后，默认为追加\0案例：#in
Laravel 原子锁概念讲解
引言什么是竞争条件(RaceCondition)？在并发编程中，当多个进程或线程同时访问和修改同一个共享资源时，最终结果会因其执行时序的微小差异而变得不可预测，甚至产生错误。这种情况被称为“竞争条件”。例子1：定时执行某个耗时的任务，如果第一个任务执行时还没有更新数据源，第二个任务就开始了，那么同一个数据源可能被更新或新增两次数据，最终导致数据源错误。例子2：商品秒杀场景：若库存仅剩1件，两个请求
MySQL(149)如何进行数据清洗？辞暮尔尔-烟火年年 MySQL mysql python 数据库
数据清洗在数据处理和分析过程中至关重要，确保数据质量和一致性。以下是一个详细的指南，展示如何使用Java进行数据清洗，包括处理缺失值、重复值、异常值、数据类型转换以及标准化等步骤。一、准备工作确保安装有Java开发环境（JDK）和Maven或Gradle等依赖管理工具。我们将使用ApacheCommonsCSV库来处理CSV文件，并使用Java标准库进行数据清洗操作。二、加载数据首先，我们加载数据
OpenCV中常用特征提取算法（SURF、ORB、SIFT和AKAZE）用法示例（C++和Python）点云SLAM 图形图像处理 opencv 算法 ORB算法 SIFT算法 SURF算法 AKAZE算法计算机视觉
OpenCV中提供了多种常用的特征提取算法，广泛应用于图像匹配、拼接、SLAM、物体识别等任务。以下是OpenCV中几个主流特征提取算法的用法总结与代码示例，涵盖C++和Python两个版本。常用特征提取算法列表算法特点是否需额外模块SIFT（尺度不变特征）稳定性强、可旋转缩放xfeatures2d模块SURF（加速稳健特征）快速但专利保护xfeatures2d模块ORB（OrientedFAST
Python学习笔记 cherishSpring python python 学习笔记
目录一、名词解释二、数据类型（变量名无类型，变量值有类型）三、数据类型转换(万物皆可转字符串)四、标识符五、运算符六、字符串扩展七、数据输入八、if语句九、while语句十、for循环语句十一、函数十二、数据容器1、List列表2、tuple元组3、字符串4、序列的常用操作-切片5、set集合6、dict字典7、数据容器相互转换8、通用操作十三、文件编码一、名词解释1、字面量被写在代码中的固定的值
白帽必备技术栏目一（javascript基础）
直接进入主题正好也在带学生会把笔记同步发送到csdn上后期不管是去就业还是在家里挖洞都都行javascript基础注意事项局部作用域里面给到的变量不加var就会变成全局变量数据类型boolean布尔类型boolean除了0和空字符串以及nullundefined其他的都是truevarbool=true;varbool=false;number类型varnum=10;//10varnum=0x23
2021-03-11今日股市收评和热点概念排名前五名牛大哥淘股
今日股市收评和热点概念排名前五名：周四在权重股带动下，指数高开高走，碳中和继续呈现霸屏节奏，只是热点开始切换到再生铝板块。从涨停股的所属板块上看，有色金属出现涨停潮，成为市场绝对热点，再生铝能否得到延续，需要继续观察。水泥、碳中和、核电、钢铁这些碳中和细分概念同样表现抢眼，水泥也开始出现多只涨停，成为市场次龙头。从目前市场表现看，碳中和的热度依旧，选择时需要继续挖掘碳中和细分概念。
Win10如何批量修改文件后缀名？Win10批量修改文件后缀名的方法 xhp618 笔记1 笔记
电脑文件都有一个固定的格式，并且每个格式都代表着不同的文件类型，但是有时候我们需要批量修改文件的后缀名要如何去操作呢？下面就让小编和大家来讲一讲Win10批量修改文件后缀名的方法。Win10批量修改文件后缀名的方法1、右键选择文件“属性”，即可查看文件的类型。2、点击左下角的“开始键-控制面板-文件夹选项”，然后点击“查看”，找到“隐藏已知文件夹类型的扩展名”取消勾选，点击应用，就可以直接显示文件
【AI 赋能：Python 人工智能应用实战】5. 梯度下降家族：SGD/Adam优化器对比实验与选择策略 AI_DL_CODE 人工智能 python 梯度下降优化器 SGD Adam PyTorch
摘要：本文系统解析梯度下降优化器的核心原理与演进脉络，构建从理论到实战的完整知识体系。理论部分梳理优化器发展里程碑，从1951年的SGD到2018年的AdamW，揭示技术迭代逻辑；通过数学公式对比SGD、Momentum、Adam等核心算法的更新机制，解析动量加速、自适应学习率的创新点。结合损失曲面分析，阐释Momentum如何逃离鞍点、Adam如何处理悬崖梯度。实战模块基于PyTorch在MNI
《半熟之恋：我与豪门大佬的驭爱之路》江黎、罗靳延已完结小说_江黎、罗靳延(半熟之恋：我与豪门大佬的驭爱之路)全文免费阅读无弹窗大结局霸道推书2
小说名：《半熟之恋：我与豪门大佬的驭爱之路》主角配角：江黎、罗靳延简介：“先生，借个火。”这是她同我讲的第一句话。我本以为，她与那些被金主大佬带上船的庸脂俗粉一样只是为了图钱，毕竟她的皮囊确实一顶一的好。就连我，在初见略有落魄的她时，也不禁暗自称赞好相貌。在她的雪茄被点燃的那一刻，我的悸动也随之暗自生根发芽，我们两人的羁绊也就此开始。推荐指数：✩✩✩✩✩———阅读全文小说内容请翻阅最底部———“你
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，

名称	体温	表面覆盖	胎生	产蛋	能飞	水生	有腿	冬眠	类标记
人	恒温	毛发	是	否	否	否	是	否	哺乳类
巨蟒	冷血	鳞片	否	是	否	否	否	是	爬行类
鲑鱼	冷血	鳞片	否	是	否	是	否	否	鱼类
鲸	恒温	毛发	是	否	否	是	否	否	哺乳类
蛙	冷血	无	否	是	否	有时	是	是	两栖类
巨蜥	冷血	鳞片	否	是	否	否	是	否	爬行类
蝙蝠	恒温	毛发	是	否	是	否	是	否	哺乳类
猫	恒温	皮	是	否	否	否	是	否	哺乳类
豹纹鲨	冷血	鳞片	是	否	否	是	否	否	鱼类
海龟	冷血	鳞片	否	是	否	有时	是	否	爬行类
豪猪	恒温	刚毛	是	否	否	否	是	是	哺乳类
鳗	冷血	鳞片	否	是	否	是	否	否	鱼类
蝾螈	冷血	无	否	是	否	有时	是	是	两栖类

决策树-预测隐形眼镜类型 （ID3算法，C4.5算法，CART算法，GINI指数,剪枝，随机森林）...

你可能感兴趣的:(决策树-预测隐形眼镜类型 （ID3算法，C4.5算法，CART算法，GINI指数,剪枝，随机森林）...)

决策树-预测隐形眼镜类型（ID3算法，C4.5算法，CART算法，GINI指数,剪枝，随机森林）...

你可能感兴趣的:(决策树-预测隐形眼镜类型（ID3算法，C4.5算法，CART算法，GINI指数,剪枝，随机森林）...)