数据挖掘导论学习总结——第四章

第四章：分类与预测

分类方法用于预测数据对象的离散类别，预测则用于预测数据对象的梁旭取值，例如我们可以构造一个分类模型来对银行贷款进行风险评估，也可以简历一个预测模型以利用顾客收入与职业预测其可能用于购买计算机设备的支出大小。最初的数据挖掘方法大多都是建立在机器学习、专家系统、统计学和神经生物学等领域的分类与预测算法，目前数据挖掘方法都要求具有基于外存以处理大规模数据集合能力且具有可扩展性。本章讲初步探讨决策树归纳方法、贝叶斯分类方法和贝叶斯信念网络等数据分类方法，此外还有KNN、基于示例学习法、遗传算法等其他分类学习方法。而预测方法则包括线性及分线性回归模型等内容。

分类与预测基本知识

分类学习方法所使用的数据集称为训练样本集合，因此分类学习有称为监督学习，它是在已知训练样本类别的情况下，通过学习建立相应模型，而无监督学习则是训练样本的类别与类别个数均未知的情况下进行的。通常分类学习的模型可以表示为分类规则行事、决策树行事或数学公式形式等。在得到分类模型后，我们需要对模型分类的准确率进行估计，例如holdout方法。它利用一组带有类别的样本进行分类测试，测试样本随机获得且与训练样本相互独立。对于一个给定数据所构造出模型的准确性可以通过由该模型所正确分类的数据样本个数所占总测试样本比例得到。若模型的准确率是通过学习数据集的测试所获得的，这样由于学习模型倾向于过分逼近训练数据，从而造成对模型测试准确率的估计过于乐观。因此需要使用一个测试数据集来对所获得的模型的准确率进行测试工作。

分类与回归是两种主要预测形式，分类用于预测离散或符号值，而回归择时用于预测连续或有序值。通常在数据挖掘中，将预测离散无序类别的数据归纳方法称为分类方法，将预测连续有序值的数据归纳方法称为预测方法。

与分类与预测有关的若干问题

在进行分类或预测前，我们需要对数据进行预处理，以提高分类或预测的准确性、效率和可扩展性。数据预处理主要包括数据清洗、相关分析、数据转换三个步骤。在对分类方法进行比较时，我们可以用预测准确率、计算速度、鲁棒性、可扩展性和易理解性等方面对模型进行比较。其中鲁棒性是指在数据带有噪声和有数据遗失的情况下模型仍然能够进行正确预测的能力，可扩展性描述的是处理大量数据并构相应学习模型所需要的能力。

接下来我们将逐一介绍各个分类与回归模型。首先从我们最熟悉的决策树模型入手，读者们可以回顾一下信息熵和信息增益的概念。

基于决策树的分类

决策树归纳方法是目前许多基于规则进行归纳数据挖掘商用系统的基础，一下是最常用的ID3算法描述。

算法：Generate_decision_tree #根据给定数据集产生一个决策树
输入：训练样本，各属性均取离散数值，可供归纳的候选属性集为attribute_list
输出：决策树
处理流程：

创建一个结点N
若该结点中的所有样本均为同一类别C，则返回N作为一个叶结点并标记为类别C
若attribute_list为空，则返回N作为一个叶结点并标记为该结点所含样本中类别个数最多的类别。否则从attribute_list中选择一个信息增益最大的属性test_attribute，并将结点N标记为test_attribute
对于test_attribute中的每一个已知取值 ai ，划分结点N所包含的样本集。根据 test_attribute=ai 条件，从结点N产生相应的一个分支，表示该测试条件，并将 si 设为满足 test_attribute=ai 条件的样本集合
若 si 为空，则将相应叶结点标记为该结点所含样本中类别个数最多的类别。否则将相应叶结点标记为Generate_decition_tree( si , attribute_list - test_attribute).

基本决策树算法是一个贪心算法，它采用自上而下，分而治之的递归方式。其中递归操作的停止条件分为三种：

一个节点的所有样本均为同一类别
若无属性可用与划分当前样本集，则利用投票原则，少数服从多数，将当前结点强制为叶节点，并标记为当前结点所含样本集中类别个数最多的类别。
没有样本满足 test_attribute=ai ，则创建一个叶结点并将其标记为当前结点所含样本集中类别个数最多的类别。

在决策树归纳方法中，通常使用信息增益方法来确定生成每个结点时所应采用的合适属性，这样可以选择具有最高信息增益（熵减少的程度最大）的属性作为测试属性，保证对之后所划分获得的训练样本子集进行分类时所需要的信息最少。也就是说，利用该属性进行当前样本集合划分，将会使得所产生的各样本子集中的“不同类别混合程度”降为最低。因此采用这种信息论方法可以帮助有效减少对象分类所需要的次数，从而确保产生的决策树最为简单，尽管不一定是最简单的。

设S代表一组训练样本集，每个对象的类别已知，共有m个不同类别，即S包含 si 个类别为 Ci 的数据行， i∈[1,2,...m] . 任何一个对象属于 Ci 的概率为 pi=si/s . 这里s为集合S中所有样本总数。一个决策树可用于对数据对象进行分类，因此决策树可以看成是 Ci 的一个信息源，为产生相应信息需要的信息熵为

I (s 1, s 2, . . . s m) = - \sum p i l o g 2 p i

若属性A可以取值为

{a1,a1,...av} { a 1 , a 1 , . . . a v } , 且该属性用作决策树的一个结点时，它将会把对应的数据集合分成v份，即

{S1,S1,...Sv} { S 1 , S 1 , . . . S v } ，其中

Sj S j 包含属性A取同一值

ai a i 的数据行。

Sj S j 包含

sij s i j 个类别属性为

Ci C i 的数据对象。根据属性A的取值对当前数据集进行划分所获得的信息就称为属性A的熵，计算公式如下：

E (A) = \sum j = 1 v s 1 j + s 2 j + . . . + s m j s I (s 1 j, s 2 j, . . . s m j) = \sum j = 1 v s j s I (s 1 j, s 2 j, . . . s m j)

其中

s1j+s2j+...+smjs s 1 j + s 2 j + . . . + s m j s 项被当做第j个自己的权值，它是由所有自己种属性A取

aj a j 值的样本数之和除以S集合中的样本总数。E(A)计算结果越小，就表示其自己划分结果越纯，越好。对于一个给定的子集

Sj S j ，它的信息为

I (s 1 j, s 2 j, . . . s m j) = - \sum i = 1 m p i j l o g 2 (p i j)

其中

pij p i j 为子集

Sj S j 中任一个数据样本属于类别

Ci C i 的概率。因此通过选择属性A并进行决策树分支而获得的信息增益可以由以下公式计算：

G a i n (A) = I (s 1, s 2, . . . s m) - E (A)

即Gain(A)被认为是根据属性A取值进行样本集合划分所获得的信息熵的减少量。
ID3方法根据S集合中数据对象来计算每个属性的Gain(A)值，并从中选择出值最大的属性作为决策树的根节点，并该属性的取值个数将初始数据集划分为v份，即通过不断对每个新产生的数据子集循环进行上述操作，直到产生所有叶结点。

决策树归纳算法无需相关领域知识。归纳的学习与分类识别操作处理都相当快。对于具有细长条分布性质的数据集合来讲，决策树归纳算法相应的分类准确率相当高。

然而，在决策树构造过程中，我们可以回遇到一些异常数据，或是存在噪声。我们可以利用树枝修建的方法对其进行处理，即通过利用统计方法删去最不可靠的分支，以提高今后分类识别的速度和分类识别新数据的能力，通常分类事前修剪和事后修剪两种方法。

事前修剪方法通过提前停止分支生成过程，即通过在当前结点上就判断是否需要继续划分该结点所含训练样本集来实现。一旦停止分支，当前结点就称为一个叶结点。该叶结点中可能包含多个不同类别的训练样本。具体来说，我们可以利用统计学上的重要性检测卡方检验或信息增益等来对分支生成情况进行评估。如果在一个结点上划分样本集时，会导致结点中样本数量少于指定的阈值，则停止继续分支。但确定一个合理的阈值也比较困难。

事后修剪方法从一个充分生长的树中修剪掉多余的树枝，被修剪的结点成为一个叶结点，并将其标记为它所包含样本中类别个数最多的类别。对于树中每个非叶结点，计算出该结点被修剪后所发生的预期分类错误率，同时根据每个分支的分类错误率以及每个分支的权重（样本分布），计算若该结点不被修剪时的预期分类错误率。如果修剪导致预期分类错误率较大，则放弃修剪，否则就将相应结点分支修剪删去。在产生一系列的经过修剪的决策树之后，我们可以利用一个独立的测试数据集，对这些经过修剪的决策树的分类准确性进行评价，保留下预期分类错误率最小的决策树。除此之外，我们也可以利用编码长度来进行修剪，最佳修剪树就是编码长度最短的决策树。该原则的基本思想是，最简单的就是最好的，利用最短描述长度（MDL，Minimum Description Length）进行决策树修剪时无需额外的独立测试数据集。

接下来我们考虑如何对经典的ID3算法进行改进。首先是对于连续取值属性A的优化，我们可以将其进行二值化，分别对应两个分支。基本的决策树归纳方法对一个测试属性的每个均值产生一个相应分支，且划分相应的数据样本子集，划分过程中将会由于子集规模过小所造成的统计特征不充分而停止。二元决策树比传统决策树更可能具有较好的分类预测准确性。

其次，在运用信息增益方法的时候，我们会偏向于选择取值较多的属性，针对这一问题，我们可以考虑采用增益比率，把每个属性取值的概率考虑在内，例如gini索引方法、卡方条件统计表方法和G统计方法等。

再者，许多处理遗失数据的方法也值得借鉴。我们可以利用属性A中最常见的值来替代一个遗失或未知属性A的值，或者我们也可以利用属性A与其他属性之间的关系来进行缺失值的填补。

最后，随着数据集的不断分解，每个数据子集将会变得越来越小，可能出现碎片、重复、复制等问题。属性构造是防止这类问题发生的一种解决方法，利用已有属性构造新的属性可以帮助改善现有属性集的在表示范围上的局限性。

贝叶斯分类方法

贝叶斯分类器是一个统计分类器，能够预测类别所属的概率。朴素贝叶斯分类器假设一个指定类别中各个属性的取值是相互独立的，也被称为类别条件独立，它可以帮助有效减少在构造贝叶斯分类器时所需要进行的计算量。其中一个最重要的定理就是贝叶斯定理，即

P (θ | x) = P ( θ ) P ( x | θ ) P ( x )

朴素贝叶斯分类算法如下：

每个数据样本都是一个n维特征向量，即属性( A1,A2,...An )的具体取值
假设共有m个不同类别， C1,C2,...Cm ，给定一个位置类别的数据样本X，分类器在已知X的情况下，预测X属于后验概率最大的那个类别，即

P (C i | X) > P (C j | X) \forall 1 \leq j \leq m

也就是说

P(Ci|X) P ( C i | X ) 的值是最大的。
3. 由于P(X)对于所有的类别均是相同的，我们只需要使得

P(X|Ci)P(Ci) P ( X | C i ) P ( C i ) 最大即可，其中

P(Ci) P ( C i ) 可以利用公式

P(Ci)=si/s P ( C i ) = s i / s 进行估算。
4. 根据所给定的数据集，直接计算

P(X|Ci) P ( X | C i ) 运算量通常非常大，为了实现估算，朴素贝叶斯通常假设各个类别是相互独立的，即各个属性的取值是相互独立的，从而有

P (X | C i) = \prod k = 1 n P (x k | C i)

于是我们的任务成为根据训练数据估算

P(xk|Ci) P ( x k | C i ) 的值，我们可以分两种情况进行讨论。
若

Ak A k 是离散值，则

P(xk|Ci)=siksi P ( x k | C i ) = s i k s i ，其中

sik s i k 为训练样本中类别为

Ci C i 且属性

Ak A k 取值为

vk v k 值的样本数量。若

Ak A k 为连续变量，我们假设其具有高斯分布，即

P (x k | C i) = g (x k, μ C i, σ C i) = 1 2 π - - \sqrt σ C i exp ( x - μ C i ) 2 2 σ 2 C i

为了预测一个位置样本X的类别，我们用以上方法计算 P(X|Ci)P(Ci) ，并将其归类为后验概率最大的一类

从理论上讲，与其他分类器相比，贝叶斯分类器具有最小的错误率。但在实际应用中，由于其所依据的类别独立性假设和缺乏某些数据的准确概率分布，从而使得贝叶斯分类器预测准确率受到影响。各种研究结果表明，与决策树和神经网络分类器相比，贝叶斯分类器在某些情况下具有更好地分类效果。在某些特定假设下，许多神经网络和曲线拟合算法的输出都同贝叶斯分类器一样，使得后验概率取值最大。

在朴素贝叶斯的基础之上，我们考虑贝叶斯信念网络。在朴素贝叶斯中，我们基于假设各类别相互独立从而估算后验概率，也就是要求样本属性的取值是相互独立的。这一假设简化了分类计算复杂性。若这一假设成立，则与其他分类方法相比，朴素贝叶斯分类器是最准确的。但在实际应用中，变量间的相互依赖情况会非常紧密，我们进一步考虑信念网络模型，用来描述这种相互关联的概率分布。该网络描述各个属性子集之间有条件的相互独立，并利用图形模型来描述其中的因果关系。

一个信念网络包含两方面的内容，有向无环图与条件概率表。在有向无环图中，每一个结点代表一个随机变量，每一个弧代表一个概率依赖。条件概率表定义了一个条件分布 P(Z|parent(Z)) ，其联合概率可以表示为

P (z!, z 2, . . . z n) = \prod i = 1 n P (z i | p a r e n t (Z i))

信念网络中的一个结点可以被选为输出结点，用来代表类别属性，网络中可有多于一个输出结点，该网络可以利用学习推理算法。其分类结果返回的是概率分布。

若网络结构已经确定且所涉及的变量均为可观察变量，我们就可以进行下一步的网络学习，与朴素贝叶斯分类方法中的概率计算方法类似。若存在隐含变量，则可以利用梯度下降法来帮助训练信念网络，其训练目标是获得CPT（Conditional Probability Table）的入口值，原理类似于神经网络中的隐藏层。梯度下降法采用的是贪心爬山搜索操作，每次循环群众都被更新并最终收敛于局部最优解。

神经网络分类方法

神经网络的优点是对噪声数据有较好的适应能力，并且对未知数据也具有较好的预测分类能力。一个多层前馈神经网络利用后传算法完成相应的学习任务。神经网络的输入层对应每个训练样本的各属性取值，隐藏层的带权输出又作为输入再传递给下一隐藏层，最后的隐层结点带权输出给输出等单元，即为预测概率。只要隐藏层足够多，多层前馈网络中的线性阈值函数可以充分逼近任何函数。

在对神经网络训练开始之前，需要确定神经网络的结构，包括输入层的单元数，隐含层的层数，每个隐含层的单元数目以及输出层单元数目。对于输入层，通常需要对各属性规格化到[0,1]区间。神经网络的结构设计是一个不断试错的过程，不同网络结构所获得的神经网络常常会获得不同的预测准确率。网络中的权重初始值设置也会影响最终的预测准确率。BackPropogation方法可以对神经网络进行训练，不断修改权重以使网络输出与实际类别之间的均方误差达到最小。尽管无法理论保证，但通常在学习停止时权重修改将会收敛。

但神经网络的一个主要缺点就是网络锁隐含知识的清晰表示。以网络及其各单元间连接的权值和偏差所构成的知识难以被人理解。神经网络规则的抽取和网络敏感性分析已经成为研究中的一个重点。

基于关联的分类方法

关联分类主要分为两步，第一步是利用标准关联规则算法挖掘出有关的关联规则，第二步是基于所挖掘出的关联规则构造一个分类器。关于关联分类方法将在第五章详细介绍。

设D为训练数据集，Y为D中所有类别的集合。D中的每个数据样本d是用一组（属性-值）对和一个类别y来表示。设I为D中所有（属性-值）对集合。一个关联分类规则（CAR）具有（conditionset ⇒y ），其中conditionset为一组（属性-值）对的组合，即有 conditionset⊂I,y∈Y ，因此我们可以用

分类器准确性分析

holdout和cross validation是两种常用的评估分类器预测准确率的技术。这两者均是在给定数据集中随机取样划分数据。在holdout方法中，所给定的数据集被随机划分为两个独立部分，一般三分之二作为训练数据，剩下三分之一作为测试数据，对其预测准确率进行评估。holdout一个简单的改进是重复利用holdout方法进行预测准确率估计k次，最后对这k次所获得的预测准确率取平均值。

为了提高预测准确率，我们可以利用bagging与boosting方法。

预测方法

对一个连续数值的预测可以利用统计回归方法建立模型来实现。借助变量转化，我们可以将一个非线性问题转换成一个线性问题。

最基础的一元线性回归可以用最小二乘法或极大似然估计进行求解。同理，多元回归也可以用最小二乘法求解。再进一步，我们可以推广到非线性模型与广义线性模型。其中广义线性模型可以处理离散变量，常见的有逻辑回归模型与泊松回归模型。逻辑回归模型也称为对数线性模型，可以用于数据压缩和数据平滑等，因为高维数据所受到造成的干扰比低维数据要少许多，高维数据占用的空间也比低维数据要少许多。

13周｜会议记录绳系
你好，我是绳系。今天是2022年3月28日。感谢你的到来，接下来，让我们一起度过愉快的阅读时光吧。今天给大家复盘一下绳系阅读群第三次会议记录。3月27日社群内部开展了一场腾讯会议，内容如下。会议主题：13周的学习总结会议时间：2022年3月27日18：00会议地址：线上腾讯会议主持人：绳系参与人：绳系阅读群部分成员（排名不分先后）东东、木子、谢琳、叶同学、Lucy、观摩、进击中的罗罗、杰怡妈、朱朱
【RH134问答题】第十章控制启动过程不怕娜服务器数据库网络
系列文章第一章提高命令行生产效率第二章计划将来的任务第三章调优系统性能第四章使用ACL控制对文件的访问第五章管理SELinux安全性第六章管理基本存储第七章管理逻辑卷第八章实施高级存储功能第九章访问网络附加存储目录系列文章请简要说明RHEL8的启动过程。系统重启和关机的命令分别是什么?Systemdtarget是什么？重置丢失的root密码需要哪些步骤？如何让系统日志在重启后持久保留？请简要说明R
你真的会使用微信吗？剽悍的今天
看完【自品牌】第四章才了解到原来微信有这么大的用处，而我却只是拿来偶尔发一下朋友圈，真是暴殄天物。难怪猫叔跟我们说微信号是一座金矿。现是社交媒体时代，人人都爱分享自己，人们习惯于在微信或微博上等展现自己。微博的出现带火了一批人，微信公众号出来又成就了一批人。现抖音出来又火了一部分人。在这个时代越来越多的人爱表现自己。就连我自己也一样，有时也忍不住在朋友圈分享自我生活或工作等说说图片等。但这也只是发
第四章意外再见寓言在天边
和大家一起商量和讨论后，E-LAN的项目方案已经初步有了眉目。谨妍时常很享受如今工作当中的气氛，大家都很专业，同时又很幽默，平时办公室的聊天，谨妍时常忍俊不禁笑出声，若需一起开会时，大家又很专业严谨，不管工作上遇到什么难题，只要有人能一起为了解决这个难题，讨论讨论就总会有结果的，谨妍自己都没意识到与他们的默契度越来越高。方案的制定比想象中的要顺利很多，谨妍安排小安和欣羽把方案的其他部分完成，自己拟
C语言入门学习 --- 4.数组子期cod c语言学习算法
文章目录第四章数组1.一维数组的创建与初始化。1.1一维数组的创建1.2一维数组的初始化1.3一维数组的使用1.4一维数组在内存中的存储2.二维数组的创建与初始化2.1二维数组的创建2.2二维数组的初始化2.3二维数组的使用2.4二维数组在内存中的存储3.数组越界4.数组作为函数参数4.1冒泡排序函数4.2数组名是什么？5.数组实例：5.1五子棋5.2扫雷游戏配套练习：第四章数组1.一维数组的创建
【学习总结】Python transformers AutoTokenizer encode 出现的 101 和 102 爱学习的小道长 AI python 学习 AI编程
1.代码展示：fromtransformersimportAutoTokenizer,AutoModelmodel_name="bert-base-chinese"tokenizer=AutoTokenizer.from_pretrained(model_name)model=AutoModel.from_pretrained(model_name)print(len(tokenizer.voca
《乌托邦》//第四章灵萱遭冷落 Amyzhu
第二天，子浩他们睡到自然醒，胖子带着女朋友出去玩了。子浩他们三个起床后一起出去吃早饭，然后去大明湖玩。子浩跟灵萱联系，让她直接去大明湖。当他们四个到达大明湖时，都已经十一点了。珺珺还是挽着建华的胳膊在前面并排走。子浩在他们后面，并用手牵着灵萱。子浩跟建华、珺珺一边走一边聊一些他们之前的往事，为了方便听的清楚些，子浩不自觉的往前靠近。灵萱就被落在了后面，听着他们聊天，说笑，自己一句都插不上，就像被遗
2021-11-1 台式电脑出问题了，手机更新小白的姐姐
Python学习：学习第四章部分内容今天做的事情：工作上了一节瑜伽课学习python感想：今天继续看了部分>，脑中产生了一个疑问，古时候交通不便，知识交流不通畅，老子他们是如何知晓世界万物发展的道的？不同的事物是不是有不同的发展规律呢？如果要遵循道来思考行事，首先自己要知道发展的规律吧？那么这个规律怎么获得呢？可以通过一个规律归纳出其他规律呢？这个是我今天疑惑的地方。还有就是关于书中要将书读薄的观
Linux基础命令的学习总结 Gnevergiveup linux
Linux基础命令vmware的三种网络模式桥接模式虚拟机占用一个独立的ip，通过虚拟交换机，直接使用物理网卡上网NAT模式使用主机ip，通过NAT设备上网仅主机模式无法上网，与其他主机隔绝配置静态ip配置成功的标志虚拟机可以上网虚拟机与主机可以相互ping通如何配置静态ip查看物理机ipipconfig-all有线上网以太网适配器无线上网无线局域网适配器WLAN100.67.14.155配置虚拟
2020-06-05《学习究竟是什么》学习总结清单5 魔域之晶
你不是在找答案，而是在做研究。通过各种方式获取信息，然后以我为主，做出自己的判断，这是做研究。三种找书方法：看推荐，看主流媒体的书评，追作者。思维导图不是整理和记忆工具，而是思考工具。思维导图更高级的用法是决策和判断。借助智能化记录和储存信息，大脑用来思考。强力研读笔记法第一，清晰表现每一章的逻辑脉络；第二，带走书中所有的亮点；第三，大量自己的看法和心得；第四，发现这本书和以前读过的其他书或文章的
日精进打卡 Fanny_c554
公司名称:宁波慈星股份有限公司姓名:叶银芬工号：A01597日精进打卡第115天【学习】诵读：《六项精进》大纲1遍，累计132遍《大学》1遍，累计88遍《弟子规》出则弟篇2遍，累计222遍《活法》第四章第13节0遍，累计185【反省～改过】1.开车有点路怒【今日感谢】1.感谢婆婆辛苦带娃【日行一善】1.早上下楼关楼道的灯【发愿】让六项精进成为生活方式。一件事、一群人、一辈子、一起走、在一起、飞更远
《第56号教室的奇迹》读书笔记 2a6a108d7803
第四章:写作步骤—写作之始——语法时间观念:提前上学，做好准备。老师将语法作业写在黑板上，练习题发在课桌上。(有准备的工作)每天早晨坚持语法练习。老师安排有序、充实，孩子没有分心的机会。56号教室，不浪费时间，别班学生8点悠闲的进入学校时，我们已经练习完语法。时间管理:一天浪费几分钟，一年是几十个小时。孩子经不起这种浪费。孩子用功读书理由:①首先很多学生慢慢喜欢上语法，他们认为学习正确书写这个新语
坚持 myself一一
一个人的气质是慢慢培养出来的，从内而外，慢慢来吧，别着急。现在要做的就是培养习惯:1.专注的习惯:少玩手机，多看书2.做事情不要有拖延症，要快速，保证质量，自己的事情就要用心去做好，不要逃避，勇敢面对3.对自己要求严格一点，不要怕苦，也不要怕疼4.多运动，调理身体。今天要完成的学习任务:局部解剖学第三章局部解剖学第四章、局部解剖学第五章英语试卷完整做一套。看书:摆渡人2看到chapter20图片发
《特立独行的华夏文明》67第四章千锤万凿出深山21 mamimima
理性主义，或者我们直指理性主义涉及的核心——理性。它的内在的基础逻辑结构，就是古希腊思辨传统与华夏文明的河图洛书易经所呈现的以客观表达（以数学和客观现象结合）方式对客观事实进行描述作为文明知识体系的基点的思路结合的产物。笔者在前面文字章节里谈过，字母文章和象形文字的各自特点。我着重说明字母文字造字的逻辑，内涵造字者两层强权命令，第一次是对新创立的一个单词的强行附意，第二次是使用手段‘强迫’他人接受
2020-03-01 Java自学第三天汐埋罗傲
第四章数据类型转换Java程序中要求参与的计算的数据，必须要保证数据类型的一致性，如果数据类型不一致将发生类型的转换。自动转换（隐式）一个int类型变量和一个byte类型变量进行加法运算，运算结果，变量的类型将是int类型，这就是数据类型的自动转换现象。特点：代码不需要进行特殊处理，自动完成规则：数据范围从小到大（与字节数不一定相关）强制转换（显式）特点：代码需要进行特殊格式的处理，不能自动完成格
Python学习系列 -认识面向对象三大特性、可见性和属性装饰器需要休息的KK. python 学习 java pycharm 面试
系列文章目录第一章初始Python第二章认识Python变量、类型、运算符第三章认识条件分支、循环结构第四章认识Python的五种数据结构第五章认识Python函数、模块第六章认识面向对象三大特性文章目录系列文章目录前言一、类和对象1.定义类2.创建和使用类对象3.使用类对象中的方法4.初始化二、面向对象的三大特性1.封装2.继承3.多态三、属性可见性四、属性装饰器总结前言面向对象编程是一种非常流
第四章、单例模式 CoCoNum 单例模式
第四章、单例模式单例模式的核心：唯一的实例，在全局能访问到全局变量不是单例模式，但会把全局变量当作单例模式使用。减少全局模式的使用方法：1.使用命名空间：letA={add(){}}A.add()2.使用闭包封装私有变量把一些变量封装到闭包内部，只暴露一些接口constuser=(function(){varname='a',age=29return{getUserInfo:function(){
2023-02-18 道德经的整体观
道德经的整体观第四章：万物之宗道冲，而用之又弗盈也。渊呵，似万物之宗。挫其锐，解其纷，和其光，同其尘。湛呵，似或存。吾不知谁之子，象帝之先。译文：道是空虚的，但却是用不完的。深邃啊，它好像是万物的宗主。道把它的尖锐性挫掉，把它的纷繁给解除掉，把它的光芒给柔和掉，把它跟灰尘等同了。道清澈透明啊，似有似无。我不知道它是谁的孩子，它像是造物者的先辈。道这个空虚的东西，它的作用却是无止境的。深邃，犹如形成
第四章生产管理与控制 ctuoip
第四章生产管理与控制1.企业生产能力的核算，是根据决定生产能力的三个主要因素，在查清和采取措施的基础上，首先计算设备组的生产能力，平衡后确定小组、工段、车间的生产能力，然后各车间进行平衡确定企业的生产能力。在企业确定生产规模，编制长远规划和确定扩建、改建方案，采取重大技术措施时，以设计生产能力或查定生产能力为依据；在编制企业年度、季度计划时，以计划生产能力为依据。2.企业的生产能力有广义和狭义之分
三只青蛙时间管理铭洋_b80b
第四章高倍速读书法如何高效学习？阅读的三个误区错误的认为该逐字逐句读错误的认为该从头读到尾才可以理解错误的认为该从头读到尾才可以记住如何高效阅读1.设定具体阅读目的2.学会设定具体的阅读目的3.了解作者的写作技巧有助于阅读三种常见的文字组织方式新闻报道：说明文，介绍、发展、总结构成非小说文学图书：主要观点、论据、总结小说载体：结构或组织形式是隐性的阅读信息的四个层次1.主题与主要内容2.每个章节的
C primer plus 复习题答案上不好，商鞅要跑 c++primer plus c语言 c++算法
复习题答案上第二章第三章第四章第五章第六章第二章c++程序的模块叫做函数预处理器编译指令是用作替换编译指令可以使用程序再std空间内的各定义cout>cheeses;coutactor;arraybetsie;array;arraydipsea;intarr[5]{1,3,5,7,9};inteven=arr[0]+arr[4];cout>num;int*ptr=newint[num];vecto
第四章元宵于就
花荣愈是深究，怒愈从心起。咬紧牙关，只恨没发泄处。左手顺手操起一张泥金鹊画细弓，此弓乃花荣平日较为中意的宝弓，右手又绰起一支紫羽箭，觑着门前数百步长廊上斜挂的一排红灯笼。弓开满月，箭发流星，飕地只一箭，那一排灯笼大概五六个，似烤串般被一箭连串起，铮的一声响，众人看去，箭头死死地钉在木柱上，还没入柱内几分。正操练的士兵都放下枪，看得呆了。花荣起身前来，众人纷纷赞道：“花统制不愧神箭将军。吾等今日有幸
摘自《这样爱你刚刚好》我的1一2岁孩子（2）蓝天白云XM
第四章，发现语言的力量一到两岁孩子的语言发展规律孩子会说话就跟直立行走一样，具有“划时代”的意义。语言为孩子打开了认识世界的一扇大门。一般来说，孩子一岁大时开始有意义的说话，由此迎来了语言发展的第一个敏感期。人类的语言是后天习得的，错过关键期就很难再学会。一到两岁是孩子语言发展的第一个敏感期，也是孩子的语言储备阶段。错过这个关键期，孩子的语言发展水平将大受影响。火山式爆发一19到21个月的语言发展
好妈妈胜过好老师第四章考试不考100分天边的云fly
考试要考100分，是每个家长对孩子的期望，可是随着这个期望，我们发现我们的期望越来越低，从100分到90分，从90分到及格。为什么？我觉得100分只能代表对考中的题目这部分我们掌握了，90多分说明我们对这部分没掌握，我们应该感谢这个90多分，让我们发现了自己的不足。不管是马虎也好还是没掌握也好，下次再出这种题我们肯定不会犯同样的错误。大宝昨天晚上说：同样的错误犯两次就是傻瓜。孩子其实明白这个道理，
stable diffusion webui学习总结（3）：参数设置 shanesu stable diffusion 学习
一、2.5D偏卡通风格参数设置：步骤1、文生图模型：darkSushiMixMixVAE：vae-ft-mse-840000-ema-pruned正面提示词：(masterpiece,highquality,highres,illustration),blurrybackground,[(whitebackground:1.2)::5],(see-through:0.85),shining,Mov
通信原理教程chapter4 今日你学左米啊
通信原理教程chapter4感冒+繁忙著教材用的是《通信原理教程》(第三版)--樊昌信著第四章模拟信号的数字化@[toc]模拟信号的数字化(AD转换)模电里面也说过,AD转换包括三个基本步骤:抽样,量化,编码,前两个在模电和信号与系统里面其实已经讲得7788了,这章的重点在于基带信号的编码.还有一些就是带通信号的抽样频率,抽样信号的非均匀量化这两个新一点的东西.这里我们顺便帮大家复习一下信号的分类
OpenCasCade ---- 学习总结。 Galaxy々 OpenCasCade 学习算法 c++
1，点2个类可以用来描述3D坐标点：•gp_Pnt类•Geom_CartesianPoint类（句柄操作）gp_PntaPnt1(-myWidth/2.,0,0);gp_PntaPnt2(-myWidth/2.,-myThickness/4.,0);gp_PntaPnt3(0,-myThickness/2.,0);gp_PntaPnt4(myWidth/2.,-myThickness/4.,0);
计算机网络第四章问答题厂里英才作业计算机网络
目录4-07.试说明IP地址与MAC地址的区别，为什么要使用这两种不同的地址？4-09.IP数据报中的首部检验和并不检验数据报中的数据。这样做的最大好处是什么？坏处是什么？4-10.当某个路由器发现一IP数据报的检验和有差错时，为什么采取丢弃的办法而不是要求源站重传此数据报？计算首部检验和为什么不采用CRC检验码？4-07.试说明IP地址与MAC地址的区别，为什么要使用这两种不同的地址？答：IP地
route命令学习总结 a1809032425 网络通信学习 linux命令总结网络服务器
route命令学习总结参考链接：1、route指令使用详解https://blog.csdn.net/justlpf/article/details/1290452842、route命令详解https://www.kancloud.cn/chunyu/php_basic_knowledge/2106519route命令用于显示和操作IP静态路由表。用于跨网段之间通信route命令主要用于操作基于内
Spring 用法学习总结（三）之 AOP 花落随风轻飘舞 Spring 系列 spring 学习 java
Spring学习7bean的生命周期8AOP面向切面编程8.1AOP相关术语8.2AOP使用7bean的生命周期bean的生命周期主要为bean实例化、bean属性赋值、bean初始化、销毁bean，其中在实例化和初始化前后都使用后置处理器方法，而InstantiationAwareBeanPostProcessor继承了BeanPostProcessor可以看下这篇博客大致了解一下：一文读懂Sp
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情