App_12062011

系统学习机器学习之半参数方法

在参数方法中，我们假设样本来自于一个已知的分布，因此我们的主要工作就是估计有限的参数；而对于另外一些问题，我们不能确定样本遵从的分布假设，这时我们可以退一步，采用混合分布估计输入样本(也就是半参数方法)；如果这样也不行，那么我们就要使用非参数的方法。今天我们来初步了解下聚类学习。主要的要点如下：

混合密度
K-均值聚类
聚类后的监督学习
层次聚类

一、混合密度

之所以要提出混合分布，主要原因就是上面所说的分布假设无法确定的情况，另一个原因也有可能样本遵从的分布本身就不是单一的，比如语音识别的学习，同样一个单词，可能因为说话者的性别、年龄、方言等因素而有不同的发音，因此不能够用统一的分布假设来进行拟合。这里我们采取表示所有这些不同发音方法的策略，即半参数密度估计（semiparamitric density estimation），我们对样本假定有多个分组，每个分组仍然假定一个具体的模型。

混合密度（mixture density）记作：

这里的G-i称为混合分支（mixture component），也称做分组（group）或簇（cluster）；P(x|G-i)是分支密度，而P(G-i)是混合比例，这里是通过概率的量来度量分支的比例和密度。分支数K是超级参数，应当是预先指定的。实际上，参数分类就是混合模型，但不同的是，参数分类是有标号的，而这里是不知道标号的，也就是非监督学习问题。因此，我们需要估计标号，接着估计每个分支的参数，为此，先看K均值聚类。

二、K-均值聚类

如何对一个样本进行聚类分析呢？这里我们有一个简单的算法，称之为K-均值聚类。为了便于理解，我们引入一个颜色量化的实例。比如我们有一副24位/像素的图像（即24个比特位来标示图像，总共可以表示2^24中颜色，1600多万种），假定我们有个8位/像素的彩色屏幕，显示这副图像无疑会存在像素损失，现在的问题是我们从原先的1600万种颜色中选取256种颜色来显示图像呢？且尽可能不损失图像质量。

如果直接均匀量化是不实际的，因为图像像素的分布并不均匀，比如一副大海的图片蓝色比较多，而基本不会出现红色；我们量化后的图像像素应当尽可能地接近反映原来的像素密度，将映射表更多地放在高密度区域，丢弃没有数据的区域。

这里我们一个自然的想法，将“距离”比较近的一些像素用一个近似值来代表，从而实现像素的量化。比如对于24位的像素x，我们有24位的映射表集合M，如果对于某个映射m-i附近的像素值都用序号i来表示像素的话，那么我们只要选取256个映射表，就可以实现1600万-->256的映射。因此这里关键是度量像素样本x与映射表m之间的距离（都是24比特的二进制序列）：

现在的问题是我们应当如何计算符合这样条件的m-i呢？我们的方法是计算总重构误差（reconsturction error），定义为：

我们可以根据一个迭代算法来计算出这样的m，最终参考向量被设置为它所代表的所有实例的均值。算法的伪代码是：

选择K个点作为初始中心；

Repeat

将每个点指派到最近的中心，形成K个簇；

重新计算每个簇的中心；

Until簇的中心不再变化

初始化K-均值算法可以有不同的方法，比如简单随机选择k个实例作为初始的M，或者可计算所有数据的均值，并将一些小的随机变量加到均值上，得到k个初始的m值。

参数K的去顶依赖于我们使用的聚类方法类型，我们可以将重构误差或对数似然作为k的函数绘制图形，找出“拐点”，即足够大的K之后，算法将开始分裂分组，此时重构误差不会大幅降低，而对数似然也不会大幅提高。

其实K-均值聚类算法是期望最大化算法（Expectation-Maximization, EM）的一个特例。

再给个详细解释：

聚类属于无监督学习，以往的回归、朴素贝叶斯、SVM等都是有类别标签y的，也就是说样例中已经给出了样例的分类。而聚类的样本中却没有给定y，只有特征x，比如假设宇宙中的星星可以表示成三维空间中的点集。聚类的目的是找到每个样本x潜在的类别y，并将同类别y的样本x放在一起。比如上面的星星，聚类后结果是一个个星团，星团里面的点相互距离比较近，星团间的星星距离就比较远了。

在聚类问题中，给我们的训练样本是，每个，没有了y。

K-means算法是将样本聚类成k个簇（cluster），具体算法描述如下：

1、随机选取k个聚类质心点（cluster centroids）为。

2、重复下面过程直到收敛 {

对于每一个样例i，计算其应该属于的类

对于每一个类j，重新计算该类的质心

}

K是我们事先给定的聚类数，代表样例i与k个类中距离最近的那个类，的值是1到k中的一个。质心代表我们对属于同一个类的样本中心点的猜测，拿星团模型来解释就是要将所有的星星聚成k个星团，首先随机选取k个宇宙中的点（或者k个星星）作为k个星团的质心，然后第一步对于每一个星星计算其到k个质心中每一个的距离，然后选取距离最近的那个星团作为，这样经过第一步每一个星星都有了所属的星团；第二步对于每一个星团，重新计算它的质心（对里面所有的星星坐标求平均）。重复迭代第一步和第二步直到质心不变或者变化很小。

下图展示了对n个样本点进行K-means聚类的效果，这里k取2。

K-means面对的第一个问题是如何保证收敛，前面的算法中强调结束条件就是收敛，可以证明的是K-means完全可以保证收敛性。下面我们定性的描述一下收敛性，我们定义畸变函数（distortion function）如下：

J函数表示每个样本点到其质心的距离平方和。K-means是要将J调整到最小。假设当前J没有达到最小值，那么首先可以固定每个类的质心，调整每个样例的所属的类别来让J函数减少，同样，固定，调整每个类的质心也可以使J减小。这两个过程就是内循环中使J单调递减的过程。当J递减到最小时，和c也同时收敛。（在理论上，可以有多组不同的和c值能够使得J取得最小值，但这种现象实际上很少见）。

由于畸变函数J是非凸函数，意味着我们不能保证取得的最小值是全局最小值，也就是说k-means对质心初始位置的选取比较感冒，但一般情况下k-means达到的局部最优已经满足需求。但如果你怕陷入局部最优，那么可以选取不同的初始值跑多遍k-means，然后取其中最小的J对应的和c输出。

二、EM

下面主要介绍EM的整个推导过程。

1. Jensen不等式

回顾优化理论中的一些概念。设f是定义域为实数的函数，如果对于所有的实数x，，那么f是凸函数。当x是向量时，如果其hessian矩阵H是半正定的（），那么f是凸函数。如果或者，那么称f是严格凸函数。

Jensen不等式表述如下：

如果f是凸函数，X是随机变量，那么

特别地，如果f是严格凸函数，那么当且仅当，也就是说X是常量。

这里我们将简写为。

如果用图表示会很清晰：

图中，实线f是凸函数，X是随机变量，有0.5的概率是a，有0.5的概率是b。（就像掷硬币一样）。X的期望值就是a和b的中值了，图中可以看到成立。

当f是（严格）凹函数当且仅当-f是（严格）凸函数。

Jensen不等式应用于凹函数时，不等号方向反向，也就是。

2. EM算法

给定的训练样本是，样例间独立，我们想找到每个样例隐含的类别z，能使得p(x,z)最大。p(x,z)的最大似然估计如下：

第一步是对极大似然取对数，第二步是对每个样例的每个可能类别z求联合分布概率和。但是直接求一般比较困难，因为有隐藏变量z存在，但是一般确定了z后，求解就容易了。

EM是一种解决存在隐含变量优化问题的有效方法。竟然不能直接最大化，我们可以不断地建立的下界（E步），然后优化下界（M步）。这句话比较抽象，看下面的。

对于每一个样例i，让表示该样例隐含变量z的某种分布，满足的条件是。（如果z是连续性的，那么是概率密度函数，需要将求和符号换做积分符号）。比如要将班上学生聚类，假设隐藏变量z是身高，那么就是连续的高斯分布。如果按照隐藏变量是男女，那么就是伯努利分布了。

可以由前面阐述的内容得到下面的公式：

（1）到（2）比较直接，就是分子分母同乘以一个相等的函数。（2）到（3）利用了Jensen不等式，考虑到是凹函数（二阶导数小于0），而且

就是的期望（回想期望公式中的Lazy Statistician规则）

设Y是随机变量X的函数（g是连续函数），那么

（1） X是离散型随机变量，它的分布律为，k=1,2,…。若绝对收敛，则有

（2） X是连续型随机变量，它的概率密度为，若绝对收敛，则有

对应于上述问题，Y是，X是，是，g是到的映射。这样解释了式子（2）中的期望，再根据凹函数时的Jensen不等式：

可以得到（3）。

这个过程可以看作是对求了下界。对于的选择，有多种可能，那种更好的？假设已经给定，那么的值就决定于和了。我们可以通过调整这两个概率使下界不断上升，以逼近的真实值，那么什么时候算是调整好了呢？当不等式变成等式时，说明我们调整后的概率能够等价于了。按照这个思路，我们要找到等式成立的条件。根据Jensen不等式，要想让等式成立，需要让随机变量变成常数值，这里得到：

c为常数，不依赖于。对此式子做进一步推导，我们知道，那么也就有，（多个等式分子分母相加不变，这个认为每个样例的两个概率比值都是c），那么有下式：

至此，我们推出了在固定其他参数后，的计算公式就是后验概率，解决了如何选择的问题。这一步就是E步，建立的下界。接下来的M步，就是在给定后，调整，去极大化的下界（在固定后，下界还可以调整的更大）。那么一般的EM算法的步骤如下：

循环重复直到收敛 {

（E步）对于每一个i，计算

（M步）计算

那么究竟怎么确保EM收敛？假定和是EM第t次和t+1次迭代后的结果。如果我们证明了，也就是说极大似然估计单调增加，那么最终我们会到达最大似然估计的最大值。下面来证明，选定后，我们得到E步

这一步保证了在给定时，Jensen不等式中的等式成立，也就是

然后进行M步，固定，并将视作变量，对上面的求导后，得到，这样经过一些推导会有以下式子成立：

解释第（4）步，得到时，只是最大化，也就是的下界，而没有使等式成立，等式成立只有是在固定，并按E步得到时才能成立。

况且根据我们前面得到的下式，对于所有的和都成立

第（5）步利用了M步的定义，M步就是将调整到，使得下界最大化。因此（5）成立，（6）是之前的等式结果。

这样就证明了会单调增加。一种收敛方法是不再变化，还有一种就是变化幅度很小。

再次解释一下（4）、（5）、（6）。首先（4）对所有的参数都满足，而其等式成立条件只是在固定，并调整好Q时成立，而第（4）步只是固定Q，调整，不能保证等式一定成立。（4）到（5）就是M步的定义，（5）到（6）是前面E步所保证等式成立条件。也就是说E步会将下界拉到与一个特定值（这里）一样的高度，而此时发现下界仍然可以上升，因此经过M步后，下界又被拉升，但达不到与另外一个特定值一样的高度，之后E步又将下界拉到与这个特定值一样的高度，重复下去，直到最大值。

如果我们定义

从前面的推导中我们知道，EM可以看作是J的坐标上升法，E步固定，优化，M步固定优化。

下面累述一下K-means与EM的关系，首先回到初始问题，我们目的是将样本分成k个类，其实说白了就是求每个样例x的隐含类别y，然后利用隐含类别将x归类。由于我们事先不知道类别y，那么我们首先可以对每个样例假定一个y吧，但是怎么知道假定的对不对呢？怎么评价假定的好不好呢？我们使用样本的极大似然估计来度量，这里是就是x和y的联合分布P(x,y)了。如果找到的y能够使P(x,y)最大，那么我们找到的y就是样例x的最佳类别了，x顺手就聚类了。但是我们第一次指定的y不一定会让P(x,y)最大，而且P(x,y)还依赖于其他未知参数，当然在给定y的情况下，我们可以调整其他参数让P(x,y)最大。但是调整完参数后，我们发现有更好的y可以指定，那么我们重新指定y，然后再计算P(x,y)最大时的参数，反复迭代直至没有更好的y可以指定。

对应于K-means来说就是我们一开始不知道每个样例对应隐含变量也就是最佳类别。最开始可以随便指定一个给它，然后为了让P(x,y)最大（这里是要让J最小），我们求出在给定c情况下，J最小时的（前面提到的其他未知参数），然而此时发现，可以有更好的（质心与样例距离最小的类别）指定给样例，那么得到重新调整，上述过程就开始重复了，直到没有更好的指定。这样从K-means里我们可以看出它其实就是EM的体现，E步是确定隐含类别变量，M步更新其他参数来使J最小化。这里的隐含类别变量指定方法比较特殊，属于硬指定，从k个类别中硬选出一个给样例，而不是对每个类别赋予不同的概率。总体思想还是一个迭代优化过程，有目标函数，也有参数变量，只是多了个隐含变量，确定其他参数估计隐含变量，再确定隐含变量估计其他参数，直至目标函数最优。

3. 重新审视混合高斯模型

我们已经知道了EM的精髓和推导过程，再次审视一下混合高斯模型。之前提到的混合高斯模型的参数和计算公式都是根据很多假定得出的，有些没有说明来由。为了简单，这里在M步只给出和的推导方法。

E步很简单，按照一般EM公式得到：

简单解释就是每个样例i的隐含类别为j的概率可以通过后验概率计算得到。

在M步中，我们需要在固定后最大化最大似然估计，也就是

这是将的k种情况展开后的样子，未知参数和。

固定和，对求导得

等于0时，得到

这就是我们之前模型中的的更新公式。

然后推导的更新公式。看之前得到的

在和确定后，分子上面的一串都是常数了，实际上需要优化的公式是：

需要知道的是，还需要满足一定的约束条件就是。

这个优化问题我们很熟悉了，直接构造拉格朗日乘子。

还有一点就是，但这一点会在得到的公式里自动满足。

求导得，

等于0，得到

也就是说再次使用，得到

这样就神奇地得到了。

那么就顺势得到M步中的更新公式：

的推导也类似，不过稍微复杂一些，毕竟是矩阵。结果在之前的混合高斯模型中已经给出。

4. 总结

如果将样本看作观察值，潜在类别看作是隐藏变量，那么聚类问题也就是参数估计问题，只不过聚类问题中参数分为隐含类别变量和其他参数，这犹如在x-y坐标系中找一个曲线的极值，然而曲线函数不能直接求导，因此什么梯度下降方法就不适用了。但固定一个变量后，另外一个可以通过求导得到，因此可以使用坐标上升法，一次固定一个变量，对另外的求极值，最后逐步逼近极值。对应到EM上，E步估计隐含变量，M步估计其他参数，交替将极值推向最大。EM中还有“硬”指定和“软”指定的概念，“软”指定看似更为合理，但计算量要大，“硬”指定在某些场合如K-means中更为实用（要是保持一个样本点到其他所有中心的概率，就会很麻烦）。

另外，EM的收敛性证明方法确实很牛，能够利用log的凹函数性质，还能够想到利用创造下界，拉平函数下界，优化下界的方法来逐步逼近极大值。而且每一步迭代都能保证是单调的。最重要的是证明的数学公式非常精妙，硬是分子分母都乘以z的概率变成期望来套上Jensen不等式，前人都是怎么想到的。

在Mitchell的Machine Learning书中也举了一个EM应用的例子，明白地说就是将班上学生的身高都放在一起，要求聚成两个类。这些身高可以看作是男生身高的高斯分布和女生身高的高斯分布组成。因此变成了如何估计每个样例是男生还是女生，然后在确定男女生情况下，如何估计均值和方差，里面也给出了公式，有兴趣可以参考。

三、聚类后的监督学习

聚类可以用来探查数据，理解数据的结构。维度归约方法用来发现变量间的相关性，从而对变量分组；而聚类方法用于发现实例间的相似性，从而对实例分组。

聚类的一个最直接应用就是分类问题，一旦发现实例间存在基于某种相似性的分组，那么可以对分组进行命名标记，定义属性，比如“客户关系管理”中对客户进行分组。

聚类也可以作为监督式学习的预处理步骤，我们先了解发生了什么，然后学习它意味着什么。

四、层次聚类

上面的聚类方法通过混合模型拟合数据，或找出最小化重构误差的分组模式，还有一些聚类方法只关注实例间的相似性，对数据没有其他要求。这里的目标是找出分组，使得一个分组汇总的对象比不在一个分组中的对象更相似，这种方法称为层次聚类（hierarchiacl clustering）。

层次聚类的关键是度量相似性，常用的就是欧式距离（向量对应分量差的组合）和绝对值距离（向量间距离）。在单链接聚类中，距离定义为两个分组的所有可能元素之间的最小距离，而全链接聚类中，两个分组间的距离则取所有可能元素之间的最大距离。

Refer：《机器学习导论》，Ethen Alpaydin（土耳其），机械工业出版社

龙珠训练营机器学习task04 a_little_pig_ python
学习笔记为阿里云天池龙珠计划机器学习训练营的学习内容，学习链接为：https://tianchi.aliyun.com/competition/entrance/231702/introduction?spm=5176.20222472.J_3678908510.8.8f5e67c2RKrT98总体思路：分别使用LightGBM，xgboost，gbdt，catboost建立多个个体学习器（加入b
vue2和vue3中是如何进行组件通信尔嵘 Vue3.0 vue3
前言：Vue2和Vue3都支持多种方式的组件通信，包括：1.Props和Events：父组件向子组件传递数据可以使用props属性。子组件向父组件发送消息可以使用自定义事件（事件名需要使用kebab-case命名规则）。在Vue3中，还可以使用v-model指令来简化双向绑定。2.$emit和on：通过on：通过emit方法在子组件中触发自定义事件，并在父组件中监听该事件使用$on方法来实现组件之
关于Java中的导包 SherlockWZX Java java
导包//静态导入包~importstaticjava.lang.Math.random;importstaticjava.lang.Math.PI;publicclassTest{publicstaticvoidmain(String[]args){System.out.println(random());//可以直接使用random方法System.out.println(PI);//可以直接使
C++实现设计模式---建造者模式 (Builder) 计算机小混子设计模式 c++设计模式建造者模式
建造者模式(Builder)建造者模式是一种创建型设计模式，它将一个复杂对象的构建与表示分离，使得同样的构建过程可以创建不同的表示。意图将复杂对象的创建过程分步骤完成，并允许以不同方式构建其各部分。提供灵活的方式构造对象，而无需关心其内部细节。使用场景创建复杂对象：当对象的创建需要很多步骤或参数时，使用建造者模式可以简化代码。需要多个构建版本：如同一个对象可能有不同的表示形式，但它们共享相同的构建
C# System.Diagnostics.Process.Start() Godsight C#基本语法
C#Process.Start()方法详解System.Diagnostics.Process.Start();能做什么呢？它主要有以下几个功能：1、打开某个链接网址（弹窗）。2、定位打开某个文件目录。3、打开系统特殊文件夹，如“控制面板”等。那么它是怎么实现这几个功能的呢？在讲应用前，我们先来看看Process.Star()的构造方法。名称说明Process.Start()启动（或重用）此Pro
计算机毕业设计之jsp影视推荐系统我的微信bishe911 课程设计 java 开发语言 mysql jsp
随着信息化时代的到来，网络系统都趋向于智能化、系统化，影视推荐系统也不例外，但目前国内的很多行业仍使用人工管理，影视信息量也越来越庞大，人工管理显然已无法应对时代的变化，而影视推荐系统能很好地解决这一问题，轻松的对影视信息进行评分，既能提高用户对影视推荐的了解，又能快捷的查看影视信息，取代人工管理是必然趋势。本影视推荐系统以SSM作为框架，B/S模式以及MySql作为后台运行的数据库。本系统主要包
Vue.js组件开发研究清北互联木材 vue.js
摘要随着前端技术的快速发展，Vue.js以其轻量级、高性能和组件化开发的优势，在前端开发领域占据了重要地位。本研究深入探讨了Vue.js组件开发的理论基础、开发方法以及实际应用。通过系统梳理Vue.js框架的核心特性、组件化思想及Vue.js组件的基本概念，本研究为Vue.js组件开发提供了全面的理论支撑。进一步地，本研究详细介绍了Vue.js组件的设计原则、组成要素及组件之间的关系，并阐述了组件
vue3阻止事件冒泡到父元素我爱加班、、前端功能实现以及问题解决前端开发遇到的问题 vue.js javascript 前端
在Vue3中，如果你想在子组件的点击事件中阻止父组件绑定的点击事件触发，可以使用以下方法：1.使用.stop修饰符Vue提供了.stop修饰符，可以阻止事件冒泡到父元素。这是最简单直接的方式。示例代码点击我exportdefault{methods:{handleParentClick(){console.log('父元素被点击');},handleChildClick(){console.log
向awk传递外部参数的五种方法（直接传递；-v选项；ARGV数值；间接引用；ENVIRON变量） jcsx 基础运维知识库 linux 自动化运维
向awk传递外部参数的五种方法（直接传递；-v选项；ARGV数值；间接引用；ENVIRON变量）向awk传递外部参数的方法有四：#（一）直接传递参数写在输入文本之前，脚本之后awk'Script'var=valueinputfile#单个参数awk-fscriptfilevar1=value1var2=value2inputfile#多个参数缺点：命令行参数的限制是他们在BEGIN过程中是不可用的
flask实现重启后需要重新输入用户名而避免浏览器使用之前已经记录的用户名 Channing Lewis Python flask python 后端
要实现重启后重新输入用户名的功能，关键是确保Flask在应用重启时不会保留之前的用户会话（即清除登录状态）。以下是一些可能的原因和解决方法：1.问题原因：Session数据没有清除Flask使用session来保存用户的登录状态（如用户名），默认存储在浏览器的Cookie中。如果Flask使用了持久化的secret_key，即使重启服务器，客户端的Cookie仍然有效，导致会话数据还存在。2.解决
vscode 顶部 Command Center,minimap AI算法网奇 python基础 python宝典 vscode ide 编辑器
目录vscode顶部CommandCenter设置显示步骤：minimap设置方法一：使用设置界面方法二：使用命令面板方法三：编辑settings.json文件左侧目录树和编辑器字体不一致：OPENEDITORSvscode顶部CommandCenterVisualStudioCode(VSCode)中的CommandCenter是一个集中管理命令和功能的工具，如果顶部没有显示，你可以按照以下步骤
Python爬虫技术第16节 XPath hummhumm python 爬虫开发语言 flask java maven java-ee
XPath是一种在XML文档中查找信息的语言，尽管XML和HTML在语法上有区别，但XPath同样适用于HTML文档的解析，尤其是在使用如lxml这样的库时。XPath提供了一种强大的方法来定位和提取XML/HTML文档中的元素和属性。XPath基础XPath表达式由路径表达式组成，它们指定了文档中的位置。下面是一些基本的XPath语法：根节点：/表示绝对路径的开始，指向文档的根节点。//表示从当
流媒体直播实时视频延迟时间排查和剖析：gop关键帧间隔导致延迟，流媒体和播放器缓存，B帧等导致的延迟 eguid_1 #1.4.3版本）直播延迟视频延迟直播平台播放延迟网络延迟
本章是流媒体直播实时视频延迟时间排查和剖析javaCV系列文章：javacv开发详解之1：调用本机摄像头视频javaCV开发详解之2：推流器实现，推本地摄像头视频到流媒体服务器以及摄像头录制视频功能实现(基于javaCV-FFMPEG、javaCV-openCV)javaCV开发详解之3：收流器实现，录制流媒体服务器的rtsp/rtmp视频文件(基于javaCV-FFMPEG)
机器学习与分布式机器学习_经理人的机器学习–您需要知道的 cumian8165 算法神经网络大数据编程语言 python
机器学习与分布式机器学习Ifyouaremanagingatechteamasaproductorprojectmanager,hereiswhatyouneedtoknowaboutmachinelearning.如果您要以产品或项目经理的身份管理技术团队，这是您需要了解的有关机器学习的知识。Machinelearninganddeeplearninghavebeenpopularbuzzwor
影刀 RPA：企业数字化转型的强大引擎 RPA李老师 rpa
一、影刀RPA是什么影刀RPA是一种基于机器学习和人工智能技术的自动化工具，它在当今数字化时代发挥着重要作用。影刀RPA是一款软件机器人，能模拟人的各种操作，在任何应用程式上进行鼠标点击、键盘输入、读取信息等自动化操作，释放人非主观决策、逻辑性高、规则性强的工作。在了解影刀RPA之前，我们先来认识一下RPA。RPA是RoboticProcessAutomation（机器人流程自动化）的简称，201
已解决python 的SyntaxError ：invalid syntax异常正确解决办法，亲测有效，嘿嘿嘿代码无疆 Python python 开发语言
文章目录问题分析报错原因解决思路解决方法示例1：拼写错误示例2：缺少符号示例3：错误的缩进示例4：错误的语句结构SyntaxError:invalidsyntax异常是Python中最常见的错误之一，它表示代码中存在语法错误。这种错误通常发生在Python解释器无法理解你的代码时，比如因为拼写错误、缺少符号、错误的缩进、不正确的语句结构等。问题分析当Python解释器报告SyntaxError:i
【Python篇】从零到精通：全面分析Scikit-Learn在机器学习中的绝妙应用半截诗 Python python 机器学习 scikit-learn 人工智能深度学习数据分析随机森林
文章目录从零到精通：全面揭秘Scikit-Learn在机器学习中的绝妙应用前言第一部分：深入了解Scikit-Learn的基础知识1.什么是Scikit-Learn？2.安装Scikit-Learn3.Scikit-Learn中的基本构件4.数据集的加载与探索5.数据预处理标准化数据6.构建和训练机器学习模型构建逻辑回归模型7.模型评估与验证混淆矩阵第二部分：深入理解Scikit-Learn的高级
ProxySQL 读写分离小左2010925 mysql database 负载均衡 proxy模式
1.ProxySQL采用不同的端口实现读写分离先说缺点，采用该方案应用程序需要内置读写分离的能力，以便区分读和写。配置ProxySQL监听在两个不同的端口，方法如下：#ProxySQL默认的用于客户端连接的端口是6033ProxyQL-Admin>showvariableslike'mysql-interfaces';+------------------+--------------+|Vari
【Python设计模式07】工厂方法模式一碗姜汤设计模式 python 设计模式工厂方法模式
工厂方法模式（FactoryMethodPattern）是一种创建型设计模式，它定义了一个用于创建对象的接口，让子类决定实例化哪一个类。工厂方法使得一个类的实例化延迟到其子类。通过使用工厂方法模式，可以将对象的创建过程与使用过程分离，从而提高代码的灵活性和可扩展性。工厂方法模式的结构工厂方法模式主要包括以下几个角色：抽象产品（Product）：定义产品的接口。具体产品（ConcreteProduc
006设计模式--工厂方法模式(Factory Method Pattern) 少年359 设计模式设计模式工厂方法模式
目录一、什么是工厂方法模式二、工厂方法模式的结构三、工厂方法模式的代码实现四、工厂方法模式的优缺点五、工厂方法模式的应用场景六、对比七、总结一、什么是工厂方法模式简单工厂模式存在的问题:类的创建依赖工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了开闭原则。工厂方法模式是一种常用的类创建型设计模式,此模式的核心精神是封装类中变化的部分，提取其中个性化善变的部分为独立类，通过依赖注入
工厂模式（Factory Pattern） coding_-_半生 java 设计模式简单工厂模式工厂方法模式抽象工厂模式
工厂模式文章目录工厂模式介绍一、工厂模式的几种变体二、工厂模式类图1.简单工厂模式（SimpleFactoryPattern）2.工厂方法模式（FactoryMethodPattern）3.抽象工厂模式（AbstractFactoryPattern）三、总结1.比较三种工厂模式应用场景2.工厂模式总结介绍工厂模式是一种常见的设计模式，用于创建对象而不暴露对象的创建逻辑。在软件开发中，工厂模式通常用
分形、大自然的分形几何、数据可视化、Python绘图 timedot-hj python绘图指南 -分形与数据可视化可视化 python 几何学算法
分形、大自然的分形几何、数据可视化、Python绘图中国传统中的『分形』大自然的分形几何数据可视化本系列采用turtle、matplotlib、numpy这三个Python工具，以分形与计算机图像处理的经典算法为实例，通过程序和图像，来帮助读者一步步掌握Python绘图和数据可视化的方法和技巧，并且让读者感受到“龙枝屈曲竞分形，瑰丽绮错千万状”的分形魅力。本系列共有八章，分别为海岸线有多长，基因与
C++学生学籍管理系统开发详解悦闻闻
本文还有配套的精品资源，点击获取简介：学生学籍管理系统是高校或教育机构中管理学生信息的重要工具。本项目详细介绍基于C++实现该系统的关键技术和方法。从面向对象编程、数据结构的选择，到数据库操作、运算符重载、文件I/O处理、用户界面设计、异常处理，以及单元测试等，系统地覆盖了构建高效、稳定学籍管理系统的全过程。1.面向对象编程基础面向对象编程（OOP）是现代编程范式的核心，它允许开发者通过类和对象来
Jetty切Tomcat部署应用之根路径/总是跳转index页面 upcdxlq tomcat java 服务器
问题描述项目之前在Jetty下运行的，http://ip:port/context/原本是进入到Controller的@RequestMappin(“/”)方法的，但部署到Tomcat下，总是跳转到index.jsp问题分析1、访问应用的其他路径都正常，这个请求压根没有得到DispatchServlet处理，默认返回index.jsp，应该是tomcat配置问题2、那是不是应用的web.xml里配
数组刃神太酷啦蓝桥杯C++组
数组栈区的空间很有限，静态区的空间大些，一般在静态区去申请较大的空间考虑特例能不能归并到一起也很重要在二维数组中，基于范围的for循环直接遍历的是行，而不是单个元素对于一个intarr[3][4]的二维数组，memset会首先填充arr[0][0]到arr[0][3]如果将数组定义为全局变量，其元素会被默认初始化为0小数四舍五入成整数的方法假设a是四舍五入之后的，b是四舍五入之前的有a=(int)
【docker了解】如何将x86镜像转换为适用于Jetson的ARM镜像 Eternal-Student Docker docker arm开发容器
将x86架构的Docker镜像转换为适用于ARM架构的Jetson设备的镜像是一个复杂的过程，因为这两种架构的指令集完全不同。不过，有一些方法可以尝试实现这一转换。使用QEMU进行仿真在x86机器上，你可以使用QEMU来模拟ARM环境，从而运行ARM镜像。但是，这种方法主要用于测试和开发，而不是生产环境。以下是基本步骤：安装QEMU：在x86机器上安装QEMU，它是一个开源的机器模拟器和虚拟化器。
AHK的相似取色睡不醒的小泽 #AHK 自动化 Autohotkey
简介PixelGetColor通常用于在特定像素处获取单一颜色值，这对于大多数应用程序来说是足够的。然而，一些带有反作弊机制的软件，例如《英雄联盟》的外服版本，会对图像进行模糊处理（Fuzz处理）。在这种情况下，我们需要采用一种能够识别颜色相似性的取色方法，以确保逻辑的正确执行。绝对取色先给出绝对取色的代码：;取色组GetColor(x,y){PixelGetColor,color,x,y,RGB
Ubuntu Server 连接WiFi RyanKONG wifi ubuntu
文章目录前言配置参考链接:前言最近又在把树莓派3B拿出来玩折腾，原本的PiOS不原生支持64x系统，而CentOS就不说了，目前是安装的UbuntuServer。PiOS是基于Debian系统，配置WiFi就直接在wpa_supplican进行配置即可。UbuntuServer舍弃了wpa_supplican做为网络配置工具，常规配置方法在wpa_supplicant是找不到配置文件的，取而代之的
【愚公系列】二十三种设计模式(一)-工厂方法模式(Factory Method Pattern) 愚公搬代码 (完)C#版设计模式和原则设计模式工厂方法模式 microsoft .net c#.netcore
标题详情作者简介愚公搬代码头衔华为云特约编辑，华为云云享专家，华为开发者专家，华为产品云测专家，CSDN博客专家，CSDN商业化专家，阿里云专家博主，阿里云签约作者，腾讯云优秀博主，腾讯云内容共创官，掘金优秀博主，亚马逊技领云博主，51CTO博客专家等。近期荣誉2022年度博客之星TOP2，2023年度博客之星TOP2，2022年华为云十佳博主，2023年华为云十佳博主等。博客内容.NET、Jav
【2025优质学术推荐】征稿控制科学、仪器、智能系统、通信、计算机、电子信息、人工智能、大数据、机器学习、软件工程、网络安全方向努力学习的大大学术会议推荐人工智能大数据深度学习神经网络
【2025优质学术推荐】征稿控制科学、仪器、智能系统、通信、计算机、电子信息、人工智能、大数据、机器学习、软件工程、网络安全方向【2025优质学术推荐】征稿控制科学、仪器、智能系统、通信、计算机、电子信息、人工智能、大数据、机器学习、软件工程、网络安全方向文章目录【2025优质学术推荐】征稿控制科学、仪器、智能系统、通信、计算机、电子信息、人工智能、大数据、机器学习、软件工程、网络安全方向2025
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l