OliverLee456

因子分析_主成分分析_独立成分分析_斯坦福CS229_学习笔记

Part VIII 因子分析主成分分析独立成分分析

在上个部分介绍了EM算法，在此部分因子分析中，我们会再次应用到。

因子分析、主成分分析和独立成分分析都作为对于数据维度进行处理的手段，对于我们理解数据、更好的表示数据都起到或多或少的作用，因此将三者放在一起进行叙述。

Part VIII 因子分析主成分分析独立成分分析

1 因子分析（Factor Analysis，FA）

1.1 背景

1.2 思想与推导

2 主成分分析（Principal Components Analysis，PCA）

3 独立成分分析（Independent Components Analysis,ICA）

4 小结

1 因子分析（Factor Analysis，FA）

首先介绍因子分析（FA）的提出背景，接着给出算法的思想，最后结合EM算法给出其参数的推导。

1.1 背景

之前介绍的各种算法，我们都有着一个不容忽视假设：样本的数量m足够充足，这样就使得通过训练（迭代），能够求解出参数从而构造出模型。但是现实有时候是残酷的，有时候会存在样本的数量匮乏的情况（m<与 $\Sigma$ ，根据极大似然法估计结果可得：

但是在当前样本数量m<有很大的概率为奇异矩阵，这就意味着 $\Sigma^{-1}$ 不存在且 $1/\left | \Sigma \right |^{1/2} =1/0$ 。而上述两个值我们在接下来具体计算多元高斯分布时都会用到，这就使接下来的计算陷入了一个困境。有没有思路解决这种问题呢？当然有了，接下来介绍两种解决这种问题的思路。

但是先容插句话。有没有好奇在上述情况下（m<出现问题，而 $\mu$ 则没有事儿。参考相关资料，发现并没有人提到。我的理解是，因为利用最大似然对于多元高斯模型进行估参时，得到的 $\mu$ 是无偏估计；而协方差阵 $\Sigma$ 则是有偏估计，且样本数据量越少，偏差越大。具体参考https://blog.csdn.net/qykshr/article/details/23273105。

现在回到正题。既然现在参数过多了，那么就可以对于参数加一些限制进行解决。最直接的思路便是通过限制协方差阵进行解决。例如可以限制协方差阵为对角阵。即：

这是一个很强的限制，因为这种限制认为各个参数之间是独立的，实际情况下是不可取的。在协方差阵为对角阵的基础之上，还可以进一步限制，即协方差阵中的对角元素取值相同。这两种强限制条件大多数情况下感觉都不太适用。

在没有限制条件即原有条件下，需满足 $m\geqslant n+1$ ，才能保证 $\Sigma$ 非奇异；而在有上述两种限制条件下，只需要满足 $m\geqslant 2$ ，即可保证 $\Sigma$ 是非奇异矩阵。（这里并不明白，希望明白的大佬指点一下）。

实际情况下，各参数之间联系是存在并且是需要利用的。解决该问题也可以通过降维的方式进行，即将高维特征转为低维特征。

1.2 思想与推导

因子分析的思想在于，在多维数据x中，假设存在一些相对低维的潜在的变量z（即因子），高维数据x可通过低维潜在的z线性表示（因子分析的一个重要假设）。那么便可以根据此种变换将高维数据x映射到低维数据z，从而达到降维的目的。那么x和z存在着什么样的映射关系呢？因子分析做出以下假设来建立x和z的关系。

（1）低维空间中存在由高斯分布生成的m个k维变量（这又是因子分析的一个重要假设）。（图中m=4，k=1）

（2）原始数据空间x为n（图中n=2）维。可以将低维空间变量通过变换矩阵 $\Lambda$ （n*k）映射到x存在的高维空间。

（3）每个样本加上n维偏移向量 $\mu$

（4）每个样本加上n维高斯扰动ε~N(0,ψ)从而得到高维向量x

由上，可将因子分析模型总结如下：

从高维向量x可由潜在的低维高斯型向量z线性表示出发，存在着以下假设，并且在下列分布中隐变量z与随机高斯噪声 $\epsilon$ 不相关：

第一行表示潜在型高斯变量分布。

第二行表示随机高斯噪声的影响。

第三行表示x由z线性表示形式。

结合上述定义，不难得到（确保明白这点）

接下来，对于x和z的联合分布建模。由于p(x,z)=p(x|z)*p(z)，两个高斯型密度函数的乘积仍然为高斯型，因此将x，z联合分布建模为高斯型如下：

之所以在左端写成矩阵形式，仅仅是为了接下来的表述方便。那么参数 $\mu _{zx}$ 和 $\Sigma$ 是什么形式呢？由多元高斯型联合分布和边缘分布的关系，我们不难进行以下推导：

因为 $z\sim N(0,I)$ ，因此，又因为 $x=\mu +\Lambda *z+\epsilon$ ，因此

那么就有：

$\mu _{zx}=\begin{bmatrix} EZ\\EX \end{bmatrix}=\begin{bmatrix} \vec{0}\\ \mu \end{bmatrix}$

接下来进行在 $\Sigma$ 的推导。在推导中需要利用概率论两个基本公式：

（1）若随机变量X，Y不相关，那么有EXY=EX*EY。在这里即为z与c不相关。

（2） $EX^{2}=\left ( EX \right )^{2}+DX$

因为 $\Sigma =\begin{bmatrix} \Sigma _{zz} &\Sigma _{zx} \\ \Sigma _{xz} & \Sigma _{xx} \end{bmatrix}$ ，那么我们可分别对于矩阵内元素进行如下计算：

$\Sigma _{zz}=I$

$\Sigma _{zx}=\Sigma _{xz}=E[(z-E[z])(x-E[x])^{T}]=E[z(\mu +\Lambda z+\epsilon )^{T}]$

$=E[zz^{T}]\Lambda ^{T}+E[z\epsilon ^{T}]=\Lambda ^{T}$

$\Sigma _{xx}=E[(x-E[x])(x-E[x])^{T}]=E[(\mu +\Lambda *z+\epsilon )(\mu +\Lambda *z+\epsilon )^{T}]$

$=\Lambda E[zz^{T}]\Lambda ^{T}+E[\epsilon \epsilon ^{T}]=\Lambda \Lambda ^{T}+\Psi$

那么结合上述结果，即可得到x，z联合分布如下:

到这里就很清晰了。还是老套路，接下来利用最大似然法求解参数从而得到x，z的联合分布。此时参数为 $\mu$ ， $\Lambda$ 和 $\Psi$ 。写出最大似然方程进行参数求解。

能够直接求偏导解出上述参数算你厉害。

此方程比较复杂，很难直接解出，因此就需要利用上一讲介绍EM算法进行求解了。在上一讲最后利用高斯混合模型对于EM算法的流程已经进行过介绍了。对于高斯混合模型而言，隐变量z为离散型，而在因子分析中隐变量z则为连续性；其实就是将求和改为积分即可。下面给出EM算法的解参数步骤：

（1）E-step：在E-step中，我们需要根据参数计算得到后验概率 $Q_{i}(z^{(i)})$ 。这里利用多元高斯分布的条件分布结论可直接推导出后验分布。先对于多元高斯分布的条件分布结论进行介绍。

若有二元高斯分布 $x\sim N(\mu ,\Sigma )$ ，且参数如下表式：

那么可得以下结论： $x_{1}|x_{2}\sim N(\mu _{1|2},\Sigma _{1|2})$ ，且

因此，根据此结论和前文的推导，可得后验分布 $z^{(i)}|x^{(i)};\mu ,\Lambda, \epsilon \sim N(\mu _{z^{(i)}|x^{(i)}},\Sigma _{z^{(i)}|x^{(i)}})$

以上，E-step顺利走通。

（2）M-step：在M-step，我们要最大化：

简化此式得到：

然后分别对于参数 $\mu ,\Lambda ,\Sigma$ 求偏导得到表达式如下所示（有兴趣的可以自己推推）：

在每次迭代中，更新参数的值直到收敛从而得到最终参数的结果。

由此，求解出三个参数，原有的n维（高维）空间样本x便可由k维（低维）空间隐变量z线性表示了。

2 主成分分析（Principal Components Analysis，PCA）

主成分分析（PCA）作为另外一种数据降维的手段得到了广泛的应用。

主成分分析的思想在于，在数据维度（n维）较大时，各个维度之间或多或少都会存在着相关性，而实际上我们并不需要全部使用维度进行处理，因为或许选取数据的某k维就代表了很大部分的n维特征。PCA的过程就是提取这k维的过程。

解释PCA可以从将近10种思路出发，这里选取比较好理解的最大方差的思路出发进行解释。

以2维数据压缩为1维数据为例，PCA要做的找到一个新的维度，是数据在新维度上的方差最大（即投影长度最长，如u1的方向所示）。因为根据信息论的观点，数据所包含的方差越大，那么数据所包含的信息量越大。如果新的投影方向u1能够包含原有数据的大部分信息（假设85%以上），那么可以认为在保证了数据信息的精度上进行了压缩。

再举一个例子，假设原有5个2维样本如下图所示。

分别将原始数据按照如图所示的两个方向进行投影，得到左图与右图。

这就很清晰了，左图的数据明显比右图更能保留原始的数据信息。

那么包含了数据最多的新的投影方向是什么方向呢？听上去是一个解最值的问题，实际上也正是这样。

首先对于数据预处理。预处理的目的在于使各个维度的数据在接下来的处理中拥有着相同的尺度。预处理步骤如下。

（1）计算 $\mu =\frac{1}{m}\sum_{i=1}^{m}x^{(i)}$

（2）更新 $x^{(i)}$ ， $x^{(i)}:=x^{(i)}-\mu$

（3）计算 $\sigma_{j}^{2}=\frac{1}{m}\sum _{i}(x_{j}^{(i)})^{2}$

（4）更新 $x^{(i)}$ ， $x^{(i)}:=x^{(i)}/\sigma _{j}^{2}$

经过预处理，每一维的数据都统一到均值为0，方差为1的这一分布尺度下了。

接下来定义优化问题，即寻找到投影长度最长的那个方向。

设样本空间存在单位方向向量u，那么某个样本点 $x^{(i)}$ ，在u上的投影长度 length 即为：

$length=\left | x^{(i)} \right |cos<x^{(i)},u>=\left | x^{(i)} \right |*\frac{\boldsymbol{x^{(i)}u}}{\left | x^{(i)} \right |*\left | u \right |}=\boldsymbol{x^{(i)}u}=x^{(i)T}*u$

因此，优化问题即为在|u|=1的条件下，使下式最大化

利用拉格朗日乘数法即可解决，这里设 $X^{T}X=\Sigma$ ，即有下式：

对u求偏导，并另偏导等于0，得 $\Sigma u-\lambda u=0$ ，即 $\Sigma u=\lambda u$ 。

这不正好是一个特征方程嘛，u就是对应的特征向量， $\lambda$ 即为特征向量对应的特征值。

竟是这么巧合？其实这也是可以理解的，从特征值与特征向量的意义出发，不难得到PCA要做的事情其实和直接求解其协方差阵的特征向量是一码事。因为目的都在于寻找到方差变化最大的方向（前k个方向）。而且由于协方差阵 $\Sigma$ 为对称阵，即得到的方向也相互正交，这就使得PCA的降维处理变得更纯粹。

回过头来，不难发现，特征值 $\lambda _{i}$ 代表着该特征向量对于原有信息的贡献率，特征值最大的一个 $\lambda _{i}$ 对应着的特征向量即为包含信息量最多的一个方向。因此我们要判断一个特征向量对于整体方差的贡献率，只需计算其特征值占全部特征值的比例即可。同理，要选取前k个特征向量组成新的维度空间，也根据k个特征向量的方差贡献率即可。

在此基础上，假设选取前k个特征向量进行降维，实现n维特征空间向k维转变，即可得到最终的映射关系：

$x_{low-dimension}(k*1)=u(k*n)*x_{hige-dimension}(n*1)$

3 独立成分分析（Independent Components Analysis,ICA）

独立成分分析的思想同样是为了将数据进行映射。

引入一个具体场景抛砖引玉—鸡尾酒宴会（cocktail party）。在宴会上，有n个人使用话筒同时在演讲。假设每个话筒（共计n个话筒）发出的声音是n个人的声音的和，那么如何从这n个话筒所记录的声音中区分中每个人的声音呢？这便是ICA的一个应用场景。

即可以将问题如下定义：设x（n*1维）为话筒最后发出的声音，s（n*1维）为每个人的声音，A（n*n）称为混合矩阵（mixing matrix），那么有以下关系。我们的目的在于解出s。设 $W=A^{-1}$ ,那么就有 $s=A^{-1}x=Wx$ 。那么目的就转换为找到这个矩阵W。在没有任何先验知识的情况下，上述问题是不可解的。但是我们仍要探究下去。因此，同样是利用“老思路”解决此问题，即假设—建模—求参。

接下来给出ICA解决此问题的思路。

为了使问题可解，需要做一些假设：

（1）假设各个数据来源 $s_{i}$ 相互独立。

（2）假设s的累积概率函数（Cumulative Distribution Function，CDF）作为先验知识可知。若不能根据经验确定，通常设做sigmoid函数效果会好一些。注意当设置为sigmoid函数为先验的CDF时，这同时也暗示着样本的均值为0，若样本的均值不为0，,则样本需要预处理将均值归为0。为什么设置sigmoid函数会带来这个影响呢？

这是因为，若设sigmoid函数 $g(x)=\frac{1}{1+e^{-x}}$ ，那么s的概率分布函数即为： $p(s)=g'(s)=\frac{1}{1+e^{x}+e^{-x}}$ 。由于p（s）为偶函数，那么 $E[s] = \int s*p(s)ds=0$ 。.因此当假设s的分布函数为sigmoid函数后，如果x的均值不为0，需要进行归一化操作将其置为0。

（3） $s_{i}$ 的分布不能为高斯分布。具体原因参见讲义不再叙述。

接下来进行建模，由于 $s_{i}$ 相互独立，因此由边缘分布乘积可直接得到联合密度函数：

又因为，结合密度函数与分布函数的关系，可得：

从而推出：

接下来又到了求参环节了，这里我们的参数是W，同样利用最大似然法进行参数的求解。写出最大似然方程：

对W求偏导，可得每次迭代的更新公式为：

为了表述方便，可将解得的W写成如下形式：

根据W，那么原有数据中的每个信号的来源即可分离开了。即每个 $s_{i}=w_{i}^{T}*x$ 。由此ICA从原有混合数据中将来源于不同信号源的数据进行分离的任务便完成了。

4 小结

或许有人会疑惑同样是作为数据降维的手段，好像最后的形式也差不多，因子分析（FA）和主成分分析（PCA）有什么区别呢？看完二者的推导，谈谈我的看法。

首先，差别还是挺明显的，二者的思想出发点就不同。FA是想从众多特征中找出一些共性（即隐变量z），利用共性对于原有数据进行表达；而PCA则是从众多特征中找出一些具有代表性的特征对于原有特征进行表达。

其次，二者的着重点也不一致。FA着重于各个变量间的协方差；而PCA则着重于总体的方差。

再者，FA相比较而言做了一些假设，较为受到限制；而PCA则无需假设，应用更广。

最后，PCA的实际应用范围是大于FA的。PCA在许多方面都发挥着不小的作用。

独立成分分析（ICA）的目的在于从多个信号混杂的数据中，解算出每个信号原有的数据。为此ICA做了一些假设，包括确定信号的分布函数。在ICA中应该留意，高斯分布的数据并不能直接应用ICA做分解。

李宏毅机器学习笔记——反向传播算法小陈phd 机器学习机器学习算法神经网络
反向传播算法反向传播（Backpropagation）是一种用于训练人工神经网络的算法，它通过计算损失函数相对于网络中每个参数的梯度来更新这些参数，从而最小化损失函数。反向传播是深度学习中最重要的算法之一，通常与梯度下降等优化算法结合使用。反向传播的基本原理反向传播的核心思想是利用链式法则（ChainRule）来高效地计算损失函数相对于每个参数的梯度。以下是反向传播的基本步骤：前向传播（Forwa
Python机器学习笔记：CART算法实战战争热诚
完整代码及其数据，请移步小编的GitHub传送门：请点击我如果点击有误：https://github.com/LeBron-Jian/MachineLearningNote前言在python机器学习笔记：深入学习决策树算法原理一文中我们提到了决策树里的ID3算法，C4.5算法，并且大概的了
机器学习笔记 rl染离机器学习笔记人工智能
什么是机器学习：机器学习是一门多学科交叉专业，涵盖概率论知识，统计学知识，近似理论知识和复杂算法知识，使用计算机作为工具并致力于真实实时的模拟人类学习方式，并将现有内容进行知识结构划分来有效提高学习效率。机器学习有下面几种定义：（1）机器学习是一门人工智能的科学，该领域的主要研究对象是人工智能，特别是如何在经验学习中改善具体算法的性能。（2）机器学习是对能通过经验自动改进的计算机算法的研究。（3）
机器学习笔记（KNN算法）空木幻城机器学习 python 机器学习算法
情景分析现在一个二维平面上有众多点(x1,y1),(x2,y2)...(xn,yn)(x_1,y_1),(x_2,y_2)...(x_n,y_n)(x1,y1),(x2,y2)...(xn,yn)，我也知道它们所属哪个类别，现在给出一个点(x,y)(x,y)(x,y)，问这个点是属于哪个类的。这是一个典型的分类问题重要概念相邻点的个数K相邻点的个数Kknn中最重要的概念就是这个了，也是唯一需要理解
【机器学习笔记】 9 集成学习 RIKI_1 机器学习机器学习笔记集成学习
集成学习方法概述Bagging从训练集中进行子抽样组成每个基模型所需要的子训练集，对所有基模型预测的结果进行综合产生最终的预测结果：假设一个班级每个人的成绩都不太好，每个人单独做的考卷分数都不高，但每个人都把自己会做的部分做了，把所有考卷综合起来得到成绩就会比一个人做的高Boosting训练过程为阶梯状，基模型按次序一一进行训练（实现上可以做到并行），基模型的训练集按照某种策略每次都进行一定的转化
吴恩达机器学习全课程笔记第二篇亿维数组 Machine Learning 机器学习笔记人工智能学习
目录前言P31-P33logistics（逻辑）回归决策边界P34-P36逻辑回归的代价函数梯度下降的实现P37-P41过拟合问题正则化代价函数正则化线性回归正则化logistics回归前言这是吴恩达机器学习笔记的第二篇，第一篇笔记请见：吴恩达机器学习全课程笔记第一篇完整的课程链接如下：吴恩达机器学习教程（bilibili）推荐网站：scikit-learn中文社区吴恩达机器学习学习资料（gith
【机器学习笔记】7 KNN算法 RIKI_1 机器学习机器学习笔记算法
距离度量欧氏距离(Euclideandistance)欧几里得度量（EuclideanMetric）（也称欧氏距离）是一个通常采用的距离定义，指在维空间中两个点之间的真实距离，或者向量的自然长度（即该点到原点的距离）。在二维和三维空间中的欧氏距离就是两点之间的实际距离。曼哈顿距离(Manhattandistance)想象你在城市道路里，要从一个十字路口开车到另外一个十字路口，驾驶距离是两点间的直线
【机器学习笔记】14 关联规则 RIKI_1 机器学习机器学习笔记人工智能
关联规则概述关联规则（AssociationRules）反映一个事物与其他事物之间的相互依存性和关联性。如果两个或者多个事物之间存在一定的关联关系，那么，其中一个事物就能够通过其他事物预测到。关联规则可以看作是一种IF-THEN关系。假设商品A被客户购买，那么在相同的交易ID下，商品B也被客户挑选的机会就被发现了。有没有发生过这样的事：你出去买东西，结果却买了比你计划的多得多的东西？这是一种被称为
【机器学习笔记】13 降维 RIKI_1 机器学习机器学习笔记人工智能
降维概述维数灾难维数灾难(CurseofDimensionality)：通常是指在涉及到向量的计算的问题中，随着维数的增加，计算量呈指数倍增长的一种现象。在很多机器学习问题中，训练集中的每条数据经常伴随着上千、甚至上万个特征。要处理这所有的特征的话，不仅会让训练非常缓慢，还会极大增加搜寻良好解决方案的困难。这个问题就是我们常说的维数灾难。维数灾难涉及数字分析、抽样、组合、机器学习、数据挖掘和数据库
【机器学习笔记】8 决策树 RIKI_1 机器学习机器学习笔记决策树
决策树原理决策树是从训练数据中学习得出一个树状结构的模型。决策树属于判别模型。决策树是一种树状结构，通过做出一系列决策（选择）来对数据进行划分，这类似于针对一系列问题进行选择。决策树的决策过程就是从根节点开始，测试待分类项中对应的特征属性，并按照其值选择输出分支，直到叶子节点，将叶子节点的存放的类别作为决策结果。以下小美相亲的例子就是决策树决策树算法是一种归纳分类算法，它通过对训练集的学习，挖掘出
【机器学习笔记】 15 机器学习项目流程 RIKI_1 机器学习机器学习笔记人工智能
机器学习的一般步骤数据清洗数据清洗是指发现并纠正数据文件中可识别的错误的最后一道程序，包括检查数据一致性，处理无效值和缺失值等。与问卷审核不同，录入后的数据清理一般是由计算机而不是人工完成。探索性数据分析(EDA探索性数据分析（EDA）是一个开放式流程，我们制作绘图并计算统计数据，以便探索我们的数据。目的是找到异常，模式，趋势或关系。这些可能是有趣的（例如，找到两个变量之间的相关性），或者它们可用
【机器学习笔记】5 机器学习实践 RIKI_1 机器学习机器学习笔记人工智能
数据集划分子集划分训练集（TrainingSet）：帮助我们训练模型，简单的说就是通过训练集的数据让我们确定拟合曲线的参数。验证集（ValidationSet）：也叫做开发集（DevSet），用来做模型选择（modelselection），即做模型的最终优化及确定的，用来辅助我们的模型的构建，即训练超参数，可选；测试集（TestSet）：为了测试已经训练好的模型的精确度。三者划分：训练集、验证集、
【机器学习笔记】11 支持向量机 RIKI_1 机器学习机器学习笔记支持向量机
支持向量机（SupportVectorMachine,SVM）支持向量机是一类按监督学习（supervisedlearning）方式对数据进行二元分类的广义线性分类器（generalizedlinearclassifier），其决策边界是对学习样本求解的最大边距超平面（maximum-marginhyperplane）。与逻辑回归和神经网络相比，支持向量机，在学习复杂的非线性方程时提供了一种更为清
【机器学习笔记】12 聚类 RIKI_1 机器学习机器学习笔记聚类
无监督学习概述监督学习在一个典型的监督学习中，训练集有标签，我们的目标是找到能够区分正样本和负样本的决策边界，需要据此拟合一个假设函数。无监督学习与此不同的是，在无监督学习中，我们的数据没有附带任何标签，无监督学习主要分为聚类、降维、关联规则、推荐系统等方面。主要的无监督学习方法聚类（Clustering）如何将教室里的学生按爱好、身高划分为5类？降维（DimensionalityReductio
【机器学习笔记】4 朴素贝叶斯 RIKI_1 机器学习机器学习笔记人工智能
贝叶斯方法贝叶斯分类贝叶斯分类是一类分类算法的总称，这类算法均以贝叶斯定理为基础，故统称为贝叶斯分类。朴素贝叶斯分类是这一类算法中最简单的较为常见的算法。先验概率根据以往经验和分析得到的概率。我们用()来代表在没有训练数据前假设拥有的初始概率。后验概率根据已经发生的事件来分析得到的概率。以(|)代表假设成立的情下观察到数据的概率，因为它反映了在看到训练数据后成立的置信度。联合概率是指在多元的概率分
【机器学习笔记】 6 机器学习库Scikit-learn RIKI_1 机器学习机器学习笔记 scikit-learn
Scikit-learn概述Scikit-learn是基于NumPy、SciPy和Matplotlib的开源Python机器学习包,它封装了一系列数据预处理、机器学习算法、模型选择等工具,是数据分析师首选的机器学习工具包。自2007年发布以来，scikit-learn已经成为Python重要的机器学习库了，scikit-learn简称sklearn，支持包括分类，回归，降维和聚类四大机器学习算法。
【机器学习笔记】10 人工神经网络 RIKI_1 机器学习机器学习笔记人工智能
人工神经网络发展史1943年，心理学家McCulloch和逻辑学家Pitts建立神经网络的数学模型，MP模型每个神经元都可以抽象为一个圆圈，每个圆圈都附带特定的函数称之为激活函数，每两个神经元之间的连接的大小的加权值即为权重。1960年代，人工网络得到了进一步地发展感知机和自适应线性元件等被提出。M.Minsky仔细分析了以感知机为代表的神经网络的局限性，指出了感知机不能解决非线性问题，这极大影响
【机器学习笔记】3 逻辑回归 RIKI_1 机器学习机器学习笔记逻辑回归
分类问题分类问题监督学习最主要的类型，主要特征是标签离散，逻辑回归是解决分类问题的常见算法，输入变量可以是离散的也可以是连续的二分类先从用蓝色圆形数据定义为类型1，其余数据为类型2；只需要分类1次，步骤：①->②多分类问题先定义其中一类为类型1（正类），其余数据为负类（rest）；接下来去掉类型1数据，剩余部分再次进行二分类，分成类型2和负类；如果有类，那就需要分类-1次,步骤：①->②->③->
【百面机器学习笔记】模型评估葡萄肉多
模型评估指标准确率（Accuracy）准确率是指分类正确的样本占总样本个数的比例。Accuracy=n(correct)/n(total)当负样本占99%时，分类器把所有样本都预测为负样本也可以获得99%的准确率。所以，当不同类别的样本比例非常不均衡时，占比大的类别往往成为影响准确率的最主要因素。精确率（Precision）&召回率（Recall）精确率是指分类正确的正样本个数占分类器判定为正样本
李宏毅机器学习笔记 2.回归 Simone Zeng 机器学习机器学习
最近在跟着Datawhale组队学习打卡，学习李宏毅的机器学习/深度学习的课程。课程视频：https://www.bilibili.com/video/BV1Ht411g7Ef开源内容：https://github.com/datawhalechina/leeml-notes本篇文章对应视频中的P3。另外，最近我也在学习邱锡鹏教授的《神经网络与深度学习》，会补充书上的一点内容。通过上一次课1.机器
【机器学习笔记】基于实例的学习住在天上的云机器学习机器学习笔记学习 KNN 实例学习
基于实例的学习文章目录基于实例的学习1基本概念与最近邻方法2K-近邻（KNN）3距离加权KNN4基于实例/记忆的学习器5局部加权回归5多种回归方式对比6懒惰学习与贪婪学习动机：人们通过记忆和行动来推理学习。1基本概念与最近邻方法名词概念参数化设定一个特定的函数形式优点：简单，容易估计和解释可能存在很大的偏置：实际的数据分布可能不遵循假设的分布非参数化：分布或密度的估计是数据驱动的（data-dri
fast.ai 机器学习笔记（一）绝不原创的飞龙人工智能人工智能 python
机器学习1：第1课原文：medium.com/@hiromi_suenaga/machine-learning-1-lesson-1-84a1dc2b5236译者：飞龙协议：CCBY-NC-SA4.0来自机器学习课程的个人笔记。随着我继续复习课程以“真正”理解它，这些笔记将继续更新和改进。非常感谢Jeremy和Rachel给了我这个学习的机会。简要课程大纲根据时间和班级兴趣，我们将涵盖类似以下内容
fast.ai 机器学习笔记（四）绝不原创的飞龙人工智能人工智能 python
机器学习1：第11课原文：medium.com/@hiromi_suenaga/machine-learning-1-lesson-11-7564c3c18bbb译者：飞龙协议：CCBY-NC-SA4.0来自机器学习课程的个人笔记。随着我继续复习课程以“真正”理解它，这些笔记将继续更新和改进。非常感谢Jeremy和Rachel给了我这个学习的机会。使用SGD优化多层函数的回顾[0:00]这个想法是
机器学习笔记（3）：误差、复杂度曲线、学习曲线等链原力
本文来自之前在Udacity上自学机器学习的系列笔记。这是第3篇，介绍了模型的误差类型、误差的由来、找到模型适合的参数、以及避免欠拟合和过拟合的方法。1.诊断误差1.1.误差类型我们的预测或者分类的结果与实际结果相比较，会存在一定的误差，误差越小，表示结果越好。一般有两种误差来源，欠拟合和过拟合。将问题看得过于简单导致了欠拟合（Underfitting），将问题看得过于复杂导致了过拟合（Overf
fast.ai 机器学习笔记（三）绝不原创的飞龙人工智能人工智能 python
机器学习1：第8课原文：medium.com/@hiromi_suenaga/machine-learning-1-lesson-8-fa1a87064a53译者：飞龙协议：CCBY-NC-SA4.0来自机器学习课程的个人笔记。随着我继续复习课程以“真正”理解它，这些笔记将继续更新和改进。非常感谢Jeremy和Rachel给了我这个学习的机会。广义定义的神经网络视频/笔记本正如我们在上一课结束时讨
fast.ai 机器学习笔记（二）绝不原创的飞龙人工智能人工智能 python
机器学习1：第5课原文：medium.com/@hiromi_suenaga/machine-learning-1-lesson-5-df45f0c99618译者：飞龙协议：CCBY-NC-SA4.0来自机器学习课程的个人笔记。随着我继续复习课程以“真正”理解它，这些笔记将继续更新和改进。非常感谢Jeremy和Rachel给了我这个学习的机会。视频复习测试集，训练集，验证集和OOB我们有一个数据集
政安晨：示例演绎机器学习中（深度学习）神经网络的数学基础——快速理解核心概念（一）{两篇文章讲清楚} 政安晨政安晨的机器学习笔记神经网络人工智能深度学习 Python 数学基础机器学习 Conda
进入人工智能领域免不了与算法打交道，算法依托数学基础，很多小伙伴可能新生畏惧，不用怕，算法没那么难，也没那么玄乎，未来人工智能时代说不得人人都要了解算法、应用算法。本文试图以一篇文章，用程序演绎的方式给大家把这里面的数学基础先讲清楚，以便于咱们未来深入，呵呵。第一次接触机器学习的小伙伴，环境搭建参考我的这篇文章（只参考这个里面关于环境搭建的部分就可以）：政安晨的机器学习笔记——跟着演练快速理解Te
【机器学习笔记】贝叶斯学习住在天上的云机器学习机器学习笔记学习贝叶斯学习人工智能
贝叶斯学习文章目录贝叶斯学习1贝叶斯学习背景2贝叶斯定理3最大后验假设MAP(MaxAPosterior)4极大似然假设ML(MaximumLikelihood)5朴素贝叶斯NB6最小描述长度MDL1贝叶斯学习背景试图发现两件事情的关系（因果关系，先决条件&结论）。执果索因：肺炎→肺癌？不好确定，换成确诊肺癌得肺炎的概率2贝叶斯定理贝叶斯定理是一种用先验慨率来推断后验慨率的公式，它可以表示为：P(
【机器学习笔记】决策树住在天上的云机器学习机器学习笔记决策树
决策树文章目录决策树1决策树学习基础2经典决策树算法3过拟合问题1决策树学习基础适用决策树学习的经典目标问题带有非数值特征的分类问题离散特征没有相似度概念特征无序例子：SkyTempHumidWindWaterForecastEnjoySunnyWarmNormalStrongWarmSameYesSunnyWarmHighStrongWarmSameYesRainyColdHighStrongW
【机器学习笔记】回归算法住在天上的云机器学习笔记回归线性回归人工智能
回归算法文章目录回归算法1线性回归2损失函数3多元线性回归4线性回归的相关系数1线性回归回归分析(Regression)回归分析是描述变量间关系的一种统计分析方法例：在线教育场景因变量Y：在线学习课程满意度自变量X：平台交互性、教学资源、课程设计预测性的建模技术，通常用于预测分析，预测的结果多为连续值（也可为离散值，二值）线性回归(Linearregression)因变量和自变量之间是线性关系，就
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa

因子分析_主成分分析_独立成分分析_斯坦福CS229_学习笔记

Part VIII 因子分析 主成分分析 独立成分分析

1 因子分析（Factor Analysis，FA）

1.1 背景

1.2 思想与推导

2 主成分分析（Principal Components Analysis，PCA）

3 独立成分分析（Independent Components Analysis,ICA）

4 小结

你可能感兴趣的:(机器学习笔记)

Part VIII 因子分析主成分分析独立成分分析