DeepHao

机器学习算法笔记Ⅳ——主成分分析原理及应用

文章目录

PCA 算法简介
相关矩阵原理

特征值与特征向量
正定矩阵与正交向量

PCA 原理推导

函数求解
PCA 算法流程
PCA matlab计算

PCA 实现鸢尾花分类

PCA 数据降维处理
KNN实现分类效果

总结

PCA 算法简介

主成分分析（英语：Principal components analysis，PCA）是在不损失或者不很损失原始数据信息的情况下将一个多维数据进行降维处理，其中降维有两个目的：
◆减少输入信息，突出特征信息，提高运算效率
◆在一定程度上能消除数据中的冗余信息，增强数据的鲁棒性

解释一：
主成分分析是一种统计方法，通过正交变换将一组可能存在相关性的变量转换成一组线性不相关的变量，达到压缩的目的。【解释来源MOOC】
解释二
主成分分析可以看成一种坐标变换，在原始的坐标基上数据与数据之间存在一定相关性，通过主成分分析，将这些数据映射在一个新的坐标系中（即变换出一种新的正交基，新的正交基的维度往往小于原始坐标系中的正交基，因此在新的坐标系中能达到降维的目的），在新的坐标系中数据与数据之间线性无关。通过数据之间的无关性便能更好的进行分类，例如下图中，原始坐标系为二维笛卡尔坐标系，正交基为 $\overrightarrow i$ 、 $\overrightarrow j$ 即传统的 $x$ 、 $y$ 轴的单位向量，而新的坐标系为单个轴（可以看为数轴），其正交基只有一个即 $\overrightarrow e$ 。【解释来源我自己】

二维数据一维映射示例

举个栗子：在学生的考试中，往往有很多门功课的成绩。最简单的比较成绩好坏的方式就是算总分并进行排名。因此这就是一种最常见的降维方式，将多门功课的成绩降为一个总分成绩。但是，通过降维后的数据也有一个特点就是不能知晓原始信息之间的关系，比如看到一份总成绩的排名名单我们是无法推敲其各科成绩的。当然这里对降维算法的描述并不是特别准确和科学，具体的理解应在后面的原理解析中。这里只是简单介绍一下降维的优点。降维是PCA不可缺少的部分。

eyes up stay sharp 一波公式原理来袭

PCA 原理推导

设 $X_1,X_2,...X_M$ 为训练样本，每个为 $N$ 维。寻找一个 $❓ \times N$ 维的矩阵 $A$ ，使 $Y=A(X-\overline X)$ ，将 $X$ 的维度由 $N$ 降到❓维，❓是自己设定的维度，其值要小于 $M$ 。
PCA要求：
① $=\begin{pmatrix} a_1 \\ a_2 \\ ...\\ a_M \end{pmatrix}$ ，其中 $a_i$ 为 $1 \times N$ 维。
② $a_i{a_j}^T=\left\{ \begin{array}{rcl} 0 & & {i \ne j}\\ 1 & & {i=j} \end{array} \right.$ ，即满足正交性。
③方差最大。寻找 $a_1$ ，使 $\sum\nolimits_{i = 1}^p {||{a_1}({x_i} - \overline x )|{|^2}}$ 最大。即 $m a x m i z e$ $\sum\nolimits_{i = 1}^p {||{a_1}({x_i} - \overline x )|{|^2}}$ ，下面讨论如何最大化目标函数 $\sum\nolimits_{i = 1}^p {||{a_1}({x_i} - \overline x )|{|^2}}$ 。

函数求解

Ⅰ、 $a_1$ 求解
$\sum\nolimits_{i = 1}^p {||{a_1}({x_i} - \overline x )|{|^2}}=\sum\limits_{i = 1}^p {{a_1}({x_i} - \overline x ){{({x_i} - \overline x )}^T}} a_1^T={a_1}\sum {a_1^T}$ ，其中 $\sum=\sum\nolimits_{i = 1}^p {({x_i} - \overline x )({x_i} - \overline x )^T}$ 为协方差矩阵，其中约束条件为 $a_1{a_1}^T=1$ ，因此我们采用拉格朗日乘数法。构造如下：
$object=\left\{ \begin{aligned} E(a_1)&=&{a_1}\sum {a_1^T}-\lambda(a_1{a_1}^T-1)&=&minvalue & &①\\ \frac{{\partial E}}{{\partial {a_1}}} &= &\sum {a_1^T}-{\lambda a_1}^T&=&0 & &②\\ \frac{{\partial E}}{{\partial {a_1^T}}} &= &\sum {a_1}-{\lambda a_1}&=&0 & &③\\ \frac{{\partial E}}{{\partial {\lambda}}}& = &1-a_1a_1^T&=&0 & &④ \end{aligned} \right.$
易知④成立，由① $\frac{{\partial E}}{{\partial {a_1}}} = \sum {a_1^T}-{\lambda a_1}^T=0$ 可得 $\sum {a_1^T}=\lambda a_1^T$ 即有 ${a_1}\sum {a_1^T}=a_1(\lambda a_1^T)=\lambda a_1a_1^T=\lambda$ 因此， $\lambda$ 为最大的特征值， ${a_1^T}$ 为最大特征值对应的特征向量。

Ⅰ、 $a_2$ 求解
与 $a_1$ 求解不同的是 $a_2$ 求解具有两个约束条件： $a_2{a_2}^T=1$ 、 $a_2{a_1}^T=0$
构造如下：
$object=\left\{ \begin{aligned} E(a_2)&=&{a_2}\sum {a_2^T}-\lambda(a_2{a_2}^T-1) - \beta a_2a_1^T&=&minvalue & &①\\ \frac{{\partial E}}{{\partial {a_2}}} &= &\sum {a_2^T}-{\lambda a_2}^T - \beta a_1^T&=&0 & &②\\ \frac{{\partial E}}{{\partial {a_2^T}}}& =& \sum {a_2}-{\lambda a_2}&=&0 & &③\\ \frac{{\partial E}}{{\partial {a_1^T}}} &=& -\beta a_2 &=&0 & &④\\ \frac{{\partial E}}{{\partial {\lambda}}} &=& 1-a_2a_2^T&=&0 & &⑤\\ \frac{{\partial E}}{{\partial {\beta}}} &=& -a_2a_1^T&=&0 & &⑥ \end{aligned} \right.$
易知⑤，⑥成立，由④ $\frac{{\partial E}}{{\partial {a_1^T}}} = -\beta a_2 =0$ 又 $a_2$ 为矩阵A的一个向量，A为满秩矩阵，因此 $a_2$ 明显不为零，所以 $\beta=0$ 。又由③ $\frac{{\partial E}}{{\partial {a_2^T}}} = \sum {a_2}-{\lambda a_2}=0$ 可推出 $\lambda$ 为 $\sum$ 的第二大特征值， ${a_2^T}$ 为第二大特征值对应的特征向量。

Ⅰ、 $a_i$ 求解
由上述两种方式，我们可以以此解得， $a_i$ 为 $\sum$ 的第 $i$ 大特征值， ${a_i^T}$ 为第 $i$ 大特征值对应的特征向量。因此我们可知矩阵A是由协方差矩阵 $\sum$ 的特征向量组成，其所包含的特征向量的个数极为我们所需要降到的维度值。

PCA 算法流程

一、对于输入的 $N$ 维向量 $X_1、X_2、X_3...、X_p$ ，求协方差矩阵 $\sum=\sum\limits_{i = 1}^p {({x_i} - \overline x ){{({x_i} - \overline x )}^T}}$
二、求 $\sum$ 的特征值和特征向量，按照从特征值从大到小分别是（我们假定所降至维度为 $M$ 维） $\lambda_1、\lambda_2、\lambda_3...、\lambda_M、$ 由于协方差矩阵是半正定矩阵，它的特征值都是非负的，因此它们对应的特征向量分别为 ${a_1^T}、{a_2^T}、{a_3^T}...、{a_M^T}$
三、设 $=\begin{pmatrix} a_1 \\ a_2 \\ ...\\ a_M \end{pmatrix}$ ，它是一个 $M \times N$ 维矩阵。 $Y_i=A(X_i-\overline X)$ ，即 $\overline X=\frac{{1}}{{p}}\sum\nolimits_{i = 1}^p X_i$ ，这样即将 $N$ 维向量 $X_i$ 变为 $M$ 维向量 $Y_i(MYi(M<N)$

PCA matlab计算

本次对单个矩阵得PCA计算采用版本为MATLABR2019b(9.7.01190202)，MATLAB对于矩阵中向量的排列规则是，一行代表一个成员，每一行内的值则是成员的值。在所给出的代码文件中，不仅用MATLAB自带的函数写了PCA算法，还严格按照PCA的算法流程用基本MATLAB语法完成PCA算法，两者输出的值是相同的。MATLAB代码如下：

%% PCA matrix calculate 5 members 2 features
clear; clc;
disp('INFO:Matrix X has 5 members, each of them has 2 features.')
X = sym([-2, -1;0, -1;0, 0;1, 2;1, 0], 'f');
[member, ~]=size(X);
disp('matrix X value:')
disp(X)

% calculate cov(X) by normal method
disp('Calculate cov(X) by normal method.')
mean_value = mean(X, 1);
for i = 1:length(mean(X, 1))
    X(:, i) = X(:, i) - mean_value(i);
end
cov_normal = X' * X / (member - 1);
disp('matrix cov_normal value:')
disp(cov_normal)

% calculate cov(X) by cov function
disp('Calculate cov(X) by cov function.')
cov_function = cov(X);
disp('matrix cov_function value:')
disp(cov_function)

% vector and lamda
[vector, lamda] = eig(cov(X));
total = sum(diag(lamda));
disp('vector and  lamda matrix value:')
disp(vector)
disp(lamda)

% reduction dim
maximum = max(max(lamda));
[index,~]=find(lamda==maximum);
A = vector(:,index);
result = X * A;
disp('final result:')
disp(result)

disp('Energy ratio maximum / total')
disp(maximum / total)


%% PCA matrix calculate 2 members 5 features
clear; clc;
disp('INFO:Matrix X has 2 members, each of them has 5 features.')
X = sym([-2,0,0,1,1;-1,-1,0,2,0], 'f');
[member, ~]=size(X);
disp('matrix X value:')
disp(X)

% calculate cov(X) by normal method
disp('Calculate cov(X) by normal method.')
mean_value = mean(X, 1);
for i = 1:length(mean(X, 1))
    X(:, i) = X(:, i) - mean_value(i);
end
cov_normal = X' * X / (member - 1);
disp('matrix cov_normal value:')
disp(cov_normal)

% calculate cov(X) by cov function
disp('Calculate cov(X) by cov function.')
cov_function = cov(X);
disp('matrix cov_function value:')
disp(cov_function)

% vector and lamda
[vector, lamda] = eig(cov(X));
disp('vector and  lamda matrix value:')
disp(vector)
disp(lamda)

% reduction dim
maximum = max(max(lamda));
[index,~]=find(lamda==maximum);
A = vector(:,index);
result = X * A;
disp('final result:')
disp(result)


%% 3 members 2 features
clear; clc;
disp('INFO:Matrix X has 3 members, each of them has 2 features.')
X = sym([1, 4;2, 5;3, 6], 'f');
[member, ~]=size(X);
disp('matrix X value:')
disp(X)

% calculate cov(X) by normal method
disp('Calculate cov(X) by normal method.')
mean_value = mean(X, 1);
for i = 1:length(mean(X, 1))
    X(:, i) = X(:, i) - mean_value(i);
end
cov_normal = X' * X / (member - 1);
disp('matrix cov_normal value:')
disp(cov_normal)

% calculate cov(X) by cov function
disp('Calculate cov(X) by cov function.')
cov_function = cov(X);
disp('matrix cov_function value:')
disp(cov_function)

% vector and lamda
[vector, lamda] = eig(cov(X));
disp('vector and  lamda matrix value:')
disp(vector)
disp(lamda)

% reduction dim
maximum = max(max(lamda));
[index,~]=find(lamda==maximum);
A = vector(:,index);
result = X * A;
disp('final result:')
disp(result)

在此版本中可以将MATLAB代码转换成实时运行脚本文件，并且可以观察打印输出，具体的输出可自行运行代码文件。截图如下：

PCA 实现鸢尾花分类

PCA 数据降维处理

导入必要的包

import pandas as pd
import numpy as np
from sklearn.decomposition import PCA
from factor_analyzer import FactorAnalyzer
import matplotlib.pyplot as plt

数据处理

def datafram_dealt(data):
    df_data = pd.read_csv(data)
    df = df_data.drop(['Unnamed: 0'], axis=1)
    class_name = list(df['Species'].drop_duplicates())
    df['Species'] = df['Species'].map({class_name[0]:0, class_name[1]:1, class_name[2]:2}).astype(int)
    df = df.sample(frac=1)
    dick_map = {class_name[0]:0, class_name[1]:1, class_name[2]:2}
    
    return df, dick_map

df, dick_map = datafram_dealt('Iris/iris.csv')

df

	Sepal.Length	Sepal.Width	Petal.Length	Petal.Width	Species
108	6.7	2.5	5.8	1.8	2
93	5.0	2.3	3.3	1.0	1
5	5.4	3.9	1.7	0.4	0
33	5.5	4.2	1.4	0.2	0
95	5.7	3.0	4.2	1.2	1
...	...	...	...	...	...
109	7.2	3.6	6.1	2.5	2
9	4.9	3.1	1.5	0.1	0
4	5.0	3.6	1.4	0.2	0
86	6.7	3.1	4.7	1.5	1
35	5.0	3.2	1.2	0.2	0

150 rows × 5 columns

dick_map

{'setosa': 0, 'versicolor': 1, 'virginica': 2}

获取训练集

train_x = df.iloc[0:120, 0:4]
train_y = df.iloc[0:120, 4]

降维为四个维度，以便查看原始维度中贡献最大的成分，可以发现四个维度贡献分别为0.92011969, 0.05660178, 0.01812305, 0.00515547

model = PCA(n_components=4)

model.fit(train_x)

PCA(copy=True, iterated_power='auto', n_components=4, random_state=None,
    svd_solver='auto', tol=0.0, whiten=False)

model.explained_variance_ratio_

array([0.92096378, 0.05528745, 0.01805879, 0.00568998])

降维为三个维度，在三维坐标系绘图可视化

model = PCA(n_components=3)
model.fit(train_x)
model.explained_variance_ratio_, model.explained_variance_

(array([0.92096378, 0.05528745, 0.01805879]),
 array([4.13008788, 0.24793812, 0.08098514]))

train_x_2D = model.transform(train_x)

fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')
ax.scatter(train_x_2D[:, 0], train_x_2D[:, 1], train_x_2D[:, 2], c=train_y)
plt.show()

降维为两个维度，在二维坐标系可视化

model = PCA(n_components=2)
model.fit(train_x)
model.explained_variance_ratio_, model.explained_variance_

(array([0.92096378, 0.05528745]), array([4.13008788, 0.24793812]))

train_x_2D = model.transform(train_x)

plt.scatter(train_x_2D[:, 0], train_x_2D[:, 1], c=train_y)
plt.show()

自定义保留95％成分，计算机自动计算保留维度，从前面四个维度不难看出，两个维度则占比超过95％，与预期结果相符合

model = PCA(n_components=0.95)
model.fit(train_x)
model.explained_variance_ratio_, model.n_components_

(array([0.92096378, 0.05528745]), 2)

利用mle参数让计算机自动计算保留的维度，结果为三个维度，其成分保留约为99.5％

model = PCA(n_components='mle')
model.fit(train_x)
model.explained_variance_ratio_, model.n_components_

(array([0.92096378, 0.05528745, 0.01805879]), 3)

sum(model.explained_variance_ratio_)

0.9943100204228477

利用因子分析实现组间方差极大化，将数据分隔更开，以三维为例

model = FactorAnalyzer(n_factors=3, rotation='promax')
model.fit(train_x)
model.loadings_

array([[ 1.06466005,  0.07180062, -0.08841903],
       [ 0.00898918,  0.77820767,  0.03874046],
       [ 0.70969381, -0.19615596,  0.26522617],
       [ 0.50775203,  0.0731516 ,  0.63305601]])

train_x_2D = model.transform(train_x)

fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')
ax.scatter(train_x_2D[:, 0], train_x_2D[:, 1], train_x_2D[:, 2], c=train_y)
plt.show()

利用因子分析实现组间方差极大化，将数据分隔更开，以二维为例

model = FactorAnalyzer(n_factors=2, rotation='promax')
model.fit(train_x)
model.loadings_

array([[ 0.93854453,  0.16348874],
       [ 0.0110667 ,  1.00086531],
       [ 0.95945583, -0.12708808],
       [ 0.92380573, -0.07361529]])

train_x_2D = model.transform(train_x)

plt.scatter(train_x_2D[:, 0], train_x_2D[:, 1], c=train_y)
plt.show()

KNN实现分类效果

导入必要的包

from sklearn import neighbors

模型建立，利用上一步中最后处理完成的二维数据

model_KNN = neighbors.KNeighborsClassifier()

model_KNN.fit(train_x_2D, train_y)

KNeighborsClassifier(algorithm='auto', leaf_size=30, metric='minkowski',
                     metric_params=None, n_jobs=None, n_neighbors=5, p=2,
                     weights='uniform')

test_x = model.transform(df.iloc[120:150, 0:4])

test_p = model_KNN.predict(test_x)
test_y = df.iloc[120:150, 4].values

print('predict value:', test_p,
      '\nlabel value  :', test_y)

predict value: [1 0 0 1 2 0 1 2 1 0 2 0 1 2 0 1 1 0 2 2 1 0 0 1 1 2 0 0 1 0] 
label value  : [1 0 0 1 2 0 2 2 2 0 2 0 1 2 0 1 1 0 2 1 2 0 0 1 2 2 0 0 1 0]

查看准确率

model_KNN.score(test_x, test_y)

0.8333333333333334

总结

PCA算法能够降低维度，减少数据，其作用与卷积操作类似。最后将处理完成的数据用于神经网路以及传统机器学习算法例如KNN等，都能取得较好的效果

机器学习算法笔记(1)——逻辑斯蒂回归Logistic处理二分类任务念旧NiceJeo 机器学习算法笔记算法机器学习 python 可视化
逻辑斯蒂回归LogisticRegressor处理二分类任务一.逻辑斯蒂回归1.模型2.代价函数（损失函数）3.优化算法二.代码实现1.二维二分类2.多维二分类本系列为观看吴恩达老师的[中英字幕]吴恩达机器学习系列课程做的课堂笔记。图片来自视频截图。不得不说，看了老师的视频真的学到了很多。即使数学不好的同志们也可以看懂，真的可谓是细致入微了。一.逻辑斯蒂回归1.模型学过深度学习的同志们对这张图一定
机器学习算法笔记-逻辑回归 diudiu~bo 机器学习经典算法算法机器学习概率论
逻辑回归（LR）我的理解是，逻辑回归就是以改进的线性回归的方法求分类，改进的内容就是引入了非线性函数，最常用的就是sigmoid函数。如下图就是sigmoid函数，横轴z=0时，纵轴g(z)=0.5，z趋向于负无穷时，g(z)趋向于0，z趋向于正无穷时，g(z)趋向于1。其中z=thetaT*X，g(z)表示概率，逻辑回归目标函数的推导见下图。逻辑回归最经典的是二分类函数，二分类回归常用的损失函数
机器学习算法笔记：贝叶斯线性回归 xiaochengJF 机器学习机器学习
文章目录贝叶斯线性回归推断预测参考文献贝叶斯线性回归线性回归当噪声为高斯分布的时候，最小二乘损失导出的结果相当于对概率模型应用MLE，引入参数先验分布是高斯分布，那么MAP的结果相当于岭回归的正则化，如果先验是拉普拉斯分布，那么相当于Lasso的正则化。利用贝叶斯方法来求解参数的后验分布，线性回归的模型假设为：f(x)=wTxy=f(x)+εε∼N(0,σ2)\begin{aligned}f(x)
ML机器学习算法笔记 l_aiya 机器学习算法 python
文章目录5.2数据预处理5.2.1缺失值处理5.2.2数据规范化5.2.3主成分分析5.3线性回归(回归模型)5.4逻辑回归（分类模型）5.5神经网络5.5.3Python神经网络分类应用5.5.4Python神经网络回归应用5.6支持向量机核函数选择：5.7K-均值聚类PythonK-均值聚类算法应用5.2数据预处理5.2.1缺失值处理importpandasaspdimportnumpyasn
机器学习算法笔记：GMM高斯混合模型 xiaochengJF 机器学习机器学习
文章目录高斯混合模型极大似然估计EM求解GMM参考文献高斯混合模型为了解决高斯模型的单峰性的问题，引入多个高斯模型的加权平均来拟合多峰数据：p(x)=∑k=1KαkN(μk,Σk)p(x)=\sum\limits_{k=1}^K\alpha_k\mathcal{N}(\mu_k,\Sigma_k)p(x)=k=1∑KαkN(μk,Σk)引入隐变量zzz，表示对应样本xxx属于哪一个高斯分布，该变量
【机器学习算法笔记】6. 降维与主分量分析（PCA） tostq 机器学习机器学习算法笔记机器学习算法 PCA 降维
【机器学习算法笔记】6.降维与主分量分析（PCA）6.1PCA算法特征选择问题是指将数据空间变换到特征空间，我们希望设计一种变换使得数据集由维数较少的有效特征来表示。PCA是最常用的线性降维方法，它的目标是通过某种线性投影，将高维的数据映射到低维的空间中表示，并期望在所投影的维度上数据的方差最大，以此使用较少的数据维度，同时保留住较多的原数据点的特性。通俗的理解，如果把所有的点都映射到一起，那么几
机器学习算法笔记-决策树 diudiu~bo 机器学习经典算法算法决策树 sklearn
决策树（DT）树模型如何切分特征衡量标准如何选择特征衡量决策树不纯度的方法剪枝策略树模型决策树：从根节点开始一步步走到叶子节点（决策）所有的数据最终都会落到叶子节点，既可以分类也可以回归。决策树对于特征判断的顺序比较严格，如果判断顺序不同，最终的结果可能不同树的组成：根节点、非叶子结点与分支、叶子节点如何切分特征衡量标准熵：表示随机变量不确定性的度量，即混乱程度。不确定性越大，得到的熵值也就越大。
【机器学习算法笔记】5. 自组织映射SOM tostq 机器学习机器学习算法笔记机器学习算法 SOM 自组织映射
【机器学习算法笔记】5.自组织映射SOM自组织映射是一类非监督学习算法自组织原则：1、自增强：如果两个神经元是同时激活的，则突触强度会选择性地增强；如果是异步激活的，突触强度会减弱2、竞争原则：可用资源的局限使得最强健增长的突触是以其他神经元作为代价的3、协作：在神经元级别中，对突触权值的修改趋于互相合作。4、结构化信息：在一个输入信号中存在的潜在次序和结构代表了冗余信息，其通过自组织系统以知识的
机器学习算法笔记：降维 xiaochengJF 机器学习机器学习
文章目录降维线性降维-主成分分析PCA原始空间重构最大投影方差最小重构距离SVD与PCoAP-PCA参考文献降维解决过拟合问题除正则化和添加数据外，降维就是最好的方法。一个nnn维球的体积可表示为：CRnCR^nCRn那么在球体积与边长为2R2R2R的超立方体比值为：lim⁡n→0CRn2nRn=0\lim\limits_{n\rightarrow0}\frac{CR^n}{2^nR^n}=0n→
机器学习算法笔记之5：支持向量机SVM marsjhao 机器学习/深度学习机器学习 svm 核函数 KKT条件
一、概述支持向量机（SupportVectorMachine，SVM）的基本模型是定义在特征空间上间隔最大的线性分类器，它是一种二分类模型，当采用了适当的核技巧后，支持向量机可以用于非线性分类。（1）线性可分支持向量机（硬间隔支持向量机）：当训练数据线性可分时，通过硬间隔最大化，可以学得一个线性可分支持向量机。（2）线性支持向量机（软间隔支持向量机）：当训练数据近似线性可分时，通过软间隔最大化，学
机器学习算法笔记-线性回归的实验过程 diudiu~bo 机器学习经典算法深度学习机器学习线性代数
线性回归的实验过程参数直接求解方法数据预处理梯度下降模块学习率对结果的影响学习率衰减3种策略的对比多项式回归模型复杂度样本数量对实验的影响正则化的作用参数直接求解方法如下图所示，根据目标函数的极值可以直接求出参数theta的表达式，用这种方法也可以直接求出线性回归的最终结果，但是这种方法并非适用于所有数据，因为theta的求解公式中包含了特征矩阵的逆矩阵，求解逆矩阵是有前提条件的，不是所有的矩阵都
机器学习算法笔记 _爱碎碎碎碎念
这是我的第一篇笔记，主要用来归纳几种经典的机器学习算法的思想、适用性、优缺点等。主要是失业在家，需要每天给自己点任务，接受大家监督。序言一些基础知识的引入，但是并没有递进关系。判别式和生成式模型机器学习方法按照训练数据有无标签将算法分成有监督和无监督的算法，这个概念浅显易懂就不多说。但是最近刷互联网公司的真题时多次预测判别式和生成式模型，就有必要提一提。判别式模型和生成式模型都是有监督的学习方法，
混淆矩阵竹林皓月
机器学习算法笔记(二十七)：混淆矩阵、精准率与召回率、F1Score转自：https://louyu.site/articles/machine-learning/2019/09/?p=1907/对于回归问题来说，评论算法的好坏我们讨论过MSE、MAE、RMSE、RSquared。但对于分类算法的评价，我们在前面始终使用“分类准确度”这一个指标。实际上分配准确度在评价分类算法的时候是存在问题的，这
【机器学习算法笔记】2. 学习算法与最小均方算法（LMS） tostq 机器学习机器学习算法笔记
【机器学习算法笔记】2.学习算法与最小均方算法（LMS）最小均方算法是一个非常流行的在线学习算法。其是建立在自适应滤波和自适应调整权重上的。2.1迭代下降思想三种以迭代下降思想为基础的无约束最优化方法：2.1.1最速下降法：在最速下降法中，对权值向量的调整是在最速下降的方向进行的，即它是与梯度向量方向相反的，梯度向量记为：最速下降法一般表示为：其原理是根据一阶泰勒展开式：2.1.2牛顿法：牛顿法是
机器学习算法笔记：RBM受限玻尔兹曼机 xiaochengJF 机器学习
文章目录玻尔兹曼机受限玻尔兹曼机推断BinaryRBM参考文献玻尔兹曼机玻尔兹曼机是一种存在隐节点的无向图模型。在图模型中最简单的是朴素贝叶斯模型（朴素贝叶斯假设），引入单个隐变量后，发展出了GMM，如果单个隐变量变成序列的隐变量，就得到了状态空间模型（引入齐次马尔可夫假设和观测独立假设就有HMM，KalmanFilter，ParticleFilter），为了引入观测变量之间的关联，引入了一种最大
机器学习算法笔记：目录 xiaochengJF 机器学习
机器学习算法笔记前面大部分来源:【机器学习】【白板推导系列】【合集1～23】，笔记主要参考Bilibili-机器学习白板系列，其它参考的大部分资料也均已列出，纯属个人笔记，如有不当之处，见谅！机器学习算法笔记代码谱聚类LDS线性动态系统(卡尔曼滤波)贝叶斯线性回归RBM受限玻尔兹曼机ParticleFilter粒子滤波降维HMM隐马尔可夫模型SVM支持向量机线性分类GMM高斯混合模型EM期望最大M
【机器学习算法笔记系列】逻辑回归(LR)算法详解和实战 fpzRobert 机器学习
逻辑回归(LR)算法概述逻辑回归（LogisticRegression）是用于处理因变量为分类变量的回归问题，常见的是二分类或二项分布问题，也可以处理多分类问题，它实际上是属于一种分类方法。逻辑回归算法原理预测函数和决策边界逻辑回归的预测函数可以表示为：举一个例子，假设我们有许多样本，并在图中表示出来了，并且假设我们已经通过某种方法求出了LR模型的参数（如下图）：这时，直线上方所有样本都是正样本y
机器学习算法笔记Ⅳ——主成分分析原理及应用 DeepHao 机器学习算法笔记
文章目录PCA算法简介相关矩阵原理特征值与特征向量正定矩阵与正交向量PCA原理推导函数求解PCA算法流程PCAmatlab计算PCA实现鸢尾花分类PCA数据降维处理KNN实现分类效果总结PCA算法简介主成分分析（英语：Principalcomponentsanalysis，PCA）是在不损失或者不很损失原始数据信息的情况下将一个多维数据进行降维处理，其中降维有两个目的：◆减少输入信息，突出特征信息
【机器学习算法笔记系列】朴素贝叶斯（NB）算法详解和实战 fpzRobert 机器学习
朴素贝叶斯(NB)算法概述朴素贝叶斯（NaïveBayes,NB）算法，是一种基于贝叶斯定理与特征条件独立假设的分类方法。朴素：特征条件独立；贝叶斯：基于贝叶斯定理。属于监督学习的生成模型，实现简单，并有坚实的数学理论（即贝叶斯定理）作为支撑。在大量样本下会有较好的表现，不适用于输入向量的特征条件有关联的场景。朴素贝叶斯算法原理贝叶斯定理条件概率：就是事件AAA在另外一个事件BBB已经发生条件下的
机器学习算法笔记之K近邻算法（KNeighborsClassifier） smallcases python sklearn
介绍：在sklearn库中，KNeighborsClassifier是实现K近邻算法的一个类，一般都使用欧式距离进行测量。这个类的结构如下：sklearn.neighbors.KNeighborsClassifierclasssklearn.neighbors.KNeighborsClassifier(n_neighbors=5,weights=’uniform’,algorithm=’auto’
机器学习算法笔记：LDS线性动态系统(卡尔曼滤波) xiaochengJF 机器学习
文章目录线性动态系统模型定义LDS滤波递推公式PredictionUpdate参考文献线性动态系统动态系统两大问题：{LearningInference:p(Z∣X){decoding→HMM (维特比)probofevidence→p(O∣λ)(前向/后向)filtering: p(zt∣x1,x2,⋯ ,xt)smoothing: p(zt∣x1,x2,⋯ ,xT)(
【机器学习算法笔记系列】K-近邻(KNN)算法详解和实战 fpzRobert 机器学习数据挖掘
KNN算法算法概述K最近邻(K-NearestNeighbor,KNN)算法，是著名的模式识别统计学方法，在机器学习分类算法中占有相当大的地位。它是一个理论上比较成熟的方法。既是最简单的机器学习算法之一，也是基于实例的学习方法中最基本的，又是最好的文本分类算法之一。算法原理：“近朱者赤近墨者黑”KNN的输入是测试数据和训练样本数据集，输出是测试样本的类别。KNN没有显示的训练过程，在测试时，计算测
【机器学习算法笔记系列】决策树(Decision Tree)算法详解和实战 fpzRobert 机器学习数据挖掘
决策树(DecisionTree)算法算法概述本文主要介绍机器学习中的决策树模型。决策树模型是一类算法的集合，在数据挖掘十大算法中，具体的决策树算法占有两席位置，即C4.5和CART算法。决策树是通过一系列规则对数据进行分类的过程。它提供一种在什么条件下会得到什么值的类似规则的方法。决策树分为分类树和回归树两种，分类树对离散变量做决策树，回归树对连续变量做决策树。同时也特别适合集成学习比如随机森林
常见机器学习算法笔记星尘逸风 ML
机器学习开发的流程（sk-learn）加载数据集数据预处理选择模型（算法）训练模型评估模型如果模型达到要求，进入实战如果模型达不到要求,可以优化(调参数).扩展数据集,增加泛化能力,可以换模型——————————————————————·监督学习算法——————K-近邻算法（KNN）样本集包含每条数据与分类的对应关系输入新数据，将新数据的每个特征与样本集中数据对应特征比较计算新数据与样本集每条数据
机器学习算法笔记——KNN算法k近邻详解 qq_39830629 机器学习
一、什么是KNN(k近邻)算法?简单来说KNN算法就是通过在训练数据中找到最接近预测数据的均值，比如现在有一个人想要知道他的房子在某同城能租到的价格，他拿到了最近一年的所有租房记录(模拟训练数据)accommodates(容纳人数)bedrooms(卧室数量)bathrooms(卫生间数量)price(价格)3118542110042210811160211791043280他的房子数据是(测试数
机器学习算法笔记之9：偏差与方差、学习曲线 marsjhao 机器学习/深度学习
1.偏差与方差的理解在训练机器学习模型时，使用不同的训练集很可能会得到不同的估计模型，估计模型随着训练集的改变而变化的程度就叫做方差variance。我们训练得到的估计模型与实际真实模型的偏差即为bias，估计与实际差距越大，bias就越高。为了得到较低的误差，需要尽可能地降低方差和偏差，然而这两者不能同时减小，在bias与variance之间存在一个权衡trade-off。低偏差的模型可以很好的
机器学习算法笔记之1：kNN算法 marsjhao 机器学习/深度学习
一、k近邻算法1、概述k近邻（k-NearestNeighbor，简称kNN）算法是一种常见的监督学习算法。其工作机制可概括为：给定测试样本，基于某种距离度量找出训练集中与其距离最近的k个训练样本，通常k是不大于20的整数。然后基于这k个“邻居”的类别信息来进行预测，通常使用投票法，即选择这k个样本中出现最多的类别来标记测试样本，在回归任务中可使用“平均法”，即将这k个训练样本标记的平均值作为预测
机器学习算法笔记（一）智能血压计
（1）容斥原理a.容斥原理是组合数学方法，可以求解集合、复合事件的概率等。b.计算几个集合并集的大小，先计算出所有单个集合的大小，减去所有两个集合相交的部分，加上三个集合相交的部分，再减去四个集合相交的部分，以此类推，一直计算到所有集合相交的部分。c.概率论:事件Ai(i=1,...,n)，P(Ai)为对应事件发生的概率。至少一个事件发生的概率：转自：https://blog.csdn.net/m
【机器学习算法笔记系列】线性回归算法详解和实战 fpzRobert 机器学习数据挖掘
线性回归算法算法概述在统计学中，线性回归(LinearRegression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是由一个或多个称为回归系数的模型参数的线性组合而成。回归分析中，只包括一个自变量和一个因变量，且二者的关系可用一条直线近似表示，这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量，且因变量和自变量之
机器学习算法笔记夏季梦幻想 python
机器学习三个步骤Step1：ModelStep2：GoodnessofFunctionStep3：GradientDe’scent线性模型（linearmodel）y=b+w1x1+w1x2…神经网络TotalLoss等于CrossEntrpy之和使用GradientDescent使用backprapogation算偏微分使用dropout优化技巧：当神经网络很深时，训练结果不一定更好，因为有梯度
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那

	Sepal.Length	Sepal.Width	Petal.Length	Petal.Width	Species
108	6.7	2.5	5.8	1.8	2
93	5.0	2.3	3.3	1.0	1
5	5.4	3.9	1.7	0.4	0
33	5.5	4.2	1.4	0.2	0
95	5.7	3.0	4.2	1.2	1
...	...	...	...	...	...
109	7.2	3.6	6.1	2.5	2
9	4.9	3.1	1.5	0.1	0
4	5.0	3.6	1.4	0.2	0
86	6.7	3.1	4.7	1.5	1
35	5.0	3.2	1.2	0.2	0

	Sepal.Length	Sepal.Width	Petal.Length	Petal.Width	Species
108	6.7	2.5	5.8	1.8	2
93	5.0	2.3	3.3	1.0	1
5	5.4	3.9	1.7	0.4	0
33	5.5	4.2	1.4	0.2	0
95	5.7	3.0	4.2	1.2	1
...	...	...	...	...	...
109	7.2	3.6	6.1	2.5	2
9	4.9	3.1	1.5	0.1	0
4	5.0	3.6	1.4	0.2	0
86	6.7	3.1	4.7	1.5	1
35	5.0	3.2	1.2	0.2	0