20斤芹菜肉包子

【西瓜书笔记】——神经网络

本文对应周志华——《机器学习》第五章·神经网络

1、神经元模型

神经网络是由具有适应性的简单单元组成的广泛并行互联的网络，它的组织能够模拟生物神经系统对真实世界物体所做出的交互反应。

神经元模型：是神经网络最基本的成分。当通过神经元的信息信好超过某一个阈值，那么该神经元就会激活，从而作用于下一个神经元。

M-P神经元模型：神经元连接来自收到来自n个其他神经元传递来的输入信号，与权重结合进行传递。神经元将收到的总输入值与阈值进行比较，利用激活函数（e.g Sigmoid）处理后产生输出。

激活函数：最典型的激活函数是阶跃函数，类似分段函数，0表示非兴奋状态，1表示兴奋状态。但阶跃函数不连续、不光滑，无法表达所有数据的活跃性质，因此常常使用sigmoid函数 $\frac{1}{1+e^{-θ^Tx}}$ 来对数据进行处理。从而把较大范围内变化的输入值挤压到(0, 1)输出值范围内。

2、感知机与多层网络

感知机：由两层神经元组成——输入层和输出层。输入层接受外界信好后传递给输出层，输出层是M-P神经元（阈值逻辑单元）。

权重 $w_i$ 和阈值θ可通过学习得到。调整感知机的权重方式如下：
$w_i ← w_i + Δw_i$
其中, $Δw_i = η(y-\hat{y})x_i，η$ 被称为学习率，其范围在(0, 1)之间。从公式中不难发现，评判感知机预测正确与否的方式在于 $\hat{y}=y$ 。如果不相等，则根据错误的程度进行权重调整。

但是，感知机只有输出层一层可以进行激活函数处理，学习能力有限，即只能一刀切。对于线性不可分问题或非线性问题，通常采用多层神经元。

多层神经网络：输入层和输出层间有隐含层（隐层），隐层和输出层神经元都拥有激活函数，从而将一刀切问题转化为了平面划分问题。

多层前馈神经网络：每层神经元与下一层神经元实现全连接，不存在同层连接和跨层连接。所谓的前馈，并非指信号不能向后传递，而是指网络拓扑结构上不存在环路或回路。隐层的作用在于对上一层神经元的输出结果进行信号加工，最终产生结果由输出层神经元输出。换言之，输入层神经元只负责接受数据，而隐层和输出层包涵功能神经元，对数据进行函数处理。（只包含一个隐层的三层神经网络即可称为多层神经网络）。

神经网络的学习过程，就是根据训练数据来调整神经元之间的连接权值和功能神经元的阈值。因此权值和阈值是神经网络的关键。

【*注】阈值相当于神经元内部的关键参数，而权值相当于不同神经元与不同神经元之间相连关系的重要度。

3、误差逆传播算法（反向传播算法-BP）

当网络层级较多时，产生的权值和阈值就会有许多，而调整阈值和权值的方法，就称作反向传播算法。如果说前馈神经网络的目的是为了得到最合适的预测模型，那么反向传播算法的作用就是反向求解，为了得到最合适的权值和阈值。

下面模拟一个3层神经网络的处理流程（输入层、隐层、输出层），其中d个输入单元，h个隐层单元，l个输出单元：

Step1：Input d个样例 xd
Step2：α = sum (输入*(输入单元与隐层间的权值) )作为隐层每个单元接收的输入值
Step3：sigmoid（α - 隐层每个单元的阈值），产生隐层输出β
Step4：γ = sum( β* (隐层每个单元与输出层每个单元间的权值) )作为输出层每个单元接收的输入值
Step5：sigmoid（γ - 输出层每个单元的阈值)，产生输出的结果y_hat
Step6：采用均方误差法衡量网络模型的性能：误差E = 1/2 * sum((y_hat - y)^2)
Step7：利用BP算法，反向迭代每一轮重新进行估计：新权值/新阈值 ← 权值/阈值 +Δ

以上就是一个多层神经网络的运行过程，Step1 ~ Step6为完整的前向神经网络处理过程，而Step7进入迭代的过程为反向神经网络的处理过程。

BP算法基于梯度下降策略，以目标的负梯度方向对参数进行调整。即对均方误差求解函数，分别对θ、w、λ等进行求导。在给定学习率η的情况下，第k个样例的均方误差函数E有：
$E_k = \frac{1}{2}\sum_{j=1}^{l}(\hat{y}_j^k-y_j^k)^2$
而对于sigmoid函数作为激活函数的清空，存在一种特殊规律：
$S^{'} (x) = S (x) \cdot (1 - S (x))$

例如：

1、权值 $w$ 的校准公式：

$Δw_{hj} = -η\frac{\partial{E_k}}{\partial{w_hj}}$
即 $Δw_hj = -ηE'$ 。对E就w进行微分计算。经过计算，反向传播算法的校准公式为：
$Δw_hj = η\hat{y}_j^k(1-\hat{y}_j^k)(y_j^k-\hat{y}_j^k)b_h$
其中， $\hat{y}_j^k$ 表示第k个样例在输出层第j个神经元上的计算结果。

2、输出层阈值 $θ$ 的校准公式：

同样的，以θ为底求导后可得：输出层上第j个神经元的阈值变化为：
$Δθ_j= -η(\hat{y}_j^k(1-\hat{y}_j^k)(y_j^k-\hat{y}_j^k))$

3、连接权 $v$ 的校准公式

以v为底求导可得：输入层第i个神经元到隐层第j个神经元间的连接权值变化为：
$Δv_{ih} = ηb_h(1-b_h)x_i\sum_{j=1}^{l}w_{hj}\hat{y}_j^k(1-\hat{y}_j^k)(y_j^k-\hat{y}_j^k)$

4、隐层阈值 $λ$ 的校准公式

以λ为底求导可得：隐层第h个神经元内部的阈值变化为：
$Δλ_h = -ηb_h(1-b_h)\sum_{j=1}^{l}w_{hj}\hat{y}_j^k(1-\hat{y}_j^k)(y_j^k-\hat{y}_j^k)$

学习率η控制着算法每一轮迭代中的更新步长。步长太大容易振荡，而步长太小的话收敛速度又会过慢。有时会使用 $η_w、η_θ、η_λ、η_v$ 会使用不同的η来进行梯度下降处理，并非要求η一定要恒定不变，反向传播处理不同的对象时可使用不同的η值。通常设置η=0.1
BP算法的工作流程

	Step1：将输入示例提供给输入层神经元
	Step2：逐层前传信号，知道产生输出层的结果
	Step3：计算输出层的误差
	Step4：将误差逆向传播至隐层神经元
	Step5：根据隐层神经元的误差对连接权值和阈值进行调整
	Step6：迭代循环过程，直到到达某种终止条件。

总而言之，首先需要计算的是 $y_{predict}$ ，然后对连接权值、权值、隐层阈值、输出层阈值进行梯度下降计算，达到终止条件后确定各系数，从而得到最优的前馈神经网络。

显然，BP算法的目的是要最小化训练集D上的累积误差。正如第k个样例的训练误差为 $E_k$ 一样，累计误差就是指所有的样例的误差之和： $\frac{1}{m}\sum_{k=0}^{k}{E_k}$ 。

不过，标准的BP算法一次只能针对一个训练样本更新连接权值和阈值，从而导致其参数更新频繁，且不同样例进行更新的效果可能出现抵消现象。

因此借鉴了该方法得到了基于累计误差最小化的更新规则，即累计误差逆传播。该方法读取整个训练集D一遍后才对参数进行更新，从而节省了计算时间，提升了效率。

【*注】面对庞大的数据计算量时，往往先采用累计误差逆传播方法对参数进行范围上的先处理，当累计误差下降到一定程度后，改用标准BP算法对部分参数进行优化。这样的方式更加合理。

BP神经网络易造成过拟合，因此常用①早停和②正则化两种方式来避免。

早停：将数据集划分成训练集和验证集，其中训练集用来计算梯度、更新连接权和阈值，而验证集则用来估计误差。若训练集误差降低，而验证集误差提升则停止训练，返回最小验证集误差对应的连接权和阈值。

正则化：在误差目标函数中增加一个用于描述网络复杂度的部分，例如：
$δ\frac{1}{m}\sum_{k=1}^{m}E_k +(1-δ)\sum_{i}w_i^2$
上述公式中添加了 $δ和(1-λ)\sum_{i}w_i^2$ 来作为描述网络复杂度的部分。

4、全局最小与局部极小

利用前馈计算得到的E作为表示神经网络在训练集上的整体误差，显然其是关于连接权值w和阈值θ的函数。而反向传播计算的过程则是一个寻优过程，旨在寻找一组最优参数使E最小。

该过程自然就涉及到最优、局部极小和全局最小的求解问题。
局部极小：在某个指定邻域范围内，存在任意E(w,θ)>E(w*,θ*)，则称w* 和theta*是局部极小值。
全局最小：在整个样本空间中，最小误差E对应的w和θ值。

显然如果样本空间中，梯度为零，只要其误差函数值小于所有相邻点的值，那么其对应的w和θ必然为局部最小点。因此可能存在多个局部最小点，但全局最小点却唯一。

梯度下降法：利用负梯度方向下降速度最快的特点，对整个函数空间进行搜索求最优解。当剃度为零时，则找到一个局部最优点，根据该局部最优点是否唯一，确定其是否为全局最小。

为了避免求得多个局部极小点，从而导致陷入局部极小而无法找到全局最小点的问题，采用如下的启发式策略来应对：
1、采用多组参数值同时初始化神经网络（等于在开局的时候选择不同的参数值来进行模型训练，等于在同一个区域内沿不同方向进行搜索，最终都能找到各自方向上的最优点）

2、模拟退火技术。所谓的退火机制，就是指每一步允许出现比当前解更差的结果，接受次优解从而保证算法的稳定。（类似于悔棋，每次将处理步骤退回至前一步，然后沿另一个方向重新搜索）

3、使用随机梯度下降。即便到达局部极小点，其也可能因为计算的参数设定、步长等因素，让深陷极小点的函数继续计算，从而从极小点中”爬“出来。

5、常见神经网络模型

5.1 RBF网络

RBF网络（径向基函数网络）是一个单隐层前馈神经网络，使用径向基函数作为隐层激活函数，而输出层则是对隐层神经元输出的线性组合。
$\varphi(x)=\sum_{i=1}^{q}w_i\rho(x,c_i)$
高斯径向基函数指的是样本x到数据中心ci之间欧式距离的单调函数：
$ρ(x, c_i) = e^{-β_i||x-c_i||^2}$
需要对数据进行聚类处理，从而得到数据中心ci。再利用BP算法求最优w和β。

5.2 ART网络

竞争学习（CL-competitive learning）是神经网络中一种常用的无监督学习策略。网络的输出神经元相互竞争，每一刻仅有一个竞争获胜的神经元被激活，其他神经元状态被抑制。

ART（自适应谐振理论）网络是竞争学习的重要代表。该神经网络由1、比较层；2、识别层；3、识别阈值；4、重置模块构成。该网络结构的优点在于可以进行增量学习和在线学习。

5.3 SOM网络

SOM-自组织映射网络也是竞争学习无监督神经网络中的一种。它通过将高维输入数据映射到低维空间，保证拓扑结构的同时将高维空间中相似样本点映射到网络输出层中的邻近神经元。

SOM的输出层神经元按照矩阵形式排列，每个单元都有一个权向量。目的就是找到最合适的权向量。首先计算样本自身携带的权向量间距，最近的神经元作为最佳匹配单元，然后补断调整邻近神经元的权向量，迭代收敛过程。

5.4 级联相关网络

级联相关网络是结构自适应网络（构造性神经网络）的重要代表。因为其网络结构并非像一般的神经网络一样是预先固定的，而是在不断的计算训练中寻找最优的网络结构。一般开始时网络只有输入层和输出层，但随之可以不断增加隐层的神经单元改善网络结构。该网络的优点在于因为无需提前预设网络层数、隐层但愿数，从而训练速度快，但在数据量较小时易陷入过拟合。

5.5 Elman网络

递归神经网络是指允许网络种出现环形结构，从而让一些神经元的输出反馈回来作为输入信号继续进入网络计算。

Elman网络便是最常用的递归神经网络之一。其结构与多层前馈神经网络类似，但是隐层神经元的输出被反馈回来与下一时刻的输入层神经元提供的信号一起，作为隐层神经元在下一时刻的输入（相当于计算完后的结果再流入隐层计算一遍）。通常也是采用sigmoid函数+BP算法的方法来实现。

5.6 Boltzmann机

Boltzmann机是一种基于能量的模型，该网络层级分为显层（输入和输出）和隐层（数据的内在表达）。其间的神经元都是布尔型，非0即1，设置向量si∈{0, 1}表示某个神经元的状态，也由w和θ分别作为连接权和阈值参数，公式如下：
$-\sum_{i=1}^{n-1}\sum_{j=i+1}^{n}w_{ij}s_is_j-\sum_{i=1}^{n}θ_is_i$

6、常用的激活函数

首先先介绍两种在激活函数选择时常见的问题：

梯度消失：这本质上是由于激活函数的选择导致的，最简单的sigmoid函数为例，在函数的两端梯度求导结果非常小（饱和区），导致后向传播过程中由于多次用到激活函数的导数值使得整体的乘积梯度结果变得越来越小，也就出现了梯度消失的现象。

梯度爆炸：同理，出现在激活函数处在激活区，而且权重W过大的情况下。但是梯度爆炸不如梯度消失出现的机会多。

6.1 Sigmoid函数

$\sigma(x) = \frac{1}{1+e^{-x}}$
目前是最普遍的激活函数，值域在(0, 1)之间。缺点是：1、会产生梯度弥散；2、图像并不能关于原点对称；3、计算e^-x时候比较耗时。

6.2 ReLU函数

线性整流函数，也被称为线性修正单元：

$f (x) = m a x (0, x)$
或写为
$=\begin{cases}x, &x> 0 \cr λx, &x≤0\end{cases}$
优点：解决部分弥散的问题，且收敛速度较快。
缺点：依旧没有完全解决梯度弥散的问题，且在x<0时的神经元安等于死亡状态无法被利用。

6.2.1 LeakyReLu函数

改造了普通的ReLU函数，避免了x<0时的神经死亡现象：
$f (x) = m a x (0, x) + β * m i n (0, x)$
其中β是一个小的非零数。

6.3 Tanh函数（双曲正切）

$tanhx=\frac{sinhx}{coshx}=\frac{e^x-e^{-x}}{e^x+e^{-x}}$
优点：解决了原点不对称的问题，且比Sigmoid快。
缺点：依旧没有解决梯度弥散的问题。

6.4 MaxOUT

提倡使用maxout方法，克服了ReLU的缺点，涉及的参数较多，本质上是在输出结果上又加了一层。
$max(w_1^Tx+b_1, w_2^Tx+b_2)$

代码实现

1.利用keras实现简单的多层前馈神经网络

程序实现：

#利用keras实现

from keras.models import Sequential
#dense用来表示全连接层
from keras.layers import Dense
import numpy as np

#定义一个numpy随机种子函数
np.random.seed(7)

#载入数据集,用delimiter确定以什么符号为分割
dataset = np.loadtxt('路径.csv', delimiter=",")

#读取X和Y
X = dataset[:, 某几列是输入]
Y = dataset[:, 最后一列是标签]

#初始化Sequential模型
model = Sequential()

#【创建隐层】包含16个隐含单元，激活函数为ReLU，input_dim为输入维度
model.add(Dense(16, input_dim=8, init='uniform', activation='relu'))

#【创建隐层】包含8个隐含单元，激活哈数为ReLU
model.add(Dense(8, init='uniform',activation='relu'))

#【创建输出层】
model.add(Dense(1, init='uniform',activation='sigmoid'))



#定义模型的损失函数类型、标准化过程、评判标准
model.compile(loss='binary_crossentropy', optimizer = 'adam', metrics=['accuracy'])

#开始拟合/训练模型,定义迭代周期150次
model.fit(X, Y, nb_epoch=150, batch_size=10)

scores = model.evaluate(X, Y)

print('%s:%.2f%%' % (model.metrics_names[1], scores[1] * 100))

【西瓜书】机器学习（周志华）学习问题记录 _linyu__ 基础知识机器学习周志华西瓜书
简述西瓜书的鼎鼎大名早有耳闻，于是毫无疑问买来入门。写此文章的时候刚要做完第二章的练习题。在看的时候有一些感慨：需要一定的数理基础，尤其是概率论的内容。但是如果没学过也不建议直接去啃概率论，只要把相关的部分看看即可。周老师默认我们能力很强，所以有些地方说得不够详细，仅靠此书无法理解，需要自己另行查阅。有一些疑似谬误的地方，但是我自己能力较差，又苦于没有人佐证，所以并不敢说周老师一定错了。在看的过程
机器学习西瓜书笔记——机器学习基本术语，模型性能指标【一】 Code思铮机器学习笔记人工智能
西瓜书第一，二章笔记datawhale吃瓜教程task1学习笔记第一章第一张主要介绍了一些机器学习研究内容和基本术语，以及发展现状。基本术语由于有些术语过于基础，在此不做赘述大家可以去读西瓜书。1、分类任务：若模型的预测值是离散的，如“好瓜”，“坏瓜”，这是分类任务。在二分类任务中有两个标签（label）一个是正类，一个是反类2、回归任务：若模型的预测值是连续的，如“西瓜的成熟度是0.99“那么这
西瓜书--无监督学习（聚类） oisflo 学习聚类机器学习
无监督学习无监督学习无监督学习前言一、无监督学习是什么？1）机器学习的分类2）解释（图文结合）3）区别二、无监督学习应用范围三、无标注数据的结构1）用处四、聚类1）聚类的含义：2)怎么判断是好的聚类：原则：3）聚类的分类：1）软聚类（softclustering）vs.硬聚（hardclustering）2）层次聚类vs.非层次聚类（图）+举例3）==算法==：凝聚式层次聚类（步骤+图文显示）分裂
全局最小值、局部最小值以及如何跳出局部最小值 keep_humble 机器学习机器学习深度学习
前段时间在看深度学习的内容，对于全局最小值和局部最小值这两个概念之前理解的不太深入，总是容易混淆，看了西瓜书之后明白了，特此总结一下，加深印象。1.全局、局部最小值的概念局部最小值是在某一区域内，函数的取值达到了最小，但是如果将这个区域扩展到定义域上来，那么这个局部最小值就不一定是最小的。全局最小值，是在定义域内，函数值最小。全局最小一定是局部最小值，但是反之不一定成立。图中的点是一个局部最小值点
机器学习（周志华西瓜书）华华不在机器学习机器学习人工智能神经网络
注：此文仅作为个人学习笔记。第一章绪论1.机器学习（machineLearning）：致力于研究如何通过计算的手段，利用经验来改善系统自身性能；学习算法（learningalgorithm）：关于在计算机上从数据中产生“模型”（model）的算法；2.（基本术语解释）数据集（dataset）示例(instance)/样本（sample）：数据集中每条记录是关于一个事件获对象的描述；属性（attri
西瓜书【机器学习（周志华）】目录随机森林404 机器学习机器学习
第一部分：基础概念机器学习概述1.1人工智能与机器学习1.2机器学习分类1.3机器学习应用1.4机器学习常用术语解释模型的评估与选择2.1经验误差与过拟合2.2评估方法2.3性能度量2.4偏差与方差第二部分：核心算法线性模型3.1什么是回归3.2一元线性回归3.3多元线性回归3.4对数几率回归3.5线性判别分析（LDA）3.6多分类学习3.7类别不平衡问题决策树4.1决策树概述4.2ID3算法4.
深度学习如何入门？深度学习机器学习深度学习 python 机器学习图神经网络深度学习算法程序员 pytorch
有人说要学深度学习，机器学习是基础；有人说，要先学数学，数学基础很重要；也有人说，不学Python寸步难行；还有人说，不看论文怎么行？又有人说，我这有两本秘籍，你拿回去好好研究，将来必成大器！从理论基础开始稳扎稳打地往上学，自然是老铁没毛病的，但是也得看时间要求，以及投产比。尤其是在一开始的时候，心气儿正足，却在西瓜书南瓜书花书等经典大部头、高数、概率、python甚至c++上耗尽心力，到头来极容
基于鸢尾花数据和手写数字，决策树，随机森林，voting，bagging法的比较 zaprily 实验记录决策树 python sklearn
四种方法的具体的原理可以见博文和西瓜书先上代码根据结果分析鸢尾花数据#evaluatebaggingalgorithmforclassificationfromnumpyimportmeanfromnumpyimportstdfromsklearn.datasetsimportmake_classificationfromsklearn.model_selectionimportcross_val
我的机器学习学习之路花果山-马大帅机器学习机器学习人工智能 python 算法 scikit-learn
学习python的初衷•hi，今天给朋友们分享一下我是怎么从0基础开始学习机器学习的。•我是2023年9月开始下定决心要学python的，目的有两个，一是为了提升自己的技能和价值，二是将所学的知识应用到工作中去，提升工作效率。我的背景与书籍选择•我是上班族，2023年非全日制硕士研究生毕业。•我的导师是数学博士，在导师的推荐下买了周老师的《机器学习(西瓜书)》和李航老师的《统计学习方法》，这2本书
人工智能（11）——————计算机视觉長安一片月人工智能人工智能计算机视觉
目录声明正文1、简介2、步骤1）图像分类2）目标检测（目标定位）3）目标跟踪4）图像分割普通分割语义分割实例分割5）图像生成3、总结声明以下内容均来自B站吴恩达教授的视频以及西瓜书和众多前辈的学习成果总结，仅记录本人的大模型学习过程，如有侵权立马删除。言论仅代表自身理解，如有错误还请指正。正文1、简介我们先来看看百度百科里对计算机视觉的介绍：计算机视觉是一门研究如何使机器“看”的科学，更进一步的说
人工智能（10）——————自然语言处理長安一片月人工智能人工智能自然语言处理学习 transformer
声明以下内容均来自B站吴恩达教授的视频以及西瓜书和众多前辈的学习成果总结，仅记录本人的大模型学习过程，如有侵权立马删除。言论仅代表自身理解，如有错误还请指正。正文简介其实在现在的人工智能领域，很多东西都是相互关联，相互促进的。比如机器学习可以引入到自然语言处理，计算机视觉等多个类别当中，而自然语言处理中特有的seq2seq方法也可以用于机器学习当中。但是根本上这些类别都存在自己独有之处。自然语言处
从零开始学AI——1 人工智能
前言最近总算有想法回到学习上来，这次就拿AI开刀吧。本系列叫从零开始学AI不是骗人的，我对AI的了解几乎就是道听途说，所以起了这么一个标题，希望学完从0变1（？此外，我应该不会特别关注代码实现上的内容，因为我对python也是一窍不通。本笔记为学习周志华老师《机器学习》（西瓜书）的个人学习记录，内容基于个人理解进行整理和再阐述。由于理解可能存在偏差，欢迎指正。引用模块说明：在笔记中，我会使用引用模
【西瓜书《机器学习》七八九章内容通俗理解】游戏乐趣人工智能机器学习人工智能
第七章：贝叶斯分类器7.1贝叶斯决策论基础核心概念：贝叶斯分类器是基于概率来做分类决策的。简单来说，就是根据已知的一些条件，去计算每个类别出现的概率，然后选择概率最大的那个类别作为分类结果。就好比你在猜一个盒子里装的是红球还是蓝球，你可以根据之前从这个盒子里摸球的一些经验（比如摸出红球的次数多），来判断这次盒子里更有可能是红球还是蓝球。例子：假如你要判断一幅图片是猫还是狗。你知道在所有的图片数据里
周志华机器学习西瓜书第五章神经网络-学习笔记(超详细) Sodas（填坑中....）周志华西瓜书——详细笔记附例题图解机器学习神经网络学习人工智能数据挖掘算法
在机器学习中，神经网络一般指的是"神经网络学习"，是机器学习与神经网络两个学科的交叉部分。所谓神经网络，目前用的最广泛的一个定义是"神经网络是由具有适应性的简单单元组成的广泛并行互连的网络，它的组织能够模拟生物神经系统对真实世界物体做出交互反应"。神经网络是一门重要的机器学习技术。它是目前最为火热的研究方向--深度学习的基础。学习神经网络不仅可以让你掌握一门强大的机器学习方法，同时也可以更好地帮助
《西瓜书》大白话思想总结-第三章小溪子子西瓜书概率论机器学习分类
第三章3.1+3.2分类和回归是监督式学习，都是根据数据，分析特征，作出预测，只是预测的值是离散的叫分类，连续的叫回归。为什么叫线性回归呢？因为线性就可以看成是直线，直线当然是连续的。而所给的直线就是根据离散点拟合出来的线，其本质就是一种预测。那么根据离散点的特征，给出了预测方程的这个直线，就符合回归的定义。因此，这就叫作线性回归。（个人理解，不一定对）这个拟合直线的方程，或者叫预测的函数，各个自
周工作计划2019-03-25 MikeShine
很久没有写工作计划了。之前一个星期生了病，很难受。上个星期基本上什么都没有干。但是好的一点是，西瓜书基本都看完了。本周工作计划：机器学习分享活动（关于决策树的分享）回看一下西瓜书的东西，每一章把开头总结写一下。老师没有给具体的任务，留了再说吧。
机器学习（西瓜书）学习笔记导览盛寒机器学习西瓜书学习机器学习人工智能
本篇文章会持续更新直到更新完毕，关注博主不迷路~（如果没有超链接，表示还没有更新到）第一章绪论1.1引言1.2基本术语1.3假设空间1.4归纳偏好第二章模型评估与选择2.1经验误差与过拟合2.2评估方法2.3性能度量2.4比较检验2.5偏差与方差第三章线性模型3.1基本形式3.2线性回归3.3对数几率回归3.4线性判别分析3.5多分类学习3.6类别不平衡问题第四章决策树4.1基本流程4.2划分选择
机器学习LDA线性判别器代码实现 Longlongaaago 机器学习 LDA 线性判别分析代码实现
机器学习LDA线性判别器代码实现西瓜书P60线性判别器LDA代码实现：importnumpyasnpimportmatplotlib.pyplotaspltdefload_data(file_name):'''数据导入函数:paramfile_name:(string)训练数据位置:return:feature_data(mat)特征lable_data(mat)标签'''fr=open(file
西瓜书-机器学习5.4 全局最小与局部极小 lestat_black 西瓜书机器学习
两种“最优”：“局部极小”(localminimum)和"全局最小"(globalminimum)对和，若存在使得多组不同参数值初始化多个神经网络使用“模拟退火”：以一定的概率接受比当前解更差的结果，有助于“跳出”局部极小使用随机梯度下降遗传算法(geneticalgorithms)[Goldberg,1989]也常用来训练神经网络以上用于跳出局部极小的技术大多是启发式，理论上商缺乏保障。Gold
2019-05-14《西瓜书》难啃杨熊猫Yang
周志华老师的《西瓜书：机器学习》这周看完1~10章锻炼：太极云手、100手/组，3组虎刨功（简）、100个/组，2组
机器学习——集成学习三三木木七机器学习集成学习人工智能
参考：ysu老师课件+西瓜书+期末复习笔记1.集成学习的基本概念集成学习（ensemblelearing）通过构建并结合多个学习器来完成学习任务。有时也被称为多分类器系统（multi-classifiersystem）、基于委员会的学习(committee-basedlearning)等。理解：集成学习是一种机器学习方法，其核心思想是将多个学习器（弱学习器）集成在一起，以达到比单个学习器更好的性能
西瓜书学习笔记——低维嵌入（公式推导+举例应用） Nie同学机器学习学习笔记机器学习
文章目录算法介绍实验分析算法介绍低维嵌入（Low-DimensionalEmbedding）是一种降低高维数据维度的技术，目的是在保留数据特征的同时减少数据的复杂性。这种技术常用于可视化、特征学习、以及数据压缩等领域。低维嵌入的目标是将高维数据映射到一个低维空间，以便更好地理解和可视化数据。在kkk近邻学习中，随着数据维度的增加，样本之间的距离变得更加稀疏，导致KNN算法性能下降。这是因为在高维空
西瓜书学习笔记——核化线性降维（公式推导+举例应用） Nie同学机器学习学习笔记机器学习
文章目录算法介绍实验分析算法介绍核化线性降维是一种使用核方法（KernelMethods）来进行降维的技术。在传统的线性降维方法中，例如主成分分析（PCA）和线性判别分析（LDA），数据被映射到一个低维线性子空间中。而核化线性降维则通过使用核技巧，将数据映射到一个非线性的低维空间中。核技巧的核心思想是通过一个非线性映射将原始数据转换到一个高维的特征空间，然后在该特征空间中应用线性降维方法。这种映射
西瓜书学习笔记——k近邻学习（公式推导+举例应用） Nie同学机器学习学习笔记机器学习
文章目录算法介绍实验分析算法介绍K最近邻（K-NearestNeighbors，KNN）是一种常用的监督学习算法，用于分类和回归任务。该算法基于一个简单的思想：如果一个样本在特征空间中的kkk个最近邻居中的大多数属于某个类别，那么该样本很可能属于这个类别。KNN算法不涉及模型的训练阶段，而是在预测时进行计算。以下是KNN算法的基本步骤：选择K值：首先，确定用于决策的邻居数量K。K的选择会影响算法的
西瓜书学习笔记——主成分分析（公式推导+举例应用） Nie同学机器学习学习笔记机器学习降维
文章目录算法介绍实验分析算法介绍主成分分析（PrincipalComponentAnalysis，PCA）是一种常用的降维技术，用于在高维数据中发现最重要的特征或主成分。PCA的目标是通过线性变换将原始数据转换成一组新的特征，这些新特征被称为主成分，它们是原始特征的线性组合。对于一个正交属性空间（各个属性之间是线性无关的）中的样本点，存在以下两个性质的超平面可对所有样本点进行恰当的表达：最近重构性
朴素贝叶斯分类算法三三木木七 #机器学习机器学习人工智能 sklearn
本文介绍了朴素贝叶斯分类算法，标记后的话一般是自己简要总结的，是比较通俗易懂的，也就是必看的。参考：西瓜书，ysu老师课件【摘要】1.分类算法：分类算法的内容是根据给定特征，求出它所属类别。2.先验概率：就是根据以往的数据分析所得到的概率。后验概率：是得到信息之后重新加以修正得到的概率。3.贝叶斯决策：贝叶斯决策理论中，我们希望选择那个最小化总体期望损失的决策。决策损失的期望值通过对所有可能状态的
决策树的相关知识点三三木木七 #机器学习决策树算法机器学习
参考：ysu老师课件+西瓜书1.决策树的基本概念【决策树】：决策树是一种描述对样本数据进行分类的树形结构模型，由节点和有向边组成。其中每个内部节点表示一个属性上的判断，每个分支代表一个判断结果的输出，最后每个叶节点代表一种分类结果。理解：它是一个树状结构，其中每个节点代表一个特征属性的判断，每个分支代表这个判断的结果，而每个叶节点（叶子）代表一种类别或回归值。关于决策树要掌握的概念：根节点（Roo
西瓜书学习笔记——层次聚类（公式推导+举例应用） Nie同学机器学习学习笔记聚类
文章目录算法介绍实验分析算法介绍层次聚类是一种将数据集划分为层次结构的聚类方法。它主要有两种策略：自底向上和自顶向下。其中AGNES算法是一种自底向上聚类算法，用于将数据集划分为层次结构的聚类。算法的基本思想是从每个数据点开始，逐步合并最相似的簇，直到形成一个包含所有数据点的大簇。这个过程被反复执行，构建出一个层次化的聚类结构。这其中的关键就是如何计算聚类簇之间的距离。但实际上，每个簇都是一个集合
西瓜书学习笔记——密度聚类（公式推导+举例应用） Nie同学机器学习学习笔记聚类
文章目录算法介绍实验分析算法介绍密度聚类是一种无监督学习的聚类方法，其目标是根据数据点的密度分布将它们分组成不同的簇。与传统的基于距离的聚类方法（如K均值）不同，密度聚类方法不需要预先指定簇的数量，而是通过发现数据点周围的密度高度来确定簇的形状和大小。我们基于DBSCAN算法来实现密度聚类。DBSCAN是基于一组邻域参数(ϵ,MinPts)(\epsilon,MinPts)(ϵ,MinPts)来刻
【机器学习·西瓜书学习笔记·线性模型】线性回归——最小二乘法（least square method）慈善区一姐机器学习学习线性回归
线性模型的基本形式给定由个属性描述的实例,其中是在第个属性上的取值，线性模型（linearmodel）试图学得一个通过属性的线性组合来进行预测的函数，即一般用向量形式写成：和确定后，模型就得以确定参数查阅表把数据集表示为一个m*（d+1）大小的矩阵，其中每行对应于一个实例，每行前d个元素对应于实例的d个属性值，最后一个元素恒置于1，即（一）均方误差（meansquarederror）基于欧几里得距
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen