视界IT

机器学习西瓜书（周志华）第六章支持向量机（SVM）

第六章支持向量机主要参考李航的统计学习方法

1. 概述
2. 感知机
3. 间隔与支持向量

3.1 间隔
3.2 支持向量

4. SVM模型目标函数与优化
5. 线性可分支持向量机的算法过程
6. 线性支持向量机

6.1 线性支持向量机的软间隔最大化目标函数的优化
6.2 软间隔最大化时的支持向量
6.2 软间隔最大化的线性支持向量机的算法过程

7. 课后练习参考答案

1. 概述

支持向量机（support vector machines, SVM）是一种二分类模型。它的基本模型是定义在特征空间上的间隔最大的线性分类器，间隔最大使它有别于感知机；支持向量机还包括核技巧，这使它成为实质上的非线性分类器。支持向量机的学习策略就是间隔最大化，可形式化为一个求解凸二次规划的问题，也等价于正则化的合页损失函数的最小化问题，支持向量机的学习算法是求解凸二次规划的最优化算法。
支持向量机学习方法包含构建由简至繁的模型：

线性可分支持向量机——硬间隔支持向量机（硬间隔最大化）——训练数据线性可分
线性支持向量机——软间隔支持向量机（软间隔最大化）——训练数据近似线性可分
非线性支持向量机——核技巧及软间隔最大化——训练数据线性不可分

核方法是比支持向量机更为一般的机器学习方法。

2. 感知机

感知机的模型就是尝试找到一条直线，能够把二元数据隔离开。放到三维空间或者更高维的空间，感知机的模型就是尝试找到一个超平面，能够把所有的二元类别隔离开。对于这个分离的超平面，定义为 $w^Tx+b=0$ ，如下图。在超平面 $w^Tx+b=0$ 上方的我们定义为y=1,在超平面 $w^Tx+b=0$ 下方的我们定义为y=−1。可以看出满足这个条件的超平面并不止一个。如何判断哪个超平面的分类效果更好。

接着我们看感知机模型的损失函数优化，它的思想是让所有误分类的点(定义为M)到超平面的距离和最小，即最小化下式：
$∑_{x_i∈M}\frac{−y_i(w^Tx_i+b)}{||w||_2}$
　　　　当w和b成比例的增加，比如,当分子的w和b扩大N倍时，分母的L2范数也会扩大N倍。在感知机模型中，我们采用的是保留分子，固定分母 $w||_2=1$ ,即最终感知机模型的损失函数为：
$_{x_i∈M}{−y_i(w^Tx_i+b)}$
　　　　如果我们不是固定分母，改为固定分子，作为分类模型有没有改进呢？
这些问题在SVM会详细解释。

3. 间隔与支持向量

3.1 间隔

函数间隔是没有统一量度，没有规范化，并不能正常反应点到超平面的距离，在感知机模型里，当分子成比例的增长时，分母也是成倍增长。为了统一度量，需要对法向量w加上约束条件，这样就得到了几何间隔 $γ$ ,定义为：
$γ=\frac{y(w^Tx+b)}{||w||_2}=\frac{γ′}{||w||_2}$
几何间隔才是点到超平面的真正距离，感知机模型里用到的距离就是几何距离。

3.2 支持向量

在感知机模型中，可以找到多个可以分类的超平面将数据分开，并且优化时希望所有的点都离超平面远。但是实际上离超平面很远的点已经被正确分类，让它离超平面更远并没有意义。反最关心是那些离超平面很近的点，这些点很容易被误分类。如果可以让离超平面比较近的点尽可能的远离超平面，那分类效果会好有一些。SVM的思想起源正起于此。

如下图所示，分离超平面为 $w^Tx+b=0$ ，如果所有的样本不光可以被超平面分开，还和超平面保持一定的函数距离（下图函数距离为1），那么这样的分类超平面是比感知机的分类超平面优的。可以证明，这样的超平面只有一个。和超平面平行的保持一定的函数距离的这两个超平面对应的向量，我们定义为支持向量，如下图虚线所示。

4. SVM模型目标函数与优化

SVM的模型是让所有点到超平面的距离大于一定的距离，也就是所有的分类点要在各自类别的支持向量两边。用数学式子表示为：

$\max \frac{2}{||w||} \qquad s.t\quad y_i(w^Tx_i+b) ≥ 1(i=1,2,...m)$

由于 $\frac{2}{||w||}$ 的最大化等同于 $\frac{||w||^2}{2}$ 的最小化。这样SVM的优化函数等价于：

$\min \frac{||w||^2}{2} \qquad s.t\quad y_i(w^Tx_i+b) ≥ 1(i=1,2,...m)$

由于目标函数 $\frac{||w||^2}{2}$ 是凸函数，同时约束条件不等式是仿射的，根据凸优化理论，可以通过拉格朗日函数将我们的优化目标转化为无约束的优化函数，这和最大熵模型原理小结中讲到了目标函数的优化方法一样。具体的，优化函数转化为：

$L(w,b,α)=\frac{||w||^2}{2} +∑_{i=1}^m(1-α_i[y_i(w^Tx_i+b)])\quad满足\;α_i≥0$

可以先求优化函数对于w和b的极小值。接着再求拉格朗日乘子 $α$ 的极大值。

首先来求 $L (w, b, α)$ 基于w 和 b 的极小值，即 $min_{w,b}L(w,b,α)$ 。这个极值我们可以通过对w和b分别求偏导数得到：
$\frac{∂L}{∂w}=0⇒w=∑_{i=1}^mα_iy_ix_i$
$\frac{∂L}{∂b}=0⇒∑_{i=1}^mα_iy_i=0$

现在我们来看将w替换为 $α$ 的表达式以后的优化函数 $ψ (α)$ 的表达式：

5. 线性可分支持向量机的算法过程

这里我们对线性可分SVM的算法过程做一个总结。

输入是线性可分的m个样本 $x_1,y_1),(x_2,y_2),...,(x_m,y_m),$ ,其中x为n维特征向量。y为二元输出，值为1，或者-1。

输出是分离超平面的参数 $w^∗$ 和 $b^∗$ 和分类决策函数。

算法过程如下：

1）构造约束优化问题
$min_α\frac{1}{2}∑_{i=1}^m∑_{j=1}^mα_iα_jy_iy_j(x_i∙x_j)−∑_{i=1}^mα_i$
$s.t.∑_{i=1}^mα_iy_i=0$
$α_i≥0\qquad i=1,2,...m$
2）用SMO算法求出上式最小时对应的α向量的值 $α^∗$ 向量.

3 ) 计算 $w^∗=∑_{i=1}^mα^∗_iy_ix_i$
4 ) 找出所有的S个支持向量,即满足 $α_s>0$ 对应的样本 $x_s,y_s)$ ，
   通过 $y_s(∑_{i=1}^mα_iy_ix^T_ix_s+b)=1$ ，
   计算出每个支持向量 $x_s,y_s)$ 对应的 $b^∗_s$ ,
   计算出这些 $b^∗_s=y_s−∑_{i=1}^sα_iy_ix^T_ix_s$ .
   所有的b∗s对应的平均值即为最终的 $b^∗=\frac{1}{S}∑_{s=1}^Sb^∗_s$
   这样最终的分类超平面为： $w^∗∙x+b^∗=0$ ，
   最终的分类决策函数为： $f(x)=sign(w^∗∙x+b^∗)$

线性可分SVM的学习方法对于非线性的数据集是没有办法使用的，有时候不能线性可分的原因是线性数据集里面多了少量的异常点，由于这些异常点导致了数据集不能线性可分，那么怎么可以处理这些异常点使数据集依然可以用线性可分的思想呢？我们在下一节的线性SVM的软间隔最大化里继续讲。

6. 线性支持向量机

现实任务中往往很难确定合适的核函数使得训练样本在特征空间中线性可分；退一步讲，即便恰好找到某个核函数使得训练样本在特征空间中线性可分，也很难断定这个貌似线性可分的结果不是由于过拟合所造成的。缓解该问题的一个方法是允许支持向量机在一些样本上出错。为此引入“软间隔”概念。

所谓的软间隔，是相对于硬间隔说的，我们可以认为上一篇线性分类SVM的学习方法属于硬间隔最大化。

回顾下硬间隔最大化的条件：
$\min \frac{||w||^2}{2} \qquad s.t\quad y_i(w^Tx_i+b) ≥ 1(i=1,2,...m)$
$L(w,b,α)=\frac{||w||^2}{2} +∑_{i=1}^m(1-α_i[y_i(w^Tx_i+b)])\quad满足\;α_i≥0$
接着我们再看如何可以软间隔最大化呢？

   SVM对训练集里面的每个样本 $x_i,y_i)$ 引入了一个松弛变量 $ξ_i≥0$ ,使函数间隔加上松弛变量大于等于1，也就是说：
$y_i(w^T∙x_i+b)≥1−ξ_i$
   对比硬间隔最大化，可以看到我们对样本到超平面的函数距离的要求放松了，之前是一定要大于等于1，现在只需要加上一个大于等于0的松弛变量能大于等于1就可以了。当然，松弛变量不能白加，这是有成本的，每一个松弛变量 $ξ_i$ , 对应了一个代价 $ξ_i$ ，这个就得到了我们的软间隔最大化的SVM学习条件如下：
$min\frac{1}{2}||w||_2^2+C∑_{i=1}^mξ_i$
$s.t.\quad y_i(w^Tx_i+b)≥1−ξ_i(i=1,2,...m)$
$ξ_i≥0(i=1,2,...m)$
   这里，C>0为惩罚参数，可以理解为我们一般回归和分类问题正则化时候的参数。C越大，对误分类的惩罚越大，C越小，对误分类的惩罚越小。
也就是说，我们希望 $\frac{1}{2}||w||_2^2$ 尽量小，误分类的点尽可能的少。C是协调两者关系的正则化惩罚系数。在实际应用中，需要调参来选择。

6.1 线性支持向量机的软间隔最大化目标函数的优化

可以利用上面的三个式子去消除w和b了。

6.2 软间隔最大化时的支持向量

在硬间隔最大化时，支持向量比较简单，就是满足 $y_i(w^Tx_i+b)−1=0$ 就可以了。根据KKT条件中的对偶互补条件 $α^∗_i(y_i(w^Tx_i+b)−1)=0$ ，如果 $α^∗_i>0$ 则有 $y_i(w^Tx_i+b)=1$ 即点在支持向量上，否则如果 $α^∗_i=0$ 则有 $y_i(w^Tx_i+b)≥1$ ，即样本在支持向量上或者已经被正确分类。

在软间隔最大化时，则稍微复杂一些，因为我们对每个样本 $x_i,y_i)$ 引入了松弛变量 $ξ_i$ 。我们从下图来研究软间隔最大化时支持向量的情况，第i个点到对应类别支持向量的距离为 $ξ_i||w||_2$ 。根据软间隔最大化时KKT条件中的对偶互补条件 $α^∗_i(y_i(w^Tx_i+b)−1+ξ^∗_i)=0$ 我们有：

a) 如果α=0,那么 $y_i(w^Tx_i+b)−1≥0$ ,即样本在间隔边界上或者已经被正确分类。如图中所有远离间隔边界的点。

b) 如果0<α $ξ_i=0,y_i(w^Tx_i+b)−1=0$

c) 如果α=C，说明这是一个可能比较异常的点，需要检查此时ξi
　　　 i)如果 $0≤ξ_i≤1$ ,那么点被正确分类，但是却在超平面和自己类别的间隔边界之间。如图中的样本2和4.

　　　ii)如果 $ξ_i=1$ ,那么点在分离超平面上，无法被正确分类。

　　　iii)如果 $ξ_i>1$ ,那么点在超平面的另一侧，也就是说，这个点不能被正常分类。如图中的样本1和3.

6.2 软间隔最大化的线性支持向量机的算法过程

公式参考: [https://blog.csdn.net/weixin_41725746/article/details/90483885#3_457]

7. 课后练习参考答案

[https://blog.csdn.net/icefire_tyh/article/details/52065224]

参考文献：
[1] [统计学习-李航]
[2] [机器学习西瓜书-周志华]
[3] [https://www.cnblogs.com/pinard/p/6103615.html]

你可能感兴趣的:(西瓜书)

周工作计划2019-03-25 MikeShine
很久没有写工作计划了。之前一个星期生了病，很难受。上个星期基本上什么都没有干。但是好的一点是，西瓜书基本都看完了。本周工作计划：机器学习分享活动（关于决策树的分享）回看一下西瓜书的东西，每一章把开头总结写一下。老师没有给具体的任务，留了再说吧。
机器学习（西瓜书）学习笔记导览盛寒机器学习西瓜书学习机器学习人工智能
本篇文章会持续更新直到更新完毕，关注博主不迷路~（如果没有超链接，表示还没有更新到）第一章绪论1.1引言1.2基本术语1.3假设空间1.4归纳偏好第二章模型评估与选择2.1经验误差与过拟合2.2评估方法2.3性能度量2.4比较检验2.5偏差与方差第三章线性模型3.1基本形式3.2线性回归3.3对数几率回归3.4线性判别分析3.5多分类学习3.6类别不平衡问题第四章决策树4.1基本流程4.2划分选择
机器学习LDA线性判别器代码实现 Longlongaaago 机器学习 LDA 线性判别分析代码实现
机器学习LDA线性判别器代码实现西瓜书P60线性判别器LDA代码实现：importnumpyasnpimportmatplotlib.pyplotaspltdefload_data(file_name):'''数据导入函数:paramfile_name:(string)训练数据位置:return:feature_data(mat)特征lable_data(mat)标签'''fr=open(file
西瓜书-机器学习5.4 全局最小与局部极小 lestat_black 西瓜书机器学习
两种“最优”：“局部极小”(localminimum)和"全局最小"(globalminimum)对和，若存在使得多组不同参数值初始化多个神经网络使用“模拟退火”：以一定的概率接受比当前解更差的结果，有助于“跳出”局部极小使用随机梯度下降遗传算法(geneticalgorithms)[Goldberg,1989]也常用来训练神经网络以上用于跳出局部极小的技术大多是启发式，理论上商缺乏保障。Gold
2019-05-14《西瓜书》难啃杨熊猫Yang
周志华老师的《西瓜书：机器学习》这周看完1~10章锻炼：太极云手、100手/组，3组虎刨功（简）、100个/组，2组
机器学习——集成学习三三木木七机器学习集成学习人工智能
参考：ysu老师课件+西瓜书+期末复习笔记1.集成学习的基本概念集成学习（ensemblelearing）通过构建并结合多个学习器来完成学习任务。有时也被称为多分类器系统（multi-classifiersystem）、基于委员会的学习(committee-basedlearning)等。理解：集成学习是一种机器学习方法，其核心思想是将多个学习器（弱学习器）集成在一起，以达到比单个学习器更好的性能
西瓜书学习笔记——低维嵌入（公式推导+举例应用） Nie同学机器学习学习笔记机器学习
文章目录算法介绍实验分析算法介绍低维嵌入（Low-DimensionalEmbedding）是一种降低高维数据维度的技术，目的是在保留数据特征的同时减少数据的复杂性。这种技术常用于可视化、特征学习、以及数据压缩等领域。低维嵌入的目标是将高维数据映射到一个低维空间，以便更好地理解和可视化数据。在kkk近邻学习中，随着数据维度的增加，样本之间的距离变得更加稀疏，导致KNN算法性能下降。这是因为在高维空
西瓜书学习笔记——核化线性降维（公式推导+举例应用） Nie同学机器学习学习笔记机器学习
文章目录算法介绍实验分析算法介绍核化线性降维是一种使用核方法（KernelMethods）来进行降维的技术。在传统的线性降维方法中，例如主成分分析（PCA）和线性判别分析（LDA），数据被映射到一个低维线性子空间中。而核化线性降维则通过使用核技巧，将数据映射到一个非线性的低维空间中。核技巧的核心思想是通过一个非线性映射将原始数据转换到一个高维的特征空间，然后在该特征空间中应用线性降维方法。这种映射
西瓜书学习笔记——k近邻学习（公式推导+举例应用） Nie同学机器学习学习笔记机器学习
文章目录算法介绍实验分析算法介绍K最近邻（K-NearestNeighbors，KNN）是一种常用的监督学习算法，用于分类和回归任务。该算法基于一个简单的思想：如果一个样本在特征空间中的kkk个最近邻居中的大多数属于某个类别，那么该样本很可能属于这个类别。KNN算法不涉及模型的训练阶段，而是在预测时进行计算。以下是KNN算法的基本步骤：选择K值：首先，确定用于决策的邻居数量K。K的选择会影响算法的
西瓜书学习笔记——主成分分析（公式推导+举例应用） Nie同学机器学习学习笔记机器学习降维
文章目录算法介绍实验分析算法介绍主成分分析（PrincipalComponentAnalysis，PCA）是一种常用的降维技术，用于在高维数据中发现最重要的特征或主成分。PCA的目标是通过线性变换将原始数据转换成一组新的特征，这些新特征被称为主成分，它们是原始特征的线性组合。对于一个正交属性空间（各个属性之间是线性无关的）中的样本点，存在以下两个性质的超平面可对所有样本点进行恰当的表达：最近重构性
朴素贝叶斯分类算法三三木木七 #机器学习机器学习人工智能 sklearn
本文介绍了朴素贝叶斯分类算法，标记后的话一般是自己简要总结的，是比较通俗易懂的，也就是必看的。参考：西瓜书，ysu老师课件【摘要】1.分类算法：分类算法的内容是根据给定特征，求出它所属类别。2.先验概率：就是根据以往的数据分析所得到的概率。后验概率：是得到信息之后重新加以修正得到的概率。3.贝叶斯决策：贝叶斯决策理论中，我们希望选择那个最小化总体期望损失的决策。决策损失的期望值通过对所有可能状态的
决策树的相关知识点三三木木七 #机器学习决策树算法机器学习
参考：ysu老师课件+西瓜书1.决策树的基本概念【决策树】：决策树是一种描述对样本数据进行分类的树形结构模型，由节点和有向边组成。其中每个内部节点表示一个属性上的判断，每个分支代表一个判断结果的输出，最后每个叶节点代表一种分类结果。理解：它是一个树状结构，其中每个节点代表一个特征属性的判断，每个分支代表这个判断的结果，而每个叶节点（叶子）代表一种类别或回归值。关于决策树要掌握的概念：根节点（Roo
西瓜书学习笔记——层次聚类（公式推导+举例应用） Nie同学机器学习学习笔记聚类
文章目录算法介绍实验分析算法介绍层次聚类是一种将数据集划分为层次结构的聚类方法。它主要有两种策略：自底向上和自顶向下。其中AGNES算法是一种自底向上聚类算法，用于将数据集划分为层次结构的聚类。算法的基本思想是从每个数据点开始，逐步合并最相似的簇，直到形成一个包含所有数据点的大簇。这个过程被反复执行，构建出一个层次化的聚类结构。这其中的关键就是如何计算聚类簇之间的距离。但实际上，每个簇都是一个集合
西瓜书学习笔记——密度聚类（公式推导+举例应用） Nie同学机器学习学习笔记聚类
文章目录算法介绍实验分析算法介绍密度聚类是一种无监督学习的聚类方法，其目标是根据数据点的密度分布将它们分组成不同的簇。与传统的基于距离的聚类方法（如K均值）不同，密度聚类方法不需要预先指定簇的数量，而是通过发现数据点周围的密度高度来确定簇的形状和大小。我们基于DBSCAN算法来实现密度聚类。DBSCAN是基于一组邻域参数(ϵ,MinPts)(\epsilon,MinPts)(ϵ,MinPts)来刻
【机器学习·西瓜书学习笔记·线性模型】线性回归——最小二乘法（least square method）慈善区一姐机器学习学习线性回归
线性模型的基本形式给定由个属性描述的实例,其中是在第个属性上的取值，线性模型（linearmodel）试图学得一个通过属性的线性组合来进行预测的函数，即一般用向量形式写成：和确定后，模型就得以确定参数查阅表把数据集表示为一个m*（d+1）大小的矩阵，其中每行对应于一个实例，每行前d个元素对应于实例的d个属性值，最后一个元素恒置于1，即（一）均方误差（meansquarederror）基于欧几里得距
如何系统学习机器学习？人邮异步社区学习机器学习人工智能
要系统学习机器学习，首先需要掌握一些基础编程技能，如Python。其次，学习基础的数学概念，如线性代数、概率论和统计学。然后，选择一些优质的在线课程和教材进行深入学习。最后，通过实践项目来巩固所学知识。以下是一些推荐的书籍：《动手学机器学习》，"西瓜书"作者周志华力荐的机器学习入门书。本书系统介绍了机器学习的基本内容及其代码实现，是一本着眼于机器学习教学实践的图书。本书包含4个部分：第一部分为机器
西瓜书学习笔记——原型聚类（公式推导+举例应用） Nie同学机器学习学习笔记聚类
文章目录k均值算法算法介绍实验分析学习向量量化（LVQ）算法介绍实验分析高斯混合聚类算法介绍实验分析总结k均值算法算法介绍给定样本集D={x1,x2,...,xm}D=\{x_1,x_2,...,x_m\}D={x1,x2,...,xm}，k均值算法针对聚类算法所得簇划分C={C1,C2,...,Ck}\mathcal{C}=\{C_1,C_2,...,C_k\}C={C1,C2,...,Ck}最
大数据学习之路金光闪闪耶
一、为什么要学习大数据？在我第一份实习的时候，忘记在什么场景下我leader突然说了一句：「干Java不就是增删改查嘛」，而恰好那时候知乎都是「干了3年Java，还是只会增删改查，迷茫」等问题，我听完leader那句话就心里一颤。因为这句话，我又一次的陷入迷茫，我不清楚自己是不是应该继续的Java，所以那段时间我干过爬虫，也撸了一阵子的西瓜书和统计学什么的。在知乎上所有相关的问题和答案我都看了，也
西瓜书学习笔记——Boosting（公式推导+举例应用） Nie同学机器学习学习笔记 boosting
文章目录引言AdaBoost算法AdaBoost算法正确性说明AdaBoost算法如何解决权重更新问题？AdaBoost算法如何解决调整下一轮基学习器样本分布问题？AdaBoost算法总结实验分析引言Boosting是一种集成学习方法，旨在通过整合多个弱学习器来构建一个强学习器。其核心思想是迭代训练模型，关注之前被错误分类的样本，逐步提升整体性能。Boosting的代表算法包括AdaBoost、G
浙江大学《机器学习》笔记——神经网络(Neural Network)【上】啵啵啵啵哲机器学习笔记神经网络机器学习人工智能
写在前面·最近在学习《机器学习》.主要是看浙江大学胡浩基老师的网课，结合周志华老师的西瓜书来学.为了理清思路和推公式就敲了这样一个读书笔记.初次学习难免会有错漏，欢迎批评指正.这份笔记主要用途还是用来自己复习回顾.当然如果对大家有帮助那就更好了hhh·注：神经网络这部分的笔记大部分是基于浙大《机器学习》的逻辑进行整理的.第5章神经网络(NeuralNetwork)·神经网络的诞生是集体的智慧·近年
西瓜书读书笔记整理（十二） —— 第十二章计算学习理论 smile-yan 机器学习西瓜书计算学习理论 PAC
第十二章计算学习理论（上）12.1基础知识12.1.1什么是计算学习理论（computationallearningtheory）12.1.2什么是独立同分布（independentandidenticallydistributed,简称i.i.d.i.i.d.i.i.d.）以及独立同分布样本12.1.3泛化误差以及经验误差12.1.4相关数学定义表示12.1.5误差参数12.1.6映射与样本集是
python自学（二）第二章正则表达式|字符串匹配、函数和面向对象程序设计 BrilandLiu python python 编程语言
为了能在开学后更好地融入实验室，本人计划用一个月的时间进行python3语言入门，该系列笔记适合已经有一门编程语言基础的朋友参考使用，欢迎同道者前来交流~使用教材：1.《python从入门到精通》清华大学出版社；（自带教学视频【二维码形式】）least17p/d2.《机器学习》周志华（西瓜书）清华大学出版社；least14p/d;3.BiliBili《和美女老师一起学python》视频。（一）正则
【机器学习】西瓜书要点个人整理 _hermit: 机器学习机器学习人工智能学习
目录前置基础知识第三章线性模型机器学习三要素1.函数集合2.目标函数3.优化方法4.模型评估方法对数几率回归（逻辑回归）第四章决策树第五章SVM第六章贝叶斯分类器第八章集成学习第九章神经网络前情提要：本文适合在学习机器学习课程前，对课程的要点进行简单预习。本文中提到的一些概念，大多是老师课上会重点讲的、考试要考的。此外，在进行复习时也可以通过这些概念引入，从而去更深入理解一些模型原理。前置基础知识
吃瓜教程Task1：概览西瓜书+南瓜书第1、2章卡拉比丘流形机器学习机器学习人工智能
由于本人之前已经学习过西瓜书，本次学习主要是对以往知识的查漏补缺，因此本博客记录了在学习西瓜书中容易混淆的点以及学习过程中的难点。更多学习内容可以参考下面的链接：南瓜书的地址：https://github.com/datawhalechina/pumpkin-book【视频链接】https://www.bilibili.com/video/BV1Mh411e7VU?p=1文章目录绪论如何对机器学习
西瓜书读书笔记整理（十） —— 第十章降维与度量学习 smile-yan 机器学习西瓜书
10.1k近邻学习10.1.1什么是kNN学习kNN算法（k-NearestNeighbors）是一种常用的分类和回归算法。它的基本思想是根据最近邻的样本来预测未知样本的标签或值。10.1.2kNN算法步骤kNN算法的步骤如下：计算未知样本与训练集中所有样本的距离（通常使用欧氏距离或其他距离度量方法）。选取与未知样本距离最近的k个样本。对于分类问题，根据这k个样本的标签进行投票或权重计算，确定未知
西瓜书第六章课后习题 lammmya
6.1试证明样本空间中任意点x到超平面(w,b)的距离为式(6.2)。画了个图在纸上进行了证明，感觉这样自会通俗易懂些。6.2试使用LIBSVM，在西瓜数据集3.0α上分别用线性核和高斯核训练一个SVM，并比较其支持向量的差别。导入相应的包主体函数：设置参数，输出。数据特征可视化输出结果以及数据特征可视化最终结果如下图结果表明，使用线性核和高斯训练核的支持向量实际是一样的(两条线重合)，且数量相同
机器学习西瓜书笔记1 糊了胡机器学习机器学习笔记人工智能
第一章机器学习之绪论目录第一章机器学习之绪论一、引言二、基本术语三、假设空间四、归纳偏好五、发展历程一、引言机器学习就是致力于研究如何通过计算的手段，利用经验来改善系统自身的性能。Mitchell给出了更形式化的定义：假设用P来评估计算机程序在某任务类T上的性能，若一个程序通过利用经验E在T中任务上获得了性能改善，则我们就说关于T和P，该程序对E进行了学习。二、基本术语收集一组西瓜数据，(色泽=青
西瓜书读书笔记整理（九） —— 第九章聚类 smile-yan 聚类支持向量机机器学习
第九章聚类9.1聚类算法概述9.1.1什么是聚类算法9.1.2聚类算法分类9.1.3聚类任务9.2性能度量（ClusterEvaluation）9.2.1外部指标（externalindex）9.2.2内部指数（internalindex）9.3距离度量（DistanceMeasures）9.3.1距离度量的性质9.3.2常见的几种距离的计算公式9.4原型聚类（prototype-basedclu
西瓜书*南瓜书*机器学习*周志华*第一章*学习小结 fyc300 笔记西瓜书机器学习机器学习人工智能自动驾驶
西瓜书*南瓜书*机器学习*周志华*第一章*学习小结第一章绪论1.1绪论通过一个关于瓜的故事引入了对于机器学习这门课的学习。机器学习正是这样一门学科，它致力于研究如何通过计算的手段，利用经验来改善系统自身的性能。1.2基本术语数据集dataset示例instance样本sample属性attribute特征feature属性值attributevalue属性空间attributespace样本空间s
【机器学习】集成学习基础概念介绍 Avasla 机器学习算法机器学习集成学习人工智能
前言本文根据西瓜书总结了一些关键知识点，介绍了集成学习的原理、类型以及结合策略。、1.个体与集成集成学习（ensemblelearning）通过构建的并结合多个学习器来完成学习任务，有时也被成为多分类器系统（multi-classifiersystem)、基于委员会的学习（committee-basedlearning)等。……通过将多个学习器进行结合，常可获得比单一学习器显著优越的泛化性能。个体
html 周华华 html
js 1，数组的排列 var arr=[1,4,234,43,52,]; for(var x=0;x<arr.length;x++){ for(var y=x-1;y<arr.length;y++){ if(arr[x]<arr[y]){ &
【Struts2 四】Struts2拦截器 bit1129 struts2拦截器
Struts2框架是基于拦截器实现的，可以对某个Action进行拦截，然后某些逻辑处理，拦截器相当于AOP里面的环绕通知，即在Action方法的执行之前和之后根据需要添加相应的逻辑。事实上，即使struts.xml没有任何关于拦截器的配置，Struts2也会为我们添加一组默认的拦截器，最常见的是，请求参数自动绑定到Action对应的字段上。 Struts2中自定义拦截器的步骤是：
make:cc 命令未找到解决方法 daizj linux 命令未知 make cc
安装rz sz程序时，报下面错误： [root@slave2 src]# make posix cc -O -DPOSIX -DMD=2 rz.c -o rz make: cc：命令未找到 make: *** [posix] 错误 127 系统：centos 6.6 环境：虚拟机错误原因：系统未安装gcc，这个是由于在安
Oracle之Job应用周凡杨 oracle job
最近写服务，服务上线后，需要写一个定时执行的SQL脚本，清理并更新数据库表里的数据，应用到了Oracle 的 Job的相关知识。在此总结一下。一：查看相关job信息 1、相关视图 dba_jobs all_jobs user_jobs dba_jobs_running 包含正在运行
多线程机制朱辉辉33 多线程
转至http://blog.csdn.net/lj70024/archive/2010/04/06/5455790.aspx 程序、进程和线程：程序是一段静态的代码，它是应用程序执行的蓝本。进程是程序的一次动态执行过程，它对应了从代码加载、执行至执行完毕的一个完整过程，这个过程也是进程本身从产生、发展至消亡的过程。线程是比进程更小的单位，一个进程执行过程中可以产生多个线程，每个线程有自身的
web报表工具FineReport使用中遇到的常见报错及解决办法（一）老A不折腾 web报表 finereport java报表报表工具
FineReport使用中遇到的常见报错及解决办法（一）这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、address pool is full：含义：地址池满，连接数超过并发数上
mysql rpm安装后没有my.cnf 林鹤霄没有my.cnf
Linux下用rpm包安装的MySQL是不会安装/etc/my.cnf文件的，至于为什么没有这个文件而MySQL却也能正常启动和作用，在这儿有两个说法，第一种说法，my.cnf只是MySQL启动时的一个参数文件，可以没有它，这时MySQL会用内置的默认参数启动，第二种说法，MySQL在启动时自动使用/usr/share/mysql目录下的my-medium.cnf文件，这种说法仅限于r
Kindle Fire HDX root并安装谷歌服务框架之后仍无法登陆谷歌账号的问题 aigo root
原文：http://kindlefireforkid.com/how-to-setup-a-google-account-on-amazon-fire-tablet/ Step 4: Run ADB command from your PC On the PC, you need install Amazon Fire ADB driver and instal
javascript 中var提升的典型实例 alxw4616 JavaScript
// 刚刚在书上看到的一个小问题,很有意思.大家一起思考下吧 myname = 'global'; var fn = function () { console.log(myname); // undefined var myname = 'local'; console.log(myname); // local }; fn() // 上述代码实际上等同于以下代码 m
定时器和获取时间的使用百合不是茶时间的转换定时器
定时器:定时创建任务在游戏设计的时候用的比较多 Timer();定时器 TImerTask();Timer的子类由 Timer 安排为一次执行或重复执行的任务。定时器类Timer在java.util包中。使用时，先实例化，然后使用实例的schedule(TimerTask task, long delay)方法，设定
JDK1.5 Queue bijian1013 java thread java多线程 Queue
JDK1.5 Queue LinkedList： LinkedList不是同步的。如果多个线程同时访问列表，而其中至少一个线程从结构上修改了该列表，则它必须保持外部同步。（结构修改指添加或删除一个或多个元素的任何操作；仅设置元素的值不是结构修改。）这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象，则应该使用 Collections.synchronizedList 方
http认证原理和https bijian1013 http https
一.基础介绍在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式，用的端口也不一样,前者是80，后
【Java范型五】范型继承 bit1129 java
定义如下一个抽象的范型类，其中定义了两个范型参数，T1，T2 package com.tom.lang.generics; public abstract class SuperGenerics<T1, T2> { private T1 t1; private T2 t2; public abstract void doIt(T
【Nginx六】nginx.conf常用指令(Directive) bit1129 Directive
1. worker_processes 8; 表示Nginx将启动8个工作者进程，通过ps -ef|grep nginx,会发现有8个Nginx Worker Process在运行 nobody 53879 118449 0 Apr22 ? 00:26:15 nginx: worker process
lua 遍历Header头部 ronin47 lua header 遍历　
local headers = ngx.req.get_headers() ngx.say("headers begin", "<br/>") ngx.say("Host : ", he
java-32.通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小(两数组的差最小)。 bylijinnan java
import java.util.Arrays; public class MinSumASumB { /** * Q32.有两个序列a,b，大小都为n,序列元素的值任意整数，无序. * * 要求：通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小。 * 例如: * int[] a = {100,99,98,1,2,3
redis 开窍的石头 redis
在redis的redis.conf配置文件中找到# requirepass foobared 把它替换成requirepass 12356789 后边的12356789就是你的密码打开redis客户端输入config get requirepass 返回 redis 127.0.0.1:6379> config get requirepass 1) "require
[JAVA图像与图形]现有的GPU架构支持JAVA语言吗？ comsci java语言
无论是opengl还是cuda，都是建立在C语言体系架构基础上的，在未来，图像图形处理业务快速发展，相关领域市场不断扩大的情况下，我们JAVA语言系统怎么从这么庞大，且还在不断扩大的市场上分到一块蛋糕，是值得每个JAVAER认真思考和行动的事情
安装ubuntu14.04登录后花屏了怎么办 cuiyadll ubuntu
这个情况，一般属于显卡驱动问题。可以先尝试安装显卡的官方闭源驱动。按键盘三个键：CTRL + ALT + F1 进入终端，输入用户名和密码登录终端：安装amd的显卡驱动 sudo apt-get install fglrx 安装nvidia显卡驱动 sudo ap
SSL 与数字证书的基本概念和工作原理 darrenzhu 加密 ssl 证书密钥签名
SSL 与数字证书的基本概念和工作原理 http://www.linuxde.net/2012/03/8301.html SSL握手协议的目的是或最终结果是让客户端和服务器拥有一个共同的密钥，握手协议本身是基于非对称加密机制的，之后就使用共同的密钥基于对称加密机制进行信息交换。 http://www.ibm.com/developerworks/cn/webspher
Ubuntu设置ip的步骤 dcj3sjt126com ubuntu
在单位的一台机器完全装了Ubuntu Server，但回家只能在XP上VM一个，装的时候网卡是DHCP的，用ifconfig查了一下ip是192.168.92.128,可以ping通。转载不是错： Ubuntu命令行修改网络配置方法 /etc/network/interfaces打开后里面可设置DHCP或手动设置静态ip。前面auto eth0，让网卡开机自动挂载. 1. 以D
php包管理工具推荐 dcj3sjt126com PHP Composer
http://www.phpcomposer.com/ Composer是 PHP 用来管理依赖（dependency）关系的工具。你可以在自己的项目中声明所依赖的外部工具库（libraries），Composer 会帮你安装这些依赖的库文件。中文文档入门指南下载安装包列表 Composer 中国镜像
Gson使用四（TypeAdapter） eksliang json gson Gson自定义转换器 gsonTypeAdapter
转载请出自出处：http://eksliang.iteye.com/blog/2175595 一.概述 Gson的TypeAapter可以理解成自定义序列化和返序列化二、应用场景举例例如我们通常去注册时（那些外国网站），会让我们输入firstName，lastName,但是转到我们都
JQM控件之Navbar和Tabs gundumw100 html xml css
在JQM中使用导航栏Navbar是简单的。只需要将data-role="navbar"赋给div即可： <div data-role="navbar"> <ul> <li><a href="#" class="ui-btn-active&qu
利用归并排序算法对大文件进行排序 iwindyforest java 归并排序大文件分治法 Merge sort
归并排序算法介绍，请参照Wikipeida zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F 基本思想：大文件分割成行数相等的两个子文件，递归（归并排序）两个子文件，直到递归到分割成的子文件低于限制行数低于限制行数的子文件直接排序两个排序好的子文件归并到父文件直到最后所有排序好的父文件归并到输入
iOS UIWebView URL拦截啸笑天 UIWebView
本文译者：candeladiao，原文：URL filtering for UIWebView on the iPhone说明：译者在做app开发时，因为页面的javascript文件比较大导致加载速度很慢，所以想把javascript文件打包在app里，当UIWebView需要加载该脚本时就从app本地读取，但UIWebView并不支持加载本地资源。最后从下文中找到了解决方法，第一次翻译，难免有
索引的碎片整理SQL语句 macroli sql
SET NOCOUNT ON DECLARE @tablename VARCHAR (128) DECLARE @execstr VARCHAR (255) DECLARE @objectid INT DECLARE @indexid INT DECLARE @frag DECIMAL DECLARE @maxfrag DECIMAL --设置最大允许的碎片数量,超过则对索引进行碎片
Angularjs同步操作http请求with $promise qiaolevip 每天进步一点点学习永无止境 AngularJS 纵观千象
// Define a factory app.factory('profilePromise', ['$q', 'AccountService', function($q, AccountService) { var deferred = $q.defer(); AccountService.getProfile().then(function(res) {
hibernate联合查询问题 sxj19881213 sql Hibernate HQL 联合查询
最近在用hibernate做项目，遇到了联合查询的问题，以及联合查询中的N+1问题。针对无外键关联的联合查询，我做了HQL和SQL的实验，希望能帮助到大家。（我使用的版本是hibernate3.3.2） 1 几个常识：（1）hql中的几种join查询，只有在外键关联、并且作了相应配置时才能使用。（2）hql的默认查询策略，在进行联合查询时，会产
struts2.xml wuai struts
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他