不牌不改

【人工智能】传统机器学习算法（QDU）

转载请务必经过我的同意

【人工智能】不确定性推理（QDU）
【人工智能】传统机器学习算法（QDU）
【人工智能】非线性分类器（QDU）
【人工智能】机器学习基础（QDU）
【人工智能】深度学习（QDU）

线性分类器

涉及内容：

Fisher 线性判别

感知器算法

分类器与准则

分类器的作用：

常规任务是利用给定的类别、已知的训练数据来学习分类规则和分类器，然后对未知数据进行分类（或预测）。逻辑回归（logistics）、SVM等常用于解决二分类问题，对于多分类问题（multi-class classification），比如识别手写数字，它需要10个分类，同样也可以用逻辑回归或SVM，只是需要多个二分类来组成多分类，但这样容易出错且效率不高，常用的多分类方法有softmax。

分类算法可以按不同的方式划分：

基于概率密度的方法和基于判别函数的方法。
- 基于概率密度的分类算法通常借助于贝叶斯理论体系，采用潜在的类条件概率密度函数的知识进行分类；在基于概率密度的分类算法中，有著名的贝叶斯估计法、最大似然估计，这些算法属于有参估计，需要预先假设类别的分布模型，然后使用训练数据来调整概率密度中的各个参数。另外，如 Parzen窗、Kn邻近等方法属于无参估计，此类方法可从训练样本中直接估计出概率密度。基于判别函数的分类方法使用训练数据估计分类边界完成分类，无需计算概率密度函数。
- 基于判别函数的方法则假设分类规则是由某种形式的判别函数表示，而训练样本可用来表示计算函数中的参数，并利用该判别函数直接对测试数据进行分类。此类分类器中，有著名的Fisher准则、感知器方法、最小平方误差法、SVM法、神经网络方法以及径向基（RBF）方法等。
根据监督方式划分分类算法，分类学习问题可分为三大类：有监督分类、半监督分类和无监督分类。
- 有监督分类是指用来训练分类器的所有样本都经过了人工或其他方式的标注，有很多著名的分类器算法都属于有监督的学习方式，如AdaBoost[51]，SVM，神经网络算法以及感知器算法。
- 无监督分类是指所有的样本均没有经过标注，分类算法需利用样本自身信息完成分类学习任务，这种方法通常被称为聚类，常用的聚类算法包括期望最大化（EM）算法和模糊C均值聚类算法等。
- 半监督分类指仅有一部分训练样本具有类标号，分类算法需要同时利用有标号样本和无标号样本学习分类，使用两种样本训练的结果比仅使用有标注的样本训练的效果更好。这类算法通常由有监督学习算法改进而成，如SemiBoost、流形正则化、半监督SVM等。

线性（二）分类器的定义：线性分类器就是用一个“超平面”将正、负样本隔离开。

常见的线性分类器有：LR，贝叶斯分类，单层感知机、线性回归，SVM（线性核）等。

非线性分类器的定义：非线性分类器就是用一个“超曲面”或者多个超平（曲）面的组合将正、负样本隔离开（即，不属于线性的分类器）。

常见的非线性（二）分类器：决策树、RF、GBDT、多层感知机、SVM（高斯核）等。

准则：

以线性分类器为例，在基于判别函数的方法中，准则用于构建合适的判别函数，或者是为判别函数确定最佳参数。

线性判别准则中比较经典的是，FIsher准则、感知机准则、最小二乘（最小均方误差）准则。

注：在许多博客中不区分LDA（Linear Discriminant Analysis）与FDA（Fisher Discriminant Analysis），所以这部分就不细致区分了。只要理解线性判别分析中包含了哪些准则以及准则的内容即可。

下文中若未作特别说明，则不区分“FDA”、“LDA”、“Fisher线性判别分析”、“Fisher准则”之间的细致概念，即同义。

引入：K-邻近算法的局限性

K-Nearest Neighbor分类器（K-邻近算法）进行分类存在很多不足：

分类器必须记住所有训练数据并将其存储起来，以便于未来测试数据用于比较。这在存储空间上是低效的，数据集很容易过大。
对一个测试图像进行分类需要和所有训练图像作比较，算法计算资源耗费高。

因为K-邻近算法的这些不足，我们引入了线性分类器。

Fisher准则

要学习线性判别绝对不能一上来就学习其函数，要先从整体思路上掌握！

基本思想

FDA是一种监督学习的降维技术，以二维数据集的二分类为例（通俗点讲二维数据集就是平面直角坐标系中的散点，二分类就是这些数据集要么是第一类，要么是第二类），有很多种方法对这些点进行分类，比如我们可以找一条直线去分隔两类点，线左边的是第一类，线右边的是第二类等等方法。而线性判别要做的是找一条直线，让这些散点都投影到该直线上，让同一类的点尽可能在直线上分布地近点，而不同类的点在直线上分布尽可能地远点。

可能还是有点抽象，我们先看看最简单的情况。假设我们有两类数据分别为红色和蓝色，如下图所示，这些数据特征是二维的，我们希望将这些数据投影到一维的一条直线，让每一种类别数据的投影点尽可能的接近，而红色和蓝色数据中心之间的距离尽可能的大。

上图提供了两种投影方式，哪一种能更好的满足我们的标准呢？从直观上可以看出，右图要比左图的投影效果好，因为右图的红色数据和蓝色数据各个较为集中，且类别之间的距离明显。左图则在边界处数据混杂。

在实际应用中，散点类别的确定往往不能仅由两种特征来确定，这就需要将FDA扩展到高维了。对于高维而言也是类似的，无非就是要去确定一个超平面，使得高维坐标系中的点投影到该超平面上同一类点尽可能近，不同类点尽可能远。降维就是FDA的主要思想。

判别函数

线性判别函数需要确定 $W$ 和 $w_0$ 可以用于判断某个样本 $X$ 所在的类

判别函数： $g(X) = W^TX+w_0$

其中， $X$ 为样本的特征（即样本点在高维坐标系下的坐标）； $W$ 为权向量（即待求参数）， $w_0$ 为阈值权，是个常数。

在二分类中，判别函数的意义在于确定一个决策面（决策面就是用于分隔每类散点的超平面），决策面的一侧为第一类点，另一侧为第二类点，在面上的点我们可以将该点归为第一类也可以归为第二类，也可以选择不对这些点分类。根据其意义，可以总结出判别规则：
$\left\{\begin{array}{l} if \space\space\space\space g(X)>0, \space\space\space\space then \space\space\space\space X∈class_1 \\ if \space\space\space\space g(X)<0, \space\space\space\space then \space\space\space\space X∈class_2 \\ if \space\space\space\space g(X)=0, \space\space\space\space then \space\space\space\space X∈class_1 \space or \space class_2\end{array}\right.$
那么， $g (X) = 0$ 就是对应的决策面方程，即 $W^TX+w_0=0$

准则函数

准则函数是用于获取最佳 $W$ 的函数，通过下面的讲解会发现准则函数是用于确定投影方向的函数

以FDA“同近异远”的主要思想为目标定义Fisher准则函数，当准则函数的值尽可能地大（或者小）时可以使两类尽量分开，同类尽量聚集。也就是说我们要将分类的好坏程度量化，用于量化的函数就是Fisher准则函数（可以理解为损失函数），当其值取最大（或最小）时得到的参数值就是我们的目标参数值，也就是决策面。

获取投影方向 $W$

以二分类为例。

将 $X$ 空间中的 $N$ 个具有 $d$ 个特征（即 $d$ 维）的样本点 $x_1$ ， $x_2$ ， $. . .$ ， $x_N$ 通过一个 $d$ 维向量 $w$ 投影到一维 $Y$ 空间中，其中 $N_1$ 个属于 $w_1$ 类的样本记为子集 $\Gamma_1$ ， $N_2$ 个属于 $w_2$ 类的样本记为子集 $\Gamma_2$ 。投影到一维 $Y$ 空间中，对应为 $y_i=W^Tx_i$ ， $i = 1, 2, . . ., N$ 。

基本参量：

在 $d$ 维 $X$ 空间中，

各类样本的均值向量 $m_i$
$m_i=\frac{1}{N_i}\sum_{x∈\Gamma_i}x,\space\space\space\space i=1,2$
样本类内离散度矩阵 $S_i$
$S_i=\sum_{x∈\Gamma_i}(x-m_i)(x-m_i)^T,\space\space\space\space i=1,2$

$S_i$ 为对称阵
总样本类内离散度矩阵 $S_w$
$S_w = S_1 + S_2$
样本类间离散度矩阵 $S_b$
$S_b = (m_1-m_2)(m_1-m_2)^T$

$S_b$ 为对称阵

在一维 $Y$ 空间中，

各类样本的均值 $\tilde{m_i}$
$\tilde{m_i} = \frac{1}{N_i}\sum_{x_j∈\Gamma_i}y_j,\space\space\space\space i=1,2$

为了表示方便， $\tilde{m_i}$ 式中的 $x_j$ 和 $y_j$ 将简写为 $x$ 和 $y$ ，含义不变， $y$ 为 $x$ 对应的投影值
样本类内离散度 $\tilde{S_i^2}$
$\tilde{S_i^2} = \sum{x∈\Gamma_i}(y-\tilde{m_i})^2, \space\space\space\space i=1, 2$
总样本类内离散度 $\tilde{S_w}$
$\tilde{S_w}=\tilde{S_1^2} + \tilde{S_2^2}$
总样本类间散度 $\tilde{S_b^2}$
$\tilde{S_b^2}=(\tilde{m_1}-\tilde{m_2})^2$

Fisher准则函数定义为：
$\space\space J_F(W) = \frac{(\tilde{m_1}-\tilde{m_2})^2}{\tilde{S_1^2} + \tilde{S_2^2}}$

表示的含义即为“同近异远”

由各类样本的均值可推出：
$\tilde{m_i} = \frac{1}{N_i}\sum_{x∈\Gamma_i}y=\frac{1}{N_i}\sum_{x∈\Gamma_i}W^Tx = W^T(\frac{1}{N_i}\sum_{x∈\Gamma_i}x)=W^Tm_i$
这样，Fisher准则函数 $J_F(W)$ 的分子可写成：
$(\tilde{m_1}-\tilde{m_2})^2\\ =(W^Tm_1-W^Tm_2)^2\\ =(W^Tm_1-W^Tm_2)(W^Tm_1-W^Tm_2)^T\\ =W^T(m_1-m_2)(m_1-m_2)^TW\\ =W^TS_bW$
现在再来考察 $J_F(w)$ 的分母与 $W$ 的关系：
$\tilde{S_i^2} = \sum_{x∈\Gamma_i}(y-\tilde{m_i})^2\\ =\sum_{x∈\Gamma_i}(W^Tx-W^Tm_i)^2\\ =W^T[\sum_{x∈\Gamma_i}(x-m_i)(x-m_i)^T]W\\ W^TS_wW$
因此，
$\tilde{S_1^2} + \tilde{S_2^2} = W^T(S_1+S_2)W=W^TS_wW$
将上述各式代入 $J_F(w)$ ，可得：
$J_F(w)=\frac{W^TS_bW}{W^TS_wW}$
最佳变换向量 $W^*$ 的求取：

为求使 $J_F(w)=\frac{W^TS_bW}{W^TS_wW}$ 取极大值时的 $w^*$ ，可以采用Lagrange乘数法求解。令分母等于非零常数，即：
$W^TS_wW=c≠0$
定义Lagrange函数为：
$\lambda)=W^TS_bW-\lambda(W^TS_wW-c)$
其中 $\lambda$ 为Lagrange乘子。将上式对 $W$ 求偏导数，可得：
$\frac{∂L(W,\lambda)}{∂ w}=S_bW-\lambda S_wW$
令偏导数为零，则有：
$S_bW^*-\lambda S_wW^*=0\\ S_bW^*=\lambda S_wW^*$
其中 $W^*$ 就是 $J_F(W)$ 的极值解。因为 $S_w$ 非奇异，将上式两边左乘 $S_W^{-1}$ ，可得：
$S_w^{-1}S_bW^*=\lambda W^*$
上式为求一般矩阵 $S_w^{-1}S_b$ 的特征值问题。利用 $S_b=(m_1-m_2)(m_1-m_2)^T$ 的定义，将上式左边的 $S_bW^*$ 写成：
$S_bW^*=(m_1-m_2)(m_1-m_2)^TW^*=(m_1-m_2)R$
其中 $R=(m_1-m_2)^TW^*$ 为标量，所以 $S_bW^*$ 总在向量 $m_1-m_2)$ 的方向上。因此 $\lambda W^*$ 可写成：
$\lambda W^*=S_w^{-1}(S_bW^*)=S_w^{-1}(m_1-m_2)R$
从而可得：
$W^*=\frac{R}{\lambda}S_w^{-1}(m_1-m_2)$
由于我们的目的是寻找最佳的投影方向， $W^*$ 的比例因子对此并无影响，因此可忽略比例因子 $\frac{R}{\lambda}$ ，有：
$W^*=S_w^{-1}(m_1-m_2)$
$W^*$ 是使Fisher准则函数 $J_F(W)$ 取极大值时的解，也就是 $d$ 维 $X$ 空间到一维 $Y$ 空间的最佳投影方向。

获取阈值 $w_0$

有了 $W^*$ ，就可以把 $d$ 维样本 $x$ 投影到一维，这实际上是多维空间到一维空间的一种映射，这个一维空间的方向 $W^*$ 相对于Fisher准则函数 $J_F(W)$ 是最好的。利用Fisher准则确定 $W$ 后，就可以将 $d$ 维分类问题转化为一维分类问题，然后，只要确定一个阈值 $w_0$ 即可。

阈值 $w_0$ 的选取：

$d$ 和 $N$ 很大时， $y$ 近似正态分布，可在Y空间内用贝叶斯分类器

经验，如：

$w_0=-\frac{1}{2}(\tilde{m_1} + \tilde{m_2})$

$w_0=-\tilde{m}$

$w_0=-\frac{1}{2}(\tilde{m_1} + \tilde{m_2})-\frac{1}{N_1+N_2-2}ln\frac{P(w_1)}{P(w_2)}$

在实际工作中还可以对 $w_0$ 进行逐次修正的方式，选择不同的 $w_0$ 值，计算其对训练样本集的错误率，找到错误率较小的 $w_0$ 值

感知器算法

基本思想

对于线性判别函数，当模式的维数已知时，判别函数的形式实际上就已经确定下来，线性判别的过程即是确定权向量。感知器是一种神经网络模型，其特点是随意确定判别函数初始值，在对样本分类训练过程中，针对分类错误的样本不断进行权值修正，逐步迭代直至最终分类符合预定标准，从而确定权向量值。可以证明感知器是一种收敛算法，只要模式类别是线性可分的，就可以在有限的迭代步数里求出权向量的解。

判别函数

设样本 $d$ 维特征空间中描述，则两类别问题中线性决策面的一般形式可表示成： $g(X) = W^TX+w_0$

将线性判别函数齐次化为： $W^TX+w_0=\alpha^Ty$

其中， $y=\left[\begin{matrix} x \\ 1 \end{matrix}\right]$ 称为增广样本向量， $\alpha=\left[\begin{matrix} w \\ w_0 \end{matrix}\right]$ 称为增广权向量。

线性判别函数的齐次简化使特征空间增加了一维，但保持了样本间的欧氏距离不变，对于分类效果也与原决策面相同，只是在Y空间中决策面是通过坐标原点的。

判别规则（与Fisher中类似）：
$\alpha^Ty\space\space\space\space \left\{\begin{array}{l} if \space\space\space\space g(X)>0, \space\space\space\space then \space\space\space\space X∈class_1 \\ if \space\space\space\space g(X)<0, \space\space\space\space then \space\space\space\space X∈class_2 \\ if \space\space\space\space g(X)=0, \space\space\space\space then \space\space\space\space X∈class_1 \space or \space class_2\end{array}\right.$

反过来说，如果存在一个权向量 $\alpha$ ，使得对于任何 $y∈class_1$ 都有 $\alpha^T>0$ ，而对任何 $y < c l a s s 2 y，都有 α T y < 0 \alpha^Ty<0 ，则称这组样本集为线性可分的，否则称样本集为线性不可分的。$

准则函数

样本的规范化

根据线性可分的定义，如果样本集 $y_1,y_2,...,y_N$ 是线性可分的，则必存在某个或某些权向量 $\alpha$ ，使得
$\alpha^Ty\space\space\space\space \begin{cases}>0, \space\space\space\space 对于一切X∈class_1 \\ <0, \space\space\space\space 对于一切X∈class_2 \\ \end{cases}$
如果将第二类样本都取其反向向量，则有：
$\begin{cases} \space\space\space y, \space\space\space\space if \space\space\space\space y∈class_1 \\ -y, \space\space\space\space if \space\space\space\space y∈class_2 \\ \end{cases}$
也就是说不管样本原来的类别标识，只要找到一个对全部样本都满足 $\alpha^Ty'_i>0,\space\space i=1,2,..,N$ 的权向量 $\alpha$ 即可。

注：为了方便，下文中使用 $y$ 表示上文中的 $y^{'}$

感知器准则函数

本质是用对所有错分样本的求和来表示对错分样本的惩罚。

如果样本 $y_k$ 被错分，则有 $\alpha^Ty_k<0$ ，因此可定义如下的感知准则函数：
$J_P(\alpha)=\sum_{y_j∈\gamma^k} (-\alpha^Ty_j)$
其中， $\gamma^k$ 是被 $\alpha$ 错分样本的集合。当且仅当 $J_P(\alpha^*)=minJ_P(\alpha)=0$ 时，无错分样本。

感知器准则函数求解

梯度下降法（非单样本修正法）：
$\alpha(k+1)=\alpha(k)-\rho_k\nabla J$
其中， $\alpha(k)$ 表示第 $k$ 次迭代， $\rho_k$ 为步长。表示下一时刻的权向量是把当前时刻的权向量向目标函数的负梯度方向调整一个修正量。

其中，
$\nabla J=∂J_P(\alpha)/∂\alpha=\sum_{y_j∈ \gamma^k}(-y_j)$
因此，
$\alpha(k+1)=\alpha(k)+\rho_k\sum_{y_j∈ \gamma^k}(-y_j)$
表示每一步迭代时把错分的样本按照某个系数加到权向量上。

单样本修正法：

不难看出，梯度下降法（非单样本修正法）每次迭代必须遍历全部样本点，才能得到 $\alpha(k)$ 下的错分样本集 $\gamma^k$ ，这是十分低效的，更常用是每次只修正一个样本或一批样本的固定增量法。

单样本修正法把样本集看做一个不断重复出现的序列而逐个加以考虑。对于任意权向量 $\alpha(k)$ ，如果把某个样本分错了，则对 $\alpha(k)$ 做一次修正。

单样本修正法的修正过程：

固定增量法

（1）初值 $\alpha(0)$ 任意

（2）对样本 $y_j$ ，若 $\alpha(k)^Ty_j<0$ ，则 $\alpha(k+1)=\alpha(k)+\rho_ky_j$ ，其中 $\rho_k$ 一般取 $1$

（3）对所有样本重复（2），直至 $J_P=0$
变增量法

$\rho_k$ 会变化。

例如绝对修正法： $\rho_k=\frac{|\alpha(k)^Ty_j|}{||y_j||^2}$

不进行细致讲解。

收敛：对线性可分样本集，经过有限次修正后一定可以找到一个解 $\alpha^*$

计算题

题目

已知有两类样本

$w_1=(x_1,x_2)=\{\space(1,0,1)^T,\space (0,1,1)^T\space\}$

$w_2=(x_3,x_4)=\{\space(1,1,0)^T,\space(0,1,0)^T\space\}$

假设初始权向量 $a_1=(1,1,1,1)^T$ ， $ρ_k=1$

试用感知准则函数法求判别函数？

解答

对样本进行变换，变成增广向量。

$x_1 = (1,0,1,1)^T$

$x_2 = (0,1,1,1)^T$

$x_3=(1,1,0,1)^T$

$x_4=(0,1,0,1)^T$
对样本进行规范化。

$x_1 = (1,0,1,1)^T$

$x_2 = (0,1,1,1)^T$

$x_3=-(1,1,0,1)^T$

$x_4=-(0,1,0,1)^T$
初始权向量 $a_1=(1,1,1,1)^T$ ， $ρ_k=1$

第一次迭代：

$a_1^Tx_1=(1,1,1,1)(1,0,1,1)^T=3>0$

$∴$ 不修正， $a_2 = a_1 = (1,1,1,1)^T$

$a_2^Tx_2=(1,1,1,1)(0,1,1,1)^T=3>0$

$∴$ 不修正， $a_3 = a_2 = (1,1,1,1)^T$

$a_3^Tx_3=-(1,1,1,1)(1,1,0,1)^T=-3<0$

$∴$ 修正， $a_4 = a_3 + ρ_k x_3= (0,0,1,0)^T$

$a_4^Tx_4=-(0,0,1,0)(0,1,0,1)^T=0$

$∴$ 修正， $a_5 = a_4 + ρ_k x_4= (0,-1,1,-1)^T$

经过第一轮迭代发现权向量有修改，需要进行第二轮迭代。
第二次迭代：

$a_5^Tx_1=(0,-1,1,-1)(1,0,1,1)^T=0$

$∴$ 修正， $a_6 = a_5+ρ_k x_1 = (1,-1,2,0)^T$

$a_6^Tx_2=(1,-1,2,0)(0,1,1,1)^T=1>0$

$∴$ 不修正， $a_7 = a_6 = (1,-1,2,0)^T$

$a_7^Tx_3=-(1,-1,2,0)(1,1,0,1)^T=0$

$∴$ 修正， $a_8 = a_7 + ρ_k x_3= (0,-2,2,-1)^T$

$a_8^Tx_4=-(0,-2,2,-1)(0,1,0,1)^T=0$

$∴$ 不修正， $a_9 = a_8 = (0,-2,2,-1)^T$

经过第二轮迭代发现权向量有修改，需要进行第三轮迭代。
第三次迭代：

$a_9^Tx_1=(0,-2,2,-1)(1,0,1,1)^T=1>0$

$∴$ 不修正， $a_{10} = a_{9} = (0,-2,2,-1)^T$

$a_{10}^Tx_2=(0,-2,2,-1)(0,1,1,1)^T=-1<0$

$∴$ 修正， $a_{11} = a_{10} + ρ_k x_2= (0,-1,3,0)^T$

$a_{11}^Tx_3=-(0,-1,3,0)(1,1,0,1)^T=1>0$

$∴$ 不修正， $a_{12} = a_{11} = (0,-1,3,0)^T$

$a_{12}^Tx_4=-(0,-1,3,0)(0,1,0,1)^T=1>0$

$∴$ 不修正， $a_{13} = a_{12} = (0,-1,3,0)^T$

经过第三轮迭代发现权向量有修改，需要进行第四轮迭代。
第四次迭代：

$a_{13}^Tx_1=(0,-1,3,0)(1,0,1,1)^T=3>0$

$∴$ 不修正， $a_{14} = a_{13} = (0,-1,3,0)^T$

$a_{14}^Tx_2=(0,-1,3,0)(0,1,1,1)^T=2>0$

$∴$ 不修正， $a_{15} = a_{14} = (0,-1,3,0)^T$

$a_{15}^Tx_3=-(0,-1,3,0)(1,1,0,1)^T=1>0$

$∴$ 不修正， $a_{16} = a_{15} = (0,-1,3,0)^T$

$a_{16}^Tx_4=-(0,-1,3,0)(0,1,0,1)^T=1>0$

$∴$ 不修正， $a_{17} = a_{16} = (0,-1,3,0)^T$

经过第四轮迭代发现权向量没有修改，迭代结束。

因此，最终权向量 $a=a_{17}=(0,-1,3,0)^T$ ，判别函数为 $g(X)=a^TX = -x_2+3x_3$

多类问题

对于多类问题，模式有 $w_1$ ， $w_2$ ， $. . .$ ， $w_m$ 个类别。可分三种情况：

绝对可分（一对多，one-vs-rest, one-over-all）

成对可分

最大值判决（直接多类分类）

第一种情况：绝对可分

每一模式类与其它模式类间可用单个判别平面把一个类分开， $c$ 类转化为 $c$ 个两类问题， $w_i$ 与非 $w_i$

简单来说，就是先将 $w_1$ 的样本作为一组， $w_2$ ， $. . .$ ， $w_m$ 的样本作为另一组，根据这两组画一条线将两组分隔；再将 $w_2$ 的样本作为一组， $w_1$ ， $w_3$ ， $. . .$ ， $w_m$ 的样本作为另一组根据这两组再画一条线将两组分隔，以此类推。

缺点：

训练样本不均衡而导致分类面有偏（假设多类中各类的训练样本数相当）
出现歧义区域，不会恰好得到c个区域（往往过多）

通过下图观察更加直观：

如果 $X$ 属于 $w_1$ ，则由图可清楚看出，这时 $g_1 (x) >0$ 而 $g_2 (x) <0$ ， $g_3 (x) <0$ 。 $w_1$ 类与其它类之间的边界由 $g_1(x)=0$ 确定。

例题： 已知三类 $w_1$ ， $w_2$ ， $w_3$ 的判别函数分别为：
$\left\{\begin{array}{l} g_1(x)=-x_1+x_2 \\ g_2(x)=x_1+x_2-5\\ g_3(x)=-x_2+1 \\ \end{array}\right. \space\space\space\space \xrightarrow[]{三个判别边界为：} \space\space\space\space \left\{\begin{array}{l} g_1(x)=-x_1+x_2=0 \\ g_2(x)=x_1+x_2-5=0\\ g_3(x)=-x_2+1=0 \\ \end{array}\right.$

如果某个 $X$ 使二个以上的判别函数 $g_i (x) >0$ ，则 $X$ 就无法作出确切的判决。如图中 $I R 1$ ， $I R 3$ ， $I R 4$ 区域。另一种情况是 $I R 2$ 区域，判别函数都为负值。 $I R 1$ ， $I R 2$ ， $I R 3$ ， $I R 4$ 都为不确定区域。

第二种情况：成对可分

对多类中的每两类构造一个分类器，所以每个模式类和其它模式类间可分别用判别平面分开，因此对于 $c$ 类就有 $\frac{c(c-1)}{2}$ 个决策面。

相较于“一对多”，决策歧义区域相对较小。

判别函数： $g_{ij}(x)=W^T_{ij}x$

判别边界： $g_{ij}(x)=0$

判别条件： $g_{ij}(x) \left\{\begin{array}{l} >0, \space\space\space\space 当x∈w_1 \\<0, \space\space\space\space 当x∈w_2 \\ \end{array}\right. \space\space\space\space i≠j$

判别函数性质： $g_{ij}(x) = g_{ji}(x)$

还是通过样例来说明：

假设判别函数为： $\left\{\begin{array}{l} g_{12}(x)=-x_1-x_2+5 \\g_{13}(x)=-x_1+5\\g_{23}(x)=-x_1+x_2 \end{array}\right. \space\space\space\space$

例题： 未知模式 $X=(x_1 ,x_2 )^T=(4,3)^T$ 属于上面的哪一类？

代入判别函数可得： $g_{1 2}(x) = −2$ ， $g_{1 3}(x) = −1$ ， $g_{2 3}(x) = −1$

把下标对换可得： $g_{21}(x) = 2$ ， $g_{31}(x) = 1$ ， $g_{32}(x) = 1$

因为 $g_{3 j }(x) > 0$ ，所以 $X$ 属于 $w_3$ 类

第三种情况：最大值判决

每类都有一个判别函数。

判别函数： $g_k (x) =W_k X\space\space\space\space\space\space k =1,2,...,M$

判别规则： $g_{i}(x)=W_K^T X \begin{cases} 最大, \space\space\space\space 当x∈w_i \\小, \space\space\space\space 其他 \\ \end{cases} \space\space\space\space$

判别边界： $g_i (x) =g_j (x)$ 或 $g_i (x) -g_j (x) =0$

就是说，要判别模式 $X$ 属于哪一类，先把 $X$ 代入 $M$ 个判别函数中，判别函数最大的那个类别就是 $X$ 所属类别。

此分类实现方式也称作多类线性机器

多类线性机器不会出现有决策歧义的区域。下图显示三类的情况：

利用感知准则实现多类判别

步骤：

（1）增广样本，但是不用进行规范化（注意和两分类问题的区别）

（2）每一类设定一个初始权向量

（3）对第 $i$ 类的样本 $y_i$ ，若 $w_i^Ty_i<=w_t^Ty_i$ ， $t = 1, . . ., M, t \neq = i$ ，则
$\begin{cases}w_i(k+1)=w_i(k)+y_i\\w_t(k+1)=w_t(k)-y_i & t≠i\end{cases} \space\space\space\space$

（4）对所有样本重复（3），直到满足 $w_i^Ty_i>w_t^Ty_i$ ， $t = 1, . ., M$ ， $t \neq = i$

注意，当存在修改时，只对不满足条件的 $t$ 对应的权向量进行修改，并非只要不满足（4）就要对全部权向量进行修改！

例题：

有三类样本 $w_1:\{(0,0)^T\}$ ， $w_2:\{(1,1)^t\}$ ， $w_3:\{(-1,1)^T\}$ ，采用感知器算法设计判别函数。

解答：

（2）对样本进行变换，变换成增广向量。

$x_1=(0,0,1)^T$

$x_2=(1,1,1)^T$

$x_3=(-1,1,1)^T$

（2）初始权向量为 $w(1)=w(2)=w(3)=(0,0,0)^T$ ，并令 $c = 1$

此时对于所有样本，全向量不再修改，迭代停止

$w_1=w_1(8)=(0,-2,0)^T$

$w_2=w_2(8)=(2,0,-2)^T$

$w_3=w_3(8)=(-2,0,-2)^T$

判别函数：

$g_1(x)=-2x_2$

$g_2(x)=2x_1-2$

$g_3(x)=-2x_1-2$

REF

线性判别分析LDA原理总结 - 博客园

线性判别分析（LDA）准则：FIsher准则、感知机准则、最小二乘（最小均方误差）准则 - 博客园

机器学习总结之——线性分类器与非线性分类器 - CSDN

分类器 - CSDN

10 模式识别- 感知器分类方法（单样本修正法+非单样本修正法）- CSDN

你可能感兴趣的:(【人工智能】,机器学习,人工智能,算法)

一文读懂：AI 工具 Cursor、DeepSeek 和 Copilot 的区别与使用方法 AI云极【AI智能系列】人工智能 copilot
在人工智能技术迅猛发展的今天，各类AI工具层出不穷，为编程、搜索、写作等领域带来了极大的便利。今天，我们将深入介绍三款备受瞩目的AI工具：Cursor、DeepSeek和Copilot。它们各有特色，适合不同场景。想知道它们之间有哪些区别？又该如何使用？一起往下看！一、什么是Cursor、DeepSeek和Copilot？1.CursorCursor是一款专为程序员打造的智能代码编辑工具，结合AI
JVM 常见知识点总结南波塞文 JVM 虚拟机 JVM
文章目录一、类加载篇1.1类加载过程1.2类加载器分类1.3双亲委派机制二、JVM内存结构篇2.1JVM内存结构2.2对象的创建过程2.3强软弱虚引用三、垃圾回收篇3.1如何判断对象是否死亡3.2哪些对象可以作为gcroots3.3垃圾回收算法3.4MinorGC和FullGC的区别3.5HotSpot为什么分为新生代和老年代3.6常见的垃圾收集器3.7详细介绍CMS垃圾回收器四、JVM调优篇4.
Llama3本地部署的解决方案 herosunly llama3 llama 本地部署 API 解决方案
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了Llama3本地部署的解决方案，希望对学习大语言模型的同学们有所帮助。文
探索Llama Recipes：Meta Llama模型的实用示例库郁英忆
探索LlamaRecipes：MetaLlama模型的实用示例库去发现同类优质开源项目:https://gitcode.com/在机器学习和自然语言处理的世界中，MetaLlama模型是一颗璀璨的新星，以其强大的对话理解和生成能力而受到广泛关注。现在，有了llama-recipes这个开源项目，开发者可以轻松上手并充分利用这些模型。本文将引导您了解这个项目，它的技术优势，适用场景以及鲜明特点。项目
ML.NET速览 aixing8475 人工智能操作系统 runtime
什么是ML.NET？ML.NET是由微软创建，为.NET开发者准备的开源机器学习框架。它是跨平台的，可以在macOS，Linux及Windows上运行。机器学习管道ML.NET通过管道(pipeline)方式组合机器学习过程。整个管道分为以下四个部分：LoadData加载数据TransformData转换数据ChooseAlgorithm选择算法TrainModel训练模型示例建立一个控制台项目。
JVM - 内存划分、类加载、GC 机制、常见参数、简单调优陈亦康面试总结 jvm 面试
目录前言一、JVM内存划分二、类加载2.1、类加载是在干什么？2.2、类加载的过程2.3、何时触发类加载？2.4、双亲委派模型（重点考察）2.4.1、什么是双亲委派模型？2.4.2、涉及到的类加载器2.4.3、详细过程图解三、GC（垃圾回收机制）3.1、STW问题（StopTheWorld）3.2、GC回收哪部分内存？3.3、垃圾对象的判定算法3.3.1、引用计数法（非JVM采取的办法）3.3.2
Streamlit，一个超强的 Python 应用开发库！一行玩python python 开发语言
大家好，我是“一行”。今天，我们要来聊一个非常酷的Python库——Streamlit。如果你有过构建Web应用的经验，或者你对快速搭建交互式应用感兴趣，那么Streamlit会是一个非常棒的工具。它可以让你用极少的代码，快速创建出功能强大且美观的Web应用。无论你是数据分析师、机器学习工程师，还是Python初学者，Streamlit都能帮你轻松实现数据可视化、模型展示等功能。今天我们就从基础开
数据结构——查找二叉树 xb1132 数据结构算法
二叉搜索树的概念如图所示，二叉搜索树（binarysearchtree）满足以下条件。对于根节点，左子树中所有节点的值num，说明目标节点在cur的左子树中，因此执行cur=cur.left。若cur.val=num，说明找到目标节点，跳出循环并返回该节点。二叉搜索树的查找操作与二分查找算法的工作原理一致，都是每轮排除一半情况。循环次数最多为二叉树的高度，当二叉树平衡时，使用O(log⁡n)时间。
JWT（3）JWT的签名算法 w_t_y_y 安全安全
在JWT（JSONWebToken）中，涉及到两种主要的算法类型：加密算法和签名算法。签名算法用于确保JWT数据的完整性和真实性，必须使用；而加密算法用于保护JWT内容的机密性，选择性使用。这里看下签名算法。一、介绍1、简介签名算法的主要目的是确保JWT的内容未被篡改，并验证其来源。签名算法用于生成一个数字签名，接收方使用相同的算法来验证签名，从而确认数据的完整性。2、jwt常见的签名算法不同的j
AI 驱动的创业产品设计趋势：大模型赋能下的创新 AI天才研究院【精选大厂面试题详解】大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
AI驱动的创业产品设计趋势：大模型赋能下的创新一、背景随着人工智能技术的飞速发展，特别是深度学习和大型语言模型（如GPT）的广泛应用，AI正在逐渐改变创业产品设计的游戏规则。大模型赋能下的创新成为许多创业公司脱颖而出的关键。本文将探讨以下几个方面的内容：AI驱动的创业产品设计趋势大模型在产品设计中的具体应用AI驱动创业产品的成功案例分析大模型赋能下的产品设计和开发挑战二、AI驱动的创业产品设计趋势
RAG理论到实践：高级、模块化RAG在AI工程架构中的行业通用解决方案与实施策略(Advanced RAG✨) 汀、人工智能 LLM工业级落地实践人工智能 AI Agent RAG 知识问答智能问答
RAG理论到实践：高级、模块化RAG在AI工程架构中的行业通用解决方案与实施策略(AdvancedRAG✨)1.RAG简介词汇解释说明embedding嵌入（embedding）是指将高维数据映射为低维表示的过程。在机器学习和自然语言处理中，嵌入通常用于将离散的符号或对象表示为连续的向量空间中的点。在自然语言处理中，词嵌入（wordembedding）是一种常见的技术，它将单词映射到实数向量，以便
2025 年，人工智能的发展还是「算力至上」吗？开心的AI频道人工智能
算力仍是基础，但不再是唯一关键，从算力至上到多维发展算力：不可或缺的基石从市场数据来看，全球智能算力需求呈现爆发式增长，预计到2025年市场规模将达103.4亿美元，年复合增长率高达17.7%。这一增长的背后，显示出AI应用从“小打小闹”走向真实落地。以大模型为例，训练一个模型需要调用约3万个AI芯片，这种规模的算力需求使得算力基础设施建设成为各国竞相布局的战略重点。工信部等六部门联合发布的《算力
Gary Marcus对2025年AI的25项预测：AGI的曙光仍未到来？ lilu8888888 人工智能 agi 百度前端
人工智能领域正经历着前所未有的快速发展，各种新技术层出不穷。然而，并非所有观点都对未来发展持乐观态度。著名人工智能专家GaryMarcus近期发布了他对2025年AI发展的25项预测，其中许多预测都对当前AI技术的局限性提出了警示。本文将深入探讨Marcus的预测，并结合实际案例进行分析，特别关注大型语言模型（LLM）的不足以及其对就业市场的影响。我们还会探讨一些优秀的AI写代码工具，例如Scri
golang工程组件篇轻量级认证机制jwt之HS、RS. ES、ED签名与验证 SMILY12138 golang 开发语言后端
JWT（JSONWebToken）是一种轻量级的认证机制，它可以用于身份验证和授权。在JWT中，令牌被加密并使用数字签名进行保护，以确保其完整性和安全性。在本文中，我们将介绍如何在Golang中使用HS、RS.ES、ED签名算法对JWT进行签名和验证。HS签名与验证HS（HMAC-SHA）是一种对称加密算法，它需要一个共享密钥来进行加解密操作。在JWT中，我们可以使用HS256、HS384和HS5
golang工程组件篇轻量级认证机制jwt之HS、RS. ES、ED签名密钥生成 SMILY12138 golang 开发语言后端
在使用JWT（JSONWebToken）进行身份验证时，我们需要使用签名算法对令牌进行加密。在JWT中，常用的签名算法有HS、RS、ES和ED等。本文将介绍这些签名算法的基本概念以及如何在Golang中生成相应的密钥。HS签名算法HS（HMAC-SHA）是一种对称加密算法，它需要一个共享密钥来进行加解密操作。在JWT中，我们可以使用HS256、HS384和HS512三种不同长度的哈希值作为加密算法
FPGA实现图像处理算法的创新点芯作者 DD：日记 1024程序员节硬件工程图像处理人工智能
以下是FPGA（现场可编程门阵列）实现图像处理算法的一些创新点：一、并行处理能力大规模并行运算创新点描述：FPGA具有丰富的逻辑资源，可以构建大量的并行处理单元。在图像处理算法中，许多操作（如滤波、边缘检测等）可以并行执行。例如，对于一个3×3的图像滤波操作，FPGA可以同时对图像中的多个像素点进行滤波计算，而不像传统的CPU那样需要顺序处理每个像素。这大大提高了处理速度，能够满足实时图像处理的需
学习 C++(1 月 21 日) 小鱼984 学习
一.时空复杂度（一）语句（基本单位）（二）语句执行次数（反映程序的运行时间）1.T(x,y,⋯)：语句数2.注意循环中语句的次数（三）时间复杂度（衡量程序效率/语句执行次数T的化简结果）1.T->O(f)化简规则：常数->1；各项系数化为1；只保留最高阶的项；logan应化为logn（即算法的运行时间与输入规模n的对数成正比）2.时间复杂度（最大时间复杂度）的分类（1）最大（坏）时间复杂度O(f)
广工Anyview离散数学第七章墨染夜雨笺离散数学算法广东工业大学离散数学学习
注：网络资源整理，并非本人代码，离散数学对初学者比较抽象，希望对你有所帮助。请注意对应题目，每年题目可能有小变动。目录试设计一算法，对某集合A上的一个二元关系R，判断R是否为等价关系试设计一算法，对某集合A上的一个二元关系R，求商集A/R试设计一算法，求某集合A上的模n同余关系试设计一算法，对某集合A上的一个二元关系R，判断R是否为偏序关系试设计一算法，对某集合A上的一个二元关系R，判断R是否为等
广工Anyview离散数学第八章墨染夜雨笺离散数学学习算法离散数学广东工业大学
注：网络资源整理，并非本人代码，离散数学对初学者比较抽象，希望对你有所帮助。请注意对应题目，每年题目可能有小变动。目录试设计一算法，对于一个从集合A到集合B的二元关系R，判断R是否为函数判断一个关系是否为函数，如果是函数，则是什么类型：单射、满射、双射、变换、非单射非满射。判断一个关系是否为函数，如果是函数并且该函数存在逆函数，则求出其逆函数试设计一算法，对于一个从集合A到集合B的二元关系R，判断
数据结构c语言版上海交通大学出版社项目三《稀疏矩阵相加》友人.227 数据结构 c语言开发语言
两个稀疏矩阵A和B采用十字链表方式存储，计算C=A+B，C也采用十字链表方式存储。根据矩阵相加的运算法则，若将矩阵B加到矩阵A上，对于A的十字链表来说，可能进行的操作有:①当aij与bij均不等于0，且aij+bij≠0时，改变结点的value值;②当aij≠0且bij=0时，value值不变;③当aij=0且bij≠0时，插入一个新结点;④当aij与bij均不等于0，且aij+bij=0时，删除
Python从0到100（六十一）：机器学习实战-实现客户细分是Dream呀 python 机器学习开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
代码随想录算法训练营第十五天| 二叉树3 Rachela_z 算法
110.平衡二叉树（优先掌握递归）再一次涉及到，什么是高度，什么是深度，可以巩固一下。题目链接/文章讲解/视频讲解：代码随想录状态：要辨别新增函数的位置，self的用法二叉树节点的深度：指从根节点到该节点的最长简单路径边的条数，从上往下数二叉树节点的高度：指从该节点到叶子节点的最长简单路径边的条数，从下往上数#Definitionforabinarytreenode.#classTreeNode:
【从零开始的LeetCode-算法】3285. 找到稳定山的下标九圣残炎 java 算法 leetcode
有n座山排成一列，每座山都有一个高度。给你一个整数数组height，其中height[i]表示第i座山的高度，再给你一个整数threshold。对于下标不为0的一座山，如果它左侧相邻的山的高度严格大于threshold，那么我们称它是稳定的。我们定义下标为0的山不是稳定的。请你返回一个数组，包含所有稳定山的下标，你可以以任意顺序返回下标数组。示例1：输入：height=[1,2,3,4,5],th
请问Python怎么安装vlfeat？ cda2024 python 开发语言
在当今数据驱动的时代，图像处理和计算机视觉成为了许多前沿应用的核心技术之一。作为一门强大的编程语言，Python在这些领域中扮演着极其重要的角色。而vlfeat是一个广泛使用的计算机视觉库，它提供了许多经典的计算机视觉算法实现，如SIFT、HOG等。本文将详细介绍如何在Python中安装和使用vlfeat，帮助你在项目中高效地集成这些强大的工具。什么是vlfeat？vlfeat是一个开源的计算机视
对于编程零基础，第一个语言是 Python 的人有什么建议？ cda2024 python 开发语言
在当今数字化时代，编程已成为一项必备技能。无论你是想成为一名专业的软件开发人员，还是希望在数据分析、人工智能等领域有所建树，掌握一门编程语言都是至关重要的第一步。对于许多初学者来说，Python是一个理想的选择。它不仅语法简洁易懂，而且拥有强大的社区支持和丰富的库资源。那么，对于编程零基础且选择Python作为第一门语言的人，有哪些实用的建议呢？1.建立正确的学习心态1.1持之以恒学习编程并不是一
【LeetCode刷题日记】常用算法基础和理解及运用_leecode刷题知识点讲解 2401_89791282 算法 leetcode 职场和发展
{根据迭代表达式，由旧值计算出新值；新值取代旧值，为下一次迭代做准备；}迭代的经典例子1.斐波那契数列（没错，又是我）2.汉诺塔问题（这不巧了么）3.背包问题有N件物品和一个容量为V的背包。第i件物品的重量是w[i]，价值是v[i]。求解将哪些物品装入背包可使这些物品的重量总和不超过背包容量，且价值总和最大。基本思路这是最基础的背包问题，特点是：每种物品仅有一件，可以选择放或不放。用子问题定义状态
数据结构——二叉树的最小深度算法 943802606 #数据结构数据结构二叉树 c语言
给定一个二叉树，找出其最小深度。最小深度是从根节点到最近叶子节点的最短路径上的节点数量。说明：叶子节点是指没有子节点的节点。输入：root=[3,9,20,null,null,15,7]输出：2示例2：输入：root=[2,null,3,null,4,null,5,null,6]输出：5提示：树中节点数的范围在[0,105]内-1000lchild不为空且T->rchild为空，返回左子树的高度+
深度优先搜索算法笔记骑狗看夕阳算法笔记深度优先笔记算法
深度优先搜索今天我们来讲解的是深度优先搜索，这是我们大家学习信息是必不可少也是最总要的一个算法，那么深度优先搜索这个算法究竟是干了什么呢？这很简单。本质搜索搜索，就在于这二字，也就是一个一个查找。不过深度优先搜索，其实就是在这棵搜索树中以深度为先，也就是所谓的不撞南墙不回头，就是说我们可以把它认为是走迷宫，如果到了终点就没有关系，不然就继续走，碰到弯道一直往右，碰到死胡同再绕出来。就是怎么简单。那
贪心算法笔记骑狗看夕阳算法笔记算法笔记
贪心算法笔记大概内容贪心就是对于一个问题有很多个步骤，我们在每一个步骤中都选取最优的那一个，最后得出答案。就是在一些函数中可行，但是有些比如二次函数，因为它的转折点不一定最优，就是不可行的。那么如何判断贪心呢？有这么几种看时间复杂度，一般的就是O(n)O(n)O(n)或者是排序O(nlogn)O(n\logn)O(nlogn)或者猜测，看着像就可以试试。自己用数学证明方法，比如归纳法，交换法，就是
gcd之和（一维）骑狗看夕阳算法 c++
gcd之和求∑i=1ngcd⁡(n,i)\sum_{i=1}^{n}\gcd(n,i)∑i=1ngcd(n,i)。那么我们这一道题讲得详细一点。因为这一道题目的n≤109n\leq10^9n≤109。这也就导致了一些算法是过不了的，那么我们就先从最简单的讲起：对每一项来一遍gcd⁡\gcdgcd，然后gcd⁡\gcdgcd我们也使用最简单的哪一种去做，也就是从小到大跑，时间复杂度O(n2)O(n^
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option

【人工智能】传统机器学习算法（QDU）

线性分类器

分类器与准则

引入：K-邻近算法的局限性

Fisher准则

基本思想

判别函数

准则函数

获取投影方向 W W W

获取阈值 w 0 w_0 w0​

感知器算法

基本思想

判别函数

准则函数

样本的规范化

感知器准则函数

感知器准则函数求解

计算题

多类问题

第一种情况：绝对可分

第二种情况：成对可分

第三种情况：最大值判决

利用感知准则实现多类判别

REF

你可能感兴趣的:(【人工智能】,机器学习,人工智能,算法)

获取投影方向 $W$

获取阈值 $w_0$