FlyerZheng

机器学习基础（一）——线性代数

学习机器学习，借此文章回顾线性代数知识。

出处：http://blog.csdn.net/han_xiaoyang/article/details/51629242

1基本概念和符号

线性代数可以对一组线性方程进行简洁地表示和运算。例如，对于这个方程组:

这里有两个方程和两个变量，如果你学过高中代数的话，你肯定知道，可以为x1 和x2找到一组唯一的解 (除非方程可以进一步简化，例如，如果第二个方程只是第一个方程的倍数形式。但是显然上面的例子不可简化，是有唯一解的)。在矩阵表达中，我们可以简洁的写作:

其中：

很快我们将会看到，咱们把方程表示成这种形式，在分析线性方程方面有很多优势(包括明显地节省空间)。

1.1基本符号

以下是我们要使用符号:

符号A ∈ Rm×n表示一个m行n列的矩阵，并且矩阵A中的所有元素都是实数。
符号x ∈ Rn表示一个含有n个元素的向量。通常，我们把n维向量看成是一个n行1列矩阵，即列向量。如果我们想表示一个行向量（1行n列矩阵），我们通常写作xT (xT表示x的转置，后面会解释它的定义)。
一个向量x的第i个元素表示为xi：

我们用aij (或Aij，Ai，j，等) 表示第i行第j列的元素：

我们用aj 或A:，j表示A矩阵的第j列元素：

我们用aT i或 Ai，:表示矩阵的第i行元素:
请注意，这些定义都是不严格的（例如，a1和a1T在前面的定义中是两个不同向量）。通常使用中，符号的含义应该是可以明显看出来的。

2 矩阵乘法

矩阵 A ∈ Rm×n 和B ∈ Rn×p 的乘积为矩阵：

其中：

请注意，矩阵A的列数应该与矩阵B的行数相等，这样才存在矩阵的乘积。有很多种方式可以帮助我们理解矩阵乘法，这里我们将通过一些例子开始学习。

2.1向量的乘积

给定两个向量x，y ∈ Rn，那么xT y的值，我们称之为向量的内积或点积。它是一个由下式得到的实数：

可以发现，内积实际上是矩阵乘法的一个特例。通常情况下xT y = yT x。

对于向量x ∈ Rm， y ∈ Rn（大小不必相同），xyT ∈ Rm×n称为向量的外积。外积是一个矩阵，其中中的每个元素，都可以由得到，也就是说，

我们举个例子说明外积有什么用。令1 ∈ Rn 表示所有元素都是1的n维向量，然后将矩阵 A ∈ Rm×n 的每一列都用列向量x ∈ Rm表示。使用外积，我们可以将A简洁的表示为：

2.2矩阵-向量的乘积

对于一个矩阵A ∈ Rm×n 和向量x ∈ Rn，他们的乘积为向量 y = Ax ∈ Rm。理解矩阵向量乘法的方式有很多种，我们一起来逐一看看。

以行的形式书写A，我们可以将其表示为Ax的形式：

也就是说，y第i行的元素等于A的第i行与x的内积 .

咱们换个角度，以列的形式表示A，我们可以看到：

换言之，y是A列的线性组合，线性组合的系数就是x的元素。

上面我们看到的是右乘一个列向量，那左乘一个行向量嘞？对于A ∈ Rm×n，x ∈ Rm， y ∈ Rn，这个式子可以写成yT = xT A 。向之前那样，我们有两种方式表达yT，这取决于表达A的方式是行还是列。第一种情况是把A以列的形式表示：

这个式子说明yT 第i列的元素等于向量x与A的第i列的内积。

我们也一样可以把A表示成行的形式，来说明向量-矩阵乘积。

我们可以看到yT 是A的行的线性组合，线性组合的系数是x的元素。

2.3矩阵-矩阵乘积

基于以上知识，我们可以看到如之前所定义的矩阵-矩阵乘法C=AB有四种不同（但是等价）的理解方法。

首先，我们可以将矩阵-矩阵相乘看作一组向量-向量乘积。根据其概念，我们最好理解的方式是矩阵C的(i，j)元素是A的i行与B的 j列的内积。符号表达如下：

注意由于A ∈ Rm×n ， B ∈ Rn×p， ai ∈ Rn bj ∈ Rn，所以内积永远有意义。对矩阵乘法而言，以A的行和B的列表示是最"自然"的表示方法。当然，我们也可以以A的列和B的行的形式进行表示。表达方法是AB外积累加的形式，稍微复杂一点点。符号表达为：

换一种方式表达，AB的值等于对于所有的i，A的i列与B的i行的外积的和。因此，对于ai ∈ Rm 和 bi ∈ Rp，外积aibiT的维度是m×p，它与C的维度是相同的。等式可能有点难理解，花点时间想想，我猜你肯定能明白。

第二种理解方式是，我们也可将向量-向量乘法看做一系列的矩阵-向量乘积。具体来说，如果我们将B以列的形式表示，我们可以将C的每一列看做A和B列的矩阵-向量乘积。符号表达为：

可以将C的i列以矩阵-向量乘积（向量在右）的方式表示为ci = Abi. 这些矩阵-向量乘积可以用前面的两种观点解释。最后类比一下，我们以A的行形式表示，将C的行视为A的行与C的矩阵-向量乘积，符号表达为

在此，我们以矩阵-向量乘积（向量左乘）的形式表示了C的i列，

只是一个矩阵乘法而已，这么细的分析看上去好像没有必要，尤其是当我们知道矩阵乘法定义后其实很容易可以计算得到结果。然而，几乎所有的线性代数内容都在处理某种类型的矩阵乘法，因此花一些时间去形成对这些结论的直观认识还是很有帮助的。

此外，知道一些更高层次的矩阵乘法的基本性质也是有好处的：

结合律即(AB)C = A(BC)
分配率即A(B + C) = AB + AC
注意哦，矩阵乘法没有交换律，即AB ≠BA.（例如，如果A ∈ Rm×n 和B ∈ Rn×q，矩阵的乘积BA在m和q不等时，BA可能根本就不存在）

如果你对这些性质不熟悉，最好花些时间自己证明一下。例如，为了验证矩阵乘法的结合律，对于A ∈ Rm×n， B ∈ Rn×p，C ∈ Rp×q，注意AB ∈ Rm×p，而 (AB)C ∈ Rm×q。类似的有BC ∈ Rn×q，所以A(BC) ∈ Rm×q。因此可以得到维度相同的矩阵。为了说明矩阵乘法符合结合律，证明(AB)C 第(i,j)个元素是否与A(BC)的(i,j)个元素相等就够了。我们可以直接运用矩阵乘法的定义进行证明。

上面的推导过程中，第一个和最后两个等式使用矩阵乘法的定义，第三和第五的等式使用标量乘法的分配率，第四个等式使用了标量加法的交换律和结合律。这种将运算简化成标量的特性以证明矩阵性质的方法会经常出现，你可以熟悉熟悉它们。

3 运算和性质

在这一节中，我们将介绍几种矩阵/向量的运算和性质。很希望这些内容可以帮助你回顾以前知识，这些笔记仅仅是作为上述问题的一个参考。

3.1 单位矩阵与对角矩阵

单位矩阵，记作I ∈ Rn×n，是一个方阵，其对角线上的都是1，其他元素都是0。即：

它具备A ∈ Rm×n矩阵的所有性质

请注意，在某种意义上，标识矩阵的符号是有歧义的，因为它没有指定I的维度。一般而言，从上下文中可以推断出I的维度，这个维度使矩阵相乘成为可能。例如，在上面的等式AI = A中的I是n × n矩阵，而A = IA中 I是m × m矩阵。

对角矩阵除了对角线元素之外其他元素都是0。可以记作D = diag(d1，d2，...，dn)，其中：

显然，I = diag(1，1，...，1).

3.2转置

矩阵的转置的是矩阵行和列的"翻转"。对于一个矩阵A ∈ Rm×n，，它的转置，AT ∈ Rn×m，是一个n × m 的矩阵，其元素为

我们实际上已经使用转置当描述行向量的转置，因为一个列向量的转置，自然是一个行向量。

下面是一些关于转置的性质，证明起来也不太难：

(AT )T = A
(AB)T = BT AT
(A + B)T = AT + BT

3.3对称矩阵

如果一个方阵A∈ Rn×n满足条件A = AT，那么它就是对称的。如果满足A = −AT则A是反对称的。很容易证明，任何矩阵A ∈ Rn×n，A + AT 是对称的，而 A−AT是反对称的。因此，任何方阵A ∈ Rn×n可以表示为一个对称矩阵和反对称矩阵的和，因为:

右边的第一个矩阵是对称的，第二个是反对称的。在实践中，对称矩阵是很常用的，他们有诸多优秀的性质，我们将在以后进行说明。我们通常将所有大小为n的对称矩阵的集合表示为Sn；A ∈ Sn则表示A是n × n的对称矩阵。

3.4矩阵的迹

方阵A ∈ Rn×n的迹，记作tr(A)，或可以省略括号表示成trA，是矩阵的对角线元素之和:

正如cs229讲义中所述，矩阵的迹具有以下性质（在此讲述完全是为了内容的完整性）：

对于A ∈ Rn×n， trA = trAT .
对于A，B ∈ Rn×n， tr(A + B) = trA + trB.
对于A ∈ Rn×n， t ∈ R， tr(tA) = t trA.
对于方阵A,B,C，trABC = trBCA = trCAB，即使有更多的矩阵相乘，这个性质也不变.

前三个性质比较容易证明，咱们一起来看看第4个性质。假设A ∈ Rm×n ，B ∈ Rn×m (因此AB ∈ Rm×m是个方阵)。观察到BA ∈ Rn×n也是一个方阵，所以他的迹是有意义的。为了证明trAB = trBA，注意到：

在这里，第一个和最后两个等式使用了迹运算和矩阵乘法的定义。第四个等式是最重要的部分，它使用了标量乘法的交换性来交换每个乘积中因式顺序，也使用了标量加法的交换律和结合律将求和过程重新排序。

3.5范数

向量的范数是向量"长度"的非正式度量。例如，我们常用的欧氏或ℓ2范数。

注意 .

更正式的来讲，范数是满足以下4个特性的任何一个方程f : Rn → R:

对于任意x ∈ Rn， f(x) ≥ 0 (非负性).
当且仅当x = 0 时，f(x) = 0(确定性).
对于任意x ∈ Rn，t∈ R，f(tx) = |t|f(x) (均匀性).
对于任意 x，y∈Rn，f(x + y)≤f(x) + f(y) (三角不等性).

另一个范数的例子是ℓ1范数，

以及ℓ∞范数，

事实上，这三个范数都是ℓP范数家族的的例子，它包含一个实参数p≥1。ℓP范数定义为：

也可以定义矩阵A的范数，如Frobenius范数，

也存在许多其他的范数，但它们超出了这篇综述讨论的范围。

3.6线性无关和秩

对于一组向量{x1，x2，...xn} ∈ Rm，如果没有向量可以表示为其余向量的线性组合，这组向量就是（线性）无关的。相反，如果一个向量属于一个集合，这个集合中的向量可以表示为其余的向量某个线性组合，那么就称其称为向量（线性）相关。也就是说，对于一些标量值α1，...，αn−1 ∈ R，如果

我们说向量x1，...，xn是线性相关；否则，该向量线性无关。例如，向量

是线性相关的，因为x3 = −2x1 + x2.

矩阵A ∈ Rm×n的列秩是所有线性独立的列的最大子集的大小。由于某些术语的滥用，列秩通常指矩阵A线性无关的列的数目。相似的，将A的行构成一个线性无关集，行秩是它行数的最大值。

对任意矩阵A ∈ Rm×n，其列秩与行秩是相等的（虽然我们不打算证明），所以我们将两个相等的秩统称为A的的秩。秩的一些基本性质如下：

对于 A ∈ Rm×n， rank(A) ≤ min(m，n). 如果rank(A) = min(m，n)，则称A满秩。
对于 A ∈ Rm×n， rank(A) = rank(AT ).
对于 A ∈ Rm×n， B ∈ Rn×p， rank(AB) ≤ min(rank(A)，rank(B)).
对于 A，B ∈ Rm×n， rank(A + B) ≤ rank(A) + rank(B).

3.7逆

矩阵A ∈ Rn×n的逆，写作A−1，是一个矩阵，并且是唯一的。

A−1A = I = AA−1.

注意不是所有的矩阵都有逆。例如非方阵，是没有逆的。然而，即便对于一些方阵，它仍有可能不存在逆。如果A−1存在，我们称矩阵A 是可逆的或非奇异的，如果不存在，则称矩阵A不可逆或奇异。

如果一个方阵A有逆A−1，它必须满秩。我们很快可以看到，除了满秩，矩阵可逆还有许多充分必要条件。

满足以下的性质的矩阵可逆；以下所有叙述都假设A，B ∈ Rn×n是非奇异的：

(A−1)−1 = A
(AB)−1 = B−1A−1
(A−1)T = (AT )−1. 因此这样的矩阵经常写作A−T

举一个矩阵的逆的应用实例。对于线性方程组Ax = b，其中 A ∈ Rn×n，并且x，b ∈ Rn.如果A是非奇异（即可逆），则x = A−1b（如果A ∈ Rm×n不是方阵呢？是否成立？）

3.8 正交矩阵

如果xT y = 0，则两个向量 x，y ∈ Rn是正交的。对于一个向量x ∈ Rn，如果则是x归一化的。对于一个方阵U ∈ Rn×n，如果所有列都是彼此正交和归一化的，（列就称为标准正交）则这个方阵是正交的（注意在讨论向量或矩阵时，正交具有不同的含义）。

根据正交和归一化的定义可得：

UT U = I = UUT

换言之，一个正交矩阵的逆矩阵的是它的转置。注意，如果U不是方阵的，也就是说， U ∈ Rm×n，n < m，但它的列仍然是正交的，则UT U = I，但UUT ≠ I.等。我们一般只使用正交这个术语来描述U为方阵的情形。

另一个正交矩阵的很好的属性是，向量与正交矩阵的运算将不会改变其欧氏范数，即对于任意x ∈ Rn，正交的U ∈ Rn×n：

3.9矩阵的值域和零空间

一组向量{x1，x2，...xn}的值域是{x1，x2，...xn}线性组合的所有向量的集合。即

可以看出如{x1，...，xn}是一组n个线性无关的向量，其中xi ∈ Rn，则({x1，...xn}) 的值域= Rn。换句话说，任何向量v ∈ Rn可以写成x1 至 xn的线性组合。向量y ∈ Rm 在值域 {x1，...，xn}上的投影 (假定 xi ∈ Rm) 是向量v ∈ span({x1，...xn})，则通过比较其欧式范数，v 与 y无限接近。这个投影记作Proj（Y；{ x1，…，n}）,可以定义它为，

A ∈ Rm×n的值域（有时也被称为列空间），表示为R(A)，就是A的值域。换言之，

R(A) = {v ∈ Rm : v = Ax，x ∈ Rn}.

我们假设A满秩且n < m，向量y ∈ Rm 在A值域上面的投影可以表示为

这最后一个方程应该看起来非常熟悉，因为它几乎是我们在课上用于参数的最小二乘估计公式（并且我们可以快速再次推导出来）几乎相同的。看一下投影的定义，你会发现这其实与我们在解决最小二乘法问题时进行最小化的目的是相同的（除了范数是一个平方，这并不影响求得最优的点），所以这些问题是有自然联系的。当 A 仅含有1个单独的列 a ∈ Rm，则出现了向量在一条直线上投影的特殊情况。

矩阵A ∈ Rm×n的零空间，记为N(A)，是被A乘后，得到的所有等于0的向量一个集合，即，

N(A) = {x ∈ Rn : Ax = 0}.

注意，向量R(A)的大小为m，而N(A)的大小为n，所以 R(AT ) 和 N(A) 的向量都在 Rn中。事实上，我们可以讨论更多。

换句话说，R(AT ) 和 N(A)是不相交的子集，一同跨越了Rn整个空间。这种类型的集合称为正交互补，写作R(AT ) = N(A)⊥.

3.10 行列式

方阵A∈Rn×n的行列式是一个映射det: Rn×n→R,记作|A|或det A (同迹运算一样，我们通常省略括号)。在代数上,可以显式地写出A的行列式的公式，但是很遗憾，它的意义不够直观。咱们先给出行列式的几何解释，然后再探讨一下它的一些特殊的代数性质。

对于矩阵：

考虑由A中所有行向量a1,a2,..,an的所有可能线性组合组成的点集S⊂Rn，其中线性组合的参数都介于0和1之间；换句话说，由于这些线性组合的参数a1,a2,...,an∈Rn满足0≦ai≦1,i=1,...,n，集合S是张成子空间({a1, . . , an})的约束。公式表达如下：

A的行列式的绝对值，是集合S的"体积"的一个量度。

例如，考虑2×2矩阵，

此处，矩阵的行：

对应于这些行的集合S如图1所示。对于二维矩阵，S一般是平行四边形。在我们的示例中A的行列式的值为|A| = -7.(可以使用本节后文将给出的公式来计算)。所以平行四边形的面积为7（自行证明！）

在三维中，集合S对应一个平行六面体（一个三维的斜面的盒子，例如每一面都是平行四边形）。这个3×3矩阵的行列式的绝对值，就是这个平行六面体的三维体积。在更高的维数中，集合S是一个n维超平形体。

图 1 ：公式(1)给出2×2矩阵A的行列式图示。此处，a1和a2是对应于A中的行的向量，集合S对应于阴影区域（亦即平行四边形）。行列式的绝对值，|det A|=7，是平行四边形的面积

代数上，行列式满足下列三个性质（其它性质亦遵循它，包括行列式的一般公式）

1、单位矩阵的行列式为1 ，|I| = 1。(从几何上来看，单位超立方体的体积为1)。

2、对于一个矩阵A∈Rn×n，如果将A中某行乘以一个标量t∈R，新矩阵的行列式值为t|A|。

(几何上，集合S的一条边乘以因数t，会导致体积扩大t倍)

3、我们交换行列式A任意两行aTi和aTj，新矩阵的行列式的值为-|A|,例如：



满足上述三个条件的函数是否存在，并不是那么容易看出来的。然而事实上，此函数存在且唯一。(此处不证明)

这三个性质的推论包括：

对于 A ∈ Rn×n, |A| = |AT |。
对于 A,B ∈ Rn×n, |AB| = |A||B|。
对于 A ∈ Rn×n,当且仅当A奇异(即不可逆)时，|A| = 0。（如果A奇异，它必不满秩，它的列线性相关。此时，集合S对应于n维空间中的一个平板，因此体积为零。）
对于A ∈ Rn×n，且A非奇异, |A-1| = 1/|A|.

在给出行列式的一般定义之前,我们定义代数余子式：对于A∈ Rn×n，矩阵A\i,\j ∈R(n-1)×(n-1)是A删除i行和j列的结果。

行列式的一般（递推）定义：

其中首项A∈ R1×1的行列式，|A| = a11。如果我们把公式推广到A∈ Rn×n，会有n！（n的阶乘）个不同的项。因此，我们很难显式地写出3阶以上的矩阵的行列式的计算等式。

然而，3阶以内的矩阵的行列式十分常用，大家最好把它们记住。

矩阵A∈ Rn×n的古典伴随矩阵（通常简称为伴随矩阵），记作adj(A),定义为：

（注意A的系数的正负变化。）可以证明，对于任意非奇异矩阵A∈ Rn×n，有

这个式子是求矩阵的逆的一个很好的显示公式。大家要记住，这是一个计算矩阵的逆的一个更加高效的方法。

3.11 二次型和半正定矩阵

对于一个方阵A∈ Rn×n和一个向量x∈ Rn，标量xTAx被称作一个二次型。显式地写出来，我们可以看到：

注意：

第一个等式是由标量的转置等于它自身得到，第二个等式是由两个相等的量的平均值相等得到。由此，我们可以推断，只有对称分量对二次型有影响。我们通常约定俗成地假设二次型中出现的矩阵是对称矩阵。

我们给出如下定义：

• 对于任一非零向量x∈Rn，如果xTAx>0，那么这个对称矩阵A∈Sn是正定（PD）的.通常记作A≻0，(或简单地A>0)，所有的正定矩阵集合记作Sn++。

• 对于任一非零向量x∈Rn，如果xTAx≧0，那么这个对称矩阵A∈Sn是半正定（PSD）的。记作A≽0，(或简单地A≧0)，所有的半正定矩阵集合记作Sn+ 。

• 同样的，对于任一非零向量x∈Rn，如果xTAx＜0,那么这个对称矩阵A∈Sn是负定(ND)的。记作A≺0，(或简单地A＜0)。

•对于任一非零向量x∈Rn，如果xTAx≤0,那么这个对称矩阵A∈Sn是半负定（NSD）的.记作A≼0，(或简单地A≤0)。

•最后，如果它既不是半正定也不是半负定-亦即，存在x1，x2∈Rn使得x1TAx1>0且x2TAx2<0，那么对称矩阵A∈Sn是不定矩阵。

显然，如果A是正定的，那么-A是负定的，反之亦然。同样的，如果A是半正定的，那么-A是半负定的，反之亦然。如果A是不定的，-A也是不定矩阵。

正定矩阵和负定矩阵的一个重要性质是，它们一定是满秩的。因此，也是可逆的。为了证明这个性质，假设存在矩阵A∈ Rn×n是不满秩的。进而，假设A的第j列可以其它n-1列线性表示。

对于x1,...,xj−1, xj+1,...,xn ∈R,设xj=-1，我们有

但是这意味着对于某些非零向量x，xTAx=0，所以A既不能正定，也不能负定。因此，如果A是正定或者负定，它一定是满秩的。

最后，一种常见的正定矩阵需要注意：给定一个矩阵A ∈Rm×n (不一定是对称，甚至不一定是方阵)，矩阵G=ATA(有时也称为格拉姆矩阵)必然是半正定的。进一步，如果m≥n,(为了方便，我们假设A满秩)此时，G=ATA是正定的。

3.12特征值和特征向量

对于一个方阵A ∈Rn×n，如果：

我们说λ∈C是A的特征值，x∈Cn是对应的特征向量.

直观上看，其实上面的式子说的就是A乘一个向量x，得到的新的向量指向和x相同的方向，但是须乘一个标量λ。注意对任一个特征向量x∈Cn和标量t∈C，A(cx) = cAx = cλx = λ(cx),，所以cx也是一个特征向量。因此，我们要说λ所对应的特征向量。我们通常假设特征向量被标准化为长度1。(此时依然有歧义，因为x和-x都可以是特征向量，但是我们也没什么办法)。

如果

我们可以把上文的等式换一种写法，表明(λ,x)是A的一个特征值-特征向量对。

但是当且仅当有非空零空间时，也就是当(λI − A)非奇异时，亦即

时，(λI − A)x = 0有x的非零解。

我们现在可以用前文的行列式的定义，来把这个表达式展开为一个(非常大的) λ的多项式，其中λ的最高阶为n。我们可以解出多项式的n个根(这可能十分复杂)，来得到n个特征值λ1, ...，λn。为了解出特征值对应的特征向量，我们可以简单地求线性等式(λiI − A)x = 0的解。需要注意，实际操作时，计算特征值和特征向量不用这个方法。(行列式的完全展开式有n!项）。这只是一个数学论证。

下面是特征值和特征向量的性质（假设A∈ Rn×n，且特征值λ1,...，λn对应的特征向量为x1,...，xn）:

矩阵A的迹等于特征值的和

A的行列式等于特征值的积

A的秩等于A的非零特征值的个数。
如果A是非奇异矩阵，则1/λi是矩阵A-1对应于特征向量xi的特征值。亦即，A−1xi = (1/λi)xi。（证明方法是，对于特征向量等式，Axi = λixi，在两边同时左乘A-1）
对角矩阵D=diag(d1, . . . ，dn)的特征值是所有的对角元素。

我们可以把所有的特征向量等式联立为

X ∈Rn×n 的列是A的特征向量，∧是对角元素为A的特征值的对角矩阵。亦即：

如果A的特征向量线性无关，则矩阵X可逆，所以A=X∧X-1。可以写成这个形式的矩阵A被称作可对角化。

3.13 对称矩阵的特征值和特征向量

当我们考察对称矩阵A∈Sn的特征值和特征向量时，有两个特别的性质需要注意。首先，可以证明，A的所有特征值都是实数。其次，A的所有特征向量时正交的。也就是说，上面所定义的矩阵X是正交矩阵。（我们把此时的特征向量矩阵记作U）。

接下来，我们可以将A表示为A=U∧UT，由上文知，一个正交矩阵的逆等于它的转置。

由此，我们可以得到所有完全使用特征值来定义的矩阵。假设A∈Sn= U∧UT。有：

其中，y=UTx（由于U满秩，任意y∈Rn可以表示为此形式。）由于yi2永远为正，这个表达式完全依赖于λi。如果所有的λi>0,那么矩阵正定；如果所有的λi≥0，矩阵半正定。同样的，如果所有的λi<0或λi≤0，矩阵A分别负定和半负定。最后，如果A既有正的特征值又有负的特征值，它是不定矩阵。

特征值和特征向量的一个常见的应用是找出矩阵的某个函数的最大值。例如，对于矩阵A∈Sn,考虑这个求最大值问题：

也就是说，我们希望找到使二次型最大的单位向量。假设特征值大小为λ1 ≥ λ2 ≥ . . . ≥ λn，这个最优化问题的最优解x为x1，对应的特征值为λ1.此时，二次型的最大值是λ1。相似的，最小值问题的最优解

是xn，对应的特征值是λn，那么最小值是λn。可以通过将A表示为特征向量-特征值的形式，然后使用正定矩阵的性质证明。然而，在下一节我们可以使用矩阵微积分直接证明它。

4矩阵微积分

之前章节的内容，在一般线性代数的课程中都会讲到。而有些常用的内容是没有的，这就是把微积分推广到向量。事实上，我们应用的微积分都会比较繁琐，各种符号总是让问题变得更复杂。在本节中，将给出一些矩阵微积分的基本定义，并举例说明。

4.1梯度

设ƒ:Rm×n→R是大小为m×n的矩阵A的函数，且返回值为实数。ƒ的梯度（关于A∈Rm×n）是一个偏导矩阵，定义如下：

即,一个m×n矩阵，其中

注意∇Af(A)和A有相同的大小。所以，特别的，当A是一个向量x∈Rn时，

需要特别记住的是，函数的梯度只在函数值为实数的时候有定义。也就是说，函数一定要返回一个标量。例如，我们就不能对Ax，A∈Rn×n中的x求梯度，因为它是一个向量。

它遵循和偏导相同的性质：

原则上，梯度是多变量函数偏导的延伸。然而，实际应用梯度时，会因为数学符号而变得棘手。例如，假设A∈Rm×n是一个具有固定系数的矩阵，b∈Rm是一个固定系数的向量。令ƒ ：Rm→R为由ƒ(z)=zTz，因此∇zf(z) =2z。现在，考虑表达式;

∇f(Ax)

上式该如何理解？至少有两种解释：

解释一，因∇f(Ax). = 2z,所以可将∇f(Ax).理解为点Ax处的梯度，那么：

∇f(Ax) = 2(Ax) = 2Ax ∈ Rm

解释二，可以认为f(Ax)是关于变量x的函数。正式的表述为，令g(x) = f(Ax)。那么在此种解释下有：

∇f(Ax) = ∇xg(x) ∈ Rn

大家可以发现，这两种解释确实不同。解释一得出的结果是m维向量，而解释二得出n维向量！怎么办？

这里的关键是确定对那个变量求微分。在第一种情况下，是让函数f对参数z求微分，然后代入参数Ax。第二种情况，是让复合函数g（x）= F（AX）与直接对x求微分。第一种情况记为∇zf（AX），第二种情况记为∇xf（AX）。你会在作业中发现，理清数学符号是非常重要的。

4.2Hessian矩阵

假设 ƒ ：Rn→R 是n维向量A的的函数，并返回一个实数。那么x的Hessian矩阵是偏导数的n×n矩阵，写作∇2xf（x），简记为H。

换句话说，∇2xf(x) ∈ Rn×n ，其中：

需要注意的是Hessian矩阵始终是对称的，即：

和梯度类似，Hessian矩阵只在f(x)为实数时有定义。

可以很自然联想到，偏导类似于函数的一阶导数，而Hessian类似函数的的二阶导数（我们使用的符号，也表明了这种联系）。通常这种直觉是正确的，但有些注意事项需要牢记。

首先，只有一个变量的实值函数，f : R→R，它的基本定义是二阶导数是一阶导数的导数，即：

然而，对于关于向量的函数，该函数的梯度是一个向量，我们不能取向量的梯度，即;

并且这个表达式没有定义。因此，不能说Hessian矩阵是梯度的梯度。然而，在下面的意义上比较靠谱：如果我们取第i项（∇xf（X））i =∂F（X）/∂xi，并取对x的梯度，我们得到：

这是Hessian矩阵的第i列（或行）。因此：

如果此处稍粗略一点，可以得出，只要将其真实的含义理解为对 (∇xf(x))的每一项求梯度，而不是对向量求梯度即可。

最后注意，虽然可求出对矩阵A∈Rn的梯度，但在本课程中，将只考虑向量x∈Rn的Hessian矩阵。这仅仅是为了方便起见（而事实上，没有计算需要求矩阵的Hessian矩阵），因为矩阵的Hessian矩阵必须表示为所有的偏导数∂2f（A）/（∂Aij∂Akℓ），而要表示为矩阵却相当麻烦。

4.3 二次函数或线性函数的梯度和Hessian矩阵

现在，让我们确定一些简单函数的梯度和Hessian矩阵。应当指出的是，这里给出的所有的梯度都是在CS229讲义给出的特殊情况。

当x∈Rn，对于已知向量b∈Rn，令f（X）= bT x。得：

因此

由此不难看出，∇xbT x= b。这是与单变量微积分类似的情况，其中，∂/（∂x）aX =a。

现在考虑二次函数f（x）= xTAx ,A∈Sn。注意到：

求其偏导数，分别考虑包含Xk和xk2因子的项：

其中最后一个等式是因为A是对称的（完全可以假设，因为它是二次型）。注意，∇xf（x）的第k项只是A的第k行和x的内积。因此，∇xxTAx=2AX。同样，与单变量微积分类似，即∂/（∂x） ax2= 2aX。

最后，再看二次函数f（X）= xTAx的Hessian矩阵（显然，线性函数bT x的Hessian矩阵为零）。在这种情况下，

因此，应当清楚的是∇x2xTAx=2A，这完全是可证明的（并再次类似于单变量的情况∂2/(∂x2) ax2 = 2a）。

总之：

∇xbT x = b

∇xxTAx = 2Ax ( A 为对称矩阵)

∇x2xTAx = 2A ( A 为对称矩阵)

4.4最小二乘法

这里将用最后一节得到的公式推导最小二乘方程。假设对矩阵A∈Rm×n（为简单起见，假定A是满秩）和向量b∈Rm ，使得b错误!未找到引用源。R（A）。在这种情况下，无法找到一个向量x∈Rn，使得Ax = b。退一步，我们找一个向量x∈Rn，使得Ax是尽可能接近b，即欧氏范数||Ax - b||22。

且知||x||22=xTx，有：

取对已有x的梯度，并使用上一节推出的性质

让最后一个表达式等于零，并求解X满足的标准方程

这正和我们课上推导的一样。

4.5行列式的梯度

现在考虑一种情况，求函数对矩阵的梯度，即对A∈Rn×n，求∇A| A |。回顾之前关于行列式的讨论：

因此：

根据伴随矩阵的性质，可立即得出：

现在，考虑函数f : Sn ++ → R, f(A) = log |A|，需要注意的是，一定要限制f的域是正定矩阵，因为这将确保| A | >0，这样log| A |是一个实数。在这种情况下，我们可以使用链式法则（很简单，只是单变量微积分的普通链式法则）得出：

那么，很显然：

此处，在最后一个表达式中去掉了转置符，因为A是对称的。注意当∂/(∂x) log x = 1/x时,和单值情况相似。

4.6最优化特征值

最后，通过直接分析特征值/特征向量，用矩阵微积分来解决一个优化问题。接下来，考虑等式约束优化问题：

对于一个对称矩阵A ∈ Sn，解决等式约束优化问题的标准方法是构造拉格朗日（一个包括等式约束的目标函数）。这种情况下的拉格朗日可由下式给出：

其中λ被称为与等式约束对应的拉格朗日乘子。对这问题可以找到一个x*的最佳点，让拉格朗日的梯度在x*上为零（这不是唯一的条件，但它是必需的）。即：

注意，这其实是线性方程组Ax =λx。这表明，假设xT x = 1，使xT Ax最大化或（或最小化）的唯一的点正是A的特征向量。

你可能感兴趣的:(机器学习笔记)

【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
【机器学习笔记Ⅰ】10 特征工程
特征工程（FeatureEngineering）详解特征工程是机器学习和数据科学中的核心环节，旨在通过对原始数据的转换、组合和提取，构建更适合模型的高质量特征。其质量直接决定模型性能上限（“数据和特征决定了模型的上限，而算法只是逼近这个上限”）。1.特征工程的核心目标提升模型性能：增强特征与目标变量的相关性。降低计算成本：减少冗余特征，加速训练。改善泛化能力：避免过拟合，提高鲁棒性。2.特征工程的
机器学习知识点复习上（保研、复试、面试）百面机器学习笔记
机器学习知识点复习上一、特征工程1.为什么需要对数值类型的特征做归一化？2.文本表示模型3.图像数据不足的处理方法二、模型评估1.常见的评估指标2.ROC曲线3.为什么在一些场景中要使用余弦相似度而不是欧氏距离？4.过拟合和欠拟合三、经典算法1.支持向量机SVM2.逻辑回归3.决策树四、降维1.主成分分析（PrinalComponentsAnalysis,PCA）降维中最经典的方法2.线性判别分析
【机器学习笔记 Ⅱ】9 模型评估巴伦是只猫机器学习机器学习笔记人工智能
评估机器学习模型是确保其在实际应用中有效性和可靠性的关键步骤。以下是系统化的评估方法，涵盖分类、回归、聚类等任务的评估指标和技术：一、分类模型评估1.基础指标2.高级指标ROC-AUC：通过绘制真正例率（TPR）vs假正例率（FPR）曲线下面积评估模型整体性能。AUC=1：完美分类；AUC=0.5：随机猜测。适用于二分类及多分类（OvR或OvO策略）。混淆矩阵：可视化模型在各类别上的具体错误（如将
【机器学习笔记 Ⅱ】7 多类分类巴伦是只猫机器学习机器学习笔记分类
1.多类分类（Multi-classClassification）定义多类分类是指目标变量（标签）有超过两个类别的分类任务。例如：手写数字识别：10个类别（0~9）。图像分类：区分猫、狗、鸟等。新闻主题分类：政治、经济、体育等。特点互斥性：每个样本仅属于一个类别（区别于多标签分类）。输出要求：模型需输出每个类别的概率分布，且概率之和为1。实现方式One-vs-Rest(OvR)：训练K个二分类器（
【机器学习笔记 Ⅱ】4 神经网络中的推理
推理（Inference）是神经网络在训练完成后利用学到的参数对新数据进行预测的过程。与训练阶段不同，推理阶段不计算梯度也不更新权重，仅执行前向传播。以下是其实现原理和代码示例的完整解析：1.推理的核心步骤加载训练好的模型参数（权重和偏置）。前向传播：输入数据逐层计算，得到输出。后处理：根据任务类型解析输出（如分类取概率最大值，回归直接输出）。2.代码实现（Python+NumPy）(1)定义模型
【机器学习笔记 Ⅲ】3 异常检测算法巴伦是只猫机器学习机器学习笔记算法
异常检测算法（AnomalyDetection）详解异常检测是识别数据中显著偏离正常模式的样本（离群点）的技术，广泛应用于欺诈检测、故障诊断、网络安全等领域。以下是系统化的解析：1.异常类型类型描述示例点异常单个样本明显异常信用卡交易中的天价消费上下文异常在特定上下文中异常（如时间序列）夏季气温突降至零下集体异常一组相关样本联合表现为异常网络流量中突然的DDOS攻击流量2.常用算法(1)基于统计的
【机器学习笔记 Ⅲ】4 特征选择巴伦是只猫机器学习机器学习笔记人工智能
特征选择（FeatureSelection）系统指南特征选择是机器学习中优化模型性能的关键步骤，通过筛选最相关、信息量最大的特征，提高模型精度、降低过拟合风险并加速训练。以下是完整的特征选择方法论：1.特征选择的核心目标提升模型性能：去除噪声和冗余特征，增强泛化能力。降低计算成本：减少训练和预测时间。增强可解释性：简化模型，便于业务理解。2.特征选择方法分类(1)过滤法（FilterMethods
机器学习笔记二-回归
回归是统计学和机器学习中的一种基本方法，用于建模变量之间的关系，特别是用一个或多个自变量（输入变量）来预测一个因变量（输出变量）的值。回归分析广泛应用于预测、趋势分析和关联研究中。根据目标和数据的性质，可以使用不同类型的回归方法。1.回归的基本概念：自变量（IndependentVariable）:也称为预测变量、解释变量，是模型中的输入变量，用于预测或解释因变量的变化。因变量（Dependent
【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
【机器学习笔记Ⅰ】13 正则化代价函数
正则化代价函数（RegularizedCostFunction）详解正则化代价函数是机器学习中用于防止模型过拟合的核心技术，通过在原始代价函数中添加惩罚项，约束模型参数的大小，从而提高泛化能力。以下是系统化的解析：1.为什么需要正则化？过拟合问题：当模型过于复杂（如高阶多项式回归、深度神经网络）时，可能完美拟合训练数据但泛化性能差。解决方案：在代价函数中增加对参数的惩罚，抑制不重要的特征权重。2.
【机器学习笔记Ⅰ】6 多类特征巴伦是只猫机器学习机器学习笔记人工智能
多类特征（Multi-classFeatures）详解多类特征是指一个特征（变量）可以取多个离散的类别值，且这些类别之间没有内在的顺序关系。这类特征是机器学习中常见的数据类型，尤其在分类和回归问题中需要特殊处理。1.核心概念(1)什么是多类特征？定义：特征是离散的、有限的类别，且类别之间无大小或顺序关系。示例：颜色：红、绿、蓝（无顺序）。城市：北京、上海、广州（无数学意义的大小关系）。动物类别：猫
机器学习笔记——支持向量机 star_and_sun 机器学习笔记支持向量机
支持向量机参数模型对分布需要假设（这也是与非参数模型的区别之一）间隔最大化，形式转化为凸二次规划问题最大化间隔间隔最大化是意思：对训练集有着充分大的确信度来分类训练数据，最难以分的点也有足够大的信度将其分开间隔最大化的分离超平面的的求解怎么求呢？最终的方法如下1.线性可分的支持向量机的优化目标其实就是找得到分离的的超平面求得参数w和b的值就可以了注意，最大间隔分离超平面是唯一的，间隔叫硬间隔1.1
【机器学习笔记Ⅰ】7 向量化巴伦是只猫机器学习机器学习笔记人工智能
向量化（Vectorization）详解向量化是将数据或操作转换为向量（或矩阵）形式，并利用并行计算高效处理的技术。它是机器学习和数值计算中的核心优化手段，能显著提升代码运行效率（尤其在Python中避免显式循环）。1.为什么需要向量化？(1)传统循环的缺陷低效：Python的for循环逐元素操作，速度慢。代码冗长：需手动处理每个元素。示例：计算两个数组的点积（非向量化）a=[1,2,3]b=[4
机器学习笔记：MATLAB实践 techDM 机器学习笔记 matlab Matlab
在机器学习领域，MATLAB是一种功能强大且广泛使用的工具，它提供了许多内置函数和工具箱，方便开发者进行各种机器学习任务。本文将介绍一些常见的机器学习任务，并提供相应的MATLAB源代码示例。数据预处理在进行机器学习之前，通常需要对原始数据进行预处理。这包括数据清洗、特征选择、特征缩放和数据划分等步骤。%导入数据data=readmatrix('data.csv');%数据清洗cleaned_da
机器学习笔记【Week9】 kuiini 人工智能机器学习人工智能
一、异常检测问题动机在现实中，我们经常会遇到“异常检测”的任务：识别罕见、异常、不符合正常模式的数据点。例：工业设备故障检测，银行欺诈识别，异常流量检测等。核心特点：异常样本稀少，难以用监督学习训练模型。二、高斯分布建立算法前，需要假设每个特征满足高斯（正态）分布。在单一特征xjx_jxj上：p(xj;μj,σj2)=12π σjexp⁡(−(xj−μj)22σj2)p(x_j;\mu_j,\si
吴恩达机器学习笔记（1）—引言大饼酥人工智能机器学习人工智能吴恩达
目录一、欢迎二、机器学习是什么三、监督学习四、无监督学习一、欢迎机器学习是当前信息技术领域中最令人兴奋的方向之一。在这门课程中，你不仅会学习机器学习的前沿知识，还将亲手实现相关算法，从而深入理解其内部机理。事实上，机器学习已广泛渗透进我们的日常生活。例如，每次你使用Google、Bing进行搜索，或用Facebook、Apple的图像识别功能识别朋友，甚至邮箱中的垃圾邮件过滤器，背后都离不开机器学
斯坦福CS229机器学习笔记-Lecture2-线性回归+梯度下降+正规方程组 Teeyohuang 机器学习 CS229-吴恩达机器学习笔记 CS229 吴恩达机器学习
声明：此系列博文根据斯坦福CS229课程，吴恩达主讲所写，为本人自学笔记，写成博客分享出来博文中部分图片和公式都来源于CS229官方notes。CS229的视频和讲义均为互联网公开资源Lecture2这一节主要讲的是三个部分的内容：·LinearRegression（线性回归）·GradientDescent（梯度下降）·NormalEquations（正规方程组）1、线性回归首先给了一个例子，如
机器学习笔记周志华第一章绪论 Olivia_ll learning note machine learning machine learning
概念和术语属性空间（attributespace)/样本空间（samplespace)/输入空间：属性张成的空间特征向量（featurevector):一个示例标记（label):关于示例结果的信息样例（example)：拥有了标记信息的示例标记空间（labelspace)/输出空间：所有标记的集合监督学习（supervisedlearning)分类（classification)——预测离散值回
机器学习笔记【Week6】 kuiini 人工智能机器学习人工智能
一、模型结果下一步训练模型得到结果后，常面临：模型性能不理想，下一步如何改进？通过对训练误差和验证误差的观察，判断是高偏差（欠拟合）还是高方差（过拟合）。一般步骤：计算训练误差和验证误差，不包含正则项。判断两者的大小和差距。根据判断选择策略：情况训练误差验证误差结论改进方向欠拟合（高偏差）高高模型能力不足增加特征，减小正则化过拟合（高方差）低高泛化能力差增加训练数据，增加正则化二、评估假设的误差训
机器学习笔记：时域和频域变换灰暗世界% 机器学习笔记机器学习笔记人工智能
加窗操作使用内置的STFT/ISTFT接口这种方法利用torch.stft（内部采用rfft）和torch.istft完成变换，同时借助加窗（例如Hann窗）保证帧内加窗并采用重叠相加（常用50%重叠）实现完美重构。窗口长度可以灵活设置，例如64或32。这种方式利用了PyTorch内置的STFT与ISTFT函数，它们内部使用了rfft/irfft，同时支持加窗并且能够保证重构出的信号长度与输入一致
机器学习笔记——特征工程好评笔记机器学习人工智能深度学习 AIGC 算法岗校招实习
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本笔记介绍机器学习中常见的特征工程方法、正则化方法和简要介绍强化学习。文章目录特征工程（FzeatureEngineering）1.特征提取（FeatureExtraction）手工特征提取（ManualFeatureExtraction）：自动特征提取（AutomatedFeatureExtraction）：2.特征选择
AIGC视频生成模型：ByteDance的PixelDance模型好评笔记 AIGC 深度学习人工智能计算机视觉机器学习 transformer 论文阅读
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance，论文于2023年11月发布，模型上线于2024年9月，同时期上线的模型还有Seaweed（论文未发布）。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录热门专栏机器学习深度学习
Meta的AIGC视频生成模型——Emu Video 好评笔记 AIGC 深度学习人工智能机器学习 transformer 校招面试八股
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍Meta的视频生成模型EmuVideo，作为Meta发布的第二款视频生成模型，在视频生成领域发挥关键作用。优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录论文摘要引言相关工作文本到图像（T2I）扩散模型视频生成/预测文本到视频（T2V）生成分解生成方法预备知识EmuVideo生成步骤图
Python机器学习笔记（二十五、算法链与管道） FreedomLeo1 Python机器学习机器学习算法 python make_pipeline Pipeline named_steps属性
对于许多机器学习算法，特定数据表示非常重要。首先对数据进行缩放，然后手动合并特征，再利用无监督机器学习来学习特征。因此，大多数机器学习应用不仅需要应用单个算法，而且还需要将许多不同的处理步骤和机器学习模型链接在一起。Pipeline类可以用来简化构建变换和模型链的过程。将Pipeline和GridSearchCV结合起来，可以同时搜索所有处理步骤中的参数。举例：使用MinMaxScaler对can
Python机器学习笔记（二十三模型评估与改进-网格搜索） FreedomLeo1 Python机器学习机器学习 python 支持向量机交叉验证网格搜索 scikit-learn
上一次学习了评估一个模型的泛化能力，现在继续学习通过调参来提升模型的泛化性能。scikit-learn中许多算法的参数设置，在尝试调参之前，重要的是要理解参数的含义。找到一个模型的重要参数（提供最佳泛化性能的参数）的取值是一项棘手的任务，但对于几乎所有模型和数据集来说都是必要的。scikit-learn中有一些标准方法可以帮我们完成调参。最常用的方法就是网格搜索（gridsearch），它主要是指
吴恩达机器学习笔记：特征与多项式回归ちゆきー机器学习笔记回归
1.特征和多项式回归如房价预测问题，ℎθ(x)=θ0+θ1×frontage+θ2×deptℎx1=frontage（临街宽度），x2=deptℎ（纵向深度），x=frontage∗deptℎ=area（面积），则：hθ(x)=θ0+θ1xh_\theta(x)=\theta_0+\theta_1xhθ(x)=θ0+θ1x线性回归并不适用于所有数据，有时我们需要曲线来适应我们的数据，比如一个二次方
吴恩达机器学习笔记：多维梯度下降实践ちゆきー机器学习笔记计算机视觉
1.特征放缩在我们面对多维特征问题的时候，我们要保证这些特征都具有相近的尺度，这将帮助梯度下降算法更快地收敛。以房价问题为例，假设我们使用两个特征，房屋的尺寸和房间的数量，尺寸的值为0-2000平方英尺，而房间数量的值则是0-5，以两个参数分别为横纵坐标，绘制代价函数的等高线图能看出图像会显得很扁，梯度下降算法需要非常多次的迭代才能收敛。解决的方法是尝试将所有特征的尺度都尽量缩放到-1到1之间。如
吴恩达机器学习笔记：监督学习ちゆきー机器学习笔记学习
1.回归我们用一个例子介绍什么是监督学习把正式的定义放在后面介绍。假如说你想预测房价。前阵子，一个学生从波特兰俄勒冈州的研究所收集了一些房价的数据。你把这些数据画出来，看起来是这个样子：横轴表示房子的面积，单位是平方英尺，纵轴表示房价，单位是千美元。那基于这组数据，假如你有一个朋友，他有一套750平方英尺房子，现在他希望把房子卖掉，他想知道这房子能卖多少钱。我们应用学习算法，可以在这组数据中画一条
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {