YZXnuaa

【数学基础】线性代数以及符号编总

1基本概念和符号

线性代数可以对一组线性方程进行简洁地表示和运算。例如，对于这个方程组:

这里有两个方程和两个变量，如果你学过高中代数的话，你肯定知道，可以为x1 和x2找到一组唯一的解 (除非方程可以进一步简化，例如，如果第二个方程只是第一个方程的倍数形式。但是显然上面的例子不可简化，是有唯一解的)。在矩阵表达中，我们可以简洁的写作:

其中：

很快我们将会看到，咱们把方程表示成这种形式，在分析线性方程方面有很多优势(包括明显地节省空间)。

1.1基本符号

以下是我们要使用符号:

符号A ∈ Rm×n表示一个m行n列的矩阵，并且矩阵A中的所有元素都是实数。
符号x ∈ Rn表示一个含有n个元素的向量。通常，我们把n维向量看成是一个n行1列矩阵，即列向量。如果我们想表示一个行向量（1行n列矩阵），我们通常写作xT (xT表示x的转置，后面会解释它的定义)。
一个向量x的第i个元素表示为xi：

我们用aij (或Aij，Ai，j，等) 表示第i行第j列的元素：

我们用aj 或A:，j表示A矩阵的第j列元素：

我们用aT i或 Ai，:表示矩阵的第i行元素:
请注意，这些定义都是不严格的（例如，a1和a1T在前面的定义中是两个不同向量）。通常使用中，符号的含义应该是可以明显看出来的。

2 矩阵乘法

矩阵 A ∈ Rm×n 和B ∈ Rn×p 的乘积为矩阵：

其中：

请注意，矩阵A的列数应该与矩阵B的行数相等，这样才存在矩阵的乘积。有很多种方式可以帮助我们理解矩阵乘法，这里我们将通过一些例子开始学习。

2.1向量的乘积

给定两个向量x，y ∈ Rn，那么xT y的值，我们称之为向量的内积或点积。它是一个由下式得到的实数：

可以发现，内积实际上是矩阵乘法的一个特例。通常情况下xT y = yT x。

对于向量x ∈ Rm， y ∈ Rn（大小不必相同），xyT ∈ Rm×n称为向量的外积。外积是一个矩阵，其中中的每个元素，都可以由得到，也就是说，

我们举个例子说明外积有什么用。令1 ∈ Rn 表示所有元素都是1的n维向量，然后将矩阵 A ∈ Rm×n 的每一列都用列向量x ∈ Rm表示。使用外积，我们可以将A简洁的表示为：

2.2矩阵-向量的乘积

对于一个矩阵A ∈ Rm×n 和向量x ∈ Rn，他们的乘积为向量 y = Ax ∈ Rm。理解矩阵向量乘法的方式有很多种，我们一起来逐一看看。

以行的形式书写A，我们可以将其表示为Ax的形式：

也就是说，y第i行的元素等于A的第i行与x的内积 .

咱们换个角度，以列的形式表示A，我们可以看到：

换言之，y是A列的线性组合，线性组合的系数就是x的元素。

上面我们看到的是右乘一个列向量，那左乘一个行向量嘞？对于A ∈ Rm×n，x ∈ Rm， y ∈ Rn，这个式子可以写成yT = xT A 。向之前那样，我们有两种方式表达yT，这取决于表达A的方式是行还是列。第一种情况是把A以列的形式表示：

这个式子说明yT 第i列的元素等于向量x与A的第i列的内积。

我们也一样可以把A表示成行的形式，来说明向量-矩阵乘积。

我们可以看到yT 是A的行的线性组合，线性组合的系数是x的元素。

2.3矩阵-矩阵乘积

基于以上知识，我们可以看到如之前所定义的矩阵-矩阵乘法C=AB有四种不同（但是等价）的理解方法。

首先，我们可以将矩阵-矩阵相乘看作一组向量-向量乘积。根据其概念，我们最好理解的方式是矩阵C的(i，j)元素是A的i行与B的 j列的内积。符号表达如下：

注意由于A ∈ Rm×n ， B ∈ Rn×p， ai ∈ Rn bj ∈ Rn，所以内积永远有意义。对矩阵乘法而言，以A的行和B的列表示是最"自然"的表示方法。当然，我们也可以以A的列和B的行的形式进行表示。表达方法是AB外积累加的形式，稍微复杂一点点。符号表达为：

换一种方式表达，AB的值等于对于所有的i，A的i列与B的i行的外积的和。因此，对于ai ∈ Rm 和 bi ∈ Rp，外积aibiT的维度是m×p，它与C的维度是相同的。等式可能有点难理解，花点时间想想，我猜你肯定能明白。

第二种理解方式是，我们也可将向量-向量乘法看做一系列的矩阵-向量乘积。具体来说，如果我们将B以列的形式表示，我们可以将C的每一列看做A和B列的矩阵-向量乘积。符号表达为：

可以将C的i列以矩阵-向量乘积（向量在右）的方式表示为ci = Abi. 这些矩阵-向量乘积可以用前面的两种观点解释。最后类比一下，我们以A的行形式表示，将C的行视为A的行与C的矩阵-向量乘积，符号表达为

在此，我们以矩阵-向量乘积（向量左乘）的形式表示了C的i列，

只是一个矩阵乘法而已，这么细的分析看上去好像没有必要，尤其是当我们知道矩阵乘法定义后其实很容易可以计算得到结果。然而，几乎所有的线性代数内容都在处理某种类型的矩阵乘法，因此花一些时间去形成对这些结论的直观认识还是很有帮助的。

此外，知道一些更高层次的矩阵乘法的基本性质也是有好处的：

结合律即(AB)C = A(BC)
分配率即A(B + C) = AB + AC
注意哦，矩阵乘法没有交换律，即AB ≠BA.（例如，如果A ∈ Rm×n 和B ∈ Rn×q，矩阵的乘积BA在m和q不等时，BA可能根本就不存在）

如果你对这些性质不熟悉，最好花些时间自己证明一下。例如，为了验证矩阵乘法的结合律，对于A ∈ Rm×n， B ∈ Rn×p，C ∈ Rp×q，注意AB ∈ Rm×p，而 (AB)C ∈ Rm×q。类似的有BC ∈ Rn×q，所以A(BC) ∈ Rm×q。因此可以得到维度相同的矩阵。为了说明矩阵乘法符合结合律，证明(AB)C 第(i,j)个元素是否与A(BC)的(i,j)个元素相等就够了。我们可以直接运用矩阵乘法的定义进行证明。

上面的推导过程中，第一个和最后两个等式使用矩阵乘法的定义，第三和第五的等式使用标量乘法的分配率，第四个等式使用了标量加法的交换律和结合律。这种将运算简化成标量的特性以证明矩阵性质的方法会经常出现，你可以熟悉熟悉它们。

3 运算和性质

在这一节中，我们将介绍几种矩阵/向量的运算和性质。很希望这些内容可以帮助你回顾以前知识，这些笔记仅仅是作为上述问题的一个参考。

3.1 单位矩阵与对角矩阵

单位矩阵，记作I ∈ Rn×n，是一个方阵，其对角线上的都是1，其他元素都是0。即：

它具备A ∈ Rm×n矩阵的所有性质

请注意，在某种意义上，标识矩阵的符号是有歧义的，因为它没有指定I的维度。一般而言，从上下文中可以推断出I的维度，这个维度使矩阵相乘成为可能。例如，在上面的等式AI = A中的I是n × n矩阵，而A = IA中 I是m × m矩阵。

对角矩阵除了对角线元素之外其他元素都是0。可以记作D = diag(d1，d2，...，dn)，其中：

显然，I = diag(1，1，...，1).

3.2转置

矩阵的转置的是矩阵行和列的"翻转"。对于一个矩阵A ∈ Rm×n，，它的转置，AT ∈ Rn×m，是一个n × m 的矩阵，其元素为

我们实际上已经使用转置当描述行向量的转置，因为一个列向量的转置，自然是一个行向量。

下面是一些关于转置的性质，证明起来也不太难：

(AT )T = A
(AB)T = BT AT
(A + B)T = AT + BT

3.3对称矩阵

如果一个方阵A∈ Rn×n满足条件A = AT，那么它就是对称的。如果满足A = −AT则A是反对称的。很容易证明，任何矩阵A ∈ Rn×n，A + AT 是对称的，而 A−AT是反对称的。因此，任何方阵A ∈ Rn×n可以表示为一个对称矩阵和反对称矩阵的和，因为:

右边的第一个矩阵是对称的，第二个是反对称的。在实践中，对称矩阵是很常用的，他们有诸多优秀的性质，我们将在以后进行说明。我们通常将所有大小为n的对称矩阵的集合表示为Sn；A ∈ Sn则表示A是n × n的对称矩阵。

3.4矩阵的迹

方阵A ∈ Rn×n的迹，记作tr(A)，或可以省略括号表示成trA，是矩阵的对角线元素之和:

正如cs229讲义中所述，矩阵的迹具有以下性质（在此讲述完全是为了内容的完整性）：

对于A ∈ Rn×n， trA = trAT .
对于A，B ∈ Rn×n， tr(A + B) = trA + trB.
对于A ∈ Rn×n， t ∈ R， tr(tA) = t trA.
对于方阵A,B,C，trABC = trBCA = trCAB，即使有更多的矩阵相乘，这个性质也不变.

前三个性质比较容易证明，咱们一起来看看第4个性质。假设A ∈ Rm×n ，B ∈ Rn×m (因此AB ∈ Rm×m是个方阵)。观察到BA ∈ Rn×n也是一个方阵，所以他的迹是有意义的。为了证明trAB = trBA，注意到：

在这里，第一个和最后两个等式使用了迹运算和矩阵乘法的定义。第四个等式是最重要的部分，它使用了标量乘法的交换性来交换每个乘积中因式顺序，也使用了标量加法的交换律和结合律将求和过程重新排序。

3.5范数

向量的范数是向量"长度"的非正式度量。例如，我们常用的欧氏或ℓ2范数。

注意 .

更正式的来讲，范数是满足以下4个特性的任何一个方程f : Rn → R:

对于任意x ∈ Rn， f(x) ≥ 0 (非负性).
当且仅当x = 0 时，f(x) = 0(确定性).
对于任意x ∈ Rn，t∈ R，f(tx) = |t|f(x) (均匀性).
对于任意 x，y∈Rn，f(x + y)≤f(x) + f(y) (三角不等性).

另一个范数的例子是ℓ1范数，

以及ℓ∞范数，

事实上，这三个范数都是ℓP范数家族的的例子，它包含一个实参数p≥1。ℓP范数定义为：

也可以定义矩阵A的范数，如Frobenius范数，

也存在许多其他的范数，但它们超出了这篇综述讨论的范围。

3.6线性无关和秩

对于一组向量{x1，x2，...xn} ∈ Rm，如果没有向量可以表示为其余向量的线性组合，这组向量就是（线性）无关的。相反，如果一个向量属于一个集合，这个集合中的向量可以表示为其余的向量某个线性组合，那么就称其称为向量（线性）相关。也就是说，对于一些标量值α1，...，αn−1 ∈ R，如果

我们说向量x1，...，xn是线性相关；否则，该向量线性无关。例如，向量

是线性相关的，因为x3 = −2x1 + x2.

矩阵A ∈ Rm×n的列秩是所有线性独立的列的最大子集的大小。由于某些术语的滥用，列秩通常指矩阵A线性无关的列的数目。相似的，将A的行构成一个线性无关集，行秩是它行数的最大值。

对任意矩阵A ∈ Rm×n，其列秩与行秩是相等的（虽然我们不打算证明），所以我们将两个相等的秩统称为A的的秩。秩的一些基本性质如下：

对于 A ∈ Rm×n， rank(A) ≤ min(m，n). 如果rank(A) = min(m，n)，则称A满秩。
对于 A ∈ Rm×n， rank(A) = rank(AT ).
对于 A ∈ Rm×n， B ∈ Rn×p， rank(AB) ≤ min(rank(A)，rank(B)).
对于 A，B ∈ Rm×n， rank(A + B) ≤ rank(A) + rank(B).

3.7逆

矩阵A ∈ Rn×n的逆，写作A−1，是一个矩阵，并且是唯一的。

A−1A = I = AA−1.

注意不是所有的矩阵都有逆。例如非方阵，是没有逆的。然而，即便对于一些方阵，它仍有可能不存在逆。如果A−1存在，我们称矩阵A 是可逆的或非奇异的，如果不存在，则称矩阵A不可逆或奇异。

如果一个方阵A有逆A−1，它必须满秩。我们很快可以看到，除了满秩，矩阵可逆还有许多充分必要条件。

满足以下的性质的矩阵可逆；以下所有叙述都假设A，B ∈ Rn×n是非奇异的：

(A−1)−1 = A
(AB)−1 = B−1A−1
(A−1)T = (AT )−1. 因此这样的矩阵经常写作A−T

举一个矩阵的逆的应用实例。对于线性方程组Ax = b，其中 A ∈ Rn×n，并且x，b ∈ Rn.如果A是非奇异（即可逆），则x = A−1b（如果A ∈ Rm×n不是方阵呢？是否成立？）

3.8 正交矩阵

如果xT y = 0，则两个向量 x，y ∈ Rn是正交的。对于一个向量x ∈ Rn，如果则是x归一化的。对于一个方阵U ∈ Rn×n，如果所有列都是彼此正交和归一化的，（列就称为标准正交）则这个方阵是正交的（注意在讨论向量或矩阵时，正交具有不同的含义）。

根据正交和归一化的定义可得：

UT U = I = UUT

换言之，一个正交矩阵的逆矩阵的是它的转置。注意，如果U不是方阵的，也就是说， U ∈ Rm×n，n < m，但它的列仍然是正交的，则UT U = I，但UUT ≠ I.等。我们一般只使用正交这个术语来描述U为方阵的情形。

另一个正交矩阵的很好的属性是，向量与正交矩阵的运算将不会改变其欧氏范数，即对于任意x ∈ Rn，正交的U ∈ Rn×n：

3.9矩阵的值域和零空间

一组向量{x1，x2，...xn}的值域是{x1，x2，...xn}线性组合的所有向量的集合。即

可以看出如{x1，...，xn}是一组n个线性无关的向量，其中xi ∈ Rn，则({x1，...xn}) 的值域= Rn。换句话说，任何向量v ∈ Rn可以写成x1 至 xn的线性组合。向量y ∈ Rm 在值域 {x1，...，xn}上的投影 (假定 xi ∈ Rm) 是向量v ∈ span({x1，...xn})，则通过比较其欧式范数，v 与 y无限接近。这个投影记作Proj（Y；{ x1，…，n}）,可以定义它为，

A ∈ Rm×n的值域（有时也被称为列空间），表示为R(A)，就是A的值域。换言之，

R(A) = {v ∈ Rm : v = Ax，x ∈ Rn}.

我们假设A满秩且n < m，向量y ∈ Rm 在A值域上面的投影可以表示为

这最后一个方程应该看起来非常熟悉，因为它几乎是我们在课上用于参数的最小二乘估计公式（并且我们可以快速再次推导出来）几乎相同的。看一下投影的定义，你会发现这其实与我们在解决最小二乘法问题时进行最小化的目的是相同的（除了范数是一个平方，这并不影响求得最优的点），所以这些问题是有自然联系的。当 A 仅含有1个单独的列 a ∈ Rm，则出现了向量在一条直线上投影的特殊情况。

矩阵A ∈ Rm×n的零空间，记为N(A)，是被A乘后，得到的所有等于0的向量一个集合，即，

N(A) = {x ∈ Rn : Ax = 0}.

注意，向量R(A)的大小为m，而N(A)的大小为n，所以 R(AT ) 和 N(A) 的向量都在 Rn中。事实上，我们可以讨论更多。

换句话说，R(AT ) 和 N(A)是不相交的子集，一同跨越了Rn整个空间。这种类型的集合称为正交互补，写作R(AT ) = N(A)⊥.

3.10 行列式

方阵A∈Rn×n的行列式是一个映射det: Rn×n→R,记作|A|或det A (同迹运算一样，我们通常省略括号)。在代数上,可以显式地写出A的行列式的公式，但是很遗憾，它的意义不够直观。咱们先给出行列式的几何解释，然后再探讨一下它的一些特殊的代数性质。

对于矩阵：

考虑由A中所有行向量a1,a2,..,an的所有可能线性组合组成的点集S⊂Rn，其中线性组合的参数都介于0和1之间；换句话说，由于这些线性组合的参数a1,a2,...,an∈Rn满足0≦ai≦1,i=1,...,n，集合S是张成子空间({a1, . . , an})的约束。公式表达如下：

A的行列式的绝对值，是集合S的"体积"的一个量度。

例如，考虑2×2矩阵，

此处，矩阵的行：

对应于这些行的集合S如图1所示。对于二维矩阵，S一般是平行四边形。在我们的示例中A的行列式的值为|A| = -7.(可以使用本节后文将给出的公式来计算)。所以平行四边形的面积为7（自行证明！）

在三维中，集合S对应一个平行六面体（一个三维的斜面的盒子，例如每一面都是平行四边形）。这个3×3矩阵的行列式的绝对值，就是这个平行六面体的三维体积。在更高的维数中，集合S是一个n维超平形体。

图 1 ：公式(1)给出2×2矩阵A的行列式图示。此处，a1和a2是对应于A中的行的向量，集合S对应于阴影区域（亦即平行四边形）。行列式的绝对值，|det A|=7，是平行四边形的面积

代数上，行列式满足下列三个性质（其它性质亦遵循它，包括行列式的一般公式）

1、单位矩阵的行列式为1 ，|I| = 1。(从几何上来看，单位超立方体的体积为1)。

2、对于一个矩阵A∈Rn×n，如果将A中某行乘以一个标量t∈R，新矩阵的行列式值为t|A|。

(几何上，集合S的一条边乘以因数t，会导致体积扩大t倍)

3、我们交换行列式A任意两行aTi和aTj，新矩阵的行列式的值为-|A|,例如：



满足上述三个条件的函数是否存在，并不是那么容易看出来的。然而事实上，此函数存在且唯一。(此处不证明)

这三个性质的推论包括：

对于 A ∈ Rn×n, |A| = |AT |。
对于 A,B ∈ Rn×n, |AB| = |A||B|。
对于 A ∈ Rn×n,当且仅当A奇异(即不可逆)时，|A| = 0。（如果A奇异，它必不满秩，它的列线性相关。此时，集合S对应于n维空间中的一个平板，因此体积为零。）
对于A ∈ Rn×n，且A非奇异, |A-1| = 1/|A|.

在给出行列式的一般定义之前,我们定义代数余子式：对于A∈ Rn×n，矩阵A\i,\j ∈R(n-1)×(n-1)是A删除i行和j列的结果。

行列式的一般（递推）定义：

其中首项A∈ R1×1的行列式，|A| = a11。如果我们把公式推广到A∈ Rn×n，会有n！（n的阶乘）个不同的项。因此，我们很难显式地写出3阶以上的矩阵的行列式的计算等式。

然而，3阶以内的矩阵的行列式十分常用，大家最好把它们记住。

矩阵A∈ Rn×n的古典伴随矩阵（通常简称为伴随矩阵），记作adj(A),定义为：

（注意A的系数的正负变化。）可以证明，对于任意非奇异矩阵A∈ Rn×n，有

这个式子是求矩阵的逆的一个很好的显示公式。大家要记住，这是一个计算矩阵的逆的一个更加高效的方法。

3.11 二次型和半正定矩阵

对于一个方阵A∈ Rn×n和一个向量x∈ Rn，标量xTAx被称作一个二次型。显式地写出来，我们可以看到：

注意：

第一个等式是由标量的转置等于它自身得到，第二个等式是由两个相等的量的平均值相等得到。由此，我们可以推断，只有对称分量对二次型有影响。我们通常约定俗成地假设二次型中出现的矩阵是对称矩阵。

我们给出如下定义：

• 对于任一非零向量x∈Rn，如果xTAx>0，那么这个对称矩阵A∈Sn是正定（PD）的.通常记作A≻0，(或简单地A>0)，所有的正定矩阵集合记作Sn++。

• 对于任一非零向量x∈Rn，如果xTAx≧0，那么这个对称矩阵A∈Sn是半正定（PSD）的。记作A≽0，(或简单地A≧0)，所有的半正定矩阵集合记作Sn+ 。

• 同样的，对于任一非零向量x∈Rn，如果xTAx＜0,那么这个对称矩阵A∈Sn是负定(ND)的。记作A≺0，(或简单地A＜0)。

•对于任一非零向量x∈Rn，如果xTAx≤0,那么这个对称矩阵A∈Sn是半负定（NSD）的.记作A≼0，(或简单地A≤0)。

•最后，如果它既不是半正定也不是半负定-亦即，存在x1，x2∈Rn使得x1TAx1>0且x2TAx2<0，那么对称矩阵A∈Sn是不定矩阵。

显然，如果A是正定的，那么-A是负定的，反之亦然。同样的，如果A是半正定的，那么-A是半负定的，反之亦然。如果A是不定的，-A也是不定矩阵。

正定矩阵和负定矩阵的一个重要性质是，它们一定是满秩的。因此，也是可逆的。为了证明这个性质，假设存在矩阵A∈ Rn×n是不满秩的。进而，假设A的第j列可以其它n-1列线性表示。

对于x1,...,xj−1, xj+1,...,xn ∈R,设xj=-1，我们有

但是这意味着对于某些非零向量x，xTAx=0，所以A既不能正定，也不能负定。因此，如果A是正定或者负定，它一定是满秩的。

最后，一种常见的正定矩阵需要注意：给定一个矩阵A ∈Rm×n (不一定是对称，甚至不一定是方阵)，矩阵G=ATA(有时也称为格拉姆矩阵)必然是半正定的。进一步，如果m≥n,(为了方便，我们假设A满秩)此时，G=ATA是正定的。

3.12特征值和特征向量

对于一个方阵A ∈Rn×n，如果：

我们说λ∈C是A的特征值，x∈Cn是对应的特征向量.

直观上看，其实上面的式子说的就是A乘一个向量x，得到的新的向量指向和x相同的方向，但是须乘一个标量λ。注意对任一个特征向量x∈Cn和标量t∈C，A(cx) = cAx = cλx = λ(cx),，所以cx也是一个特征向量。因此，我们要说λ所对应的特征向量。我们通常假设特征向量被标准化为长度1。(此时依然有歧义，因为x和-x都可以是特征向量，但是我们也没什么办法)。

如果

我们可以把上文的等式换一种写法，表明(λ,x)是A的一个特征值-特征向量对。

但是当且仅当有非空零空间时，也就是当(λI − A)非奇异时，亦即

时，(λI − A)x = 0有x的非零解。

我们现在可以用前文的行列式的定义，来把这个表达式展开为一个(非常大的) λ的多项式，其中λ的最高阶为n。我们可以解出多项式的n个根(这可能十分复杂)，来得到n个特征值λ1, ...，λn。为了解出特征值对应的特征向量，我们可以简单地求线性等式(λiI − A)x = 0的解。需要注意，实际操作时，计算特征值和特征向量不用这个方法。(行列式的完全展开式有n!项）。这只是一个数学论证。

下面是特征值和特征向量的性质（假设A∈ Rn×n，且特征值λ1,...，λn对应的特征向量为x1,...，xn）:

矩阵A的迹等于特征值的和

A的行列式等于特征值的积

A的秩等于A的非零特征值的个数。
如果A是非奇异矩阵，则1/λi是矩阵A-1对应于特征向量xi的特征值。亦即，A−1xi = (1/λi)xi。（证明方法是，对于特征向量等式，Axi = λixi，在两边同时左乘A-1）
对角矩阵D=diag(d1, . . . ，dn)的特征值是所有的对角元素。

我们可以把所有的特征向量等式联立为

X ∈Rn×n 的列是A的特征向量，∧是对角元素为A的特征值的对角矩阵。亦即：

如果A的特征向量线性无关，则矩阵X可逆，所以A=X∧X-1。可以写成这个形式的矩阵A被称作可对角化。

3.13 对称矩阵的特征值和特征向量

当我们考察对称矩阵A∈Sn的特征值和特征向量时，有两个特别的性质需要注意。首先，可以证明，A的所有特征值都是实数。其次，A的所有特征向量时正交的。也就是说，上面所定义的矩阵X是正交矩阵。（我们把此时的特征向量矩阵记作U）。

接下来，我们可以将A表示为A=U∧UT，由上文知，一个正交矩阵的逆等于它的转置。

由此，我们可以得到所有完全使用特征值来定义的矩阵。假设A∈Sn= U∧UT。有：

其中，y=UTx（由于U满秩，任意y∈Rn可以表示为此形式。）由于yi2永远为正，这个表达式完全依赖于λi。如果所有的λi>0,那么矩阵正定；如果所有的λi≥0，矩阵半正定。同样的，如果所有的λi<0或λi≤0，矩阵A分别负定和半负定。最后，如果A既有正的特征值又有负的特征值，它是不定矩阵。

特征值和特征向量的一个常见的应用是找出矩阵的某个函数的最大值。例如，对于矩阵A∈Sn,考虑这个求最大值问题：

也就是说，我们希望找到使二次型最大的单位向量。假设特征值大小为λ1 ≥ λ2 ≥ . . . ≥ λn，这个最优化问题的最优解x为x1，对应的特征值为λ1.此时，二次型的最大值是λ1。相似的，最小值问题的最优解

是xn，对应的特征值是λn，那么最小值是λn。可以通过将A表示为特征向量-特征值的形式，然后使用正定矩阵的性质证明。然而，在下一节我们可以使用矩阵微积分直接证明它。

4矩阵微积分

之前章节的内容，在一般线性代数的课程中都会讲到。而有些常用的内容是没有的，这就是把微积分推广到向量。事实上，我们应用的微积分都会比较繁琐，各种符号总是让问题变得更复杂。在本节中，将给出一些矩阵微积分的基本定义，并举例说明。

4.1梯度

设ƒ:Rm×n→R是大小为m×n的矩阵A的函数，且返回值为实数。ƒ的梯度（关于A∈Rm×n）是一个偏导矩阵，定义如下：

即,一个m×n矩阵，其中

注意∇Af(A)和A有相同的大小。所以，特别的，当A是一个向量x∈Rn时，

需要特别记住的是，函数的梯度只在函数值为实数的时候有定义。也就是说，函数一定要返回一个标量。例如，我们就不能对Ax，A∈Rn×n中的x求梯度，因为它是一个向量。

它遵循和偏导相同的性质：

原则上，梯度是多变量函数偏导的延伸。然而，实际应用梯度时，会因为数学符号而变得棘手。例如，假设A∈Rm×n是一个具有固定系数的矩阵，b∈Rm是一个固定系数的向量。令ƒ ：Rm→R为由ƒ(z)=zTz，因此∇zf(z) =2z。现在，考虑表达式;

∇f(Ax)

上式该如何理解？至少有两种解释：

解释一，因∇f(Ax). = 2z,所以可将∇f(Ax).理解为点Ax处的梯度，那么：

∇f(Ax) = 2(Ax) = 2Ax ∈ Rm

解释二，可以认为f(Ax)是关于变量x的函数。正式的表述为，令g(x) = f(Ax)。那么在此种解释下有：

∇f(Ax) = ∇xg(x) ∈ Rn

大家可以发现，这两种解释确实不同。解释一得出的结果是m维向量，而解释二得出n维向量！怎么办？

这里的关键是确定对那个变量求微分。在第一种情况下，是让函数f对参数z求微分，然后代入参数Ax。第二种情况，是让复合函数g（x）= F（AX）与直接对x求微分。第一种情况记为∇zf（AX），第二种情况记为∇xf（AX）。你会在作业中发现，理清数学符号是非常重要的。

4.2Hessian矩阵

假设 ƒ ：Rn→R 是n维向量A的的函数，并返回一个实数。那么x的Hessian矩阵是偏导数的n×n矩阵，写作∇2xf（x），简记为H。

换句话说，∇2xf(x) ∈ Rn×n ，其中：

需要注意的是Hessian矩阵始终是对称的，即：

和梯度类似，Hessian矩阵只在f(x)为实数时有定义。

可以很自然联想到，偏导类似于函数的一阶导数，而Hessian类似函数的的二阶导数（我们使用的符号，也表明了这种联系）。通常这种直觉是正确的，但有些注意事项需要牢记。

首先，只有一个变量的实值函数，f : R→R，它的基本定义是二阶导数是一阶导数的导数，即：

然而，对于关于向量的函数，该函数的梯度是一个向量，我们不能取向量的梯度，即;

并且这个表达式没有定义。因此，不能说Hessian矩阵是梯度的梯度。然而，在下面的意义上比较靠谱：如果我们取第i项（∇xf（X））i =∂F（X）/∂xi，并取对x的梯度，我们得到：

这是Hessian矩阵的第i列（或行）。因此：

如果此处稍粗略一点，可以得出，只要将其真实的含义理解为对 (∇xf(x))的每一项求梯度，而不是对向量求梯度即可。

最后注意，虽然可求出对矩阵A∈Rn的梯度，但在本课程中，将只考虑向量x∈Rn的Hessian矩阵。这仅仅是为了方便起见（而事实上，没有计算需要求矩阵的Hessian矩阵），因为矩阵的Hessian矩阵必须表示为所有的偏导数∂2f（A）/（∂Aij∂Akℓ），而要表示为矩阵却相当麻烦。

4.3 二次函数或线性函数的梯度和Hessian矩阵

现在，让我们确定一些简单函数的梯度和Hessian矩阵。应当指出的是，这里给出的所有的梯度都是在CS229讲义给出的特殊情况。

当x∈Rn，对于已知向量b∈Rn，令f（X）= bT x。得：

因此

由此不难看出，∇xbT x= b。这是与单变量微积分类似的情况，其中，∂/（∂x）aX =a。

现在考虑二次函数f（x）= xTAx ,A∈Sn。注意到：

求其偏导数，分别考虑包含Xk和xk2因子的项：

其中最后一个等式是因为A是对称的（完全可以假设，因为它是二次型）。注意，∇xf（x）的第k项只是A的第k行和x的内积。因此，∇xxTAx=2AX。同样，与单变量微积分类似，即∂/（∂x） ax2= 2aX。

最后，再看二次函数f（X）= xTAx的Hessian矩阵（显然，线性函数bT x的Hessian矩阵为零）。在这种情况下，

因此，应当清楚的是∇x2xTAx=2A，这完全是可证明的（并再次类似于单变量的情况∂2/(∂x2) ax2 = 2a）。

总之：

∇xbT x = b

∇xxTAx = 2Ax ( A 为对称矩阵)

∇x2xTAx = 2A ( A 为对称矩阵)

4.4最小二乘法

这里将用最后一节得到的公式推导最小二乘方程。假设对矩阵A∈Rm×n（为简单起见，假定A是满秩）和向量b∈Rm ，使得b错误!未找到引用源。R（A）。在这种情况下，无法找到一个向量x∈Rn，使得Ax = b。退一步，我们找一个向量x∈Rn，使得Ax是尽可能接近b，即欧氏范数||Ax - b||22。

且知||x||22=xTx，有：

取对已有x的梯度，并使用上一节推出的性质

让最后一个表达式等于零，并求解X满足的标准方程

这正和我们课上推导的一样。

4.5行列式的梯度

现在考虑一种情况，求函数对矩阵的梯度，即对A∈Rn×n，求∇A| A |。回顾之前关于行列式的讨论：

因此：

根据伴随矩阵的性质，可立即得出：

现在，考虑函数f : Sn ++ → R, f(A) = log |A|，需要注意的是，一定要限制f的域是正定矩阵，因为这将确保| A | >0，这样log| A |是一个实数。在这种情况下，我们可以使用链式法则（很简单，只是单变量微积分的普通链式法则）得出：

那么，很显然：

此处，在最后一个表达式中去掉了转置符，因为A是对称的。注意当∂/(∂x) log x = 1/x时,和单值情况相似。

4.6最优化特征值

最后，通过直接分析特征值/特征向量，用矩阵微积分来解决一个优化问题。接下来，考虑等式约束优化问题：

对于一个对称矩阵A ∈ Sn，解决等式约束优化问题的标准方法是构造拉格朗日（一个包括等式约束的目标函数）。这种情况下的拉格朗日可由下式给出：

其中λ被称为与等式约束对应的拉格朗日乘子。对这问题可以找到一个x*的最佳点，让拉格朗日的梯度在x*上为零（这不是唯一的条件，但它是必需的）。即：

注意，这其实是线性方程组Ax =λx。这表明，假设xT x = 1，使xT Ax最大化或（或最小化）的唯一的点正是A的特征向量。

你可能感兴趣的:(基础算法)

零基础数据结构与算法——第四章：基础算法-排序（总） qqxhb 零基础数据结构与算法算法小学生编程算法排序算法数据结构插入桶归并
排序上（冒泡/选择/插入）排序中（归并/堆排/快排）排序下（计数/基数/桶）4.1.10排序算法的比较性能比较下表总结了我们学习的排序算法的性能特点：排序算法平均时间复杂度最坏时间复杂度最好时间复杂度空间复杂度稳定性是否基于比较冒泡排序O(n²)O(n²)O(n)O(1)稳定是选择排序O(n²)O(n²)O(n²)O(1)不稳定是插入排序O(n²)O(n²)O(n)O(1)稳定是归并排序O(nlo
算法设计与分析知识总结 vortex5 算法
一、算法基础算法是对特定问题求解步骤的描述，是指令的有限序列，具有输入、输出、有穷性、确定性和可行性五个性质。程序则是算法用某种编程语言的具体实现。优秀的算法应具备正确性、健壮性、可理解性、抽象分级和高效性，其中时间复杂度是衡量算法效率的重要标准。常用的时间复杂度符号包括O（上界）、Ω（下界）和Θ（紧确界）。1.1时间复杂度分析非递归算法以嵌套循环为例，分析以下代码的时间复杂度：for(i=1;i
基础算法枚举，贪心
1.枚举穷举所有可能的解：算法枚举通过尝试所有可能的组合或排列来解决问题，确保不会错过任何潜在的解。并进行验证和比较，找到最优解。或者所有解。解空间的类型：可以是一个范围的所有数字（或二元组，字符串），或者满足某个条件的所有数字。蓝桥杯一题枚举问题小明对数位中含有2、0、1、9的数字很感兴趣（不包括前导0），在1到40中这样的数包括1、2、9、10至32、39和40，共28个，他们的和是574。请
【基础算法】贪心 (二) ：推公式让我们一起加油好吗 #贪心基础算法篇（一）算法数据结构贪心算法洛谷数学
文章目录什么是推公式1.拼数⭐⭐(1)解题思路(2)代码实现2.ProtectingtheFlowersS⭐⭐⭐(1)解题思路(2)代码实现3.奶牛玩杂技⭐⭐⭐(1)解题思路(2)代码实现什么是推公式如果细说的话，本篇标题应该叫推公式+排序。推公式就是寻找排序规则，排序就是在该排序规则下对整个对象排序。在解决某些问题的时，当我们发现最终结果需要调整每个对象的先后顺序，也就是对整个对象排序时，那么我
图论基础算法入门笔记
图论基础与建图图的定义图是由若干给定的顶点及连接两顶点的边所构成的图形，顶点用于代表事物，连接两顶点的边用于表示两个事物间的特定关系。建图的概念建图是指找到合适的方法将图表示出来。图的存储方法直接存边存储方式：直接使用一个数组，将边的起点与终点信息存储。代码实现：#includeusingnamespacestd;structEdge{intu,v;//边的起点和终点};intn,m;//n为顶点
LeetCode第300题_最长递增子序列 @蓝莓果粒茶算法 leetcode 算法职场和发展学习 c#游戏 python
LeetCode第300题：最长递增子序列文章摘要本文详细解析LeetCode第300题"最长递增子序列"，这是一道考察动态规划和二分查找的中等难度题目。文章提供了动态规划和贪心+二分查找两种实现方案，包含C#、Python、C++三种语言实现，配有详细的算法分析和性能对比。适合学习动态规划和二分查找的读者。核心知识点：动态规划、二分查找、贪心算法难度等级：中等推荐人群：具备基础算法知识，想要提升
LeetCode第301题_删除无效括号 @蓝莓果粒茶算法 leetcode 算法职场和发展 c#学习 python c++
LeetCode第301题：删除无效括号文章摘要本文详细解析LeetCode第301题"删除无效括号"，这是一道考察DFS和括号匹配的困难难度题目。文章提供了DFS和BFS两种实现方案，包含C#、Python、C++三种语言实现，配有详细的算法分析和性能对比。适合学习深度优先搜索和字符串处理的读者。核心知识点：DFS、BFS、括号匹配、字符串处理难度等级：困难推荐人群：具备基础算法知识，想要提升搜
【机器学习】机器学习的基本分类-监督学习-线性回归（Linear Regression） IT古董人工智能机器学习机器学习分类学习人工智能线性回归
线性回归是监督学习中的一种基础算法，用于解决回归问题。它通过拟合一条直线（或平面、高维超平面），来预测输出与输入变量之间的关系。1.线性回归的基本概念目标给定输入和对应的输出y，找到一个线性函数：其中：是权重（回归系数）。b是偏置（截距）。y是预测值。损失函数为了找到最佳的w和b，需要最小化预测值和真实值
算法-基础算法-枚举算法（Python）总裁余(余登武) 算法与数据结构算法 leetcode
文章目录前言解题思路题目1两数之和2计数质数前言枚举算法（EnumerationAlgorithm）：也称为穷举算法，指的是按照问题本身的性质，一一列举出该问题所有可能的解，并在逐一列举的过程中，将它们逐一与目标状态进行比较以得出满足问题要求的解。在列举的过程中，既不能遗漏也不能重复。枚举算法的核心思想是：通过列举问题的所有状态，将它们逐一与目标状态进行比较，从而得到满足条件的解。由于
【分治算法】【Python实现】Strassen矩阵乘法「已注销」 #分治算法分治算法 Python
文章目录@[toc]问题描述基础算法时间复杂性Strassen算法时间复杂性问题时间复杂性Python实现个人主页：丷从心·系列专栏：分治算法学习指南：算法学习指南问题描述设AAA和BBB是两个n×nn\timesnn×n矩阵，AAA和BBB的乘积矩阵CCC中元素cij=∑k=1naikbkjc_{ij}=\displaystyle\sum\limits_{k=1}^{n}{a_{ik}b_{kj
【学习】《算法图解》第七章学习笔记：树程序员
前言在前面的章节中，我们学习了数组、链表、散列表等基本数据结构，以及一些基础算法。本章将介绍一种非常重要的数据结构——树(Tree)，特别是二叉搜索树(BinarySearchTree)。树结构在计算机科学中应用广泛，从文件系统到数据库再到人工智能，都能看到树的身影。《算法图解》第七章深入浅出地介绍了树的基本概念、实现和应用，帮助读者理解这一关键数据结构。一、树的基本概念（一）什么是树树是一种分层
【学习】《算法图解》第七章学习笔记：树自学也学好编程程序人生
前言在前面的章节中，我们学习了数组、链表、散列表等基本数据结构，以及一些基础算法。本章将介绍一种非常重要的数据结构——树(Tree)，特别是二叉搜索树(BinarySearchTree)。树结构在计算机科学中应用广泛，从文件系统到数据库再到人工智能，都能看到树的身影。《算法图解》第七章深入浅出地介绍了树的基本概念、实现和应用，帮助读者理解这一关键数据结构。一、树的基本概念（一）什么是树树是一种分层
10个基于Python的计算机视觉实战项目云博士的AI课堂基于Python计算机视觉 python 计算机视觉机器视觉人工智能
10个基于Python的计算机视觉实战项目，涵盖多个领域和应用场景，每个项目均附有GitHub地址、概述、解决的问题及应用场景：1.PCV图像处理与计算机视觉库GitHub地址:jesolem/PCV概述:提供计算机视觉基础算法的Python实现，包括图像分割、直方图均衡化、图像增强等。解决的问题:简化图像处理流程，支持快速实现算法原型。应用场景:学术研究、教学实验、图像预处理任务。2.基于朴素贝
LeetCode第287题_寻找重复数 @蓝莓果粒茶算法 leetcode 算法职场和发展 c#学习 python c++
LeetCode第287题：寻找重复数文章摘要本文详细解析LeetCode第287题"寻找重复数"，这是一道考察数组和二分查找的中等难度题目。文章提供了二分查找和快慢指针两种实现方案，包含C#、Python、C++三种语言实现，配有详细的算法分析和性能对比。适合学习数组操作和查找算法的读者。核心知识点：二分查找、快慢指针、数组操作难度等级：中等推荐人群：具备基础算法知识，想要提升数组操作和查找算法
【C语言练习】100. 使用C语言实现简单的自然语言理解算法视睿从零开始学习机器人 c语言算法开发语言排序算法
100.使用C语言实现简单的自然语言理解算法100.使用C语言实现简单的自然语言理解算法关键词匹配算法简介示例代码：简单的关键词匹配算法代码说明示例运行扩展功能其他方法基于规则的方法统计机器学习方法C语言中统计机器学习方法概述常见统计机器学习算法的C实现贝叶斯定理基础算法核心思想常见变体实现示例（Python）优缺点优化库与工具性能与注意事项有限状态自动机（FSA）深度学习接口调用混合方法100.
从搬砖工到架构师，Java全栈知识体系（2025版）程序员岳彬 java 开发语言后端程序人生
文章目录一、前端技术体系1.前端基础2.前端框架与生态3.工程化工具4.跨端与性能优化二、后端Java技术体系1.Java核心基础2.后端Web开发3.持久层技术4.微服务与中间件三、运维与DevOps1.Linux服务器2.容器与集群3.持续集成/部署4.监控与日志四、AI算法与大模型集成1.基础算法2.大模型工程实践3.应用场景五、工程工具与最佳实践1.开发工具2.代码规范与质量3.架构设计六
图像基础算法学习笔记 jerry201108 视觉基础知识学习笔记计算机视觉
目录概要一、图像采集二、图像标注四、图像几何变换五、图像边缘检测Sobel算子Scharrt算子Laplacian算子Canny边缘检测六、形态学转换十三、图像去噪概要参考书籍：《机器视觉与人工智能应用开发技术》廖建尚，钟君柳出版时间：2024-02-01图像采集图像标注：绘制直线、矩阵、圆形、椭圆和多边形图像灰度转换：灰度化、二值化等图像转换方法图像几何变换：图像旋转、图像镜像、图像缩放、图像透
推荐算法介绍-基础算法盒子6910 运维视角下的广告业务算法推荐算法机器学习 c++java python
本系列教程也可以称为【深度学习-推荐系统】的读书笔记，该书系统化讲解了现代推荐系统的演进历程和工程实现，是一本非常优秀的推荐系统入门教程一、推荐系统架构1.1推荐系统介绍概述：获得“用户信息”、“物品信息”、“场景信息”的基础上，推荐系统要处理的问题可以形式化的定义为对于用户U(user)，在特定场景C(context)下，针对海量的“物品信息”，构建一个函数f(U,I,C)，预测用户对特定候选物
【原神 × 二叉树】角色天赋树、任务分支和圣遗物强化路径的算法秘密！星之尘1021 游戏视角下的算法通识课算法
【原神×二叉树】角色天赋树、任务分支和圣遗物强化路径的算法秘密！作者：星之辰标签：#原神#二叉树#天赋树#任务分支#圣遗物强化#算法科普发布时间：2025年6月总字数：6000+一、引子：提瓦特大陆的“树型奥秘”你是否曾留意过《原神》角色面板的天赋树？升级技能要先解锁前置分支，圣遗物强化出现“加成路径”，主线剧情层层递进……其实，这些常见的“分叉与递归”，都和二叉树这类基础算法结构有着天然联系！二
中美大模型技术路径差异解析：产品经理视角下的核心逻辑与产业启示 charles666666 人工智能产品经理语言模型自然语言处理产品经理
一、基础研究与工程化能力的差异化演进在技术底层架构层面，中美呈现出显著的路径分野。美国企业更注重基础算法突破与通用能力建设，如OpenAI通过Transformer架构的持续迭代，将模型参数量推升至万亿级别（如GPT-4Turbo的1.8万亿参数）。这种“技术驱动型”模式强调对长文本理解、多模态融合等底层能力的突破，其核心逻辑在于构建通用人工智能的“技术护城河”。中国技术路径则更聚焦场景驱动的工程
学而思编程2025年CodeStars年度综合评估真题解析 | 基础算法组 T1 除虫计划热爱编程的通信人算法
欢迎大家订阅我的专栏：算法题解：C++与Python实现！本专栏旨在帮助大家从基础到进阶，逐步提升编程能力，助力信息学竞赛备战！专栏特色1.经典算法练习：根据信息学竞赛大纲，精心挑选经典算法题目，提供清晰的代码实现与详细指导，帮助您夯实算法基础。2.系统化学习路径：按照算法类别和难度分级，从基础到进阶，循序渐进，帮助您全面提升编程能力与算法思维。适合人群：准备参加蓝桥杯、GESP、CSP-J、CS
如何成为一名优秀的产品经理一点.点 #自动驾驶相关知识点自动驾驶汽车
一、夯实核心基础深入理解智能驾驶技术栈：感知：摄像头、雷达（毫米波、激光雷达）、超声波传感器的工作原理、优缺点、融合策略。了解目标检测、跟踪、SLAM等基础算法概念。定位：GNSS、IMU、高精地图、轮速计等定位技术，RTK，定位精度与可靠性。规划决策：路径规划（全局/局部）、行为决策（跟车、换道、路口处理）、运动控制（纵向/横向控制）。了解状态机、规则引擎、预测算法等。地图：高精地图（HDMap
Day123 | 灵神 | 二叉树 | 找树左下角的值为了前进而后退，为了走直路而走弯路刷题记录 c++算法深度优先数据结构二叉树
Day123|灵神|二叉树|找树左下角的值513.找树左下角的值513.找树左下角的值-力扣（LeetCode）思路：初学者可以看灵神视频二叉树的层序遍历【基础算法精讲13】_哔哩哔哩_bilibili我的思路就是在每层的循环前加个判断，把res更新队头元素，队头肯定是最左边的灵神思路是先入队右孩子再入队左孩子，这样最后一个出队的肯定是最左边的完整代码：笔者思路：classSolution{pub
实习校招面试手撕代码真题题型7——滑动窗口学会歌唱的老周 #面试 java 数据结构 leetcode 算法题手撕代码面试手撕
滑动窗口思路:连续最大长度要想起滑动窗口可以去看下这个up讲滑动窗口的视频，我就是看了他讲的，讲的很不错：滑动窗口【基础算法精讲03】_哔哩哔哩_bilibili1最长不重复子串3.无重复字符的最长子串-力扣（LeetCode）publicintlengthOfLongestSubstring(Strings){intn=s.length();//左指针intleft=0;//最长子串的长度int
编程日志5.15 牛牛程序员成长日记哈希算法算法 c++
哈希表的基础算法#includeusingnamespacestd;//哈希表结点类定义//这段代码定义了一个名为HashNode的模板类，用于哈希表中的结点，其中每个结点存储一个键值对。//哈希表结点类template//模板声明，用于定义一个通用的类模板，可以用于处理不同类型的键KeyType和值ValueTypeclassHashNode{public:KeyTypekey;//存储结点的键
梦熊解析：202505基础算法 C-DHEnry 算法图论
T1-最小数码解法：第一问答案为2n，因为从n变成2n的过程中，若进位会使数码和减少（逢十进一），因此不进位时数码和最大。不进位的充要条件是每一位权值在4以内。第二问需找到每一位均为4或更小，且数码和为n的最小值。为使位数最少，贪心策略是尽可能多填4，小数放前。示例：若n=5，答案为14若n=8，答案为44Code:#includeusingnamespacestd;#definesc(x)sca
算法 - 常用模板（一）（Java） zhaozll 算法专栏算法 java leetcode
算法-常用模板（一）（Java）很多情况下，一些基础的代码在求解复杂问题时可以进行复用，而无需重复造轮子。因此，本篇对一些常用的基础算法进行了总结。由于笔者目前仍在学习阶段，因此本篇将保持长期更新状态，目前并不代表最终的完全版本。一、链表相关1.1链表数据结构来自lc。/***Definitionforsingly-linkedlist.*publicclassListNode{*intval;*
如何优化搜索系统的分词效果？7个实用技巧搜索引擎技术 ai
如何优化搜索系统的分词效果？7个实用技巧关键词：搜索系统、分词优化、中文分词、NLP、搜索引擎、文本处理、算法优化摘要：本文深入探讨了搜索系统中分词效果的优化方法。我们将从分词的基本原理出发，分析影响分词效果的关键因素，并提出7个实用技巧来提升分词准确性。文章涵盖了从基础算法选择到高级优化策略的全方位内容，包括词典构建、算法调优、上下文理解等多个维度，并通过实际代码示例和案例分析展示每种技巧的具体
mysql关于join查询优化的方法 W-vergil 微服务 mysql
一、JOIN底层原理MySQL的JOIN操作核心基于嵌套循环算法（Nested-LoopJoin），结合索引优化和缓存机制提升性能。以下是其核心实现机制：1.Nested-LoopJoin（NLJ）基础算法驱动表选择优化器优先选择数据量较小的表作为驱动表（外层循环表），以减少循环次数。执行流程foreachrowin驱动表:foreachrowin被驱动表:if匹配JOIN条件:输出结果集时间复杂
AI 的 6 大核心方向 + 学习阶段路径星火撩猿 AI &大模型人工智能学习
一、机器学习（ML）目标：用数据“训练”模型，完成分类、回归、聚类等任务。学习阶段：（1）基础数学：线性代数、概率统计、微积分（适度）（2）ML基础算法：线性回归、决策树、KNN、SVM（用scikit-learn）（3）模型优化：交叉验证、正则化、特征工程（4）无监督学习：K-Means、PCA、DBSCAN（5）实战项目：房价预测、信用评分、客户分类等推荐工具：Python、scikit-le
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号

【数学基础】 线性代数以及符号编总