反对称变换
第二类特殊的正规变换满足如下条件.
问题 8.65 设
为
维 Euclid 空间,
, 则下列条件等价:
(1)
;
(2) 对任意
,
;
(3) 对任意
,
;
(4)
在任何标准正交基下的矩阵都是反对称的.
满足上述等价条件的变换称为反对称变换. 与对称变换可对角化不同, 反对称变换的标准形离不开二阶块.
问题 8.66 设
为反对称变换, 则存在一组标准正交基使得
的矩阵为
其中,
,
为正实数.
于是我们很容易得到反对称矩阵的特征值和特征向量的性质.
问题 8.67 设
为反对称矩阵,
为
的复特征值,
为
的特征向量.
(1) 证明:
是纯虚数或零;
(2) 若
,
, 证明:
且
.
对称变换
第三类也是最值得关注的正规变换是对称变换, 即满足
. 利用正规变换的标准形, 再注意到二阶对称矩阵一定有实特征值就可以得到:
问题 8.68 设
为
维 Euclid 空间,
, 则下列条件等价:
(1)
(2) 对任意
,
(3)
在任何标准正交基下的矩阵为对称矩阵;
(4)
在某组标准正交基下的矩阵为对角矩阵.
从而有
问题 8.69 对称变换
的特征多项式的根都是实根. 设
是
的全部不同的特征值, 则
且特征子空间两两正交.
上述推论可用矩阵语言来表述为
问题 8.70 设
为对称矩阵, 则存在正交方阵
(可取
) 使得
此对角矩阵称为
在正交相似下的标准形.
上述结论我们在讲正定矩阵的时候已经得到了, 只是需要很多技巧; 现在用内积的观点来看就自然多了, 简洁而漂亮.
求实对称矩阵
在正交相似下的标准形的步骤, 与求其 Jordan 标准形的步骤类似.
问题 8.71 (1) 求出
的所有不同特征值
.
(2) 求特征子空间的一组标准正交基: 先求齐次线性方程组
的基础解系, 在将其标准正交化.
(3) 将特征子空间的标准正交基作为列向量得到正交矩阵
, 则
通常, 求一般矩阵相似下的标准形不需要标准正交基. 正交相似的要求更高, 性质自然更好. 最直接的用途就是正交相似同时也实现了合同变换, 这就为我们研究对称矩阵带来了很大的便利.
矩阵分解
利用对称矩阵的标准形, 我们很容易得到如下结论(对比一下以前的方法).
问题 8.72 实对称矩阵
是正定(半正定)的当且仅当
的特征值都大于(大于等于)零.
这样利用正交相似标准形, 我们就可以对半正定矩阵开方(实际上开任何次方都可以).
问题 8.73 设
为半正定矩阵, 证明: 存在唯一半正定矩阵
使得
.
对于一般的矩阵
,
是半正定的, 于是存在半正定矩阵
使得
. 如果
可逆, 则
也可逆, 于是有
问题 8.74
是正交矩阵, 从而对任意可逆矩阵
有唯一的分解
, 其中
为正交矩阵,
为正定矩阵.
当
不可逆时, 考虑
的正交相似下的标准形, 注意到
的列向量的关系, 也能得到:
问题 8.75 任意
有分解式
, 其中
为正交矩阵,
为半正定矩阵
. 这里,
是唯一的,
不一定唯一.
上述分解就是方阵的极分解. 例如对于
, 记
则极分解为
. 注意到
对应于复数
极分解可以看作是极坐标的推广, 这一点到后面酉空间时会看得更加清晰.
在上述问题中, 利用
正交相似标准形就能得到方阵的奇异值分解.
问题 8.76 设
, 证明: 存在实对角矩阵
和正交矩阵
使得
其中,
, 称为
的奇异值, 也就是
的特征值的算术平方根.
当然, 我们也可以用
代替
, 因为这两者有相同的特征值, 更进一步有
问题 8.77 设
, 则
与
正交相似.
利用正定矩阵的性质可以处理很多问题. 试举两例如下. 更多的问题见书中习题.
问题 8.78 设
对称, 且
是正定的, 证明:
(1)
的复特征值都是实数, 且
可对角化;
(2) 若
也是正定的, 则
的复特征值为正实数.
问题 8.79 设
对称, 且
是正定的, 证明: 存在实可逆矩阵
使得
都是对角矩阵.
酉内积
复线性空间上也可以定义向量的长度, 不过不能用通常的二次型.
问题 8.80 复线性空间上的对称双线性函数
不可能满足正定性.
对于复数
, 我们定义其长度满足
. 对一般情形, 我们考虑
问题 8.81 对任意
可以定义其长度满足
这里,
. 类似于二次型与二元函数的关系, 这个长度对应于
上的二元函数
将该二元函数的性质总结推广, 称复线性空间
上的二元复函数
为
上的 Hermite 型, 如果
满足:
共轭对称性: 对任意
,
. 这里,
是
的共轭复数;
线性性: 对任意
,
,
特别地, 我们称
为
对应的 Hermite 二次型.
问题 8.82 Hermite 型
是共轭对称的并且对第一个变量是线性的, 对第二个变量是共轭线性的(要求第二个变量是线性的、第一个变量是共轭线性的也可以).
正定的 Hermite 型就是(酉)内积, 具有内积的复线性空间就是酉空间. 酉空间的研究思路与 Euclid 空间的几乎一致, 不同的是, 酉空间的研究要比 Euclid 空间容易, 因为复线性变换的特征值都能取到, 不会出现实线性变换的特征值不存在的麻烦. 关于这一部分内容, 我的教材中也是以问题的形式展现的, 参考教材即可. 这里仅把其中重要的列出来.
问题 8.83 (1) 长度可以定义, 但是夹角的意义不大, 有用的是正交情形, 即内积为零.
(2) Cauchy-Bunyakovski 不等式的证明与 Euclid 空间情形一样, 其中的判别式法也能用, 不过需要做一点调整: 参数
用一个合适的复参数.
向量长度自然是由
决定的. 如果是对称双线性函数,
自然能被
唯一确定. 对于 Hermite 型, 这个结论也是对的, 只是要麻烦一些.
问题 8.84 设
是酉空间
上的内积, 记
, 证明极化恒等式:
酉矩阵
Schmidt 正交化可以得到标准正交基, 标准正交基之间的过渡矩阵是酉矩阵, 即满足
.
阶酉矩阵的全体记为
.
问题 8.85 若
是酉矩阵, 则
的模为
.
行列式为
的酉矩阵称为特殊酉矩阵, 其全体记为
. 容易得到
问题 8.86 (1)
,
.
(2)
这个集合非常有意思. 从几何上看有
问题 8.87
与
维 Euclid 空间的单位球
存在自然的一一对应.
更有趣的是, 把
的条件稍微放宽一点, 考虑
集合
有特别的性质.
问题 8.88 (1)
对于矩阵的加、减、乘法都封闭, 每个非零元都可逆, 其逆也在
中, 也就是说,
对于除法也封闭.
实际上就是四元数, 其一组基为
(2)
是一个
维 Euclid 空间, 其中的内积定义为
对于的二次型为
因此
中每个元
的长度
就是
的行列式
.
(3) 若
, 则
.
对于
, 考虑
上的变换
则有
问题 8.89 (1)
是
上的正交变换, 即
.
(2) 设
,
, 则
.
(3) 对任意
,
是
的不变子空间, 从而,
也是
的不变子空间.
(4) 设
, 则
(5) 作为
上的线性变换,
在基
下的矩阵为
其中
,
.
(6) 映射
,
, 满足
进一步,
是一个满射, 且对任意
,
有且仅有两个元素.
一般情形, 酉矩阵与正交矩阵也有关系.
问题 8.90 设
,
, 证明:
为酉矩阵当且仅当
为(特殊)正交矩阵.
正规变换
类似于 Euclid 空间情形, 半单线性变换在酉空间中也占据重要地位. 意料之外又是情理之中的是, 在酉空间处理类似问题要比 Euclid 空间简单.
问题 8.91 设
为
维酉空间,
, 则下列条件等价:
(1) 任何
-子空间的正交补也是
-子空间;
(2) 在
的某组标准正交基下
的矩阵为对角矩阵.
(3)
是正规变换, 即满足
既然可对角化就方便多了. 不过需要注意的是, 在标准正交基下
的矩阵为
, 则
的矩阵为
. 这与 Euclid 空间略有不同, 其原因自然是内积的共轭线性性. 自然有三类
问题 8.92 设
为正规变换,
在标准正交基下的矩阵为
.
(1) 若
, 则称
为酉变换. 此时,
.
(2) 若
, 则称
为 Hermite 变换. 此时,
.
(3) 若
, 则称
为反 Hermite 变换. 此时,
.
值得注意的是, 对称变换和反对称变换差异很大, 所有对称变换构成的线性空间与所有反对称变换构成的线性空间的维数也不一样. 但是 Hermite 变换与反 Hermite 变换仅有细微的差别.
问题 8.93 设
, 则
为 Hermite 变换当且仅当
为反 Hermite 变换. 从而, Hermite 变换的全体与反 Hermite 变换的全体之间存在一一对应, 且这个对应是线性同构(作为实线性空间).
无穷维内积空间
在分析学中, 我们遇到的都是函数空间, 这样的空间几乎都是无穷维的.
问题 8.94 设
上的双线性函数满足
.
(1) 证明:
是
上的内积;
(2) 记
, 求
.
从这个问题可以看出, 无限维与有限维差距很大, 处理无限维空间的问题需要小心一点. 不仅如此, 无限维空间还有更大的麻烦.
问题 8.95 设
的内积如上, 考虑多项式列
则对任意
, 存在
, 使得当
时有
这里,
就相当于一个 Cauchy 列, 其极限不存在. 这种情形与有理数域中的 Cauchy 列极限不一定存在类似. 我们可以考虑有理数域的完备化, 即考虑其中所有 Cauchy 列的全体构成的线性空间
, 极限为零的 Cauchy 列为子空间
, 则
与
之间存在线性同构(有理数域上). 利用类似想法, 我们可以考虑
中 的完备化. 为此我们可以建立多项式和数列之间的对应关系.
问题 8.96 设
, 定义
中加法、数乘和乘法为
中内积定义为
定义映射
为
其中,
, 则
是等距同构且满足
于是我们可以考虑更大的数列空间. 首先看看
中的 Cauchy 列的特点.
问题 8.97 设
(
) 是
中的 Cauchy 列.
(1) 证明: 每个向量的第
个坐标构成的数列
是收敛的, 设极限为
;
(2) 证明: 数列
满足
(3) 令
, 则
是 Cauchy 列.
直观上可以看出来
是
与
的极限, 不过, 我们需要先把空间
扩大一点.
问题 8.98 设
; 对任意
定义加法与数乘及二元函数为
(1)
是一个 Euclid 空间.
(2)
是完备的, 即
中任何 Cauchy 列在
都有极限.
这样的空间是 Hilbert 首先考虑的, 因此被称为 Hilbert 空间.
度量
内积的一大用途是定义了向量的长度, 从而也能定义任意两点
的距离
这个距离满足如下性质.
问题 8.99 (1) (正定性)
, 且等号成立当且仅当
;
(2) (三角不等式) 对任意
,
(3) (绝对齐性)
;
(4) (平移不变性)
.
一般来说, 距离只要满足 (1), (2) 即可. 不过, 在线性空间中, 要求 (3), (4) 也是很自然的, 性质也会好很多. 问题是除了内积还有其他定义满足上述四条性质的距离的方式吗?
首先由平移不变性可以的
因此我们只需要定义任意一点与
的距离即可. 于是定义函数
为
称
为
的范数, 它自然满足
问题 8.100 (1) (正定性)
, 且等号成立当且仅当
;
(2) (三角不等式) 对任意
,
(3) (绝对齐性)
.
比如, 若
是 Euclid 空间, 任意
的范数可以定义为
函数空间的内积或许更有启发性: 对任意
, 内积定义的范数为
很自然地(?)想到如下推广.
问题 8.101 设
,
, 对任意
, 定义
则
是一个范数, 称为
范数.
这儿的难度是三角不等式, 即 Minkovski 不等式的证明.
线性变换的范数
考虑线性空间不可避免要考虑线性变换. 考虑线性变换或矩阵的范数会有意想不到的发现. 首先考虑对称矩阵.
问题 8.102 设
对称, 又
的特征根分别位于区间
,
, 证明:
的特征根位于区间
.
这个结论告诉我们对称矩阵的最大特征值似乎具有范数所要求的三角不等式. 不过特征值可能是负数, 而要定义范数自然有
, 所以可以考虑特征值的绝对值的最大值.
问题 8.103 设
为
阶实对称矩阵构成的线性空间, 对任意
, 定义
为
的特征值的绝对值的最大值, 则
是
上的范数.
不过, 这个定义不方便操作, 改写一下会好一些.
问题 8.104 设
对称,
为
的最小和最大特征值. 对任意
,
, 称
为
的 Rayleigh 商, 或者定义
(1)
,
;
(2)
.
对于一般的矩阵
, 实特征值不一定存在. 我们用奇异值代替, 即考虑
的特征值的最大值的平方根.
问题 8.105 对任意
, 定义
则
是
上的范数.
注意到
, 于是有
问题 8.106 对任意
有
这样就好多了, 可以自然推广到一般的线性变换.
问题 8.107 设
是有限维 Euclid 空间,
, 定义
则
为
上的范数.
实际上, 上述定义还可以推广到线性映射或更一般的空间上(需要一些条件), 这是泛函分析要研究的内容. 定义范数是为了计算长度或距离, 而距离在分析中是用来考虑极限、连续等重要概念的基础.
大学三年级的时候学习泛函分析, 第一节课就遇到了一批概念: 赋范空间、赋拟范空间、赋准范空间、赋准拟范空间以及赋
范空间; 后来还有 Frechet 空间、
空间、
空间、
空间、
空间,
空间. 在相当长时间内, 这些定义把人搞得晕头转向, 完全没有意识这些都是可以自然得到的. 当时的课本上没有 Hilbert 空间理论, 这部分是作为补充内容讲授的. 补充的内容当然是更高一等, 难度也应该更大的, 至少我最初的感觉是这样, 怀揣着敬畏之心的. 后来发现完全不是这么回事: 与赋各种范的空间相比, Hilbert 空间要亲切友好得多, 并不因为它的名头太响而拒人于千里之外.
有理数的绝对值
最后提一个好玩的东西. 实数是有理数的完备化, 可以看出有理数的 Cauchy 列的等价类构成的. 不过这里有一个问题, 我们是用有理数的绝对值来定义 Cauchy 列的, 而绝对值满足如下的性质.
问题 8.108 对任意
, 有
(1) (正定性)
, 且等号成立当且仅当
;
(2) (三角不等式)
(3)
这可以看作绝对值与加法和乘法的相容性. 问题是除了通常的绝对值, 还有其他定义
的方式使得上述三个条件都满足吗? 实际上是有的.
问题 8.109 对任意
, 定义
则
满足上题中三个条件.
这就相当于把每个非零有理数的长度都定义为
, 自然是比较平凡的. 有没有不平凡的呢? 的确是有的! 根据条件, 只需要定义素数的长度即可. 如果有兴趣作一番有一定难度的推理, 我们就能发现本质上定义绝对值的方法就是如下的所谓 p-adic 绝对值.
问题 8.110 设
为(正)素数, 对任意素数
, 定义
, 而
. 这样利用
可以定义每一个有理数的绝对值.
满足绝对值的三个条件.
从此, 数学的世界一下子从实数域跳跃到了更广阔的空间, 就像哈勃把人类的视野从银河系带到了更广袤的深空.