对有限覆盖引理的一些理解

对有限覆盖引理的一些理解

定理描述

有限覆盖原理又称为博雷尔-勒贝格原理 1, 在卓里奇的<<数学分析>>中是这样描述的:

在覆盖一个闭区间的任何开区间族中都有覆盖该闭区间的有限子族. 1

在菲赫金哥茨的 <<微积分学教程>> 中是这样描述的:

在闭区间 $[a, b]$ 被一个开区间的无穷系 $\Sigma = \{\sigma\}$ 所覆盖, 则恒能从 $\Sigma$ 里选出有限的子系$\Sigma^* = \{\sigma_1, \sigma_2,\dots, \sigma_n\}$ 它同样能覆盖全区间. 2

证明方法

我所知的对这个定理进行的证明方法有两个.(请原谅我的孤陋寡闻)

证法一:

前提: $X_k\,(k \in Z)$ 是一开区间, 现有无限个开区间的集合 $S = \{X_k\}$, 并集 $P = {\displaystyle \cup \atop {X_k \in S}} {X_k}$ 覆盖闭区间 $[a, b]$.

  1. 现假设存在一个区域 $({a}^{'}, \, {b}^{'})$ , 无论都无法从$S$中选出有限的 $X$ 集 $U$ 完全覆盖此区域.
  2. 既然 $({a}^{'}, \, {b}^{'})$ 没有被完全覆盖, 那么其中定然存在一个更小的区域 ${({a}^{''}, \, {b}^{''})} \subset {({a}^{'}, \, {b}^{'})}$ , 即 $({a}^{''}, \, {b}^{''})$ 中所有的点都不被有限的 $X$ 覆盖. 假设 $\lambda \in {({a}^{"}, \, {b}^{"})}$ , 那么 $\lambda$ 必然也没有被覆盖.
  3. 但是根据条件, 存在确定的 $p\,\,(p \in Z)$ 使 $\lambda \in X_p$ 成立, 将 $X_p$ 加入到选出的有限集合 $U$ 中, $U$ 还是有限的, 而 $\lambda$ 被覆盖了, 与假设矛盾.

证法二:

前提: $X_k\,(k \in Z)$ 是一开区间, 现有无限个开区间的集合 $S = \{X_k\}$, 并集 $P = {\displaystyle \cup \atop {X_k \in S}} {X_k}$ 覆盖闭区间 $[a, b]$.

  1. 可以肯定$[a, b]$中存在一个包含 $a$ 的闭区间可以被有限的 $X$ 集合覆盖, 假设 $x^*$ 是这个区间的最大值, 即 $[a, x^*] \,\, ([a, x^*] \subset [a, b])$ 被有限的 $X$ 集合, 且 $x^* \leq b$.
  2. 因为 $x^* \in X_k$, 且 $X_k$ 是开区间, 那么存在 $\epsilon > 0$ 使 $(x + \epsilon) \in X_k$ 成立, 简单的说就是一定还存在 $x^{'} > x^*, x^{'} \in X_k$. 因此 $x^* = b$

困惑

虽然以上两个证明过程看起来都很简单, 但是我最初还是很难理解这里边的道理, 主要疑问有以下几个:

  1. 证法一中的第 3 步, 虽然在有限集 $U$ 中加入新的 $X_k$ 后, 可将未被包含的点 $\lambda$ 也加入进来, 可是如何理解只需要再增加有限个 $X_k$ 就能覆盖完毕所有的剩下的其他类似的肯能是无限多的 $\lambda$ 点.
  2. 证法二中的第 2 步, 表明 $\exists x \in X_k , x \in (a, b) \Rightarrow \exists x^{'}, x^{'} > x, x^{'} \in (a, b), x^{'} \in X_k$, 这个可以理解为一种类似"传递性"的效果. 可是这个"传递性"如何体现出"有限"性呢? 算句话说通过一个 $x \,\, (x < b)$ 可以推导出 $b$ 也被覆盖, 可是如何理解 $x$ 与 $b$ 之间只差了有限个 $X_k$ , 为什么不是无限个 $X$ ?
  3. 为什么被覆盖区域要求是闭区间, 而覆盖区域是开区间, 否则该定理不一定成立呢? (这一点很多书籍的作者会强调)

自己的一些理解

以上困惑始终困扰者我, 尤其是前两点. 仔细思考, 其实我的主要困惑就是一个, 在这个定理中, 无限跨向有限的桥梁究竟是如何建立的?

为了弄清楚定理背后的道理, 我重新对定理进行思考, 为了便于后面的叙述, 我采用<<微积分学教程>>中对于该定理的描述:

在闭区间 $[a, b]$ 被一个开区间的无穷系 $\Sigma = \{\sigma_k\} \, (k = 1, 2, 3, \dots)$ 所覆盖, 则恒能从 $\Sigma$ 里选出有限的子系 $\Sigma^* = \{\sigma_{k_1^{'}}, \sigma_{k_2^{'}},\dots, \sigma_{k_n^{'}}\}$ 它同样能覆盖全区间.

其中的每个 $\sigma_k \, (k \in Z)$ 其实也可视为一个邻域, 假设 $\sigma_k = (a_k, b_k)$, 令其中心点为 $c_k = \dfrac{(a_k + b_k)}{2}$;
再令其半径为 $\epsilon_k = \dfrac{ b_k - a_k}{2}$, 那么邻域也可表示为 $\sigma_k = (c_k - \epsilon_k, \, c_k + \epsilon_k)$.

[思考 1] 一个开区间覆盖一个闭区间和多个开区间合起来覆盖一个闭区间意味着什么?

如果 $[a, b] \subset (a^{'}, b^{'})$ 那么 $a^{'} < a \,\wedge \, b^{'} > b$.

假设有两个开区间 $\sigma_1 = [a_1, b_1], \, \sigma_2 = [a_2, b_2], \, a_2 > a_1, \, b_2 > b_1$, 如果这两个开区间都无法单独覆盖闭区间 $[a, b]$, 但合起来却可以, 则 $a_1 < a, \, b_2 > b$ 且 $\sigma_1 \cap \sigma_2 \neq \varnothing \, (b_1 > a_2)$.

总结: 如果多个开区间需要合起来才能覆盖一个闭区间, 那么对于每个开区间都有其他开区间与之相交, 以防止出现"缝隙", 且这些开区间合并后还是开区间; 必须被覆盖的闭区间的起点被包含在某个开区间中, 终点亦是如此, 即在合并后的开区间中存在无数的 $a^{*} \, (a^{*} < a)$ 和 $b^{*} \, (b^{*} > b)$.

[思考 2] 定理不太好理解, 那么能不能增加一些条件让定理变得更显而易见一些?

试着给邻域中心距离加上最小值的限制, 定理似乎就比较好理解了.
假设任意不同的邻域的中点的距离 $|c_k - c_{k^{'}}|$ 有非零最小值 $d_{min}$, 则任意邻域的半径最小值必须满足 $\epsilon_{min} > \dfrac{d_{min}}{2}$ .
用以下办法可以选出不超过 $\dfrac{(a + b)}{d_{min}} + 2$ 个 $\sigma_k$ 组成的区域就可以覆盖整个$[a, b]$:

先做一个方便的假设, 如果 $k < k^{'}$ 那么 $c_k < c_{k^{'}}$, 即下标越大的邻域 $\sigma_k$ 的中心点越大. 下边我们来选出我们需要的 $\sigma$ 并不断的加入 $\Sigma^*$:

步骤 1 往 $\Sigma^*$ 中加入一个包含 $a$ 点的邻域 $\sigma_r$ , 此时 $\Sigma^* = \{\sigma_r\}$. 如果 $b \in \sigma_r$, 则结束这个过程, 否则进行步骤二.

步骤 2 在所有 $\sigma_k \ (k > r)$ 中选出与 $\sigma_r$ 相交(根据[思考 1]的结论, 这样的开区间是存在的), 且 $c_k - c_r$ 最大的邻域, 假设为 $\sigma_t$, 则把 $\sigma_t$ 加入 $\Sigma^*$ 中, 此时 $\Sigma^* = \{\sigma_r, \sigma_t\}$ . 如果 $b \in \sigma_p, \sigma_p \in \Sigma^{*}$ 成立(即 $b$ 被选出的区间包含), 则结束选择过程, 否则以最新加入的区域为基础, 重复本步骤.

这样选出的邻域个数不会超过 $\dfrac{(a + b)}{d_{min}} + 2$ 个.

[思考 3] 在[思考 2]的基础上想想去掉限制条件, 如何让定理成立?

现在考虑将 "任意不同的邻域的中点的距离 $|c_k - c_{k^{'}}|$ 有非零最小值 $d_{min}$" 这个条件去掉, 为了方便, 我们假设 $k \to \infty$ 时, $d_k = |c_{k} - c_{k-1}| \to 0$.

分析这样一个例子, 设邻域 $\sigma_k$ 的中心 $c_k = - \dfrac{1}{k} ,\, (k = 1, 2, 3, \dots)$ , 这样的邻域如何能完全覆盖闭区间 $[-1, 0]$ 呢?

1.我们首先考虑如果 $\sigma_1$ 的半径足够大的情况.

例如设 $\epsilon_1 = 2$, 那么 $\sigma_1 = (-3, 1)$ 已完全覆盖 $[-1, 0]$ , 可见如果邻域半径足够大, 那么必有有限的邻域可覆盖闭区间, 条件是存在 $p, q \in Z$, 使 $ c_p - \epsilon_p < a, c_q + \epsilon_q > b $ 成立. 定理成立.

2.考虑 $k \to \infty$ 时, $\epsilon_k \to 0$ 的情况.

  首先 $\Sigma$ 不能在 $[a, b]$ 内有"缝隙", 因为 $c_{k+1} - c_k = \dfrac{1}{k(k+1)}$ , 不妨可设 $\epsilon_k = \dfrac{1}{k(k+1)} \Rightarrow \epsilon_k + \epsilon_{k+1} > c_{k+1} - c_k$, 如此就有 $\sigma_k \cap \sigma_{k+1} \neq \varnothing$ 保证了 $\Sigma$ 内部不会有"缝隙".
由上可得:
$$\sigma_k = (-\dfrac{1}{k} -\dfrac{1}{k(k+1)}, \, -\dfrac{1}{k} + \dfrac{1}{k(k+1)}) = (-\dfrac{k+2}{k(k+1)}, \, -\dfrac{1}{k+1})$$
$$\{\sigma_k\} = \{(-\dfrac{3}{2},-\dfrac{1}{2}), \, (-\dfrac{2}{3}, -\dfrac{1}{3}), \, (-\dfrac{5}{12}, -\dfrac{1}{4}), \dots \}$$可以看出 $\Sigma$ 不可能包含 $b$ 点, 因为 $k \to \infty$ 时 $b_k = -\dfrac{1}{k+1} \to 0$, 无论如何 $b_k$ 不可能大于 $0$ , 无法满足使定理成立的前提条件.
  如果我们给 $\epsilon_k$ 加上一个小小常数, 情况将变得不一样, 设 $\epsilon_k = \dfrac{1}{k(k+1)} + \lambda$ , $\lambda$ 是一大于 0 的常数. 根据包含 $b$ 点的条件:
$$-\dfrac{1}{k+1} + \lambda > 0 \Rightarrow k < {\dfrac{1}{\lambda} - 1}$$
例如如果 $\lambda = \dfrac{1}{10000}$, 那么 $\Sigma$ 的前 10000 个邻域组成的集合 $\Sigma^* = \{\sigma_1, \sigma_2, \dots , \sigma_{10000}\}$ 可覆盖 $[-1, 0]$

  至此可以总结一下, 如果无穷系 $\Sigma$ 能够包含 $b$ 点, 那么 $k \to \infty$ 时, 有
$$b \in \sigma_k = (c_k - \epsilon_k, c_k + \epsilon_k) \Rightarrow c_k + \epsilon_k > b$$
那么一定存在一个确定的整数 $k^*$, 满足 $c_k + \epsilon_k > c_{k^*} + \epsilon_{k^*} > b$ , 或者这样说假设 $k \to \infty$ 时, $c_k + \epsilon_k \to B$ , 那么对于任意确定的值 $p < B$, 存在确定的 $k^{'}$, 对所有 $k > k^{'}$ 有 $c_k + \epsilon_k > p$, $b$ 可以看成 $p$ 的一个特例.
  根据有限极限的数列的定理(这里只是为了方便理解, 而不是用数列极限理论来证明有限覆盖定理):

若整序变量 $x_n$ 趋于极限 $a$, 又 $a > p \,\, (a < q)$, 则一切变量的数值, 从某项起, 将有 $x_n > p \,\, (x_n < q)$ . 2

结合前面所述, 设有一数列:
$$\{x_k\} = \{c_k + \epsilon_k\}, 且 \displaystyle \lim_{k \to \infty} x_k = B\label{eq:test}\tag{1}$$
因为 $B > b$, 根据数列的定理, 从某一项起, 有 $x_k > b$, 因此有限覆盖定理成立.

[思考 4] 为什么定理中规定用开区间去覆盖闭区间, 为什么不能用闭区间去覆盖闭区间?

如果 [思考 3] 的问题想通了, 这个问题自然就想通了. 如果 $[a, b] \subset [a^{'}, b^{'}] \Rightarrow a^{'} \leq a \,\wedge \, b^{'} \geq b$.
如果 $\Sigma$ 是闭区间的无穷系, 结合 $\eqref{eq:test}$ 式不能推导出 $B > b$, 因为有可能 $B = b$. 因为只有在 $k \to \infty$ 时才有 $x_k = b$, 因此无法用有限的 $\sigma_k$ 去覆盖 $[a, b]$

参考


[1] B.A.卓里奇: 数学分析(第一卷)(第七版). 李植译. 北京, 高等教育出版社


[2] Г. М. 菲赫金哥尔茨: 微积分学教程(第一卷)(第八版). 杨弢亮, 叶彦谦译. 北京: 高等教育出版社

你可能感兴趣的:(数学)