随机过程教学中值得注意的问题

0. 现实世界与概率模型

概率论的创立和发展历程几乎包含了人类企图认识世界的全过程, 在概率论的研究过程中, 人们不得不同时面对现实世界和概率模型这两个世界, 相比于研究纯粹数学而言, 部分研究纯粹数学的人可以只面对数学层面的模型世界, 而概率论的研究需要同时面对两者,因此我们就可以理解概率论处理的问题通常更为复杂和困难。另外从数学发展的脉络来看, 基于上面的理由,我们也可以理解为何现代概率论的建立要比许多数学分支晚许多.

在概率论的研究中, 下面的这些问题是我们不得不面对的.

  1. 什么是确定性?
  2. 什么是未知性?
  3. 什么是随机性?
  4. 世界到底是确定性的还是随机的?

这些问题都很难回答, 而且他们的区别并不是我们想象的那样明显.
现在我们来看几个例子.
例1, 我们抛一枚硬币, 请问这个现象是随机的还是确定性的?
如果注意这里的措词, 我们就会发现在描述这个问题的过程中有描述得不够清楚的地方了, 这里的措词用的是现象, 问题是在这个抛硬币的事件中,我们关系的是过程还是结果, 到底是考虑过程的随机性还是结果的随机性, 显然对这个现象的研究, 研究结果和过程是有所不同的. 也许有人觉得这不过是文字游戏, 事实上我想说明的是, 面对复杂而纷繁的世界, 我们使用的语言未必准确描述这个世界, 有时候我们只是自认为描述准确了罢而已.

现在假定我们关心的是结果的随机性, 那么面对抛硬币这个事件, 其结果是否是随机的呢?

面对这个问题,如两个方面的回答是典型的. 一些人说是随机的,而另一些人说是确定性的,后者的典型代表如爱因斯坦,他们会说这个过程本身是确定性的, 我们之所以认为这个事件具有随机性是因为我们对这个过程的认识还不够完全, 还有许多的未知性, 比如我们没有精准地知道抛出瞬间的速度, 所受的力以及硬币在空中运动时具体的受力情况, 如果知道这些信息, 根据牛顿力学理论,我们是可以准确知道硬币落到地面是哪面朝上的(不过在这里很多人却忘记了牛顿力学本身也是我们在认识世界过程中提出的一种数学模型).

当然, 还有相当多的人持第一种观点, 比如波尔, 他们认为抛硬币这个现象本身具有随机性,他们称为内蕴随机性,也就是这个现象本身具有随机性, 而持第二种观点的人则认为是未知性导致我们假设事件具有随机性, 事件本身并不随机.

在这里, 持这两种不同观点的人的核心是世界的可认知性, 毫无疑问, 这个问题一定会导致哲学家乃至科学家们长时间的争论, 不会很快地得到结果.

从例1我们看到, 确定性, 随机性和未知性, 这三者得界限并不像我们想象中那样明显.

1. 什么是随机性?

什么是随机现象? 随机性的本质是什么? 这个世界到底是确定性的还是随机性的, 这些问题几乎是每个科学家都要必须要面对的问题, 同时这些问题也是非常困难的问题, 这些问题困扰了古往今来无数的哲学家和科学家.

关于这个世界到底是随机的还是确定性的这个问题, 在人类科技发展史上, 德国著名物理学家阿尔伯特·爱因斯坦(Albert Einstein,1879年3月14日—1955年4月18日)和丹麦著名物理学家尼尔斯·亨利克·戴维·玻尔(Niels Henrik David Bohr,1885年10月7日—1962年11月18日)这对好友就进行过一场长时间的争论, 他们俩在有生之年谁都没有能说服对方, 并且在今天看来这场争论并没有因为这样伟大的科学家退出历史舞台而结束. 我认为至少到目前为止, 这个问题远远没有一个好的答案.


Albert Einstein
Niels Henrik David Bohr

当然, 对于做数学的人来说, 我们可以耍赖, 采取回避这些问题的办法.

事实上, 从数学的角度来看, 你研究的问题是不是随机的取决于你看问题的视角.
例2 Dirichlet 函数

首先我们从 Dirichlet 函数
\begin{equation} \begin{split} D:&[0, 1]\to \mathbb{R}\\ &x\longmapsto D(x)=\left\{\begin{array}{ll} 1, &\text{ $x$ 是有理数}, \\ 0, &\text{否则}. \end{array}\right. \end{split} \end{equation}
谈起. 见到这个函数, 我想很少会有人说这个Dirichlet 函数是一个随机变量.

现在, 我们从概率的角度来考虑问题. 首先我们给集合 附加一个 代数结构, 例如考虑 上所有的 Lebesgue 可测集构成的 代数 , 然后考虑 上定义的 Lebesgue 测度 , 也就是说考虑函数

其中 为 的 Lebesgue测度, 于是 构成了概率空间;
现在我们再回首来看 Dirichlet 函数.

需要注意, 很多人会说 Dirichlet 函数是病态的, 是不自然的, 显然这中说法是不恰当的.首先Dirichlet 函数的确简单, 它不过表达了我们人类最基本的逻辑判断而已, 它是 上的有理数集的特征函数而已, 其次 Dirichlet 函数是测度论意义下的简单函数, 因此是可测函数, 也就是随机变量.

那么问题来了, Dirichlet 函数到底是不是确定性的还是随机的?

从上面的例子可以看出, 如果不考虑附加在 上的概率空间结构, 那么 Dirichlet 函数是确定性的函数无疑的, 但是当我们在 附加了概率空间结构之后, Dirichlet 函数就变成了随机变量了.

这种看似矛盾的结论的原因在哪里呢. 根源在于随机变量并不具备随机性. 导致我们错误的原因是我们混淆了随机性于可测性, 本质上将,随机变量定义过程中核心的是可测性, 于函数的取值的随机性没有任何关系.

由此我们进一步知道, 随机过程也并不具有随机性,随机过程在定义过程中要点也是体现的一种可测性, 这是实质,是历史遗留下来的问题.

2. 概率论也是研究确定性的数学工具

在大多概率论教材中, 开篇就大谈随机现象, 并多次声明概率论是研究随机现象的数学分支, 并且很多教程都不真正指明这样做的真实意图, 导致很多学生认为概率论只是研究随机现象的数学分支. 事实上, 概率论的创立是为了处理随机想象, 但是我们又凭什么说她只能处理随机现象呢, 为杀牛而打造的牛刀莫非就不能杀鸡吗.

毫无疑问, 概率论最初是为研究随机想象的规律而创立起来的数学分支, 其核心是为了处理和研究随机现象, 但需要注意到:

概率论本质上是研究和发掘隐藏在随机想象背后的确定性规律的数学分支

为什么这样说呢, 对于一个随机事件 , 在概率论中我们关心的往往是这个事件 发生的概率, 也就是, 事实上 本身就是确定性的, 因此概率论研究的对象可能是具有随机性的, 但是其描述随机想象的规律的方式还是确定性的, 因此在研究概率论时没有必要过多纠结我们处理的现象到底是不是随机的问题.
另外, 现代数学中许多的确定性的问题也可以使用随机的方法进行研究, 例如 Jean-Michel Bismut 就使用概率方法给出 Atiyah-Singer 指标定理的证明, 显然 Atiyah-Singer 指标定理在传统上我们认为其隶属于确定性数学的研究范畴, 现在却可以用随机的方法加以证明, 因此随机方法似乎有统一确定性世界和随机性世界的能力和趋势.

3. 随机变量的随机性

从数学的视角来看, 随机变量这个容易给人造成误解的名称是由历史原因造成的, 随机变量的取值性并不具备随机性, 它准确的名称应该叫可测函数, 更准确的称谓应该叫可测映射.

4. 代数结构与可数可加性

在概率的研究中, 往往会出现 代数结构, 这往往让初学者费解, 为什么要考虑这样一种结构.
也就是

对于给定的样本空间 , 我们称 的子集族 为 上的一个 代数, 如果 满足

  1. ;
  2. 对补运算封闭, 即若 , 则 ,
  3. 对可数并封闭, 即 , 则 .

注 1:
我们规定 的元素称为随机事件, 也就是所 是我们考虑的随机事件的集合.
这里面自然有几个问题需要回答.

  • 为什么不将 所有的子集规定为事件呢, 这样做不就能包含所有的可能了吗, 事实上, 这样做的代价就是我们将遇到某些集合无法定义概率测度, 因此从技术上我们不得不放弃研究 所有的子集 的概率测度这种幻想, 只能退而求其次研究 的幂集的子集, 也就是在 的幂集挑选出合适的子集.
  • 为什么要定义 代数, 并且要如此定义能, 从技术上, 我们关系某些事件, 然后自然可以将我们关心的事件汇集起来构成一个集合, 那么我们现在关键之处就在于要挑选出合适的子集, 也就是要考虑这个挑选出来的子集应该具备什么样的性质.
    首先我们在建立模型来处理随机现象时, 样本空间自然是首先考虑的对象 , 即要求 是自然的事情, 另外假如我们考虑了一个随机事件 , 事件 的补 也被自然的考虑到, 一个事件与其补仿佛就像一个人与其影子一样, 如影随形, 不可分离, 因此这就要求我们挑选的这个集合 对补运算封闭, 在这个考虑下, 显然我们要求 具备 1, 2两条性质就合情合理了, 唯独要求 对可数并封闭在似乎是有点奇怪的, 其实这个条件是为了使得概率测度具备可数可加性, 为了我们在 能定义出具备可数可加性的概率测度, 显然若要求 满足可数并封闭就能使得运算自由畅通无阻, 认识到测度的可数可加性是我在测度的研究中前进的一大步.
  • 注意到, 在集合的运算中, 我们要考虑到无穷层次的话, 可数无穷是我们考虑到的最小的无穷层次了, 作为 代数的定义使得我们对集合的运算 在可数无穷的层次上是封闭的, 同时其对集合的差运算也是封闭的. 因此在可数层次来看, 这个集合的运算几乎是畅通无阻.

注 2
在研究随机现象的过程中, 我们选取什么样的 代数是一个很复杂的问题, 对于很多复杂的样本空间而言, 如果我们选取的集合太多将可能导致某些集合无法定义概率, 也就是所谓不可测集的存在导致我们只能妥协.

注 3
由于概率论也是处理确定性现象强有力的工具, 因此现在在数学的视角下很多学者不再真正的关心事件是不是真正意义下随机的, 这也就是回避了关于世界是随机的还是确定性的问题.

5. 随机过程的定义

现在绝大多数文献都将随机过程定义如下,

假设 为概率空间, 为非空集, 称映射

为概率空间 上的一个随机过程, 如果对于任意的 , 映射 是随机变量. 并称映射 为 随机过程过 的轨道.

这样的定义在数学上已经得到大家的公认, 没有什么问题, 真正的问题是我们很难发现数学模型与现实世界的差异性, 事实上我认为现在概率论的应用过程中存在将概率模型乱用的现象, 数学模型本身与现实的衔接问题没有得到好的解决, 因此被不同的人随意解读, 甚至是错误解读.

下面的这些命题被人们经常随意的使用

  1. 随机变量是随机的, 其含义是随机变量的取值是随机的.
  2. 我们将抛一个骰子出现的点数记为 , 那么 是随机变量.
  3. . . .

这样的问题到处都是, 事实上我还看到有数学专业的数学书给出随机变量的取值是随机的的提法, 仔细分析这些说法都是欠妥的.
事实上从上面的定义可以看出, 随机过程的取值并没事什么随机性可言, 只要给定确定的 , 那么存在唯一的实数 与之对应, 因此其取值并不存在随机性可言.

6. 对随机过程轨道的观察所体现出来的随机性其实是未知性

现在我们来针对 Brown 运动来看这样的问题,
首先Brown运动(brownian motion)的数学定义如下:

我们称随机过程 为 Brown运动, 如果其满足以下性质:

  1. 初始值: ;
  2. 独立增量性: 即对于任意的 以及 , 有
    相互独立.
  3. 平稳性, 即 若 , 那么 与 有相同的分布;
  4. 正态分布:对任意的 , 满足均值为 方差为 的正态分布, 即 .

在这个定义中, 我们看不到原来的概率空间 了, 有许多人说没有必要指出概率空间是什么? 我的看法是, 如果容易指出, 那么我们将其指出来又何妨呢?

  • 首先, 这个时候我们来看轨道就非常的诡异, 如果死抓住轨道的定义, 事实上考虑的应该是 . 其中样本空间是什么这并不是一个容易的问题, 历史上控制论的创始人 Norbert Wiener 在其微分空间一文中给出了这个随机过程的概率空间, 但是现在看来也非平凡之事.

    类似的事情是人们将Brown运动用来模拟股票的价格波动, 那么相同的问题依然可以提出来, 其次观察到的序列是不是某个轨道的采样?

这个问题在微分动力系统理论里面都困难得要死的问题, 在概率论中, 这应该是一个更困难的问题, 而在概率中, 人们似乎默认这样的嵌入是没有问题的, 这个问题的解决, 我觉得也许会很重要.

7 随机过程轨道的连续性问题

有人说Brown运动的轨道是不可微的, 其实这个说法是什么意思呢, 事实上, 我们也只是证明了Brown运动的轨道可微的概率是 , 然而这就下结论说Brown运动的每一条轨道都是不可微的显然是不合适的. 真实的Brown运动会不会在某些轨道上是可微的? 其次, 如果Brown运动真的不可微, 那么其速度又该如何定义呢, 这个花粉微粒是有速度还是没有速度呢, 如果没有速度, 那它又是如何运动起来的呢. 当然作为数学研究可以耍赖, 把这个问题抛给物理学家, 我也认为这需要物理学来解决, 我们需要更多关于Brown运动的信息, 从数学上看也就是还需要更多的先验假设, 没有这些先验的信息, 我们是无法将Brown运动研究清楚的, 就像再多的数学假设无法回答我手中笔的质量是多少一样.

现在我们对于一条给定的轨道 , 我们是否可以问在这条轨道上那些点是连续的, 那些点是可微的, 能否对这条轨道上的某些值进行修改使得这条轨道变得连续, 或者光滑呢.

当然由于随机过程的参数集 是个很一般的集合, 因此要考虑连续性集在某些点上修改其值, 我们需要考虑如下两个方面的问题.

  1. 要将 赋予测度结构和拓扑结构.
  2. 如果 赋予了测度结构, 要在一个零测集上修改一个一般的函数使其演变为一个连续函数我觉得不太可能.

对于上面的 2, 例如我们取参数集 , 我想在 上如何修改轨道的值都不能使得其变得连续.

8 随机过程与随机现象

我们以以下两个例子来说明随机过程与随机现象的描述
例 1
我们来考虑某人不间断地投骰子, 记骰子 个面构成的集合为 , 此处未来简化我们采用古典概型.
来描述问题, 其中 , 但是上面的概率空间却不是某人无穷次抛骰子这一过程所对于的概率空间, 事实上某人无穷次抛骰子这一随机过程:

所对应的概率空间应为 , 因此其轨道不是 条, 而是有无穷多条轨道(具备连续势).

这个例子说明, 对于实际应该过程中, 随机过程的定义域并不是一平凡事情, 如何构建概率空间是一个重要而复杂的建模过程, 这是概率公理没有告诉我们的, 这需要在应用过程中针对不同的情况具体给出.

例2

记 为 时刻股票的价格, 那么此时对应的概率空间 是什么样的这是个十分困难的问题, 现在我们假设 已经给定了, 那么我们此时如何来理解随机性.

我们在实际过程中所观测到的事实上是什么呢

事实上我们只能观测到时间(假设时间可以准确测量)的抽样 , 以及对应这些时刻某个轨道 的采样, 也就是如下

这些状态, 但是你是观测不到这些抽样来自哪条轨道的, 也就是无法确定上面采样中的 , 从而无法确定轨道 , 这就是随机性的根源, 当然这里本质上是未知性的体现. 打个比方, 这就仿佛我们观察到一辆汽车开了过来, 我们看到其轨道上某些时刻的位置, 事实上下一个时刻它将去哪里, 车内的驾驶员是谁将是十分重要的, 但是我们却看不到驾驶员, 这就类似我们看不到这条轨道到底是来样本空间中的哪个 一个样.

9 参考阅读

[1] 应坚刚, 何萍. 概率论[M]. 复旦大学出版社, 2016.

[2] 王丽霞. 概率论与随机过程[M]. 清华大学出版社, 2012.

[3] BISMUT J-M. The Atiyah-Singer theorems: A probabilistic approach. I. The index theorem[J]. Journal of Functional Analysis, 1984, 57(1): 56–99.

[4] BISMUT J-M. The Atiyah-Singer theorems: A probabilistic approach. II. The Lefschetz fixed point formulas[J]. Journal of Functional Analysis, 1984, 57(3): 329–348.

[5] WIENER N. Differential-Space[J]. Journal of Mathematics and Physics, 1923, 2(1–4): 131–174.

10. 致谢

感谢复旦大学王博士对本文的修改与建议.


Version 3.0 (18-Jul-2020)

你可能感兴趣的:(随机过程教学中值得注意的问题)