测度论与概率论基础

很多读者可能在本科阶段学过“概率论与数理统计”课程。我们数学专业的人称之为“初等概率论”。“初等概率论”遗留了很多未能解决的问题,例如:
1 除了离散型随机变量,连续型随机变量,及两种随机变量的混合外,是否存在其他类型的随机变量?
2 期望的本质是什么?如果问题1的答案是肯定的,那么对于那些“比较奇怪”的随机变量,怎样计算其期望呢?对于离散型随机变量,期望是求和;对于连续型随机变量,期望是积分。求和与积分的本质是否一致呢?我们在“初等概率论”中,涉及期望的定理,被迫对离散型和连续性两张情形分别讨论,显得繁冗拖沓。而且很多证明也令人感觉不爽利。例如很重要的期望公式:对任意非负随机变量X,E X= 积分号 P(X > x)dx.我们如果用黎曼积分来证明,显得很罗嗦,似乎也没有把握问题的本质。而且事实上,这个公式不仅对两边有限的情形是对的,对两边无限的情形也是对的。似乎有必要找到更本质性的工具来证明这个结论。
3 “初等概率论”中,对于随机变量的关系讨论不清楚。我们熟悉的,无非是两个随机变量独立,或者其中一个是另外一个函数这些比较简单的情形。更复杂一点的,顶多是讨论一个随机向量中各个分量之间的关系,无非是计算一些协方差之类的东西,讨论范围非常狭隘。随机变量间的关系显然不会只有这些简单的内涵。而且我们常常遇到讨论一列,甚至是不可数多个随机变量之间的关系,“随机向量”无法达到这一目的。
4 更根本的一个问题:如果随机变量X与Y同分布,f是一个可测函数。那么f(X)与f(Y)同分布吗?换句话说,给定随机变量X和可测函数f,f(X)的分布确定吗?“初等概率论”似乎连这个问题都解答不了。
5 条件概率是什么?如果有两个连续性的随机变量X,Y,我们常常可能要计算P(X>0|Y=1)这种东西,但是P(Y=1)=0,如果用“初等概率论”的定义,就会出现0/0,让人束手无策。
 
概率论本身就是一个解决问题的数学分支。既然存在“初等概率论”解释不了的东西,就需要有一个理论框架,来回答这些问题。因此就有学习“测度论”与“高等概率论”的必要。
另一方面,对于担任“测度论”教学任务的老师,我认为也应该在整个课程开始前提出这些问题,激发学生学习课程的兴趣。否则“测度论”课程将完全陷入理论的推导,学生看不到学习的价值,就会感觉枯燥乏味。
 
除了解决以上列出的,以及更多没有列出的具体问题之外,其实还有一个更本质的问题:概率论为什么称之为概率论?它和其他数学分支有什么区别?“初等概率论”中大量运用的工具无非是微积分的计算,或者是不等式的估计,似乎就是数学分析的运用,没有什么概率论自己的东西。
我认为,概率论独有的工具,归根到底只有两个,一个是“耦合”,就是人为的构造大的概率空间,来解决有关随机变量分布的问题;另外一个是“条件概率和条件期望”,但如前文所述,“初等概率论”中连什么是条件概率都定义不清楚。
 
以上说明了学习“测度论”的必要性。我强烈推荐已故程士宏先生编著的《测度论与概率论基础》,它常年作为北京大学本科三年级“测度论”课程的教材。该书论证详细清晰,习题难度适中,有很强的可读性。我当年学习这门课程,最后取得了 95分的成绩,后来我又担任过该课程的助教,因此对这本书读得还算比较细致。下面我就谈一下我对这本书的一些理解。希望能对即将读这本书的读者有帮助,也希望对已经读过这本书的读者复习有帮助:
 

我一直认为,数学是直觉和逻辑的统一体。形象思维和抽象思维在数学学习中都发挥着重要的作用。有些人忽视直接思维的重要性,片面的认为数学等同于逻辑。事实上,逻辑仅仅是数学的工具,单靠逻辑是不可能得到任何真正有意义的数学结论的。因此,在数学学习过程中,不应该过分关注细节,更应该从宏观上着眼。

前苏联数学家kolmolgorov完成了概率论的公理化体系。
首先一个比较容易想象的结论是,概率应该认为是定义在集合系(即集合组成的集合)上的函数,概率值应当是集合在映射下的象。那么集合系可以是随随便便的呢?考虑到概率论中对于事件必须可以做交并补等基本的运算,因此自然产生了sigma域这种集合系。但单单有它是不够的,因为sigma域往往是复杂的,我们定义概率很难在每个上面都具体定义出来,因此考虑到只定义其中的一部分形式较简单的集合的概率值,希望通过它们就足以决定其他集合的概率值。于是产生了诸如环,半环,域的概念(sigma域的弱化)。
以上仅仅解决了集合系的问题。那么什么是随机变量呢?由于我们希望能刻画复杂的随机变量的关系,那么最合适的方法就是,把我们要考虑的一大堆随机变量视为同一个概率空间到实数集的映射。但这个映射不是普通的映射了。因为我们已经定义了sigma域的定义,要考虑以它为基础对映射添加一定限制。
为什么随机变量必须要映到R上,这很自然,因为R相对于普通集合的优势在于它上面的元素可以做精彩的运算。
接下来我们可以定义测度的理论,而概率仅仅是其中一个特例。测度的定义是广泛的,它不仅包括概率,还包括最常见的lebsegue测度,以及计数测度。于是可测空间再添加一个分量就有了测度空间的定义。接下来的任务就是建立测度扩张的理论了,以回答“部分集合的概率值决定所有集合概率值”的问题。
对于随机变量,我们可以从哪些角度考察它呢?一个是考虑其数字特征,于是有了积分的理论;一个是考虑同一空间上各随机变量的关系,于是有了各种收敛性的概念。
下一个重要任务是研究不同测度空间的关系。在此范围内有积分的变量替换理论和R-N导数的概念。接下来又有了lebsegue分解定理。于是初等概率论不能解决的最基本问题如随机变量的分类和概率密度的意义已经解决。
定义符号测度的概念。这是为了给出条件期望的概念。
定义乘积空间。这一方面是为了给出独立随机变量的构造,另一方面在此基础上可以构造复杂的测度空间。关于随机过程存在性的kolmolgorov定理将整个概率论基础的理论推到了顶峰。
作为概率论基础理论严密化的意义,在这些理论基础上,可以得出诸如kolmolgorov零一律,大数律,特征函数,中心极限定理等深刻的定理的严格证明。
以上就是我对概率论基础的一些认识,权供参考,有不妥之处欢迎批评指正。

你可能感兴趣的:(框架,工具,任务)