早期概率史上三部里程碑性质的著作为,伯努利的《推测术》,棣莫弗的《机遇论》,以及拉普拉斯的《概率分析理论》。最近为了码数理统计大作业,略读一二,今天来讲讲伯努利的《推测术》。
伯努利家族在数学史上的贡献大家是有目共睹,至少有12人对数学的各方面做出不同的贡献,其中5人在概率方面,最为杰出的可能就是以名字命名大数定律的伯努利。
Bernoulli's law of large numbers
早期的概率论的著作,多是讨论具体的赌博取胜的概率,而伯努利在《推测术》的前三部分中更为系统地研究了古典概率,更注重计算的一般规律和数学证明。将赌局中投掷骰子事件重复独立性明确的进行了指出,如今符合这种条件的也被称为伯努利概型。而我们如今在排列组合中运用频繁的“排列”也是伯努利在书中首次提出。
当然,这种乏味无趣的数学证明并不是我今天要讲的重点,今天的重点主要是书中伯努利对于概率这个捉摸不透的东西如何看待的,以及众所周知的大数定律是如何解释着世界的,也就是《推测术》这本书最为精彩的第4部分。
概率
和大多数数学家一样,伯努利一开始也是把概率分为主观概率和客观概率。
所谓主观概率,就是人主观地对事件发生可能性的估计,比如看着阴雨密布,我说“十有八九要下雨”,这里“十有八九”中的"0.8~0.9"并不是一个客观的数字,更多的是基于我的主观判断得出的结论。
而对于客观概率,则更多的与概率论以及数理统计的内容挂钩。伯努利把客观概率分为两类,一是“可以先验地计算的概率”,二是“后验地计算的概率”。(注:这里的先验和后验和Bayes统计中的先验和后验不同,注意区分)。
前者用现在的术语也就是古典概率,其计算的根据建立在由事物的对称性而得到的先验的事实,这种事实保证了等可能性,如投掷一个均匀的骰子,每个点数朝上的可能性为。
后者用现在的术语也就是统计概率,通俗地来讲也就是常说的“用频率去估计概率”, 要通过大量观察结果计算,也就是数理统计中大样本统计的问题。
机械决定论
伯努利对于所有事物的发生都采取了一种机械决定论的观点:世界上的一切事物都受到严格的因果律的支配。比如,以投掷骰子为例,伯努利认为:如果一切有关条件,包括骰子的形状大小、质量分布、投掷的初始位置、投掷的方向与力度、以及投掷时刻的所有的环境条件全给定弄准了,那么投掷结果就确定了,因此并没有随机性可言。(大名鼎鼎的拉普拉斯也采取这个观点)。他们对于随机性的解释为,投掷的结果对于有关的条件极其敏感,条件的极其微小的改变就足以影响结果,所以才造成的随机性。
其实,结合物理学中海森堡的不确定性原理(Uncertainty principle),我们也可以显然地得出,由于我们无法把位置和速度同时测准,所以投掷骰子这件事情的条件永远不能确定,因此仍然具有的随机性。但是在17世纪的当时,伯努利的这个看法也是受很多哲学家对世界当时的认知的影响。虽然这个观点是过时的,但是仍在当初有着重大的意义。
道德确定性
《推测术》一书对概率统计影响深远的另一原因,就是伯努利引进了所谓“道德确定性”的概念(Moral certainty)。
若一个事件,我们无法确定其能一定能发生,但是它能被认定以极大的可能性不会不发生,则称它有道德确定性,简言之,即概率接近1的事件。但是往往,我们无法判断一件事情多确定会发生,即概率接近1到什么程度,所以伯努利研究其反面,即概率很接近0的事件,我们可以称是“道德否定”的。
这个概念对后世数理统计学有着重大的影响。在进行统计推断中,我们不可能100%不出错,所以我们指定一个很小的数alpha>0,而使得做出推断出错的概率不超过alpha,于是推断出错这个事件,发生的概率不超过很小的数alpha,在这次推断中”道德确定地“不可能发生,因而我们就相信所做的推断的可靠性。在区间估计中,这个alpha就是置信水平1-alpha中的alpha,在假设检验中也就是显著性水平。
现今,我们把伯努利定义的“道德确定性”称为“事实上的确定性“(Practical certainty),而这种“小概率事件在一次试验中极有可能不发生”的观点称为”小概率事件原理“,我们生活中无处不在运用着这个原理。
同等无知原则
伯努利在《推测术》一书中也提出一个对于后世数理统计学发展有重大影响的一个思想,也就是在Bayes统计中对先验分布的选取的一个重要的原则,就是同等无知原则(后世学者的命名)。
伯努利将古典概率中的“等可能性”的思想推广到主观概率的场合。他认为如果没有任何理由认为某种可能性比其他可能性有优势的时候,我们应给予这些可能性以同等的主观概率,也就好比先验分布取均匀分布。贝叶斯逝去后公之于世的论文就是基于这个思想,最后发展为贝叶斯学派,与传统的频率学派对立至今。
伯努利大数定律
码了这么多,最后到了这个最精彩的最美丽的定律,伯努利大数定律。对于这个定律以及伯努利当时的想法与证明也不在此赘述,伯努利当时的证明较为复杂,并且在当时,伯努利希望能够研究出最小试验次数N以及精度epsilon之间的联系,但是当时伯努利计算出来的N=25550,虽然相比切比雪夫不等式计算出来的N=600600小很多,但是在当时社会25550仍然是个天文数字,伯努利对此很不满意,之后也得到了很多学者的关注和研究,在此也不再多言。
伯努利工作的最大的意义还是在于大数定律对于哲学的影响,因为伯努利证明了:
数学家不仅可以后验地认识世界,还可以用数学去估量他们的知识的限度。
在《推测术》一书结尾,伯努利也如此评价自己得到的结果:
如果我们能把一切事件永恒地观察下去,则我们终将发现:世间的一切事物都受到因果律的支配,而我们也注定会在种种极其纷纭杂乱的事象中认识到某种必然。
大数定律告诉我们,纵使世界万象变化万千,人类总能通过实验去认知自然界的奥秘,但是我们也能看出,自然界不会轻易揭开它的面纱。
2016.6.5下午 读《数理统计学简史》后的即兴乱写,望读者见谅