2014-05-15 22:02 by Jeff Li
系列文章:[传送门]
马上快要期末考试了,为了学点什么。就准备这系列的博客,记录复习的成果。
概率论研究随机事件。它源于赌徒的研究。即使是今天,概率论也常用于赌博。随机事件的结果是否只凭运气呢?高明的赌徒发现了赌博中的规律。尽管我无法预知事件的具体结果,但我可以了解每种结果出现的可能性。这是概率论的核心。
“概率”到底是什么?这在数学上还有争议。“频率派”认为概率是重复尝试多次,某种结果出现的次数在尝试的总次数的比例。“贝叶斯派”认为概率是主观信念的强弱。幸好,这些争议并不影响我们在日常生活中使用“概率”哲学。天气预报的降雨概率为80%时,很多人会因此带上伞。报纸会分析一场球赛某支球队的赢球概率,如果最终赢球概率为10%的球队取胜,那么球迷会感到惊讶。这结果是小概率事件。
要知道某个结果的概率并不容易。上面分析球队的赢球概率,要考虑许多因素。投一个骰子,有6种可能的结果。物理情况会影响结果的概率,比如撒子是否均匀,比如掷撒子的人是否有技巧偏向。如果骰子是均匀的,且没有作弊,那么每种结果出现的概率相同。为了能从数学上给结果分配一个概率,我们往往会加上一些假设。这些假设有理想化的成份,但并不至于偏离现实。比如,我们说掷撒子,撒子均匀,掷的人也没有什么特殊手法,并由此推断每种结果出现的可能相同。那么,其中任意一个结果出现的概率为1/6。
计数的基本原理叙述如下:
如果一个实验可以分为m个步骤,每个步骤分别有n1,n2,...,nm种可能,那么总共会下面 有种可能的结果。
n1×n2×...×nm
基本技术原理的核心是“分步”。对于简单的一个步骤的事情,我们能比较直接的分辨结果的总数。
从数学上来说,如果进行m次有放回的抽样,每次抽样都有n种可能。如果最终结果有序,那么将有nm种可能。
考虑下面的问题:
一个骰子连续掷2次,所有可能的结果有多少个?
模拟例子:(python系列文章)
import itertools a = [1, 2, 3, 4, 5, 6] outcomes = list(itertools.product(a, a))print(outcomes)print(len(outcomes))
#itertools 相关文档
会有下面的结果:
[(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6), (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)] 36
#所以出现的概率P=1/36。
有序的非重复抽样又叫做排列(permutation)。从数学上来说,从n个样品中挑选m个,放入m个位置,将有n×(n−1)×...×(n−m+1)种可能。如果我们使用阶乘(factorial)运算符,那么结果可以表示为
n!(n−m)!
#其中,n!=1×2×...×(n−1)×n。
考虑下面的问题:
我们用下面的程序来模拟队长组合的状况:
import itertools a = ["Tom", "Lee", "King", "James"] outcomes = list(itertools.permutations(a, 2))print(outcomes)print(len(outcomes))
# 相关文档
结果为
[('Tom', 'Lee'), ('Tom', 'King'), ('Tom', 'James'), ('Lee', 'Tom'), ('Lee', 'King'), ('Lee', 'James'), ('King', 'Tom'), ('King', 'Lee'), ('King', 'James'), ('James', 'Tom'), ('James', 'Lee'), ('James', 'King')]
#共有12种可能的结果。
m个样品有m!种排列方式。如果是从n个样品中抽取m个作为组合,所有的这m!种排序方式应该看做一种。因此,有n!(n−m)!m!种可能结果。我们可以用下面的方式记录组合:
(nm)=n!(n−m)!m!
考虑下面的问题:
从4个人中抽出2个人,有多少种可能?
下面来模拟:
import itertools a = ["Tom", "Lee", "King", "James"] outcomes = list(itertools.combinations(a, 2))print(outcomes)print(len(outcomes))
#相关文档
有以下结果
[('Tom', 'Lee'), ('Tom', 'King'), ('Tom', 'James'), ('Lee', 'King'), ('Lee', 'James'), ('King', 'James')]
#可以看到,从4个中挑选2个,有6种可能的组合。这是排列的一半。
概括来讲,从n个样品中,无序的重复抽样m次,有
(n+m−1m−1)
我们在上面多次使用了阶乘运算,在Python中,它可以使用math.factorial实现:
import mathprint(math.factorial(5))
基本计数原理
排列
组合
(生活离不开寻找数学,你说呢?)
路上走来一步一个脚印,希望大家和我一起。
感谢读者!很喜欢你们给我的支持。如果支持,点个赞。
知识来源: 概率论等书 和 python api