Biostatistics(5)概率与概率分布

3.1 随机事件及其概率

3.1 .1 随机事件的几个基本概念

随机事件:在同一组条件下,每次试验可能出现也可能不出现的事件。
必然事件:在同一组条件下,每次试验一定出现的事件。
不可能事件:在同一组条件下,每次试验一定不出现的事件。

3.1.2 事件的概率

事件A的概率是描述事件A在试验中出现的可能性大小的一种度量,记事件A出现可能性大小的数值为P(A),P(A)称为事件A的概率(probablity)

概率的统计定义
在相同条件下随机试验n次,某事件A出现m次(m≤n),则比值m/n称为事件A发生的频率。随着n的增大,该频率围绕某一常数p上下波动,且波动的幅度逐渐减小,趋于稳定,这个频率的稳定值即为该事件的概率,记为:
P(A)=m/n=p

Example of probability
•A transcription factor binding site consists of 7 nucleotides. How many different types of possible motifs should we investigate?
Each position can be any of A, G, C, T
Number of motifs: 4x4x4x4x4x4x4=4^7
•What is the probability that the first nucleotide is A, while the second nucleotide is either A or G?
Number of motifs satisfying the requirement is
2x4x4x4x4x4=2*4^5
Probability = 2*4^5 /4^7=0.125

3.2 概率的性质与运算法则

3.2.1 概率的基本性质

(1)对任意随机事件A,有:0≤P(A)≤1
(2)必然事件的概率为1,而不可能事件的概率为0
(3)若A与B互斥,则:P(AUB)=P(A)+P(B)
此性质可推广到多个两两互斥的随机事件A1,A2,...,An,则:
P(A1UA2U...UAn)=P(A1)+P(A2)+...+P(An)

3.2.2 概率的加法法则

法则1 两个互斥事件之和的概率,等于两个事件概率之和。设A和B为两个互斥事件,则:
P(AUB)=P(A)+P(B)
法则2 对于任意两个随机事件,它们和的概率为两个事件分别的概率之和减去两事件相交的概率,即
P(AUB)=P(A)+P(B)-P(A∩B)

3.2.3 条件概率与独立事件

当某一件事件B已经发生时,事件A发生的概率,称这种概率为事件B发生条件下事件A发生的条件概率(conditional probability)
条件概率P(A|B)与概率P(AB),P(B)有以下关系:
P(A|B)=P(AB)/P(B),P(B)>0
变形后可以得到:
P(AB)=P(B)P(A|B) 该式称为概率的乘法公式

一般认为,两个事件中不论哪一个事件发生并不影响另一个事件发生的概率,则称这两个事件互相独立。当两个事件相互独立时,其乘法法则可以简化为:
P(AB)=P(A)P(B)
上述式子可以推广到多个事件相互独立的情形,即如果A1,A2,...,An相互独立,则:
P(A1A2...An)=P(A1)P(A2)...P(An)

Sexually Transmitted Disease
Suppose two doctors, A and B, test all patients coming into a clinic for syphilis. Let events A+={doctor A makes a positive diagnosis} and B+={doctor B makes a positive diagnosis} . Suppose doctor A diagnosis 10% of all patients as positive, doctor B diagnoses 17% of all patients as positive, and both doctors diagnose 8% of all patients as positive. Are the events A+,B+ independent?
Pr(A+)=.1 Pr(B+)=.17 Pr(A+∩B+)=.08
Pr(A+∩B+)=.08>Pr(A+)×Pr(B+)=.1(.17)=.017
the events are dependent.

你可能感兴趣的:(Biostatistics(5)概率与概率分布)