【作业题】
Suppose that Die-Hardly-Ever battery has an exponential time-to-failure
distribution with a mean of 48 months. At 60 months, the battery is still operating.
【重点】条件概率+指数分布无记忆性
即 P ( x > s + t ∣ x > t ) = P ( x > s ) P(x>s+t|x>t)=P(x>s) P(x>s+t∣x>t)=P(x>s)
Suppose that a man has k keys, one of which will open a door. Compute
the expected number of keys required to open the door for the following two cases:
a. The keys are tried one at a time without replacement.(不放回)
b. The keys are tried one at time with replacement.(放回)
【作业题】可能考察是否full period
R i = X i m < 1 R_i=\frac{X_i}{m}<1 Ri=mXi<1
检验样本是否服从均匀分布
对前提进行假设
F r e q u e n c y Frequency Frequency
H 0 : R i ′ s U ( 0 , 1 ) H_0:R_i's~U(0,1) H0:Ri′s U(0,1)
H 1 : R i ′ s n o t U ( 0 , 1 ) H_1:R_i's not U(0,1) H1:Ri′snotU(0,1)
在测试前要说明清楚,显著性水平
α = P ( t y p e o n e e r r o r ) = p ( r e j e c t H 0 ∣ H 0 i s t r u e ) \alpha=P(type\ one\ error)=p(reject\ H_0|H_0 is\ true) α=P(type one error)=p(reject H0∣H0is true)
检验是否服从 U ( 0 , 1 ) U(0, 1) U(0,1)如下,
Using appropriate test, check whether the numbers are uniformly distributed: 0.594, 0.928, 0.515, 0.055, 0.507, 0.351, 0.262, 0.797, 0.788, 0.442, 0.097, 0.798, 0.227, 0.127, 0.474, 0.825, 0.007, 0.182, 0.929, 0.852.
即判断数据是否服从均匀分布。
int main(){
#ifdef local
freopen("data.txt", "r", stdin);
// freopen("data.txt", "w", stdout);
#endif
int n = 20;
rep(i, 1, n){
cin >> a[i];
}
sort(a+1, a+n+1);
rep(i, 1, n){
cout << " " << a[i];
}
}
排序可得(共20个数据)
0.007 0.055 0.097 0.127 0.182 0.227
0.262 0.351 0.442 0.474
0.507 0.515 0.594
0.788 0.797 0.798 0.825 0.852 0.928 0.929
KS检测,主要用于检测数据是否符合某种分布
Using appropriate test, check whether the numbers are uniformly distributed: 0.594, 0.928, 0.515, 0.055, 0.507, 0.351, 0.262, 0.797, 0.788, 0.442, 0.097, 0.798, 0.227, 0.127, 0.474, 0.825, 0.007, 0.182, 0.929, 0.852.
This method uses an auxiliary function t(x) that is everywhere ≥ the density f(x) of the RV X we want to simulate
接受-拒绝采样,这个方法使用一个辅助函数 t ( x ) t(x) t(x), t ( x ) t(x) t(x)函数满足处处 t ( x ) ≥ f ( x ) t(x)≥f(x) t(x)≥f(x), f ( x ) f(x) f(x)是随机变量X的概率密度函数,X就是我们想要进行模拟的随机变量。
显然,处处 t ( x ) ≥ 0 t(x)≥0 t(x)≥0
引入 t ( x ) t(x) t(x)去求解 c c c
不妨,令 r ( x ) = t ( x ) c r(x)=\frac{t(x)}{c} r(x)=ct(x),其一定为概率密度
我们必须选择 t t t,以此能更轻松的从 r ( x ) r(x) r(x)概率密度函数中采样。
例题 Problem 7: Give an algorithm for generating a standard normal random variable X ∼ N(0,1).
(Hint: if we can generate from the absolute value |X|, then by symmetry we can obtain X by independently generating a rv U (for sign) that is ±1 with probability 1/2 and setting X = U|X|.)
(1)前提准备
首先,根据已知分布的概率密度函数f(x),产生服从此分布的样本X
f ( x ) = 1 2 π e − x 2 2 ( − ∞ < x < + ∞ ) f(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}} (-\infty
但根据题目提示,我们仅能产生|X|,不过同理,不妨设随机变量Z, Z = ∣ X ∣ Z=|X| Z=∣X∣,由X的概率密度函数我们可以知道Z的概率密度函数
f Z ( z ) = 2 2 Π e − z 2 2 ( z ≥ 0 ) f_Z(z)=\frac{2}{\sqrt{2Π}}e^{-\frac{z^2}{2}} (z≥0) fZ(z)=2Π2e−2z2(z≥0)
此时再找一个建议函数(辅助函数),即随机变量Y,其服从指数分布,故我们可得其概率密度函数
f Y ( y ) = λ e − λ y ( y > 0 ) f_Y(y)=\lambda e^{-\lambda y} (y>0) fY(y)=λe−λy(y>0)
(2)我们首先得确定建议函数的参数 λ \lambda λ与Acceptance-rejection method的参数c(在Acceptance-rejection method算法中我们希望c能接近1)
c ∗ g ( x ) ≥ f ( x ) c*g(x)≥f(x) c∗g(x)≥f(x),g(x)为建议函数
c f Y ( u ) f Z ( u ) = c λ e − λ u 2 2 π e − u 2 2 = c λ 2 π 2 e 1 2 ( u − λ ) 2 − λ 2 2 \frac{cf_Y(u)}{f_Z(u)}=\frac{c\lambda e^{-\lambda u}} {\frac{2}{\sqrt{2\pi}}e^{-\frac{u^2}{2}}}= \frac{c\lambda\sqrt{2\pi}}{2}e^{\frac{1}{2}(u-\lambda)^2-\frac{\lambda^2}{2}} fZ(u)cfY(u)=2π2e−2u2cλe−λu=2cλ2πe21(u−λ)2−2λ2
易得
c λ 2 π 2 e 1 2 ( u − λ ) 2 − λ 2 2 ≥ c λ 2 π 2 e − λ 2 2 \frac{c\lambda\sqrt{2\pi}}{2}e^{\frac{1}{2}(u-\lambda)^2-\frac{\lambda^2}{2}}≥c\frac{\lambda\sqrt{2\pi}}{2}e^{-\frac{\lambda^2}{2}} 2cλ2πe21(u−λ)2−2λ2≥c2λ2πe−2λ2
不妨令 λ = 1 \lambda=1 λ=1, c = 2 2 π e 1 2 c=\frac{2}{\sqrt{2\pi}}e^{\frac{1}{2}} c=2π2e21
(这么令代入便于计算)
即可以满足 c f Y ( u ) f Z ( u ) ≥ 1 \frac{cf_Y(u)}{f_Z(u)}≥1 fZ(u)cfY(u)≥1
此时确定可以将 f Y ( u ) f_Y(u) fY(u)作为我们的建议函数(辅助函数)
t ( y ) = c f Y ( y ) t(y)=cf_Y(y) t(y)=cfY(y)
(课件中使用t(x)代表建议函数,故此用t表示)
(3)由(2)已将建议函数 t ( y ) = c f Y ( y ) t(y)=cf_Y(y) t(y)=cfY(y)找好,接下来我们从中进行采样
【第一个是为了得到样本Y】
【第二个是为了得到样本U】
(4)综上,我们产生了Z,其满足 Z = ∣ X ∣ Z=|X| Z=∣X∣,但我们实际求解的是X
注意第3步, U 2 ≤ e − ( Y − 1 ) 2 2 U2≤e^{-\frac{(Y-1)^2}{2}} U2≤e−2(Y−1)2,可得
− l n ( U 2 ) ≥ ( Y − 1 ) 2 / 2 -ln(U2)≥(Y-1)^2/2 −ln(U2)≥(Y−1)2/2
就可以简化 − l n ( U 2 ) -ln(U2) −ln(U2)是服从参数为1的指数分布。
设,事件A为接受事件,由Acceptance-Rejection method可知,当A发生时,可将采样Y去代替X,即X=Y
左边 = P ( X ≤ x ) = P ( Y ≤ x ∣ A ) = P ( Y ≤ x , A ) P ( A ) 左边=P(X≤x)=P(Y≤x|A)=\frac{P(Y≤x,A)}{P(A)} 左边=P(X≤x)=P(Y≤x∣A)=P(A)P(Y≤x,A)
对Y进行采样,得到y,可以取Y作为X的概率如下,
P ( A ∣ Y = y ) = P ( U ≤ f ( y ) t ( y ) ) = f ( y ) t ( y ) P(A|Y=y)=P(U≤\frac{f(y)}{t(y)})=\frac{f(y)}{t(y)} P(A∣Y=y)=P(U≤t(y)f(y))=t(y)f(y)
t(y)为建议分布的概率密度函数
U服从U(0, 1)的均匀分布,故概率如上。
则 0 ≤ f ( y ) t ( y ) ≤ 1 0≤\frac{f(y)}{t(y)}≤1 0≤t(y)f(y)≤1
即 f ( y ) ≤ t ( y ) f(y)≤t(y) f(y)≤t(y)
取r(y)为Y的概率密度函数
P ( A a n d Y ≤ x ) = ∫ − ∞ x P ( A a n d Y ≤ x ∣ Y = y ) r ( y ) d y P(A\ and\ Y ≤ x)=\int_{-\infty}^xP(A\ and\ Y ≤x|Y=y)r(y)dy P(A and Y≤x)=∫−∞xP(A and Y≤x∣Y=y)r(y)dy
由区间知Y≤x必然成立,故
P ( A a n d Y ≤ x ) = ∫ − ∞ x P ( A a n d Y ≤ x ∣ Y = y ) r ( y ) d y = ∫ − ∞ x P ( A ∣ Y = y ) r ( y ) d y = ∫ − ∞ x f ( y ) t ( y ) ∗ t ( y ) c d y = 1 c ∫ − ∞ x f ( y ) d y = 1 c F ( x ) P(A\ and\ Y ≤ x)=\int_{-\infty}^xP(A\ and\ Y ≤x|Y=y)r(y)dy\\= \int_{-\infty}^xP(A|Y=y)r(y)dy\\ =\int_{-\infty}^x\frac{f(y)}{t(y)}*\frac{t(y)}{c}dy\\ =\frac{1}{c}\int_{-\infty}^xf(y)dy\\ =\frac{1}{c}F(x) P(A and Y≤x)=∫−∞xP(A and Y≤x∣Y=y)r(y)dy=∫−∞xP(A∣Y=y)r(y)dy=∫−∞xt(y)f(y)∗ct(y)dy=c1∫−∞xf(y)dy=c1F(x)
又因为 P ( A ) = ∫ R P ( A ∣ Y = y ) r ( y ) d y = 1 c ∫ R f ( y ) d y = 1 c P(A)=\int_R P(A|Y=y)r(y)dy\\ =\frac{1}{c}\int_R f(y)dy=\frac{1}{c} P(A)=∫RP(A∣Y=y)r(y)dy=c1∫Rf(y)dy=c1即 P ( A ) = 1 c P(A)=\frac{1}{c} P(A)=c1
已知, = P ( X ≤ x ) = P ( Y ≤ x ∣ A ) = P ( Y ≤ x , A ) P ( A ) =P(X≤x)=P(Y≤x|A)=\frac{P(Y≤x,A)}{P(A)} =P(X≤x)=P(Y≤x∣A)=P(A)P(Y≤x,A)
将 P ( A a n d Y ≤ x ) = 1 c F ( x ) P(A\ and\ Y ≤ x)=\frac{1}{c}F(x) P(A and Y≤x)=c1F(x)带入
将 P ( A ) = 1 c P(A)=\frac{1}{c} P(A)=c1带入
解得, P ( X ≤ x ) = F ( x ) P(X≤x)=F(x) P(X≤x)=F(x),综上得证。
连续型经验分布是分段线性不是阶梯式
重点:数据是否已经被分组
当原始的数据已知且有具体的值的时候
这里我们可以使用插值法。
首先我们得到的是一组未经处理的数据,不妨设有n个
然后,根据数值由小到大对其进行排序,
这样,每个值都会和一个区间相对应
定义一个连续的、分段线性的分布函数F
将Xi单调递增排序,Xi表示第i小(Xi就是排序过的数值),此时可以得到F函数如下
{ 0 , if x < X ( 1 ) i − 1 n + 1 + x − X i ( n − 1 ) ( X ( i + 1 ) − X ( i ) ) , if X i ≤ x < X ( i + 1 ) , ∀ i < n − 1 1 , if X ( n ) < x \begin{cases} 0& ,\text{if $x
我们没有独立的数据样本点的时候,仅知道每组数据间隔中有多少数据,即
优点
缺点
Data have been collected on service times at a drive-in-bank window at the Shady Lane National Bank. The data are summarized into intervals as follows:
Set up a table like examples which has been discussed in class, for generating service
times by the table-lookup method. Generate five values of service time using random
numbers 0.9473, 0.0823, 0.3561, 0.2482, and 0.8831.
Interval Seconds | Frequency | probability | cumulative pro | Slope |
---|---|---|---|---|
15-30 | 10 | 1 15 \frac{1}{15} 151 | 1 15 \frac{1}{15} 151 | 225 |
30-45 | 20 | 2 15 \frac{2}{15} 152 | 1 5 \frac{1}{5} 51 | 225 2 \frac{225}{2} 2225 |
45-60 | 25 | 1 6 \frac{1}{6} 61 | 11 30 \frac{11}{30} 3011 | 90 |
60-90 | 35 | 7 30 \frac{7}{30} 307 | 3 5 \frac{3}{5} 53 | 900 7 \frac{900}{7} 7900 |
90-120 | 30 | 1 5 \frac{1}{5} 51 | 4 5 \frac{4}{5} 54 | 150 |
120-180 | 20 | 2 15 \frac{2}{15} 152 | 14 15 \frac{14}{15} 1514 | 450 |
180-300 | 10 | 1 15 \frac{1}{15} 151 | 1 | 1800 |
由图可知:
X 0 = 15 , X 1 = 30 , X 2 = 45 , . . . , X 7 = 300 X_0=15,X_1=30,X_2=45,...,X_7=300 X0=15,X1=30,X2=45,...,X7=300
计算斜率:
a i = X i − X i − 1 C u m u l a t i v e P ( X i ) − C u m u l a t i v e P ( X i − 1 ) a_i=\frac{X_i-X_{i-1}}{CumulativeP(X_i)-CumulativeP(X_{i-1})} ai=CumulativeP(Xi)−CumulativeP(Xi−1)Xi−Xi−1
a 1 = 30 − 15 1 15 = 225 a1=\frac{30-15}{\frac{1}{15}}=225 a1=15130−15=225
a 2 = 45 − 30 2 15 = 225 2 a2=\frac{45-30}{\frac{2}{15}}=\frac{225}{2} a2=15245−30=2225
其余斜率求解方法相同,接下来根据概率求解x值
如 F ( x ) = 0.9473 F(x)=0.9473 F(x)=0.9473
易知, F ( x ) > 14 15 F(x)>\frac{14}{15} F(x)>1514
x = 180 + ( 0.9473 − 0.9333 ) ∗ 1800 = 205.14 x=180+(0.9473-0.9333)*1800=205.14 x=180+(0.9473−0.9333)∗1800=205.14
其余同理。
例题: Consider the shifted (two-parameter) exponential distribution, which has
density function
f ( x ) = { 1 β e − ( x − γ ) / β if x ≥ γ 0 otherwise f(x)=\begin{cases} \frac{1}{\beta} e^{-(x-\gamma)/\beta}& \text{if $x≥\gamma$}\\ 0& \text{otherwise} \end{cases} f(x)={β1e−(x−γ)/β0if x≥γotherwise
for β > 0 \beta > 0 β>0 and any real number γ \gamma γ. Given a sample X 1 , X 2 , X 3 , . . . , X n X_1,X_2,X_3,...,X_n X1,X2,X3,...,Xn of IID random values
from this distribution, find formulas for the joint MLEs γ ^ \hat{\gamma} γ^ and β ^ \hat{\beta} β^ .
求解如下:
可得最大似然函数 L ( γ , β ) = 1 β n e x p [ − ∑ i = 1 n ( X i − γ ) / β ] L(\gamma, \beta)=\frac{1}{{\beta}^n}exp[-\sum_{i=1}^n(X_i-\gamma)/\beta] L(γ,β)=βn1exp[−i=1∑n(Xi−γ)/β]
上式必然满足 X i ≥ γ X_i≥\gamma Xi≥γ对于所有的 i i i
两侧同时取对数
l ( γ , β ) = l n ( L ( γ , β ) ) = − n l n ( β ) − [ ∑ i = 1 n ( X i − γ ) / β ] = − n l n ( β ) − 1 β ∑ i = 1 n X i + n γ β l(\gamma,\beta)=ln(L(\gamma,\beta))=-nln(\beta)-[\sum_{i=1}^n(X_i-\gamma)/\beta]\\ =-nln(\beta)-\frac{1}{\beta}\sum_{i=1}^{n}X_i+n\frac{\gamma}{\beta} l(γ,β)=ln(L(γ,β))=−nln(β)−[i=1∑n(Xi−γ)/β]=−nln(β)−β1i=1∑nXi+nβγ
我们已知, β > 0 \beta>0 β>0,想要越大的 n γ β n\frac{\gamma}{\beta} nβγ, γ \gamma γ就得越大
例如 γ = X ( 1 ) \gamma=X_{(1)} γ=X(1),我们就等于要最大化 g ( β ) g(\beta) g(β) g ( β ) = − n l n ( β ) − 1 β ∑ i = 1 n X i + n x ( 1 ) β g(\beta)=-nln(\beta)-\frac{1}{\beta}\sum_{i=1}^{n}X_i+n\frac{x_{(1)}}{\beta} g(β)=−nln(β)−β1i=1∑nXi+nβx(1)
综上可解得, β ^ = X ‾ ( n ) − X ( 1 ) \hat{\beta}=\overline{X}(n)-X_{(1)} β^=X(n)−X(1)
也可写作 β ^ = X ‾ ( n ) − γ ^ \hat{\beta}=\overline{X}(n)-\hat{\gamma} β^=X(n)−γ^但 γ 是有 ^ \gamma是有\ \hat{} γ是有 ^
要注意,尽管我们需要尽可能大的 γ \gamma γ,但是也要满足 X ≥ γ X≥\gamma X≥γ,也就是最大的 γ \gamma γ也只能取得最小的 X i X_i Xi
X ( 1 ) = m i n { X 1 , X 2 , . . . , X n } X_{(1)}=min\{X_1,X_2,...,X_n\} X(1)=min{X1,X2,...,Xn}