多项分布

组合数与排列数

C n m = n ! m ! ( n − m ) ! C_{n}^{m}=\frac{n !}{m !(n-m) !} Cnm=m!(nm)!n!
A n m = n ! ( n − m ) ! A_{n}^{m}=\frac{n !}{(n-m) !} Anm=(nm)!n!

多项分布

多项分布允许将概率分配给离散变量的向量。举例:假设现在我们要在有 J J J个词的字典中生成一个有 N N N词的文本,一种表示这个文本的方法是:
y = [ y 1 , y 2 , . . . , y n ] T \mathbf{y}=[y_1,y_2,...,y_n]^T y=[y1,y2,...,yn]T
y i y_i yi表示第 i i i个词出现的次数,值得注意的是这种方法忽略了词序,只是一种比较简单的模型。多项分布定义为:
P ( Y = y ) = P ( y ) = N ! ∏ j y j ! ∏ j q j y j P(Y=\mathbf{y})=P(\mathbf{y})=\frac{N !}{\prod_{j} y_{j} !} \prod_{j} q_{j}^{y_{j}} P(Y=y)=P(y)=jyj!N!jqjyj
q i q_i qi是每个词出现的概率, ∑ q i = 1 \sum{q_i}=1 qi=1
证明:
由样本二重性:
P ( Y = y ) = P ( [ Y 1 , . . . , Y J ] = [ y 1 , . . . y J ] ) = C N y 1 q 1 y 1 ∗ C N − y 1 y 2 q 2 y 2 ∗ . . . ∗ C y J y J q J y J = N ! y 1 ! ( N − y 1 ) ! ∗ N − y 1 ! y 1 ! ( N − y 1 − y 2 ) ! ∗ . . . ∗ 1 ∗ ∏ j q j y j = N ! ∏ j y j ! ∏ j q j y j \begin{aligned} P(Y=\mathbf{y})&=P([Y_1,...,Y_J]=[y_1,...y_J]) \\ &= C_{N}^{y_1}q_1^{y_1}* C_{N-y_1}^{y_2}q_2^{y_2}*...*C_{y_J}^{y_J}q_J^{y_J}\\ &=\frac{N !}{y_1 !(N-y_1) !}*\frac{N-y_1 !}{y_1 !(N-y_1-y_2) !}*...*1*\prod_{j} q_{j}^{y_{j}} \\ &= \frac{N !}{\prod_{j} y_{j} !} \prod_{j} q_{j}^{y_{j}} \\ \end{aligned} P(Y=y)=P([Y1,...,YJ]=[y1,...yJ])=CNy1q1y1CNy1y2q2y2...CyJyJqJyJ=y1!(Ny1)!N!y1!(Ny1y2)!Ny1!...1jqjyj=jyj!N!jqjyj

你可能感兴趣的:(机器学习的第一课,机器学习,概率论)