极大似然估计法推出朴素贝叶斯法中的先验概率估计公式

统计学方法 P53-4.1

 令参数 P(Y=ck)=θk ,其中 k{1,2..K}
 那么随机变量Y的概率可以用参数来表示为一个紧凑的形式
       P(Y)=k=1KθkI(Y=ck)
 I是指示函数 Y=ck 成立时,I=1;否则I=0。
 极大似然函数 L(θk;y1,y2..yN)=i=1NP(yi)=k=1KθNkk ,其中N为样本总数, Nk 为样本中 Y=ck 的样本数目
 取对数得到 l(θk)=ln(L(θ))=k=1KNklnθk
 联立所有的k以及约束条件有
       i=1kNi=N
      i=1kNi=λk=1Kθk
     
     综上 θk=NkN

你可能感兴趣的:(机器学习)