似然比

假设1: P(y|x) = p = p(y|!x)

假设2:P(y|x) = p1 != p2 = p(y|!x)

其中1表示二者独立,2表示不独立。

 

似然比主要是用来描述二者的依赖程度,也就是假设2的程度

假设是二项分布

 

cx, cy, cxy表示出现次数,N表示总次数,估计p p1 p2。

 

对已H1(假设1):

p(y|x)  = cy/N

p(y|!x) = cy/N

条件cx下cxy的二元组xy b(cxy, cx, p)

条件N - cx下cy - cxy的二元组!x y: b(cx - cxy, N - cx, p)

 

对已H2(假设1):

p(y|!x) = c(y, !x)/c(!x) = (cy - cxy)/(N - cx)

p(y|x)  = cxy/cx

p(y|!x) = (cy - cxy)/(N - cx)

条件cx下cxy的二元组xy b(cxy; cx, p1), cxy为随机变量

条件N - cx下cy - cxy的二元组!x y: b(cx - cxy;N - cx, p2) cx-cxy为随机变量

 

L(H1) = b(cxy; cx, p)*b(cy - cxy; N -cx, p)

L(H2) = b(cxy; cx, p1) *b(cy - cxy; N - cx, p2)

表示什么含义?

似然比:

logr = Log(L(H1)/L(H2))

 

 

如果这个值很大,说明二者是依赖的的

你可能感兴趣的:(似然比)