信息熵的计算

信息熵计算公式:

 

    信息熵的计算_第1张图片

演示数据:

 

性别(x) 考试成绩(y)

 

 

 

 

 

 

X的信息熵计算为:

    p(男) = 3/5 = 0.6

    p(女) = 2/5 = 0.4

根据上面的计算公式可得:

    列X的信息熵 为: H(x)= - ( 0.6 * log2(0.6) + 0.4 * log2(0.4)) =  0.97.......

Y的信息熵计算为:

    p(优) = 4/5 = 0.8

    p(女) = 1/5 = 0.2

    列X的信息熵 为: H(x)= - ( 0.8 * log2(0.8) + 0.2 * log2(0.2)) =  0.72.......

 

由信息熵引出的条件熵:

信息熵的计算_第2张图片

条件熵的概念类似于条件概率,就是再给定X的情况的条件下,y的信息熵。

给定性别为男,成绩为优的条件熵:

H(y | x = 男)= 3/5 * -(2/3 * log2(2/3) + 1/3 * log2(1/3)) = 0.55...

H(y | x = 女)= 2/5 * -( 1 * log2(1) + 1 * log2(1)) =  0.0...

H(y | x)= H(y | x = 男)+ H(y | x = 女) = 0.55... +  0.0... = 0.55

 

 

 

你可能感兴趣的:(机器学习,算法)