用户分群-最大熵值法及R语言实现

一、算法概述

熵值法是一种客观赋权法,其根据各项指标观测值所提供的信息的大小来确定指标权重。设有个待评方案,项评价指标,形成原始指标数据矩阵,对于某项指标,指标值的差距越大,则该指标在综合评价中所起的作用越大;如果某项指标的指标值全部相等,则该指标在综合评价中不起作用。

在信息论中,熵是对不确定性的一种度量。信息量越大,不确定性就越大,熵也就越大;信息量越小,不确定性就越小,熵也越小.根据熵的特性,我们可以通过计算熵值来判断一个方案的随机性及无序程度,也可以用熵值来判断某个指标的离散程度,指标的离散程度越大,该指标对综合评价的影响越大。因此,可根据各项指标的变异程度,利用信息熵这个工具,计算出各个指标的权重,为多指标综合评价提供依据。

信息熵 则借鉴了热力学中熵的概念 ,描述信源的平均信息量,即​
其中信息熵越大系统越混乱,携带的信息量越大。​ 例如有两个信源,其中概率分布分别为​
在这里插入图片描述
则信息熵分别为​ H(x)=−0.99log0.99−0.01log0.01=0.08

			H(y)=−0.5log0.5−0.5log0.5=1

可见,信源 Y 比信源 X的平均自信息要大,即 Y携带的信息量比 X
携带的信息量大。从 X和 Y的概率分布也可直观得出 Y的不确定性更大&

你可能感兴趣的:(R)