背景:
大数据火热的背景下,数据的深层次挖掘成了一个热门的话题,单一类型的数据.只需要看不同年份数值,即可以明白其含义,然而很多时候研究方向是多维度,多类型的数据,这个时候,无法在一张图表上更好的展示.这个时候就引入了评分机制,人为的为数据打分,然而不同类型的数据是无法互相影响的,这个时候我们就引入了权重这个概念.
评分:
什么是评分?
以城市的GDP为例,2015年广东的GDP有7.2万亿(全国最高),2015年西藏的GDP有0.1万亿(全国最低),这个时候我们就需要确定好最高得分例如10分,最低得分1分,并确定好具体GDP与得分之间的关系,自定义算法(不一定是等比关系,但一定是正比关系),算出其他省份的得分,以此类推,可以计算例如人均GDP,GDP增速,人数,人口增长等一系列的数据评分.
注:得分的对比需要是同一纬度,例如省与省之间的对比,不要省与市之间进行对比
综合评分和权重:
什么是权重和综合评分?
以广州为例,假如其GDP的评分为9.5分,GDP增速评分为8分,人口增长评分为9分
这个时候我们需要知道其综合评分,我们给GDP 权重占比50% GDP增速 权重占比30% 人口增长 权重占比20%
注意,权重比之和最好是100%
我们可以计算出其综合评分为9.5*50%+8*30%+9*20%=8.95分
分类和指标:
在数据研究当中,数据类型繁华多样,但是在研究当中,我们往往会把具有同一共性的数据类型打上同一属性的标签
例如:土地总量,土地人均供应量,工业用地,商业用地,住宅用地都可以划分为 土地数据 这一个分类
常住人口数,人口流出数量,人口流入数量,人口密度 都可以化作 人口数据这一个分类
分类可以不止一级,只是最后一级就是我们的具体指标:如常住人口数,土地总量这样具有具体意义的数据
分类下综合评分的计算:
例:土地数据 下有 商业用地,住宅用地两个指标项 其中商业用地 权重占比为30% 住宅用地 权重占比为70%
人口数据 下有 常住人口数,人口密度两个指标项 其中常住人口数 权重占比为60% 人口密度权重占比为30%
对于综合评分来说 土地数据 权重占比40% 人口数据 权重占比60%
其综合评分=(商业用地评分*30%+住宅用地评分*70%)*40%+(常住人口数评分*60%+人口密度评分*30%)*60%
如果有更多级的分类,其算法也是一致的,但是需要注意的是每一级具体分类下的子指标(或分类)的权重占比之和为100%