r 语言计算欧氏距离_【R统计】基于欧几里得距离进行的聚类分析

题目:

为了深入地了解我国人口的文化程度,利用1990年全国普查数据对全国30个省、直辖市、自治区进行聚类分析,分别选用了三个指标:(1)大学以上文化程度的人口占全部人口的比例(DXBZ);(2)初中文化程度的人口占全部人口的比例(CZBZ);(3)文盲半文盲人口占全部人口的比例(WMBZ)分别用来反映较高、中等、较低文化程度人口的状况。(1)计算样本的欧几里得距离,分别用最长距离法、均值法、重心法和ward法作聚类分析,并画出相应的谱系图,如果将所有样本分为4类,试写出个种方案的分类结果;(2)用动态聚类方法(共分为4类),给出相应的分类结果。

数据:

地区DXBZCZBZWMBZ

北京9.3030.558.70

天津4.6729.388.92

河北0.9624.6915.21

山西1.3829.2411.30

内蒙古1.4825.4715.39

辽宁2.6032.328.81

吉林2.1526.3110.49

黑龙江2.1428.4610.87

上海6.5331.5911.04

江苏1.4726.4317.23

浙江1.1723.7417.46

安徽0.8819.9724.43

福建1.2316.8715.63

江西0.9918.8416.22

山东0.9825.1816.87

河南0.8526.5516.15

湖北1.5723.1615.79

湖南1.1422.5712.10

广东1.3423.0410.45

广西0.7919.1410.61

海南1.2422.5313.97

四川0.9621.6516.24

贵州0.7814.6524.27

云南0.8113.8525.44

西藏0.573.8544.43

陕西1.6724.3617.62

甘肃1.1016.8527.93

青海1.4917.7627.70

宁夏1.6120.2722.06

新疆1.8520.6612.75

脚本:

#原始数据

X

DXBZ=c(9.30, 4.67, 0.96, 1.38, 1.48, 2.60, 2.15, 2.14, 6.53, 1.47,

1.17, 0.88, 1.23, 0.99, 0.98, 0.85, 1.57, 1.14, 1.34, 0.79,

1.24, 0.96, 0.78, 0.81, 0.57, 1.67, 1.10, 1.49, 1.61, 1.85),

CZBZ=c(30.55, 29.38, 24.69, 29.24, 25.47, 32.32, 26.31, 28.46,

31.59, 26.43, 23.74, 19.97, 16.87, 18.84, 25.18, 26.55,

23.16, 22.57, 23.04, 19.14, 22.53, 21.65, 14.65, 13.85,

3.85, 24.36, 16.85, 17.76, 20.27, 20.66),

WMBZ=c( 8.70, 8.92, 15.21, 11.30, 15.39, 8.81, 10.49, 10.87,

11.04, 17.23, 17.46, 24.43, 15.63, 16.22, 16.87, 16.15,

15.79, 12.10, 10.45, 10.61, 13.97, 16.24, 24.27, 25.44,

44.43, 17.62, 27.93, 27.70, 22.06, 12.75),

row.names = c("北京", "天津", "河北", "山西", "内蒙古", "辽宁", "吉林",

"黑龙江", "上海", "江苏", "浙江", "安徽", "福建", "江西",

"山东", "河南", "湖北", "湖南", "广东", "广西", "海南",

"四川", "贵州", "云南", "西藏", "陕西", "甘肃", "青海",

"宁夏", "新疆")

)

#计算

Province

hc1

hc2

hc3

hc4

#输出图1

opar

plclust(hc1,hang=-1)

re1

plclust(hc2,hang=-1)

re2

par(opar)

#输出图2

opar

plclust(hc3,hang=-1)

re3

plclust(hc4,hang=-1)

re4

par(opar)

km

sort(km$cluster) #排序便于输出

##输出如下##

#河北 内蒙古 江苏 浙江 福建 江西 山东 河南 湖北 湖南 广东

# 1 1 1 1 1 1 1 1 1 1 1

# 广西 海南 四川 陕西 新疆 安徽 贵州 云南 甘肃 青海 宁夏

# 1 1 1 1 1 2 2 2 2 2 2

# 北京 天津 山西 辽宁 吉林 黑龙江 上海 西藏

# 3 3 3 3 3 3 3 4

结果:

博文源代码和习题均来自于教材《统计建模与R软件》(ISBN:9787302143666,作者:薛毅)。

你可能感兴趣的:(r,语言计算欧氏距离)