一、实验内容
思想:研究样品或指标(变量)之间存在着程度不同的相似性(亲疏),并按相似程度不同将指标和样品形成一个分类系统。
分析
f<-read.csv("2007.csv文件存放路径",header=T) #读取数据
f #显示数据`
attach(f)
a<-f[,2:9]
y=scale(a)
cor(y)
pca=princomp(y,cor=FALSE,scores=TRUE)
summary(pca)
Comp1,comp2,comp3的累计方差贡献率达到90.4%,这部分承载了原数据绝大多数的信息。
Step4、做系统聚类
1)提取数据
a=cbind(f[,1],f[,2],f[,3])
2)画聚类图
dist<-dist(a)
hc<-hclust(dist,"single")
cbind(hc$merge,hc$height)
plot(hc,f[,1])
re<-rect.hclust(hc,k=3)
for(i in 1:3){
+print(paste("第",i,"类"))
+print(f[re[[i]],]$地区)
+}
f<-read.csv("C:\\Users\\Adminstrator\\Documents\\Tencent Files\\3105814524\\FileRecv\\aa2.csv",header=T) #读取数据
f #显示数据
attach(f)
a<-f[,2:9]
y=scale(a)
cor(y)
pca=princomp(y,cor=FALSE,scores=TRUE)
summary(pca)
Comp1,comp2,comp3的累计方差贡献率达到90.4%,这部分承载了原数据绝大多数的信息。
Step4、做系统聚类
1)提取数据
a=cbind(f[,1],f[,2],f[,3])
2)画聚类图
dist<-dist(a)
hc<-hclust(dist,"single")
cbind(hc$merge,hc$height)
plot(hc,f[,1])
re<-rect.hclust(hc,k=3)
for(i in 1;3):{
+print(paste("第",i,"类"))
+print(f[re[[i]],]$地区)
+}