2016年广西各市第一、二、三产业分布情况【聚类分析】

2016年广西各市第一、二、三产业分布情况

数据来源:国家统计局
03-06.jpg
代码实现如下:
数据处理
> md <- read.csv("d:/GX2016.csv",header = TRUE,sep=",") #提取数据
> md
        X       x1    x2    x3    x4
1    南宁 107.0000 103.2 105.8 108.8
2    柳州 107.3000 103.1 105.7 110.5
3    桂林 106.9000 104.5 106.4 108.7
4    梧州 107.6000 103.3 108.6 107.2
5    北海 108.6000 104.1 109.6 109.7
6  防城港 109.1000 104.0 115.5 106.5
7    钦州 109.0000 103.5 113.3 109.7
8    贵港 107.9000 103.8 110.0 107.9
9    玉林 108.0000 102.1 109.6 109.0
10   百色 108.8000 103.9 109.5 110.2
11   贺州 108.1000 104.1 110.0 108.3
12   河池 104.9000 103.2 101.2 108.5
13   来宾 103.9000 103.0 101.5 107.1
14   崇左 108.2000 103.4 107.9 111.5
15        107.5214    NA    NA    NA
> md <- read.csv("d:/GX2017.csv",header = TRUE,sep=",") #提取数据
> md
        X    x1    x2    x3    x4
1    南宁 107.0 103.2 105.8 108.8
2    柳州 107.3 103.1 105.7 110.5
3    桂林 106.9 104.5 106.4 108.7
4    梧州 107.6 103.3 108.6 107.2
5    北海 108.6 104.1 109.6 109.7
6  防城港 109.1 104.0 115.5 106.5
7    钦州 109.0 103.5 113.3 109.7
8    贵港 107.9 103.8 110.0 107.9
9    玉林 108.0 102.1 109.6 109.0
10   百色 108.8 103.9 109.5 110.2
11   贺州 108.1 104.1 110.0 108.3
12   河池 104.9 103.2 101.2 108.5
13   来宾 103.9 103.0 101.5 107.1
14   崇左 108.2 103.4 107.9 111.5
> mdd <-  md[,-c (1 ,0)] #删除第一列
> mdd
      x1    x2    x3    x4
1  107.0 103.2 105.8 108.8
2  107.3 103.1 105.7 110.5
3  106.9 104.5 106.4 108.7
4  107.6 103.3 108.6 107.2
5  108.6 104.1 109.6 109.7
6  109.1 104.0 115.5 106.5
7  109.0 103.5 113.3 109.7
8  107.9 103.8 110.0 107.9
9  108.0 102.1 109.6 109.0
10 108.8 103.9 109.5 110.2
11 108.1 104.1 110.0 108.3
12 104.9 103.2 101.2 108.5
13 103.9 103.0 101.5 107.1
14 108.2 103.4 107.9 111.5

x1                 x2               x3              x4
    地区总产值       第一产业        第二产业        第三产业
描述统计
> #描述统计
> library(Hmisc)
> data <- c("x1","x2","x3","x4")
> summary(mdd[data])
       x1              x2              x3              x4       
 Min.   :103.9   Min.   :102.1   Min.   :101.2   Min.   :106.5  
 1st Qu.:107.1   1st Qu.:103.2   1st Qu.:106.0   1st Qu.:108.0  
 Median :108.0   Median :103.5   Median :109.0   Median :108.8  
 Mean   :107.5   Mean   :103.5   Mean   :108.2   Mean   :108.8  
 3rd Qu.:108.5   3rd Qu.:104.0   3rd Qu.:109.9   3rd Qu.:109.7  
 Max.   :109.1   Max.   :104.5   Max.   :115.5   Max.   :111.5  

> myda1 <- sum(mdd$x2)/sum(mdd)
> myda2 <- sum(mdd$x3)/sum(mdd)
> myda3 <- sum(mdd$x4)/sum(mdd)
> pic <- c(0.2418,0.2527,0.2542)*100
> labls <-c("第一产业","第二产业","第三产业")
> lab2 <- paste(labls," ",pic,"%",sep="")
> pie(pic,labels = lab2,col = rainbow(5),main="各产业比重饼图")
Rplot021.png
1       2       3    4       5     6        7     8     9    10     11
南宁  柳州  桂林  梧州  北海 防城港  钦州  贵港  玉林  百色  贺州
12     13    14
河池  来宾  崇左
聚类分析
> #聚类分析
> d <- dist(mdd) #求距离
> fit.average <- hclust(d,method = "average")
> plot(fit.average,hand=.8,main="聚类分析")
> rect.hclust(fit.average,k=4)
Rplot06.png
条形图
> #条形图
> par(mar=c(5,5,8,2))
> x <- c("南宁","柳州","桂林","梧州","北海","防城港","钦州","贵港",
+        "玉林","百色","贺州","河池","来宾","崇左")
> y <- c(1:100)
> barplot(md$x1,main = "地区生产总值",names.arg=x,
+         xlab = "城市",ylab = "总产出")
> barplot(md$x2,main = "第一产业",names.arg=x,xlab = "城市",ylab = "总产出")
> barplot(md$x3,main = "第二产业",names.arg=x,
+         xlab = "city",ylab = "总产出")
> barplot(md$x4,main = "第三产业",names.arg=x,
+         xlab = "city",ylab = "总产出")

Rplot.png
Rplot01.png
Rplot03.png
Rplot04.png

总结:

  1. 从聚类分析图可知,第一类为河池、来宾,第二类为防城港、钦州,第三类为北海、百色、玉林、梧州、贵港、贺州,第四类为崇左、柳州、南宁、桂林,也比较符合人们的认知水平。
  2. 综合来说,在广西,第四类城市经济发展水平较高,第三类次之,第一类较低。
  3. 从饼图可知,在三类产业中,第三产业占总产值的比重最高,紧接着的第二产业,且第二产业和第三产业比重很接近,三类产业发展较为均衡,没有较突出的领域,第一产业占的比重依然很大,第三产业没有成为发展的主力军,导致总体GDP在全国水平也偏低。
  4. 具体分析,在第一产业中,百色、北海、崇左、贺州的产值较高;在第二产业中,桂林、防城港、北海、贺州的产值较高;在第三产业中,南宁、柳州、百色、崇左的产值较高,因此在新兴领域,在南宁和柳州发展有较好前景。

表格数据获取链接:https://www.jianguoyun.com/p/DWZ7JDQQ0r2mBxiY754B

你可能感兴趣的:(2016年广西各市第一、二、三产业分布情况【聚类分析】)