nhanes数据库挖掘教程4-ggsurvey包对插补后数据绘制条形图、箱线图、直方图(1)

美国国家健康与营养调查( NHANES, National Health and Nutrition Examination Survey)是一项基于人群的横断面调查,旨在收集有关美国家庭人口健康和营养的信息。
地址为:https://wwwn.cdc.gov/nchs/nhanes/Default.aspx
nhanes数据库挖掘教程4-ggsurvey包对插补后数据绘制条形图、箱线图、直方图(1)_第1张图片
上期我们已经介绍了对nhanes数据库数据进行多重插补,这次我们介绍一下怎么对插补后数据进行分析,先介绍ggsurvey包对插补后数据绘制条形图、箱线图、直方图,我们上次插补生成了5个插补数据,我们导入其中一个。

library("survey")
library(ggsurvey)
bc<-read.csv("E:/nhanes/nhanestest1.csv",sep=',',header=TRUE)
names(bc)

nhanes数据库挖掘教程4-ggsurvey包对插补后数据绘制条形图、箱线图、直方图(1)_第2张图片
数据中包含有缺失值插补的信息,这部分我们绘图并不需要,先删掉,并把分类变量转成因子

bc<-bc[,c(1:16)]
bc$RIAGENDR<-as.factor(bc$RIAGENDR)
bc$RIDRETH1<-as.factor(bc$RIDRETH1)
bc$DMDMARTL<-as.factor(bc$DMDMARTL)

生成调查数据

bcSvy2<- svydesign(ids = ~ SDMVPSU, strata = ~ SDMVSTRA, weights = ~ WTMEC2YR,
                   nest=TRUE,data = bc)

绘制年龄的条形图,绘制之前需对年龄分段,在生成调查数据前分段也可以

bcSvy2<-update(bcSvy2,agecut=cut(RIDAGEYR,c(0,20,40,60,Inf),right=FALSE))

绘图

ggbarweight_svy(bcSvy2, agecut)+ylab("Proportion")

nhanes数据库挖掘教程4-ggsurvey包对插补后数据绘制条形图、箱线图、直方图(1)_第3张图片
进一步更改颜色

ggbarweight_svy(bcSvy2, agecut,fill = TRUE)+ylab("Proportion")

nhanes数据库挖掘教程4-ggsurvey包对插补后数据绘制条形图、箱线图、直方图(1)_第4张图片
绘制箱线图

ggboxweight2d_svy(bcSvy2, RIDAGEYR, RIDRETH1)

nhanes数据库挖掘教程4-ggsurvey包对插补后数据绘制条形图、箱线图、直方图(1)_第5张图片
箱线图还可以进一步分面,我这里按婚姻状态进一步分面

ggboxweight3d_svy(bcSvy2, RIDAGEYR, RIDRETH1,DMDMARTL)

nhanes数据库挖掘教程4-ggsurvey包对插补后数据绘制条形图、箱线图、直方图(1)_第6张图片
绘制直方图
nhanes数据库挖掘教程4-ggsurvey包对插补后数据绘制条形图、箱线图、直方图(1)_第7张图片
进一步调整宽度
nhanes数据库挖掘教程4-ggsurvey包对插补后数据绘制条形图、箱线图、直方图(1)_第8张图片
本次分享就到这里了,仅供参考,图形的细节、颜色还可以进一步调整,有空再介绍一下,有兴趣的也可以自己研究一下。

你可能感兴趣的:(R语言,nhanes数据库)