疾病负担研究(GBD)——如何绘制疾病成分比

如需要加入GBD数据交流群,请加小编微信“Endoscopy_1991”,小编拉你进群

关于GBD数据库的实操视频已经陆续更新,如需要,大家可以关注B站的“小明学习室”。

这是GBD系列的第9篇推文,

今天后台有朋友反应不知道怎么做第一篇例文《The trends in incidence of primary liver cancer caused by specific etiologies: Results from the Global Burden of Disease Study 2016 and implications for liver cancer prevention》的图4。

疾病负担研究(GBD)——如何绘制疾病成分比_第1张图片

我仔细琢磨了下这个图形,写了个适合于画这个图的代码,和大家分享交流下:

根据这个图的标题的意思,是要拿到这4种疾病的发病例数,然后得到这4种疾病的发病总例数后得到每个疾病的占所有疾病的百分比。

因此,图4作图的关键就是每个疾病的占所有疾病的百分比

根据这个思路,我们下载好GBD2019年五种肝癌(乙肝、丙肝、酒精肝、脂肪肝以及其他病因)的所有年份的发病例数。

下载好的数据格式需要有下面这部分的数据(其中一部分):

获得这个原始数据后我们就可以开始运算了

首先,设置路径,读取R包

疾病负担研究(GBD)——如何绘制疾病成分比_第2张图片

我们首先获取2019年的5种肝癌的发病数

建立新的数据集用来存储5种肝癌占总肝癌例数的百分比

接下来我们需要构建循环语句来计算每一个地区的5种肝癌占总肝癌例数的百分比,并存储在新建立的数据集中。

我的思路是:建立2个循环,第一个循环是每循环一次,读取一个地区的5种肝癌发病数,并以此计算不同类型肝癌的发病占比,第二个循环是每循环一次,将一个地区的一个类型肝癌的发病占比赋值到LC_percent中,直至2个循环结束。我设置的代码大概是这样的,大家后期可以根据自己的疾病修改代码,并将其存储至LC_2019S数据集中

疾病负担研究(GBD)——如何绘制疾病成分比_第3张图片

我们采用同样的方法计算1990年5种肝癌占总肝癌例数的百分比

疾病负担研究(GBD)——如何绘制疾病成分比_第4张图片

最后合并好1990以及2019年的数据,并添加标签变量

针对合并好的数据框,将location以及cause设定变量的排列顺序

疾病负担研究(GBD)——如何绘制疾病成分比_第5张图片

最后开始作图,采用ggplot2中的条形图进行绘图,用5种肝癌类型作为填充-fill,由于我们已经统计好各个分型的占比,因此stat采用“identity”,并将占比百分比作为说明映射到图形中即可。

疾病负担研究(GBD)——如何绘制疾病成分比_第6张图片

最后就可以出来这个图形了~,当然了大家可以根据自己的配色来选择颜色搭配,然后在AI软件中调整图形即可。

疾病负担研究(GBD)——如何绘制疾病成分比_第7张图片

大家可以打开R实际操练起来,如果需要上述代码和数据,可以关注公众号——小明学习室,回复关键词“GBD”即可获取~

因为微信公众号修改规则,如果不标星或点在看,你可能会收不到我公众号文章的推送,请大家将本公众号标星,看完文章后记得点在看,谢谢。

你可能感兴趣的:(GBD数据库,数据挖掘,机器学习,大数据,r语言,数据库)