疾病负担研究(GBD)-如何优雅的展示发病率数据

文章首发于微信公众号:“小明学习室”

本文是GBD的第三篇推文,今天我们就以已经发表的高分GBD文章来看下如何展示GBD数据,本文案例文章是发表在JOURNAL OF HEPATOLOGY的肝癌GBD研究,题目为The trends in incidence of primary liver cancer caused by specific etiologies: Results from the Global Burden of Disease Study 2016 and implications for liver cancer prevention.

疾病负担研究(GBD)-如何优雅的展示发病率数据_第1张图片

在文中,作者用一个表格展示了1990到2016年的疾病发病数以及年龄校正后的标准发病率,同时作者估计了从1990到2016年之间的年平均发病变化率(estimated annual percentage change, EAPC)。

疾病负担研究(GBD)-如何优雅的展示发病率数据_第2张图片

这个方法描述的大义就是:需要用ASR计算EAPC,同时说明了ASR以及EAPC的计算方法,但ASR在下载好的数据中已有,这个不需要我们计算,我们只需要计算EAPC即可。按照文中方法描述,我们采用线性回归方程来计算,y值是每一年对应的ln(ASR),x值就是年份,EAPC就是把对应的x和y值根据回归方程计算出β值后,EAPC=100*(exp(β)-1)。按照这个思路我们即可计算出EAPC,如果EAPC>0,说明ASR逐年递增;EAPC<0,说明ASR逐年递减。

这次我们来制作第一个表格,就是文章的Table 1

疾病负担研究(GBD)-如何优雅的展示发病率数据_第3张图片

里面数据都是现成的,除了EAPC需要计算外,我们需要做的是将数据以及95%UI的上下值整合在一个方格中即可,免去自己一个个打上去。

我们打开我们的R语言:

 

我们首先读取表格中的1990年的发病率数据

 疾病负担研究(GBD)-如何优雅的展示发病率数据_第4张图片

通过对EC限定条件取EC的子集,取的EC_1990如下:

疾病负担研究(GBD)-如何优雅的展示发病率数据_第5张图片

我们再通过下述代码获取示例文中的第一列数据:需要注意的是,我们的发病数是没有除以1000的

疾病负担研究(GBD)-如何优雅的展示发病率数据_第6张图片

得到的结果如下

疾病负担研究(GBD)-如何优雅的展示发病率数据_第7张图片

按照相同的方法可以获取2019

 疾病负担研究(GBD)-如何优雅的展示发病率数据_第8张图片

 我们按同样的思路计算ASR

疾病负担研究(GBD)-如何优雅的展示发病率数据_第9张图片

获得的其中一个ASR的数据结果如下

疾病负担研究(GBD)-如何优雅的展示发病率数据_第10张图片

下面按照文章的方法学描述来计算EAPC

疾病负担研究(GBD)-如何优雅的展示发病率数据_第11张图片

最后计算得到的结果如下所示:

疾病负担研究(GBD)-如何优雅的展示发病率数据_第12张图片

最后我们再用同样的方法整合可信区间上下值

疾病负担研究(GBD)-如何优雅的展示发病率数据_第13张图片

最后得到的结果如下:

疾病负担研究(GBD)-如何优雅的展示发病率数据_第14张图片

我们再将各部分的数据整合在一起,输出到csv表格中

疾病负担研究(GBD)-如何优雅的展示发病率数据_第15张图片

最后打开表格,呈现给大家的结果是这样的:

疾病负担研究(GBD)-如何优雅的展示发病率数据_第16张图片

剩下的只需要大家将结果黏贴至word中,调整格式即可,这样我们的第一张表格就制作完成了,是不是很简单,大家可以操练起来

大家如果需要上述代码,关注微信公众号——小明学习室,回复“GBD”即可获取代码和数据结果

                                                   疾病负担研究(GBD)-如何优雅的展示发病率数据_第17张图片

你可能感兴趣的:(GBD数据库,回归,数据挖掘)