SPSS生存分析

本推文是SPSS‖生存分析基础入门与实战课程中S02-1生存分析

首先总结下死亡速度、生存率、和生存时间。

死亡速度及其计算

“死亡”指的是,阳性终点事件的发生。死亡速度:时刻存活的个体在t时刻的瞬时死亡(阳性事件发生)率,可以理解为一-组人群在不同时刻的阳性终点事件发生的速度。具体可以用以下函数来表达:

SPSS生存分析_第1张图片

在专业上,我们把它称之为风险h(t), 上述公式称之为风险函数(hazard function) 。风险函数随着时间的变化而变化,一般情况下,随访前期,“死亡速度较快。

与死亡速度相对应的的是死亡率,即一段时间内人群的死亡比例,死亡率由死亡速度乘以时间即可得到。

生存率及其计算

生存率(survival rate):0 时刻存活的个体经历 t 时后仍存活的可能性,简写为S(t)。这一指标临床上用的非常多,比如我们经常计算肺癌患者3年生存率、10年生存率、乳腺癌患者5年复发率等。

一把情况下,研究伊始人群总生存率为1,而当所有人出现阳性终点事件时,生存率为0。 生存率与时间相关,可建立与时间的函数关系,因此生存率又称关于时间的生存函数。一般情况下,由于生存分析主要阳性事件结局为坏结局,时间越长,生存率往往越低。

研究者可以根据研究对象的“死亡”速度,来计算各时间点的生存率。最常见的计算方法是Kaplan-Meier法。Kaplan-Meier法又称乘积极限法,它根据每一个时间段的生存概率相乘得到累计生存率。初学者可忽略其计算的原理与方法。

生存时间及其计算

生存时间与死亡率、生存率紧密相关。死亡速度越高、生存率越低,则生存时间越短。生存时间的计算,最常见的采用中位生存时间来描述。中位生存时间(median survival time):也称半数生存期,是生存时间中位数,表示恰有50%的个体存活的时间,即生存率为50%时对应的生存时间,是描述集中趋势的指标。中位生存期越长,表示疾病的预后越好。

如何阅读生存曲线图

死亡速度、生存率、生存时间三者一事三表,高度相关(见下图)。

SPSS生存分析_第2张图片

生存曲线图可集中形象反映三者的特征与关系。

生存曲线图最常见的莫过于Kaplan-Meier生存曲线图。1958年,Edward L. Kaplan和 Paul Meier合作发表了一篇关于如何处理不完整的生存时间资料文章后,利用Kaplan-Meier方法描绘生存过程、绘制生存曲线已经成为处理不同生存时间(time-to-event)的最熟悉的方式。

我们以下数据为例,采用SPSS软件绘制出最朴素的生存曲线图。

3种疗法治疗66例白血病患者缓解时间(天),数据(kaplanm.sav)如下:

A疗法:4,5,9,10,11,12,13,20+,28,28,28,29,31,32,37,41,41,57,62,74,109,100,139,158+

B疗法:8,10,10,12,14,20,48,70,75,99,103,161+,162,169,195,199+,220,217+,245+

C疗法:8,10,11,12+,23,25,28,28,31,31,40,48,89,124,143,159+,190+,196+,197+,205+,219+

本案例中总共有3种疗法,每种疗法的终点阳性事件是疾病进展,生存时间即术后到疾病进展之间的缓解期时间。时间带+号意味着它是不完全生存时间,研究对象删失了。

随着时间的流逝,同一疗法的患者逐渐出现疾病进展的现象,且大部分出现在早期,所以早期生存率下降地较快(风险函数值即死亡速度较大)。不同人群的同一时期的死亡速度可能不一致,导致不同对象死亡率、中位生存时间都不一致。

下图即Kaplan-Meier 生存曲线图,我们可以从中得到更多的信息。该图X轴为生存时间,Y轴为生存率,不同曲线代表不同治疗随着时间变化,生存率发生的变化。请问,三种治疗方法生存率变化趋势一致吗?死亡速度变化一致吗?

SPSS生存分析_第3张图片

很明显,三者死亡率均呈下降趋势,早期下降较快,后期趋于平稳;三者死亡率下降速度不一致,A疗法(代表蓝色曲线)生存率下降较快,死亡速度较快,因此生存时间也相对较短。B、C两种疗法伯仲之间。

曲线图折线的发生意味着此时此刻研究对象发生阳性事件(本例是患者出现了进展);带加号意味着,在此时此刻,患者出现了失访现象。该时刻出现阳性事件该时刻患者删失了

Y轴50%生存率对应的X轴时间为各条曲线的中位生存时间。可以看出来,时间长短上,A疗法

SPSS生存分析_第4张图片

怎么看死亡速度(风险函数值)呢?某一时刻的死亡速度即该时刻的曲线的切线斜率(紫色虚线)。可以看出,在第40天前后,三者切线斜率是A疗法>B疗法>C疗法,意味着A疗法出现疾病进展的速度最快。同时,不同时刻同一人群死亡速度不同。

SPSS生存分析_第5张图片

因此,通过K-M生存曲线图就可大致描述不同组人群的生存率、死亡速度、中位生存时间。同时,生存曲线图也显示出3组人群生存率变化趋势不尽相同,或者说3条生存曲线不一致,反映出3组人群不同的生存状态。

你可能感兴趣的:(java,算法,机器学习)