生存分析(1)

临床研究中,生存分析对于一项干预措施或者是危险因素的评估是一种关键方法。生存分析对应于一组统计方法,用于调查感兴趣事件发生所花费的时间。生存分析的概念是广泛的,可以是指通常意义下的生存时间,也可以是指所关心的某个现象(如疾病愈后,合格品使用后)。多见到的生存分析概念有总体生存分析(overrall survival analysis,OS),无病进展生存期(Progression-Free Survival,PFS)。

参考文章及书目
什么是无病进展生存期、总生存期和中位生存期?
Survival Analysis Basics

1. 肿瘤研究中,典型的问题

  • 某些临床特征对患者生存的影响是什么
  • 一个人生存3年的概率是多少?
  • 两组患者的生存率是否存在差异?

2. 几个概念

2.1 总体生存分析

总体生存是指,从病人确认患有疾病开始至因任何原因引起死亡的时间。该指标常常被认为是肿瘤临床试验中最佳的疗效终点。确认病人因病或其他因素引起死亡的日期通常几乎没有困难,并且死亡的时间有其独立的因果关系。如果在生存期上有小幅度的提高,可以认为是有意义的临床受益证据

2.2 无病进展生存期

所谓无病进展生存期(Progression-Free Survival,PFS)通常定义为病人经过治疗,随机选择某个时间直到肿瘤复发或因各种原因出现死亡,病人总的生存时间。

PFS的优点在于它能反映肿瘤的生长(这个现象可能反映了肿瘤相关疾病或死亡的因果联系),可以于生存获益证实前被评价,不会受到后续治疗的潜在的易混淆的指标或症状影响。而且PFS的结果比生存期结果出现得更早,治疗过程中,病人一旦出现了症状,肿瘤复发了,过了无病进展生存期就要采取其他积极治疗手段,从而进一步改善患者的症状,延长生存时间。

2.3 无复发生存时间

无复发生存时间( relapse-free survival time) 是指从治疗到疾病复发之间的时间。也称为无病生存时间(disease-free survival time) 和无事件生存时间 (event-free survival time) 。

3. 生存函数和风险函数

使用生存概率和危险概率这两个概念来描述生存数据。

3.1 生存函数

生存函数用S(t)表示, 是指观察对象生存时间T大于某时刻t的概率。

S(t) = Prob(T > t)

在具体问题中,该函数t时刻的取值可以用以下公式来估计

S(t) = 生存时间长于t的观察对象人数 / 观察对象总人数

显然,S(t) 是一个随时间增加而下降的函数,表示观察对象随访到t时刻的累计生存率。

3.2 风险函数

风险函数用h(t)表示,指的是是在时间t被观察的个体在该时间发生事件的概率。

风险函数随着时间的延长可呈现为递增、递减或者其他的波动形式。如果风险函数为常数时,表示死亡速率不随着时间而加速;如果风险函数随着时间上升,则表示死亡速率随时间而加速;风险函数随着时间下降,则表示死亡速率随时间减速。

4. Kaplan-Meier 生存分析

Kaplan-Meier 生存分析,即就是乘积极限法,是一种非参数方法,用于根据观察到的生存时间估算生存概率(Kaplan和Meier,1958年)。

时刻的生存概率计算如下:

= 在存活的概率
= 之前还活着的病人数量
是指再时刻事件的发生的书目
=0,

估计概率(S(t))是仅在每个事件发生时才改变值的阶跃函数。同样也可以计算生存概率的置信区间。

KM生存曲线是KM生存概率与时间的关系图,提供了可用于估计度量值(例如中位生存时间)的数据。

5. Cox回归分析

5.1 什么是Cox回归模型

Cox模型是目前生存分析多因素预后评价中较好的统计学方法。Cox将模型以半参数方式出现,适用于许多分布未知的资料的多因素分析,可以再许多因素共存的情况下,排除混杂因子的影响,提高预后分析的质量,并能处理截尾数据。

上面提到Cox是半参数模型,什么是半参数模型

参数模型回归分析:已知生存时间服从特定的参数模型时,拟合相应的参数模型,更准确地分析确定变量之间的变化规律。
缺点:使用参数法进行生存分析需要事先知道生存时间的分布。
优点:1. 能比较两组或多组生存时间分布函数。2.能分析危险因素对生存时间的影响。3.能建立生存时间与危险因素之间的依存关系的模型。

非参数检验:检验分组变量各水平所对应的生存曲线是否一致。
对生存时间的分布没有要求。常用的方法有乘积极限法(PL法)和寿命表法(LT法)。

半参数模型回归分析:不需要对生存时间的分布作出假定,但却可以通过一个模型来分析生存时间的分布规律,以及危险因素对生存时间的影响。

Cox比例风险回归分析法是这种半参数模型的代表,在表达形式上与参数模型相似,但在对模型中的各个参数进行估计时又不依赖于特定分布假设

先写到这里,实践才能真正掌握,后面重点使用R进行生存分析,并可视化分析结果。

你可能感兴趣的:(生存分析(1))