TCGA+biomarker——多因素Cox回归

多因素Cox回归

单因素cox回归分析得到的是多个自变量与生存之间的关系,但并没有排除其他因素这个结果是否有作用。一般多因素Cox回归分析就是用来矫正其它因素的,也可以用作某变量是否能作为独立因子的评估方法。

多因素cox回归案例展示

下图展示了多因素COX回归,评估KIF20A表达状态与总生存和无病生存之间的相关性,并矫正了其他因素对其影响,评估KIF20A能否作为独立因子!(这里其实是将KIF20A这个因素构建成两种不同的分类体系,一种为连续性数值变量;一种为二分类型变量。两者形式的变量进行多因素cox回归分析,发现都显著,进一步证明了KIF20A作为独立因子的可靠性!)

image

很多时候,为了单因素和多因素COX回归结果看起来更连贯,经常也会把两种cox回归结果整理在一起进行展示,如下图:分别在两组独立数据集中做单因素和多因素Cox回顾分析。解释如下:以TESTING数据集结果为例,单因素cox分析了10个变量与生存之间的关系,发现有5个变量结果显著。接下来对这5个变量进行多因素分析,发现有两个变量显著,可作为独立因子!

image

多因素cox回归结果解释

多因素cox回归结果
image

从上图中可以看出来,单因素cox和多因素cox的结果属性值都是一样的,只是前者的变量为一个(对应一组结果值),后者变量可以有多个(对应多组结果值)。

多因素cox回归结果关键之处****:在多因素cox回归分析中,可以评估各个自变量的相对效应,比较各个自变量的回归p值。若性别(sex)更为显著的,****表明性别是患者之间生存期不同的主要因素,患者年龄次之,但作为协变量的情况下表现不明显(p>0.05)。也可以查偏回归系数等指标,关注exp(coef)信息,和上文中分别使用性别(sex)和年龄(age)的单变量Cox回归具有一致的趋势。性别(sex)的exp(coef)<1(即HR<1), 年龄的exp(coef)>1(即HR>1),表明男性肺癌患者比女性肺癌患者具有更差的预后,高龄人群可能存在更高的风险。

多因素cox回归分析如何做?

——适用于数值型变量,即多因素cox结果只有一行。(自变量可以是连续性变量,也可以是数值化后的分类变量)

rm(list = ls())
library("survival")
library("survminer")
#载入并查看数据集
data("lung")
head(lung)
str(lung)#该数据将所有变量都转换为数值型,包括性别(1,2表示),分期(1,2,3,4表示)等。若是字符型的话,结果会有所不同!

#cox 回归分析(多因素)
res.cox <- coxph(Surv(time, status) ~ age+sex+ph.ecog+ph.karno+pat.karno, data = lung)
res.cox
summary(res.cox)

——适用于分类变量,同时展示所有协变量的结果

rm(list = ls())
library("survival")
library("survminer")
#载入并查看数据集
data("lung")
head(lung)
str(lung)#该数据都为数值型,如性别(1,2表示)。要分类展示cox回归需要将分类变量因子化

#将分类变量从数值型改为因子
lung <- within(lung, {
  sex <- factor(sex, labels = c('female', 'male'))})# female为对照

#cox回归分析(多因素)
res.cox <- coxph(Surv(time, status) ~ age+sex+ph.ecog+ph.karno+pat.karno, data = lung)
res.cox
summary(res.cox)
##是否分开展示看结果,整体展示和分开展示哪个好说明好解释用哪个!!

往期回顾
TCGA+biomarker——常见结果展示
TCGA+biomarker——Sample基线表
TCGA+biomarker——单因素Cox回归

更多内容可关注公共号“YJY技能修炼”~~~

你可能感兴趣的:(TCGA+biomarker——多因素Cox回归)