COX预测模型过程中,我踩过的那些雷

R语言做!初学者先进来看看!!!

SCI冲

COX分析:做临床信息与预后相关的COX分析大致都会分为两个步骤,先做单因素COX回归分析,再根据P值挑选有意义的变量,最终纳入COX多因素回归模型中;这个过程可以利用SPSS进行,当然为了和后续分析结果可视化联系在一起,可能使用R语言会更方便一些;

R语言COX分析:上述的单因素COX分析到多因素COX分析的R分析,在网上的教程不少,其中绝大多数都直接从教你如何分析自变量与结局间的关系开始,一直到可视化,这里我也推荐一个B站上的教程,小姐姐带着写代码,每一步都有详细解说,有需要的可以去看看,视频链接为:

【麦子】Cox回归的R操作:从单因素到多因素一气呵成_哔哩哔哩_bilibili​www.bilibili.com/video/av18918951/​编辑

这里必须要提及的是数据问题,肯定有很多初学者在跟着教程跑代码的时候出现了不少error,warning,这主要原因是很多教程使用的数据都是R语言中自带的数据集lung,人家自带的数据能不规范嘛,你再看看你的数据类型符合用coxph()函数做分析的要求嘛???所以接下来,我就我在COX分析过程中遇到的困难给初学者们排排雷;

数据读取问题:使用read.table()函数读取部分数据时,会存在数据读取不全,数据缺失的问题,当然不是所有数据都存在这种情况,如果存在这种情况了,或者使用read.table()函数后,不论怎么修改sep="",row.names=也不能将数据正确格式读进来的时候,建议大家将原有的数据存储为UTF-8编码以逗号形式分割的.csv格式,再利用R语言中的read.csv(data,sep=",")函数读取,效果会好不少;

数据缺失值问题:在COX分析中会默认把缺失值直接删除后再做分析,如果某个样本有缺失值,建议把这个样本删除,当然,如果某个变量在样本中的缺失值过多,建议不要将这个变量纳入模型分析;

R包的安装问题:如果你跟的教程里面用的是install.packages(""),但是你使用这个代码总显示该R语言版本无法下载安装包时,很可能这个代码已经不适用了,这时候不要犹豫,直接在浏览器上搜索这个包的名字,登录这个包相关的官网上,点击installation模块,上面会有更新的安装此包的代码!!!亲测,上案例,COX等比例风险检验所需的survminer包,用install.packages("")已经无了,上官网,再安装;

官网安装代码截图

安装包安装成功的过程

COX分析中结局数据类型:生存分析类结局主要分为两种,出现阳性事件,用1表示,未出现阳性事件,用0表示,很多初学者在标注结局时,认为0和1应该是因子型变量,要么原数据就是factor形式,要么就是自己利用factor函数直接改成了因子型变量,最后用COX已分析,报错了:Error in coxph(y ~ 性别, data = data) : an id statement is required for multi-state models;这个错误是由于,COX分析使用的生存分析结局的0和1是数值型变量,你把它变成因子型了,肯定识别不了,这个问题困扰了我一个晚上,我是在网上翻到一篇外国网友的相似问题才知道了原因;

因子型结局变量报错

变量名问题:在我的数据变量名中,有包含@符号的,于是有报错了;当然有关变量名还不能包含其他哪些符号,大家一起探索!!!

变量名包含@报错

多因素COX回归分析中变量过多显示收敛不佳:我最后是有23个变量进入了多因素COX回归模型的建立,没有报错,但是报了warning,也是在国外网站上查到了相似问题,显示由于变量过多引起的;那这个时候你就要重新筛选你的变量了,这个时候我才重新去找COX分析对于因变量和自变量的要求,以下列出,包括各自变量间批次独立,这就需要独立性检验或者回归分析的介入了,如果你觉得现学相关的R代码太麻烦了,那你可以重新捡起来SPSS,网上教程教的很详细,一定要比R代码上手快一些;当然其他有关残差和等比例风险验证的问题,我本人也还没学会,遇到问题了,我们再一起讨论!!!

变量过多收敛不好

COX多因素模型需要满足的条件:

1.各观测值间相互独立,即残差之间不存在自相关;

2.因变量和自变量之间存在线性关系;

3.残差的方差齐;

4.不存在多重共线性;

5.没有显著异常值;

你可能感兴趣的:(r语言,回归)