php 生存分析,HPA数据库08.做生存分析

生信论文的套路

ONCOMINE从全景、亚型两个维度做表达差异分析;

临床标本从蛋白水平确认(或HPA数据库),很重要;

Kaplan-Meier Plotter从临床意义的角度阐明其重要性;

cBio-portal数据库做基因组学的分析(机制一);

STRING互作和GO/KEGG分析探讨可能的信号通路(机制二);

TISIDB/TIMER分析肿瘤免疫特征(机制三)。

我们前面说过,如果没有条件,用人类蛋白组图谱数据库(The human preotein atlas, HPA,网址:https://www.proteinatlas.org/)阐释蛋白的差异表达是最方便的。一般在论文中出现的是病理检测结果(IHC),特别是结合ONCOMINE数据库的结果,对基因在肿瘤和临近组织的表达进行对比展示。

此外,尽管KM Plotter可以用来做生存分析,但是有时会遭到质疑。我们还可以用用HPA获得生存分析的数据,并通过Excel做出生存曲线图。那具体如何操作呢?

首先是打开HPA官网,输入兴趣基因“ACE2”,点击search进入页面。

php 生存分析,HPA数据库08.做生存分析_第1张图片

找到含有病人信息的网页,这里的数据均来自TCGA数据库,包括病人的样本信息,病人年龄,性别,种族,疾病分期,存在状态,存活时间等信息。

php 生存分析,HPA数据库08.做生存分析_第2张图片

点击show all,复制样本信息和描述的所有内容,粘贴到Excel(Excel先设置为文本格式,或者在粘贴时出现的对话框选择为文本)。粘贴后,数据是分为两列的,接下来,需要用到数据处理的技巧。

php 生存分析,HPA数据库08.做生存分析_第3张图片

在数据的对话框下面有 分列功能,选择描述部分的内容,然后选择分列。出现如下的对话框。

php 生存分析,HPA数据库08.做生存分析_第4张图片

我们获得的数据之间是空格,所以我们可以选定“空格”,别的可以先不管。

php 生存分析,HPA数据库08.做生存分析_第5张图片

最后获得分列的数据信息。有些数据信息并不全面,我们需要对一些数据进行预处理,调整信息到相应的列中。然后把数据粘贴到Graphpad中,进行生存分析就可以了。

php 生存分析,HPA数据库08.做生存分析_第6张图片

愿与果友们共同成长!

你可能感兴趣的:(php,生存分析)