关于这个包的相关介绍,作者在这个网站进行了介绍http://research-pub.gene.com/IMvigor210CoreBiologies/ ,关于包的使用和安装,在这篇文章中都进行了介绍。但是这个说明已经是18年的内容,随着R版本的更新和变化,安装过程总有一些问题出现。
结合这个package的内容和其他文章,进行一个学习和总结。
1.介绍
1.1主要内容
- 原文的目的:对免疫治疗反应与否,或者反应抵抗一些关键因素进行探索。
- 涉及这个R包的内容:对使用PD-L1抑制剂治疗的患者,进行相关的测序记录和临床特征的记录
- 原文发现:对治疗的反应与CD8+T效应细胞表型有关,甚至在更大程度上与高新抗原或肿瘤突变负担有关。缺乏反应与成纤维细胞中转化生长因子β(TGFβ)信号的特征有关。
当然原文后面还有一些动物实验,文章做的东西还是比较多的,与这个R包的关系不算太大。个人分析时,按需进行分析,得到自己的结果就好。
1.2意义
如前文所讲,这个R包有一些珍贵的数据,是一个当前十分流行的免疫反应队列数据包,包含了一些免疫治疗相关的数据。
如果做免疫治疗和免疫微环境相关的,这个包还是有很大的利用价值的。
2.如何安装
2.1 下载R包,直接安装
在包的说明文档中http://research-pub.gene.com/IMvigor210CoreBiologies/ ,提及到这个包的下载地址 http://research-pub.gene.com/IMvigor210CoreBiologies/IMvigor210CoreBiologies.tar.gz
本来按照这个下载就可以,之前也是可以下载的,但是自己写这个总结的时候,发现这个链接竟然失效了,幸亏有之前下载的。我把这个上传到网盘,有需要的下载
安装包和提取到的数据如下
本来是放的网盘下载链接,结果平台不让放,让人很生气,平台很让人生气,好感度下降很多。
install.packages("./IMvigor210CoreBiologies_1.0.0.tar.gz", repos = NULL, type = "source")
2.2 安装依赖的R包
按照上面的安装完成后,依然会提示很多问题,首先就是缺各种包,按照提示安装即可。由于每个人之前安装过的包不同,所缺的也不一定一样,按照提示安装即可。
下面的代码是可以判断是否安装过某一个包,然后再决定安装与否的
### 设置镜像
options("repos"=c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor")
### 安装缺失的R包-CRAN
if(!requireNamespace("dplyr",quietly = TRUE)) install.packages("dplyr")
if(!requireNamespace("DT",quietly = TRUE)) install.packages("DT")
if(!requireNamespace("ggplot2",quietly = TRUE)) install.packages("ggplot2")
if(!requireNamespace("reshape2",quietly = TRUE)) install.packages("reshape2")
if(!requireNamespace("plyr",quietly = TRUE)) install.packages("plyr")
if(!requireNamespace("survival",quietly = TRUE)) install.packages("survival")
if(!requireNamespace("circlize",quietly = TRUE)) install.packages("circlize")
if(!requireNamespace("lsmeans",quietly = TRUE)) install.packages("lsmeans")
if(!requireNamespace("spatstat",quietly = TRUE)) install.packages("spatstat")
if(!requireNamespace("corrplot",quietly = TRUE)) install.packages("corrplot")
### 安装缺失的R包-Bioconductor
if(!requireNamespace("ComplexHeatmap",quietly = TRUE)) BiocManager::install("ComplexHeatmap")
if(!requireNamespace("biomaRt",quietly = TRUE)) BiocManager::install("biomaRt")
if(!requireNamespace("DESeq2",quietly = TRUE)) BiocManager::install("DESeq2")
if(!requireNamespace("edgeR",quietly = TRUE)) BiocManager::install("edgeR")
if(!requireNamespace("limma",quietly = TRUE)) BiocManager::install("limma")
2.3 其中需要的一个特殊的包
上面的按照相应的需要,缺什么补什么就可以,但是其中需要Deseq
包,这个包不能直接在R中使用命令安装,因为这个包已经不存在现有的R版本中。
这时候,就需要去储存R包的位置中找到这个R包的是存档,手工安装。可以去bioconductor网站中,搜索相应的这个包的版本。
在这个链接中
https://bioconductor.statistik.tu-dortmund.de/packages/3.8/bioc/html/DESeq.html
下载到本地
然后按照本地安装R包的方式,进行安装即可
3.数据获取
3.1 使用安装好的R包,提取相关数据
library(IMvigor210CoreBiologies)
data(cds)
expreSet <- as.data.frame(counts(cds))
annoData <- fData(cds)
phenoData <- pData(cds)
expreSet 是表达矩阵,行是基因31286,列是样本348
annoData是基因的注释信息
phenoData是样本信息
有25列信息,值得深入挖掘
3.2 保存数据
像这种不好下载的数据,既然已经把数据提取出来了,那么就直接保存为Rdata数据格式,方便下次提取。
只需要把Rdata文件放在相关位置即可,每次load即可
load(file = "./IMvigor210CoreBiologies.Rdata")
安装包和提取到的数据如下
本来是放的网盘下载链接,结果平台不让放,让人很生气,平台很让人生气,好感度下降很多。
4.拓展
世界就是如此奇妙,能够轻松想到的事情,早就有人做过了。既然只是提取IMvigor210CoreBiologies的数据,那么早有人已经把这个工作做成了R包
有人把这个数据打包到了easierData这个R包中
if(!requireNamespace("easierData",quietly = TRUE)) BiocManager::install("easierData")
library(easierData)
library(SummarizedExperiment)
data <- get_Mariathasan2018_PDL1_treatment()
expreSet <- assay(data)
phenoData <- as.data.frame(colData(data))
但是这个R包中,关于样本信息有删减,可能作者只是用于有助于他的研究的数据,可以使用,但是不一定是全面的。根据需求进行取舍。
参考文章
TGF-b attenuates tumor response to PD-L1 blockade by contributing to exclusion of T cells
TGFβ attenuates tumour response to PD-L1 blockade by contributing to exclusion of T cells | Nature
免疫反应R包IMvigor210CoreBiologies的安装以及数据获取
安装IMvigor210CoreBiologies R包遇到的一系列问题_yitingh的博客-CSDN博客
IMvigor210CoreBiologies包安装指北 - 腾讯云开发者社区