IMvigor210CoreBiologies的安装以及数据获取

IMvigor210CoreBiologies的安装以及数据获取_第1张图片

关于这个包的相关介绍,作者在这个网站进行了介绍http://research-pub.gene.com/IMvigor210CoreBiologies/ ,关于包的使用和安装,在这篇文章中都进行了介绍。但是这个说明已经是18年的内容,随着R版本的更新和变化,安装过程总有一些问题出现。

结合这个package的内容和其他文章,进行一个学习和总结。

1.介绍

1.1主要内容

  • 原文的目的:对免疫治疗反应与否,或者反应抵抗一些关键因素进行探索。
  • 涉及这个R包的内容:对使用PD-L1抑制剂治疗的患者,进行相关的测序记录和临床特征的记录
  • 原文发现:对治疗的反应与CD8+T效应细胞表型有关,甚至在更大程度上与高新抗原或肿瘤突变负担有关。缺乏反应与成纤维细胞中转化生长因子β(TGFβ)信号的特征有关。

当然原文后面还有一些动物实验,文章做的东西还是比较多的,与这个R包的关系不算太大。个人分析时,按需进行分析,得到自己的结果就好。

1.2意义

如前文所讲,这个R包有一些珍贵的数据,是一个当前十分流行的免疫反应队列数据包,包含了一些免疫治疗相关的数据。

如果做免疫治疗和免疫微环境相关的,这个包还是有很大的利用价值的。

2.如何安装

2.1 下载R包,直接安装

在包的说明文档中http://research-pub.gene.com/IMvigor210CoreBiologies/ ,提及到这个包的下载地址 http://research-pub.gene.com/IMvigor210CoreBiologies/IMvigor210CoreBiologies.tar.gz

install.packages("./IMvigor210CoreBiologies_1.0.0.tar.gz", repos = NULL, type = "source")

2.2 安装依赖的R包

按照上面的安装完成后,依然会提示很多问题,首先就是缺各种包,按照提示安装即可。由于每个人之前安装过的包不同,所缺的也不一定一样,按照提示安装即可。

下面的代码是可以判断是否安装过某一个包,然后再决定安装与否的

### 设置镜像
options("repos"=c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor")
### 安装缺失的R包-CRAN
if(!requireNamespace("dplyr",quietly = TRUE)) install.packages("dplyr")
if(!requireNamespace("DT",quietly = TRUE)) install.packages("DT")
if(!requireNamespace("ggplot2",quietly = TRUE)) install.packages("ggplot2")
if(!requireNamespace("reshape2",quietly = TRUE)) install.packages("reshape2")
if(!requireNamespace("plyr",quietly = TRUE)) install.packages("plyr")
if(!requireNamespace("survival",quietly = TRUE)) install.packages("survival")
if(!requireNamespace("circlize",quietly = TRUE)) install.packages("circlize")
if(!requireNamespace("lsmeans",quietly = TRUE)) install.packages("lsmeans")
if(!requireNamespace("spatstat",quietly = TRUE)) install.packages("spatstat")
if(!requireNamespace("corrplot",quietly = TRUE)) install.packages("corrplot")
### 安装缺失的R包-Bioconductor
if(!requireNamespace("ComplexHeatmap",quietly = TRUE)) BiocManager::install("ComplexHeatmap")
if(!requireNamespace("biomaRt",quietly = TRUE)) BiocManager::install("biomaRt")
if(!requireNamespace("DESeq2",quietly = TRUE)) BiocManager::install("DESeq2")
if(!requireNamespace("edgeR",quietly = TRUE)) BiocManager::install("edgeR")
if(!requireNamespace("limma",quietly = TRUE)) BiocManager::install("limma")

2.3 其中需要的一个特殊的包

上面的按照相应的需要,缺什么补什么就可以,但是其中需要Deseq包,这个包不能直接在R中使用命令安装,因为这个包已经不存在现有的R版本中。

这时候,就需要去储存R包的位置中找到这个R包的是存档,手工安装。可以去bioconductor网站中,搜索相应的这个包的版本。
在这个链接中
https://bioconductor.statistik.tu-dortmund.de/packages/3.8/bioc/html/DESeq.html
下载到本地
IMvigor210CoreBiologies的安装以及数据获取_第2张图片

然后按照本地安装R包的方式,进行安装即可

3.数据获取

3.1 使用安装好的R包,提取相关数据

library(IMvigor210CoreBiologies)

data(cds)
expreSet <- as.data.frame(counts(cds))
annoData <- fData(cds)
phenoData <- pData(cds)

expreSet 是表达矩阵,行是基因31286,列是样本348
IMvigor210CoreBiologies的安装以及数据获取_第3张图片

annoData是基因的注释信息
IMvigor210CoreBiologies的安装以及数据获取_第4张图片

phenoData是样本信息
有25列信息,值得深入挖掘
IMvigor210CoreBiologies的安装以及数据获取_第5张图片

3.2 保存数据

像这种不好下载的数据,既然已经把数据提取出来了,那么就直接保存为Rdata数据格式,方便下次提取。

只需要把Rdata文件放在相关位置即可,每次load即可

load(file = "./IMvigor210CoreBiologies.Rdata")

4.拓展

世界就是如此奇妙,能够轻松想到的事情,早就有人做过了。既然只是提取IMvigor210CoreBiologies的数据,那么早有人已经把这个工作做成了R包

有人把这个数据打包到了easierData这个R包中

if(!requireNamespace("easierData",quietly = TRUE)) BiocManager::install("easierData")
library(easierData)
library(SummarizedExperiment)
data <- get_Mariathasan2018_PDL1_treatment()
expreSet <- assay(data)
phenoData <- as.data.frame(colData(data))

但是这个R包中,关于样本信息有删减,可能作者只是用于有助于他的研究的数据,可以使用,但是不一定是全面的。根据需求进行取舍。

参考文章
TGF-b attenuates tumor response to PD-L1 blockade by contributing to exclusion of T cells
TGFβ attenuates tumour response to PD-L1 blockade by contributing to exclusion of T cells | Nature
免疫反应R包IMvigor210CoreBiologies的安装以及数据获取
安装IMvigor210CoreBiologies R包遇到的一系列问题_yitingh的博客-CSDN博客
IMvigor210CoreBiologies包安装指北 - 腾讯云开发者社区

你可能感兴趣的:(生信学习,r语言,数据分析,数据挖掘)