GenVisR包:突变类型不在waterfall函数指定范围?

GenVisR包是一个用于基因组可视化的包。为我们提供了多种用于展示基因组突变、基因突变等图像,包括我们熟知的基因突变瀑布图等。今天介绍该包中的waterfall函数功能。

在学习该包的使用时,发现网上有许多不错的介绍该包用法的博文,已经详细介绍了基因突变瀑布图绘制的详细参数,但是大多都是基于该函数中作者定义的MAF/MGI格式进行讲解:

MAF/MGI format

所以突变的类型仅限于表格中展示的,但是实际上,我们经常会遇到表格以外的突变类型,那我们要怎么办呢?
GenVisR的waterfall函数filetype中除了MAF/MGI还提供了第三种“Custom”即为自定义。这种类型为我们提供了操作性更强的绘图手段。

GenVisR包的下载

if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")
BiocManager::install("GenVisR", version = "3.8")

waterfall函数的使用

GenVisR包为我们提供了waterfall函数使用的示例。

# Load GenVisR and set seed
library(GenVisR)
# Plot only genes with mutations in 6% or more of samples
waterfall(brcaMAF, mainRecurCutoff = 0.06)
brcaMAF_Cutoff0.06

当然你可以显示指定的基因:

# Plot only the specified genes
waterfall(brcaMAF, plotGenes = c("PIK3CA", "TP53", "USH2A", "MLL3", "BRCA1"))
waterfall_specified_genes

或者显示样本更多的临床信息:

# Create clinical data
subtype <- c("lumA", "lumB", "her2", "basal", "normal")
subtype <- sample(subtype, 50, replace = TRUE)
age <- c("20-30", "31-50", "51-60", "61+")
age <- sample(age, 50, replace = TRUE)
sample <- as.character(unique(brcaMAF$Tumor_Sample_Barcode))
clinical <- as.data.frame(cbind(sample, subtype, age))

# Melt the clinical data into 'long' format.
library(reshape2)
clinical <- melt(clinical, id.vars = c("sample"))

# Run waterfall
waterfall(brcaMAF, clinDat = clinical, clinVarCol = c(lumA = "blue4", lumB = "deepskyblue", 
    her2 = "hotpink2", basal = "firebrick2", normal = "green4", `20-30` = "#ddd1e7", 
    `31-50` = "#bba3d0", `51-60` = "#9975b9", `61+` = "#7647a2"), plotGenes = c("PIK3CA", 
    "TP53", "USH2A", "MLL3", "BRCA1"), clinLegCol = 2, clinVarOrder = c("lumA", 
    "lumB", "her2", "basal", "normal", "20-30", "31-50", "51-60", "61+"))
waterfall_included_clinicalinfor

上述的代码,大家在GenVisR包的手册中都可以查看。

接下来,我们介绍一下如果你的数据突变类型与GenVisR要求的不一样,包含了更多的信息时候应该怎么办?

首先我们了解一下输入文件的格式,非常简单,3列即可——样品名称、基因symbol、突变类型:

data_format

要注意的是表头名字,waterfall的自定义模式要求了三列的名字必须为:sample,gene,variant_class。
可以对原始数据进行修改也可以在R中重新设置表头。
如果你的数据还包含了其他信息,不用删除,保留即可。只要确保你的数据中含有按照要求命名的这三列信息即可。

library(GenVisR)
#import data
Dat<-read.table('~/Desktop/waterfalldata.txt',header=T,stringsAsFactors = F,check.names = F,sep='\t’)
#change header
colnames(Dat)<-c('sample', 'gene','variant_class’)

按要求调整好数据格式之后,我们就要进行绘图。主要是两个参数的变化,第一个fileType选择‘Custom’,另外我们要设定variant_class的顺序。如果你有明确的前后顺序可以给予确定的顺序,要记得把数据中所有的突变类型都要输入。如果你无所谓先后顺序,你可以参考下列代码,即按照数据中突变类型出现的先后顺序为最终的排序顺序。

#plot
waterfall(Dat,fileType = 'Custom',variant_class_order = levels(factor(Dat$variant_class)))

然后你就可以得到你想要的瀑布图了。

你可能感兴趣的:(GenVisR包:突变类型不在waterfall函数指定范围?)