Contra软件检测拷贝数变异

作者按

本文记述了博主测试软件Contra的所有过程,mind如下,部分尚待补充。

概述

Contra是博主经过测试20+款CNV检测软件后决定使用的检测软件,它灵敏、以基因为单位确定del和dup,适合panel捕获的数据,此外需要准备一批正常样本的baseline。软件作者只提供了全外捕获的baseline,如果是自己的小panel,则需要自己构建baseline,或者只测一个标准品作为control,长期使用。

官方文献为

http://bioinformatics.oxfordjournals.org/content/28/10/1307

官方manual网址为

http://contra-cnv.sourceforge.net/

原理

(待有时间补充)
也是针对reads coverage,取显著区段再合并。

安装

下载软件包解压即可

wget https://sourceforge.net/projects/contra-cnv/files/CONTRA.V2.0/CONTRA.v2.0.8.tar.gz/download
tar –xvzf CONTRA.v2.0.8.tar.gz
#安装bedtools
cd CONTRA.v2.0.8
tar -zxvf BEDTools.v2.11.2.tar.gz
cd BEDTools.v2.11.2
make clean
make all

结束后将该文件夹添入环境变量,即可直接调用contra.py

运行脚本

#1 用标准品NA12878作对照call CNV,bed是自己panel的捕获区间
python ~/Software/CONTRA.v2.0.8/contra.py \
-t CONTRA.bed \
-s input/test.HQ.bam \
-c input/NA12878-1.HQ.bam \
-o test \
--numBin 10 \
--minReadDepth 10 \
--minNBases 10 \
--pval 0.1 \
--sampleName test \
--nomultimapped False \
-p False \
--minExon 2000 \
--minControlRdForCall 5  \
--minTestRdForCall 0 \
--minAvgForCall 20 \
--maxRegionSize 0 \
--targetRegionSize 200  
--passSize 0.35
#2 
python ~/Software/CONTRA.v2.0.8/WGCNV-SINGLE/wgcnv_noBAF.py output/ human output_result/ test 
#参数依次是  [outDir] [outPrefix]

结果解析

(待补充)

结果文件

1.test_mu0.2.txt
表头为:
Gene
INFO
Chr

Start
End
mean.LR
median.LR
sd.LR
GainLoss
pval
n
percentage.probes.beyond.threshold
adj.pval
copy number= 2×(2^mean.LR)
2.test_mu0.2.png
3.test_mu0.2_sigGenes.pdf
4.test_byChr.pdf

过滤标准

1.借鉴赛默飞的过滤标准,gain的cn大于5以上认为阳性;loss的一律不报
2.根据假设检验的p值,p值越小越可信
3.根据percentage.probes.beyond.threshold,越大越可信

可视化结果

image.png

参考文献

Li, J, Lupat, R, Amarasinghe, KC, Thompson, ER, Doyle, MA, Ryland, GL, Tothill, RW, Halgamuge, SK, Campbell, IG, Gorringe, KL (2012). "CONTRA: copy number analysis for targeted resequencing," Bioinformatics 28(10): 1307-1313

NOTE

你可能感兴趣的:(Contra软件检测拷贝数变异)