作者按
本文记述了博主测试软件Contra的所有过程,mind如下,部分尚待补充。
概述
Contra是博主经过测试20+款CNV检测软件后决定使用的检测软件,它灵敏、以基因为单位确定del和dup,适合panel捕获的数据,此外需要准备一批正常样本的baseline。软件作者只提供了全外捕获的baseline,如果是自己的小panel,则需要自己构建baseline,或者只测一个标准品作为control,长期使用。
官方文献为
http://bioinformatics.oxfordjournals.org/content/28/10/1307
官方manual网址为
http://contra-cnv.sourceforge.net/
原理
(待有时间补充)
也是针对reads coverage,取显著区段再合并。
安装
下载软件包解压即可
wget https://sourceforge.net/projects/contra-cnv/files/CONTRA.V2.0/CONTRA.v2.0.8.tar.gz/download
tar –xvzf CONTRA.v2.0.8.tar.gz
#安装bedtools
cd CONTRA.v2.0.8
tar -zxvf BEDTools.v2.11.2.tar.gz
cd BEDTools.v2.11.2
make clean
make all
结束后将该文件夹添入环境变量,即可直接调用contra.py
运行脚本
#1 用标准品NA12878作对照call CNV,bed是自己panel的捕获区间
python ~/Software/CONTRA.v2.0.8/contra.py \
-t CONTRA.bed \
-s input/test.HQ.bam \
-c input/NA12878-1.HQ.bam \
-o test \
--numBin 10 \
--minReadDepth 10 \
--minNBases 10 \
--pval 0.1 \
--sampleName test \
--nomultimapped False \
-p False \
--minExon 2000 \
--minControlRdForCall 5 \
--minTestRdForCall 0 \
--minAvgForCall 20 \
--maxRegionSize 0 \
--targetRegionSize 200
--passSize 0.35
#2
python ~/Software/CONTRA.v2.0.8/WGCNV-SINGLE/wgcnv_noBAF.py output/ human output_result/ test
#参数依次是 [outDir] [outPrefix]
结果解析
(待补充)
结果文件
1.test_mu0.2.txt
表头为:
Gene
INFO
Chr
Start
End
mean.LR
median.LR
sd.LR
GainLoss
pval
n
percentage.probes.beyond.threshold
adj.pval
copy number= 2×(2^mean.LR)
2.test_mu0.2.png
3.test_mu0.2_sigGenes.pdf
4.test_byChr.pdf
过滤标准
1.借鉴赛默飞的过滤标准,gain的cn大于5以上认为阳性;loss的一律不报
2.根据假设检验的p值,p值越小越可信
3.根据percentage.probes.beyond.threshold,越大越可信
可视化结果
参考文献
Li, J, Lupat, R, Amarasinghe, KC, Thompson, ER, Doyle, MA, Ryland, GL, Tothill, RW, Halgamuge, SK, Campbell, IG, Gorringe, KL (2012). "CONTRA: copy number analysis for targeted resequencing," Bioinformatics 28(10): 1307-1313