bedtools shuffle 迷思

bedtools shuffle 的目的是保持每个 interval 的总长,随机变换所有 inerval 的位置,结果可以作为一种随机背景。-chrom 参数将随机重分配限定在原来的染色体上,可能有助于一些原本就在各个染色体上分布有差异的样本得到更「公正」的结果,或换言之更关注每条染色体之间的差异,然:

对一堆 ChIP-seq peak bed 文件一通操作:bedtools shuffle -chrom

发现很多 bed 文件在各种 variant 上产生了 startend 都为负的情况,之前也有人发现了这个问题 Bedtools shuffle produces gibberish when using -chrom #663 .

应该是由于 bed 文件和 基因组文件中染色体名称不同,当然是各种变体的名称

随便看一个 ChIP-seq bed 文件:

image

基因组文件:

image

所以,最终的解决办法就是,只保留 canonical 的染色体,或者不用 -chrom 这个参数。


最后,更希望有人点击我的绿鸟网站页面...

你可能感兴趣的:(bedtools shuffle 迷思)