坐标格式的bed文件的sort需要格外注意

最近在做BedGraph文件转为bigWig 的时候发生如下报错:

10_Aligned.bg is not case-sensitive sorted at line 1008480.  Please use "sort -k1,1 -k2,2n" with LC_COLLATE=C,  or bedSort and try again.

比较容易理解,就是我们的基因组坐标排序不符合要求,我简单思考一下,就按照提示修改了我的代码,如下:

cat $1 |while read id
do
file=$(basename $id )
sample=${file%%.*}
echo $sample
genomeCoverageBed -bg -ibam $id -g mm10_chrom_info.txt | LC_COLLATE=C sort -k1,1 -k2,2n >$sample.bg
bedGraphToBigWig $sample.bg mm10_chrom_info.txt $sample.bw
done

很明显,起初是chr10排在前面,修改之后chr1就排在前面了。

当然,如提示,用bedtools sort -i 也是可以的。

你可能感兴趣的:(坐标格式的bed文件的sort需要格外注意)