小RNA ----计算miRNA 表达量

https://www.biostars.org/p/302465/

https://www.biostars.org/p/297272/

啊啊啊啊啊啊 

选取唯一比对的序列uniqe read

nohup ls *sam | while read id; do samtools view -S -F 4 $id | grep -v "XS:" >${id%%%_*}.sam; done &

比对到miRNA base 上的reads 数目的统计,没有好办法

我的理解是统计比对上的reads 的个数

所以,我做的是,统计sam 文件第三列,“比对的小RNA的名字”出现的个数。

ls *sam | while read id; do awk -F '\t' '{sum[$3]++}END{for(i in sum) print i "\t" sum[i]}' $id > ${id%%%.*}.counts; done &

出来的txt 文件类似于这样:


补充:我不知道为啥,我的sam 文件除了头部之外的列也以@开头,所以后面的流程就没办法进行。解决办法:

nohup ls *.sam | while read id; do sed -i "s/@HISEQ/HISEQ/g" $id; done &


得到的counts 文件合并

paste *mature.bna*counts > mature.bna.merge.counts

你可能感兴趣的:(小RNA ----计算miRNA 表达量)