回贴基因组

for org in `head org.v4.1 | cut -f 2`; do 
cd $org;
bash /leofs/noncode/NONCODEv4/cmds/blat.sh  $org.2bit v3.fa
cd ..;
echo $org; done

回贴基因组流程:

回贴基因组_第1张图片

代码如下:

blat.sh:

twoBitDb=$1
queryFa=$2

blat $twoBitDb $queryFa $queryFa.psl
$CMD/pslReps -singleHit $queryFa.psl $queryFa.psl.1 $queryFa.psr
$CMD/pslToBed  $queryFa.psl.1 $queryFa.bed
perl /leofs/noncode/NONCODEv4/cmds/dup.pl $queryFa.bed 3 > $queryFa.bed.dup
bedToGtf.sh $queryFa.bed.dup > $queryFa.gtf
cuffcompare -C -o $queryFa.c $queryFa.gtf

cut -f 4 $queryFa.bed > ncid.Get.Blat1
perl $CMD/rmFa.pl $queryFa ncid.Get.Blat1 > $queryFa.2

blat -minScore=0 -minIdentity=90 $twoBitDb $queryFa.2 $queryFa.psl.2
$CMD/pslReps -singleHit $queryFa.psl.2 $queryFa.psl.1.2 $queryFa.psr.2
$CMD/pslToBed  $queryFa.psl.1.2 $queryFa.bed.2
perl /leofs/noncode/NONCODEv4/cmds/dup.pl $queryFa.bed.2 3 > $queryFa.bed.dup.2
bedToGtf.sh $queryFa.bed.dup.2 > $queryFa.gtf.2
cuffcompare -C -o $queryFa.c.2 $queryFa.gtf.2

gtf2Bed.pl $queryFa.c.combined.gtf > $queryFa.c.bed
gtf2Bed.pl $queryFa.c.2.combined.gtf > $queryFa.c.2.bed
perl -ne '
@t = split(/\t/,$_);
$tid = $t[0]; 
$t[4] =~ /.*?\|(.*?)\|/;
$ncid = $1;
print $tid . "\t" . $ncid . "\n"; 
' $queryFa.c.tracking > idMapping.1

perl -ne ' 
@t = split(/\t/,$_);
$tid = $t[0];
$t[4] =~ /.*?\|(.*?)\|/;
$ncid = $1;
print $tid . "\t" . $ncid . "\n";
' $queryFa.c.2.tracking > idMapping.2




####!得到NONCODE的Gtf, 然后与其它物种做cuffcompare, 将c的合并掉。
#cuffcompare -r $queryFa.gtf -o v4 $queryFa.gtf 1.gtf 2.gtf

perl $CMD/leftJoin.pl $queryFa.c.bed 4 idMapping.1 1 | awk '{print $1"\t"$2"\t"$3"\t"$14"\t"$5"\t"$6"\t"$7"\t"$8"\t"$9"\t"$10"\t"$11"\t"$12;}' > $queryFa.blat.bed
perl $CMD/leftJoin.pl $queryFa.c.2.bed 4 idMapping.2 1 | awk '{print $1"\t"$2"\t"$3"\t"$14"\t"$5"\t"$6"\t"$7"\t"$8"\t"$9"\t"$10"\t"$11"\t"$12;}' >> $queryFa.blat.bed


你可能感兴趣的:(回贴基因组)