整理-P2 MAST文件处理

1. MSAT 文件空格替换成 TAB分隔

awk 'BEGIN {OFS="\t"}{print NR,$0}' hg38.motif.1015.hit.bed  >hg38.motif.1015.hit.tab.bed
# {print NR,$0} 打印行数
# {print $0} 不打印行数
2. 去除最后一行注释
sed -i '$d' hg38.motif.1015.hit.tab.bed
#输出文件除了最后一行的内容.
3. 去除前两行注释
# 删除首行
sed -i '1d' a.txt
#删除前2行
sed -i '1,2d' a.txt
4. MAST文件转成bed文件
cat hg38.motif.1015.hit.mast |awk ' { $2=null;print $0 }' >hg38.motif.1015.hit.bed

cat hg38.motif.1.hit.mast|awk 'BEGIN {OFS = "\t"}{print $1,$3,$4,$2}' >hg38.motif.1.hit.mast.bed
5. MAST文件提取fasta
bedtools getfasta -fi /mnt/memory/ZZ/genome/hg38_genome.fa -bed /mnt/memory/Fanyixian/result/MAST_hg38_results/hg38.motif.1.hit.mast.tab.bed -fo hg38.motif.1.hit.mast.fa

你可能感兴趣的:(整理-P2 MAST文件处理)