输出bed格式,并用bedtools能够自动识别并转换正负链

往TraesCS6B03G0578500.1.bed写入文件

Chr6B	IWGSC_v2.1	exon	299893989	299894056	100	-	.	ID=TraesCS6B03G0578500.1.exon2;Parent=TraesCS6B03G0578500.1;Name=TraesCS6B02G215300.1.exon1;Target=TraesCS6B02G215300.1 812 879 +
less TraesCS6B03G0578500.1.bed | awk '{print $1,$5,$5+300,$6,$7,$9}' | cut -d "." -f1,2 | sed -e 's/ID=//g' | awk '{print $1,$2,$3,$6,$4,$5}'|sed -e 's/ /\t/g' > TraesCS6B03G0578500.1.bed1

查看bed文件:bed中的第五列就是gff3中的第六列,bed中的第六列是正负链

Chr6B   299894056       299894356       TraesCS6B03G0578500.1   100     -

提取序列

bedtools getfasta -fi ../iwgsc_refseqv2.1_assembly.fa -bed TraesCS6B03G0578500.1.bed -s -name -fo TraesCS6B03G0578500.1.bed.out.txt在这里插入代码片

查看TraesCS6B03G0578500.1.bed.out.txt

>TraesCS6B03G0578500.1(-)
GTTGAATATGAGCATGTTTTACTTTGAAATGGAGGTAAAAGATTTACCTCATTCCCTTAATTAGATGAGAATTTAGTCATGACATGGACAAAGCCAAACAAAGCAGCCAAAAAGAGCCCAACAAGAAAAAAGCCTACTTTCGTGGTAGGATGCTCCCTAGATGTGCCCCCCCCCCTCCCCGCGAGTCAACAATTGGCGCCTCCTTCTTGTATTAAGCATATATAGCATTATGCGATCATGGTCAAGGTAATCCTTCATGTTGTAGGTGTGTGACATTATGTAAATTGTCTTTTCATTACA

你可能感兴趣的:(shell,shell)