本文编写了一个函数replace_all(),该函数有三个参数,file_name、be_replaced和new,分别对应着传入的文件,要替换的字符串,替换后的字符串。该函数可以将原文本中被替换掉的字符串全部变成替换后的新字符串,并保存到一个新的文本中,简言之,就是Word的全部替换。
比如,利用CRISPR-Cas9改变目标基因时,我想知道剪切后的序列信息,就可以将保存着原始序列信息的fasta文件,剪切掉的序列,替换上的序列依次输入,得到命名为’replaced.fasta’的结果文件。
def replace_all(file_name,be_relaced,new):
f_read=open(file_name,'r')
seq=0
count=0
content=[]
for each_line in f_read:
if each_line[:1]=='>':
seq+=1
content.append(each_line)
else:
if be_relaced in each_line:
count+=each_line.count(be_relaced)
each_line=each_line.replace(be_relaced,new)
content.append(each_line)
decide=input(f"There are {seq} sequences and {count} {be_relaced},do you want to replace all to {new}?\n"
f"[Yes/No]:")
if decide in ['Yes','yes','YES']:
f_write=open('replaced.fasta','w')
f_write.writelines(content)
f_write.close()
f_read.close()
file_name=input("Please enter the file name:")
be_replaced=input("Please enter the sequence to be replaced:")
new=input("Please enter the new sequence:")
replace_all(file_name,be_replaced,new)
>td
ATGAAATTTTGATTTTTTTCTACAAATCATAAATATATTGGTATTTTGTACTTTATTTTTGGAATATGAGCAGGAATTGTTGGTTTATCAATAAGAATAATTATTCGATTAGAGTTAGGAAATCCTGGTTCTTTAATTGGTAATGATCAAATTTATAATTCTATTGTAACTAGACATGCTTTTTTAATAATTTTTTTTTTTGTTATACCTGTAATAATAGGAGGTTTTGGAAATTATTTGATTCCTTTAATGTTAGGGAGGCCTGATATGGCTTTTCCTCGAATAAATAATATAAGATTTTGATTATTACCTCCAAGATTAATATTATTGTTATCAAGAATATTTATTGGTACTGGTACTGGTACAGGTTGAACTGTTTATCCTCCTTTATCTTCTAATTTATCTCATAGGGGTCCTTCAGTTGATTTATCAATTTTTTCTTTACATATTGCTGGGGTTTCATCAATTATAGGCTCAATTAATTTTATTACAACAATTTTAAATATAAAAATTTATAAAATTGAATTAATTTCTTTATTTTCTTGAGCTATATTATTAACAGCAATTTTATTATTATTGTCTTTACCAGTTTTAGCAGGGGCAATTACTATATTATTATTTGATCGAAATTTAAATACTTCATTTTTTGATCCTTCTGGGGGTGGTGATCCTATTTTATATCAACATTTATTTTGGTTTTTTGGTCATCCTGAAGTTTATATTTTAATTTTACCTGGATTTGGTTTAATTTCTCATATAATTTGTAATGAAAGAAAAAAAAAAGAAACTTTTGGAAGTATAGGAATAATTTATGCAATAATTTCTATTGGTTTATTAGGTTTTATTGTTTGGGCTCATCATATATTTACTGTTGGAATAGATGTAGATACTCGTGCTTATTTTACTTCTGCTACAATAATTATTGCTGTACCTACTGGAATTAAAATTTTTAGTTGGTTAGCTACTATAAATGGGATAAAAATTAAGTTTTCTGTAGTTAATTTATGACTTTTAGGATTTATTTTTTTATTTACTATTGGAGGTTTAACAGGAATTATTTTATCAAATTCTTCTATTGATATTGTTTTACATGATACTTATTATGTGGTAGCTCATTTTCATTATGTTTTATCTATAGGAGCAGTATTTGCTATTTTTGGAAGTTTTATTTATTGGTATCCTTTATTTACTGGTTTAACAATAAATCAATATTGATTAAAAATTCAATTTTTTTTAATATTTTTTGGGGTTAATATAACTTTTTTTCCTCAACATTTTTTAGGATTAAGAGGTATACCTCGTCGATATTCTGATTATCCTGATTCTTATTTATGTTGAAATATAATTTCTTCAATTGGTTCTTTAGTAACATTATTGAGAACATTTTATTTTTTTTTTATTTTATGGGAATCAATTGTTTCTCGACGAATTTTAATTTTTATAAATAATAATAATAGTTCAATTGAATGATTAATAACTTTTCCATTAAACAATCATACTTTTTATGAAATTCCAAAAGTGTTTAAATTAAAT
>tj
ATGAAATTTTGATTTTTTTCAACAAATCATAAATATATTGGTATTTTGTATTTTATTTTTGGAATATGATCTGGTATTGTTGGTTTATCAATAAGAATAATTATTCGTTTAGAGTTAGGAAATCCTGGTTCTTTAATTGGTAATGATCAAATTTATAATTCTATTGTTACTAGACATGCTTTTTTAATAATTTTTTTTTTTGTTATACCTGTTATAATAGGTGGTTTTGGTAATTATTTAATTCCTTTGATATTAGGAAGCCCAGATATGGCTTTTCCTCGAATAAATAATATAAGATTTTGGTTATTACCTCCTAGGTTAATATTATTATTATCAAGAATATTTATTGGGACTGGTACAGGAACTGGTTGAACAGTGTATCCTCCTTTATCTTCAAATTTATCTCATAGAGGACCTTCAGTAGATTTATCAATTTTTTCTTTACATATTGCTGGGGTTTCTTCTATTATAGGTTCAATTAATTTTATTACTACAATTTTAAATATAAAAATTTATAAAATAGAATTAATTTCTTTATTTTCTTGGGCAATGTTATTAACTGCTATTTTATTGTTATTATCTTTACCTGTTTTAGCTGGGGCTATTACTATATTATTATTTGATCGAAATTTAAATACTTCATTTTTTGATCCTTCAGGAGGTGGAGACCCTATTTTATATCAACATTTATTTTGATTTTTTGGTCATCCAGAAGTTTATATTTTAATTTTACCTGGATTTGGATTAATTTCTCATATAATTTGTAACGAAAGAAAAAAAAAAGAAACTTTTGGAAGAATAGGAATAATTTATGCTATAATTTCTATTGGTTTACTAGGATTTATTGTTTGGGCTCACCATATATTTACAGTTGGGATGGATGTTGATACTCGTGCTTATTTTACTTCAGCTACTATAATTATTGCTGTTCCTACAGGTATTAAAATTTTTAGTTGATTAGCTACAATAAATGGAATAAAAATTAAATTTTCTGTAGTTAATTTATGATTATTAGGTTTTATTTTTTTATTTACTATTGGAGGATTAACGGGTATTATTTTATCAAATTCTTCAATTGATATTGTTTTACATGATACTTATTATGTAGTTGCTCATTTTCATTATGTTTTATCAATAGGAGCTGTATTTGCTATTTTTGGTAGGTTTATTTATTGATACCCATTATTTACTGGTTTATTCATAAATCAGTATTGATTAAAAATTCAATTTTTTATAATATTTTTAGGGGTTAATATAACTTTTTTCCCTCAACATTTTTTAGGTTTAAGAGGTATACCTCGACGATATTCAGATTATCCAGATTCTTATTTATGTTGAAATATAATTTCTTCAATTGGTTCTTTAGTTACATTATTAAGAACATTTTATTTTTTTTTTATTCTTTGAGAGTCAATTGTATCTCACCGGGTTTTAATTTTTATAAATAATAATAATAGTTCAATTGAATGATTAATAACTTATCCTATAAATAATCATACTTTCTATGAAATTCCTAAAGTATTTAAATTAAAT
>to
ATGAAATTTTGATTTTTTTCAACAAATCATAAATATATTGGTATTTTGTATTTTATTTTTGGGATATGAGCAGGAATTGTGGGCTTATCCATAAGAATAATTATTCGTTTAGAATTAGGAAATCCAGGTTCTTTAATTGGAAATGATCAAATTTATAATTCTATTGTTACGAGTCATGCTTTTTTAATAATTTTTTTTTTTGTTATACCTGTTATAATAGGGGGATTTGGAAATTATTTAATTCCATTAATGTTAGGAAGTCCTGATATAGCTTTTCCTCGAATAAATAATATAAGATTTTGATTATTACCTCCAAGATTATTATTATTATTATCAAGAATGTTTATTGGTACTGGGACTGGAACAGGTTGAACTGTTTATCCTCCTTTATCTTCAAATTTATCTCATAGGGGTCCTTCAGTGGATTTATCAATTTTTTCTTTACATATTGCTGGAGTTTCTTCAATTATAGGTTCAATTAATTTTATTACTACAATTTTAAATATAAAAATTTACAAAATTGAATTAATTTCTTTATTTTCTTGGGCTATATTATTAACAGCTATTTTATTATTATTATCTTTACCAGTTTTAGCTGGAGCTATTACTATATTATTGTTTGATCGAAATTTAAATACTTCTTTTTTTGATCCTTCAGGAGGTGGTGATCCAATTTTATATCAACATTTATTTTGATTTTTTGGACATCCTGAAGTTTATATTTTAATTCTTCCAGGTTTTGGATTAATTTCTCATATAATTTGTAATGAAAGAAAGAAAAAAGAAACTTTTGGAAGAATAGGAATAATTTATGCAATAATTTCTATTGGTTTATTAGGATTTATTGTTTGGGCTCATCATATATTTACTGTAGGTATAGATGTTGATACTCGAGCTTATTTTACTTCTGCTACTATAATTATTGCTGTACCTACGGGAATTAAAATTTTTAGTTGATTAGCTACAATAAATGGTATAAAAATTAAATTTTCTGTAGTAAATTTATGACTTTTAGGATTTATTTTTTTATTTACTATTGGAGGATTAACAGGAATTATTTTATCAAATTCTTCAATTGATATTGTTTTACATGATACATATTATGTTGTTGCTCATTTTCATTATGTTTTATCTATAGGAGCTGTTTTTGCTATTTTTGGAAGATTTATTTATTGGTATCCTTTATTTACTGGATTAACAATAAATCAATATTGATTAAAGATTCAATTTTTTTTAATATTTTTTGGAGTAAATATAACTTTTTTTCCTCAGCATTTTTTAGGATTGAGAGGTATACCTCGTCGATATTCAGATTATCCTGATTCTTATTTATGTTGAAATATAATTTCTTCAATTGGTTCTTTAGTAACATTAATAAGAACATTTTATTTTTTTTTTATTTTATGGGAATCAATTGTTTCTCGACGAATTTTAATTTTTATAAATAATAATAACAGTTCTATTGAATGATTAATAACTTTTCCATTAAATAATCATACTTTTTATGAAATTCCAAAAGTATTTAAATTAAAT
>tchi
ATGAAATTTTGATTTTTTTCAACAAATCATAAATATATTGGTATTTTGTATTTTATTTTTGGTATATGAGCAGGAATTGTAGGTTTATCAATAAGAATAATTATTCGTTTAGAATTAGGAAATCCTGGTTCTTTAATTGGAAATGATCAAATTTATAATTCTATTGTTACAAGTCATGCTTTTTTAATAATTTTTTTTTTTGTTATACCTGTTATAATAGGGGGTTTTGGAAATTATTTAATTCCATTAATATTAGGAAGACCCGATATAGCATTCCCTCGAATAAATAATATAAGATTTTGATTATTACCTCCAAGATTAATATTGTTATTATCAAGAATATTTATTGGAACTGGTACAGGAACAGGATGAACTGTTTATCCACCTTTATCTTCTAATTTATCTCATAGGGGTCCTTCAGTTGATTTATCTATTTTTTCTTTACATATTGCTGGGGTTTCTTCAATTATAGGTTCAATTAATTTTATTACTACAATTTTAAATATAAAAATTTATAAAATTGAATTAATTTCTTTATTTTCTTGAGCAATATTATTAACAGCAATTTTATTATTATTATCTTTACCAGTTTTAGCTGGAGCAATTACAATATTATTATTTGATCGAAATTTAAATACTTCTTTTTTTGATCCTTCAGGAGGTGGTGATCCAATTTTATATCAACATTTATTTTGATTTTTTGGTCATCCTGAAGTTTATATTTTAATTTTACCTGGTTTTGGATTAATTTCTCATATAATTTGTAATGAAAGAAAAAAAAAAGAAACTTTTGGTAGAATAGGAATAATTTATGCAATAATTTCTATTGGTTTACTAGGATTTATTGTATGGGCTCATCATATATTTACTGTAGGAATGGATGTTGATACTCGAGCTTATTTTACTTCTGCAACTATAATTATTGCAGTGCCTACAGGTATTAAAATTTTTAGTTGATTAGCTACAATAAATGGTATAAAAATTAAGTTTTCTGTAGTAAATTTATGACTTTTAGGTTTTATTTTTTTATTTACTATTGGAGGATTAACTGGAATTATTTTATCAAATTCTTCAATTGATATTGTTTTACATGATACCTATTATGTTGTTGCTCATTTTCATTACGTTTTATCTATAGGGGCTGTTTTTGCTATTTTTGGTAGATTTATTTATTGATATCCTTTATTTACTGGATTAACAATAAATCAATATTGATTAAAAATTCAATTTTTTTTAATATTCTTTGGGGTTAATATAACTTTTTTTCCTCAACATTTTTTAGGATTGAGAGGAATACCTCGTCGGTATTCAGATTATCCAGATTCTTATTTATGTTGAAATATAATTTCTTCAATTGGTTCTTTAGTTACATTATTGAGAACATTTTATTTTTTTTTTATTCTATGAGAATCTATTGTTTCTCGACGAATTTTAATTTTTATAAATAATAATAATAGATCTATTGAATGACTAATAACTTTTCCATTAAATAATCATACTTTTTATGAAATTCCAAAAGTATTTAAATTAAAT
>tcae
ATGAAATTTTGATTTTTTTCAACAAATCACAAATATATTGGTATTTTGTATTTTATTTTTGGTATATGAGCAGGAATTATTGGTTTATCAATAAGAATAATTATTCGTTTAGAATTAGGTAATCCTGGATCTTTAATTGGTAATGATCAAATTTATAATTCTATTGTTACTAGTCATGCTTTTTTAATAATTTTTTTTTTTGTTATACCTGTTATAATAGGTGGATTTGGAAATTATTTAATTCCATTAATATTAGGAAGTCCTGATATAGCTTTTCCTCGAATAAATAATATAAGATTTTGATTATTACCTCCAAGATTAATATTATTATTATCAAGAATATTTATTGGTACTGGTACTGGTACTGGGTGAACAGTTTATCCTCCATTGTCTTCAAATTTATCTCATAGGGGACCTTCAGTAGATTTATCAATTTTTTCTTTACATATTGCTGGAGTTTCTTCTATTATAGGCTCAATTAATTTTATTACAACAATTTTAAATATAAAAATTTATAAAATTGAATTAATTTCTTTATTTTCTTGAGCAATGTTATTAACAGCAATTTTATTATTATTATCTTTACCGGTTTTAGCAGGTGCAATTACTATATTATTATTTGATCGAAATTTAAATACTTCATTTTTTGATCCTTCTGGTGGTGGTGATCCAATTCTTTATCAACATTTATTTTGATTTTTTGGTCATCCTGAAGTTTATATTTTAATTTTACCTGGGTTTGGTTTAATTTCTCATATAATTTGTAATGAAAGAAAAAAAAAAGAGACTTTTGGTAGAATAGGAATAATTTATGCAATAATTTCTATTGGTTTATTAGGTTTTATTGTTTGAGCACATCATATATTTACAGTAGGTATAGATGTAGATACCCGAGCTTATTTTACTTCAGCAACTATAATTATTGCAGTTCCTACAGGAATTAAAATTTTTAGATGATTAGCTACTATAAATGGAATAAAAATTAAGTTTTCTGTAGTAAATTTATGACTTTTAGGTTTTATTTTTTTATTTACTATTGGGGGATTAACAGGAATTATTTTATCAAATTCTTCAATTGATATTGTTTTACATGATACTTATTATGTAGTAGCTCATTTTCATTATGTTTTATCAATAGGAGCAGTCTTTGCTATTTTTGGAAGATTTATTTATTGATATCCTTTATTTACTGGATTAACTATAAATCAATATTGATTAAAAATTCAATTTTTTTTAATGTTTTTTGGAGTAAATATAACTTTTTTTCCTCAACATTTTTTAGGATTAAGAGGTATACCTCGTCGATATTCAGATTATCCTGATTCTTATTTATGTTGAAATATAATTTCTTCAATTGGTTCTTTAGTAACATTATTAAGAACATTTTATTTTTTTTTTATTTTATGAGAATCTATTGTTTCTCGACGAATTTTAATTTATATAAATAATAATAATAGTTTTATTGAATGATTAATAACTTTTCCGTTAAATAATCATACTTTTTATGAAATTCCAAAAGTATTTAAATTAAAT
>tp
ATGAAATTTTGATTTTTTTCAACAAATCATAAATATATTGGTATTTTGTATTTTATTTTTGGAATATGGGCAGGAATTGTAGGTTTATCAATAAGAATAATTATTCGTTTAGAATTAGGTAATCCTGGTTCATTAATTGGTAATGATCAAATTTATAATTCTATTGTTACTAGACATGCTTTTTTAATAATTTTCTTTTTTGTTATACCTGTAATAATAGGAGGTTTTGGTAATTATTTAATTCCATTAATATTAGGAAGTCCTGATATAGCTTTTCCTCGTATAAATAATATAAGATTTTGATTATTACCGCCAAGATTAATATTATTATTATCAAGAATATTTATTGGTACAGGTACAGGAACAGGTTGAACTGTGTATCCTCCATTATCTTCAAATTTATCTCATAGGGGTCCTTCTGTAGATTTATCAATTTTTTCTTTACATATTGCTGGGGTTTCTTCAATTATAGGTTCAATTAATTTTATTACTACAATTTTAAATATAAAAATTTATAAAATTGAATTAATTTCTTTATTTTCTTGAGCTATATTATTAACAGCAATTTTATTATTATTGTCTTTACCAGTATTAGCAGGTGCAATTACTATATTATTATTTGATCGAAATTTAAATACTTCATTTTTTGACCCTTCTGGGGGTGGTGACCCTATTTTATATCAGCATCTATTTTGATTTTTTGGGCATCCTGAAGTTTATATTTTAATTTTACCTGGATTTGGTTTAATTTCCCATATAATTTGTAATGAAAGAAAAAAAAAAGAAACCTTTGGAAGAATAGGAATAATTTATGCAATAATTTCTATTGGTTTATTAGGGTTTATTGTTTGAGCTCATCATATATTTACAGTAGGAATGGATGTTGATACGCGGGCTTATTTTACTTCAGCTACTATAATTATTGCTGTACCTACTGGTATTAAAATTTTTAGGTGATTAGCAACTATAAATGGTATAAAAATTAAATTTTCTGTAGTTAATTTATGACTTTTAGGATTTATTTTTTTATTTACTATTGGGGGTTTAACAGGAATTATTTTATCAAATTCTTCAATTGATATTGTTTTACATGATACATATTATGTTGTAGCTCATTTTCATTATGTTTTATCTATGGGAGCAGTTTTTGCAATTTTTGGTAGATTTATTTATTGATATCCATTATTTACTGGTTTAACAATAAATCAATATTGATTAAAAATTCAATTCTTTTTAATATTTTTTGGGGTTAATATAACTTTTTTTCCCCAACATTTCTTAGGATTAAGAGGAATGCCTCGACGATACTCAGATTATCCAGATTCTTATTTATGTTGAAATATAATTTCTTCGATTGGTTCTTTAGTAACATTATTAAGAACATTTTATTTTTTTTTTATTTTATGAGAATCAATTGTTTCTCGACGAGTTTTAATTTTTATAAATAATAATAATAGTTCAATTGAATGATTAATAACTTTTCCATTAAATAATCATACTTTTTATGAAATTCCAAAAGTATTTAAATTTAAT
>ma
ATGAAATTATGATATTTTTCAACAAATCATAAATATATTGGAATTTTATATTTTATTTTTGGTATATGATCAGGAATTGTAGGATTATCTATAAGAATAATTATTCGATTAGAATTAGGAAATCCTGGTTCATTAATTGGTAATGATCAAATTTATAATTCTATTGTGACTACTCATGCTTTTATAATAATTTTTTTTTTTGTAATACCTGTAATAATAGGAGGTTTTGGAAATTATTTAATTCCTTTAATATTAGGATGTCCTGATATAGCTTTCCCTCGAATAAATAATATAAGTTTTTGGTTATTACCTCCAAGAATTTTATTATTAATTTCTAGAATATTTATTGGAACAGGAACAGGAACAGGATGAACTGTTTATCCTCCTTTATCATCAAATTTAGCACATTCTGGTCCTTCAGTAGATTTATCAATTTTTTCTTTACATATTGCTGGAATATCATCAATTATAGGTTCAATTAATTTTATTACTACTATTATAAATATAAAAATTTATAAATTTGAATATATTGTTTTATTTTCTTGGGCAATAATTTTAACAGCTATTTTATTATTATTATCATTACCTGTATTAGCTGGGGCTATTACTATATTATTATTTGATCGAAACTTAAATACTTCATTTTTTGATCCTGCTGGAGGAGGAGATCCTATTTTATATCAACATTTATTTTGATTTTTTGGTCATCCTGAAGTTTATATTTTAATTTTACCTGGATTTGGATTAATTTCTCATATAATTTGTAATGAAAGAAAAAAAAAAGAAGTTTTTGGTTCAATAGGAATAATTTATGCAATAATTTCAATTGGTTTATTAGGATTTATTGTTTGAGCTCATCATATATTTACTGTTGGAATAGATATTGATACACGTGCTTATTTTACTTCAGCAACAATAATTATTGCTGTTCCTACTGGTATTAAAGTATTTAGTTGATTAGCTTCAATAAATGGAATAAAAATTAAATTTTCTGTTTATAATTTATGAATATTAGGATTTATTTTTTTATTTACTGTTGGAGGTTTAACAGGTATTATATTATCAAATTCTTCAGTTGATATTGTTTTGCATGATACTTATTATGTAGTTGCTCATTTTCATTATGTTTTATCTATAGGTGCAGTTTTTGCAATTTTTGGTAGATTTATTTATTGATATCCTTTATTTACAGGTTTATATATAAATCAATATTGATTAAAAATTCAATTTATAATAATATTTTTTGGTGTAAATTTAACTTTTTTTCCTCAACATTTTTTAGGATTAAGAGGAATACCTCGACGTTATTCTGATTATCCAGATTCATATTATTGTTGAAATTTATTTTCTTCATTAGGATCATTAGTAACTTTAATAAGGACTTTTTATTTTTTTTTTATTGTATGAGAATCAATAATTTCAAATCGTATTTTAATTTATGTAAATATTATTGGTAATTCTATTGAATGAATAATAACTTATCCAGCAAATAATCATAGTTTTTATGAAATTCCTAAATTATTTATAAAGAAT
替换后文件内容:
>td
ATGAAATCGTGATCGTTTTCTACAAATCATAAATATATTGGTATCGTGTACTTTATCGTTGGAATATGAGCAGGAATTGTTGGTTTATCAATAAGAATAATTATTCGATTAGAGTTAGGAAATCCTGGTTCTTTAATTGGTAATGATCAAATCGATAATTCTATTGTAACTAGACATGCTTTTTTAATAATCGTTTTTTTTGTTATACCTGTAATAATAGGAGGTTTTGGAAATTATCGGATTCCTTTAATGTTAGGGAGGCCTGATATGGCTTTTCCTCGAATAAATAATATAAGATCGTGATTATTACCTCCAAGATTAATATTATTGTTATCAAGAATATCGATTGGTACTGGTACTGGTACAGGTTGAACTGTTTATCCTCCTTTATCTTCTAATCGATCTCATAGGGGTCCTTCAGTTGATCGATCAATCGTTTCTTTACATATTGCTGGGGTTTCATCAATTATAGGCTCAATTAATCGTATTACAACAATCGTAAATATAAAAATCGATAAAATTGAATTAATCGCTTTATCGTCTTGAGCTATATTATTAACAGCAATCGTATTATTATTGTCTTTACCAGTTTTAGCAGGGGCAATTACTATATTATTATCGGATCGAAATCGAAATACTTCATCGTTTGATCCTTCTGGGGGTGGTGATCCTATCGTATATCAACATCGATCGTGGTTTTTTGGTCATCCTGAAGTTTATATCGTAATCGTACCTGGATCGGGTTTAATCGCTCATATAATCGGTAATGAAAGAAAAAAAAAAGAAACTTTTGGAAGTATAGGAATAATCGATGCAATAATCGCTATTGGTTTATTAGGTTTTATTGTTTGGGCTCATCATATATCGACTGTTGGAATAGATGTAGATACTCGTGCTTATCGTACTTCTGCTACAATAATTATTGCTGTACCTACTGGAATTAAAATCGTTAGTTGGTTAGCTACTATAAATGGGATAAAAATTAAGTTTTCTGTAGTTAATCGATGACTTTTAGGATCGATCGTTTTATCGACTATTGGAGGTTTAACAGGAATTATCGTATCAAATTCTTCTATTGATATTGTTTTACATGATACTTATTATGTGGTAGCTCATCGTCATTATGTTTTATCTATAGGAGCAGTATCGGCTATCGTTGGAAGTTTTATCGATTGGTATCCTTTATCGACTGGTTTAACAATAAATCAATATTGATTAAAAATTCAATCGTTTTTAATATCGTTTGGGGTTAATATAACTTTTTTTCCTCAACATCGTTTAGGATTAAGAGGTATACCTCGTCGATATTCTGATTATCCTGATTCTTATCGATGTTGAAATATAATCGCTTCAATTGGTTCTTTAGTAACATTATTGAGAACATCGTATCGTTTTTTTATCGTATGGGAATCAATTGTTTCTCGACGAATCGTAATCGTTATAAATAATAATAATAGTTCAATTGAATGATTAATAACTTTTCCATTAAACAATCATACTTTTTATGAAATTCCAAAAGTGTTTAAATTAAAT
>tj
ATGAAATCGTGATCGTTTTCAACAAATCATAAATATATTGGTATCGTGTATCGTATCGTTGGAATATGATCTGGTATTGTTGGTTTATCAATAAGAATAATTATTCGTTTAGAGTTAGGAAATCCTGGTTCTTTAATTGGTAATGATCAAATCGATAATTCTATTGTTACTAGACATGCTTTTTTAATAATCGTTTTTTTTGTTATACCTGTTATAATAGGTGGTTTTGGTAATTATCGAATTCCTTTGATATTAGGAAGCCCAGATATGGCTTTTCCTCGAATAAATAATATAAGATCGTGGTTATTACCTCCTAGGTTAATATTATTATTATCAAGAATATCGATTGGGACTGGTACAGGAACTGGTTGAACAGTGTATCCTCCTTTATCTTCAAATCGATCTCATAGAGGACCTTCAGTAGATCGATCAATCGTTTCTTTACATATTGCTGGGGTTTCTTCTATTATAGGTTCAATTAATCGTATTACTACAATCGTAAATATAAAAATCGATAAAATAGAATTAATCGCTTTATCGTCTTGGGCAATGTTATTAACTGCTATCGTATTGTTATTATCTTTACCTGTTTTAGCTGGGGCTATTACTATATTATTATCGGATCGAAATCGAAATACTTCATCGTTTGATCCTTCAGGAGGTGGAGACCCTATCGTATATCAACATCGATCGTGATCGTTTGGTCATCCAGAAGTTTATATCGTAATCGTACCTGGATCGGGATTAATCGCTCATATAATCGGTAACGAAAGAAAAAAAAAAGAAACTTTTGGAAGAATAGGAATAATCGATGCTATAATCGCTATTGGTTTACTAGGATCGATTGTTTGGGCTCACCATATATCGACAGTTGGGATGGATGTTGATACTCGTGCTTATCGTACTTCAGCTACTATAATTATTGCTGTTCCTACAGGTATTAAAATCGTTAGTTGATTAGCTACAATAAATGGAATAAAAATTAAATCGTCTGTAGTTAATCGATGATTATTAGGTTTTATCGTTTTATCGACTATTGGAGGATTAACGGGTATTATCGTATCAAATTCTTCAATTGATATTGTTTTACATGATACTTATTATGTAGTTGCTCATCGTCATTATGTTTTATCAATAGGAGCTGTATCGGCTATCGTTGGTAGGTTTATCGATTGATACCCATTATCGACTGGTTTATTCATAAATCAGTATTGATTAAAAATTCAATCGTTTATAATATCGTTAGGGGTTAATATAACTTTTTTCCCTCAACATCGTTTAGGTTTAAGAGGTATACCTCGACGATATTCAGATTATCCAGATTCTTATCGATGTTGAAATATAATCGCTTCAATTGGTTCTTTAGTTACATTATTAAGAACATCGTATCGTTTTTTTATTCTTTGAGAGTCAATTGTATCTCACCGGGTTTTAATCGTTATAAATAATAATAATAGTTCAATTGAATGATTAATAACTTATCCTATAAATAATCATACTTTCTATGAAATTCCTAAAGTATCGAAATTAAAT
>to
ATGAAATCGTGATCGTTTTCAACAAATCATAAATATATTGGTATCGTGTATCGTATCGTTGGGATATGAGCAGGAATTGTGGGCTTATCCATAAGAATAATTATTCGTTTAGAATTAGGAAATCCAGGTTCTTTAATTGGAAATGATCAAATCGATAATTCTATTGTTACGAGTCATGCTTTTTTAATAATCGTTTTTTTTGTTATACCTGTTATAATAGGGGGATCGGGAAATTATCGAATTCCATTAATGTTAGGAAGTCCTGATATAGCTTTTCCTCGAATAAATAATATAAGATCGTGATTATTACCTCCAAGATTATTATTATTATTATCAAGAATGTTTATTGGTACTGGGACTGGAACAGGTTGAACTGTTTATCCTCCTTTATCTTCAAATCGATCTCATAGGGGTCCTTCAGTGGATCGATCAATCGTTTCTTTACATATTGCTGGAGTTTCTTCAATTATAGGTTCAATTAATCGTATTACTACAATCGTAAATATAAAAATCGACAAAATTGAATTAATCGCTTTATCGTCTTGGGCTATATTATTAACAGCTATCGTATTATTATTATCTTTACCAGTTTTAGCTGGAGCTATTACTATATTATTGTTTGATCGAAATCGAAATACTTCTTTTTTTGATCCTTCAGGAGGTGGTGATCCAATCGTATATCAACATCGATCGTGATCGTTTGGACATCCTGAAGTTTATATCGTAATTCTTCCAGGTTTTGGATTAATCGCTCATATAATCGGTAATGAAAGAAAGAAAAAAGAAACTTTTGGAAGAATAGGAATAATCGATGCAATAATCGCTATTGGTTTATTAGGATCGATTGTTTGGGCTCATCATATATCGACTGTAGGTATAGATGTTGATACTCGAGCTTATCGTACTTCTGCTACTATAATTATTGCTGTACCTACGGGAATTAAAATCGTTAGTTGATTAGCTACAATAAATGGTATAAAAATTAAATCGTCTGTAGTAAATCGATGACTTTTAGGATCGATCGTTTTATCGACTATTGGAGGATTAACAGGAATTATCGTATCAAATTCTTCAATTGATATTGTTTTACATGATACATATTATGTTGTTGCTCATCGTCATTATGTTTTATCTATAGGAGCTGTTTTTGCTATCGTTGGAAGATCGATCGATTGGTATCCTTTATCGACTGGATTAACAATAAATCAATATTGATTAAAGATTCAATCGTTTTTAATATCGTTTGGAGTAAATATAACTTTTTTTCCTCAGCATCGTTTAGGATTGAGAGGTATACCTCGTCGATATTCAGATTATCCTGATTCTTATCGATGTTGAAATATAATCGCTTCAATTGGTTCTTTAGTAACATTAATAAGAACATCGTATCGTTTTTTTATCGTATGGGAATCAATTGTTTCTCGACGAATCGTAATCGTTATAAATAATAATAACAGTTCTATTGAATGATTAATAACTTTTCCATTAAATAATCATACTTTTTATGAAATTCCAAAAGTATCGAAATTAAAT
>tchi
ATGAAATCGTGATCGTTTTCAACAAATCATAAATATATTGGTATCGTGTATCGTATCGTTGGTATATGAGCAGGAATTGTAGGTTTATCAATAAGAATAATTATTCGTTTAGAATTAGGAAATCCTGGTTCTTTAATTGGAAATGATCAAATCGATAATTCTATTGTTACAAGTCATGCTTTTTTAATAATCGTTTTTTTTGTTATACCTGTTATAATAGGGGGTTTTGGAAATTATCGAATTCCATTAATATTAGGAAGACCCGATATAGCATTCCCTCGAATAAATAATATAAGATCGTGATTATTACCTCCAAGATTAATATTGTTATTATCAAGAATATCGATTGGAACTGGTACAGGAACAGGATGAACTGTTTATCCACCTTTATCTTCTAATCGATCTCATAGGGGTCCTTCAGTTGATCGATCTATCGTTTCTTTACATATTGCTGGGGTTTCTTCAATTATAGGTTCAATTAATCGTATTACTACAATCGTAAATATAAAAATCGATAAAATTGAATTAATCGCTTTATCGTCTTGAGCAATATTATTAACAGCAATCGTATTATTATTATCTTTACCAGTTTTAGCTGGAGCAATTACAATATTATTATCGGATCGAAATCGAAATACTTCTTTTTTTGATCCTTCAGGAGGTGGTGATCCAATCGTATATCAACATCGATCGTGATCGTTTGGTCATCCTGAAGTTTATATCGTAATCGTACCTGGTTTTGGATTAATCGCTCATATAATCGGTAATGAAAGAAAAAAAAAAGAAACTTTTGGTAGAATAGGAATAATCGATGCAATAATCGCTATTGGTTTACTAGGATCGATTGTATGGGCTCATCATATATCGACTGTAGGAATGGATGTTGATACTCGAGCTTATCGTACTTCTGCAACTATAATTATTGCAGTGCCTACAGGTATTAAAATCGTTAGTTGATTAGCTACAATAAATGGTATAAAAATTAAGTTTTCTGTAGTAAATCGATGACTTTTAGGTTTTATCGTTTTATCGACTATTGGAGGATTAACTGGAATTATCGTATCAAATTCTTCAATTGATATTGTTTTACATGATACCTATTATGTTGTTGCTCATCGTCATTACGTTTTATCTATAGGGGCTGTTTTTGCTATCGTTGGTAGATCGATCGATTGATATCCTTTATCGACTGGATTAACAATAAATCAATATTGATTAAAAATTCAATCGTTTTTAATATTCTTTGGGGTTAATATAACTTTTTTTCCTCAACATCGTTTAGGATTGAGAGGAATACCTCGTCGGTATTCAGATTATCCAGATTCTTATCGATGTTGAAATATAATCGCTTCAATTGGTTCTTTAGTTACATTATTGAGAACATCGTATCGTTTTTTTATTCTATGAGAATCTATTGTTTCTCGACGAATCGTAATCGTTATAAATAATAATAATAGATCTATTGAATGACTAATAACTTTTCCATTAAATAATCATACTTTTTATGAAATTCCAAAAGTATCGAAATTAAAT
>tcae
ATGAAATCGTGATCGTTTTCAACAAATCACAAATATATTGGTATCGTGTATCGTATCGTTGGTATATGAGCAGGAATTATTGGTTTATCAATAAGAATAATTATTCGTTTAGAATTAGGTAATCCTGGATCTTTAATTGGTAATGATCAAATCGATAATTCTATTGTTACTAGTCATGCTTTTTTAATAATCGTTTTTTTTGTTATACCTGTTATAATAGGTGGATCGGGAAATTATCGAATTCCATTAATATTAGGAAGTCCTGATATAGCTTTTCCTCGAATAAATAATATAAGATCGTGATTATTACCTCCAAGATTAATATTATTATTATCAAGAATATCGATTGGTACTGGTACTGGTACTGGGTGAACAGTTTATCCTCCATTGTCTTCAAATCGATCTCATAGGGGACCTTCAGTAGATCGATCAATCGTTTCTTTACATATTGCTGGAGTTTCTTCTATTATAGGCTCAATTAATCGTATTACAACAATCGTAAATATAAAAATCGATAAAATTGAATTAATCGCTTTATCGTCTTGAGCAATGTTATTAACAGCAATCGTATTATTATTATCTTTACCGGTTTTAGCAGGTGCAATTACTATATTATTATCGGATCGAAATCGAAATACTTCATCGTTTGATCCTTCTGGTGGTGGTGATCCAATTCTTTATCAACATCGATCGTGATCGTTTGGTCATCCTGAAGTTTATATCGTAATCGTACCTGGGTTTGGTTTAATCGCTCATATAATCGGTAATGAAAGAAAAAAAAAAGAGACTTTTGGTAGAATAGGAATAATCGATGCAATAATCGCTATTGGTTTATTAGGTTTTATTGTTTGAGCACATCATATATCGACAGTAGGTATAGATGTAGATACCCGAGCTTATCGTACTTCAGCAACTATAATTATTGCAGTTCCTACAGGAATTAAAATCGTTAGATGATTAGCTACTATAAATGGAATAAAAATTAAGTTTTCTGTAGTAAATCGATGACTTTTAGGTTTTATCGTTTTATCGACTATTGGGGGATTAACAGGAATTATCGTATCAAATTCTTCAATTGATATTGTTTTACATGATACTTATTATGTAGTAGCTCATCGTCATTATGTTTTATCAATAGGAGCAGTCTTTGCTATCGTTGGAAGATCGATCGATTGATATCCTTTATCGACTGGATTAACTATAAATCAATATTGATTAAAAATTCAATCGTTTTTAATGTTTTTTGGAGTAAATATAACTTTTTTTCCTCAACATCGTTTAGGATTAAGAGGTATACCTCGTCGATATTCAGATTATCCTGATTCTTATCGATGTTGAAATATAATCGCTTCAATTGGTTCTTTAGTAACATTATTAAGAACATCGTATCGTTTTTTTATCGTATGAGAATCTATTGTTTCTCGACGAATCGTAATCGATATAAATAATAATAATAGTTTTATTGAATGATTAATAACTTTTCCGTTAAATAATCATACTTTTTATGAAATTCCAAAAGTATCGAAATTAAAT
>tp
ATGAAATCGTGATCGTTTTCAACAAATCATAAATATATTGGTATCGTGTATCGTATCGTTGGAATATGGGCAGGAATTGTAGGTTTATCAATAAGAATAATTATTCGTTTAGAATTAGGTAATCCTGGTTCATTAATTGGTAATGATCAAATCGATAATTCTATTGTTACTAGACATGCTTTTTTAATAATCGTCTTTTTTGTTATACCTGTAATAATAGGAGGTTTTGGTAATTATCGAATTCCATTAATATTAGGAAGTCCTGATATAGCTTTTCCTCGTATAAATAATATAAGATCGTGATTATTACCGCCAAGATTAATATTATTATTATCAAGAATATCGATTGGTACAGGTACAGGAACAGGTTGAACTGTGTATCCTCCATTATCTTCAAATCGATCTCATAGGGGTCCTTCTGTAGATCGATCAATCGTTTCTTTACATATTGCTGGGGTTTCTTCAATTATAGGTTCAATTAATCGTATTACTACAATCGTAAATATAAAAATCGATAAAATTGAATTAATCGCTTTATCGTCTTGAGCTATATTATTAACAGCAATCGTATTATTATTGTCTTTACCAGTATTAGCAGGTGCAATTACTATATTATTATCGGATCGAAATCGAAATACTTCATCGTTTGACCCTTCTGGGGGTGGTGACCCTATCGTATATCAGCATCTATCGTGATCGTTTGGGCATCCTGAAGTTTATATCGTAATCGTACCTGGATCGGGTTTAATCGCCCATATAATCGGTAATGAAAGAAAAAAAAAAGAAACCTTTGGAAGAATAGGAATAATCGATGCAATAATCGCTATTGGTTTATTAGGGTTTATTGTTTGAGCTCATCATATATCGACAGTAGGAATGGATGTTGATACGCGGGCTTATCGTACTTCAGCTACTATAATTATTGCTGTACCTACTGGTATTAAAATCGTTAGGTGATTAGCAACTATAAATGGTATAAAAATTAAATCGTCTGTAGTTAATCGATGACTTTTAGGATCGATCGTTTTATCGACTATTGGGGGTTTAACAGGAATTATCGTATCAAATTCTTCAATTGATATTGTTTTACATGATACATATTATGTTGTAGCTCATCGTCATTATGTTTTATCTATGGGAGCAGTTTTTGCAATCGTTGGTAGATCGATCGATTGATATCCATTATCGACTGGTTTAACAATAAATCAATATTGATTAAAAATTCAATTCTTTTTAATATCGTTTGGGGTTAATATAACTTTTTTTCCCCAACATCGCTTAGGATTAAGAGGAATGCCTCGACGATACTCAGATTATCCAGATTCTTATCGATGTTGAAATATAATCGCTTCGATTGGTTCTTTAGTAACATTATTAAGAACATCGTATCGTTTTTTTATCGTATGAGAATCAATTGTTTCTCGACGAGTTTTAATCGTTATAAATAATAATAATAGTTCAATTGAATGATTAATAACTTTTCCATTAAATAATCATACTTTTTATGAAATTCCAAAAGTATCGAAATCGAAT
>ma
ATGAAATTATGATATCGTTCAACAAATCATAAATATATTGGAATCGTATATCGTATCGTTGGTATATGATCAGGAATTGTAGGATTATCTATAAGAATAATTATTCGATTAGAATTAGGAAATCCTGGTTCATTAATTGGTAATGATCAAATCGATAATTCTATTGTGACTACTCATGCTTTTATAATAATCGTTTTTTTTGTAATACCTGTAATAATAGGAGGTTTTGGAAATTATCGAATTCCTTTAATATTAGGATGTCCTGATATAGCTTTCCCTCGAATAAATAATATAAGTTTTTGGTTATTACCTCCAAGAATCGTATTATTAATCGCTAGAATATCGATTGGAACAGGAACAGGAACAGGATGAACTGTTTATCCTCCTTTATCATCAAATCGAGCACATTCTGGTCCTTCAGTAGATCGATCAATCGTTTCTTTACATATTGCTGGAATATCATCAATTATAGGTTCAATTAATCGTATTACTACTATTATAAATATAAAAATCGATAAATCGGAATATATTGTTTTATCGTCTTGGGCAATAATCGTAACAGCTATCGTATTATTATTATCATTACCTGTATTAGCTGGGGCTATTACTATATTATTATCGGATCGAAACTTAAATACTTCATCGTTTGATCCTGCTGGAGGAGGAGATCCTATCGTATATCAACATCGATCGTGATCGTTTGGTCATCCTGAAGTTTATATCGTAATCGTACCTGGATCGGGATTAATCGCTCATATAATCGGTAATGAAAGAAAAAAAAAAGAAGTTTTTGGTTCAATAGGAATAATCGATGCAATAATCGCAATTGGTTTATTAGGATCGATTGTTTGAGCTCATCATATATCGACTGTTGGAATAGATATTGATACACGTGCTTATCGTACTTCAGCAACAATAATTATTGCTGTTCCTACTGGTATTAAAGTATCGAGTTGATTAGCTTCAATAAATGGAATAAAAATTAAATCGTCTGTTTATAATCGATGAATATTAGGATCGATCGTTTTATCGACTGTTGGAGGTTTAACAGGTATTATATTATCAAATTCTTCAGTTGATATTGTTTTGCATGATACTTATTATGTAGTTGCTCATCGTCATTATGTTTTATCTATAGGTGCAGTTTTTGCAATCGTTGGTAGATCGATCGATTGATATCCTTTATCGACAGGTTTATATATAAATCAATATTGATTAAAAATTCAATCGATAATAATATCGTTTGGTGTAAATCGAACTTTTTTTCCTCAACATCGTTTAGGATTAAGAGGAATACCTCGACGTTATTCTGATTATCCAGATTCATATTATTGTTGAAATCGATCGTCTTCATTAGGATCATTAGTAACTTTAATAAGGACTTTTTATCGTTTTTTTATTGTATGAGAATCAATAATCGCAAATCGTATCGTAATCGATGTAAATATTATTGGTAATTCTATTGAATGAATAATAACTTATCCAGCAAATAATCATAGTTTTTATGAAATTCCTAAATTATCGATAAAGAAT