Python-79 用python对excel里复制过去的的DNA序列进行格式修改,获得fasta格式的文件 2020-09-29

用python对excel里复制过去的的DNA序列进行格式修改,获得fasta格式的文件:
代码与解释如下:

import os #事先安装并导入这个包;如果没安装好就win+r后输入cmd,再输入 pip install os 然后enter
import shutil  #导入这个包;如果没安装好就win+r后输入cmd,再输入 pip install  shutil 然后enter
import plistlib#如果没安装好就win+r后输入cmd,再输入 pip install  plistlib 然后enter,之后再回到这个页面就可以正常运行了!

fin = open('E:/SDSampleData20200708/1.txt', "rt") #打开一个txt文件
data = fin.read()#读取txt
#replace all occurrences of the required string
data = data.replace("_", "\n") #找到特殊字符进行替换
#data = data.replace("bbb", ">")
#data = data.replace("xxx", "\n")
#close the input file
fin.close()
#open the input file in write mode
fin = open('E:/SDSampleData20200708/20200929序列.txt', "wt")
#overrite the input file with the resulting data
fin.write(data)#将处理好的结果再写进前面的txt内。
#close the file
fin.close()

原始格式:


image.png

处理后得到的格式:


image.png

你可能感兴趣的:(Python-79 用python对excel里复制过去的的DNA序列进行格式修改,获得fasta格式的文件 2020-09-29)