Python积累

从基因组注释中提取转录因子

字符串find使用+异常值处理

今天又写了一个小脚本,从基因组的注释文件中筛选所有可能的转录因子,方法是以DNA binding的GO号及关键词'Transcription factor'和'transcription factor'为筛选条件。
昨晚其实想复杂了,主要使用一个判断语句 str.find() != -1 就好了

import os
os.chdir('C:/Users/zm/Desktop')

Inputfile='gene_annot.txt'
TFs=[]
title=0
for line in open(Inputfile).readlines():
    if title != 0:
        if line.find('GO:0003677') != -1 or line.find('Transcription factor') != -1 or line.find('transcription factor') != -1:
            TFs.append(line)
    if line.startswith('ID'):
        TFs.append(line)
        title=1

昨晚写了一点点,还想着把每一行的输入转换成列表,然后再判断,那可真真的是很麻烦了,但是在想这个的时候,倒是学了一个新的知识点:异常值处理
可惜了,那几行脚本被我删除了,就是

try:
  GOs.append(line[18])
except IndexError:
  GOs.append('NULL')

你可能感兴趣的:(Python积累)