用python集合比较两个基因名文件的差异

比较两个基因名文件的差异

有时候需要比较两个只有基因名的文件时,可以用将每个文件读入,并用集合(set)的算法,来比较两个文件

如:

file1.txt

gene1
gene2
gene3
gene4
gene5
gene6

file2.txt

gene1
gene2
gene4
gene7
gene8
gene10

具体python代码如下:

import sys

#用sys.argv[1]和[2]来接收两个文件
file1 = open(sys.argv[1], 'r').readlines()
file2 = open(sys.argv[2], 'r').readlines()
#接收的文件转换成集合,然后用 ^ 来计算两个集合的对称差集
differece = set(file1) ^ set(file2)
outtxt = open('output_diff_file.txt', 'w')
for line in differece:
    outtxt.write(line)
outtxt.close()

接下来在命令行中输入python脚本加上两个txt文件就能输出名为'output_diff_file.txt'的文件了,这个文件就是file1和file2中有差异的基因名了。

你可能感兴趣的:(用python集合比较两个基因名文件的差异)