那些年被Excel软件改了名字的基因

我们在做生信分析时经常和序列、基因和蛋白打交道,基因在各个生信公共数据库中有唯一识别编号(GeneID,通常是数字编码,如Entrze ID),也有各自独特的别名(GeneName or Gene Symbol)。我们谈谈:那些年被Excel软件改了名字的基因。据研究发现:现已经发表的很多科研报道中有很多基因名称都变成了日期格式的名字,这种改变是因为Excel软件的自作聪明(自动把符合预期的字符进行格式转换,看到SEPT3,它以为你说的是3-Sep;看到MART2,它以为你说的是2-Mar;看到DECR1,它以为你说的是1-Dec,这样的例子有很多,大多数是基因名称开头中含月份英文简写,然后被Excel自动识别和改名的)和人的疏忽(一般研究人员如果不涉及这些含月份简写的基因名称时是不会注意到的,打开含基因名称的数据,然后再保存文件,这个过程错误已经留在了里面)造成的,只要你的研究涉及基因和蛋白,而你又用Excel软件打开进行数据的查看和整理、分析,都可能受影响。

下面是我整理的物种人Human(Homo sapies)中含有月份简写的基因列表,希望对生信分析人员有帮助(当然,这个表格可以自己整理)。

一、月份中英文及简写对照表


二、基因列表


你可能感兴趣的:(那些年被Excel软件改了名字的基因)