GO(Gene Ontology)

基因本体论(Gene Ontology)介绍
http://blog.sina.com.cn/s/blog_96e99d280102vzj6.html
The Gene Ontology Handbook: https://link.springer.com/content/pdf/10.1007%2F978-1-4939-3743-1.pdf
coursera 北大课程 <生物信息学:导论与方法> 第十周,第一课(有十分完整的介绍)
https://www.coursera.org/learn/sheng-wu-xin-xi-xue/home/week/10
ontology-documentation:
http://geneontology.org/page/ontology-documentation

what?

Ontology 首先是出现于哲学领域的一个词汇,后来广泛用于计算机领域,发挥了很重要的作用,再后来这个概念被引入生物领域。
gene Ontology 是生物中Ontology中一个重要应用。go项目最初是由研究三种模式生物(果蝇、小鼠和酵母)基因组的研究者共同发起。是生物信息分析中很重要的一个方法
go是在生物领域应用非常广,可以帮助生物学家对基因产物进行准确的定义(功能、位置),节省时间。

why?

因为在最开始的时候,生物学家们更多是专注于自己研究的物种/课题,而且每个生物学家对功能等的定义是存在差异的,导致不同实验室/物种不能实现直接的对接(比如A物种内的x基因的功能使用的是a这个词汇进行注释,而B物种内的x基因的功能却使用的是与a同义的词汇b进行注释,这种情况计算机无法识别),就像讲两种语言的人,无法直接进行语言交流。这种情况导致的问题是,出现了一种阻碍,让问题复杂化了。所以就有了Ontology在生物领域中的应用,实现“书同文”。

how?

go定义了基因/基因产物的功能(通过术语)且定义了它们各自之间功能是怎样联系的(关系)。它组成了一个具有大量term的词汇库,并定义各种term之间的关系(is_a part_of R)。
GO通过三个方面的术语对基因/基因产物的功能进行描述:分子功能(molecular function) -由基因/基因产物行使的分子水平上的功能; 细胞组件(cellular component)-基因/基因产物产生功能时其在细胞结构上的位置;生物学过程(biological process)-在哪个生物学通路/生物过程发挥作用。

go注释方法

目前,GO 注释主要有两种方法:
(1)序列相似性比对(BLAST):例如blast2go(将blast结果转化为GO注释)
(2)结构域相似性比对(InterProScan)

blast2go的本地化教程:

注意要按顺序导入文件数据到MySQL中
因为需要导入的文件有点大,可以将mysql的存储路径更改到空间大的地方。
https://www.coursera.org/learn/sheng-wu-xin-xi-xue/home/week/10
http://www.biotrainee.com/thread-1773-1-1.html
http://blog.shenwei.me/local-blast2go-installation/

在blast2go软件正确安装的情况下,使用blast2go进行go注释,出现无法得到注释结果的问题:

Blast2GO Pipeline Version 2.5.0
--------------------------------------

Hash for resource ec2go_19072011.txt of type ec created. 4003 associations loaded.
Blast2GO build: 23092011
Change b2g-properties file to: b2gPipe.properties
Blast2go.version=2.5.0
Blast2GO can not reach the Internet
Blast2GO started (without GUI)
create new Project
set new Project
Hit description position set to: 5
Hit description filter set to: 
GoWeight set to: 5.0
blastx_2.2.25.xml
BLAST result added to sequence: Seq1
Open database connection to database b2gdb on localhost as blast2go with password starts with bla*****
Open database connection to database b2gdb on localhost as blast2go with password starts with bla*****
BLAST result added to sequence: Seq2
BLAST result added to sequence: Seq3
BLAST result added to sequence: Seq4
BLAST result added to sequence: Seq5
BLAST result added to sequence: Seq6
BLAST result added to sequence: Seq7
BLAST result added to sequence: Seq8
BLAST result added to sequence: Seq9
BLAST result added to sequence: Seq10
Annotation of 0 seqs with 0 annots finished. Now searching for orfan IPRs...
B2G-Pipe finished

经过排查,问题是出在blast2go无法识别新版nr数据库中注释信息(可以识别2017年nr数据库的注释,却无法识别18年的,可能在17-18这期间nr的注释结构发生了改变),只需要将nr库改为17年的就性行了,但这只是治标不治本。
GO(Gene Ontology)_第1张图片

另外还有可能出错的原因是,blast2go无法识别blast高的版本号,当使用高版本的blast的时候,直接将版本号给修改为低版本的就行了,例如(BLASTX 2.2.25+)

BLASTX 2.2.25+
如何看懂go graph:

GO 的图形是一个有向无环图

ontology-structure
http://geneontology.org/page/ontology-structure
ontology-relations
http://geneontology.org/page/ontology-relations#basics

你可能感兴趣的:(GO(Gene Ontology))