第一期学习小组分享会,主题为代谢数据库的介绍和使用,主要内容为KEGG、BIGG、MetaCyc、MetaRxn、BRENADA、SEED、ATLAS和MINE数据库的学习和介绍。
KEGG:https://www.kegg.jp/
KEGG(Kyoto Encyclopedia of Genes and Genomes)是由日本京都大学和东京大学联合开发的数据库,是基因组测序和其他高通量实验技术生成的大规模分子数据集的整合和解读的突出参考知识库,可以用来查询代谢途径、酶(或编码酶的基因)、产物等,也可以通过BLAST比对查询未知序列的代谢途径信息。KEGG主要通过Web界面进行访问,同样也可以通过本地运行的Perl或java程序进行访问,使用很方便。KEGG是一个综合数据库资源,进一步可细分为16个主要的数据库。
PubChem:http://www.ncbi.nlm.nih.gov/pubchem/
业界很有名的分子数据库,储存有化合物的 2D 和 3D 结构物理性质、化学性质以及安全信息。更重要的是能查询到与化合物相关的文献和专利,该功能能迅速且全面地让我们了解检索化合物的背景知识。
ChEBI:http://www.ebi.ac.uk/chebi/
BioCyc:https://biocyc.org/
16822个途径/基因组数据库的集合(大肠杆菌、枯草芽孢杆菌、酿酒酵母和人等生物体的基因组和代谢途径;计算预测的代谢途径和操纵子(细菌和古细菌)从其他数据库中整合的数据,包括基因本质、调节网络、蛋白质特征和基因注释);加上探索它们的软件工具(基因组浏览器、个体代谢通路和完整代谢图的显示等)。
MetaCyc
MetaCyc是一个阐明通过实验手段阐释代谢通路的数据库。MetaCyc的数据来源于科学实验文献,含有初生代谢和次生代谢通路,还包括相关的化合物、酶和基因,比如:与大多数的微生物和植物中发生的通路有关的2,844种不同生物;带有14,051种酶反应和52,446个相关文献引用的2,526种代谢通路;MetaCyc收集了所有的由国际生物化学与分子生物学联合会命名委员会(NC-IUBMB)分配EC编号的所有酶催化反应;MetaCyc并不会为特定有机体系建立完成的代谢模型。
Reactome:http://reactome.org/
免费开源的代谢通路数据库,提供直观的生物信息学工具,用于可视化、解释和分析途径相关知识,以支持基础研究,基因组分析、建模和系统生物学研究等。
Reactome利用PSIQUIC Web服务来覆盖来自Reactome功能交互网络和外部交互数据库(如IntAct,ChEMBL,BioGRID和iRefIndex)的分子交互数据。Pathway注释由生物学专家与Reactome编辑人员合作编写,并交叉引用许多生物信息学数据库(NCBI Gene数据库,Ensembl和 UniProt数据库,UCSC基因组浏览器,KEGG化合物和ChEBI小分子数据库,PubMed和 Gene Ontology)。
BRENDA:https://www.brenda-enzymes.org/
酶数据库,提供酶的分类、命名法、生化反应、专一性、结构、细胞定位、提取方法、文献、应用与改造及相关疾病的数据。
BIGG:http://bigg.ucsd.edu/
基因组及代谢网络重建的知识库,将108多个已发布的基因组尺度代谢模型集成到一个数据库中。用户可以浏览、搜索和可视化模型,BiGG模型中的基因被映射到NCBI基因组注释,代谢产物被链接到许多外部数据库(KEGG、PubChem等)。
kbase:https://narrative.kbase.us
能利用注释好的基因组快速重建基因组水平的代谢模型
可能网络存在问题?各个模块按钮点不开!
antiSMASH:https://antismash.secondarymetabolites.org
微生物次级代谢物合成基因簇注释数据库,允许对细菌和真菌基因组中的次级代谢物生物合成基因簇进行全基因组的快速识别、注释和分析。
SEED
MetaRxn
跨越代谢模型和数据库的代谢物和反应的知识库
BioCarta Pathway
ATLAS
MINE