数据库

https://academic.oup.com/nar/issue

  • sanger 英
  • broad institue 美
  • UCSC 美

1. 核酸数据库

  • DNA数据库
  • 基因组数据库
  • 基因变异数据库
  • 基因表达数据库
  • RNA数据库
  • 病毒数据库
    INSDC(DDBJ、NCBI、ENA):http://www.insdc.org/

HGP人类基因组计划 1990-2003 约三亿个碱基对

  • 千人基因组 https://www.internationalgenome.org/(1000genomes.org)

2.基因组注释 即基因组注释数据库

2.1 基因组注释
  • 基因组数据由原始的测序序列,通过jiangreads组装成scaffolds乃至完成的染色体的基因组序列
  • 识别其中的基因序列,分析其产物的功能和结构,寻找不同族群间的变异和规律(群体基因组比较)
2.2 数据库
  • Ensembl 人 →脊椎模式生物的基因组注释数据库
  • Ensembl Genomes 非脊椎

3.癌症基因组数据库

  • TCGA 美国癌症基因组图谱 2006开始
    基因组、表观基因组、转录组、蛋白组、影像组
    介绍网站:https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga
    数据门户:https://portal.gdc.cancer.gov/

  • ICGC 国际癌症基因组联盟

4.基因变异数据库

4.1 基因变异
  • 单碱基置换
    • 微缺失、微插入
    • 缺失/插入 indels 、重复序列扩增、基因损伤(缺失、插入、倍增)
    • 复杂基因的重组
4.2 数据库
  • HGMD 人类基因突变数据库 与人类遗传病相关的
  • ClinVar 与人类健康相关的 临床的
  • COSMIC (最大最完整的)癌症体细胞突变数据库
  • dbSNP 单核苷酸多态性数据:插入、删除、微型卫星、非多态性变异

5.RNA数据库

  • RNA家族数据库 Rfam
    Rfam家族分为三大类:非编码RNA基因、结构化cis调控元素、自拼接RNA
    http://rfam.xfam.org/
    http://xfam.org/

    xfam

  • 非编码RNA数据库 NONCODE(此不包括tRNA、rRNA数据)

  • miRNA 数据库 miBase

  • RNACentral 整合收集了来自多物种的所有非编码RNA类型的非编码RNA序列
    包含了NONCODE、Rfam等
    https://rnacentral.org/

    miBase数据来源

6.基因表达数据库

定性、定量基因的表达,来研究基因调控的作用和结果

  • GEO 功能基因组公共数据库
    MIAME标准的数据
    表达的点阵数据array data 和 测序数据NGS data
    -Expression Atlas 基因RNA和蛋白表达数据

7.微生物组学数据库

  • 美国 人类微生物组计划 Human Microbiome Project
  • 欧EBI 微生物宏基因组数据库 MGnify 不仅是人体中的
    微生物组:关注微生物本身
    宏基因组:更关注环境中微生物群落整体 微生物与其周围的环境、宿主的关系

8.病毒数据库

  • 病毒病原体数据库 ViPR
  • NCBI病毒数据资源
  • 新冠
    GISAID 数据库(原是禽流感病毒的全球倡议数据库)https://www.gisaid.org/
    中国国家生物信息中心的新冠病毒数据库
  • 中国国家微生物科学数据中心(微生物组学,从宏观到微观)

9.蛋白质数据库

  • UniProt 全球蛋白质序列数据库
  • Pfam 蛋白质家族数据库 识别蛋白域
  • InterPro 蛋白质家族分类数据库 InterProScan
  • PDB 结构
  • CATH/Gene3D 结构

你可能感兴趣的:(数据库)