2021.03.25【读书笔记】丨生物信息学与功能基因组学(第五章 高级数据库搜索 上)

  • 学习目标
    • 定义位置特异性打分矩阵(PSSM);
    • 解释位置特异性迭代BLAST(PSI-BLAST)和DELTA-BLAST怎样大幅提升蛋白质BLAST蛋白搜索的灵敏度;
    • 描述谱隐马尔可夫模型(HMMs)并解释其与BLAST相比在数据库搜索中的优势;
    • 解释空位种子的策略怎样提升DNA搜索的灵敏度;
    • 描述数以百万计的二代测序是怎样比对到参考基因组上的。
  • 引言
    • 第四章介绍了BLAST,BLAST搜索可以有很多种用途,本章将介绍几种高级的数据库搜索技术。
    • NCBI五种BLAST不足以解决的三个问题:
      • 很难发现进化关系远缘但是同源的蛋白
      • 将长序列(>20k)与数据库进行比对
      • 二代测序生成大量的短读段都需要比对到一个参考基因组,BLAST完成效率很低。
    • 本章将简要介绍针对不同类型研究问题的特殊BLAST的资源,然后介绍PSI-BLAST和DELTA-BLAST和隐马尔可夫模型,这些工具可用于发现远缘蛋白。
  • 特殊BLAST网站
    • 物种特异性BLAST网站:NABI Map Viewer
      • 限定某一特定物种,或聚焦数十种重要物种
    • Ensemble BLAST
      • Ensemble BLAST服务器允许用户搜索Ensemble数据库
      • 2021.03.25【读书笔记】丨生物信息学与功能基因组学(第五章 高级数据库搜索 上)_第1张图片
      • 2021.03.25【读书笔记】丨生物信息学与功能基因组学(第五章 高级数据库搜索 上)_第2张图片
    • Welcome Trust 桑格研究所(WTSI)
      • WTSI在基因测序领域有很重要的地位。该网站提供了针对超过100个物种的BLAST搜索,还提供针对脊椎动物基因组注释计划的BLAST服务器。该计划致力于队友选择的脊椎动物基因组进行高质量人工注释。
    • 特殊的BLAST-相关算法
      • WU BLAST 2.0
      • 欧洲生物信息学研究所(EBI)
        • 1.BLAST工具包括WU BLAST 2.0及NCBI BLAST和PSI-BLAST
        • 2.与BLAST一样,FASTA(FASTAⅡ)也是一种搜索DNA和蛋白质数据库的启发算法。还有其他基于全局和局部比对的搜索工具。
        • 3.可提供对欧洲核苷酸档案库的搜索,使用户可从二代测序数据中发现感兴趣的序列。
        • 2021.03.25【读书笔记】丨生物信息学与功能基因组学(第五章 高级数据库搜索 上)_第3张图片
      • NCBI BLAST
        • NCBI上的BLAST还提供了一系列专门的搜索。
      • NGS BLAST
        • 第九章会介绍二代测序(NGS)和存储二代测序数据的序列读段档案库(SRA)。链接到SRA后可与在结果列表中点击一个或多个框进入到BLAST界面,这个页面可以用一个感兴趣的查询序列,来对一套二代测序数据进行搜索。
  •  

你可能感兴趣的:(生物信息学与功能基因组学,生物信息,数据处理读书笔记)