2021.11.22【读书笔记】丨生物信息学与功能基因组学(第五章第四节 隐马尔可夫模型)

  • 5.4 谱搜索:隐马尔可夫模型(HMMs)
    • 谱隐马尔可夫模型在生成用于识别远缘序列相似度的位置特异性打分系统时,比PSSMs更通用,如语音检测,声纳等一系列信号检测问题;
    • 在生信领域,HMMs已经被用于各式各样的应用:序列比对、蛋白质结构预测、蛋白质跨膜区域预测、染色体拷贝数变化分析和基因发现算法等;
    • 优势:
      • 谱HMMs是一个概率模型,它评估在比对中的一个给定位点上发生匹配、错配、插入和确实(空位)的可能性。通过开发一个基于已知序列的统计学模型,我们可以使用谱HMM来描述一个特定序列与模型相匹配的可能性。
      • 谱HMM可以将一个多序列比对转换成一个位置特异性评分系统。谱HMM的一个常见应用是在谱HMMs的一个数据库中查询一条感兴趣的单一蛋白质序列,另一应用时在一次数据库搜索中将一个谱HMM作为查询条目,例如PFAM和SMART。
    • 马尔科夫链:
      • 一种数据结构,由一个初始状态,一个有限的、离散的可能状态集合和描述如何从一个状态到下一个状态移动的转移函数组成。又被称为有限状态机。
        • 2021.11.22【读书笔记】丨生物信息学与功能基因组学(第五章第四节 隐马尔可夫模型)_第1张图片

    • 一个HMM包含一系列被定义的状态,是一个可以被用以描述在一个序列中每一个位置所处“状态”的模型。
      • 2021.11.22【读书笔记】丨生物信息学与功能基因组学(第五章第四节 隐马尔可夫模型)_第2张图片

    • 隐马尔可夫模型结构图
      • 图示:

        2021.11.22【读书笔记】丨生物信息学与功能基因组学(第五章第四节 隐马尔可夫模型)_第3张图片

      • 1.最下面方框时一系列的主要状态,可能对应这一条氨基酸序列的残基
      • 2.第二行有插入状态组成,该状态对比对中因为必要的插入二变化的区域进行建模
      • 3.第三行由圆形表示的对应于空位的删除状态的组成。提供一条途径以掠过多重序列比对中的一列。发射产生比对中的观察序列
      • 状态影响因素
        • 转移概率与发射概率
          • 转移概率描述沿着马尔科夫链的隐藏状态序列的路径;
          • 发射概率描述成对比对时的匹配状态;
    • HMMER软件:命令行和网页版
      • hmmbuild:可读取一个多序列比对来创建一个谱HMM
      • hmmsearch:指定HMM和数据库
        • 图示

          2021.11.22【读书笔记】丨生物信息学与功能基因组学(第五章第四节 隐马尔可夫模型)_第4张图片

      • hmmcalibrate:将5000条随机序列比对到谱HMM上,将分数比对到一个机制分布,并计算出对于估算数据库匹配的统计学显著性非常必要的参数。
    • HMMER3的改进
      • 运行速度提升
      • 提供HMMER网页版
      • 图示

        2021.11.22【读书笔记】丨生物信息学与功能基因组学(第五章第四节 隐马尔可夫模型)_第5张图片

  •  欢迎加群交流,或者加VX:bbplayer2021,邀请进群
  • 2021.11.22【读书笔记】丨生物信息学与功能基因组学(第五章第四节 隐马尔可夫模型)_第6张图片

 

你可能感兴趣的:(生物信息学与功能基因组学,读书笔记,生物信息,业务流程测试,数据分析,linux)