测序数据分析之OTU

1. OTU(Operational Taxonomic Units)操作分类单元:是在是在系统发生学研究或群体遗传学研究中,为了便于进行分析,人为给某一个分类单元(品系,种,属,分组等)设置的同一标志。在生物信息分析中,一般来说,测序得到的每一条序列来自一个菌。要了解一个样品测序结果中的菌种、菌属等数目信息,就需要对序列进行归类操作(cluster)。通过归类操作,将序列按照彼此的相似性分归为许多小组,一个小组就是一个OTU。通常按97%的相似度,对所有序列进行OTU划分并进行生物信息统计分析。

通常在97%的相似水平下聚类生成OTU,近期认为100%更合理。

选择每个聚类群众最高丰度序列作为代表性序列。

为什么需要OTU?

序列错误:PCR产生的错误;测序错误

菌内16S多样性

计算能力和算法限制,两两比较太耗时

 

优点:快速生成丰度矩阵

不足:只到属水平;菌和OTU无法对应;不同批次实验无法比较

2.扩增子实验和分析流程

测序数据分析之OTU_第1张图片

 简言之,基本思路为:质控-挑选代表序列(OTU/ESV)-物种注释-生成Feature表-多样性分析(整体)-差异比较(局部)-机器学习

你可能感兴趣的:(菌群分析)