宏基因组分析步骤Linux,为什么宏基因组数据分析比较难?

生物数据分析包括很多种类,比如人基因组,植物,动物,微生物,还有RNA,单细胞RNA等等,其中宏基因组数据分析是比较难的部分,为什么呢?这里总结了以下10点原因。

样品采集

由于微生物在地球上广泛的覆盖,因此,宏基因组样品来源非常广泛,从南北极冰川,到海底淤泥,从喜马拉雅山山脉,到亚马逊丛林,覆盖高山,大河,冰川,土壤,海洋,大气,火山,牛胃,包括人体各个部分都可以进行宏基因组研究,采集到合适的样品,才能开展创新性的研究。

样品提取

由于微生物宏基因组样品种类繁多,可以来自人肠道,山川,河流,土壤,粪便等等样品。因此,很难有统一的样品提取流程。往往无法提取到高质量的DNA而影响后续分析结果。另外,由于样品中可能包括多种物种,例如革兰氏阳性菌和革兰氏阴性菌,由于二者细胞壁的差别,不同的提取方法都可能造成差异。另外,一些样品中可能包含宿主污染,去除宿主污染也是一大难题。对于宏转录样品,由于原核生物与真核生物 RNA结构不同,也不能采用同样的测序。样品提取一直是宏基因组分析中一项重大难题,需要结合前人经验,以及具体样品,不停的摸索经验。

建库方案

选择不同的建库方案,会对结果造成影响。二代测序需要使用PCR扩增,会带来PCR的偏向性,比如高GC区域无法很好的扩增出来,测序不到,影响后续分析

你可能感兴趣的:(宏基因组分析步骤Linux)