【现学现卖·文献】病毒宏基因组分析相关文献(1)

​一、污水中病毒组

最近在看一些病毒宏基因组的论文。前几篇可能看得认真和全面一点,写得也会多,后面的论文方法什么的应该大同小异,就只总结流程图和“小异”。

1.大致内容流程图

2.方法和结果

(1)viral particles:收集的污水样品保存在-80℃。使用前,600-800ml污水样品在4℃解冻72h→4℃,4000g,15min离心(留上清)→4℃,10000g,15min离心(留上清)→采用0.22μm孔径的切向流过滤(tangential-flow filtration)装置收集病毒组分→用30-kDa的切向流过滤器浓缩病毒溶液至12ml→镜检(SYBR gold epifluorescence microscopy)。

(2)Viral nucleic acid:镜检有病毒粒子→采用超高速离心加蔗糖层(38%,wt/vol)的方法得到病毒沉淀→重悬在500μl SM buffer(100mMNaCl,8mMMgSO4·7H2O,50mMTris-HCl,pH 7.5)中→用DNase和RNase消化游离的核酸→最后用试剂盒提取病毒的核酸。

(3)construct libraries:文中每个样品都用了12对random primers做了RT和cDNA RT-PCR→样品不同的PCR产物定量至相同的量→454 GS FLX titanium平台测序。

(4)Bioinformatics:根据引物tags对得到的reads进行修剪和解析,对于每个样品,若reads间有超过35bp且一致性超过95%的,会被assembled到同一个contigs→大于100bp的reads、assembled contigs和nonassembled singlets在GenBank-nonredundant nucleotide and protein sequence databases中进行比对(BLASTn和BLASTx),E value<10^-4→根据BLAST返回的结果将序列分类→解析序列与BLAST返回结果的一致性分布(sequence identity distribution analysis,下图)。

四个样品包含的病毒种类和占比

一致性分布,每个点是一个BLAST中的查询序列

(5)Acquisition of novel virus genomes:用试剂盒提取病毒粒子的核酸→病毒基因组序列的3’和5’端用RACE试剂盒扩增,中间序列根据454的测序结果设计引物,用sanger测序验证。

对于环状DNA基因组,使用“rolling-circle+inverse PCR amplification”,我在前面的推送里写过inverse PCR:【现学现卖】实验-PCR。首先用试剂盒rolling- circle amplification(Genomiphi; GE Healthcare)和random hexamers扩增核酸样品中的环状DNA基因组→用inverse PCR扩增全长,sanger测序。

(6)Phylogenetic analysis:选取可能的新病毒和它们在BLAST中相近的hits,以及与相近科、属病毒的氨基酸序列→MUSCLE和MAFFT进行多序列比对,选取比对好的进行→pairwise distance analyses和conserved amino acid analyses,之后进行→Maximum likelihood tree(RAxML预测参数,PROTGAMMA,Dayhoff similarity matrix parameters,用MEGA-midpoint rooting美化了无根树)和Sliding-window analyses。

图片中A是两个新病毒,B和C是用序列中两个片段分别建树的结果。

有的新病毒和已知病毒的亲缘关系较远

与其他病毒亲缘关系较远的病毒,B是sliding-window分析的aa序列一致性

(7)Nucleotide composition analysis (NCA):判断新发现的病毒的宿主。因为这个是研究生活污水的,所以要看病毒群体和新病毒的寄主是什么。

文章结构清晰,结果讨论部分充分分析了材料中包含的已知病毒种类和寄主的分布情况,以及实验中发现的新病毒的可能种类和可能寄主,并且结合NCA结果,讨论进化树中分支的可能原因等。

你可能感兴趣的:(【现学现卖·文献】病毒宏基因组分析相关文献(1))