微生物基因组重测序得到的SNP、indel、sv等分析结果如何进行后续的实验验证?

答:

通过全基因组重测序一般能够发现SNPs、SV、CNV、InDel等多种遗传变异,不同的变异类型,其验证方法也各不相同。

① SNPs可以通过PCR扩增包含该SNP位点的区段,并进行测序;或采用SNPs分型检测的方法验证。

② CNVs可通过Real-time PCR对存在拷贝数变异的片段进行扩增,并根据CT值估算不同个体的拷贝数变化倍数。

③ 小的SVs可通过PCR扩增和测序辨别,而大的SVs则需要通过亚显微方法发现,如FISH等。

小片段的InDel,可通过PCR扩增,利用Sanger法测序进行验证。

Q2:SNP、Indel注释的结果包含哪些必要信息?

A2:对于SNP、Indel,根据参考基因组注释信息,注释突变所在的位点,分为exonic、intronic、intergenic、3’UTR 和5’UTR等。 对于在exonic区域的SNP和small Indel位点,将会对突变位点对于蛋白翻译的影响进行注释,把SNP分为nonsynonymous(非同义突变)、synonymous(同义突变)、stopgain(翻译提前终止) 、stoploss(终止密码子缺失)等几类;Indel分为frameshift、nonframeshif、stopgain 、stoploss等。

Q3: 泛基因组和核心基因组之间的关系?

A3:泛基因组即某一个群体(通常是同属)的中所有个体基因的总和,其中全部个体都含有的基因称为核心基因组(core genome);在部分菌株中存在的基因称为非必须基因组(dispensable genome)或者附属基因(accessary genome)。

Q4:什么是GC skew?

A4:GC skew = (G - C)/(G +C),是用来衡量G和C相对含量的指标,如果G含量>C含量则GC skew的值为正值,反之则为负值。

在大多数细菌基因组中,前导链(leading strand)和滞后链(lagging strand)在碱基组成上存在很明显的不同,前导链富含G和T,而滞后链中的A和C更多一些。打破A=T和C=G的碱基频率发生的偏移,被称之为“AT(AT-skew)”和“GC(GC-skew)”。由于通常GC偏移比AT偏移发生的更明显,所以习惯上更多地只考虑GC偏移。

因为GC偏移在前导链中是正值而在滞后链中为负值,所以GC偏移值是前导链起点、终点以及转变成滞后链的信号,反之亦然。这使得GC偏移成为在环状染色体(circular chromosomes)中标记起点和终点的一个有用的工具。

更多案例解答:

对于含有质粒的细菌基因组项目,如何进行分析比较好?mp.weixin.qq.com有2株大肠杆菌(细菌),如何通过测序的方法知道二者的差异?mp.weixin.qq.comSNP分析得到的SNP位点与预期不符,是什么原因?mp.weixin.qq.com

你可能感兴趣的:(微生物基因组重测序得到的SNP、indel、sv等分析结果如何进行后续的实验验证?)