测序有关问题

1.为什么要在上机测序之前做PCR扩增?

测到的reads数取决于flowcell上长了多少cluster(1个模板链扩增出一簇分子),有多少cluster,理论上就得到多少reads(SE测序一个cluster得到一条序列,PE测序就是一对序列);flowcell上长多少cluster是通过文库上机浓度控制的,文库本身浓度较高,则稀释到一定浓度后再上机,以达到适中的cluster数量,一个文库如果DNA含量足够,浓度足够,可以上机多次;PCR-free文库由于不做PCR扩增,所以对样品本身的DNA含量要求比较高,这样建出的文库才能达到上机浓度和DNA量的要求。

2.上机之前做的PCR扩增与测序时做的桥式PCR有啥区别?

桥式PCR的目的是为了形成cluster,单个DNA分子反应的信号难以检测,桥式扩增后形成cluster,测序时才能捕捉到信号;

上机之前做的PCR扩增,作用见问题1;

3. 什么是接头

测序之前,要对待测的DNA片段进行包装,包装成以下格式:

正向接头(P5 + 正向引物) + 插入片段+ 反向接头(反向引物 + index/barcode + p7)

4 . 接头的作用

接头有三个作用:

一:接头的不同体现在index的不同,index的目的是为了区分样本;一台测序仪不可能就产出一个样本的数据量,多个样本一块测......

二: 在flowcell上有P5和P7两种已知序列,在接头上加P5和P7,使得read通过碱基互补固定在flowcell;

注:芯片有8条通道,在通道的内表面做了专门的化学修饰,把2种DNA序列(P5和P7)通过共价键链到玻璃表面;

三:在接头中加测序引物结合位点:测序一般要从引物下游几十个bp以后,信号才逐渐稳定,能够读出来,所以测序引物要在所测片段的上游;所以要把测序引物结合位点加到接头上;

5.什么时候加接头?

对不平整的read进行修复,5’端磷酸化,3’端加A之后加接头;

注意:有可能3’端加不上A也可以加上接头;

6. 接头与原始数据

先讲一下原始数据是怎么来的,对于一条打断的DNA片段,从5’到3’测序,分三步:

第一步:测read1;

read1引物结合位点开始测,如果打断的read小于150bp,则会测穿,测到接头;

这里需要注意的一点是read1对应两种接头,这两种接头的差别是相差一个A,因为在加接头之前,有的3’端加上了A有的没有加上A,这就导致了测穿时对应两类接头;

第二步:测index;

由read2引物结合位点开始测,测6-8个碱基,即index;

第三步:测read2;

以正向链为模板,再合成其互补链,洗掉正向链,从互补链的5’到3’测,当打断的read小于150bp,会测到接头;

我们拿到的原始数据是包含接头的,read中至多只有一端有接头 (测序由测序引物开始测,5’端肯定不包含接头,只有3’端当测穿时才可能包含接头);

7. 接头过滤

Flexbar在过滤接头时,默认已知的接头序列与待过滤read之间最小的overlap为5bp,当overlap>=5bp时会去掉接头;

flexbar仅仅去掉一个接头,当原始数据出现接头自链(read一端有两个接头) 的情况时,不能过滤干净,也就导致了后续比对质量很差;

你可能感兴趣的:(测序有关问题)