测序忘了发给你拼接结果?不用慌,咱们自己来!

最近因为之前的测序company又菜又马虎,忍无可忍,常换常新。在适应新公司送样方式和测序结果等等的时候,学到了一些东西,也是今天想要分享的两点:

1.最最常用的核酸检测技术:Sanger双脱氧终止法

2.最最实用的技能:测序结果的序列拼接


先来说说这个双脱氧终止法是如何引起我的注意的?是我在阅读新公司的测序软件使用说明时,看到了这样一句话:

红色标注的这句

让我想起了曾几何时,与老师和师兄讨论实验时,常常被质疑,为什么你的测序结果里没有你的引物序列?

这就要从这个双脱氧终止法的原理开始说起了……long long ago……

emm具体来说就是,Sanger等人在1977年提出这个测序方法,其原理是:核酸模板在核酸聚合酶、引物、四种单脱氧碱基存在条件下复制或转录时,如果在四管反应系统中分别按比例引入四种双脱氧碱基,只要双脱氧碱基掺入链端,该链就停止延长,链端掺入单脱氧碱基的片段可继续延长。如此每管反应体系中便合成以共同引物为5’端,以双脱氧碱基为3’端的一系列长度不等的核酸片段。反应终止后,分四个泳道进行电泳。以分离长短不一的核酸片段(长度相邻者仅差一个碱基),根据片段3’端的双脱氧碱基,便可依次阅读合成片段的碱基排列顺序。

有点复杂,大概意思就是说在体系中加入dNTP和ddNTP混合物,遇到dNTP无所谓,遇到ddNTP则终止,感兴趣的朋友可以看以下两张图。

图1
图2

(图片来自于:https://wenku.baidu.com/view/81a4d06fb84ae45c3b358cb6.html)

大概原理了解了,我们的产物在测序的过程中,在模板指导下,聚合酶不断将dNTP加到引物的3’-OH末端,使引物延长,合成出新的互补的DNA链,所以!双脱氧终止法测序是从引物3'端之后第一个碱基开始测序,没有测序的引物序列哦~


然后,我们再来讨论一下,当你拿到公司发给你的测序结果,没有拼接好的那种,该怎么办?

首先,第一步当然还是问明白,为啥不给我拼接,以后还给不给拼。毕竟时间就是金钱,我的朋友们,该偷懒的时候就可以偷懒一下。

第一时间和销售沟通

其次,我们也要懂得自己动手,丰衣足食,求人不如求己,先学学怎么搞定序列拼接吧。

简易版(DNAMAN):

下载一个DNAMAN,之前的文章里好像有下载地址,记不清咯,或者自己百度下吧。

导出就是export,是或否自己点开看看就知道啦

得到你想要的序列,File ——》Save as ——》选择格式保存即可。

进阶版(DNAstar 之 Seqman):

DNAStar是分子生物实验室常用的序列分析软件。该软件由EditSeq,MegAlign,GeneQuest,MapDraw,PrimerSelect,Protean,SeqMan七个模块组成,今天要说的就是七分之一的Seqman,剩下6个我还没学hhh。

SeqMan主要用于多序列的拼接,可以将成千上万的序列(最多可以支持64000多序列)装配成contigs,同时在拼接前,可以修整质量差的序列以及清除自动测序的序列结果中的污染序列或载体序列,提供完善的编辑和输出功能。

1.简单的拼接,类似于上面提到的DNAMAN

这里需要注意的一点是:如果你导入的是seq文件,那么只能看到序列结果;如果你导入ab1文件,你可以看到序列+峰图(推荐)

根据自己需要选择即可
这里我选的是seq,选错了,后面又重新选了ab1文件

然后点击左上角的Assemble,就得到了拼接之后的Contig:

可以根据峰图手动校正序列哦
接下来就是导出序列啦

2.手动恢复被Seqman自动修正的序列末端

SeqMan根据trace数据的质量和载体序列在装配之前可以自动地进行末端修整

当我们想看到原始的全部序列时:

找到小黑棒
有黄色背景色的部分即为系统修整部分

3.去除载体序列

在序列比对的过程中,测序结果含有一定的载体序列有时会造成我们的困扰,所以在拼接之前我们可以去除载体序列,对结果进行一定的优化。

在Seqman里,默认有一些载体序列:

查看系统里的载体序列
如果没有你使用的载体,·自行添加
添加新载体时需要注意的地方
最后可以导出,和未去除载体序列比对下

ok,seqman大概就这些,更多详情可参考:https://wenku.baidu.com/view/2510ca7965ce05087732133d.html

你可能感兴趣的:(测序忘了发给你拼接结果?不用慌,咱们自己来!)