SNP的概念和特点

SNP的概念和特点

单核苷酸多态性(single nucleotide polymorphism,SNP),主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种。占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均每500~1000个碱基对中就有1个,估计其总数可达300万个甚至更多。

SNP所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的转换(transition)或颠换(transversion)所引起,也可由碱基的插入或缺失所致。但通常所说的SNP并不包括后两种情况。

理论上讲,SNP既可能是二等位多态性,也可能是3个或4个等位多态性,但实际上,后两者非常少见,几乎可以忽略。因此,通常所说的SNP都是二等位多态性的。这种变异可能是转换(C T,在其互补链上则为G A),也可能是颠换(C A,G T,C G,A T)。转换的发生率总是明显高于其它几种变异,具有转换型变异的SNP约占2/3,其它几种变异的发生几率相似。Wang等的研究也证明了这一点。转换的几率之所以高,可能是因为CpG二核苷酸上的胞嘧啶残基是人类基因组中最易发生突变的位点,其中大多数是甲基化的,可自发地脱去氨基而形成胸腺嘧啶。

在基因组DNA中,任何碱基均有可能发生变异,因此SNP既有可能在基因序列内,也有可能在基因以外的非编码序列上。总的来说,位于编码区内的 SNP(coding SNP,cSNP)比较少,因为在外显子内,其变异率仅及周围序列的1/5.但它在遗传性疾病研究中却具有重要意义,因此cSNP的研究更受关注。

从对生物的遗传性状的影响上来看,cSNP又可分为2种:一种是同义cSNP(synonymous cSNP),即SNP所致的编码序列的改变并不影响其所翻译的蛋白质的氨基酸序列,突变碱基与未突变碱基的含义相同;另一种是非同义cSNP(non- synonymous cSNP),指碱基序列的改变可使以其为蓝本翻译的蛋白质序列发生改变,从而影响了蛋白质的功能。这种改变常是导致生物性状改变的直接原因。cSNP中约有一半为非同义cSNP。

先形成的SNP在人群中常有更高的频率,后形成的SNP所占的比率较低。各地各民族人群中特定SNP并非一定都存在,其所占比率也不尽相同,但大约有85%应是共通的。

SNP自身的特性决定了它更适合于对复杂性状与疾病的遗传解剖以及基于群体的基因识别等方面的研究:

1、 SNP数量多,分布广泛。据估计,人类基因组中每1000个核苷酸就有一个SNP,人类30亿碱基中共有300万以上的SNPs.SNP 遍布于整个人类基因组中,根据SNP在基因中的位置,可分为基因编码区SNPs(Coding-region SNPs,cSNPs)、基因周边SNPs(Perigenic SNPs,pSNPs)以及基因间SNPs(Intergenic SNPs,iSNPs)等三类。

2、 SNP适于快速、规模化筛查。组成DNA的碱基虽然有4种,但SNP一般只有两种碱基组成,所以它是一种二态的标记,即二等位基因(biallelic)。由于SNP的二态性,非此即彼,在基因组筛选中SNPs往往只需+/-的分析,而不用分析片段的长度,这就利于发展自动化技术筛选或检测SNPs.

3、 SNP等位基因频率的容易估计。采用混和样本估算等位基因的频率是种高效快速的策略。该策略的原理是:首先选择参考样本制作标准曲线,然后将待测的混和样本与标准曲线进行比较,根据所得信号的比例确定混和样本中各种等位基因的频率。

4、 易于基因分型。SNPs 的二态性,也有利于对其进行基因分型。对SNP进行基因分型包括三方面的内容:(1)鉴别基因型所采用的化学反应,常用的技术手段包括:DNA分子杂交、引物延伸、等位基因特异的寡核苷酸连接反应、侧翼探针切割反应以及基于这些方法的变通技术;(2)完成这些化学反应所采用的模式,包括液相反应、固相支持物上进行的反应以及二者皆有的反应。(3)化学反应结束后,需要应用生物技术系统检测反应结果。

SNP与突变的关系:
1、多态性是一个群体概念,多态性指这个差异占群体的1%以上。否则就叫突变(小于1%)。
2、SNP是多态性中的一种,只是进一步限定了差异只是单碱基。
3、SNP一般来说,是全部体细胞一样的基因型(除开嵌合体)。
4、突变一般不是一个个体全部细胞的变化。
5、如果突变发生在生殖细胞,则可以遗传,但是只要这个突变群没有达到总群体的1%,它就只是一个突变株/系。达到了1%就是多态性了。

SNP检测方法:
目前已有多种方法可用于SNP检测,如根据DNA列阵的微测序法、动态等位基因特异的杂交、寡聚核苷酸特异的连接、DNA芯片以及TaqMan系统等。但不管哪一种方法,首先必须进行靶序列的扩增,然后才能进行其它检测。

传统的SNP检测方法是采用一些已有的成熟技术,如DNA测序、限制性酶切片段长度多态性(RFLP)、单链构象多态性(SSCP)、等位基因特异的寡聚核苷酸杂交(ASO)等。这些技术虽在某种程度上能完成对 SNP的检测,但由于它们必须通过凝胶电泳进行检测,因此,距快速、高效、自动化的目标还相差甚远。传统的RFLP只能检测到SNP的一部分,测序技术既费时费力,又不易实现自动化,而且DNA链的二级结构还容易造成人工假相,使测序结果出现偏差,不适宜于SNP的检测;SSCP则很难满足自动化的需要,难以大规模开展工作。因此,这些方法均未被广泛采用。

DNA芯片技术是近年来新开发的一种DNA序列变异检测工具。DNA芯片(DNA chip),也称生物芯片(biochip),其大小与计算机上的CPU芯片相似,约1 cm2或更大些,以玻璃、硅、聚丙烯等作为载体基片,芯片上铺了一层肉眼看不见的DNA纤维“地毯”,即具有特定碱基序列的探针。待测基因经提取后,被切成长短不一的片段,经荧光化学物质标记后,注射到嵌有芯片的载片上。由于DNA和探针杂交的程度与荧光强度相关,因此通过激光扫描,即可根据荧光强弱测出被检测序列的变异。

目前已有多家公司开展了对芯片的研究,例如美国的Affymetrix公司、NEN生命科学公司等。前者曾开发出BRCA1(乳癌基因1号)芯片、 p53芯片等,后者则在1张玻璃芯片上集成了多达2400个已知基因。此外,Research Genetics公司新近开发了1个集成有1500个SNP的DNA芯片,它涵盖了人类基因组全部24条染色体,所提供的信息量至少等于或优于目前常用的300~400个微卫星标记的图谱,检测时只需0.5μg的DNA样品就可进行1次全基因组的扫描。

另外Transgenomic公司的WAVE?核苷酸片段分析系统是高通量且较为准确可靠的筛查未知、已知SNP的新方法。利用Transgenomic公司的WAVE?核苷酸片段分析系统进行SNP检测平均每个样本的费用为$0.5。

转载自生物实验网

你可能感兴趣的:(c,工作,生物,工具,transition)