二代测序之SNV基础知识笔记总结

二代测序之SNV基础知识笔记总结

文章目录

  • 二代测序之SNV基础知识笔记总结
    • SNV基础知识
      • SNVs
      • Mutation vs. Variant[变异和突变]
    • 不同层次的突变
      • DNA:
        • 1.编码DNA(coding DNA) c.
        • 2.非编码DNA(non-coding DNA) n.
        • 3.基因组(genomic)g.
        • 4.线粒体(mitochondrial)m.
        • 5.环形DNA(circular DNA):o.
      • RNA:r.
      • Protein(蛋白质):p.
      • 不同变异的写法
        • 1. Substitutiion 单个碱基的替换
        • 2. Deletion 删失
          • ①单个核苷酸 one nucleotide
          • ②多个核苷酸 several nucleotides【三种写法】
        • 3.Duplication 重复
        • 4.Insertion 插入
        • 5.Inversion 倒置
        • 6.Conversion 转换
        • 7.Deletion-insertion 删除插入
        • 8.Alleles 等位基因
        • 9.Sequence repeats 重复序列
      • RNA层面的改变
      • 蛋白质层面的变化
      • 参考视频资料:

SNV基础知识

SNVs

  1. Single Nucleotide Variants 单核苷酸突变体 ==> DNA序列的改变

  2. Short Nucleotide Variants 短核苷酸突变体(<50bp)==> 结构突变

    ①拷贝数突变【数量的改变】

    ②位置突变

Mutation vs. Variant[变异和突变]

​ 1.变异:改变主要与疾病相关

​ 2.多态性:非导致疾病的变化,在一个群体的改变达到1%甚至更高(SNP单核苷酸多态性)

​ 3.Variant变化(该词偏中性)指两个序列有差异有变化,不一定代表和疾病有关系

不同层次的突变

DNA:

1.编码DNA(coding DNA) c.

二代测序之SNV基础知识笔记总结_第1张图片

根据+,-确定内含子的位置,区分5‘UTR和3’UTR。

2.非编码DNA(non-coding DNA) n.
3.基因组(genomic)g.

​ e.g. g.12158663A>G :在基因组该位置参考基因组的A替换为G

4.线粒体(mitochondrial)m.
5.环形DNA(circular DNA):o.

RNA:r.

Protein(蛋白质):p.

不同变异的写法

1. Substitutiion 单个碱基的替换

Format:

“prefix(前缀)”“position_substitued(替换的位置)”“reference_nucleotide(参考的核苷酸)""">""new_nucleotide(新的核苷酸)"

e.g. g.123A>G

!!!替换使用的是“>”,但是蛋白质层面上就不能用">">

2. Deletion 删失

Format:“prefix”“position(s)_deleted”"del"

e.g. g.123_127del【在123-127位置上出现缺失】

①单个核苷酸 one nucleotide

NG_012232.1:g.19del【序列:AGAATCACA ==> AGAA_CACA :在基因组第19的位置上出现了T的删失】

②多个核苷酸 several nucleotides【三种写法】

e.g. AGAATCACA ==> AGAA___ CA

1° NG_012232.1:g.19_21del:AGAATCACA ==> AGAA___ CA

2° NG_012232.1:g.19_21delTCA

3° NG_012232.1(NM_004006.1):c.183_186+48del【以编码DNA为参考位置,“+48”为显示在编码区域】

3.Duplication 重复

定义:指一个或多个核苷酸的拷贝直接插入到该序列的3‘端的原始拷贝中,而且dup应是串联的!!!

Format:“prefix”“position(s)_duplicated”"dup"

e.g. g.123_345dup

4.Insertion 插入

定义:一个或多个核苷酸被插入,并且这些插入片段不是序列5’端直接的拷贝

Format: “prefix”“positions_flanking”“ins”"inserted_sequence"

e.g. g.123_124insAGC

5.Inversion 倒置

定义:原来的核苷酸序列上的多个核苷酸被互补链的核苷酸序列所代替

Format:“prefix”“positions_inverted”"inv"

e.g. g.123_345inv

比如说:CATCAGCCT ==> CACTGACCT,标注为NC_000023.10:g.32361330_32361333inv,其中TCAG和CTAG(反过来)是互补的。

6.Conversion 转换

定义:一段DNA的碱基被基因组内的另一端碱基所代替,且这两段的碱基长度可能不相同。

Format:“prefix”“positions_converted”“con”"positions_replacing_sequence"

e.g. g.123_345con888_1110

7.Deletion-insertion 删除插入

定义:一个或多个核苷酸被一个或多个其他的核苷酸代替,但不是替换,倒置或者转换

Format:“prefix”“positions_deleted”“delins”"inserted_sequence"

e.g. g.123_127delinsAG

8.Alleles 等位基因

定义:一个染色体上的一组相应的变异,因为人类染色体组为二倍体,在基因座上有两个等位基因,一个等位基因来自父母的一方

描述方法:

(1)当两个变异都出现在一个基因中且都在一条染色体上(顺式):“g.[variant1;variant2]”

(2)当两个变异都出现在一个基因中但是在不同的染色体上(反式):“g[variant];[variant2]”

(3)当两个变异都出现在一个基因中但是不知道在哪一条染色体上:“variant1(;)variant2” i.e. 不使用"[]"

9.Sequence repeats 重复序列

定义:一个或多个核苷酸片段(重复单元)出现了多次

Format:

①unique repeat单个重复:“prefix”“position_first_nucleotide_first_repeat_unit”“repeat_sequence”[copy number"] e.g. g.123CAG[16] CAG重复了16次

②mixed repeat混合重复:“prefix”“range_repeated_sequence”“repeat_sequence_unint1”[“copy number”]“repeat_sequence_unit2”[“copy_number”] e.g. g.123_191CAG[19]CAA[4]

如果不确定重复多少次,使用(),例如g.8932A(18_23) ,意味着可能重复18-23次。

RNA层面的改变

二代测序之SNV基础知识笔记总结_第2张图片

蛋白质层面的变化

二代测序之SNV基础知识笔记总结_第3张图片

参考视频资料:

https://www.bilibili.com/video/BV1gC4y1W7e1?share_source=copy_web

欢迎关注我的公众号呀!
二代测序之SNV基础知识笔记总结_第4张图片

你可能感兴趣的:(生物信息学)