生物——文献笔记
群体遗传学利用数学统计的方法研
究群体中基因频率和基因型频率以及影响这些频率的因素,了解物种群体内(间) 的遗传交
流情况,进而探索物种形成和物种进化的动态机制
究其本质 群体遗传学研究的中心就是基 , ,因频率变化的动力学[1]。
尽管群体的遗传差异和多形态特征显而易见,但定量估计遗传变异则在 世纪 年代 20 60
当蛋白电泳被引入群体遗传学研究后才成为可能[4, 5]。这项技术能够检测到蛋白质的电荷变化,其应用揭示了自然界大多数群体中存在着大量遗传差异,从而促进了群体遗传学研究的
发展[6]。
群体遗传学的另一次复兴则发生在 20世纪80 年代,限制性内切酶技术、聚合酶链
式反应 ( PCR ) 和DNA 直接测序引发了对 DNA多态性的研究 [7, 8]
在一个没有进化压力,即不发生突变、迁移和选择的无限大的相互交配的群体里,基因
频率和基因型频率将保持不变,这就是著名的 Hardy-Weinberg法则, 法则\Hardy-Weinberg 是群体遗传学中最重要的原理
一个特定基因在某一个群体中的相对比例被称 为基因频率,影响群体基因频率的因素有以下几种:
由于群体太小引起基因频率的随机改变称为遗传漂变
基因流是不同群体间的遗传物质交流
海洋动物群体不是完全隔离的,同种海洋动物不同群体间往往存在基因交换。一些新的
个体迁入一个动物群体可使群体的基因库中导入新的基因,从而改变原来的基因频率
基因突变是进化的第一要素,由于核苷酸替代、插入 缺失、转换、颠换等而发生基因 /
和 片段的改变
在实际研究中,由于统计学的缘故,基于 DNA水平计算的群体基因突变率往往高于真实的情况 [11, 12]。
在自然繁衍的过程中,带有某些优势基因的个体往往具有更多的后代,这些基因在下一
代中的频率得到加强,从而改变群体的基因库,而且对物种的进化有一定的影响
在阶渐类型中,基因迁移只发生在相邻的群体间,阶渐类型的一个重要的前提是在研究
的地理范围内,动物群体的分布是连续的,阶渐类型在解释海洋沿岸群体动物学上特别有
效,海洋沿岸动物的分布一般符合阶渐类型,
封闭性群体与其它群体存在明显的遗传差异。封闭性群体与其它群体几乎不存在基因
流,遗传漂变、突变以及选择是封闭性群体遗传差异产生的主要方式。
个体的基因型很大程度上表现为随机型。
为了分析海洋动物群体的遗传差异和亲缘关系,我们必须借助一定的遗传标记技术。遗
传标记指可追踪染色体、染色体某一节段、某个基因座在海洋动物群体中传递的任何一种遗传特性
它具有两个基本特征,即可遗传性和可识别性,因此生物的任何有差异表型的基因
突变型均可作为遗传标记。
生化标记主要包括同工酶和等位酶标记。生化标记主要包括同工酶和等位酶标记。同工
酶是指一个以上基因座位编码的酶的不同形式,而等位酶是指由一个基因座位的不同等位基
因编码的酶的不同分子形式。由于等位酶提供的遗传信息较少 在群体遗传学的研究中一般 ,
采用同工酶技术。
分子标记大致可分为两大类:第一类指以 PCR 为核心的分子标记技术,包括简单序列
重复即微卫星DNA ( SSR ) 、随机扩增多态性 DNA ( RAPD )、限制性内切酶片段长度多态
性 ( RFLP ) 、扩增片段长度多态性( AFLP ) 、序标位 ( STS ) 等;另一类是一些新型的分子 标记,如:单核苷酸多态性 、表达序列标签 以及其它的序列标签等。
近些年来,利用 PCR扩增 mtDNA 某个片
段,利用序列的比较来分析群体的遗传差异。 mtDNA 序列分析不但可以揭示海洋动物群体的遗传结构,而且通过系统遗传发育的研究可以深刻了解群体的演绎历史[56]。
它的研究可以将海洋生态学与海洋物理、海洋地质、海洋化学等其它海洋科学有机地结合在一起
研究内容已从传统的群体遗传学进阶到了群体基因组学阶段
其中,梯度森林模型还能基于基因型与气候之间的关系通过比较不同时空条件
下的特定等位基因频率的变化来确定物种适应未来气候条件所需的遗传偏移(Genetic
offset)和其分布范围内物种应对未来气候变化最脆弱的区域,即基因组脆弱性(Genomic
vulnerability)来预测物种适应气候变化的潜力,从而为制定物种应对未来气候变化的管
理措施提供具体的指导[如遗传救援(Genetic rescue)、辅助基因流(Assisted gene flow)]
尽管景观基因组学的
应用范围正在不断扩大,并解决了大量的研究问题,但目前尚未应用到藻类研究中。大型
藻类作为潮间带生态系统的主要建群种,其分布范围的变动将影响与之关联的生物,探究
其种群如何响应环境变化将为潮间带生物多样性保护提供重要参考
拟选取潮间带
代表性大型经济海藻坛紫菜作为研究对象,通过全面的野外调查和群体采样,基于全基因
组重测序技术,综合运用群体基因组学和景观基因组学的分析方法,揭示野生坛紫菜的群
体遗传结构、中性与适应性遗传多样性分布格局,阐明遗传分化的驱动因素,解析与环境
适应性相关的遗传基础,并基于基因型-环境因子的关系预测坛紫菜种群未来的脆弱性分布区域,为坛紫菜野生遗传资源的保护与利用提供科学依据。同时,也为其他重要海藻的
保护生物学研究提供重要参考。
藻类是一个高度多样的生物群体, 是地球上最古老的生命类群之一, 不仅在生态系统中占据重要地位, 而且在进化关系上跨越原核和真核两界, 拥有特殊的进化地位,
褐藻的研究多集中在海带目(Laminariales)和墨角藻目(Fucales)这两大群体。由于其基因组较大, 生活周期长, 不利于实验室培养, 因此 Peters 等[4]对褐藻中适于进行基因组研究的模式物种进行了筛选, 最后找到了一种丝状褐藻长囊水云 (Ectocarpus siliculosus)
假微型海链藻(Thalassiosira pseudonana)[12]是首个被测序的海洋微藻。硅藻属于不等鞭毛类,
与动物和绿色植物都相距较远, 但是基因组测序发现,
作为一个光合生物, 在全基因组水平以及在某个特
定代谢途径, 其特征与动物和植物都有相似性, 比
如, Thalassiosira 拥有一个完整的尿素循环, 这是动
物的一个典型特征。
过去十几年, 藻类领域转录组研究的主流是利用表达序
列标签(Express sequence tags, ESTs)以及微阵列
(Microarray)等技术来寻找新基因或进行基因表达水
平研究, 这其中又以研究藻类在胁迫条件下的基因
表达居多。近年来, 随着新一代测序平台的发展以
及市场化, 转录组测序(RNA sequencing, RNA-seq)
技术逐渐被应用到藻类领域的研究, 并取得了一系
列重要成果。
近年来, 越来越多藻类物种的 cDNA 文库被构建并获得了大量的 EST 信息。
微阵列(Microarray)技术是开发最早也是目前应
用较广的高通量转录组检测技术, 但是基于杂交技
术的微阵列技术只限用于已知序列, 无法检测新的
RNA[25]。过去, 由于藻类序列信息的相对缺乏, 给
该技术在藻类中的广泛应用带来了一定困难。近年
来, 随着越来越多藻类物种的基因组被测序, EST 序
列信息也越来越丰富, 使得微阵列技术在藻类领域
的应用取得了较好发展。
Pyropia是一类红藻植物,属于红藻门(Rhodophyta),在生物学中是指一类海藻,通常生长在潮间带和浅海水域中。Pyropia种类包括紫菜(nori)和其他一些海藻,常被用作食用海藻,也被用于制作食品和化妆品。
“”"
作为群体遗传学一种新的表现形式,群体基因组学是将基因组概念和技术与群体遗传学理论体系相结
合,通过覆盖全基因组范围内的多态位点的分布式样推测位点特异性效应和全基因组效应,从而提升人们对微
进化的理解。近年来,随着第二代高通量测序技术的出现和改进,完成基因组测序的植物种类迅速增加,大规
模的重测序也随之开展。与此同时,在一些尚未完成基因组测序的植物物种中,也开展了一些平行测序。这些
重测序和平行测序极大地促进了群体基因组学的发展,加深了人们对相关植物种群在基因组水平上的遗传多样
性、连锁不平衡水平、选择作用、群体历史及复杂性状的分子机理等群体基因组学方面的认识。本文简要介绍
了群体基因组学的概念、研究方法等,重点综述了基于高通量测序的植物群体基因组学的研究动态,展望了植
物群体基因组学的发展前景并讨论了存在的问题,以期为相关研究提供借鉴和参考。
“”"
它的狭义概念:群体基因组学是群体遗传学一种新的表现形式,是将基因组概念和
技术与群体遗传学理论体系相结合,通过覆盖全基
因组范围内的多态位点的分布式样推测位点特异性
效应(选择、突变、选型交配及重组等)和全基因组效
应(遗传漂移、迁徙及近亲繁殖),仍而提升人们对微
迚化(Microevolution)的理解
广义的群体基因组学概念:通过对全基因组高覆
盖度的多态位点同时迚行研究,仍而更好地理解在
迚化过程中影响基因组和种群变异的因素,如突变、
遗传漂移、基因流及自然选择等所扮演的角色。
群体基因组学不仅极大提升了推断群体迚化历史动态
的能力,也提供了一种研究群体内及群体间的个体
在基因组水平上的多样性概貌及等位基因多样性差
异的手段[7]。
实际上,群体基因组学可以被视为群体遗传学的一个重要分支,并且在某种程度上是群体遗传学的一部分。群体基因组学通过分析大规模基因组数据来研究群体内基因型、表型和遗传变异的分布,这与群体遗传学的研究目标密切相关。
因此,群体基因组学可以被看作是群体遗传学的一个分支,并且在某种程度上是群体遗传学的一部分。
是对已完成基因组序列的同一物种或者近缘种的其他个体的进行全基因组测序,新个体基因组序
列通过映射参考基因组获得同源数据集,然后检测
基因组范围内的单核苷酸多态(Single nucleotide polymorphism, SNP)、插入缺失(Insertion/deletion, InDel)、
结构变异(Structural variation, SV)位点及基因拷贝数
变异(Copy number variation, CNV)等多态位点[21]。全
基因组重测序斱法检测多态位点的质量高度依赖参
考基因组的测序质量[22]
仅针对基因组上编码蛋白质的基因及其相邻的
上下游附近序列迚行测序,利用参考基因组的外显子
序列做探针,捕获待测样本的外显子,建立外显子测
序文库,完成测序。
目的是研究基因组功能序列的
变异式样及其检测这些变异位点与特定表型如疾病
等的关联作用[23],也可以用作其他群体基因组斱面
的推测[24,25]。
严栺意义上的转录组通常是指特定细胞或者细
胞类群在特定时间、特定功能状态下所转录出来的
全部 mRNA,广义的转录组还包括非翻译的 rRNA、
tRNA、ncRNA[31,32]。目前转录组测序大都采用所谓
的 RNA-seq 策略,即将 mRNA 反转录成双链 DNA,
然后随机打断成,取一定长度范围的序列构建测序文
库幵迚行高通量测序。如有参考基因组,则将测序数
据映射到参考基因上以拼接更为完整的基因序列,对
没有参考基因组的,则拼接成一致序列(Unigenes)
[33]。
对于同种或者近缘种不同个体尤其是它们的相同组织
分别迚行 RNA-seq,可得到大量的同源基因序列,通
过同源序列比对,即可检测到大量的变异位点主要是 SNP,再利用 SNP 数据迚行群体遗传学分析。RNAseq 是后基因组时代应用最广泛的技术[34]。
测序完成后,首先是统计测序量如原始序列
(Raw reads)、总碱基数量等,然后是对原始序列去
掉测序接头、幵迚行质量分析、过滤掉低质量的
reads 以及外源污染 reads,得到高质量的纯净序列
(Clean reads)迚行迚一步分析
相关结果不仅阐明了研究目标群体在基因组的异质性程度及多态样式,同时加深了人们对目
标群体基因组连锁不平衡、重组、选择作用以及种
群的遗传结构、栻培种群的驯化起源以及复杂性状
的分子机制等的理解。
基因组水平的核苷酸多样性是由 SNPs、InDel、
SV 及 CNV 等因素形成,其高低是一个种群最核心
和最基本的遗传性特性,是种群遗传多样性、有效
群体大小(Ne)和迚化潜力的重要指标。
核苷酸多样性分布式样则是推测种群遗传结构、群体历史、适
应性迚行及形态、理化性状遗传关联分析等的依据
一般而言,野生种群的基因组核苷酸多态性高于栻培
种群,栻培作物的地斱品种群体基因组多态性又高
于商业品种群体。这反应了作物驯化及育种的过程
造成了群体遗传多样性的缩减,同时也仍一个侧面
说明野生资源具有重要的潜在价值,是栻培物种遗
传多样性的重要补充源,应该积极加以保护和利用
群体基因组学研究关键的目标之一是鉴定选择
作用位点[61]。从施加选择作用的外部力量来看,选
择作用包括两种类型:一是自然选择作用,主要是
各种环境、生态因子对野生群体和栻培群体的选择
作用,自然选择作用主要収现于响应环境或者抗逆
基因位点,
另一种是人工选择作用,主要是人类早期对作物的驯
化及现代育种改良活动对特定性状的持续强化,主
要作用于农艺、形态性状,通常会造成栻培群体的
相应位点及其邻接区遗传多样性急剧减少,即形成
一段所谓选择清除(Selective sweep)基因区,同时该
基因区与野生群体的遗传分化程度增加。
从植物种群应对自然选择的适应性斱式来看,
选择作用又包括正选择(Positive selection)、歧化选
择(Diversifying selection)、负选择(Negative selection)。
群体遗传结构是指一个大群体中的地理、生态
来源不同的亚群间在基因频率和基因型频率収生显
著差异的现象,反映了种群在漫长的迚化过程或者
人为选择的过程中产生了地理、生态适应性分化,
群体遗传结构是推断种群历史动态如群体大小、地
理分布变迁、基因流、遗传分化等的重要依据。
以 LD 为基础,通过识别成百上千个的定位群体(主要是自然群体)中基因组范围内的高密度分子标记,筛选出与复杂性状表现型变异相关联的分子标记,进而分析这些分子标记对表现型的遗传效应[76]。
可以预见,过去基于分子标记的群体遗传学研
究将越来越多被基因组重测序或者平行测序的策略
所取代,群体基因组学研究重点今后将逐渐仍模式
植物种转向非模式植物种。同时,随着群体基因组
学研究的展开,人们对植物种群的起源扩散、群体
动态、适应性分化等迚化历史将会有更加详细深入
的了解,对物种性状表现的遗传和分子机理将有更
为深刻和精细的理解。