来源
The genome of cowpea (Vigna unguiculata [L.] Walp.). Plant J
. 2019 Jun;98(5):767-782. doi: 10.1111/tpj.14349.
单位:University of California Riverside
豇豆(Vigna unguiculata),与绿豆(Vigna radiata)、小豆( Vigna angularis )同属于豇豆属 Vigna。
菜豆科家族Phaseoleae tribe (soybean, common bean, adzuki bean, mung bean, pigeon pea and cowpea)
豇豆在非洲驯化,从那里传播到各大洲,现在亚洲、欧洲、美国以及中南美洲的许多地方普遍种植。豇豆的优势之一是对恶劣条件,如炎热干燥的环境和贫瘠的土壤的高度恢复能力。
豇豆染色体数为 2 n = 22,之前估计的基因组大小为 613 Mb。其基因组与其他暖季豆科植物(菜豆科家族)具有高度共线性。之前使用二代+BAC组装了一个品系 IT97K-499-35 的碎片化草图。
结果
基因组大小估计
流式细胞仪估计大小640.6 Mb。
kmer评估大小 560.3 Mb。kmer 估计会因PCR 引入的错误导致的低拷贝 k-mer 的高估、基因家族中重复的 k-mer 和保守基序的计数不足以及 k-mer 的大量低估而带来不准确。因此本研究采用640.6 Mb。
采用stitching方法组装
PacBio测序91.7X,采用CANU、Falcon、 ABruijn等多种方法组装,再结合Bionano拼接合并。最后使用 通过使用ALLMAPs将44 003 个SNP锚定到11条假染色体上。锚定大小473.4Mb(91.1%)。GC含量与其他豆科类似。
评估组装质量:
- 约168M 149-bp paired reads比对率98.92%;
- 之前二代组装的129 000 contigs (500 bp or longer)比对率99.69%;
- 之前组装的178 000 个BAC比对率99.95%;
- 约157 000 transcripts比对率99.95%;
- 采用BLASR 将原始的PacBio 5.29 M reads比对率88.68%
修改豇豆染色体编号
通过豇豆和菜豆(普通豆)的同线性,修改染色体编号,并将部分染色体方向翻转。
基因注释和重复DNA
豇豆EST+根茎叶花种子RNAseq,拟南芥、普通豆、大豆、紫花苜蓿、杨树、水稻和葡萄的蛋白质序列,结合从头预测,共注释了 29 773 个蛋白质编码位点,以及 12 514 个可变剪接的转录本。
BUSCO评估95.9%。
重复序列注释估计 49.5% 组成:39.2% 的转座元件 (TE)、4% 的简单序列重复 (SSR) 和 5.7%未识别的低复杂度序列。
着丝粒区域是基于 455 bp 串联重复序列定义的,该重复序列先前被 FISH 鉴定为豇豆着丝粒中含量丰富。包含该序列的区域跨越 20.18 Mb(组装基因组的 3.9%)
(a)红线代表着丝粒区域,基于 455-bp 串联重复比对;(b) 每 1 Mb 的重组率;(c) 1 Mb 窗口中的基因密度;(d) 在 1 Mb 窗口中重复覆盖;(e) 1 Mb 窗口中的SNP密度。
SNP分布和着丝粒位置推断
豇豆遗传多样性
SNP和INDEL
将前人研究的 36 个不同种质的二代测序数据比对到上一版本的基因组,共得到 957 710 个SNPs(1M),为将它们定位在豇豆新组装的参考基因组上,由 SNP 位置及其每侧 60 个碱基组成的 121 个碱基序列与参考基因组进行 BLAST比对,保留Top1,99.83%能比对上参考序列上,其中包括 Illumina iSelect Consortium Array芯片中49 697 SNPs ,约35% (336 285 SNPs)和基因相关。表明 iSelect 芯片设计对基因的预期偏见是可信的。
BreakDancer v.1.4.5 检测结构变异,共17 401 个插入和 117 403 个缺失。插入比缺失数量少得多,这可能反映了当reads比对到参考基因组时软件识别插入的能力有限。
Vu03 上 4.2-Mb 染色体倒位的鉴定
10张遗传图谱用于锚定和定向scaffold到假染色体上,其中7个表明有一些大片段区域存在倒位,而其他三个显示在同一区域无重组,表明杂交中的两个亲本具有相反的方向。为找到倒位断点,用一些之前的材料测序的contig比对,与参考基因组相同的共线性好,相反方向的则在断点之前对齐。证实了染色体倒位和参考序列中两个断点的位置:36 118 991 bp(断点 1)和 40 333 678 bp(断点 2),用于包含 242 个基因的 4.21-Mb 倒置。两个断点区域的 PCR 扩增进一步验证了这种反向。
使用 368 份不同的豇豆种质,包括 243 个地方品种和 97 个育种种质(含有 iSelect 芯片数据),用于估计种质之间的倒位频率。总共有 33 个材料 (9%) 与整个区域的参考基因组具有相同的 SNP 单倍型,即可能是相同的方向,其中 3 个是地方品种(占该组地方品种的 1.2%),而其他 30 个是包括参考基因组在内的育种材料。表明该区域的参考基因组方向在地方品种中很少见,并且其频率在育种材料中有所增加。
另外,这部分区域很少有重组,说明在栽培×野生杂交的遗传图谱中,野生与栽培种质的方向相反。因为这个培育的亲本与参考基因组具有相同的单倍型,因此大概也具有相同的方向,该区域缺乏重组表明与参考方向相反的方向是祖先(野生)类型。
豇豆和小豆的比较表明 IT97K-499-35 和小豆基因组组装在该区域具有相反的方向,这与豇豆参考基因组在该区域相对于野生豇豆种质中保留的祖先状态发生倒位的猜想一致,并且出现在同类物种中。
Comparison between the Vu03 chromosomal inversion region in cowpea (y-axis) and its syntenic region in Vigna angularis (vigan.Shumari). inverted segment (~36-41 Mbp in the V. angularis chromosome)
倒位的直接影响是抑制杂合子的重组,导致倒位区域独立进化。携带倒转的三个地方品种B-301(独脚金抗性供体)、 B-171、TVu-53。
探索倒位是否与独脚金抗性相关,将先前鉴定的该性状 QTL 的图谱位置与倒位位置进行比较。独脚金小种 1 和 3 抗性的 QTL 位于与 Vu03 倒位不同的染色体上,排除了倒位作为这些抗性的基础。然而,注意到高粱基因Sobic.005G213600通过存在/缺失变异调节独脚金抗性 编码与豇豆基因Vigun03 g220400同源的磺基转移酶,其位于 Vu03 上的倒位区域内,并在根组织中高表达。因此,包含Vigun03 g220400的区域似乎可能以尚未发现的方式影响独脚金相互作用。
此外,豆荚数的 QTL位于倒位区域内。
与其他暖季豆科植物共线性分析
对豇豆及其近亲小豆( Vigna angularis )、绿豆( Vigna radiata )和普通豆( P. vulgaris )进行共线性分析。
两种豇豆的保守程度高于普通豆(菜豆)。六条豇豆染色体(Vu04、Vu06、Vu07、Vu09、Vu10 和 Vu11)在所有其他三个物种中基本上与单条染色体具有同线性。Vu02、Vu03 和 Vu08 也与其他两种豇豆属一对一关系,但与菜豆一对二关系,表明这些染色体重排是豇豆与菜豆不同的特征。剩余的豇豆染色体 Vu01 和 Vu05 具有可变的共线性关系,其他三个物种中的每一个都有两条染色体,表明这些染色体重排是豇豆属物种形成的更多特征。还应该注意的是,在这些物种之间具有一对二关系的大多数染色体与涉及着丝粒区域的易位一致。
在这些共线性关系的基础上,对小豆、绿豆和可能的其他豇豆采用修订后的豇豆染色体编号物种将是直接的,有利于促进目标性状的基因组信息从一个物种到另一个物种的相互转化。
(a) 小豆 (Va ; Vigna angularis );(b) 绿豆(Vr;Vigna radiata);(c)使用修改后的豇豆染色体编号系统的普通豆 (Pv; Phaseolus vulgaris )
重复元素和基因组扩张
先前的分析表明豇豆在系统发育上更接近绿豆 (Vr) 而不是红豆 (Va),尽管 Va 和 Vr 基因组的大小相对相似,豇豆分别大 11% 和 12%。
将 Vu 与 Vr 进行比较,94% 的 56 Mbp 大小差异可以通过 TE 的差异含量来解释,57% 可以通过单独的超家族Gypsy逆转录转座子的差异含量来解释。
和普通豆进行了类似的比较,虽然组装的基因组小( 473 Mb (9%)),但TE含量更高,45.2% versus 39%。有可能是P. vulgaris的 contig N50=0.395 Mb,而 Vu = 10.9 Mb。真正的P. vulgaris基因组比 Feulgen 密度测定法估计的要大得多,其中大部分 TE 影响了组装。
跨物种比较表明,豇豆基因组大小的差异在很大程度上可以通过 TE 含量来解释,尤其是Gypsy逆转录转座子的含量。这可能是由于最近的差异扩张或古代插入的差异保留造成的。
豇豆基因家族变化
为了鉴定豇豆中拷贝数显着增加或减少的基因,来自豆科植物信息系统的 18 543 个科 ( https://legumeinfo.org/search/phylotree和https://legumeinfo.org/data/public/Gene_families/) 进行了分析。该集合的构建是为了捕获源自豆科植物分类深度的基因,基于直系关系和豆科植物和外群物种的每个物种同义位点率。这些科包括 14 种豆科植物,其中 6 种来自菜豆族(大豆、普通豆、红豆、绿豆、木豆和豇豆)。在豇豆基因成员相对于每个豆科植物物种的平均成员处于最高百分位的 185 个基因家族中,这些家族包括以下超家族组中的几个:NBS-LRR 抗病基因、各种受体样蛋白激酶、防御素、核糖体蛋白、NADH-醌氧化还原酶成分。所有这些家族都出现在基因芯片中,它们可能通过旁系同源基因的跳跃错配而扩张或收缩。
在18 543个豆科植物基因科中,有2 520个科没有豇豆基因成员,这与菜豆科其他6个已测序基因组的平均无成员家庭数(3 057个)相当。2520 个“无豇豆”家族富含以下超家族:UDP-糖基转移酶、枯草杆菌蛋白酶样丝氨酸蛋白酶、几个激酶超家族、几个可能的逆转录转座子相关家族、FAR1 相关蛋白和 NBS-LRR 抗病家族。
SAUR 样生长素超家族在豇豆中包含 138 个注释基因,而在红豆和绿豆中分别为 90 和 52 个。NBS-LRR 超家族包含 402 个注释基因,而红豆和绿豆中分别为 272 和 86 个。
多器官增大候选基因的鉴定
作物驯化通常涉及人类收获的特定器官的大小增加。最近有研究使用源自驯化×野生杂交的重组近交系(RIL)群体在 Vu08 上鉴定了与豇豆器官大小增加相关的基因组区域。该区域包含一组关于豆荚长度、种子大小、叶长和叶宽的 QTL(CPodl8、CSw8、CLl8、CLw8)。
这里使用参考基因组序列用于进一步研究这个驯化热点,跨越 2.21 Mb 包括 313 个基因。鉴定了普通豆基因组中的共线区域,其中最大的区域位于普通豆染色体 8 (Pv08) 上。该区域总共包含 289 个常见的豆类合成基因,然后将其与 Schmutz等人提供的与驯化相关的常见豆类基因列表进行比较。这两个列表的交集仅包含一个基因Phvul.008G285800,这是一个与豇豆Vigun08 g217000相对应的用于增加种子大小的普通豆候选基因.,该基因编码组氨酸激酶 2,在多种豇豆组织中表达,包括根、种子、豆荚和叶。拟南芥直系同源AHK2 ( AT5G35750.1 ) 是一种细胞分裂素受体,已被证明可调节植物器官大小等。因此Vigun08 g217000是进一步研究的候选基因。