文章来源:Identification of Laying-Related SNP Markers in Geese Using RAD Sequencing
阅读者:樊云鹏
摘要
产蛋性能是鹅生产的一个重要经济性状。由于产蛋性能的遗传力较低,因此制定一种标记辅助选择(MAS)策略具有重要意义。确定与目标性状相关的序列变异是量化MAS的前提,但目前对鹅基因组的研究较少,这严重阻碍了鹅产蛋性状遗传标记的识别。最近开发的限制性位点相关DNA(RAD)测序是识别大规模单核苷酸多态性(SNP)和降低基因组复杂性的一种可能方法,而不需要参考基因组信息。在本研究中,我们开发了一种用于检测鹅产蛋相关SNP的混合RAD测序策略。构建了两个DNA库,每个库由10个具有高估计育种值(HEBV)和低估计育种值(LEBV)的个体的基因组DNA组成。共从42,291,356个序列中获得139,013个SNP,其中18,771,943个序列为LEBV序列,23,519,413序列为HEBV序列。在LEBV和HEBV两群体中,通过个体AS-PCR基因分型进一步验证了在两个DNA池中具有不同等位基因频率的55个SNP。55个SNP中有10个在这两个群体中表现出明显的等位基因分布。这10个SNP在492只鹅群中进一步进行了基因分型,以验证其与产蛋量的相关性。结果表明,10个SNP中有8个与产蛋量有关。此外,线性回归分析表明,SNP记录-111407、106975和112359涉及到影响产蛋率的多基因网络。我们使用IPCR扩展在候选RAD标记的两侧未知区域。对获得的序列进行BLAST检索,得到鸭和鸡的同源基因。克隆5个新的基因,这些基因含有候选的与产蛋相关的SNP,分别是膜相关鸟苷酸激酶(MAGI-1)、KIAA 1462、Rho GTPase激活蛋白21(ARHGAP 21)、酰基-CoA合成酶家族成员2(ACSF 2)、胃动蛋白2(ASTN 2)。综上所述,我们的数据表明,8个SNP和5个基因可能是鹅产量数标记辅助选择的候选标记或靶点。
引言
鹅的繁殖力不稳定,孵化性能差,易受遗传、营养、环境、疾病等多种因素的影响。由于生殖遗传力较低,传统的选择方法难以改善繁殖性状。标记辅助选择(MAS)是改善低遗传力性状的有效途径。然而,探索性状连锁序列变异或功能成因需要发展MAS技术。单核苷酸多态性(SNP)是最丰富的遗传标记类型,它的遗传稳定性为研究基因组区的遗传奠定了基础。然而,目前还没有关于鹅基因组序列的数据,这极大地阻碍了该物种在分子水平上对经济性状的研究。
候选基因方法是识别与重要经济性状相关的遗传标记的常用方法。Chen等人(2012年)在万江白鹅的催乳素(PRL)内含子2中发现了30多个SNP,在催乳素受体(PRLR)第10外显子中发现了5个SNP。这些多态性与产蛋率显著相关。赵等人(2011)发现两个促性腺激素释放激素(GnRH)和PRL的SNP分别与乌龙鹅的繁殖性状有关。Zhang等人(2013)在紫鹅的不同阶段证明了黄体生成素(LH)、PRL及其受体的基因表达,丁等人(2006)用抑制消减杂交(SSH)技术鉴定了产蛋鹅肝脏中许多差异表达基因。这些基因包括卵黄生成素I、apoVLDL-Ⅱ、乙醇胺激酶、G蛋白γ-5亚基和白亮氨酸-tRNA合成酶。最近,郭等人(2011年)采用了类似的方法,在产蛋期和产蛋期找到了几个差异表达的基因,包括PRLR、雌激素受体1和抗穆勒激素受体II。
新一代高通量DNA测序技术加速了研究动物基因组研究的速度。该技术在全基因组测序、靶再测序,转录组测序中得到了广泛的应用。最近,Xu等人(2013)利用短读取测序技术(Illuma)鉴定了在产蛋鹅和雏鹅卵巢组织中294个上调和278个下调基因的572个差异表达基因。不幸的是,由此产生的转录组仅提供有限的编码区域的限制性位点信息,与非编码区域相比,这些区域的核苷酸多样性要低得多。
限制性位点相关DNA(RAD)测序是一种新发展起来的快速大规模SNP发现方法,可以有效地降低基因组的复杂性。它是一种经济有效的SNP发现和基因分型方法。它允许较小的研究小组,或研究尚未拥有参考基因组的生物体的小组,进行“基因组范围的研究”。RAD测序法已成功地应用于多种生物体,其中包括:格皮、鲑鱼、欧亚海狸、喉和虹鳟鱼、鲟鱼和菜籽。
在本研究中,我们应用RAD测序,在鹅基因组中发现了新的SNP。通过比较两个具有最低估计育种值(LEBV)和最高估计育种值(HEBV)的DNA池之间的等位基因频率来选择用于选择产卵性能的SNP。使用等位基因特异性PCR(AS-PCR)进行个体基因分型,首次在LEBV和HEBV群体中证实了候选SNP-连锁模式,并在492只鹅群体中进一步验证。克隆了含有与产蛋相关的SNP的新基因。
材料和方法
道德声明
所有实验均经南京农业大学动物保护和使用委员会审核批准,并按照“实验动物管理条例”(中国,1988年)进行。所有的努力都是为了尽量减少采血过程中的不适。
动物和样品制备
本研究以江苏丽华畜牧有限公司养殖场的492只扬州鹅为研究对象。在试验过程中,鹅尽可能被喂以添加青草或水草的稻谷。这种饲料是在白天提供的,那时鹅被放生到屋外的一个空地上。在整个研究过程中,鹅暴露在自然光照和温度下。将产蛋鹅分别饲养在不同的笼里,以记录整个产蛋期的总产蛋量。用含液泡的肝素钠从翼静脉采集血样。
产蛋性能与分组
在34周的产蛋期内,每天记录所有个体的总蛋数。表1总结了实验种群的平均蛋数。利用全同胞和半同胞的信息计算了个体的种数估计值(EBV)。从492只鹅中选出10只EBV最低和最高的个体,分别命名为LEBV组和HEBV组。RAD文库的制备及序列分析
使用全血DNA试剂盒(OmegaBio-TEK,Doris,USA)遵循制造商的说明从血液中提取全基因组DNA。使用Thermo Scientific Nanodrop 2000分光光度计评估每个个体样品的DNA浓度。所有DNA样品的终浓度调整为100 ng/ul。A260/280和A260/230比值均在标准范围内。每10个个体混合等量的基因组DNA准备LEBV和HEBV的两个DNA池。用限制性内切酶EcoRI消化基因组DNA。共构建了2个复用的测序文库,其中每个DNA样本被分配一个独特的核苷酸序列标识符 (MID)进行条形码编码。用IlluminaHiSeq 2000进行单端(101-BP)测序。
序列分析与产蛋相关突变检测
从3’端将原始序列修剪到90个核苷酸,保证了97.5%以上核苷酸的质量值在Q30以上(等于0.1%的测序误差)。通过序列相似性,利用USTACKS为每个RAD位点产生独特的候选等位基因,将修整后的读数聚类成读取标签(以下简称RAD-标签)。对于自然种群,在该步骤中允许两个最大碱基对错配。然后,使用RAD-标签在SNP调用的默认参数下,使用Ustack将其折叠到集群中。对每个SNP,LEBV和HEBV池的等位基因频率差异进行比较。选择两个池间等位基因分布显著不同的SNP作为群体进一步验证的候选位点。
鹅群体产蛋相关突变的验证
在LEBV和HEBV组中,共选择了55个SNP进行进一步的个体基因分型。不同等位基因分布的SNP在LEBV和HEBV中的分布在492只鹅的种群中进行了验证。采用AS-PCR技术对群体进行基因分型。为了提高PCR扩增的特异性和对等位基因的可靠识别,在3’端的第三碱基处引入了一个额外的错配碱基对。用Primer Premier 5软件(美国加利福尼亚州Palo Alto,Premier Bio-ft),按照Liu和Hayashi的方法设计了AS-PCR引物。
引物和PCR产物的长度在S1表中显示。在20μL反应中利用两个特异性引物进行基因分型,其中包括约50 ng模板DNA、5μL 2X PCR Taq酶(加拿大)、1μL特异引物和普通引物 (10μmol)(中国深圳)。扩增条件为:94°C预变性3 min,32次扩增(94℃ 30 s,45°C-72°C 30 s,72°C 30 s),72°C扩增5 min。用3.0%琼脂糖凝胶电泳分离PCR产物。
基于产卵相关SNP的新基因克隆
利用反向PCR(IPCR)结合比较测序技术,进一步克隆了含有证实的产蛋相关SNP的功能基因。IPCR是以自连接环状DNA为模板,在已知序列上设计的反向引物扩增未知序列(相邻已知序列)的方法。根据RAD标记序列设计引物,本工作中使用的引物列在S2表中。用KPNⅠ、HindⅢ、SAC I和NOCⅠ(中国北京NEB的所有酶)在37℃下消化6小时,共消化5微克基因组DNA。然后用等体积的苯酚∶氯仿∶异戊醇(25∶24∶1)混合物处理消化的样品,除去水相,用乙醇沉淀DNA并通过离心收集。在16°C条件下过夜,在1600 U/ml T4 DNA连接酶(NEB,中国北京)存在下,以0.5~1.0μg/ml的浓度自连接DNA。用苯酚∶氯仿∶异戊醇(25∶24∶1)提取连接混合物,用乙醇沉淀,再悬浮于无菌蒸馏水中,浓度为50ng/ul。巢式PCR扩增RAD标记两侧未知序列。巢式聚合酶链反应(Nest PCR)在50 ml中,50ng制备的DNA,每种引物2μ1(10μmol)和25μl LATaq酶(TAKARA,大连)。扩增条件为:98°C预变性30 s,32次扩增(98°C 10 s,45°C-72°C 30 s,72°C 4 min),72°C扩增7 min。第一轮PCR后,用双蒸馏水稀释PCR产物1:100。1微升稀释液作为第二轮扩增的模板。引物W(外引物对)和N(内引物对)分别用于第一次和第二次PCR扩增。在1.5% Tris/硼酸/EDTA(TBE)琼脂糖凝胶上进行PCR反应。PCR条带在紫外光下被去除,并按照供应商的建议使用凝胶提取试剂盒(Omega Bio-Tek,Doraville,USA)进行纯化。根据制造商的方案,使用TA克隆试剂盒(TransgenBiotech,北京,中国)将纯化的DNA片段直接连接到噬菌粒TA载体(pasy-T3质粒)中,然后转化为感受态细胞(转基因生物技术)。在含氨苄西林50 mg/ml的LB琼脂上进行转化。选择菌落取样,在2.0 Eppendorf管中悬浮于1ml LB培养基中,在37°C下生长16小时。将靶DNA测序(GeneWiz,苏州,中国)。使用DNAman软件包进行多序列比对(版本8.0;Lynnon Bio-soft,加拿大魁北克)。使用BlastX(http://www.ncbi.nlm.nih.)进行数据库搜索GOV/BLAST)。.
统计和数据分析
采用独立卡方检验,检测LEBV与HEBV DNA池RAD-标记等位基因频率的差异。对于发现与产蛋相关的SNP,用Bonferroni校正估计了5%的I类总错误率的显着性阈值,给出了
其中αBon是Bonferroni调整后的P值,α是未校正的P值,nInformation是SNP的个数。Fisher’s精确检验用统计语言R版本2.11.1比较LEBV和HEBV的等位基因频率。个体的产蛋期估计育种值(EBV)计算如下:
其中
是EBV。bi是ith亲缘关系的表型信息,包括个体、全同胞和半同胞的表型表现。bi是Pi的偏回归系数。b’是偏回归系数的向量。P是表型值向量。
用PowerMarker V3.25计算基因型频率、等位基因频率、基因多样性、杂合性、多态信息含量(PIC)和哈代-温伯格平衡定律拟合优度的卡方检验 。所有数据均以平均±SD表示。
单因素方差分析(SPSS for Windows,20.0版;IBM-SPSS,芝加哥,IL)比较不同基因型的平均蛋数。采用Duncan的多重范围检验(SPSS for Windows,Version20.0)评估其显着性。所有显着性水平为p<0.05的单性状组合均被纳入进一步的多重标记分析。采用线性回归方法(SPSS for Windows,20.0版)。采用线性回归方法,分析多标记组合和两种数量性状模式(加性模式:PAa(PAA PAa≈(PAA + Paa)/2)/2)和显性模式(PAa≈PAA或Paa)。
结果
RAD测序
RAD测序产生3.8GB的数据,包含超过4229万个单端读取,每个读取长度为90bp(表2),RAD-标签在组内对齐和组间,不匹配的数目为1。对于LEBV和HEBV,每组RAD标签的数量分别为884827和942117。相对应每组测序深度分别为17.33×和20.47×,平均测序深度为18.9×。过滤后步骤共计检测到139,013个SNP。只有分布在第6位到第90位的SNP才被选择用于进一步分析,因为该区域以外的多态性更容易受到常见的测序错误的影响。在所有SNP中,338是三等位基因。其余138,675 SNP是双等位基因,包括52.97%的转换和47.03%的颠换,提供了转换/颠换(TS/TV)比率1.10。在转换中A/G取代数(38,549)几乎等于C/T替代数(34,226),而G/T(31,622)颠换超过A/C(12,384)、A/T(13,078)和C/G(8,816)颠换。与产蛋相关的SNP的发现
对RAD测序的138,675个SNP进行Chisquare检验,分析LEBV与HEBV池等位基因频率的差异。经Bonferroni调节后,467个SNP显著(p<3.69×10−7)。采用等位基因特异性PCR方法对所有LEBV和HEBV鹅进行个体基因分型。用该方法可获得55个SNP的稳定基因型(S1表)。进一步的个体基因分型结果表明,55个单核苷酸多态性中有10个等位基因频率在LEBV和HEBV队列中有显着性差异 (p<0.00024~4.19×10−8) (表3)。
实验鹅群体产蛋期相关单核苷酸多态性的验证
通过AS-PCR对492只鹅群体进行了基因分型 (图1)。利用Powermark V3.25软件对每个SNP进行遗传多样性分析。如表4所示,10个SNP的基因多样性(HE)、杂合性(H0)和多态性信息内容(PIC)分别为0.4394-0.4991、0.0830-0.533和0.3161-0.3746。记录135849的SNP具有最高的基因多样性、杂合度和PIC。PIC常用作分子标记遗传多态性的指标。在本研究中,10个SNP的PIC值范围为0.25-0.5,表明这些SNP表现出中间水平的多态性。7个SNP显示与Hardy-Weinberg平衡(HWE)的显著偏离(p<0.05),而其它三个SNP,包括记录-135849、记录-88247和记录-135057均在HWE中(p>0.05)。
如表5所示,记录-106975的GG和GA基因型产蛋量显著高于AA基因型的(p<0.01)。GG基因型与GA基因型在产蛋量上无显著差异(p>0.05)。
SNP记录-134172具有AA基因型鹅产蛋量明显高于AT基因型鹅(p<0.01),TT基因型与AA和AT基因型无显着性差异(p>0.05)。
记录-112359,TT基因型的产蛋量显著高于GG基因型(p<0.01)。TG基因型与TT基因型和GG基因型相比,产蛋量差异无显着性(p>0.05)。
记录-106582,AA和CA基因型的产蛋量显著高于GG基因型,但CA基因型与AA基因型之间差异无显着性(p>0.05)。
记录-111407,AA型和TA型鹅产蛋量显著高于TT型鹅(p<0.01)。AA和TA基因型的产蛋量差异不显著(p>0.05)。
在记录-88247中,AA基因型的产蛋量显著高于GG基因型(p<0.01)。AA基因型产蛋量显著高于GA基因型(p<0.05)。
对于记录135057,AA和GA基因型的产蛋量显著高于GG基因型(p<0.01)。
在记录-130775中,AA和AG基因型的产蛋率高于GG基因型(p<0.01)。
记录-135849和记录-130652的基因型与产蛋量之间无显著相关性(P>0.05)。结果表明,这8个单核苷酸多态性(纪录-106975,记录-134172,记录-112359,记录-106582,记录-111407,记录-88247,记录-135057,记录-130652,记录-130775)与产蛋性状显著相关(p<0.01)。这些新鉴定的SNP分别存放在NCBI dbSNP数据库中,登录号分别为1714766361、1714766362、1714766363、1714766364、1714766365、1714766367、1714766368和1714766370。
产蛋性能多标记回归分析
在单标记组合中,我们发现8个SNP对鹅卵数有显著影响。采用线性回归模型分析了多个显著标记对鹅产蛋性能的影响。8个SNP参与分析,以确定该性状的基因组合或网络(图2)。建立了两个网络,其中一个由两个标记组成,另一个由三个标记组成。记录-111407和记录-106975被包括在两个标记网络中(图2A)。预测值(在矩形中左边)与相应的实际值(在矩形中为右)有很高的相关性(r=0.98,r=0.81)。记录-111407和记录-106975分别对产蛋性能表现出加性和显性效应。用TT基因型替代GG/GA,可使平均蛋数减少9.45。记录-111407,A到T的转换将导致卵数下降7.71。三个标记网络引入了一个额外的标记记录-112359,它对产蛋率表现出加性效应(图2B)。T代G使卵数减少5.16。
携带产蛋相关SNP的新基因的鉴定
在上述8个候选基因的基础上,对鹅的相关功能基因进行了鉴定。首先,利用候选RAD标签对NCBI公共数据库进行BLAST搜索,获取相应的序列。然而,由于90-bp的RAD标记太短,无法进行有效的比对,因此没有获得明显的匹配序列。因此,我们使用IPCR来扩展候选RAD标签两侧的未知区域。延伸的序列被用于进一步的BLAST。因为没有可用的参考基因组信息对于鹅,我们主要使用检索的鸭或鸡序列用于鹅基因注释。
如表6和表S2所示,我们在记录-106975的基础上克隆了2,488 bp的侧翼序列。在鸭(taxid:8835)和鸡(taxid:9031)的全基因组数据库中,DNA序列与鸭和鸡序列的同源性分别为89%和65%。利用NCBI Map Viewer工具,根据记录-106975序列,获得了膜相关鸟苷酸激酶(MAGI-1)基因。对于记录-134172,IPCR获得了1,964bp的侧翼序列长度。DNA序列与鸭和鸡的同源性分别为94%和79%。根据记录-134172的序列鉴定了KIAA1462基因。
记录-112359的侧翼序列长度为2,164 bp。DNA序列与鸭和鸡的同源性分别为93%和79%。Rho GTPase激活蛋白21(ARHGAP 21)基因是根据记录-112359序列鉴定的。
对于记录-106582,通过IPCR获得2,623 b长度的侧翼序列。DNA用鸭和鸡序列分别显示81%和65%的同源性,根据记录-106582的序列鉴定了ACYCoA合成酶家族成员2(ACSF2)基因。
对于记录-111407,通过IPCR获得了1,508bp的侧翼序列长度。DNA 序列与鸭和鸡序列的同源性分别为80%和72%。 根据记录-111407序列鉴定Astrotactin2(AS TN2)基因。
记录-106975, 记录-134172, 记录-112359, 记录-106582和记录-111407的派生序列已存入GenBank(http://www.ncbi.nlm.nih.gov/genbank))),登录号分别为KP271033, KP271035, KP271036, KP271032和KP271034。
对记录-88247、记录-135057和记录-130775,通过IPCR获得3,100 bp、1,300bp和4,711 bp的侧翼序列。3个DNA序列与鸭序列的同源性分别为90%、93%和92%。记录-88247和记录-135057的DNA序列与鸡的同源性分别为78%和82%。我们没有从鸡的全基因组shotgun contigs数据库(分类号:9031)中找到记录-130775相应的序列。
讨论
基于池的RAD排序
在本研究中,我们采用了一种经济有效的比较RAD排序方法来发现与鹅产蛋性能有关的SNP。在没有参考基因组的动物中挖掘SNP有许多研究。由于没有参考基因组可供鹅使用,RAD测序提供了一种成本效益高的方法,可以在鹅基因组中发现大量的SNP。
转换和颠换(ts/tv)的比值是DNA序列演化的一般性质。对于已经研究的所有基因组序列,人们注意到,转换发生的频率在比颠换高,因为转换不需要改变构象。在本研究中,鹅的TS/TV比率为1.10,其符合转换偏倚的规则。
下一代测序的浅测序深度是决定从序列数据生成基因型调用的质量和测序成本的主要因素。Catchen等人(2011)模拟RAD-seq过程,以测试USTACKS识别三叶松粘背植物基因座的能力。他们证明,平均测序深度为20×和40×,是可靠的下一代测序测序深度,有较低的错误率。在本研究中,LEBV组和HEBV组的平均测序深度分别为20×和17×,表明在深度上得到了可靠的测序结果。
与产蛋相关的SNP的发现
采用两步策略,将基于池的RAD测序与个体验证相结合,在较大的种群中发现与产蛋相关的SNP。个体池的下一代测序(NGS)在基因组范围内的SNP发现中往往更有效,即使考虑到测序错误,也能提供更准确的等位基因频率估计。DNA池NGS的成本效益更高的方法在各种研究中得到了广泛的应用,证明了DNA池的NGS允许在单个SNP上估计等位基因频率,具有较高的准确性,但文库的构建和测序工作相对较少。在我们的研究中,通过比较LEBV和HEBV DNA池中估计的等位基因频率,我们确定了467个与产蛋量相关的SNP。在适用于AS-PCR的467个SNP中,有55个在LEBV和HEBV队列中进行了个体基因分型。10个SNP在两组间有不同的等位基因分布,阳性率为18.2%。与以前的研究相比,Turner等人(2010年)在蛇纹石和非蛇纹石土壤中检测到拟南芥两个DNA库之间的840万个多态性。在840万个多态性中,96个在土壤类型之间的等位基因频率差异大于80%。同时,在96个多态性的基础上发现了81个基因。目前还没有统一的标准来评估基于池测序的阳性率多态数。然而,Gautier等人(2013) 基于池和个体的RAD测序数据评估等位基因频率估计的准确性。结果表明,DNA池测序是估算大量SNP位点等位基因频率的一种经济有效的方法。朱等人(2012)实验证明,DNA池测序是一种非常强大和成本效益高的技术,可以在全基因组范围内发现SNP。
在本研究中,通过与小规模代表性个体的比较研究,进一步验证了10个候选SNP在产蛋量较大的鹅群中的存在。8个SNP对蛋数有显著影响,阳性率为80%,小规模代表性比较与大规模验证具有较高的一致性。我们的结论是,基于池的RAD测序结合极具代表性的个体比较,是识别感兴趣性状的相关SNP的一种成本效益高的方法。
蛋产量的关联分析
提高产蛋性能对于鹅的生产具有重要的意义。然而,由于繁殖力较低,表型选择对提高产蛋率的效率较低。对所涉及的遗传标记或基因进行鉴定,有助于提高这一低遗传力的性状。许多研究人员一直致力于研究鹅繁殖性状的遗传机制。姜等(2011)检测到PRL基因的5"侧翼区SNP,以寻找影响皖西白鹅繁殖性状的遗传标记。Chen等人(2012年)揭示了PRLR第10外显子中SNP与皖江白鹅卵子性能的显著关联。Xu等人(2013)进行了新转录体组装和基因表达分析,鉴定了大量与卵泡发育和生殖生物学相关的基因,包括胆固醇侧链裂解酶和多巴胺β羟基。Kang等人(2014)证实了烯醇ASE1(ENO1)基因的表达与孕前鹅相比,在产卵鹅的卵巢表达高,在四川白鹅的卵巢卵泡中鉴定出ENO1基因的表达谱。在我们的研究中,我们清楚地证明了8个SNPs对鹅的产蛋性状有显著的影响。线性回归进一步揭示了产蛋数的两个多重SNP网络,涉及记录-111407、106975和112359。模型预测与观测值有较好的一致性,验证了这些SNP对蛋数的组合效果。以前的研究也报道了多个基因或标记可以用来预测性状。Jiang等人.(2009)通过对多个标记物的回归分析,证实了两个基因或三个基因网络显著地影响了肉牛的5或8个性状。Ghazalpour等人(2006)利用微阵列和遗传标记数据构建了小鼠肝脏基因共表达网络,并研究了几个基因模块与小鼠体重的关系。因此,这8个SNP,特别是记录-111407、106975和112359的组合可以是用于选择鹅产蛋性能的有希望的分子标记。我们使用David生物信息学资源6.7和UniHI在线工具进一步探讨了MAGI-1,ARHGAP 21和ASTN 2的功能联系,分别来自记录-111407,106975和112359。分析结果表明,这些基因在任何信号通路或基因网络中都没有直接关联。然而,MAG1-1和ARGAP21可以直接或间接地由分层(SFN)基因调节。据报道,在包括卵巢癌、子宫乳头状浆液癌、子宫平滑肌瘤、卵巢颗粒细胞瘤和类固醇细胞瘤的各种类型的人类疾病中,SFN的表达经常丢失。Wang等人(2012)表明SFN的表达与雌激素和孕酮受体(ER和PR)呈负相关。Khongmanee等人(2013)显示SFN在胆管癌细胞无凋亡耐药中起重要作用。大量的证据表明MAGI-1和ARHGAP 21在疾病和生殖功能中发挥作用的可能性很大。
基因克隆
利用IPCR扩增RAD标记,结合鸭(TABID:8835)和鸡(TABID:9031)公共数据库的比对,共获得5个新基因。与以往的研究相比,我们没有检测到FSHβ,PRL,GnRH,LH和 PRLR等明确的生殖相关基因。相反,我们发现三个新基因,MAGI-1,ARHGAP 21和KIAA 1462,可能在产蛋过程中起着重要的作用。实际上,RAD-测序是一种通过酶切来减少基因组表达的方法。这种方法得到的SNP仅代表整个基因组的一小部分。本研究从LEBV和HEBV DNA池中分别获得884,827和942,117个RAD标记。估计平均覆盖率占整个基因组的~6.96% (1.1GB,Anas platyrunchos),因此,上述已知的产蛋相关基因很有可能不能被列入所获得的基因列表中。
对于MAG1-1基因,Kranjecetal(2014)证明在HPV-阳性细胞中可促进细胞-细胞接触,具有抑制细胞增殖和促进的功能凋亡。ARHGAP21优先用作GTPase活化蛋白(GAP),CDC42调节ARP2/3复合物。它位于细胞核、细胞质或核周区域,参与细胞-细胞粘附形成和细胞迁移。KIAA1462是一种位于细胞核、胞浆和质膜上的蛋白编码基因。与KIAA1462相关的疾病包括动脉疾病和冠状动脉疾病。Akashi等人(2011)鉴定KIAA 1462为一种新的蛋白,位于细胞与细胞的连接处,并得出结论:KIAA 1462在内皮细胞与细胞的连接中的积累依赖于VE-cadherin介导的细胞-细胞粘附。卵母细胞的生长是由膜细胞和颗粒细胞支持的,它们在卵母细胞周围建立了动态和高度组织的细胞层。卵母细胞和颗粒细胞之间的缝隙连接是复杂的,并且在卵母细胞生长的支持、减数分裂停滞的维持以及整个卵泡上皮的信号转导中起主要作用。一个众所周知的与细胞-细胞连接的建立相关的效应是抑制细胞增殖。以上证据表明,这些基因(MAGI-1、ARHGAP 21和KIAA 1462)极有可能影响颗粒细胞的增殖和凋亡,进而干扰卵母细胞的生长。此外,KIAA1462在减数分裂重组中起着非常重要的作用。Chowdhuryetal(2009)发现,在人的重组率中KIAA1462是与变异相关的六个基因位点中的一个。减数分裂中的失败或错误可能导致不育、流产或出生缺陷。
另外两个克隆基因包括ACSF 2和ASTN2.ACSF 2是Acyl-CoA合成酶(ACS)家族成员,参与脂肪酸合成和三羧酸循环。ACSF 2是一种线粒体基质酶,位于线粒体基质中。ACSF 2基因在细胞代谢过程中的特征与线粒体功能有关,暗示ACSF 2基因可能在生殖过程中起一定作用。ASTN 2在移行性小脑颗粒神经元中高表达。它在神经元的功能中起着重要的作用。Lesch等人(2008)鉴定ASTN 2基因参与细胞粘附和神经细胞通讯。Ahn等人(2010)发现一种来自ASTN 2基因内含子的新的微RNA,并优先在性腺中表达。
结论
我们将基于池的RAD测序策略应用于鹅的SNP发现。通过个体关联分析验证了8个与产蛋相关的SNP。以产蛋相关的SNP为基础,克隆了5个鹅的新基因。我们的数据表明,这些SNP或基因可能是标记辅助选择动物的候选标记或靶标。这些方法可以在其他生产动物中进行,可以提供给人类更高效、更好的动物食用/使用。我们的研究还表明,分子方法可以有目的的使用(而不是)简单地确定一些生理级联的分子机制。事实上,这方面的更多研究将有助于各种动物的生产。