第二章 微型裸腹溞孤雌溞和有性雌溞RNA-seq与iTRAQ蛋白分析
2.1 前言
微型裸腹溞(Moina micrura)隶属节肢动物门(Arthropoda)、甲壳纲(Crustacea)、鳃足亚纲(Branchiopoda)、双甲目(Diplostraca)、枝角亚目(Cladocera)、裸腹溞科(Moinidae),是一种具有丰富的形态和生态可塑性的世界性分支动物,分布在世界的温带、热带和亚热带地区(Murugan 2006)。微型裸腹溞是鱼类幼体的理想活饵料和经济上重要的甲壳类动物,可作为评估水生生态系统水质的指标(Arauzo and Valladolid 2003)。
与其他枝角类一样,微型裸腹溞也行周期性的孤雌生殖,能够诱导微型裸腹溞进行有性生殖的条件多种多样,包括密度、温度、食物质量和数量以及光照周期等(Fernando et al 2007)。Crosetti和Margaritora 研究表明微型裸腹溞的有性生殖可能是由温度和光照周期以及竞争诱导(Crosetti and Margaritora 1987)。Fernando等发现培养体积是其进行有性生殖的重要诱因(Fernando et al 2007)。Jana和Pal确定食物质量对微型裸腹溞的生长和繁殖有很大的影响(Jana and Pal 1985)。微型裸腹溞休眠卵的产生是在有雄性存在且食物供应不足的高密度培养条件下,高密度虽然可以诱导雄性的产生,但并不是诱导休眠卵产生的充分的应激因子;类似地,单纯的食物限制并不会诱导雄性和休眠卵的产生,是需要高密度的协同作用(Osman et al 2013)。
在生态学中,微型裸腹溞这种生殖可塑性倍受关注,但对其生殖转化调控的分子机制的认识还很缺乏。使用分子工具探究微型裸腹溞某些分子单元在生长和生殖调控中的潜在作用是很有必要的。
高通量测序技术可以分析一个有机体在响应环境压力过程中全部分子谱的变化。转录组测序(RNA-Seq)是一种转录定量技术,且已经被成功地应用于基因注释、表达分析和转录本分析(Yang et al 2011)。同样,蛋白组是一种用于解决基因组序列无法提供基因功能注释的高通量方法,是确定基因功能的最直接的方法(Ahsan et al 2008)。同位素相对标记与绝对定量技术(iTRAQ)相对于低通量蛋白组学方法(如传统的二维凝胶方法)是第二代无凝胶蛋白组学,可以更精确的进行蛋白定量。目前还没有发现有对环境胁迫下参与生殖转化的蛋白质进行蛋白质组学分析的研究。
本章的目的是进一步研究与枝角类生殖转化有关的关键基因及其蛋白质产物。为了实现这一点,以微型裸腹溞作为模型,使用RNA-Seq和iTRAQ技术鉴定有性生殖雌溞(SF)和孤雌生殖雌溞(PF)之间差异表达的mRNA和蛋白质。这些研究将为枝角类生殖转换分子机制的研究提供重要信息。
2.2 材料与方法
2.2.1 样品准备
微型裸腹溞采集于南湖(中国,武汉),并在实验室通过单克隆培养建立纯系。健康且有活力的孤雌生殖雌溞已经在实验室培养1年,培养温度设置为25℃,光照周期为光:暗=12 h:12 h,饲喂食物为小球藻。根据微型裸腹溞的生物学特征,当种群密度达到一定水平就会发生生殖转化,使用显微镜确定它们的生殖状态,分别收集健康有活力的有性生殖雌溞(SF)和孤雌生殖雌溞(PF)(图2-1),并将它们放入冻存管中(100只/管)。用无菌纯水将冻存管中的样品清洗2~3次,吸干水分后放入液氮中速冻,之后存放于-80℃。本研究分别采集6管有性生殖雌溞和孤雌生殖雌溞进行转录组测序和蛋白组测序。
2.2.2 主要仪器和试剂
1)主要仪器:梯度PCR仪L96G(杭州朗基科学仪器有限公司),微量移液器(Eppendorf),凝胶成像分析系统(Syngene),DYY-III型电泳仪及水平电泳槽(北京六一仪器厂),台式低温高速冷冻离心机(Eppendorf),超净工作台(江苏苏净集团有限公司),恒温水浴锅(北京六一仪器厂),GZX-III系列光照培养箱(上海新苗医疗器械制造有限公司),组织研磨器TissueLyser II(QIAGEN),实时荧光定量PCR仪(ThermoFisher Scientific),NanoDrop 2000分光光度计(赛默飞)等。
2)主要试剂:PCR反应试剂(rTaq酶,dNTP等)(Takara),Trizol(上海翊圣生物科技有限公司),DL2000 DNA Marker(Takara),蛋白酶抑制剂(Thermo, United States),PrimeScript RT reagent kit(Takara)等。
2.2.3 总RNA提取和cDNA文库构建
使用TRIzol试剂分别提取SF和PF的总RNA,并且使用DNase I去除基因组DNA。利用Nanodrop 2000分光光度计评估样品纯度和RNA浓度,并使用RNA 6000 Nano kit在安捷伦2100型生物分析仪上分析RNA的质量。所有样品的260/280比率都大于2.0并且RIN值≥7.5。在构建文库之前,去除核糖体和病毒RNA,并且用磁性Oligo-dT珠(Invitrogen, United States)分离poly(A)+ mRNA。然后使用Illumina(San Diego, CA, United States)的TruSeqTM RNA sample preparation Kit将每种样品的10 μg总RNA用于构建文库,所有的操作均按照Illumina协议进行。此后,将构建好的测序文库在Illumina HiSeqTM 2000(Majorbio Biotech Co., Ltd. Shanghai, China)系统中上机测序。
2.2.4 转录组De novo组装和生物信息学分析
原始双端测序reads由SeqPrep和Sickle以默认参数进行修剪和质控。然后使用Trinity将来自SF和PF样品的高质量数据(clean data)进行de novo组装,并且所有组装的全长序列被命名为unigenes(Grabherr et al 2011)。将所有得到的unigenes针对NR、Swiss-Prot、COG和KEGG数据库进行Blastx搜索和注释(Camacho et al 2009)。使用Blast2GO软件(Conesa et al 2005)进行GO的功能注释,并使用WEGO软件对unigenes进行功能分类(Ye et al 2006)。基因表达量read counts被进一步标准化为FPKM(Fragments per kilobase of exon per million reads mapped)值。通过使用RSEM软件(v 1.2.7)(Li and Dewey 2011)计算表达量倍数变化,并使用R Bioconductor包edgeR分析差异表达基因(DEG)(Robinson et al 2010)。P-value设定为差异表达基因的阈值,在多重检验中P-value的阈值由FDR(False Discovery Rate)的值确定(Benjamini and Yekutieli 2001)。以FDR≤0.001且差异倍数不低于2倍为标准筛选两个不同样本的差异表达基因(DEGs)。
2.2.5 蛋白质制备和iTRAQ标记
将微型裸腹溞的冻存样本置于冰上,加入1:10比例蛋白裂解缓冲液(8 M 尿素,0.3% SDS)和适量蛋白酶抑制剂(Thermo, United States),混匀后将样本转移到Lysing Matrix Tubes振荡管中,使用高通量组织研磨仪震荡研磨4次;冰上裂解30 min;4℃,16000 g离心30 min,取上清。将蛋白质(每个样品200 μg,用裂解液将体积补充至200 μL)用10 mM TCEP(Thermo, USA)(最终浓度)在37℃还原1 h,并用40 mM碘乙酰胺(Sigma, USA)在暗室里烷基化40 min。在-20℃下加入6倍体积的冷却丙酮沉淀还原和烷基化的蛋白质混合物4 h;在4℃,10,000 g,离心20 min后,将沉淀物溶于200 μL 100 mM TEAB(Applied Biosystems, Milan, Italy)中,用胰蛋白酶(Promega, Beijing, China)(胰蛋白酶:蛋白质=1:50)在37℃下消化蛋白质12 h,并等分为两等份。胰蛋白酶消化后,通过旋转真空离心(Christ RVC 2-25, Christ, Germany)干燥多肽,再溶解于0.4 M TEAB中,并根据8-plex iTRAQ试剂(AB SCIEX,USA)的制造商指南进行处理。将样品以SF和PF的iTRAQ标签标记,用等量异位标签标记多肽并在室温下孵育2 h,合并标记的多肽混合物并通过真空浓缩器干燥。
2.2.6 LC/LC-MS/MS分析
用上样缓冲液[含有2%乙腈(ACN)的5 mM甲酸铵,pH=10]重悬每个部分;并通过高pH反相液相色谱(RPLC, Acquity Ultra Performance LC; Waters, Milford, MA)分离。溶剂A和溶剂B分别为2% ACN(pH=10,通过氨调节)和80% ACN(pH=10,通过氨调节)。在高pH RPLC柱(C18, 1.7 μm, 2.1 mm × 150 mm; Waters, USA)上用0%至30%溶剂B(2~38 min)和30%至100%溶剂B(38~40 min)进行梯度洗脱。用Nano Aquity UPLC系统(Waters Corporation, Milford, MA)对收集的所有级分进行LC-MS/MS分析,该系统连接到配备在线纳米电喷雾离子源的Q-Exactive四极-轨道杂化质谱仪(Thermo, USA)。将4 μL多肽样品加载到Thermo Scientific Acclaim PepMap C18柱(75 μm × 25 cm; 1.7 μm粒径)上,流速为300 nL/min,持续1 min,然后用分析柱(Acclaim PepMapC18, 75 μm × 25cm)在89 min内以5%至100%的溶剂B进行线性梯度分离,最后在溶剂B为100%时持续6 min。用于分离的溶剂A和溶剂B分别是含有0.1%甲酸的2% ACN和含有0.1%甲酸的80% ACN。将柱在初始条件下重新平衡30 min。柱流速保持在300 nL/min,温度保持在40℃,使用1.9 kV的电喷雾电压。Q-Exactive质谱仪在数据依赖性模式下工作,实现MS与MS/MS采集的自动切换。获得质量分辨率为70 K的全扫描MS光谱(m/z 350~1300),然后进行分辨率为17.5 K的MS/MS扫描。
2.2.7 蛋白质的鉴定分析
使用Proteome DiscovererTM Software 2.1(Thermo, United States)处理从LC/LC-MS/MS分析中获得的原始数据。搜索参数包括:将uniprot organism 6669-D. pulex作为蛋白质数据库;Iodoacetamide作为Cys烷基化;氧化(M)、乙酰基(蛋白质N末端)和iTRAQ8plex(Y)作为潜在的动态修饰;iTRAQ8plex(K)和iTRAQ8plex(N-末端)作为静态修饰。使用针对NR数据库的Blast2GO程序进行蛋白质的功能注释,并将不同注释的蛋白质进一步匹配至KEGG数据库。使用R语言中的t检验函数计算样本之间差异的显著P-value。为了确定显著上调或下调的蛋白质,将SF/PF或PF/SF比值的阈值设置为≥1.50或≤0.67(≥1.5倍)且P-value<0.05。
2.2.8 转录组与蛋白质组数据的相关性分析
为了评估mRNA和蛋白质之间定量信息的潜在相关性,使用截断值(DEGs:|倍数变化(FC)|>2.0和FDR<0.001;DEPs:p值<0.05和|FC|≥1.50)筛选具有明显差异表达的mRNA和蛋白质。然后,我们使用RNA-seq数据作为可搜索的数据库,分析所有鉴定的蛋白质序列并用RNA-seq数据进行搜索查询。为了进一步挖掘蛋白质组的有效信息,在DEPs和整个转录本数据库之间也进行了相关性分析。
2.2.9 RT-qPCR验证
分别使用TRIzol试剂从SF和PF样品中提取总RNA。使用Nanodrop 2000分光光度计评估样品纯度和RNA浓度,使用PrimeScript RT reagent kit(Takara)分别将PF和SF的10 μg总RNA进行逆转录。使用针对DEGs的特异性引物在ABI 7500 real-time PCR系统上(Applied Biosystems,United States)对获得的RT样品进行qPCR。引物序列和反应体系见表2-1和2-2,采用三步法进行RT-qPCR,具体如下:预变性95℃ 10 min,接着36个循环包括变性95℃ 15 sec,64℃退火30 sec及72℃延伸30 sec。在基因表达量分析中,以GAPDH基因的表达作为内参对照,使用QuantStudioReal-Time PCR软件和2-ΔΔCt方法分析目的基因的相对表达量(Livak and Schmittgen 2001)。
2.2.10 数据分析
所有数据均用SPSS 19.0软件进行统计学分析。生理学数据采用Student’s t-检验和Tukey方法进行95%置信水平下的单因素方差分析。使用Student’s t-test评估RT-PCR结果,数据表示为平均值±标准误(SEM)。当P<0.05时,实验组之间的差异被认为是显著的。
2.3 结果
2.3.1 RNA-Seq数据和DEGs的鉴定
利用RNA-Seq技术来比较SF和PF之间的mRNA表达谱,以SF和PF建立2个文库,分别获得77,923,354和68,509,476条clean reads,read length为145 bp,所有Q30均高于96%。在质控后获得了平均长度为995 bp的69,857个unigenes。在这些unigenes中,分别有20,131(28.8%)、24,282(34.8%)、8,807(12.6%)、24,543(35.1%)和13,213(18.9%)个unigenes被注释到NR、Swiss-prot、KEGG、COG和GO数据库。此外,FPKM分析表明在SF和PF之间总共有1665个unigenes(FC>2.0和FDR<0.001)显著差异表达。与PF相比,SF中有963个基因表达上调,702个基因表达下调。
2.3.2 GO和KEGG pathway富集分析
为了进一步探索DEGs在宏观水平上的分布,对SF和PF中的DEGs集分别进行了GO和KEGG pathway富集分析。GO富集分析表明:在SF中上调的基因与表皮高度相关(如多糖结合、几丁质结合、表皮结构成分等)、血红蛋白(如铁离子结合、血红素结合和四吡咯结合)、氧化应激(如氧化还原酶活性和氧化还原过程)和卵黄原蛋白(如脂质转运蛋白活性);而在SF中下调的大多数基因主要富集在代谢过程(如大分子/杂环/氨基糖聚糖代谢过程)、主要代谢过程(如蛋白质代谢过程、蛋白水解和碳水化合物/多糖代谢过程)、催化活性(如水解酶活性和转移酶活性)和肽酶活性(如内肽酶活性和丝氨酸型肽酶/内肽酶活性)(图2-2)。KEGG pathway富集分析表明:在SF中大多数上调的基因与生物体系统(如长寿调节途径、PPAR信号传导途径等)和代谢(如柠檬酸循环、戊糖和葡糖醛酸交换等)广泛相关;而生物系统(如蛋白质消化和吸收、溶酶体等)和环境信息处理(如神经活性配体-受体相互作用和鞘脂信号通路)是下调基因主要富集的pathway(图2-3)。
2.3.3 微型裸腹溞中生殖转化的关键DEGs
为了进一步探索微型裸腹溞的生殖转化机制,共筛选出1665个DEGs,在SF中分别鉴定出120个上调基因和103个下调基因(SF vs. PF; FC≥100)。在SF上调的DEGs中,进一步确定了一些可能与生殖转化相关的关键基因,如chitotriosidase-1 (Chit1)、probable chitinase 3(Cht3)、ATP-dependent RNA helicase DDX54(Ddx54)、hemoglobin、phosphatidylethanolamine-binding protein homolog F40A3.3(F40A3.3)、Vg、protein-lysine N-methyltransferase Mettl10(Mettl10)、alpha-crystallin A chain(Cryacra)、heat shock protein Hsp-16.2(Hsp16.2)、sex-lethal homolog(Sxl)、endocuticle structural glycoprotein SgAbd-8(SgAbd-8)、cuticle protein 6(CP6)、cuticle protein 7(CP7)和pupal cuticle protein 27(Pcp27)(表2-3).
3.3.4 蛋白质的鉴定与定量
Q-Exactive质谱仪具有高分辨率和高准确度的优势,用来检测SF和PF之间的差异表达蛋白(DEPs)。结果表明:有2352个蛋白质在Proteome Discoverer中命中;在数据库中发现的肽片段的匹配误差低于0.05Da(图2-4 A);大多数蛋白质的分子量分布在21-60 kDa(图2-4 B);肽长度约为9-20 aa,峰值区域在9-15 a(图2-4 C);鉴定到蛋白质中的肽的数量如图2-4 C所示,大多数蛋白质序列覆盖率为1-40%。
2.3.5 DEPs的鉴定和富集分析
在SF和PF中共鉴定出600个DEPs(FC≥1.5且p-value<0.05),包括在SF中上调的102个蛋白质和下调的498个蛋白质。GO分析表明:大多数DEPs功能分布在细胞组分(如细胞部分、大分子复合物等)、结合、细胞过程和代谢过程;此外在SF中大多数上调的DEPs主要与发育过程和转录调节因子活性相关(图2-5)。除GO分析外,还进行了KEGG pathway富集分析,用于进一步阐明这些DEPs的假定功能,结果表明:在SF中上调的蛋白质主要参与遗传信息处理通路,特别是与真核生物中RNA转运、核糖体和核糖体生物发生有关的翻译过程,而下调基因主要富集的通路只发现核糖体(图2-6)。
2.3.6 微型裸腹溞中生殖转化的关键DEPs
为了进一步探究微型裸腹溞的生殖转化机制,在SF中鉴定出50个上调蛋白(FC≥1.5)和130个下调蛋白(FC≥1.6)。在SF上调的DEPs中,进一步确定了一些可能与生殖转化有关的关键蛋白,包括bolA-like protein(G0274169)、ferritin subunit(Ferh)、hemoglobin、cytoglobin-2(Cygb2)、Vg、Vg2、protein-lysine N-methyltransferase Mettl10(Mettl10)、NADH dehydrogenase 1 alpha subcomplex assembly factor 5(Ndufaf5)、heat shock protein(ECU02_0100)、heat shock protein (Hsp-16.2)和 pupal cuticle protein 20(Pcp20)(表2-4)。
2.3.7 SF和PF之间转录组与蛋白组数据相关分析
如图2-7 A所示,在蛋白质和转录本水平上共鉴定出2352个基因,然而,仅有72个DEPs在转录本水平也同时检测到(图2-7 B)。Pearson相关系数为-0.1542(P<0.01,图2-7 C),这表明转录水平的基因相对表达量与蛋白质水平正相关但不强。GO分析表明:主要的GO 条目分别集中于结合、代谢过程、催化活性、细胞过程和单组织过程(图2-7 D)。此外,在最显著富集的通路中,大多数DEGs聚集在代谢途径、核糖体和蛋白质消化和吸收中,而DEPs主要富集通路是核糖体、核糖体生物发生、RNA转运和剪接体(图2-7 E)。
基于转录组和蛋白质组数据之间的相关性分析,在SF中共有15个上调基因和16个下调基因(具有功能注释)在转录水平和蛋白水平上均有表达。这些上调基因包括Amy2、Cryaa、Ddb_G0274169、Cdipt、hemoglobin、Vg、Vg2、Mettl10、Vat1L、Kcp、Hsp-16.2、Gpx3、SgAbd-8、Rps26和Sod1(表2-5);下调基因包括Tsr、Sec5、Man2B1、EFE4、Smpd1、Etfa、Nup155、Ebna1Bp2、Lolal、Anpep、Zetatry、CpipJ_CPIJ014254、Rps17、Ugt2B31、Aael007945和FABP(表2-6)。
为了进一步挖掘生殖转化的相关信息,分别分析了前40个DEGs和DEPs,在这些DEPs中有5个蛋白(Vg2、Mettl10、Vat1L、Cryas和Hsp-16.2)在蛋白水平和转录水平上均显著上调(表2-7),而没有蛋白在转录水平和蛋白水平均下调。同时还发现一些上调的蛋白质(如Hemoglobin、sod、amy2和rps26)在转录水平上显示出相对低的差异表达水平(表2-8)。另外,一些下调的蛋白质(如clca4a、npc2、sgabd-1、sec5、keratin、krt8、ugt2b31和man2b1)在转录水平上也显示出相对低的差异表达水平(表2-9)。
转录组和蛋白质组数据之间的比较表明蛋白质的表达模式与其在转录水平上的mRNA表达模式显示出一般相关性。而这些数据还揭示了转录水平和翻译水平之间的显著不一致。在蛋白水平上发现SF中有59个上调蛋白(FC>1.5)(具有功能注释)和469个下调蛋白(FC>1.8),但在转录水平mRNA表达无变化,另外,4个上调蛋白和11个下调蛋白显示出与转录水平相反的丰度变化(图2-8)。
除了转录调控之外,基因表达很明显也在受转录后水平的调控。为了更好地突出转录后调控过程的重要性,进一步确定了SF中12个关键的与生殖转化相关的DEPs,包括Vg fused with superoxide dismutase(Dmagvtg1)、ferritin subunit(Ferh)、cathepsin l-like proteinase(Cat-1)、chorion peroxidase(Pxt)、cuticle protein 7(CP7)、cytoglobin-2(Cygb2)、endocuticle structural glycoprotein SgAbd-2(SgAbd-2)、probable cytochrome P450 301a1(Cyp301a1)、pupal cuticle protein 20(Pcp20)、heat shock protein ECU02_0100(Ecu02_0100)、ferritin heavy chain(FHC)和apolipoprotein D(Apod)(表2-10)。
2.3.8 RT-qPCR验证候选基因
为了进一步确认转录组和蛋白组数据结果,随机选取21个DEGs或DEPs进行RT-qPCR验证,包括在SF中的11个上调DEGs或DEPs(Amy2、Cryaa、Ddb_Gg0274169、Hemoglobin、Vg、Vg2、Hsp-16.2、Gpx3、SgAbd-8、Mettl10和Sod1)和在PF中的10个上调DEGs或DEPs(Tsr、Sec5、Man2B1、Nup155、Ebna1Bp2、Anpep、Zetatry、Rps17、Aael007945和Ugt2B31)。结果表明:这21个DEGs或DEPs的表达谱与高通量测序结果基本一致(表2-11)。
2.4 讨论
与其他枝角类一样,微型裸腹溞也可以将它们的生殖方式从孤雌生殖转换为有性生殖以适应外部环境。但关于生殖转化的分子机制知之甚少。在本研究中,基于转录组学和蛋白质组学分析,试图研究微型裸腹溞(SF vs. PF)中的DEGs和DEPs,并鉴定参与生殖转化的关键基因或其蛋白产物。
GO和KEGG富集分析表明微型裸腹溞中的上调和下调基因具有不同的富集条目。在SF中富集条目主要是表皮相关(如多糖结合、几丁质结合、表皮的结构成分等)、血红蛋白(如铁离子结合、血红素结合和四吡咯结合)和氧化应激(如氧化还原酶活性和氧化还原过程)。几丁质参与昆虫的表皮形成,是抵抗任何环境胁迫的最重要的组织屏障(Pesch et al 2016),血红蛋白能让生物体在低氧胁迫下存活(Pirow et al 2001)。这些结果表明,SF中上调的基因对形成抗不利条件的保护性表皮结构、增加缺氧条件下氧的输送和储存具有重要作用。相反,在PF中主要富集的是基本代谢过程(如代谢过程、大分子代谢过程和蛋白质代谢过程)。众所周知,PF可以产生大量孤雌胚胎,这些胚胎可以在不受精的情况下直接发育成成体(Arbaciauskas 2004),这些结果意味着PF中各种代谢过程的上调可能在营养摄取中起重要作用,以进一步促进新生儿的成长。
转录组和蛋白质组之间的相关性分析表明蛋白质在不同GO条目中的富集与转录组结果一致。然而,蛋白质中富集的通路主要为遗传信息处理通路,而在转录水平中占主导地位的是各种代谢过程。此外,目前的研究表明31个基因在转录水平和蛋白水平上均显著差异表达,包括16个上调基因和15个下调基因。尽管转录调控和翻译调控通常是协调一致的,但也发现了许多与这一趋势相反的基因,在SF中共有543个DEPs表现出与转录水平不同表达模式,这意味着转录后调控的参与。先前的研究表明转录后加工决定稳态蛋白水平(Chen and Harmon 2006)。为了进一步探讨转录后调控对生殖转化的影响,还挖掘出一些在mRNA水平和蛋白质水平调控趋势相反的蛋白质,包括Dmagvtg1、Ferh、Cat-1、Ndufaf5、Pxt、cuticle protein 7、Cygb2、endocuticle structural glycoprotein SgAbd-2、Cyp301a1、Pcp20、Ecu02_0100、ferritin heavy chain和Apod。在微型裸腹溞的生殖转化中,这些转录后调控的基因比那些转录调控的基因可能发挥着更重要的作用。下面对涉及生殖转化的关键基因及其蛋白质产物进行分类分析。
1)氧气输送相关基因
球蛋白是一个含有血红素的球状蛋白的超级家族,参与结合和/或运输氧气,特别是铁离子结合、血红素结合和氧气运输(Baldi et al 1994; Culbertson 2010)。在SF的球蛋白成员中含有1个基因(hemoglobin)在转录水平与蛋白水平上均显著上调和3个基因(Cygb2、Ferh和ferritin heavy chain)在转录后水平上显著上调。血红蛋白(hemoglobin)是最重要的球蛋白之一,在氧气运输中起着关键作用。无脊椎动物在大多数情况下血红蛋白的浓度较低,但是缺氧会导致淡水浮游动物生物体内的血红蛋白浓度显著增加,这表明血红蛋白合成的诱导可以提高水蚤对低环境溶解氧水平的耐受性,并使生物体在这种压力下生存(Pirow et al 2001)。鉴于在枝角类有性生殖发生的环境溶氧水平相对较低,进一步证明溶解氧水平可能是枝角类发生生殖转化的重要环境因素。与hemoglobin相似,蛋白组数据中存在的Cygb2也属于球蛋白家族,其在SF中显著上调。由于先前的研究已经证明Cygb2可以在缺氧条件下上调并在需氧反应中发挥关键作用(Fago et al 2004; Schmidt et al 2004),所以推测Cygb2也可能参与微型裸腹溞的细胞内氧气储存或转运。除hemoglobin和Cygb2外,Ferh和ferritin heavy chain也在三价铁的结合和运输中起重要作用,Larade和Storey)报道,铁蛋白的浓度可在缺氧等应激条件下迅速升高(Larade and Storey 2004),这意味着铁蛋白是缺氧的急性期蛋白(Beck et al 2002)。众所周知,环境信号可以调节动物的各种关键生理过程,参与氧气运输的球蛋白相关基因均在SF中上调以响应缺氧条件,这表明低氧含量可能导致微型裸腹溞发生生殖转化。另一方面,SF中球蛋白相关基因的高表达水平也可能表明SF需要更多的氧气来完成有性生殖并产生休眠卵。
2)卵黄原蛋白相关基因
Vitellogenin(Vg/Vit-2)vitellogenin-2(Vg2)都是卵黄原蛋白(Vg)家族的成员,其在枝角类卵黄蛋白的形成中起关键作用(Kato et al 2004)。卵黄原蛋白是卵黄蛋白(vitellin,Vn)的主要前体,为卵生生物的胚胎发育提供能量(Matozzo et al 2008)。在SF与PF的比较中,SF中的Vg和vitellogenin-2的表达水平均显著高于PF,在中华拟同形溞中也报道了类似的结果(Zhang et al 2016)。此外,还发现SF中Dmagvtg1在转录后水平显著上调,先前的研究已经报道Dmagvtg1编码Vg,Vg的前体是大型溞卵中最丰富的多肽(Kato et al 2004)。这些结果表明SF可产生更多卵黄蛋白包裹入休眠卵中以促进胚胎发育。与Vg类似,F40A3.3也在SF中高表达,其功能注释为脂质转运或脂质转运蛋白活性,并且在脂质结合中起重要作用。因此,它也可能参与SF中卵黄蛋白的合成。
3)表皮相关基因
与PF相比有7个基因及其蛋白质产物(cuticle protein 6、cuticle protein 7、endocuticle structural glycoprotein SgAbd-2、endocuticle structural glycoprotein Sgabd-8、Pcp20、Pcp27和Cyp301a1)在SF中显著上调,它们与表皮或几丁质的合成有关。在这些基因中,与PF相比,cuticle protein 7、endocuticle structural glycoprotein SgAbd-2、Pcp20和Cyp301a1在SF转录后水平的表达水平显著更高。表皮蛋白和几丁质都参与表皮的形成,表皮是昆虫抵抗环境胁迫的最重要屏障(Neville et al 1976)。在枝角类中,表皮也由表皮蛋白和几丁质组成,它们可以抵抗外部不利的环境条件(Repka et al 1995; Liu et al 2014b)。最近的一项研究表明,大型溞可以在苏格兰小虾的存在下产生一系列的形态变化,包括甲壳形态变化和表皮硬化(Otte et al 2014)。此外,另一项研究表明Cyp301a1参与黑腹果蝇成虫表皮的形成(Sztal et al 2012)。总的来讲,表皮相关基因和蛋白质的高表达表明这些其可以帮助SF在表皮结构中发生一系列相应的变化以应对不利的外部环境条件。另外,SF需要产生休眠卵以度过不利的环境条件,并且休眠卵由具有厚表皮的黑色卵鞍包裹,这些结果表明在SF中上调的表皮相关基因也可能在卵鞍的形成中起关键作用。
4)热休克蛋白(HSP)相关基因
与PF相比,3个热休克蛋白(Hsp)相关家族(Hsp-16.2、ECU02_0100和Cryaa)的成员在SF中高表达。Hsp-16.2编码一种小的热休克蛋白(sHsp),其在保护蛋白质免受应激诱导的聚集中起重要作用(Pozsgai et al 2007)。先前的研究已经证明Hsp16.2的抗细胞凋亡作用是由Hsp90的活化介导的,即Hsp16.2与Hsp90相结合(Bellyei et al 2007a)。此外,Hsp16.2的过表达可以增加脂筏的形成,从而有助于稳定质膜(Bellyei et al 2007a,b)。ECU02_0100是一种Hsp70相关蛋白,属于Hsp70s家族成员。Hsp70s在应激耐受性和逆境生存中发挥着至关重要的作用(Mikulski et al 2011),它们还可以促进新合成蛋白质的正确折叠(Mayer and Bukau 2005)。Cryaa可编码α-晶状体蛋白A链(αAC),其属于α-晶状体蛋白(αC)。与Hsp16.2类似,αC与sHSP家族C末端的90-100个残基的氨基酸序列具有明显的序列同源性(Klemenz et al 1991)。在热应激和氧化应激下αC的表达显著增加,这表明αC也是响应于多种环境胁迫的分子伴侣(类似于sHSP)。总的来说,这些发现表明SF中3个Hsp基因的高表达可以通过维持细胞稳态来保护微型裸腹溞免受各种环境应激刺激(如低温或高温,缺氧)。此外,这些发现还表明Hsp蛋白可能是处理环境压力和维持体内平衡的关键蛋白,其在成功发生生殖转化中起重要作用。
5)甲基转移酶相关基因
甲基转移酶是一大类酶,包括蛋白质甲基转移酶、DNA/RNA甲基转移酶、天然产物甲基转移酶和非S-腺苷甲硫氨酸(SAM)依赖性甲基转移酶。对于蛋白质甲基转移酶,先前的研究已经证明法呢酸O-甲基转移酶(farnesoic acid O-methyltransferase)是十足类和鳃足类甲壳类动物合成甲基法尼酯的主要贡献酶(Ruddell et al 2003; Li et al 2010)。最近的研究报道甲基法尼酯在调节水蚤生殖转化方面发挥着关键作用(LeBlanc and Medlock 2015)。这些研究结果表明在SF中编码甲基转移酶的上调基因(Mettl10和Ndufaf5)也可能与微型裸腹溞的生殖转化有关,另一方面DNA甲基转移酶可以催化甲基转移到DNA,DNA甲基化是遗传调控的关键组成部分,主要发生在碱性胞嘧啶的5-C上,形成50个甲基胞嘧啶,并且不会引起DNA序列的变化(Lan et al 2010)。已经在大型溞中检测到DNA甲基化的存在,这表明该物种可能发生着潜在的表观遗传效应(Vandegehuchte et al 2009)。与PF相比,Mettl10和Ndufaf5基因产物在SF中的高表达表明DNA甲基化也可能与微型裸腹溞的生殖转化有关。
6)编码肽酶、过氧化物酶和脂质运载蛋白的基因
与PF相比,iTRAQ结果显示一些编码肽酶、过氧化物酶和脂质运载蛋白的基因在SF中高表达。在幼虫蜕皮期间,组织蛋白酶L样蛋白酶(Cathepsin L-like proteinase)在棉铃虫中上调表达(Wang et al 2010)。绒毛膜过氧化物酶(Chorion peroxidase)参与埃及伊蚊的不溶性卵绒毛膜的形成(Li et al 1996)。所以推测组织蛋白酶L样蛋白酶和绒毛膜过氧化物酶可能参与微型裸腹溞在不利条件下胚胎和幼体的发育过程。载脂蛋白D(Apolipoprotein D)是一种具有保护作用的急性反应蛋白,参与调节氧化应激保护的机制(Ganfornina et al 2008)。与PF相比,载脂蛋白D在SF中也显著上调,这可能有助于保护微型裸腹溞免受氧化应激的危害。这些研究结果表明在SF中上调的组织蛋白酶L样蛋白酶、绒毛膜过氧化物酶和载脂蛋白D可能在微型裸腹的生殖转化中发挥作用。
2.5 小结
根据转录组和蛋白质组数据的分析,确定了微型裸腹溞中涉及生殖转化的几个关键DEGs和DEPs。结果表明转录后调控可能在生殖转化中发挥重要作用。在SF中上调的基因及其蛋白产物主要属于球蛋白相关家族、卵黄原蛋白相关家族、表皮相关家族、热休克蛋白相关家族和甲基转移酶相关家族,表明这些基因可能在微型裸腹溞的生殖转化中起关键作用。与之相反,GO分析表明PF中上调的基因与代谢过程密切相关,这可能是PF群体能够快速增殖的原因。综合转录组和蛋白质组数据为探究微型裸腹溞生殖转化中的转录后调控提供了新的见解和宝贵的资源。此外,该研究还提供了许多可用于进一步进行功能研究的与微型裸腹溞生殖转换相关的关键候选基因及其蛋白产物。