TITLE****:Integrative epigenomic and transcriptomic analysis reveals the requirement of JUNB for hematopoietic fate induction
译名:综合表观基因组和转录组分析揭示了JUNB对造血命运诱导的需求
期刊:NATURE COMMUNICATIONS
日期:2022年6月
下载链接:https://doi.org/10.1038/s41467-022-30789-4
研究介绍:人多能干细胞向造血祖细胞分化可作为体外人胚胎造血模型,但表观基因组和转录组的动态变化尚不清楚。本文系统地描述了在体外造血祖细胞分化过程中中间祖细胞染色质的可及性、H3K4me3和H3K27me3的修饰以及转录组。综合分析揭示了造血转录因子结合区的顺序开放和二价基因的逐步表观遗传重编程。对内皮细胞向造血细胞转化的单细胞分析以及与体内造血源内皮细胞的比较揭示了体外和体内造血的重要特征。我们发现JUNB是造血内皮细胞特化和内皮细胞向造血细胞转化的重要调节因子。这些研究描绘了从人类多能干细胞到造血祖细胞的表观基因组路线图,这可能为产生具有更高发育潜力的造血祖细胞铺平道路。
材料与方法:
材料:
本研究使用H1 hESC细胞系和iCRISPR/Cas9细胞系。所用细胞均未被支原体污染。
方法:
1、****RNA-seq数据分析。
使用带有默认参数的Trim_Galore(版本0.6.7)软件对read进行修整。然后,使用默认参数的STAR(版本2.7.1a)将适配器修剪的配对端RNA-Seq reads映射到hg38全基因组。读取reads使用htseq-count(版本0.11.1)计算,原始数据计数归一化和差异表达基因使用DESeq2(版本1.32.0)软件获得。
2、ChIP-seq和ATAC-seq数据处理。
使用Trim_Galore(版本0.6.7)处理所有的配对端原始reads,以削减适配器和低质量的reads。从ATAC-seq和ChIP-seq的适配器修剪的对端reads通过bowtie2(版本2.3.5)与hg38对齐,。使用samtools(版本1.9)软件将SAM转换为BAM文件。Picard工具(版本2.26.10,markduplices)去除PCR重复序列和多重映射reads。在使用MACS2(版本2.2.6)调用峰值之前,将每个时间点的复制BAM文件合并并删除与黑名单基因组区域对齐的reads,并使用Homer(版本4.10.4,findMotifsGenome)分析富集的TF motif。每个样本的信号轨迹都是使用bamCoverage(3.3.0版本,deeptools)函数生成的,并被规范化到RPKM以实现可视化。
3、用Mfuzz进行ATAC-seq聚类分析。
在使用bedtools(2.27.1版本)合并功能将每个时间点的ATAC-seq峰值合并在100bp内后,通过合并所有阶段的峰值集创建一个共识联合峰值集。随后,使用bedtools multicov功能默认设置计算每个样本的ATAC-seq读取reads。根据ATAC-seq读取reads,计算RPKM值。以RPKM值>5至少两个时间点对RPKM矩阵进行分位数归一化处理。聚类前,去除RPKM值随时间变化系数(CV) <10%的峰,以保持动态变化的峰区域。对剩余的峰进行分位数归一化,z评分进行转换,然后在R中进行mfuzz(版本2.56.0)聚类,以显示HPC分化过程中染色质的动态开放状态。
4、二价基因的ChromHMM分析与鉴定。
采用ChromHMM(version 1.22)软件按照手册的要求对染色质状态进行识别和表征。使用binarizeam命令将来自hPSC的H3K4me3和H3K27me3对齐文件分箱到200个bp箱中。LearnModel使用默认参数与四个发射状态一起使用。四种染色质状态被划分为:仅h3k27m3、仅H3K4me3、H3K27me3/H3K4me3(称为二价结构域)和无(非标记区域)。二价基因的定义如下:首先从hPSC的分割文件中提取二价区,然后将RefSeq转录本启动子区(在TSS附近定义为±2.5 kb)与二价区相交。只有>200bp重叠的基因被认为是二价基因。
5、GO****分析。
使用R包clusterProfiler(版本3.6.0)使用默认参数GO富集分析。每个集群的GO功能使用定制的脚本重新汇总并可视化为条形图,并绘制了p值以显示其重要性。在补充数据文件中列出了各GO功能中显著性和基因。
6、单细胞RNA-seq数据处理分析。
使用FastQC(0.11.9)检查原始测序数据的质量,通过细胞计数流水线(2.0.1)生成单细胞表达矩阵。对于多个样品的综合分析,使用cellranger aggr管道将样品归一化到相同的读取深度。从cellranger管道得到的UMI(唯一分子标识符)矩阵被用于以下分析。为了检测分化效率,我们用H1和iPS细胞系进行分化,并用SB431542处理后的混合细胞培养进行单细胞测序。然后,我们使用Souporcell(2.0)通过SNP信息来区分数据中的源细胞系,并将H1保留的细胞用于下游分析。对于细胞聚类和差异表达基因的鉴定,使用R软件包Seurat(3.2)进行细胞类型鉴定。简单地说,我们用3个标准筛选细胞:表达基因数、UMI数、每个细胞中线粒体基因的百分比。具有任何这些度量的单元格会超出所有单元格的2个标准差,并被丢弃。接下来,鉴定出高变异基因,并利用这些基因进行主成分分析。使用Seurat中的FindClusters函数,将10个主要成分用于进行细胞聚类,分辨率参数设置为0.15。通过findallmarker功能识别差异表达基因,并将每个细胞群与其他所有细胞进行比较。使用Top DEGs生成热图,显示细胞集群的标记基因表达。
7、JUNB****敲除细胞系的建立。
利用在线工具(http://chopchop.cbu.uib.no/)设计了针对JUNB的SgRNA。用于基因分型的sgRNA序列和引物分别列在补充表2和3中。将退火后的23bp原间距寡核苷酸(每寡核苷酸100 μM)插入pLKO5.sgRNA.EFS中,构建SgRNA表达慢病毒载体。GFP(Addgene:57822)向量用BsmBI线性化。用sgRNA质粒转染293 T细胞制备慢病毒。本研究使用iCas9 hPSCs生成敲除细胞系。转染sgRNA前,用1 μg/ml多西环素(D9891,Sigma)和10 μM Y-27632处理iCas9 hPSCs 24-48 h,第二天,用accutase(Millipore)消化成单细胞悬液,接种于含1 μg/ml多西环素、10 μM Y-27632的MEF喂食器包被板上。一旦细胞附着,将sgRNA慢病毒加入培养皿中8小时。转染后2天,用酶解酶将hPSCs解离为单细胞,每6 cm重镀1000个细胞,10 μM Y-27632。细胞被允许生长,直到单个细胞的菌落可见(约10天)。选取单菌落进行Sanger测序,鉴定JUNB KO克隆。
结果:
图1、HPC分化过程中染色质状态的动态变化。显示hPSC的造血分化过程的示意图(上图)以及转录和染色质状态分析的样本收集策略(下图)。B各分化期RNA-Seq复制的PCA。HPSC、VME、EPC和HPC的C聚类图在启动子(TSS±2.5kb)处重复ATAC-seq信号。D条形图显示了所有分化期ATAC-seq、H3K4me3和H3K27me3芯片-seq数据的峰值分布。显示hPSC、VME、EPC和HPC中基因表达、H3K4me3、H3K27me3结合和染色质可及性之间的Pearson相关性的热图(TSS±2.5kb)。UCSC浏览器快照显示了代表标记基因在HPC分化的不同阶段的CHIP-SEQ和ATAC-SEQ图谱。每个面板左侧的热图显示了归一化的基因表达水平。基因组浏览器的查看比例根据全局数据范围进行调整。HPSC-、VME-、EPC-和HPC-推定的启动子为阴影。HPSC人多能干细胞、VME血管中胚层细胞、EPC内皮祖细胞、HPC造血祖细胞、源数据作为源数据文件提供
图2、HPC分化过程中的时间表观遗传特征和基因表达模式。HPC分化过程中atac-seq峰的Mfuzz聚类分析。ATAC-SEQ峰被聚集成六个簇,并被分成三个类别。线条图描绘了标准化的ATAC-SEQ信号,其中每条灰线表示不同细胞群中相同位置的信号,而绿线表示每组的上和下四分位数之间的值。每个ATAC-seq簇中的H3K4me3和H3K27me3修饰的B信号。C每个簇中最接近ATAC-seq峰的基因的对数转化基因平均表达(读取计数)。D-f条形图显示了通过对不同类别的ATAC-SEQ星系团进行GO分析而丰富的统计上过高的生物过程。P值,Fisher‘s精确检验。G每个ATACseq类别中的TF基序丰富。点的大小反映了含有特定Tf基序的序列的比例,颜色显示了从Fisher的确切p值得到的丰富。HPSC人多能干细胞、血管中胚层细胞。EPC内皮祖细胞、HPC造血祖细胞。源数据以源数据文件的形式提供。
图3、组蛋白修饰景观在HPC分化过程中的动态变化。显示基于ChromHMM算法从芯片序列数据集中分类的染色质状态的热图。每行对应不同的组蛋白标记,每列代表不同的染色质状态。具有低H3K4me3或H3K27me3修饰的区域被标记为未标记;同时具有H3K4me3和H3K27me3的区域被标记为二价。较深的颜色表示更高的概率。B方框图,显示每个分化阶段对应的基因表达水平(上图)和染色质可及性(下图)。每个盒子的顶部都标有基因/峰值编号。显示细胞状态转变过程中二价结构域动态的示意图。显示hPSC向VME转变过程中H3K4me3(左)、H3K27me3(中)和激活的双价基因的基因表达(n=419)的动态的3D盒图。HPSC向VME转变过程中激活二价基因的E GO分析。UCSC浏览器视图显示了在hPSC向VME转变过程中代表基因座上的H3K4me3和H3K27me3修改概况。推定的推动者是阴暗的。显示VME向EPC转变过程中H3K4me3(左)、H3K27me3(中)和激活的双价基因的基因表达(n=253)的动态的G盒图。VME向EPC转变过程中激活的双价基因的H GO分析。UCSC浏览器快照显示了VME向EPC转变过程中具有代表性的基因座上的H3K4me3和H3K27me3图谱。推定的推动者是阴暗的。J UCSC基因组浏览器快照显示了H3K4me3和H3K27me3修饰图谱以及HOXA5、HOXA9和HOXA10基因座的染色质可访问性。推定的推动者是阴暗的。F,i,j中显示代表性基因表达水平的热图。B、d、g中的长方体边界是25%和75%,横跨长方体的水平线是中间值,胡须表示最小值和最大值。P值,Fisher‘s精确检验。基因组浏览器的查看比例根据全局数据范围进行调整。HPSC人多能干细胞、VME血管中胚层细胞、内皮祖细胞、HPC造血祖细胞。源数据以源数据文件的形式提供。
图4、ScRNA-seq和scATAC-seq分析揭示了ECs和早期HPC的亚群。显示单细胞RNA-seq和atac-seq的样本收集的示意图。圆点表示培养皿中不同类型的细胞。分化第6天细胞的单链RNA序列显示HPC、EC、MES和EPI簇的UMAP结果。来自SCATAC-SEQ数据的HPC、EC、MES和EPI星系团的UMAP可视化。CD34基因座周围有D个ScATAC-seq峰。新出现的开放区域有阴影。AEC TI、AEC TII、PreHPC TI、Pre-HPC TII和HE簇的scRNA-seq(左)和scATAC-seq(右)的UMAP图,来自B.f中描述的EC和HPC群体的重新聚类,显示了顶端deg在AEC TI、AEC TII、Pre-HPC TI、Pre-HPC TII和HE群体中的表达。AEC TI、AEC TII、Pre-HPC Ti、Pre-HPC TII和HE群体的G,h细胞周期和轨迹分析。在AEC TI、AEC TII、Pre-HPC TI、Pre-HPC TII和HE人群中,具有代表性的HPC和AEC相关基因在EHT过程中的表达。HPSC人多能干细胞。VME血管中胚层细胞、EPC内皮祖细胞、HPC造血祖细胞、EPI上皮细胞、MES中胚层细胞、EC内皮细胞、HE血源性内皮细胞、AEC动脉内皮细胞、AEC TI、AEC-I型、AEC TII、AEC-II型、HPC前TI型前HPC I型、Pre-HPC TII Pre-HPC型II、源数据作为源数据文件提供。
图5、体外和在体HEC单细胞转录组的比较。显示CS10 HEC、CS13 HEC和体外HEC基因表达模式的热图。颜色渐变表示基因表达的值。B散点图分别显示了体外HEC、CS10 HEC和CS13 HEC与决定系数的相关性。差异表达的基因被突出显示。蓝点、红点和灰点分别代表体外HEC中上调基因、下调基因和稳定基因。CS10 HEC、CS13 HEC和体外HEC中最高差异表达基因的C GO分析。点的颜色显示了从Fisher的精确p值中得到的丰富。CS-Carnegie分期,HEC造血内皮细胞。源数据以源数据文件的形式提供。
图6、表观遗传学特征表明JUNB是一种潜在的造血调节因子。热图显示了其结合基序在图2G中的类别II和III中丰富的二价TF的表达水平(FPKM)。颜色渐变表示基因表达的值。UCSC基因组浏览器快照显示H3K4me3、H3K27me3和ATAC-seq信号在JUNB的推定启动子处出现峰值,推定启动子为阴影。C小提琴图显示,在图4B的scRNA-seq图中,JUNB在EC和HPC簇中的表达较高。AEC TI、AEC TII、Pre-HPC Ti、Pre-HPC TII和HE群体中JUNB的D基序丰度。E-Bar图显示JUNB在CS10 HEC(n=124)、CS13 HEC(n=21)和体外HEC(n=119)中的表达水平。数据以平均值±SEM值表示。P值,双尾非配对t检验。F HPC差异化期间MYB、MEIS1、RUNX1和JUNB基序的ATAC-SEQ足迹可视化。将基因组中所有这些基序结合位置上的ATAC-SEQ信号与基序进行比对并取平均值。HPSC人多能干细胞、VME血管中胚层细胞、EPC内皮祖细胞、HPC造血祖细胞、外周上皮细胞、MES中胚层细胞、EC内皮细胞、HE造血内皮细胞、AEC动脉内皮细胞、AEC TI AEC-I型、AEC TII AEC型II、HPC前TI型前HPC、Pre-HPC TII Pre-HPC型。
图7 、JUNB缺乏严重损害hPSC向HECs和HPC的分化。示意图显示在起始密码子附近以JUNB为靶点的sgRNA。绿色箭头代表基因分型的聚合酶链式反应引物。B代表性的流式细胞仪密度图并定量检测WT和KO细胞第8天的HPC(CD34+CD43+),n=3个独立实验。与WT相比,JUNB KO CD34+EPC中上调的基因表达增加。P值,Fisher‘s精确检验。流式细胞仪检测WT和JUNB KO细胞第6天−和CD73−的密度图和数量。N=3个独立实验。E热图显示在WT和JUNB KO HECS中对HEC特性重要的基因的表达水平。颜色渐变表示基因表达的值。F-TF与JUNB在RUNX1和CD44基因组座位上的结合。推定的推动者是阴暗的。G-JUNB可诱导表达结构图。显示HPC分化过程中DOX诱导窗口的示意图。I-Bar图显示,阿霉素诱导的异位JUNB表达在第3天至第5天部分挽救了内皮细胞(CD34+CD73−CD184−)的百分率。N=3个独立实验。J-Bar图显示,在HEC规范或EHT窗口期用DOX诱导JUNB的表达可显著挽救HPC(CD34+CD43+)百分率。N=3个独立实验。HPC造血祖细胞、HEC造血内皮细胞、EHT内皮-造血细胞转化、WT野生型、KO基因敲除。对于条形图b、d、i、j,数据以平均值±SD表示。P值,双尾非配对t检验。源数据以源数据文件的形式提供。
结论:
综合的表观遗传学和转录分析以及综合分析表明,在高度确定的体外HPC分化条件下,染色质变化为祖细胞类型的顺序出现铺平了道路,导致类似于人类胚胎体内造血的HPC形成。此外,由这些分析推动的功能研究发现,在体外系统中,JUNB缺陷显著抑制HEC和HPC的生成。本研究丰富了人类系统造血规范的表观遗传调控知识,为优化体外分化和获得具有更强造血潜能的hes和HPCs提供线索。