大家好,我是血小板,是一种小的循环无核细胞,在止血、伤口愈合和疾病进展中起着关键作用。但是今天我不是来做科普讲座的,最近有一伙人利用我发了一篇10+的文章,而且从投稿到发表居然只有5天!这我就坐不住了,我决定亲自来介绍这篇文献~
文章简介:
这篇文章【1】发表在期刊: American Journal of Hematology,是血液学中比较有质量的期刊。在最近一年的影响因子为10.047。中科院大类: 医学 1区 中科院小类: 2区 血液学。在中科院《国际期刊预警名单(试行)》名单( 2021年1月发布版)也没有发现这个期刊
另外这本期刊还收录了以下数据库:
Science Citation Index
Science Citation Index Expanded
Current Contents - Clinical Medicine
Current Contents - Life Sciences
BIOSIS Previews
文献解读:
当我与其他类型的细胞通信或在血液中循环时,我的RNA图谱可能会改变。我可能参与肿瘤的发展和转移,被肿瘤教育过的我的RNA会改变表达特征并且能够检测到肿瘤。只有少数数据库提供我的数据,如PlateletWeb用来研究我的蛋白信号网络和我在人类中抗原检测,PLATELETOMICS检测我的RNA和miRNA表达。然而,目前还缺乏对大数据对我的表达谱的系统研究,这就需要在不同条件下获得高质量的转录组数据。目前还没有针对疾病的全面的血小板表达数据库。
我目前还没有针对疾病的全面的表达数据库,而这篇文章将对研究界非常有帮助。为了系统地研究血小板的RNA表达谱,他们从NCBI GEO的基因表达总集和SRA数据库中挑选了我的表达数据集,包括来自27种疾病和健康对照的1260个RNA-seq、358个RNA微阵列、21个miRNA-seq和430个miRNA微阵列数据。当然还有外周血单核细胞(PBMC)和全血的RNA-seq数据集。然后,他们去除了RNA-seq表达数据的批量效应,并将其分为四组:
(1)实体瘤:结直肠癌(CRC)、乳腺癌(BRCA)、胰腺癌(PC)、肝胆癌(HCC)、胶质母细胞瘤(GBM)、非小细胞肺癌(NSCLC)和低级别胶质瘤(LGG)
(2)心血管疾病(CAD):不稳定型心绞痛(UA)、ST段抬高型心肌梗死(ST段抬高型心肌梗死)、肺动脉高压(PH)、无明显动脉粥样硬化(NSAth)、稳定型心绞痛
(3)感染(病毒):人类免疫缺陷病毒(HIV)、登革热和流感(H1N1)
(4) 其他:慢性胰腺炎(CP)、癫痫、多发性硬化症、糖尿病。
我的Reads分布分析显示,平均约80%的Reads被映射到外显子(39.89%)和内含子(39.18%)区域(图1A)。他们发现12.07%的片段被定位到线粒体DNA上,因为完整的线粒体是我发挥功能和生存的关键。只有8.86%的片段被定位到基因间隔区。接下来,他们研究了健康样本中我的表达情况,发现不同研究中表达基因的数量差异很大(图1B)。这是有点奇怪的?我推测可能是由于不同的治疗或处理方法所致。在健康血小板中, FPKM>3的表达基因的分布是相似的(图1B),因此,他们认为FPKM>3的基因是高置信度基因。结果显示,我在健康人中平均表达4994个蛋白质编码基因和2168个非编码基因,而在疾病患者中蛋白质编码基因和非编码基因总数从3069个到13678个不等(图1C)。
由于我在血管中循环,他们找到了我、PBMC和全血之间基因表达谱的差异。结果发现,我、PBMC和全血中平均表达基因数(FPKM>3)分别为7162个、10521个和9336个。在这些基因中,非编码基因在分别约占30.27%、12.54%和12.18%(图1D)。此外,他们还对FPKM>3的40%以上的样本中表达的基因进行了筛选,并在这三个来源中鉴定出4326个共同基因(编码基因和非编码基因分别为4168和158个)。在探索三个来源的最高表达基因时(图1E)。他们发现在前100个基因中有27个基因相同和前500个基因中有142个基因相同。有趣的是,37个线粒体基因中有35个在我的基因前100位,高表达的前10个基因中有6个来自线粒体(MT-RNR2、MT-RNR1、MT-ND1、MT-CO2、MT-ATP6和MT-CO3)(图1F)。另外4个基因分别是B2M、TMSB4X、FTH1和PPBP,它们与我的形成和功能密切相关。同时,PBMC和全血中表达的前10个基因同时存在于线粒体相关基因和血红蛋白基因中(图1F)。
为了研究基因在不同疾病中的功能,他们通过在基因本体论(GO)中筛选关键字“血小板”来排除我的相关基因,这样就可以更好的研究我在不同疾病中作用,而不会关注到我如何产生、如何发挥凝血作用这类话题了。并对剩下的前500个基因进行GO富集分析。如图1G所示,在健康样本和疾病中,这些基因都富集定位于膜的蛋白、定位于内质网的蛋白和定位于膜的共翻译蛋白。有趣的是,与健康样本和其他疾病相比,HCC、BRCA、PC、CRC、DM、CP和病毒缺乏与核糖体生物发生相关的GO术语。这表明在不同的条件或疾病下,我的RNA谱是不同的。
接下来,他们以差异倍数>1.5,p<0.05,FPKM>10为临界值,确定了疾病和健康样本之间的差异表达基因(DEGs)。在不同的CAD疾病中,DEG的数目差异很大(8~3298个),在感染性疾病中没有DEGs。与健康血小板相比,CRC、BRCA、PC、HCC、GBM和NSCLC分别为1434、1414、1316、1191、1070和225,说明非小细胞肺癌与其他肿瘤的不同之处。为了进一步探索这一差异,他们将DEGs相交,发现5种肿瘤(BRCA、CRC、GBM、PC和HCC)共有716个DEG,NSCLC中有143个独特的DEGs(图1H)。同时,他们在6个肿瘤中发现了4个常见的上调基因(ITGA2B、DEFA1、DEFA3和TLN1),这四个基因已被报道与多发性癌症的发生有关和78个常见的下调基因主要编码核糖体蛋白(图1I)。
为了探索我在癌症诊断中的潜在价值,他们利用SEG工具鉴定了11个实体肿瘤中的特异性表达基因(SEG) (图1J)。他们发现FKBP1A在NSCLC和LGG中特异性的低表达,还在TCGA数据中观察到FKBP1A在肺和脑肿瘤中的表达与健康对照相比下调。此外,NSCLC和LGG中的其余7个血小板SEG(GP1BB、PRR7、CYBA、NOP53、TYMP、STUB1和ATP5D)和LGG中的3个SEG(DUSP1、DUSP2和DDIT4)被报道与肿瘤的发生有关。
为了便于利用我的这些高质量数据集进行新的发现,他们将表达数据和分析结果组织到最先进的血小板表达数据库中,命名为血小板表达图谱(PEA)。PEA提供了一套完整的基因和miRNA表达谱图谱以及每个数据集的高级分析结果:
(1)不同疾病中血小板的表达谱;
(2)特定基因(miRNA)在健康和各种疾病中的平均表达;
(3)差异表达分析,包括DEGs的功能富集和蛋白质相互作用网络;
(4)血小板特异性表达基因。
本文小结:
总之,他们首先系统地研究了不同疾病的我的RNA的表达情况,并展示了其在我、PBMC和全血中的表达情况。其实,他们为我提供了一个完整表达数据库,我在这里要说一句——
这可以作为研究界的基础设施。但是在未来,仍有几个问题需要解决,包括PEA的长期维持等。其实,我在炎症、免疫、癌症的发病和转移都有作用。最近的研究表明,我还可以携带由功能失调细胞溢出的疾病相关生物分子(如RNA、蛋白质和代谢物),对疾病具有诊断作用,但是这方面的研究还不是很多,大家还要继续加油呀~
有了这么宝贵的资源,该怎么用起来呢?如果不知道的话,请看第二条《加油血小板!》;如果想要会会血小板,欢迎联系我们多多交流哦!
参考文献
[1] G.Y. Xie, C.J. Liu, Y.R. Miao, M. Xia, Q. Zhang, A.Y. Guo, A comprehensive platelet expression atlas (PEA) resource and platelet transcriptome landscape, Am J Hematol, 97 (2022) E18-E21.