单细胞技术在 2013 年和 2019 年被 Nature Methods 评选为年度技术,2018 年被 Science 评选为 10 大科学突破。据统计,CNS 发表单细胞领域文章已经超过 900 篇,其中 2019~2020 期间发表 285 篇。国自然资助的单细胞项目已经达到 513 项,总额 4.1 亿,其中 2019 年中标 113 项,总额 6,606 万。
如果说单细胞技术是热门,那空间转录组就是黑马,10x Visium 技术一经问世,便备受瞩目。空间转录组避免了组织中细胞位置信息丢失的现象,可以观测到组织中不同区域细胞构成和原始基因表达,直接获取不同功能区域的差异基因表达信息。
如果说 09~19 年是单细胞技术黄金十年的话,那么接下来 5 年一定是空间转录组的天下。
单细胞技术和空间转录组二者的结合,可以碰撞出不一样的火花,既能挖掘出大量前人没有发现的信息,也能大幅度提升文章的档次。
虽然两者都是现阶段的科研宠儿,但是将二者罗列在一起,就一定可以发表高分文章吗?
答案是:
NO!
没有合理的课题设计,
几十万的科研经费只能是打水漂!
那如何进行课题设计呢?来来来,欧易生物倾囊相授:
构建精细化图谱,为课题奠定良好的基础
构建细胞图谱,是单细胞研究的一大利器。设计单细胞课题时,可以先从细胞图谱出发。
构建单细胞图谱,需要注意,人和小鼠的全组织图谱已经发表,所以一定要注意图谱的精细化和差异化。
什么是精细化?
别人发表了肝脏细胞图谱,那我们可以构建肝实质细胞图谱。
什么是差异化?
别人发表了肝癌细胞图谱,那我们可以构建肝炎的细胞图谱。
生物体构成的复杂性,远远超出人们的认知。单细胞技术是解析这种复杂性的一把利器,细胞图谱构建的精细化程度越高、差异化程度越大,发现未知的重大现象的可能性越大。
在现阶段,细胞图谱的精细化和差异化阈值没有上限。只要你能设计出来并且可以实施,那就放心大胆的去做。
单细胞图谱挖掘,大有可为
获得细胞图谱后,根据 marker 基因,针对感兴趣的细胞类型,进行多次亚型划分,可以判定出前人没有发现的细胞亚型。还是上面那句话,生物体构成之复杂,是你我所无法想象的。只要细胞数足够大,一定可以找出教科书上没有提及的细胞种类。
就算捕获到的细胞数目不足以支撑发现稀有细胞,不同样本类型(sample type)、细胞类型(cell type)或细胞群体(cell cluster)之间的比较,也能提供大量的数据供我们深入挖掘。
例如针对感兴趣的细胞群体进行拟时序分析挖掘不同细胞群体的分化发育轨迹,GESA 分析挖掘不同细胞群体的功能和通路,或细胞互作分析不同细胞群体之间的联系,都是常用的分析思路。
基于上述发现之后,再针对关键性 marker 基因做一个 FISH 验证,以 NC 为代表的 10 分文章基本就能拿下。
空间转录组联合,恰到好处
上面的思路,是单细胞最为常见的分析套路。做到这一步,根据单细胞层面的数据,大家对于所研究的细胞群体会有初步的认识。继续朝下深入的话,一般有两个思路,功能验证和组学联合。
功能验证的思路,以后有机会可以再深入聊聊。组学联合的种类有很多,蛋白层面、表观层面和免疫层面等等。今天我们主要讨论空间层面的组学联合。
首先大家需要清楚,为什么要做空间转录组?
做完上面提到的单细胞内容后,大家对于目标细胞群体应该有了初步的认识,但是仍然会有很多问题值得商榷,例如:
细胞类型鉴定完之后,可能会发现对照组和处理组的细胞类型差不多,但是表型却大同小异。同样类型的细胞,为什么在不同样本中的表现差异如此之大?基因表达不同的缘故吗?那又是什么因素导致相同类型的细胞基因表达差异如此之大?
通过降维聚类,特征相似的细胞聚集在一起。基因表达相似,便代表这一群细胞行驶的功能是一样的吗?既然特征相似,为什么细胞和细胞之间,在二维平面上的分布还是有一定距离?聚类之后的细胞分布,和细胞在组织上的真实分布有什么关系?
细胞的异质性是真实存在的,而在单细胞水平下是研究是以群(cluster)为最小单元,这样分析是否合理?以群为单位,是否会掩盖或忽略掉细胞之间的关键信息?
单细胞水平下分析得到的细胞分化发育轨迹,或细胞和细胞之间的通讯联系,在空间上是否真实分布在临近区域?不同细胞之间的联系,是直接,还是间接?或者反过来,单细胞水平下分析得到的功能相似的细胞群体,在组织中的分布,一定是在同一区域吗?
这些问题,如果仅仅靠单细胞一个层面的数据,是很难解释清的。所以需要在单细胞的基础上,联合空间转录组,二者相互印证,才能获取更真实的信息。
接下来讨论一下,如何进行单细胞联合空间转录组的样本设计?
目前空间转录组价格还是比较贵的,一张 slides 要十几二十万。但是一张 slide 有 4 个捕获区域,就是可以处理 4 个冷冻切片,这里可以做的文章就大了。
之前单细胞的设计,我们选取了 Control:Case = 3:3 的模式。
如果所研究的病理组织信息可以集中体现在一张切片上,那么一张空间 slides 上放置 Control1+Case3,或者 Control2+Case2 都是可以的。
前者处理组的切片数为 3,目的是为了更好的分析处理之后不同样本之间的异质性。后者是一种比较稳妥的方案,对照组和处理组都设置了重复,可以规避掉切片质量不均导致空间结果不好的风险。
如果需要多张切片才能完整描述所研究的病理组织信息,那就得设置多张空间 slides,甚至需要一张 slides 来描述同一个组织的不同病理区域。
这个时候,基于经费的考虑,可以先选择一个处理组的样本做空间转录组,拿到有意思的结果之后,可以慢慢补充其他处理组样本的空间结果。
至于对照组的空间结果是否需要补充,这个后面会提及。
关于单细胞联合空间转录组的样本设计,还有一个很重要的点,是否需要对同一个样本同时进行单细胞和空间?这个问题,必须在一开始就想清楚,否则会导致整个课题的失败。
我的建议是,如果条件允许,选择多个组学在同一个样本上进行,特别是针对人的病理或肿瘤样本。
所以在样本准备时候,就要将组织一分为二,一半用来做单细胞,另外一半冻存起来为空间转录组做好备份。
小鼠样本组织通常都比较小,实施起来比较麻烦,可以选择一只小鼠做单细胞,另取一只小鼠做空间。小鼠模型的背景均一性较好,这样操作也可以。但是对于肿瘤样本,建议最好还是在同一个样本同时进行单细胞和空间转录组。
最后,讨论一下,如何进行单细胞和空间转录组的联合分析?
前面说过,通过单细胞转录组可以获取研究对象的细胞图谱,进而分析得到目标细胞群的 marker 基因、分化轨迹和通讯关系等结果。
上面在讨论「为什么要做空间转录组?」所提到的几个问题,都是进行单细胞和空间转录组联合时可以进行的分析内容,此处不再赘述,下面罗列一些新的联合分析关注点。
一、通过单细胞细胞类型鉴定结果辅助判定空间转录组的细胞类型
空间转录组分辨率达不到单细胞水平,10x 目前一个 spot 捕获 1~10 个细胞,所以如果仅仅通过空间转录组的数据是无法精确判定每个 spot 的主要细胞类型的。
最近 Nature Biotechnology 上发表了一个 MIA 算法,可以很好的解决空间数据冗杂的现象。
同时,结合空间转录组提供的组织水平的 HE 染色信息,也可以对单细胞鉴定到的细胞类型进行修正。
二、通过空间转录组快速定位单细胞分析获得 marker 基因
单细胞数据分析可以预测到很多 marker 基因,但是并非所有 marker 基因都能被验证出来。
一部分原因是由于分析预测的 marker 基因具有假阳性的可能,一部分原因也是由于验证过程中没有明确的观测区域导致。
单细胞测序获得的亚型,往往需要复杂的免疫荧光验证,如果有空间转录组的数据,也可以快速整合,定位单细胞测序得到的亚群在空间中的位置。
三、 对比不同分组空间结果,深入挖掘单细胞数据
前面给大家建议的两种样本设计方案里,多张切片的方案中提到先做处理样本的空间转录组,毕竟大家更为关注处理之后组织类型的变化过程。
如果只做了处理样本的空间转录组的话,此时课题设计是以单细胞为主,空间为辅,文章中的讨论需要注意主次。
如果经费充足的话,建议同时补充对照组的空间转录组,对比不同类型样本之间空间信息的差异,可以深入探讨一系列的问题——
a) 空间结构是否具有明确区域划分?
b) 不同区域之间是否有特异性的 marker?
c) 单细胞分化发育轨迹和空间位置是否有关联?
d) 不同区域的细胞之间是否存在通讯关系?
单细胞和空间转录组都属于当今最前沿的科研技术。很多老师都希望在自己课题中运用这些前沿技术,以此可以快速发表高分文章。
但是就如上文所言,技术虽好,但正确运用才是关键。所以大家一定要在最开始设计好自己的课题思路,否则到最后只能「一场空」。