内容一览:20 世纪以来,干细胞与再生医学技术一直是国际生物医学领域的热点前沿之一。现如今,研究人员已开始探索将干细胞转变为特定类型细胞。然而,这一过程中干细胞会出现不规则生长或自发分化为不同类型细胞的情况,因此,如何控制干细胞的生长和分化成为研究人员面临的挑战之一。本文中,北京大学赵扬课题组等研究员尝试将机器学习应用于多能干细胞分化过程中,并有效改善了这一情况,同时为再生医学带来了新的方向。
关键词:多能干细胞 图像分析 机器学习
本文首发自 HyperAI 超神经微信公众平台~
多能干细胞 (pluripotent stem cell, PSC) 是一类具有自我更新、自我复制能力的多潜能细胞,其可以体外无限增殖和分化成各种细胞类型,替代受损细胞,促进受损组织功能恢复,为眼部疾病、心血管系统疾病及神经系统疾病等领域治疗带来了新希望。
然而,目前多能干细胞定向分化过程会出现细胞系间 (line-to-line) 和批次间 (batch-to-batch) 分化不稳定等问题,从而使制备功能性细胞耗时而费力,严重阻碍多能干细胞临床应用产品的研发及规模化制造。因此,实现对多能干细胞分化过程的实时监控显得尤为重要。
近日,北京大学赵扬课题组、张钰课题组联合北京交通大学刘一研课题组研发了一个基于活细胞明场动态图像和机器学习的分化系统,能够实时智能调节和优化多能干细胞分化过程,实现对功能性细胞的高效、稳定性生产。目前,该研究成果已发表在《Cell Discovery》期刊上,题目为《A live-cell image-based machine learning strategy for reducing variability in PSC differentiation systems》。
该研究成果已发表在《Cell Discovery》期刊上
论文地址:
https://www.nature.com/articles/s41421-023-00543-1
实验概述
目前,显微技术可以对细胞进行图像采集,机器学习方法可以对细胞图像进行分析。因此,本研究利用机器学习算法对明场图像中的细胞进行识别和分类,以确定它们的谱系或细胞成分,帮助研究人员更好地理解细胞 结构 和功能。
经验证,本研究成果可有效优化并且改进多能干细胞向心肌细胞 (cardiomyocyte, CM) 以及肝、肾嵌体细胞分化过程,整套研究方法及流程如下:
图 1:机器学习优化 PSC-to-CM
a:上半部分图显示,PSC 每个分化过程都存在变异性,下半部分图显示,机器学习应用于上述分化过程中,有效减少了变异性。
b:使用小分子调节剂调控 canonical Wnt 信号通路的 PSC-to-CM 分化过程,绿色箭头表示第一阶段调节 CHIR 的持续时间和浓度,彩色圆点表示机器学习的检查点。
c:10 天时间内,延迟明场图像和 cTnT 荧光结果。
d:整个过程中,分化成功和失败的细胞位置及形态。
e:成功分化细胞第 5 天到 12 天,纹理及形态变化。
f:分化效率的线对线变异性。
g:不同批次细胞分化变异性。
h:不同 CHIR 剂量,分化图像局部特征变化。
实验过程
实验数据集
研究人员以 PSC-to-CM 分化为主要示例,通过蔡司 Cell Discover 7 活细胞全自动成像平台,实时采集分化过程中的明场图像,追踪整个过程,如上图 1b 所示。分化结束时,通过 cTnT(一种心肌细胞的特异标志物)荧光标记识别成功分化的 CM。这个过程中,为了增加图像多样性,研究人员引入了几个变量(不同 PSC、初始细胞密度、分化培养基、不同 CHIR 剂量),最终收集了超 720 万张图像。
实验成果
结合活细胞成像技术和机器学习,本实验获得以下 4 点成果:
- 机器学习能准确识别分化细胞状态并预估分化效率。
研究人员发现在分化过程的第 6 天,最终能够成功分化成 CM 的细胞,即 CPC(心脏祖细胞)开始呈现纺锤型,**因此,他们采用弱监督模型识别了明场图像中的此类细胞,并将其命名为「图像识别心肌祖细胞(Image-Recognized CPC, IR-CPC) 。**如下图 2 所示,研究人员得出 IR-CPC 占总细胞比例与真实分化效率相关性达 88%。
图 2:IR-CPC 比例与真实分化效率相关性
同时,研究人员采用 pix2pix 深度学习模型对 CM 诱导阶段(即分化第一阶段)的明场图像进行预测,如下图所示,预测分化效率与真实分化效率相关性达 93%。
以上实验表明,机器学习能够识别分化不同阶段的细胞状态,并能对分化结果进行实时预测。
- 机器学习能实时预测分化时间和诱导因子浓度。
分化过程中,研究人员发现在中胚层阶段 (0-3 天),诱导物 CHIR99021 (CHIR) 的剂量(浓度与处理时间)对分化效率影响较大。 他们基于分化初期 (0-12h) 明场图像中与 CHIR 有关特征构建了一个逻辑 回归 模型,用来预测孔中 CHIR 浓度(偏低、适中、偏高),如下图所示,在选定 CHIR 处理时间为 24h 时,模型对每个孔(一种有多个小孔的实验室用品)浓度判断准确率达 93.1%。
图 4:模型对孔内 CHIR 浓度预测
同时,研究人员将不同 CHIR 处理时间 (24h、36h 或 48h) 下模型的预测结果(即偏差分数)进行比较,可以得到最优 CHIR 处理时间。如下图 5 所示,最优 CHIR 处理时间约为 12 小时(偏差分数最小)。此外,如图 6 所示,根据模型预测结果,还可以调整 CHIR 浓度,提高分化效率。
图 6:调整、未调整 CHIR 浓度的分化结果
以上实验表明,机器学习能实现对诱导剂剂量的干预。
- 机器学习能实时判断 PSC 起始分化的最佳状态。
研究人员发现即使在 CHIR 浓度适量的情况下,也会出现分化失败的细胞,他们提出这是由空间异质性 (spatially variable differentiation) 造成的,即分化第 0 天处于 PSC 集落边缘的细胞易成功,而位于 PSC 集落中心的细胞易失败。
对此,研究人员建立了基于随机森林的机器学习模型,用来识别分化成功率高的起始细胞图像特征,模型结果表明,细胞面积中等、边缘越长且越坑洼的细胞容易分化成功,这与实际观察一致。基于这个模型,研究人员发现通过识别起始 PSC 状态预测与真实分化效率的相关性达 76%,结果如下图 7 所示。
据此,研究人员还通过人工干预、改变细胞的起始形态,有效将分化效率从 21.6% ± 2.7% 提升至 88.8% ± 10.5% 。
以上结果表明,机器学习能对对 PSC 起始状态进行质控。
- 机器学习能帮助筛选小分子化合物,提高分化稳定性。
研究人员发现 CHIR 浓度是影响分化的重要因素之一,因此他们尝试开展小分子筛选,用新的化合物抵消不恰当的 CHIR 浓度。如下图所示,研究人员基于分化过程第 6 天的明场活细胞图像和已建立的弱监督模型,构建了小分子筛选平台,最终在 3,000 多个小分子中成功筛选出了 BI-1347 这一化合物。
图 8:机器学习筛选小分子化合物过程
以上实验表明,基于机器学习模型,研究人员可以建立一个小分子筛选平台,从而缩短筛选实验周期,降低筛选成本,并且通过这一技术筛选的小分子又拓宽了 CHIR 剂量范围,从而整体提高了 PSC 分化过程稳定性。
最后,为扩展应用场景,研究者将本研究成果应用在肾祖细胞和肝细胞分化早期阶段,同样取得了准确预测效果,可知,该研究成果能为多能干细胞分化过程提供实时指导。
细胞治疗:或成生物医药新赛道
细胞治疗是一种新兴的疗法,对众多疾病(癌症、遗传疾病)都展现出良好的治疗效果。其主要治疗方式分为免疫细胞治疗和干细胞治疗,其中,干细胞凭借其多向分化、免疫调节以及分泌细胞因子等功能,成为该领域的核心研究方向之一。
目前看来,我国细胞治疗领域发展较短,但未来前景却十分广阔。一方面,从数据上来看,未来十年或将成为该领域快速增长期。据相关数据预计,我国细胞治疗市场规模将由 2021 年的 13 亿元,增长至 2030 年的 584 亿元,年均增速高达 53%。另有数据显示,我国细胞和基因治疗市场有望在 2025 年达到 25.9 亿美元,以 276% 的复合增长率增长。
另一方面,各地政府也不断出台扶持、鼓励该领域的相关政策。 比如北京、上海、天津、深圳等地都在大力发展细胞治疗产业。上海推出《上海市促进细胞治疗科技创新与产业发展行动方案(2022—2024 年)》,提出力争到 2024 年上海细胞治疗产业规模达到 100 亿元。去年,深圳接连发布扶持生物医药产业发展的文件,将重点支持包括细胞治疗药物在内的产业集群高质量发展。
*数据集及代码地址:
https://GitHub.com/zhaoyanglab/ML-for-psc-differentiation*
参考链接:
[1]https://www.thepaper.cn/newsDetail_forward_23417694
[2]http://www.cls.edu.cn/Research/Research_Achievements6067.shtml
[3]https://stcsm.sh.gov.cn/zwgk/ghjh/20221104/f7b02ab5db40439e8d...
[4]http://legacy.frostchina.com/wp-content/uploads/2021/11/20211...
—— 完 ——
本文首发自 HyperAI 超神经微信公众平台\~