小乐数学科普:一个可精确表征形状的数学框架:可见性图

zzllrr小乐导读2021-2-5:本文由两篇相关的英文翻译构成,介绍了一种近期由马克斯·普朗克分子植物生理研究所科学家研发的分析形状的数学框架:可见性图Visibility Graph,以及相应的可视化工具GraVis(已在GitHub开源,基于Python),其背后的数学统计原理和详细实操案例,原文(一篇是国外科技小编对原作的简明科普介绍,一篇是原作者正式论文)分别来自:Science X旗下网站phys.org 2021-1-21,以及自然通讯杂志开放获取文章nature.com 2021-1-19

一、对该研究成果的简明科普介绍:

在自然界中,许多事物进化后,大小,颜色,以及尤其是形状都不同。尽管可以容易地描述物体的颜色或大小,但是形状的描述更为复杂。在《自然通讯》上发表的一项研究中,马克斯·普朗克分子植物生理研究所的杰奎琳·诺瓦克(Jacqueline Nowak)和她的同事们概述了一种基于网络表示法描述形状的新方法,该方法也可以用于重组和比较形状。

Jacqueline Nowak设计了一种新颖的方法,该方法依赖于基于网络的形状表示(称为可见性图visibility graph)以及用于分析形状的工具GraVis。可见性图表示对象的形状,该对象的形状由其周围的轮廓定义,GraVis背后的数学结构由围绕轮廓等距放置的一组节点指定。然后,节点通过不与形状边界交叉或对齐的边彼此连接。结果,测试所有节点对之间的连接将为分析的形状确定可见性图。

在本研究中,杰奎琳·诺瓦克(Jacqueline Nowak)使用可见性图和GraVis工具比较了不同形状。为了测试这种新方法的功能,将简单的三角形,矩形和圆形的可见性图,以及沙粒,鱼和树叶的复杂形状进行了比较。

通过使用不同的机器学习方法,他们证明了该方法可用于根据形状的复杂性来区分形状。此外,可见性图能够区分植物表皮细胞所显示形状的复杂性,其形状类似于拼图碎片。对于这些细胞,可以使用GraVis准确量化不同的形状参数,如瓣长,颈宽或细胞面积。GraVis项目负责人,"系统生物学与数学建模"研究组负责人,波茨坦大学的生物信息学教授Zoran Nikoloski说:“使用GraVis定量表皮细胞的叶数优于现有工具,这表明它是解决与形状分析有关的特定问题的有力工具。”

将来,科学家们希望利用表皮细胞和整个叶子的可见性图来获得影响形状的关键细胞过程的生物学见解。此外,通过GraVis量化的不同植物细胞的形状特征可以促进遗传筛选以确定形态发生的遗传基础。最后,GraVis的应用将有助于更深入地了解自然界中细胞与器官形状之间的相互关系。

二、该研究成果原文核心内容。

下面是译者对原作的翻译,有部分精简,完整内容可参看Nature网站公开的原文。

摘要

细胞的形状对于生物的功能和发育至关重要。然而,用于细胞形状定量,比较和分类的通用框架仍未得到开发。在这里,我们介绍了形状的可见性图表示,它有助于网络驱动的特征描述和跨不同领域遇到的形状的分析。以叶子表皮细胞的复杂形状为例,我们证明了我们的框架可以准确地量化细胞的突起和内陷,并且与竞争方法相比,还可以提供其他功能。我们进一步表明,能见度图的结构特性可用于量化表皮细胞形状的复杂性,并允许将植物分类到各自的系统演化分枝。

引言

自然界有无数种形状,但是了解它们的起源和演变仍然是一个挑战。不仅在多细胞真核生物的类别之间观察到形状上的差异,而且还在其单个细胞的水平上发现了形状上的差异。细胞的形状从简单到高度复杂,在发育过程中会发生变化。细胞形状被认为是亚细胞过程和作用于细胞上的力的综合结果,通常决定了细胞的功能。定量形状描述符的发展是能够比较细胞形状并探究它们与细胞过程的关系以及对细胞功能的影响的第一步。因此,形状的定量描述符必须足够丰富:(i)获得形状差异的全局见解;(ii)指定各个形状的关键特征;以及(iii)用电脑精确地重建的细胞形状。

可以基于两类全局描述符比较形状:基于区域的,量化关键形状属性(例如,面积,凸包,偏心率,中轴线及其组合)和基于边界的(例如,傅里叶描述符)。可以通过以下两种主要方法之一来获得形状的描述符:结构(离散)方法(将形状划分为多个子部分)和全局(连续)方法(用于整体分析形状)。生成的描述符有助于比较细胞形状,但可能会基于所使用描述符的属性引入偏差。例如,基于区域的描述符之间的距离进行比较依赖大小尺寸,因此不适合进行发育研究。虽然基于区域的描述符的比率克服了这个问题,但它们为形状比较提供了极有限的信息。沿形状边界定位的地标的使用有助于更容易地比较形状,尽管必须叠加不同形状的地标以考虑缩放,旋转和平移。此外,由于在细胞形状中缺少公共界标,因此必须手动放置这些点或通过任意采样放置这些点,从而使自动分析具有挑战性。

一种更复杂的基于边界的描述符通过应用傅里叶变换,将封闭的二维形状边界转换为椭圆的总和。生成的描述符是相似性不变的,导致形状描述符独立于形状旋转,方向和缩放。另一类型的基于尺寸和方向不变的边界的形状描述符,将二维形状表征为遵循自回归模型方法的顺序边界样本的线性组合。但是,这些描述符在同时解决形状比较,关键特性确定和细胞形状复杂性表征的通用性方面仍然不足。

出现在许多植物的子叶和叶表皮上的拼图状表皮细胞代表具有特定局部特征的复杂细胞形状。这些局部特征由细胞边界的凸起部分(即细胞突起,称为叶瓣lobe)和称为颈部(neck)的内陷区域给出。叶瓣和颈已被用来比较表皮细胞形状的差异。尽管努力制定描述符同时识别跨不同类群表皮细胞之间的差异和准确地表征其局部形状,基于黄金标准的性能比较分析是罕见的。这种努力可被视为理解细胞化过程在复杂细胞涌现中作用的一个必要步骤。在这里,我们提出了一种独特的基于网络的形状表示形式,称为可见性图,其属性可以同时用作全局和局部形状描述符。我们将相应的框架称为GraVis。

结论

可见度图是基于图形的形状表示

a)形状的轮廓。节点(蓝色)沿轮廓线等距放置,并用于创建可见性图。如果两个节点可以“彼此看到”,则它们在可见性图中连接在一起,即,连接它们的线段不交叉或不与轮廓线对齐(底边);否则,节点将无法看到彼此(橙色边缘)。节点之间的边缘可以根据其边缘长度(欧氏距离)加权。

b)a中细胞的可见性图的可视化。

c)可见性图a的加权和缩放邻接矩阵的热图,其中权重为零的边缘表示不存在所述边缘,因此表示节点之间的“不可见性”。加权可见性图用于局部特征提取,而未加权图用于全局形状描述和形状比较。

可见度图的比较

a根据从未加权邻接矩阵A获得的拉普拉斯算子L的频谱(即特征值分布)λ比较两个可见性图。柯尔莫可洛夫-斯米洛夫统计量(Kolmogorov–Smirnov检验)用于量化两个频谱分布之间的差异。

bd通过该过程获得的聚类树状图,该过程由一组合成的,简单的三角形,圆形和矩形形状组成,其中b的节点数相同

c在形状的网络表示之间的节点数可变

d可变数量的节点,使用模块化聚类将其简化为具有相同数量的节点。

可见度图作为形状的全局描述符

基于其拉普拉斯算子的光谱的可见性图之间的距离可用于多元分析和可视化,以区分相似形状的不同组。我们展示了从三个不同的领域的形状的主成分分析:a砂粒,b鱼形状和c叶形状

可见度图量化了表皮细胞的复杂性

a发芽后96小时的拟南芥表皮细胞的显微镜图像示例(单个图像)。

b原始显微镜图像可以通过绘制所有检测到的表皮细胞的可见性图并根据它们的相对完全性(δ)对其进行加权来重建,该相对完全性由相应可见性图的相对密度计算得出。与较复杂的表皮细胞形状(深橙色)相比,像气孔这样的简单圆形形状具有相对较小的相对完全性(白色)。

可见度图的集中度度量可表征局部形状特征

ab为可见性图的节点计算接近度中心度,并通过不同的节点大小对其进行可视化。

c叶瓣(浅蓝色节点)和颈部(深蓝色节点)分别对应于沿轮廓线的局部最小值和最大值。

GraVis准确量化叶瓣数

我们基于网络的框架GraVis依赖于不同的网络属性来分析形状。接下来,我们用三种GraVis的竞争检测工具进行比较,即:LobeFinder,PaCeQuant和LOCO-EFA。所有这三个工具都使用基于边界的方法来检测表皮细胞的叶瓣:LobeFinder使用基于凸包的算法来识别叶瓣位置。PaCeQuant通过寻找轮廓曲率方向的局部变化来检测叶瓣,而LOCO-EFA使用高级椭圆傅里叶分析,其中轮廓被分解为一组唯一系数。后者的叶瓣数可以从显示特定模式贡献的椭圆轮廓推断出来。

GraVis区分转基因品系对表皮细胞形状的影响

为了显示GraVis在检测表皮细胞中局部特征的差异方面功能强大,我们使用了不同的基因改造品系,其中叶瓣和颈部的数量和大小受到影响。

GraVis将植物分类为系统演化分枝

植物可以根据其叶形分为不同类群。然而,尚不清楚单个细胞的形状是否也允许准确分类。为了验证这一假设,我们将GraVis与机器学习方法结合使用,对来自不同维管植物演化分枝的表皮细胞进行分类。

你可能感兴趣的:(小乐数学科普:一个可精确表征形状的数学框架:可见性图)