许多应用需要三维数据的理解
机器人、增强现实、自动驾驶、医学图像处理(CT、核磁共振)广泛应用前景和现实的应用基础
三维数据有多种表示方式:
多视角图片
体素网格
mesh数据(工业界)
深度图像(RGB-D)
上述的体素网格、mesh数据都可以通过点云转化得到
三维点云研究的任务,大致分为:形状分类、形状检索、关键点检测、形状匹配、、语义分割、三维目标检测、三维实例分割
多数任务需要高级别语义层次的形状理解
对三维点云进行深度学习,需要首先解决置换排列不变性。
解决思路:1. 将点云转化成规则的数据,然后使用CNN,2. 定义符合性能要求的点云卷积直接处理。
问题:复杂度高,信息丢失、遮挡影响
优势:
核心问题:
需要克服例如尺度、平移、旋转等刚体变换的鲁棒性
鲁棒性:
核心思想:通过多层感知器学习逐点的特征
解决了置换排列不变性
刚体变换鲁棒性
缺点:
核心思想:
针对点间关系进行建模
缺点:
通过在高维空间中进行最近邻查找,复杂度非常高
采样——>局部分组——>特征提取(共享的PointNet)
模仿了CNN学习范式:局部到全局
缺点:
局部模式学习未考虑点间关系
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OaZja9wz-1624082346063)(resources\网络结构分类图.png)]
非归纳式点云分割网络结构
点云规模不变!
连接共享MLP进行逐像素分类!
归纳式点云分割网络结构
关键问题:给定一个中心三维点和其邻域点,如何定点云卷积,得到中心点特征。
点云卷积:根据局部区域内所有点之间的关系,调整区域内点特征,调整后点特征再经过shared MLP+ max Pooling得到点云卷积结果。
核心思想:挖掘卷积邻域内所有点的特征差异,调整每个邻域点特征。
**点云卷积:**将邻域3D点投影至卷积中心点法平面,在二维平面对邻域点进行排序,根据排序顺序进行一维卷积,最后max pooling得到中心点特征。
**点云卷积:**将三维点邻域划分为若干个shell,根据shell的固有顺序特性,利用一维卷积提取特征。
点云卷积:
**点云卷积:**传统线性相乘,weight定义为若干个kernel point对应的weight的线性组合。
主要的学术贡献:在点云卷积操作上进行创新,我们将传统图像卷积操作泛化至不规则点云数据,在点云卷积中捕获局部点之间的相互关系,提取三维形状特征。
2D图像的关键信息,就是RGB信息的规则组合
3D点云的关键信息,就是空间分布信息(点与点之间的相互关系)。
CNN:以参考点为中心编码3D空间相对几何关系,推理学习隐含的形状。
第一步,点云分组,局部点云建模——>球形邻域(卷积操作的作用域,类似还有最近邻)(1. 中心参考点(点云采样)2. 邻居点(球内采样))
泛化卷积:
主要包括两部分:
相对关系特征加权+特征维度提升
相对几何信息 h i , j h_{i,j} hi,j可以灵活设置,比如:3D欧式距离,坐标差,坐标级联,以及其他几特性等等。
特性:
置换排列不变性,且实现了在每一个点上使用不同的权重
相对关系具备空间不变性,所以也对刚体变换鲁棒,比如3D欧式距离
显式建模点间交互
不同局部,权值共享
**主要学术贡献:**我们把图像领域的DenseNet思想推广至点云卷积网络,并通过一个分组的策略,解决了其复杂性问题,在性能、复杂度、计算速度达到了较好的平衡。
**基本思想:**点云卷积时,稠密融合多级别上下文信息,提取多元化的点云语义特征,提升特征的辨别能力。
DenseNet CVPR’17 Best Paper
核心思想:
密集连接,多次执行PConv操作,计算量大,显存需求大!
解决方法:
通过分组,保证输出通道不变的前提下,增加了网络层数,学习力增强。
点云语义分割方面,尤其是大规模点云语义分割任务中,点云采样策略和点云分组策略是非常重要的,因为目前多数使用的最远距离采样(fps)速度非常慢,无法适用于大规模语义分割任务,目前也有一些方法在关注这一个领域,比如说,random net ,目前点云深度学习领域正处于快速发展时期,但是目前的研究主要集中在点云卷积上,对于整体的网络结构研究还不是很多,图像CNN的经验非常值得借鉴,空洞卷积,残差连接。
总结:https://github.com/Yochengliu/awesome-point-cloud-analysis
截止到2021年的最新点云深度学习工作
https://github.com/NUAAXQ/awesome-point-cloud-analysis-2020