【今日CV 计算机视觉论文速览 第141期】Mon, 8 Jul 2019

今日CS.CV 计算机视觉论文速览
Mon, 8 Jul 2019
Totally 33 papers
?上期速览✈更多精彩请移步主页

【今日CV 计算机视觉论文速览 第141期】Mon, 8 Jul 2019_第1张图片

Interesting:

?BigBiGAN大规模的对抗表示学习方法, 研究人员将图像生成质量转换为了改进表示学习表现上去,基于Biggan 提出了Bigbiggan模型。通过增加编码器和改进的判别器拓展了模型的表示能力,实现了良好的生成效果。(from deepmind)
【今日CV 计算机视觉论文速览 第141期】Mon, 8 Jul 2019_第2张图片
生成的新图像和结果:

【今日CV 计算机视觉论文速览 第141期】Mon, 8 Jul 2019_第3张图片

?深度图像修复, 为了解决深度图的缺失问题,研究人员提出了一种基于双图正则化的快速低秩矩阵补全方法。将深度图修复问题变成了低秩矩阵的补全问题。利用局域和非局域的图正则化来协同解决,局域图可以保证局部的相似性,非局域图可以探索rgb和深度图在梯度的连续性。最后使用了高速的方法来实现。(from HIT哈工大)
【今日CV 计算机视觉论文速览 第141期】Mon, 8 Jul 2019_第4张图片
恢复的结果:
【今日CV 计算机视觉论文速览 第141期】Mon, 8 Jul 2019_第5张图片
去噪方法Block match 3D,BM3D虽然PSNR很好,但是过度平滑忽略了很多细节:
【今日CV 计算机视觉论文速览 第141期】Mon, 8 Jul 2019_第6张图片
ref:http://www.cs.tut.fi/~foi/GCF-BM3D/

?科幻电影角色网络的综述, (from Laboratoire Informatique d’Avignon Fr)
【今日CV 计算机视觉论文速览 第141期】Mon, 8 Jul 2019_第7张图片

?C^3 Framework开源的人群密度检测框架, 包括了基准网络、灵活的参数和策略配置、试验系统(from 西工大 浙大)
【今日CV 计算机视觉论文速览 第141期】Mon, 8 Jul 2019_第8张图片
code:https://github.com/gjy3035/C-3-Framework
blog:https://zhuanlan.zhihu.com/p/65650998

?测量深度学习中的数据效率,HiGSFA), 分级信息保持基于图的慢特征分析(hierarchical information-preserving graph-based slow feature analysis),(from 鲁尔大学)
omniglog dataset:https://github.com/brendenlake/omniglot
语言文字百科涵盖了已知的全部书写系统,各种文字抽象:http://www.omniglot.com/
https://www.kamon18.com/cart/goodslist.cgi?in_kate=1
https://www.zhihu.com/question/67007477/answer/316722531

TL;NR
基于动作姿态来联系艺术形式
用于高效三维学习的点体素cnn
+++全通道叠加的图像超分辨
+++快速通用的图像迁移用于照片艺术渲染
非监督的循环连续形变用于形状匹配
基于多级小波的图像超分辨
尺度注意力的航空图像分割
+++++细粒度图像分析综述
++++基于高斯噪声学习的盲去噪
tracknet高速小物体的追踪


Daily Computer Vision Papers

A Novel Deep Learning Pipeline for Retinal Vessel Detection in Fluorescein Angiography
Authors Li Ding, Mohammad H. Bawany, Ajay E. Kuriyan, Rajeev S. Ramchandran, Charles C. Wykoff, Gaurav Sharma
虽然深度学习的最新进展已经显着提高了彩色眼底CF图像中血管检测的现有技术水平,但是由于缺乏标记的地面真实数据集,在荧光素血管造影FA中检测血管的成功已经受到阻碍。我们提出了一种新的管道,使用深度神经网络检测FA图像中的视网膜血管,通过在循环学习中结合两种关键组件交叉模态转移和人类来减少生成标记的地面实况数据所需的工作量。交叉模态转移同时利用捕获的CF和眼底FA图像。首先利用预先训练的神经网络从CF图像中检测二元血管图,然后通过稳健的参数倒角对准几何配准并转移到FA图像,以用无监督技术获得初步的FA血管检测。使用转移的血管作为深度学习的初始地面实况标签,循环方法中的人通过在深度学习和标记之间迭代来逐步提高地面实况标签的质量。该方法显着减少了手动标记工作,同时增加了参与我们强调了所提方法的几个重要考虑因素,并验证了三个数据集的性能。实验结果表明,所提出的管道显着减少了注释工作量,并且由此产生的深度学习方法显着优于现有的FA容器检测方法。引入了一个新的公共数据集RECOVERY FA19,其中包括高分辨率超宽视场图像和精确标记的地面真实二元船舶地图。

A Performance Evaluation of Correspondence Grouping Methods for 3D Rigid Data Matching
Authors Jiaqi Yang, Ke Xian, Peng Wang, Yanning Zhang
寻求3D刚性数据点云,网格或深度图之间一致的点对点关系是3D计算机视觉中的基本问题。虽然近年来已经提出了许多对应选择方法,但是它们的优点和缺点在不同的应用和扰动方面仍然不清楚。为了填补这一空白,本文对9种最先进的3D对应分组方法进行了综合评估。一个好的对应分组算法有望从初始特征匹配中检索到多个内点,从而提高精度和召回率,并促进准确的变换估计。针对这一规则,我们在具有不同应用背景的三个基准测试上进行实验,包括形状检索,三维物体识别和点云配准以及各种扰动,如噪声,点密度变化,杂波,遮挡,部分重叠,不同尺度的初始对应,以及关键点检测器和描述符的不同组合。丰富多样的应用场景和滋扰导致不同的空间分布和初始特征对应的内部比率,从而能够进行全面评估。根据结果​​,我们总结了评估方法的特点,优点和缺点,并指出了一些潜在的未来研究方向。

Distilling with Residual Network for Single Image Super Resolution
Authors Xiaopeng Sun, Wen Lu, Rui Wang, Furui Bai
最近,深度卷积神经网络CNN在单图像超分辨率SISR方面取得了显着进展。然而,盲目地使用残余结构和密集结构从LR图像中提取特征,可能导致网络膨胀并且难以训练。为了解决这些问题,我们提出了一种简单有效的SISR残余网络DRN提取方法。详细地,我们提出了包含两个分支的残余蒸馏块RDB,而一个分支执行剩余操作而另一个分支提取有效信息。为了进一步提高效率,我们通过堆叠一些RDB和一个长跳过连接来设计剩余蒸馏组RDG,这可以有效地提取局部特征并将它们与全局特征融合。这些有效的特征有益于图像重建。基准数据集上的实验表明,我们的DRN优于最先进的方法,特别是在性能和​​模型大小之间有更好的权衡。

Depth Restoration: A fast low-rank matrix completion via dual-graph regularization
Authors Wenxiang Zuo, Qiang Li, Xianming Liu
作为一种真实的场景感知方法,深度信息获得了广泛的应用。然而,由于深度感测技术的限制,在实践中捕获的深度图通常在很多像素处遭受可怕的噪声和缺失值。在本文中,我们提出了通过双图正则化进行深度恢复的快速低秩矩阵完成。具体地,深度恢复可以转换为低秩矩阵完成问题。为了完成低秩矩阵并将其恢复到深度图,所提出的包含局部和非局部图正则化的双图方法分别利用深度图的局部相似性和深度颜色对应物的梯度一致性。此外,由于封闭形式的解决方案,所提出的方法实现了高速深度恢复。实验结果表明,所提出的方法在客观和主观质量评估方面均优于现有技术方法,特别是对于严重的深度退化。

Visual Appearance Analysis of Forest Scenes for Monocular SLAM
Authors James Garforth, Barbara Webb
单目同时定位和映射SLAM是一种廉价且节能的方式,使无人驾驶飞行器无人机能够安全地导航托管森林并收集对监测树木健康至关重要的数据。然而,SLAM研究主要是在结构化的人类环境中进行的,因此很难适应非结构​​化的森林。在本文中,我们比较了最先进的单眼SLAM系统在森林数据上的表现,并使用视觉外观统计来描述森林与其他环境之间的差异,包括逼真的模拟森林。我们发现SLAM系统除了最简单的森林地形之外都很困难,并且识别照明变化的关键属性以及区分森林场景和经典城市数据集的场景运动。这些差异可以深入了解是什么让森林难以映射并为有针对性的改进开辟道路。我们还证明,即使是对人眼看起来令人印象深刻的模拟也无法正确反映他们模拟的环境的困难属性,并提供更接近模仿自然场景的建议。

Benchmarking unsupervised near-duplicate image detection
Authors Lia Morra, Fabrizio Lamberti
无监督的近似重复检测具有许多实际应用,从社交媒体分析和网络规模检索到数字图像取证。它需要对从图像中提取的一组描述符运行阈值限制查询,目的是识别所有可能的近似重复,同时限制由于视觉上相似的图像引起的误报。由于误报率随着数据集大小而增长,因此需要非常高的特异性,对于实际用例而言高达1 10 9这一重要要求,然而,在文献中经常被忽略。近年来,基于深度卷积神经网络的描述符在基于内容的图像检索任务中已经匹配或超越了传统的特征提取方法。据我们所知,我们是第一次尝试建立基于深度学习的描述符的性能范围,用于在一系列数据集上进行无监督的近似重复检测,包括广泛的近似重复定义。我们利用既定基准和新基准,例如Mir Flick Near Duplicate MFND数据集,其中为一般的大规模图像集合中的所有可能对提供已知的基础事实。为了比较不同描述符的特异性,我们将无监督检测的问题减少到近似重复与非重复图像的二元分类的问题。后者可以使用接收器操作曲线ROC方便地表征。我们的研究结果总体上倾向于选择微调深度卷积网络,而不是使用现成的特征,但高特异性设置的差异取决于数据集并且通常很小。在MFND基准测试中观察到最佳性能,在误差率为1.43倍10 6时达到96灵敏度。

AI-based evaluation of the SDGs: The case of crop detection with earth observation data
Authors Natalia Efremova, Dennis West, Dmitry Zausaev
对于应用人工智能AI的开发人员和研究人员来说,17个可持续发展目标的框架是一个挑战。人工智能和地球观测EO可以提供可靠和分类的数据,以便更好地监测可持续发展目标可持续发展目标。在本文中,我们概述了SDG目标,可以使用AI工具进行有效测量。我们确定具有AI和EO最重要贡献的指标,并描述将最先进的机器学习模型应用于其中一个指标。我们描述了U net与SE块的应用,用于有效分割用于作物检测的卫星图像。最后,我们演示了如何在直接促成特定可持续发展目标的解决方案中更有效地应用人工智能,并提出进一步研究基于人工智能的可持续发展目标评估基础设施。

Self-Supervised Learning for Cardiac MR Image Segmentation by Anatomical Position Prediction
Authors Wenjia Bai, Chen Chen, Giacomo Tarroni, Jinming Duan, Florian Guitton, Steffen E. Petersen, Yike Guo, Paul M. Matthews, Daniel Rueckert
近年来,卷积神经网络已经改变了医学图像分析领域,因为它们具有学习各种分类和回归任务的判别图像特征的能力。然而,成功地学习这些特征需要大量的手动注释数据,这些数据的获取成本高并且受专家图像分析员的可用资源的限制。因此,无监督,弱监督和自监督的特征学习技术受到很多关注,其目的在于利用大量可用数据,同时避免或大大减少手动注释的工作量。在本文中,我们提出了一种训练心脏MR图像分割网络的新方法,其中通过预测解剖位置以自我监督的方式学习特征。解剖位置用作监控信号,不需要额外的手动注释。我们证明这个看似简单的任务为特征学习提供了强大的信号,并且通过自我监督学习,我们实现了比从头开始训练的U网更好或相当的高分割精度,特别是在小数据设置下。当仅有五个带注释的对象可用时,与基线U net相比,所提出的方法将短轴图像分割的平均Dice度量从0.811改善到0.852。

A Spectral Approach to Unsupervised Object Segmentation in Video
Authors Elena Burceanu, Marius Leordeanu
我们在视频中将对象分割制定为空间和时间中的图分区问题,其中节点是像素,它们的关系形成局部邻域。我们声称此像素级图中最强的聚类表示显着对象分割。我们使用一种新颖且快速的3D滤波技术来计算主要聚类,该技术可以找到谱聚类解,即图的邻接矩阵的主要特征向量,而无需明确构建明确的矩阵,这将是难以处理的。我们的方法基于功率迭代来寻找矩阵的主特征向量,我们证明它相当于在时空特征体积中执行一组特定的3D卷积。这使我们可以避免创建矩阵并在GPU上实现快速并行实现。我们证明了我们的方法也适用于视频流的在线处理,同时比直接应用于邻接矩阵的经典幂迭代要快得多。与其他作品不同,我们的方法致力于在像素级别保持空间和时间的对象一致性。为此,它需要在帧级别具有强大的像素功能。这使得它非常适合用作现有分段算法的输出功能并快速改进其解决方案,而无需任何其他监督。在实验中,我们使用相同的超参数集获得了对DAVIS 2016数据集的最新技术方法的一致改进,无论是在无监督和半监督任务中。

C^3 Framework: An Open-source PyTorch Code for Crowd Counting
Authors Junyu Gao, Wei Lin, Bin Zhao, Dong Wang, Chenyu Gao, Jun Wen
该技术报告试图提供在人群计数领域提出的有效且可靠的试剂盒,其被表示为人群计数代码框架C 3 F. C 3 F的贡献是三倍1提出了一些实体基线网络,这些网络已经达到了现有技术水平。 2提供了一些灵活的参数设置策略以进一步提升性能。 3开发了一个强大的日志系统来记录实验过程,这可以提高每个实验的可重复性。我们的代码在网址上公开发布

Prior Activation Distribution (PAD): A Versatile Representation to Utilize DNN Hidden Units
Authors Lakmal Meegahapola, Vengateswaran Subramaniam, Lance Kaplan, Archan Misra
在本文中,我们介绍了先前激活分布PAD的概念,作为一种通用的通用技术,用于捕获用于分类任务的深度神经网络的隐藏层单元的典型激活模式。我们表明,这种隐藏层的组合神经激活具有类特定的分布特性,然后定义多个统计测量来计算测试样本的激活偏离这些分布的程度。使用包括MNIST,CIFAR10,Fashion MNIST notMNIST在内的各种基准数据集,我们展示了如何使用这种基于PAD的测量,独立于任何训练技术,推导细粒度不确定性估计推断b提供与需要的替代方案竞争的推理准确性执行完整的管道,并且c可靠地隔离出分布测试样本。

Primate Face Identification in the Wild
Authors Ankita Shukla, Gullal Singh Cheema, Saket Anand, Qamar Qureshi, Yadvendradev Jhala
由于快速的城市化和森林砍伐造成的生态不平衡对几种野生动物的种群产生了不利影响。这种栖息地的丧失使一些非人类灵长类物种如黑猩猩和猕猴的种群倾斜,并限制它们在人类定居点附近共存,经常在争夺资源时导致人类野生动物的冲突。为了有效开展野生动物保护和冲突管理,有必要定期监测人口和冲突地区。然而,诸如用于数据收集的现场访问和由专家进行的手动分析的现有方法是资源密集的,繁琐且耗时的,因此需要自动的,非侵入性的,更有效的替代方案,例如基于图像的面部识别。个人识别中的挑战是由于不受控制的环境导致的姿势,照明变化和遮挡等不相关因素而产生的,有限的训练数据进一步加剧了这种挑战。受人类感知的启发,我们建议学习对这些烦扰因素具有鲁棒性的表示,并捕捉个体身份子流形的相似性概念。所提出的方法,灵长类人脸识别PFID,通过训练网络来区分正负图像对来实现这一点。 PFID损失通过成对损失增加标准交叉熵损失,以学习更多的判别性和可推广特征,从而使其适用于其他相关的识别任务,如开集,闭集和验证。我们根据分类,验证,闭集识别和开放集识别四个协议报告了两种灵长类动物,恒河猴和黑猩猩的面部识别的最新准确度。

A Survey of Pruning Methods for Efficient Person Re-identification Across Domains
Authors Hugo Masson, Amran Bhuiyan, Le Thanh Nguyen Meidine, Mehrsan Javan, Parthipan Siva, Ismail Ben Ayed, Eric Granger
近年来,为人们重新识别等视觉识别任务提出的深度学习架构大幅增加,其中必须通过多个分布式摄像机识别个人。尽管深暹罗网络已经极大地提高了现有技术的准确性,但用于特征提取的CNN的计算复杂性仍然是一个问题,阻碍了它们在具有有限资源的平台上或在具有实时约束的应用中的部署。因此,在不显着降低其精度的情况下压缩这些架构具有明显的优势。本文提供了适用于压缩应用于人员识别的深暹罗网络的最新修剪技术的调查。根据它们的修剪标准和策略,并根据不同的设计方案分析这些技术,以利用修剪方法来针对目标应用微调网络。使用具有ResNet特征提取器的Siamese网络和多个基准识别数据集获得的实验结果表明,修剪可以在保持高精度的同时显着降低网络复杂性。在使用大型预训练或微调数据集执行剪枝的情况下,ResNet特征提取器所需的FLOPS数量减少一半,同时在原始模型的1中保持相当的1级精度。在训练较大的CNN时修剪也可以提供比微调CNN更好的性能。

Attentive Context Normalization for Robust Permutation-Equivariant Learning
Authors Weiwei Sun, Wei Jiang, Eduard Trulls, Andrea Tagliasacchi, Kwang Moo Yi
计算机视觉中的许多问题需要以点云的形式处理稀疏的非结构化数据。置换等变网络已经成为一种流行的解决方案,它们利用简单的感知器操作单个数据点,并利用全局池化策略提取上下文信息。在本文中,我们提出了Attentive Context Normalization ACN,这是一种简单而有效的技术,可以构建对异常值具有鲁棒性的置换等变网络。具体来说,我们将展示如何使用在网络中估计的权重来标准化要素图,以便从标准化中排除异常值。我们使用这种机制通过组合它们来利用局部和全局两种类型的关注,我们的方法能够在高维空间中找到基本数据点以解决给定任务。我们通过大量实验证明,与噪声和异常值存在下相机姿态估计,稳健拟合和点云分类相比,我们的方法(我们称之为Attentive Context Networks ACNe)提供了性能的显着飞跃。

Large Scale Adversarial Representation Learning
Authors Jeff Donahue, Karen Simonyan
经过对侧训练的生成模型GAN最近获得了引人注目的图像合成结果。但是,尽管在使用GAN进行无监督表示学习方面取得了初步成功,但它们已经被基于自我监督的方法所取代。在这项工作中,我们表明图像生成质量的进步转化为显着改善的表示学习性能。我们的方法BigBiGAN建立在最先进的BigGAN模型之上,通过添加编码器和修改鉴别器将其扩展到表示学习。我们广泛评估了这些BigBiGAN模型的表示学习和生成功能,证明了这些基于生成的模型在ImageNet上的无监督表示学习以及无条件图像生成方面实现了最先进的技术。

High-throughput Onboard Hyperspectral Image Compression with Ground-based CNN Reconstruction
Authors Diego Valsesia, Enrico Magli
航天器上的高光谱图像的压缩是有限的计算资源与光学仪器的不断增长的空间和光谱分辨率之间的折衷。因此,它需要具有良好速率失真性能和高吞吐量的低复杂度算法。近年来,空间数据系统咨询委员会CCSDS侧重于基于预测编码的无损和近无损压缩方法,从而产生了最近公布的CCSDS 123.0 B 2推荐标准。虽然量化预测残差的环路重建为近无损操作模式提供了极好的速率失真性能,但是由于数据依赖性,它显着地限制了可实现的吞吐量。在本文中,我们研究了基于图像预量化的快速方法的性能,然后是无损预测压缩器。虽然众所周知这是次优的,但是可以利用强大的信号模型来重建地面部分的图像,从而恢复部分次优性。特别地,我们表明卷积神经网络可用于此任务,并且它们可以恢复以每像素2比特的比特率引起的整个SNR下降。

Detecting and Diagnosing Adversarial Images with Class-Conditional Capsule Reconstructions
Authors Yao Qin, Nicholas Frosst, Sara Sabour, Colin Raffel, Garrison Cottrell, Geoffrey Hinton
对抗性示例提出了关于神经网络模型是否对与人类相同的视觉特征敏感的问题。大多数用于减轻对抗性示例的方法随后被更强大的攻击所击败。受这些问题的驱使,我们采用不同的方法,并建议基于输入的类条件重建来检测对抗性示例。我们的方法使用作为Capsule Networks CapsNets的一部分提出的重建网络,但是通常足以应用于标准卷积网络。我们发现对抗性或其他损坏的图像导致比正常输入更大的重建误差,通过阈值化重建误差提示简单的检测方法。基于这些发现,我们提出了重建攻击,其寻求导致错误分类和低重建误差。虽然这种攻击会产生未被发现的对抗性示例,但我们发现对于CapsNets而言,由此产生的扰动会导致图像在视觉上更像目标类。这表明CapsNets利用了与人类感知更加一致的特征,并解决了对抗性例子引发的核心问题。

Visualizing Uncertainty and Saliency Maps of Deep Convolutional Neural Networks for Medical Imaging Applications
Authors Jae Duk Seo
深度学习模型现在用于许多不同的行业,而在某些领域,安全性不是医学领域的关键问题,这是一个巨大的问题。不仅如此,我们希望模型能够很好地概括,但我们也希望知道模型对其决策的信心以及哪些特征最重要。我们的团队旨在开发一个完整的管道,其中不仅显示模型决策的不确定性,而且还显示输入图像的哪些像素组对预测贡献最大的显着性图。

Improved local search for graph edit distance
Authors Nicolas Boria, David B. Blumenthal, S bastien Bougleux, Luc Brun
图形编辑距离GED测量两个图形之间的不相似性,作为将一个图形转换为另一个图形的基本操作序列的最小成本。该措施在许多领域是基础,例如结构模式识别或分类。但是,确切地计算GED是NP难的。在提出用于计算近似解的不同类型的启发式算法中,基于局部搜索的算法为GED提供了最紧密的上界。在本文中,我们介绍K REFINE和RANDPOST。 K REFINE推广并改进了现有的局部搜索算法,在小图上表现尤为出色。 RANDPOST是一个通用的热启动框架,随机生成有希望的初始解决方案,供任何基于本地搜索的GED算法使用。它在大型图表上特别有效。广泛的实证评估表明,K REFINE和RANDPOST在实践中都表现出色。

Generating large labeled data sets for laparoscopic image processing tasks using unpaired image-to-image translation
Authors Micha Pfeiffer, Isabel Funke, Maria R. Robu, Sebastian Bodenstedt, Leon Strenger, Sandy Engelhardt, Tobias Ro , Matthew J. Clarkson, Kurinchi Gurusamy, Brian R. Davidson, Lena Maier Hein, Carina Riediger, Thilo Welsch, J rgen Weitz, Stefanie Speidel
在医学领域,缺乏大型训练数据集和基准通常是训练深度神经网络的限制因素。与昂贵的手动标签相比,计算机模拟可以用最少的手动工作生成大而完全标记的数据集。但是,经过模拟数据训练的模型通常无法很好地转换为真实场景。为了弥合模拟和真实腹腔镜图像之间的领域差距,我们利用了不成对图像到图像翻译的最新进展。我们将图像转换为图像转换方法,以基于来自简单腹腔镜模拟的图像生成多种逼真的合成图像。通过合并手段确保在翻译过程中保留图像内容,我们确保为模拟图像提供的标签对于其逼真的翻译仍然有效。这样,我们就能够生成具有逼真外观的大型,完全标记的腹腔镜图像合成数据集。我们表明,该数据集可用于训练腹腔镜图像肝脏分割任务的模型。在没有手动标记单个腹腔镜图像的情况下,我们在一些患者中实现了高达0.89的平均骰子评分,并且表明使用我们的合成数据预训练模型可以极大地改善他们的表现。合成数据集将公开提供,使用分割图,深度图,法线贴图以及工具和相机的位置进行完全标记

A new method for determining the filled point of the tooth by Bit-Plane Algorithm
Authors Zahra Alidousti, Maryam Taghizadeh Dehkordi
到目前为止,研究人员已经在他们的牙齿图像研究中应用了分割技术,并对牙根长度和深度进行了构建。在本文中,提出了一种精确识别牙齿填充点的新方法。在该方法中,通过在OPG图像上应用位平面算法来检测填充的牙齿。所提方法的新颖之处在于我们可以将其用于医学中用于检测牙科填充物,并且我们计算并呈现填充点的面积,这可以帮助牙医评估牙齿的填充点。由牙医确认的实验结果清楚地表明,该方法能够将填充点与其余健康牙齿完全分开。

Cardiac MRI Segmentation with Strong Anatomical Guarantees
Authors Nathan Painchaud, Youssef Skandarani, Thierry Judge, Olivier Bernard, Alain Lalande, Pierre Marc Jodoin
最近的出版物表明,应用于心脏MRI的现代卷积神经网络CNN的分割精度可以达到专家间的变异性,在这一研究领域取得了很大的成就。然而,尽管取得了这些成功,但CNN仍然会产生解剖学上不准确的分割,因为即使使用先前的形状,它们也不能保证其结果的解剖学合理性。在本文中,我们提出了一种心脏MRI分割方法,该方法总能产生解剖学上合理的结果。该方法的核心是对抗变分自动编码器aVAE,其潜在空间编码光滑的歧管,其上有大量有效的心脏形状。该aVAE用于自动地将解剖学上不准确的心脏形状扭曲成接近但正确的形状。我们的方法可以适应任何心脏分割方法,并将其解剖学上难以置信的结果转换为合理的结果,而不会影响其整体几何和临床指标。通过我们的方法,CNN现在可以产生在专家间变异性内并且在解剖学上总是合理的结果。

Incremental Concept Learning via Online Generative Memory Recall
Authors Huaiyu Li, Weiming Dong, Bao Gang Hu
随着时间的推移,逐步到达数据学习越来越多的概念的能力对于终身学习系统的发展至关重要。然而,当不断学习新概念时,深度神经网络常常会忘记先前学过的概念,这被称为灾难遗忘问题。灾难性遗忘的主要原因是过去的概念数据不可用,并且在逐步学习新概念的过程中神经权重会发生变化。在本文中,我们提出了一种基于伪排练的类增量学习方法,使神经网络能够不断学习新概念。我们使用条件生成对抗网络来巩固旧概念记忆并在学习新概念期间回忆伪样本,并且平衡的在线记忆回忆策略是最大限度地维持旧记忆。我们设计了一个可理解的增量概念学习网络以及一个概念对比损失来减轻神经权重变化的幅度。我们评估了针对MNIST,Fashion MNIST和SVHN数据集的建议方法,并与其他基于排练的方法进行了比较。广泛的实验证明了我们的方法的有效性。

Degenerative Adversarial NeuroImage Nets: Generating Images that Mimic Disease Progression
Authors Daniele Ravi, Daniel C. Alexander, Neil P. Oxtoby
模拟代表神经退行性疾病的图像对于预测患者结果和验证疾病进展的计算模型是重要的。这种能力对于结果和筛查标准涉及神经影像学的二级预防临床试验是有价值的。传统的计算方法受限于强加萎缩的参数模型,并且对资源要求极高。深度学习的最新进展已经产生了用于纵向研究的数据驱动模型,例如能够实时生成合成图像的面部老化。类似的解决方案可用于模拟大脑萎缩的轨迹,但需要解决新的挑战以确保准确的疾病进展建模。在这里,我们提出退行性对抗性NeuroImage Net DaniNet一种新的深度学习方法,学习模拟神经退行性成像对MRI的影响。 DaniNet使用一组基础支持向量回归SVR进行训练,以捕获伴随疾病进展的区域强度变化模式。 DaniNet生成整个输出图像,由2D MRI切片组成,其被约束以匹配来自SVR的区域预测。 DaniNet还能够调节非成像特征年龄,诊断等的进展,同时保持个体独特的脑形态。对抗训练可确保逼真的大脑图像和平滑的时间进展。我们使用从阿尔茨海默氏病神经影像学计划ADNI数据集中提取的9652 T1加权纵向MRI训练我们的模型。我们对来自ADNI的1283幅图像的单独测试集进行定量和定性评估,证明DaniNet能够生成模拟疾病进展的准确且令人信服的合成图像。

Data Efficient Unsupervised Domain Adaptation for Cross-Modality Image Segmentation
Authors Cheng Ouyang, Konstantinos Kamnitsas, Carlo Biffi, Jinming Duan, Daniel Rueckert
深度学习模型训练来自源域的医学图像,例如尽管成像常见的解剖结构,但是当部署在来自不同目标域的图像上时,成像模态经常失败。深度无监督域适应UDA旨在仅使用未标记的目标域数据和标记的源域数据来改善目标域上的深度神经网络模型的性能。然而,当目标数据稀缺时,现有技术方法表现出降低的性能。在这项工作中,我们介绍了一种新的数据有效的UDA方法,用于多域医学图像分割。所提出的方法结合了新的基于VAE的特征先验匹配(其是数据有效的)和域对抗训练以学习在分割期间利用的共享域不变的潜在空间。通过从标记的源域3D MRI调整到未标记的目标域3D CT,在公共多模态心脏图像分割数据集上评估我们的方法。我们表明,通过仅使用一个未标记的3D CT扫描,所提出的架构在同一设置中优于现有技术。最后,我们对先前匹配和领域对抗训练进行消融研究,以阐明所提方法的理论基础。

Adversarial Learning with Multiscale Features and Kernel Factorization for Retinal Blood Vessel Segmentation
Authors Farhan Akram, Vivek Kumar Singh, Hatem A. Rashwan, Mohamed Abdel Nasser, Md. Mostafa Kamal Sarker, Nidhi Pandey, Domenec Puig
在本文中,我们提出了一种有效的眼底图像的血管分割方法,使用具有多尺度特征和核分解的对抗性学习。在对抗框架的生成网络中,采用空间金字塔池,核因子分解和挤压激励块来增强不同尺度空间域中的特征表示,降低计算复杂度。反过来,通过将卷积层与附加的挤压激励块组合以将所生成的分割掩模与其各自的基础事实区分开来来制定对抗性框架的鉴别器网络。在将图像馈送到网络之前,我们通过使用边缘锐化和高斯正则化来预处理它们以达到用于血管分割的优化解决方案。使用形态学操作对经过训练的模型的输出进行后处理以去除小的噪声斑点。所提出的方法在定性和定量上优于使用DRIVE和STARE数据集的现有技术血管分割方法。

Extraction and Analysis of Fictional Character Networks: A Survey
Authors Vincent Labatut LIA , Xavier Bost LIA
字符网络是从叙述中提取的图形,其中顶点表示字符,边缘对应于它们之间的交互。通过对字符网络的分析,例如摘要,分类或角色检测,可以自动解决许多与叙述有关的问题。在考虑小说作品时,角色网络尤为重要。小说,戏剧,电影,电视剧,因为他们的利用允许开发信息检索和推荐系统。然而,小说作品具有特定属性,使这些任务更难。本调查旨在展示和组织与从小说作品中提取人物网络相关的科学文献,以及他们的分析。我们首先以通用的方式描述提取过程,并根据叙述的媒介,网络分析的目标和其他因素解释其构成步骤在实践中如何实施。然后,我们将回顾用于表征角色网络的描述性工具,重点关注它们在此上下文中的解释方式。我们通过提供对从其分析中得出的应用程序的回顾来说明角色网络的相关性。最后,我们确定了现有方法的局限性和最有希望的观点。

Blind Image Quality Assessment Using A Deep Bilinear Convolutional Neural Network
Authors Weixia Zhang, Kede Ma, Jia Yan, Dexiang Deng, Zhou Wang
我们提出了一种深度双线性模型,用于盲目图像质量评估BIQA,可以处理合成和真实的失真。我们的模型由两个卷积神经网络CNN组成,每个网络都专注于一个失真场景。对于合成失真,我们预先训练CNN以对图像失真类型和级别进行分类,在此我们享受大规模的训练数据。对于真实的扭曲,我们采用预先训练的CNN进行图像分类。来自两个CNN的特征被双线性地合并为用于最终质量预测的统一表示。然后,我们使用随机梯度下降的变体在目标主题评级数据库上微调整个模型。大量实验表明,所提出的模型在合成和真实数据库上都实现了卓越的性能。此外,我们使用群体最大分化竞争验证了我们的方法在滑铁卢探索数据库中的普遍性。

Evaluating the distribution learning capabilities of GANs
Authors Amit Rege, Claire Monteleoni
我们通过在合成数据集上进行测试来评估生成对抗网络的分布学习能力。数据集包括R n空间中的点的常见分布以及包含各种形状和大小的多边形的图像。我们发现大体上的GAN无法忠实地重建包含不连续支撑或带有噪声的急弯的点数据集。此外,在图像数据集上,我们发现GAN似乎没有学会计算图像中相同类型的对象的数量。我们还强调了GAN中概括与学习之间的明显张力。

Automated Non-Destructive Inspection of Fused Filament Fabrication Components Using Thermographic Signal Reconstruction
Authors Joshua E. Siegel, Maria F. Beemer, Steven M. Shepard
制造商很难在制造批量生产中生产低成本,坚固且复杂的部件。像熔融长丝制造FFF这样的添加工艺可以低成本地生产复杂的几何形状,但缺陷限制了关键应用中的可行性。我们提出了一种高精度,高通量和低成本的自动无损检测方法,使用采用热成像信号重建TSR和人工智能AI处理的闪光热成像FT数据进行FFF层间分层。深度神经网络DNN在PolyLactic Acid PLA小部件中区分5mm次表层的四个分层厚度时具有95.4 /像素精度,并且在区分可接受和相同组件的不可接受条件时具有98.6精度。自动检测可以对分层缺陷进行时间和成本有效的检查,支持FFF在关键和小批量应用中的使用。

Structure fusion based on graph convolutional networks for semi-supervised classification
Authors Guangfeng Lin, Jing Wang, Kaiyang Liao, Fan Zhao, Wanjun Chen
由于半监督分类的多视图数据多样性和复杂性,大多数现有的图卷积网络关注于网络体系结构构建或显着的图结构保留,忽略了半监督分类贡献的完整图结构。为了从多视图数据中挖掘出更完整的分布结构,同时考虑到特征性和通用性,我们提出了基于图卷积网络SF GCN的结构融合,以提高半监督分类的性能。 SF GCN不仅可以通过频谱嵌入保留每个视图数据的特殊性,还可以通过多图结构之间的距离度量来捕获多视图数据的共同样式。假设多图结构之间的线性关系,我们可以通过平衡特异性损失和共性损失来构建结构融合模型的优化函数。通过求解该函数,我们可以同时从多视图数据和融合结构作为相邻矩阵获得融合光谱嵌入,以输入图形卷积网络进行半监督分类。实验表明,SF GCN的性能优于三个具有挑战性的数据集,即Cora,Citeseer和Pubmed在引文网络中的表现。

DeepAAA: clinically applicable and generalizable detection of abdominal aortic aneurysm using deep learning
Authors Jen Tang Lu, Rupert Brooks, Stefan Hahn, Jin Chen, Varun Buch, Gopal Kotecha, Katherine P. Andriole, Brian Ghoshhajra, Joel Pinto, Paul Vozila, Mark Michalski, Neil A. Tenenholtz
我们提出了一种基于深度学习的技术,用于检测和量化腹主动脉瘤AAAs。这种状况导致美国每年超过10,000人死亡,无症状,经常被偶然发现,并且经常被放射科医师所忽视。我们的模型架构是一个改进的3D U Net结合椭圆拟合,执行主动脉分割和AAA检测。该研究使用由马萨诸塞州综合医院放射科进行的321次腹部盆腔CT检查进行培训和验证。然后,在具有与原始数据集不同的患者人口统计学和获取特征的单独的57个检查组中进一步测试该模型的普遍性。 DeepAAA在对比度和非对比度CT扫描上分别在0.91 0.95和0.85 1.0两组数据灵敏度特性上实现了高性能,并且可以处理具有不同数量图像的图像体积。我们发现DeepAAA超过了文献报道的放射科医师在偶然AAA检测中的表现。预计该模型可以作为常规CT检查中的有效背景检测器,以防止偶然的AAA被遗漏。

Measuring the Data Efficiency of Deep Learning Methods
Authors Hlynur Dav Hlynsson, Alberto N. Escalante B., Laurenz Wiskott
在本文中,我们提出了一个新的实验协议,并用它来衡量数据效率性能作为两个深度学习算法,卷积神经网络CNN和分层信息保持图的慢速特征分析HiGSFA的训练集大小的函数,用于任务分类和转移学习场景。在MNIST和Omniglot数据集的不同大小的子集上训练算法。当模型训练为每类50和200个样本用于MNIST分类时,HiGSFA优于标准CNN网络。在其他情况下,CNN表现更好。结果表明,在某些情况下,贪婪,局部最优的自下而上学习与基于全球梯度的学习同等或更强大。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页



pic from pexels.com

你可能感兴趣的:(视觉,目标检测,计算机视觉,机器学习,深度学习,数据集,图像提升,生成对抗,风格迁移,人脸美妆)