【计算机视觉 | 图像分类】arxiv 计算机视觉关于图像分类的学术速递(7 月 13 日论文合集)

文章目录

  • 一、分类|识别相关(5篇)
    • 1.1 CellGAN: Conditional Cervical Cell Synthesis for Augmenting Cytopathological Image Classification
    • 1.2 Recognizing student identification numbers from the matrix templates using a modified U-net architecture
    • 1.3 A Survey on Figure Classification Techniques in Scientific Documents
    • 1.4 Active Learning for Video Classification with Frame Level Queries
    • 1.5 Face Image Quality Enhancement Study for Face Recognition

一、分类|识别相关(5篇)

1.1 CellGAN: Conditional Cervical Cell Synthesis for Augmenting Cytopathological Image Classification

CellGan:用于增强细胞病理图像分类的条件宫颈细胞合成

https://arxiv.org/abs/2307.06182

在这里插入图片描述
自动检查薄层细胞学测试(TCT)切片可以帮助病理学家发现宫颈异常,以准确和有效的癌症筛查。目前的解决方案大多需要定位可疑细胞并基于局部斑块分类异常,考虑到TCT的整个载玻片图像非常大的事实。因此,它需要正常和异常宫颈细胞的许多注释,以监督斑块级分类器的训练以获得有希望的性能。在本文中,我们提出CellGAN合成细胞病理学图像的各种宫颈细胞类型,以增强贴片水平的细胞分类。CellGAN建立在一个轻量级的骨干网上,配备了一个非线性类映射网络,有效地将细胞类型信息整合到图像生成中。我们还提出了跳跃层全局上下文模块来建模细胞的复杂空间关系,并通过对抗学习获得合成图像的高保真度。我们的实验表明,CellGAN可以产生视觉上合理的TCT细胞病理学图像的不同类型的细胞。我们还验证了使用CellGAN的有效性,大大提高了补丁级细胞分类性能。

1.2 Recognizing student identification numbers from the matrix templates using a modified U-net architecture

使用改进的U-Net结构从矩阵模板识别学生身份号码

https://arxiv.org/abs/2307.06120

在这里插入图片描述
本文提出了一种创新的方法来识别学生在考试和知识测试中,克服了传统的个人信息输入方法的局限性。所提出的方法采用矩阵模板上指定的部分的考试,其中包含数字的正方形被选择性地涂黑。该方法涉及开发一个专门设计用于识别学生的个人身份证号码的神经网络。神经网络利用了一个特别适应的U-Net架构,在一个广泛的数据集上训练,该数据集包括黑化表的图像。该网络展示了识别变黑方块的模式和排列的熟练程度,准确地解释其中的信息。此外,该模型在正确识别输入的学生个人号码和有效地检测表内的错误条目方面表现出很高的准确性。这种方法提供了多个优点。首先,它通过自动从涂黑的表格中提取识别信息,大大加快了考试评分过程,消除了手动输入的需要,并最大限度地减少了错误的可能性。其次,该方法使识别过程自动化,从而减少管理工作并加快数据处理。这一创新的身份识别系统的引入代表了考试和知识测试领域的一个显著进步,以简化、高效和准确的身份识别过程取代了传统的人工输入个人数据。

1.3 A Survey on Figure Classification Techniques in Scientific Documents

科技文献中的图形分类技术综述

https://arxiv.org/abs/2307.05694

在这里插入图片描述
数字在视觉上代表了一个重要的信息,并提供了一个有效的手段来交流科学事实。最近,已经有许多努力直接从数字中提取数据,特别是从表格,图表和绘图中,使用不同的人工智能和机器学习技术。这是因为从数字中删除信息可以更深入地了解科学文献中强调的概念。在这篇调查论文中,我们系统地将数字分为五类-表格,照片,图表,地图和地块,并随后提出了一个批判性的审查现有的方法和数据集,解决问题的数字分类。最后,我们找出目前的研究差距,并提供可能的方向,进一步研究图形分类。

1.4 Active Learning for Video Classification with Frame Level Queries

基于帧层次查询的主动学习视频分类算法

https://arxiv.org/abs/2307.05587

在这里插入图片描述
深度学习算法已经突破了计算机视觉研究的界限,并在各种应用中表现出令人称道的性能。然而,训练一个强大的深度神经网络需要大量的标记训练数据,获取这些数据需要大量的时间和人力。这个问题对于像视频分类这样的应用程序来说更加严重,其中人类注释者必须端到端地观看整个视频以提供标签。主动学习算法自动从大量未标记数据中识别出信息量最大的样本;这极大地减少了在引入机器学习模型时的人类注释工作,因为只有由算法识别的少数样本需要被手动标记。在本文中,我们提出了一种新的主动学习框架的视频分类,其目标是进一步减少人类注释者的标签负担。我们的框架确定了一批范例视频,以及一组信息帧的每个视频;注释者仅需要检查帧并为每个视频提供标签。这比观看完整的视频来制作标签所涉及的手动工作要少得多。我们制定了一个标准的不确定性和多样性的基础上,以确定信息丰富的视频,并利用代表性的采样技术,从每个视频中提取一组样本帧。据我们所知,这是第一次为视频分类开发主动学习框架的研究工作,其中注释者只需要检查几帧来生成标签,而不是观看端到端视频。

1.5 Face Image Quality Enhancement Study for Face Recognition

面向人脸识别的人脸图像质量增强研究

https://arxiv.org/abs/2307.05534

在这里插入图片描述
无约束人脸识别是计算机视觉和生物识别领域的一个研究热点。然而,低质量照片中的人脸识别问题迄今为止还没有得到很好的研究。在本文中,我们探讨了低质量的照片上的人脸识别性能,我们试图提高在处理低质量的人脸图像的准确率。我们组装了一个大型数据库,低质量的照片,并检查三个不同的质量集的人脸识别算法的性能。使用国家的最先进的人脸图像增强方法,我们探讨了增强后的人脸图像的人脸识别性能。为了在没有实验偏差的情况下执行此操作,我们开发了一种新的低质量人脸照片识别协议,并通过实验验证了性能。我们设计的协议,人脸识别低质量的人脸图像可以是有用的其他研究人员。此外,实验结果显示了这个问题的一些具有挑战性的方面。

你可能感兴趣的:(计算机视觉arxiv最新论文,计算机视觉,分类,人工智能)