hitrjj

【AI视野·今日CV 计算机视觉论文速览第157期】Mon, 16 Sep 2019

AI视野·今日CS.CV 计算机视觉论文速览
Mon, 16 Sep 2019
Totally 33 papers
?上期速览✈更多精彩请移步主页

Interesting:

?DeepHomography内容感知的单应性估计, 由于传统单应性估计方法对于图像质量十分敏感，低纹理和低光照会造成估计误差。先前基于学习的估计方法大多为合成图像的监督学习或基于航空图像的非监督学习，忽略了深度不一致在单应性中的作用。同时对于图像的统一处理忽视了前景和动态目标。这篇文章提出了一种新的非监督方法，首先对于图像进行掩膜学习排除异常区域(无纹理)，随后基于得到的特征计算损失代替了直接从图像得到损失，同时还提出了一个新的数据集包含了多种具有挑战的情况。(from 电子科大旷视)

排除动态、模糊和低纹理的掩膜生成：

一些数据集内得到的结果：

code:https://github.com/JirongZhang/DeepHomography

?荧光显微镜数据合成与实例分割, 研究人员提出了一种合成方法生成荧光显微镜模拟数据集，并利用空间约束的循环一致性对抗网络来进行细胞核检测。(from 普渡印第安纳大学)
训练方法与合成数据：

细胞核检测与掩膜分割，下图为语义分割网络：

分割结果：

数据合成方法：Nuclei Segmentation of Fluorescence Microscopy Images Using Three Dimensional Convolutional Neural Networks
Three Dimensional Fluorescence Microscopy Image Synthesis and Segmentation,cvpr2018 CVMI workshop
实验室主页：https://engineering.purdue.edu/~micros/publications.html

?FakeSpotter一个AI合成假脸欺诈检测基线模型, (from 南洋理工、九州大学、阿里巴巴、小米)
利用每一层神经元的行为作为特征：

这篇文章页脚中有很多参考代码可以学习

?有云台单目相机的跟随机器人, (from 中科院大学)

?FoodTracker实时食物检测的移动端实现, (from McGill University)

检测结果和营养分析：

dataset:UECFood100 [11] and UECFood256 [12] benchmarks

?3D U2-Net基于三维Unet的多域医学图像分割方法，(from 浙大鹏城实验室)

?异常图像检测，检测出背离整体分布的异常图像,(from 飞利浦研究罗蒙索夫大学)

?基于双分支图网络的语义分割方法,(from 牛津北大深动科技)
同时基于空间特征和通道维度进行处理：

?基于在线多尺度卷积稀疏编码模型实现，并利用简化最大后验框架和ADMM算法求解得到视频去雨雪效果,(from 西安交大)

Daily Computer Vision Papers

MRI Brain Tumor Segmentation using Random Forests and Fully Convolutional Networks
Authors Mohammadreza Soltaninejad, Lei Zhang, Tryphon Lambrou, Guang Yang, Nigel Allinson, Xujiong Ye
在本文中，我们提出了一种新的基于学习的多模态MRI图像中脑肿瘤自动分割方法，该方法包含两组机器学习和手工制作的特征。完全卷积网络FCN形成机器学习功能，基于文本的功能被视为手工制作的功能。随机森林RF用于将MRI图像体素分类为正常脑组织和肿瘤的不同部分，即水肿，坏死和增强肿瘤。该方法在BRATS 2017挑战数据集上进行评估。结果表明，该方法提供了有希望的分割。对于整个肿瘤，核心和增强肿瘤，针对地面真相的自动脑肿瘤分割的平均骰子重叠测量值分别为0.86,0.78和0.66。

Hierarchical Joint Scene Coordinate Classification and Regression for Visual Localization
Authors Xiaotian Li, Jakob Verbeek, Juho Kannala
视觉本地化对计算机视觉和机器人技术中的许多应用至关重要。为了解决单图像RGB定位问题，现有技术的基于特征的方法通过在查询图像和预先构建的3D模型之间匹配局部描述符来解决任务。最近，已经利用深度神经网络来直接学习场景中的原始像素和3D坐标之间的映射，因此通过正向传递通过网络隐式地执行匹配。在这项工作中，我们提出了一种新的分层联合分类回归网络，以从单个RGB图像以粗略到精细的方式预测像素场景坐标。网络由一系列输出层组成，每个输出层都以先前输出的输出为条件，最终输出层对坐标进行回归，其他输出层产生粗略的位置标签。我们的实验表明，所提出的方法优于vanilla场景坐标回归网络，并且在大型环境中更具可扩展性。通过数据增强，它可以在三个基准数据集上实现最先进的单图像RGB定位性能。

Recurrent Connectivity Aids Recognition of Partly Occluded Objects
Authors Markus Roland Ernst, Jochen Triesch, Thomas Burwick
前馈卷积神经网络是核心对象识别的普遍模型。对于诸如闭塞等具有挑战性的条件，神经科学家认为视觉皮层中的反复连接有助于物体识别。在这项工作中，我们研究人工神经网络是否以及如何也可以从循环连接中受益。为此，我们系统地比较了由自下而上B，横向L和自上而下T连接组成的架构。为了评估性能，我们引入了两个新颖的立体遮挡对象数据集，它们弥合了从数字分类到识别3D对象的差距。该任务包括识别由多个遮挡物对象遮挡的一个目标对象。我们发现循环模型的性能明显优于前馈模型，后者在参数复杂度方面具有匹配性。我们表明，对于具有挑战性的刺激，循环反馈能够正确地修改网络的初始前馈猜测。总的来说，我们的结果表明，人工和生物神经网络都可以利用复发来改善对象识别。

Brain-Like Object Recognition with High-Performing Shallow Recurrent ANNs
Authors Jonas Kubilius, Martin Schrimpf, Ha Hong, Najib J. Majaj, Rishi Rajalingham, Elias B. Issa, Kohitij Kar, Pouya Bashivan, Jonathan Prescott Roy, Kailyn Schmidt, Aran Nayebi, Daniel Bear, Daniel L. K. Yamins, James J. DiCarlo
深度卷积人工神经网络人工神经网络是灵长类腹侧溪流视觉处理机制的候选模型的领先类型。虽然最初受到大脑解剖学的启发，但在过去的几年中，这些人工神经网络已经从AlexNet中的简单八层架构演变为极其深入和分支的架构，展示了越来越好的对象分类性能，但却质疑它们仍然是大脑的样子。特别是，来自机器学习社区的典型深度模型通常难以映射到大脑的解剖结构上，因为它们具有大量的层和缺少生物学上重要的连接，例如复发。在这里，我们证明了更好的解剖学对齐大脑和机器学习的高性能以及神经科学测量不必相互矛盾。我们开发了CORnet S，一个浅层人工神经网络，具有四个解剖学映射区域和循环连接，由Brain Score指导，这是一种新的大规模神经和行为基准综合，用于量化灵长类动物腹侧视觉流模型的功能保真度。尽管比大多数模型要浅得多，但CORnet S是Brain Score的顶级模型，并且在ImageNet上的表现优于同样紧凑的模型。此外，我们对CORnet S电路变体的广泛分析表明，复发是Brain Score和ImageNet前1名表现的主要预测因素。最后，我们报告CORnet S IT神经群体的时间演变类似于实际的猴子IT群体动态。总之，这些结果建立了CORnet S，一种紧凑的，复现的ANN，作为灵长类腹侧视觉流的当前最佳模型。

Video Rain/Snow Removal by Transformed Online Multiscale Convolutional Sparse Coding
Authors Minghan Li, Xiangyong Cao, Qian Zhao, Lei Zhang, Chenqiang Gao, Deyu Meng
监控视频中的视频雨雪是计算机视觉社区的一项重要任务，因为视频中存在雨雪会严重降低许多监控系统的性能。已经广泛研究了各种方法，但是大多数方法仅在稳定的背景场景下考虑一致的雨雪。然而，从实际监控摄像机捕获的雨雪在时间上总是高度动态，偶尔会改变背景场景。针对这一问题，本文提出了一种新的雨雪清除方法，该方法充分考虑了雨雪和视频序列背景场景的动态统计。具体来说，雨雪被编码为在线多尺度卷积稀疏编码OMS CSC模型，不仅可以精确地传递真实雨雪的稀疏散射和多尺度形状，而且可以通过实时改善的参数很好地编码其时间动态配置。该模型。此外，对背景场景施加的变换算子被进一步嵌入到所提出的模型中，其精细地传达动态背景变换，例如旋转，缩放和失真，不可避免地存在于真实视频序列中。如此构造的方法自然可以更好地适应动态雨雪以及背景变化，并且还适合于处理归因于其在线学习模式的流视频。所提出的模型在简明的最大后MAP框架中制定，并且可以通过ADMM算法容易地求解。与现有技术的在线和离线视频雨雪清除方法相比，该方法在视觉和数量上均可在合成和真实视频数据集上实现更好的性能。具体来说，我们的方法可以以相对较高的效率实施，显示其实时视频雨雪清除的潜力。

Dual Graph Convolutional Network for Semantic Segmentation
Authors Li Zhang, Xiangtai Li, Anurag Arnab, Kuiyuan Yang, Yunhai Tong, Philip H.S. Torr
利用长距离上下文信息是像素明智的预测任务（例如语义分割）的关键。与之前使用多尺度特征融合或扩张卷积的工作相比，我们提出了一种新颖的图卷积网络GCN来解决这个问题。我们的双图卷演化网络DGCNet通过在单个框架中建模两个正交图来模拟输入特征的全局背景。第一个组件模拟图像中像素之间的空间关系，而第二个组件模拟沿网络特征图的通道维度的相互依赖性。这通过将特征投影到新的较低维度空间中来有效地完成，其中可以在重新投影到原始空间之前对所有成对交互进行建模。我们的简单方法比强基线提供了实质性的好处，并在Cityscapes 82.0平均IoU和Pascal Context 53.7平均IoU数据集上实现了最先进的结果。

Weakly-Supervised 3D Pose Estimation from a Single Image using Multi-View Consistency
Authors Guillaume Rochette, Chris Russell, Richard Bowden
我们提出了一种新颖的数据驱动正则化器，用于3D人体姿态估计的弱监督学习，消除了影响现有方法的漂移问题。我们通过将立体声重建问题转移到网络本身的损失中来实现这一点。这避免了在训练之前重建3D数据的需要，并且与先前的半监督方法不同，避免了对监督训练的预热期的需要。我们的方法的概念和实现简单性是其吸引力的基础。通过我们额外的基于投影的损失，不仅可以直接增加许多弱监督方法，而且很明显它如何塑造重建并防止漂移。因此，我们相信它将成为任何研究弱监督3D重建的研究人员的宝贵工具。对可用的最大的多摄像机和无标记数据集Panoptic进行评估，我们获得的精度基本上与在训练中充分利用3D groundtruth的强监督方法无法区分。

A Collaborative Approach using Ridge-Valley Minutiae for More Accurate Contactless Fingerprint Identification
Authors Ritesh Vyas, Ajay Kumar
非接触式指纹识别已成为各种电子商务和执法应用中个人识别的可靠且用户友好的替代方案。然而，从文献中已经知道，与从基于接触的指纹传感器获得的那些相比，非接触式指纹图像提供非常低的匹配精度。本文开发了一种新方法，可显着改善目前可用的非接触式指纹匹配功能。我们系统地分析了补充岭谷信息的范围，并引入了新方法，以实现与目前常用的现有指纹匹配器相比更高的匹配精度。我们还研究了最少探索的指纹颜色空间转换选项，这些选项可以在更准确的非接触式指纹匹配中发挥关键作用。本文介绍了使用NBIS，MCC和COTS匹配器的不同公开的非接触式指纹数据库的实验结果。我们始终如一的优异成绩验证了所提方法对更准确的非接触式指纹识别的有效性。

BPnP: Further Empowering End-to-End Learning with Back-Propagatable Geometric Optimization
Authors Bo Chen, Tat Jun Chin, Nan Li
在本文中，我们提出了BPnP，一种通过PnP求解器进行反向传播的新方法。我们证明了这种几何优化过程的梯度可以使用隐式函数定理来计算，就好像它是可微分的一样。此外，我们开发了一个残差整合技巧，使用BPnP平滑稳定地进行端到端姿态回归。我们还提出了一种成形算法，该算法成功地使用BPnP进行关键点回归。

DARTS+: Improved Differentiable Architecture Search with Early Stopping
Authors Hanwen Liang, Shifeng Zhang, Jiacheng Sun, Xingqiu He, Weiran Huang, Kechen Zhuang, Zhenguo Li
最近，对自动化神经架构设计过程的兴趣越来越大，而可分辨架构搜索DARTS方法使该过程在几天内就可用了。特别地，引入了称为一次性模型的超网络，通过该网络可以用梯度下降连续搜索该体系结构。然而，当搜索时期的数量变大时，经常观察到DARTS的性能崩溃。同时，在选定的体系结构中可以找到许多跳过连接。在本文中，我们声称崩溃的原因是在DARTS的双层优化中存在合作和竞争，其中架构参数和模型权重交替更新。因此，我们提出了一种简单有效的算法，名为DARTS，通过在满足某个标准时提前停止搜索过程来避免崩溃并改善原始DARTS。我们证明了提出的早期停止标准在避免崩溃问题方面是有效的。我们还对基准数据集进行了实验，并展示了我们的DARTS算法的有效性，其中DARTS在CIFAR10上达到2.32测试误差，在CIFAR100上达到14.87，在ImageNet上达到23.7。我们进一步指出，通过手动设置少量搜索时期，隐含地将早期停止的想法包括在一些现有的DARTS变体中，同时我们给出了早期停止的明确标准。

Part-Guided Attention Learning for Vehicle Re-Identification
Authors Xinyu Zhang, Rufeng Zhang, Jiewei Cao, Dong Gong, Mingyu You, Chunhua Shen
车辆识别Re ID通常需要人们识别车辆之间的细粒度视觉差异。除了容易受到视点变化和变形影响的车辆的整体外观之外，车辆部件还提供了区分近似相同车辆的关键线索。在这些观察的启发下，我们引入了一个部分引导注意网络PGAN来精确定位突出的部分区域，并有效地将全局和部分信息结合起来用于判别性特征学习。 PGAN首先检测不同部件组件和显着区域的位置，而不管车辆身份如何，其作为自下而上的关注来缩小可能的搜索区域。为了估计检测到的部分的重要性，我们提出了一个部分注意模块PAM，以自适应地定位具有高注意力权重的最具辨别力的区域，并抑制具有相对较低权重的不相关部分的分心。 PAM由Re ID损失引导，因此提供自上而下的关注，使得能够在汽车部件和其他显着区域的水平上计算注意力。最后，我们汇总了全局外观和部件功能，以进一步提高功能性能。 PGAN在端到端框架中结合了部分引导的自下而上和自上而下的关注，全局和部分视觉特征。大量实验表明，所提出的方法在四个大规模基准数据集上实现了新的现有技术车辆Re ID性能。

Towards Generalizable Forgery Detection with Locality-aware AutoEncoder
Authors Mengnan Du, Shiva Pentyala, Yuening Li, Xia Hu
随着深度学习技术的进步，现在可以生成超逼真的假图像和视频。这些被操纵的伪造品可能会吸引大量观众，并对我们的社会产生不利影响。尽管已经花费了大量精力来检测伪造品，但是它们的性能在以前看不见但相关的操作上显着下降，并且检测泛化能力仍然是个问题。为了弥补这一差距，在本文中，我们提出了Locality aware AutoEncoder LAE，它结合了细粒度表示学习和在统一框架中强制执行局部性。在训练过程中，我们使用像素智能掩模来规范LAE的局部解释，以强制模型学习伪造区域的内在表示，而不是捕获训练集中的伪像并学习伪相关以执行检测。我们进一步提出了一个积极的学习框架，以选择具有挑战性的候选人进行标记，以减少注释工作以规范解释。实验结果表明，LAE确实可以专注于伪造区域做出决策。结果进一步表明，与通过替代操作方法产生的伪造品的现有技术相比，LAE实现了优异的泛化性能。

Rethinking Zero-Shot Learning: A Conditional Visual Classification Perspective
Authors Kai Li, Martin Renqiang Min, Yun Fu
零镜头学习ZSL旨在仅基于类的语义描述来识别看不见的类的实例。现有算法通常通过学习从一个特征空间到另一个特征空间的映射来将其表示为语义视觉对应问题。尽管是合理的，但先前的方法基本上以隐式方式丢弃了视觉特征的高度珍贵的辨别能力，因此产生了不期望的结果。我们将ZSL重新表述为条件视觉分类问题，即，基于从语义描述中学习的分类器对视觉特征进行分类。通过这种重新设计，我们开发了针对各种ZSL设置的算法对于传统设置，我们建议训练一个深度神经网络，通过基于情节的训练方案从语义属性直接生成视觉特征分类器。对于广义设置，我们将高度学习连接起来。用于所见类的判别分类器和用于看不见类的生成分类器以对所有类的视觉特征进行分类对于转换设置，我们利用未标记的数据来有效地校准分类器生成器，使用新颖的学习而不忘记自我训练机制并通过鲁棒性指导过程广义交叉熵损失。大量实验表明，在所有ZSL设置中，我们提出的算法在大多数基准数据集上的显着优势明显优于现有技术。

FoodTracker: A Real-time Food Detection Mobile Application byDeep Convolutional Neural Networks
Authors Jianing Sun, Katarzyna Radecka, Zeljko Zilic
我们提供了一种移动应用程序，用于实时识别单个图像中的多对象食物的食物项目，然后返回具有组分和近似量的营养成分。我们的工作分为两部分。首先，我们构建了一个深度卷积神经网络，与最先进的检测策略YOLO融合，实现了近80个平均精度的同时多目标识别和定位。其次，我们将我们的模型调整为具有扩展营养分析功能的移动应用程序。在app侧推断和解码模型输出后，我们在实时或本地模式下呈现包括边界框位置和类标签的检测结果。我们的模型非常适合移动设备，具有可忽略的推理时间和较小的内存要求，并具有深度学习算法。

Content-Aware Unsupervised Deep Homography Estimation
Authors Jirong Zhang, Chuan Wang, Shuaicheng Liu, Lanpeng Jia, Jue Wang, Ji Zhou
两幅图像之间的鲁棒单应性估计是一项基本任务，已广泛应用于各种视觉应用。传统的基于特征的方法通常根据匹配的特征检测图像特征并根据RANSAC异常值去除拟合单应性。然而，单应性的质量很大程度上依赖于图像特征的质量，其在低光和低纹理图像方面易于出错。另一方面，先前的深度单应性方法要么合成用于监督学习的图像，要么采用用于无监督学习的空间图像，两者都忽略了在单应性估计中深度差异的重要性。此外，它们同等地处理图像内容，包括动态对象和近距离前景的区域，这进一步降低了估计的质量。在这项工作中，为了克服这些问题，我们提出了一种采用新架构设计的无监督深度单应法。我们在估计过程中学习掩模以拒绝异常区域。此外，我们计算了我们学到的深层特征的损失，而不是像以前那样直接比较图像内容。此外，还提供了一个综合数据集，涵盖了常规和具有挑战性的案例，例如质地差和非平面干扰。通过与基于特征和以前的深度方法的比较来验证我们的方法的有效性。代码即将在Github上发布。

Unsupervised Image Regression for Heterogeneous Change Detection
Authors Luigi T. Luppino, Filippo M. Bianchi, Gabriele Moser, Stian N. Anfinsen
异构多时相卫星图像中的变化检测是遥感中一个新兴且具有挑战性的主题。特别是，主要挑战之一是以无人监督的方式解决问题。在本文中，我们提出了一种基于亲和矩阵和图像回归比较的双时态异构变化检测的无监督框架。首先，我们的方法量化了从两个图像中的共同定位的图像块计算的亲和度矩阵的相似性。这样做是为了自动识别可能未改变的像素。将识别的像素作为伪训练数据，我们学习转换以将第一图像映射到另一图像的域，反之亦然。选择四种回归方法进行变换高斯过程回归，支持向量回归，随机森林回归，以及最近提出的称为均匀像素变换的核回归方法。为了评估我们框架的潜力和局限性，以及每种回归方法的优缺点，我们对两个真实数据集进行了实验。结果表明，亲和度矩阵的比较本身已经可以被认为是变化检测方法。然而，显示图像回归以改善单独前一步骤获得的结果，并产生准确的变化检测图，尽管多时间输入数据具有异质性。值得注意的是，随机森林回归方法通过实现与其他方法类似的精确度而优异，但具有显着更低的计算成本并且具有快速且稳健的超参数调整。

Transferable Adversarial Robustness using Adversarially Trained Autoencoders
Authors Pratik Vaishnavi, Kevin Eykholt, Atul Prakash, Amir Rahmati
事实证明，机器学习是解决许多应用领域中复杂问题的极其有用的工具。这种流行使其成为恶意行为者的有吸引力的目标。对抗性机器学习是一个充分研究的研究领域，其中对手试图通过仔细操纵输入来在机器学习算法中引起可预测的错误。作为回应，已经提出了许多技术来加强机器学习算法并减轻对抗性攻击的影响。在这些技术中，对抗性训练增强了对抗性输入的训练数据，已被证明是一种有效的防御技术。然而，对抗性训练在计算上是昂贵的，并且对抗性能的改进仅限于单个模型。在本文中，我们提出了对抗训练的自动编码器增强，这是第一个对某些自适应对手具有鲁棒性的可转移对抗防御。我们通过对分类损失进行对等训练自动编码器，从分类管道中解除对抗鲁棒性。我们表明，我们的方法可以获得与MNIST，Fashion MNIST和CIFAR 10数据集上最先进的对抗训练模型相媲美的结果。此外，我们可以将我们的方法转移到其他易受攻击的模型，并在没有额外培训的情况下提高其对抗性能。最后，我们将防御与集合方法相结合，并将对抗性训练与多个易受攻击的预训练模型并行化。在单一的对抗训练课程中，自动编码器可以在易受攻击的模型上实现与标准对抗训练相当或更好的对抗性能。

Efficient 2.5D Hand Pose Estimation via Auxiliary Multi-Task Training for Embedded Devices
Authors Prajwal Chidananda, Ayan Sinha, Adithya Rao, Douglas Lee, Andrew Rabinovich Magic Leap, Inc
2D关键点估计是人体和手部三维姿态估计问题的重要前提。在这项工作中，我们讨论了在具有高度约束的存储器和计算包络的嵌入式设备上部署极其高效的2.5D手姿态估计所需的数据，体系结构和训练过程，例如AR VR可穿戴设备。我们的2.5D手部姿势估计包括由自我中心图像上的关节位置的2D关键点估计，由深度传感器捕获，并且使用相应的深度值提升到2.5D。我们的贡献是两倍我们讨论数据标记和增强策略，网络架构中的模块与现有技术的MobileNetV2架构相比，共同导致3个翻牌计数和2个参数数量。 b我们提出了一种辅助多任务培训策略，以补偿网络的小容量，同时实现与MobileNetV2相当的性能。我们的32位训练模型的存储器占用空间小于300千字节，工作频率超过50赫兹，小于35 MFLOP。

Measuring the Effects of Non-Identical Data Distribution for Federated Visual Classification
Authors Tzu Ming Harry Hsu, Hang Qi, Matthew Brown
联合学习使视觉模型能够使用来自移动设备的真实世界数据以隐私保护方式进行培训。鉴于其分布式特性，这些设备上的数据统计数据可能会有很大差异。在这项工作中，我们通过联邦学习来研究这种非相同数据分布对视觉分类的影响。我们提出了一种合成具有连续相同范围的数据集的方法，并为联合平均算法提供性能测量。我们表明，随着分布的不同，性能会下降，并通过服务器动力提出缓解策略。 CIFAR 10上的实验表明，在一系列不相同的情况下，分类性能得到了改善，在最偏斜的环境中分类精度从30.1提高到76.9。

Automatic Hip Fracture Identification and Functional Subclassification with Deep Learning
Authors Justin D Krogue, Kaiyang V Cheng, Kevin M Hwang, Paul Toogood, Eric G Meinberg, Erik J Geiger, Musa Zaid, Kevin C McGill, Rina Patel, Jae Ho Sohn, Alexandra Wright, Bryan F Darger, Kevin A Padrez, Eugene Ozhinsky, Sharmila Majumdar, Valentina Pedoia
目的髋部骨折是发病率和死亡率的常见原因。使用深度学习自动识别和分类髋部骨折可以通过减少诊断错误和减少手术时间来改善结果。方法回顾1118项研究中的髋关节和骨盆X线片，并通过边界框标记3034髋，分类为正常，移位股骨颈骨折，非移位股骨颈骨折，股骨转子间骨折，既往ORIF或既往关节成形术。训练基于深度学习的对象检测模型以自动化边界框的放置。密集连接的卷积神经网络DenseNet在边界框图像的一个子集上进行训练，并在一个保持的测试集上评估其性能，并通过比较100个图像子集与两组人类观察者的团队训练放射科医师和矫形外科医生，以及高级急诊医学，放射学和整形外科的居民。结果我们模型的骨折二元精度为93.8 95 CI，91.3 95.8，灵敏度为92.7 95 CI，88.7 95.6，特异性95.0 95 CI，91.5 97.3。多类别分类准确度为90.4 95 CI，87.4 92.9。与人类观察者相比，我们的模型在所有条件下至少达到了专家级别的分类。此外，当该模型被用作辅助时，人类表现得到改善，辅助居民表现接近于独立的团契培训专家表现。结论我们的深度学习模型以至少专家水平的准确度识别和分类髋部骨折，并且当用作辅助改善人类表现时，辅助居民表现接近于无辅助团体训练的参加者。

Flow Models for Arbitrary Conditional Likelihoods
Authors Yang Li, Shoaib Akbar, Junier B. Oliva
了解数据集特征之间的依赖关系是大多数无监督学习任务的核心。然而，大多数生成建模方法仅关注联合分布p x并利用模型，其中在给定其余观察到的协变量x o p x u mid x o的情况下获得某些特征子集的条件分布是难以处理的。传统的条件方法为一组固定的协变量提供了一个模型，该协变量以另一组固定的观察到的协变量为条件。相反，在这项工作中，我们开发了一个模型，该模型能够通过易处理的条件可能性产生所有条件分布p x u mid x o，用于任意x u。我们提出了基于流动生成模型的变量变化的新颖扩展，任意条件流模型AC Flow，其可以以观察到的协变量的任意子集为条件，这是先前不可行的。我们将AC Flow应用于特征的插补，并通过引入辅助目标来开发用于多重和单个插补的统一平台，该辅助目标为流动模型提供原则性的单一最佳猜测。大量的实证评估表明，我们的模型在合成和现实世界数据集中的图像修复和特征插补中实现了单一和多重插补的最先进性能。代码可在

White-Box Adversarial Defense via Self-Supervised Data Estimation
Authors Zudi Lin, Hanspeter Pfister, Ziming Zhang
在本文中，我们研究了如何防御分类器以防止使用巧妙修改的输入数据欺骗分类器的对抗性攻击的问题。与之前的作品相比，这里我们专注于白盒对抗防御，攻击者不仅可以完全访问分类器，还可以获得尽可能强大攻击的防御者。在这样的上下文中，我们建议将防御者视为功能性的，更高阶的函数，其以函数作为其参数来表示函数空间，而不是常规的固定函数。从这个角度来看，应该针对每个对抗性输入单独实现和优化防御者。为此，我们提出了RIDE，一种有效且可证明收敛的自监督学习算法，用于个人数据估计，以保护预测免受敌对攻击。我们展示了图像识别中对抗性防御性能的显着改善，例如分别在现有BPDA攻击者下的MNIST，CIFAR 10和ImageNet数据集上的98,76,43测试精度。

A superpixel-driven deep learning approach for the analysis of dermatological wounds
Authors Gustavo Blanco, Agma J. M. Traina, Caetano Traina Jr., Paulo M. Azevedo Marques, Ana E. S. Jorge, Daniel de Oliveira, Marcos V. N. Bedo
背景。基于图像的皮肤病伤口内不同组织的识别增强了患者的护理，因为它不需要侵入性评估。本手稿提出了一种名为QTDU的方法，该方法将深度学习模型与超像素驱动的分割方法相结合，用于评估皮肤溃疡组织的质量。

FakeSpotter: A Simple Baseline for Spotting AI-Synthesized Fake Faces
Authors Run Wang, Lei Ma, Felix Juefei Xu, Xiaofei Xie, Jian Wang, Yang Liu
近年来，我们目睹了生成对抗网络GAN及其在图像合成中的变体的空前成功。这些技术被广泛用于合成虚假面孔，这对现有的面部识别FR系统构成严重挑战，并且随着假货传播和加剧错误信息而给社交网络和媒体带来潜在的安全威胁。不幸的是，这些AI合成假面的强大探测器仍处于起步阶段，尚未准备好完全应对这一新兴挑战。目前，基于图像取证和基于学习的方法是检测假面孔的两大类策略。在这项工作中，我们提出了一种基于监测神经元行为的替代方法。对神经元覆盖和相互作用的研究已经成功地证明它们可以作为深度学习系统的测试标准，特别是在暴露于对抗性攻击的环境下。在这里，我们推测监测神经元行为也可以作为检测假脸的资产，因为逐层神经元激活模式可以捕获对假检测器很重要的更微妙的特征。根据经验，我们已经证明，基于神经元覆盖行为的拟议FakeSpotter与简单的线性分类器相结合，可以大大优于经过深度训练的卷积神经网络CNN，用于发现AI合成假面。在三个深度学习基于DL的FR系统上进行了大量实验，其中两个GAN变体用于合成假面，并且在两个公共高分辨率面部数据集上进行了大量实验，证明了FakeSpotter作为一个简单但强大的假人脸检测基线的潜力。狂野的。

Human Following for Wheeled Robot with Monocular Pan-tilt Camera
Authors Zheng Zhu, Hongxuan Ma, Wei Zou
由于其在实际应用中的潜力，人类对移动机器人的追随已经见证了显着的进步。目前，大多数人类跟随系统配备有深度传感器以获得人和机器人之间的距离信息，其受到感知要求和噪声的影响。在本文中，我们设计了一种带有单眼云台摄像机的轮式移动机器人系统，可以跟随人类，它可以在视野中保持目标并同时保持跟随。该系统由快速人体探测器，实时准确的视觉跟踪器，移动机器人和云台摄像机统一控制器组成。在视觉跟踪算法中，利用连体网络和光流信息同时定位和回归人类。为了使用单目相机执行以下操作，引入人体高度的约束来设计控制器。在实验中，人类跟踪在模拟和真实的机器人平台中进行和分析，这证明了整个系统的有效性和稳健性。

3D U$^2$-Net: A 3D Universal U-Net for Multi-Domain Medical Image Segmentation
Authors Chao Huang, Hu Han, Qingsong Yao, Shankuan Zhu, S. Kevin Zhou
像U Net这样的完全卷积神经网络一直是医学图像分割中最先进的方法。实际上，网络是高度专业化的，并且针对每个分段任务单独训练。代替多个模型的集合，非常希望学习用于不同任务的通用数据表示，理想地是单个模型，其中添加了针对每个任务的最少数量的参数。受近期图像分类多领域学习成功的启发，我们首次探索了一种处理多种医学分割任务的有前途的通用架构，并且可以扩展到新任务，无论不同的器官和成像方式如何。我们的3D通用U Net 3D U 2网络基于可分离卷积，假设来自不同域的图像具有特定于域的空间相关性，可以通过信道方式卷积进行探测，同时还共享可以通过逐点卷积建模的交叉信道相关性。我们在五个器官分割数据集上评估3D U 2网络。实验结果表明，该通用网络能够在分割精度方面与传统模型竞争，而只需要大约1个参数。此外，我们观察到该体系结构可以轻松有效地适应新域，而不会牺牲用于学习通用网络共享参数化的域中的性能。我们将3D U 2 Net的代码放入公共领域。网址

Multiple Partitions Aligned Clustering
Authors Zhao Kang, Zipeng Guo, Shudong Huang, Siying Wang, Wenyu Chen, Yuanzhang Su, Zenglin Xu
多视图聚类是一项重要但具有挑战性的任务，因为难以集成来自多个表示的信息。大多数现有的多视图聚类方法探索数据点所在空间中的异构信息。由于不可避免的噪音或观点之间的不一致，这种常见做法可能导致重大信息丢失。由于不同的视图允许相同的集群结构，因此自然空间应该是所有分区。与现有技术正交，在本文中，我们建议通过融合分区来利用多视图信息。具体而言，我们通过不同的旋转矩阵对齐每个分区以形成一致的聚类指示符矩阵。此外，为每个视图分配权重以考虑视图的聚类容量差异。最后，在统一框架中共同学习基本分区，权重和一致性聚类。我们证明了我们的方法在几个真实数据集上的有效性，其中发现了相对于其他最先进的多视图聚类方法的显着改进。

Center-Extraction-Based Three Dimensional Nuclei Instance Segmentation of Fluorescence Microscopy Images
Authors David Joon Ho, Shuo Han, Chichen Fu, Paul Salama, Kenneth W. Dunn, Edward J. Delp
荧光显微镜是分析组织中3D亚细胞结构的重要工具。表征组织的重要步骤涉及细胞核分割。在本文中，描述了使用卷积神经网络CNN分割核的两阶段方法。特别地，由于3D数据集的大小和复杂性，手动创建用于训练目的的标记体积是不实际的，因此本文描述了一种基于空间受限的循环一致性对抗网络生成合成显微镜体积的方法。所提出的方法在多个真实的显微镜数据集上进行测试，并且优于其他常用的分割技术。

SegNAS3D: Network Architecture Search with Derivative-Free Global Optimization for 3D Image Segmentation
Authors Ken C. L. Wong, Mehdi Moradi
深度学习大大减少了对图像分割中手动特征选择的需求。然而，网络架构优化和超参数调整大多是手动和耗时的。尽管在计算机视觉中对网络体系结构搜索的研究越来越多，但大多数工作集中在图像分类而非分割，并且在医学图像分割方面的努力非常有限，特别是在3D中。为了解决这个问题，我们在此提出了一个框架SegNAS3D，用于三维图像分割的网络架构搜索。在该框架中，网络体系结构包括互连的构建块，其由诸如卷积和跳过连接的操作组成。通过将块结构表示为可学习的有向非循环图，可以通过衍生自由全局优化一起学习诸如特征通道的数量和使用深度监督的选项之类的超参数。对具有19个结构的43个3D脑磁共振图像的实验实现了平均Dice系数为82。每个架构搜索在三个GPU上需要不到三天的时间，并且生成的架构比手动创建的架构要小得多。

Encoding High-Level Visual Attributes in Capsules for Explainable Medical Diagnoses
Authors Rodney LaLonde, Drew Torigian, Ulas Bagci
由于难以解释决策，深度神经网络通常被称为黑盒子。这是机器学习更深层次趋势的特征，其中预测性能通常以可解释性为代价。在某些领域，例如基于图像的诊断任务，了解机器生成预测背后的原因对于评估信任至关重要。在这项研究中，我们介绍了胶囊网络的新颖设计，以提供可解释的诊断。我们提出的深度可解释的胶囊结构称为DX Caps，可以在胶囊载体内编码高水平的视觉属性，以便同时产生肺癌的恶性预测以及放射科医师用于解释其预测的六种视觉可解释属性的近似值。为了减少这个更深层网络的参数和内存负担，我们引入了一个新的胶囊平均池功能。通过这种简单但基本的补充，胶囊网络可以以比以前更深的方式设计。我们的整体方法可以表征为多任务学习，我们学习在我们独特构建的深层胶囊网络的载体内近似肺结节的六个高级视觉属性，同时分割结节并预测其恶性潜在诊断。通过1000多次CT扫描测试，我们的实验结果表明，我们提出的算法可以近似于肺结节的视觉属性远远好于深度多路径密集3D CNN。当首次应用于此任务时，所提出的网络也比基线可解释的胶囊网络X Caps和CapsNet实现更高的诊断准确度。据我们所知，这是第一个研究胶囊网络进行视觉属性预测的研究，特别是可解释的医学图像诊断。

A method for Cloud Mapping in the Field of View of the Infra-Red Camera during the EUSO-SPB1 flight
Authors Alessandro Bruno, Anna Anzalone, Carlo Vigorito for the JEM EUSO collaboration
EUSO SPB1于2017年4月24日在新西兰瓦纳卡的美国宇航局气球发射场发布，于5月7日降落在南太平洋。分析由气球上的仪器收集的数据以搜索UHECR超高能宇宙射线空气淋浴的UV脉冲特征。夜间云的存在会影响UHECR的间接测量，因此了解探测器观测期间的气象条件至关重要。在飞行过程中，机上EUSO SPB1 UCIRC摄像机芝加哥大学红外线摄像机获取了紫外望远镜视野中的图像。可用的夜间和白天图像包括在两个红外波段中观察到的大气气象条件的信息。已经研究了云的存在，采用了一种方法，该方法被开发用于为每个可用的红外图像提供密集的云度图。最终的掩模用于在IR相机像素分辨率下给出像素云量信息，该分辨率几乎是UV相机的4倍。在这项工作中，通过使用基于不同低级图像特征分析的专家系统获得云度图。此外，需要应用图像增强步骤作为处理未校准数据的预处理步骤。

Perceptual Image Anomaly Detection
Authors Nina Tuluptceva, Bart Bakker, Irina Fedulova, Anton Konushin
我们提出了一种新的图像异常检测方法，其中使用从正常数据的某些分布中抽取的样本的算法旨在检测分布异常样本。我们的方法包括编码器和发生器的组合，用于将图像分布映射到预定义的潜在分布，反之亦然。它利用Generative Adversarial Networks来学习这些数据分布，并使用感知损失来检测图像异常。为了实现这一目标，我们引入了一种新的相似性度量，它表达了图像之间的感知相似性，并且对图像对比度的变化具有鲁棒性。其次，我们介绍了一种新方法，用于在没有用于超参数调整的验证数据集的情况下选择多目标损失函数图像重建和分布映射的权重。在训练之后，我们的模型测量输入图像的异常，作为它与建模数据分布的最近生成图像之间的感知差异。所提出的方法在几个公开可用的图像基准上进行了广泛的评估，并实现了最先进的性能。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页

膜拜一下巅峰算力:) 百P算力 1024*Ascend910(*32 Da Vinci AI core) pic from huaweis.com

你可能感兴趣的:(机器学习,目标检测,计算机视觉)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
[数据集][目标检测]汽车头部尾部检测数据集VOC+YOLO格式5319张3类别 FL1623863129 数据集目标检测汽车 YOLO
数据集制作单位：未来自主研究中心(FIRC)版权单位：未来自主研究中心(FIRC)版权声明：数据集仅仅供个人使用，不得在未授权情况下挂淘宝、咸鱼等交易网站公开售卖,由此引发的法律责任需自行承担数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：5319标注数量(xml文件
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc

【AI视野·今日CV 计算机视觉论文速览 第157期】Mon, 16 Sep 2019

Interesting:

Daily Computer Vision Papers

你可能感兴趣的:(机器学习,目标检测,计算机视觉)

【AI视野·今日CV 计算机视觉论文速览第157期】Mon, 16 Sep 2019