hitrjj

【今日CV 计算机视觉论文速览第111期】Fri, 3 May 2019

今日CS.CV 计算机视觉论文速览
Fri, 3 May 2019
Totally 29 papers
?上期速览✈更多精彩请移步主页

Interesting:

?****Single Image Portrait Relighting单图肖像光照重建, 本文提出了一种为手机拍摄人像修改光照的方法，通过提供的环境光照明图像将生成目标光照下的新图像。这一方法仅仅在18个独立个体在受控光源下手机的数据集进行训练。640-640照片只需要160ms，有集成到手机相机中的潜力。(from UCSD)

基于自编码器原理的光照变换网络示意图。中间可以预测光照也可以修改光照：

数据集构建 OLAT imageset，与目标相隔1.7m相机间相隔20度，图像加权合成后可以得到环境光的分布：

网络模型细节如下图所示,分别训练了光照编码和目标光照下的图像损失：

Authors:http://kevinkingo.com/
Group:http://jacobsschool.ucsd.edu/visualcomputing/
prof:https://cseweb.ucsd.edu/~ravir/

?***DPSNET深度平面扫描立体视觉,最近研究人员开始利用语义信息来改进对于无纹理或反光表面的深度图估计。与先前方法直接估计深度或者光流不同的是，DPSNet利用平面扫描算法来构建cost体，并从体中回归出深度图。cost volume来自于可差分的变换过程，使得这一方法可以利用深度学习进行训练。 (from KAIST,CMU,MSRA)
深图图构建过程：

网络模型的细节结构和构造：

一些结果：

?大规模图像分类半监督学习, (from Facebook AI)
利用一个训练好的teacher模型从大规模的无标签数据中选出新的数据集，随后再利用新数据集训练学生网络，并利用原始数据集进行调优：

?RetinaFace单阶段的稠密人脸定位, 包含了外监督、自监督多任务学习等多个平行分支。将输出人脸分类分数、bbox，人脸五个关键点、人脸的3D顶点投影等信息。(from 帝国理工)

搜索到的人脸900/1151：

ref:人脸分析库：insightface:https://github.com/deepinsight/insightface

?局域光场融合, 基于多个非规则视角插值得到新视角的渲染图像。(from 加州大学伯克利分校)

利用多平米模型表示图像并进行融合：

?基于回归卷积的假人脸视频检测, 检测了detect Deepfake,Face2Face 和FaceSwap等方法生成的伪造视频。(from USC信息科技学院)
模型架构：

dataset: FaceForensics++

?3D BAT, 半自动化基于web的3D标注工具，用于自动驾驶全景多模态数据(from UCSD)

code:https://github.com/walzimmer/3d-bat

?LIVDET IN ACTION, 活体指纹检测比赛(from University of Cagliari意大利)

dataset: LivDet 2019

?2019 DAVIS Challenge on Video Object Segmentation, 包括了半监督追踪、交互式追踪、非监督多目标追踪等任务。(from ETHz google AI adobe Research)

link:http://davischallenge.org/

Daily Computer Vision Papers

Local Light Field Fusion: Practical View Synthesis with Prescriptive Sampling Guidelines
Authors Ben Mildenhall, Pratul P. Srinivasan, Rodrigo Ortiz Cayon, Nima Khademi Kalantari, Ravi Ramamoorthi, Ren Ng, Abhishek Kar
我们提供了一种实用且强大的深度学习解决方案，用于捕获和渲染复杂现实世界场景的新视图以进行虚拟探索以前的方法要么需要难以处理的密集视图采样，要么对用户应如何对场景的视图进行采样以可靠地呈现高质量的新颖视图提供很少或没有指导。相反，我们提出了一种用于从不规则的采样视图网格进行视图合成的算法，该算法首先通过多平面图像MPI场景表示将每个采样视图扩展为局部光场，然后通过混合相邻的局部光场来渲染新颖视图。我们扩展了传统的全光采样理论，以推导出一个边界，该边界精确地指定用户在使用我们的算法时应该如何密集地对给定场景的视图进行采样。在实践中，我们应用此界限来捕获和渲染真实世界场景的视图，这些视图实现了奈奎斯特速率视图采样的感知质量，同时使用的视图减少了多达4000倍。我们通过增强现实智能手机应用程序展示我们的方法的实用性，该应用程序可引导用户捕获场景的输入图像，以及在桌面和移动平台上实现实时虚拟探索的查看器。

Self-supervised Learning for Video Correspondence Flow
Authors Zihang Lai, Weidi Xie
本文的目的是对来自视频的特征嵌入进行自我监督学习，适用于对应流，即匹配视频上帧之间的对应关系。我们利用视频中外观的自然空间时间一致性来创建指针模型，该模型学习通过复制参考帧中的颜色来重建目标帧。

Lifting Vectorial Variational Problems: A Natural Formulation based on Geometric Measure Theory and Discrete Exterior Calculus
Authors Thomas M llenhoff, Daniel Cremers
成像和视觉方面的许多任务可以被制定为矢量值映射的变分问题。我们通过提升到电流空间来处理这种矢量变分问题的松弛和凸化。为此，我们记得具有多凸拉格朗日的函数可以在函数图上重新参数化为凸一齐函数。这导致在域和密码域的产品空间中的取向表面上的等效形状优化问题。然后通过将搜索空间从定向表面放松到更一般的电流来获得凸形配方。我们提出使用Whitney形式对所得到的无限维优化问题进行离散化，这也推广了最近的子标签精确多标记方法。

Clustering Images by Unmasking - A New Baseline
Authors Mariana Iuliana Georgescu, Radu Tudor Ionescu
我们提出了一种基于unmasking的新型凝聚聚类方法，这种技术以前用于文本文档的作者验证和视频中的异常事件检测。为了连接两个聚类，我们在训练二元分类器之间交替，以区分来自一个聚类的样本和来自另一个聚类的样本，以及ii在每个步骤中去除最具判别性的特征。中间获得的分类器的更快降低的准确率表明应该连接两个簇。据我们所知，这是第一个应用取消屏蔽以聚类图像的工作。我们将我们的方法与k均值以及最近的现有聚类方法进行比较。实证结果表明，我们的方法能够提高各种深层和浅层特征表示和不同任务的性能，如手写数字识别，纹理分类和细粒度物体识别。

Human Action Recognition with Deep Temporal Pyramids
Authors Ahmed Mazari, Hichem Sahbi
深度卷积神经网络CNN现在在包括动作识别在内的不同模式识别任务中实现了重大飞跃。当前的CNN越来越深，数据越来越多，这使得它们成为大量标记训练数据的成功支流。 CNN还依赖于最大平均合并，这降低了输出层的维数，从而削弱了它们对标记数据可用性的敏感性。然而，该过程可能稀释上游卷积层的信息，从而影响训练表示的辨别力，特别是当学习的类别被细粒度化时。

Egocentric Hand Track and Object-based Human Action Recognition
Authors Georgios Kapidis, Ronald Poppe, Elsbeth van Dam, Lucas P. J. J. Noldus, Remco C. Veltkamp
以自我为中心的视觉是一个新兴的计算机视觉领域，其特点是从第一人称视角获取图像和视频。在本文中，我们通过明确利用场景中检测到的感兴趣区域的存在和位置来解决自我中心人类行为识别的挑战，而无需进一步使用视觉特征。

The 2019 DAVIS Challenge on VOS: Unsupervised Multi-Object Segmentation
Authors Sergi Caelles, Jordi Pont Tuset, Federico Perazzi, Alberto Montes, Kevis Kokitsi Maninis, Luc Van Gool
我们将介绍2019年DAVIS挑战视频对象分割，这是DAVIS挑战系列的第三版，这是一项专为视频对象分割VOS设计的公共竞赛。除了原版半监督音轨和上一版中引入的互动音轨外，今年还将推出一款新的无监督多目标音轨。在新引入的轨道中，要求参与者在每个图像上提供非重叠的对象提议，以及在帧之间链接它们的标识符，即视频对象提议，而没有任何测试时间，人工监督没有在测试视频上提供的涂鸦或掩模。为了做到这一点，我们以简洁的方式重新注释了DAVIS 2017的列车和val集，以促进无人监督的轨道，并为比赛创建了新的测试开发和测试挑战集。本文详细描述了无监督轨道的定义，规则和评估指标。

Face Identification using Local Ternary Tree Pattern based Spatial Structural Components
Authors Rinku Datta Rakshit, Dakshina Ranjan Kisku, Massimo Tistarelli, Phalguni Gupta
本文报告了人脸识别系统的突破性结果，该系统利用了一种称为局部三元树模式的新型局部描述符。当系统在存在包括约束，无约束和整形外科图像的多种面部图像的情况下执行时，为面部图像设计灵巧且可行的局部描述符在面部识别任务中起到紧急的前言。已经提出LTTP从面部图像提取鲁棒且有区别的空间特征，因为该描述符可用于最佳地描述面部的各种结构组件。为了提取最有用的特征，为每个像素形成具有八个邻居的三元树。 LTTP模式可以以四种方式生成LTTP左深度，LTTP左宽度，LTTP右深度和LTTP右宽度。这四种模式生成的编码方案在计算复杂性和时间复杂性方面非常简单和有效。所提出的面部识别系统在六个面部数据库上进行测试，即UMIST，JAFFE，扩展的耶鲁面部B，整形外科，LFW和UFI。实验评估表明，考虑到在不同环境下捕获的各种面部，在设计面部识别系统时将产生长期影响的最优秀结果。

DS-VIO: Robust and Efficient Stereo Visual Inertial Odometry based on Dual Stage EKF
Authors Xiaogang Xiong, Wenqing Chen, Zhichao Liu, Qiang Shen
本文提出了一种基于EKF扩展卡尔曼滤波器的双阶段算法，用于实时和稳健的立体声VIO视觉惯性测距。这种基于EKF的算法的第一阶段执行加速度计和陀螺仪的融合，而第二阶段执行立体相机和IMU的融合。由于加速度计和陀螺仪以及立体相机和IMU之间具有足够的互补特性，基于双级EKF的算法可以实现高精度的测距估计。同时，由于该算法中状态向量的维数较低，其计算效率可与之前基于滤波器的方法相媲美。我们称之为DS VIO双级基于EKF的立体视觉惯性测量法，并通过将其与EuRoC数据集上的OKVIS，ROVIO，VINS MONO和S MSCKF等现有技术方法进行比较来评估我们的DSVIO算法。结果表明，我们的算法在RMS误差方面可以达到相当甚至更好的性能

RetinaFace: Single-stage Dense Face Localisation in the Wild
Authors Jiankang Deng, Jia Guo, Yuxiang Zhou, Jinke Yu, Irene Kotsia, Stefanos Zafeiriou
尽管在不受控制的人脸检测方面取得了巨大进步，但野外准确有效的面部定位仍然是一个开放的挑战。本文提出了一种强大的单阶段人脸检测器，名为RetinaFace，它利用联合额外监督和自我监督的多任务学习，在各种人脸尺度上进行像素智能人脸定位。具体来说，我们在以下五个方面做出贡献1我们在WIDER FACE数据集上手动注释五个面部标志，并在这个额外监督信号的帮助下观察硬面检测的显着改进。 2我们进一步添加了一个自监督网格解码器分支，用于与现有的监督分支并行地预测像素方面的3D形状面部信息。 3在WIDER FACE硬测试装置上，RetinaFace的性能优于现有技术平均精度AP 1.1，达到AP等于bf 91.4。 4在IJB C测试装置上，RetinaFace使最先进的方法ArcFace能够在FAR 1e 6的面部验证TAR 89.59中改进其结果。 5通过采用轻量级骨干网络，RetinaFace可以在单个CPU核心上实时运行以获得VGA分辨率图像。将发布额外的注释和代码以方便将来的研究。

LivDet in Action - Fingerprint Liveness Detection Competition 2019
Authors Giulia Orr , Roberto Casula, Pierluigi Tuveri, Carlotta Bazzoni, Giovanna Dessalvi, Marco Micheletto, Luca Ghiani, Gian Luca Marcialis
国际指纹活体检测竞赛LivDet是一个公开的，公认的学术界和私营公司的会议点，处理区分来自人造材料和图像相对于真实指纹的指纹复制的图像的问题。在本期LivDet中，我们邀请竞争对手提出具有匹配系统的集成算法。目标是调查这种整合在多大程度上影响整个绩效。提交了12个算法，其中8个算法用于集成系统。

Directing DNNs Attention for Facial Attribution Classification using Gradient-weighted Class Activation Mapping
Authors Xi Yang, Bojian Wu, Issei Sato, Takeo Igarashi
深度神经网络DNN在图像分类任务中具有高精度。然而，由此类数据集训练的具有共发生偏差的DNN可能在制定分类决策时依赖于错误的特征。它将极大地影响训练有素的DNN的可转移性。在本文中，我们提出了一种交互方法，以指导分类器关注用户手动指定的区域，以减轻共现偏差的影响。我们在CelebA数据集上进行测试，经过预先训练的AlexNet经过精心调整，专注于基于Grad CAM结果的特定面部属性。

Recurrent-Convolution Approach to DeepFake Detection - State-Of-Art Results on FaceForensics++
Authors Ekraam Sabir, Jiaxin Cheng, Ayush Jaiswal, Wael AbdAlmageed, Iacopo Masi, Prem Natarajan
错误信息的传播已成为一个重要问题，提高了相关检测方法的重要性。虽然存在不同的错误信息表现，但在这项工作中，我们专注于检测视频中的面部操作。具体来说，我们尝试在视频中检测Deepfake，Face2Face和FaceSwap操作。我们利用循环方法利用视频的时间动态。在FaceForensics数据集上进行评估，并且我们的方法改进了先前的技术水平4.55。

Large-scale weakly-supervised pre-training for video action recognition
Authors Deepti Ghadiyaram, Matt Feiszli, Du Tran, Xueting Yan, Heng Wang, Dhruv Mahajan
当前完全监督的视频数据集仅包含几十万个视频和少于一千个域特定标签。这阻碍了高级视频架构的发展。本文对使用大量网络视频进行预训练视频模型以进行动作识别任务进行了深入研究。我们的主要实证研究结果是，尽管有嘈杂的社交媒体视频和标签，但是大规模预训练超过6500万个视频，大大改善了三个具有挑战性的公共行动识别数据集的最新技术水平。此外，我们研究了弱监督视频动作数据集构建中的三个问题。首先，假设动作涉及与对象的交互，那么如何构建动词对象预训练标签空间以最有利于转移学习第二，基于框架的模型在动作识别上表现良好是对良好图像特征的预训练足够或者是训练前对于最佳转移学习有价值的时空特征最后，由于动作标签是在视频级别提供的，因此在长视频与短视频中的动作通常不太好，因为如果有一些固定的数字预算，应如何选择视频片段以获得最佳性能或几分钟的视频

Billion-scale semi-supervised learning for image classification
Authors I. Zeki Yalniz, Herv J gou, Kan Chen, Manohar Paluri, Dhruv Mahajan
本文提出了一种大型卷积网络半监督学习的研究。我们提出了一个基于教师学生范式的管道，它利用了大量未标记图像，最多可达10亿。我们的主要目标是改善给定目标体系结构的性能，如ResNet 50或ResNext。我们对我们的方法的成功因素进行了广泛的分析，这使我们能够制定一些建议来生成用于半监督学习的图像分类的高精度模型。因此，我们的方法为图像，视频和细粒度分类的标准体系结构带来了重要的收益。例如，通过利用10亿个未标记的图像，我们学到的香草ResNet 50在ImageNet基准测试中达到了81.2的前1精度。

DPSNet: End-to-end Deep Plane Sweep Stereo
Authors Sunghoon Im, Hae Gon Jeon, Stephen Lin, In So Kweon
多视图立体声旨在从在任意运动下由相机获取的图像重建场景深度。最近的方法通过深度学习解决了这个问题，深度学习可以利用语义线索来处理诸如无纹理和反射区域之类的挑战。在本文中，我们提出了一个称为DPSNet深平面扫描网络的卷积神经网络，其设计灵感来自基于传统几何的密集深度重建方法的最佳实践。 DPSNet采用平面扫描方法，而不是直接估计图像对中的深度和/或光流对应，而不是使用平面扫描算法从深度特征构建成本量，通过上下文调整成本量。了解成本汇总，并从成本量中回归密集深度图。成本量使用可区分的变形过程构建，该过程允许对网络进行端到端的训练。通过在深度学习框架内有效地结合传统的多视图立体概念，DPSNet在各种具有挑战性的数据集上实现了最先进的重建结果。

RRPN: Radar Region Proposal Network for Object Detection in Autonomous Vehicles
Authors Ramin Nabati, Hairong Qi
区域提议算法通过假设每个图像中的对象位置在大多数现有技术的两阶段对象检测网络中起重要作用。尽管如此，已知区域提议生成器是这两个阶段对象检测网络中的瓶颈，使得它们变慢并且不适合于诸如自动驾驶车辆的实时应用。在本文中，我们介绍了一种基于雷达的实时区域提议算法，用于自动驾驶车辆中的目标检测。通过将雷达检测映射到图像坐标系并且在每个映射的雷达点处生成预定义的锚框作为对象提议来生成所提出的感兴趣区域RoI。然后，我们基于对象距离对生成的锚执行变换和缩放操作，以更好地适合检测到的对象。我们使用Fast R CNN对象检测网络在新发布的NuScenes数据集上评估我们的方法。与选择性搜索对象提议算法相比，我们的模型运行速度提高了100倍以上，同时实现了更高的检测精度和召回率。代码已公开发布于

3D BAT: A Semi-Automatic, Web-based 3D Annotation Toolbox for Full-Surround, Multi-Modal Data Streams
Authors Walter Zimmer, Akshay Rangesh, Mohan Trivedi
在本文中，我们专注于获取2D和3D标签，以及借助新颖的3D Bounding Box Annotation Toolbox 3D BAT跟踪道路上物体的ID。我们的开源，基于Web的3D BAT集成了多项智能功能，可提高可用性和效率。例如，此注释工具箱支持使用插值对轨道进行半自动标记，这对下游任务（如跟踪，运动规划和运动预测）至关重要。此外，通过将来自3D空间的注释投影到图像域中，自动获得所有相机图像的注释。除了原始图像和点云馈送之外，还可以使用由顶视图鸟瞰图，侧视图和正视图组成的主视图，以从不同视角观察感兴趣的对象。我们的方法与其他公开可用的注释工具的比较表明，使用我们的工具箱可以更快，更有效地获得3D注释。

Optimal Multi-view Correction of Local Affine Frames
Authors Ivan Eichhardt, Daniel Barath
该技术要求在每个图像对之间预先估计对极几何。它利用了摄像机运动所暗示的约束，以便将闭合形式校正应用于输入亲和度的参数。而且，示出了通过部分仿射协变检测器（例如，AKAZE或SIFT）获得的旋转和标度可以通过所提出的算法完成为全仿射帧。它在合成实验和公开可用的现实世界数据集中得到验证，该方法总是改进评估的仿射协变特征检测器的输出。作为副产品，比较这些检测器并报告获得最准确的仿射帧的检测器。为了证明其适用性，我们表明所提出的技术作为预处理步骤提高了相机装备，表面法线和单应性估计的姿态估计的准确性。

Detection of Single Grapevine Berries in Images Using Fully Convolutional Neural Networks
Authors Laura Zabawa, Anna Kicherer, Lasse Klingbeil, Andres Milioto, Reinhard T pfer, Heiner Kuhlmann, Ribana Roscher
产量估算和预测在葡萄育种和葡萄栽培领域特别受关注。每株植物收获的浆果数量与产生的质量密切相关。因此，早期产量预测可以使浆果集中稀疏，以确保高质量的最终产品。传统上，产量估算是通过从小样本量推断和利用历史数据来完成的。此外，它需要由在该领域具有丰富经验的熟练专家来执行。图像中的浆果检测为专家提供了一种廉价，快速且无创的替代方案，可用于其他耗时且主观的现场分析。我们对用Phenoliner（一种野外表型分析平台）获得的图像应用完全卷积神经网络。我们计算图像中的单个浆果，以避免错误检测葡萄串。群集通常是重叠的，并且可以在大小上变化很大，这使得难以可靠地检测它们。我们特别致力于直接在葡萄园中检测白葡萄。单个浆果的检测被制定为具有三个类别的分类任务，即浆果，边缘和背景。应用连通分量算法来确定一个图像中的浆果数量。我们比较自动计数的浆果数量与手动检测到的浆果在60个图像中显示雷司令植物在垂直拍摄定位格子VSP和半最小修剪树篱SMPH。我们能够在VSP系统内正确检测浆果，准确度为94.0，SMPH系统的准确度为85.6。

Single Image Portrait Relighting
Authors Tiancheng Sun, Jonathan T. Barron, Yun Ta Tsai, Zexiang Xu, Xueming Yu, Graham Fyffe, Christoph Rhemann, Jay Busch, Paul Debevec, Ravi Ramamoorthi
照明在肖像照片中传达主体的本质和深度方面起着核心作用。专业摄影师将仔细控制他们工作室的灯光以操纵他们的主题的外观，而消费者摄影师通常被限制在他们的环境照明。尽管先前的工作已经探索了重新照亮图像的技术，但是由于专用硬件的要求，受控或已知照明下的受试者的多个图像，或几何和反射的精确模型，它们的效用通常是有限的。为此，我们提出了一个纵向重新点亮神经网络的系统，该系统将在无约束环境中用标准手机相机拍摄的肖像的单个RGB图像作为输入，并从该图像产生该主体的重新图像，就好像它一样。根据任何提供的环境地图照亮。我们的方法是在一个由18个人组成的小型数据库上进行训练，这个数据库是在一个由密集采样光球组成的受控光阶段设置下在不同方向光源下捕获的。与先前的工作相比，我们提出的技术在我们的数据集验证集上产生了定量优越的结果，并在数百个真实世界手机肖像的数据集上产生了令人信服的定性重新照明结果。因为我们的技术可以在160毫秒内产生640倍640的图像，所以它可以在未来实现面向摄影应用的交互式用户。

Toward Extremely Low Bit and Lossless Accuracy in DNNs with Progressive ADMM
Authors Sheng Lin, Xiaolong Ma, Shaokai Ye, Geng Yuan, Kaisheng Ma, Yanzhi Wang
权重量化是深度神经网络DNNs模型压缩方法中最重要的技术之一。最近使用先进的优化算法ADMM交替方向乘法方法使用DNN权重量化的系统框架的工作实现了权重量化的一种现有技术结果。在这项工作中，我们首先扩展这种基于ADMM的框架以保证解决方案的可行性，并且我们进一步开发了一个多步骤，渐进式DNN权重量化框架，由于ADMM正规化的特殊性，我实现了进一步的权重量化的双重好处，以及ii减少每个步骤中的搜索空间。广泛的实验结果证明了与先前工作相比的卓越性能。我们为MNIST的所有层LeNet 5推出了第一个无损和完全二值化的亮点。我们为CIFAR 10的所有层VGG 16和ImageNet的ResNet推出了第一个完全二值化，并且具有合理的精度损失。

Full-Jacobian Representation of Neural Networks
Authors Suraj Srinivas, Francois Fleuret
诸如神经网络的非线性函数可以通过仿射平面局部地近似。最近的作品使用了输入雅可比行列式，它描述了这些平面的法线。在本文中，我们介绍了完整的雅可比行列式，其中包括这个法线以及一个称为偏差雅可比行星的附加截距项，它们共同描述了局部平面。对于ReLU神经网络，偏置雅可比行列式对应于输出w.r.t的梯度之和。中间层激活。

Inverse Halftoning Through Structure-Aware Deep Convolutional Neural Networks
Authors Chang Hwan Son
逆半色调中的主要问题是去除平坦区域上的噪声点并恢复图像结构，例如纹理区域上的线条，图案。因此，本文提出了一种结构为两个子网的新结构感知深度卷积神经网络。一个子网用于图像结构预测，而另一个用于连续色调图像重建。首先，为了预测图像结构，训练包括连续色调片的片对和通过数字半色调产生的相应半色调片。随后，通过将梯度滤波器与连续色调片进行卷积来生成梯度片。在给定半色调片和梯度片的情况下，使用微批量梯度下降算法训练图像结构预测的子网，其分别被馈送到子网的输入和丢失层。接下来，包括图像结构的预测地图通过融合层堆叠在输入半色调图像的顶部，并且被馈送到图像重建子网中，使得整个网络被自适应地训练到图像结构。实验结果证实，所提出的结构感知网络可以在平坦区域上很好地去除噪声点图案并在纹理区域上清楚地恢复细节。此外，证明了所提出的方法超过了基于深度卷积神经网络和本地学习词典的传统现有技术方法。

26ms Inference Time for ResNet-50: Towards Real-Time Execution of all DNNs on Smartphone
Authors Wei Niu, Xiaolong Ma, Yanzhi Wang, Bin Ren
随着一系列高端移动设备的迅速出现，许多以前需要桌面级计算能力的应用程序现在可以在这些设备上运行而没有任何问题。然而，如果不进行仔细优化，执行深度神经网络是实时视频流处理的关键构建块，这是许多常用应用程序的基础，但仍然具有挑战性，特别是如果需要极低延迟或高精度推断。这项工作介绍了CADNN，这是一个编程框架，借助先进的模型压缩稀疏性和一套全面的体系结构感知优化，在移动设备上高效地执行DNN。评估结果表明，CADNN优于所有最先进的密集DNN执行框架，如TensorFlow Lite和TVM。

Land Use and Land Cover Classification Using Deep Learning Techniques
Authors Nagesh Kumar Uba
目前广泛使用表示为正射影像马赛克的亚米级航空影像的大型数据集，这些数据集可能包含大量尚未开发的信息。此图像有可能找到几种类型的功能，例如森林，停车场，机场，住宅区或图像中的高速公路。然而，这些东西的出现基于许多因素而变化，包括捕获图像的时间，传感器设置，用于矫正图像的处理以及由图像捕获的区域的地理和文化背景。本文探讨了使用深度卷积神经网络从非常高的空间分辨率VHR，正射校正，可见带多光谱图像中分类土地利用。最近的技术和商业应用已经在可见的红色，绿色，蓝色RGB光谱带中驱动了大量的VHR图像，这项工作探索了深度学习算法利用该图像进行自动土地利用土地覆盖LULC分类的潜力。

Fully Automatic Brain Tumor Segmentation using a Normalized Gaussian Bayesian Classifier and 3D Fluid Vector Flow
Authors Tao Wang, Irene Cheng, Anup Basu
来自磁共振图像的脑肿瘤分割MRI是测量肿瘤对治疗的反应的重要任务。但是，自动分割非常具有挑战性。本文提出了一种基于归一化高斯贝叶斯分类的自动脑肿瘤分割方法和一种新的三维流体矢量流FVF算法。在我们的方法中，提出了归一化高斯混合模型NGMM并用于模拟健康的脑组织。利用高斯贝叶斯分类器从测试脑MR图像中获取高斯贝叶斯脑图GBBM。进一步处理GBBM以初始化3D FVF算法，该算法对脑肿瘤进行分割。该算法有两个主要贡献。首先，我们提出一个NGMM来模拟健康的大脑。其次，我们将2D FVF算法扩展到3D空间并将其用于脑肿瘤分割。所提出的方法在公开可用的数据集上得到验证。

NATTACK: Learning the Distributions of Adversarial Examples for an Improved Black-Box Attack on Deep Neural Networks
Authors Yandong Li, Lijun Li, Liqiang Wang, Tong Zhang, Boqing Gong
强大的对抗性攻击方法对于理解如何构建强大的深度神经网络DNN以及彻底测试防御技术至关重要。在本文中，我们提出了一种黑盒子对抗攻击算法，它可以击败香草DNN和最近开发的各种防御技术产生的DNN。我们的算法不是为目标DNN的良性输入搜索最佳对抗性示例，而是在以输入为中心的小区域上找到概率密度分布，这样从这个分布中抽取的样本很可能是一个对抗性的例子，而不需要访问DNN的内部层或权重。我们的方法是通用的，因为它可以通过单一算法成功攻击不同的神经网络。根据针对2个香草DNN和13个防御DNN的测试，它也很强大，它在大多数测试案例中都优于最先进的黑盒子或白盒攻击方法。此外，我们的结果显示，对抗性训练仍然是最好的防御技术之一，而对抗性的例子并不像防御DNN那样可以在防御性DNN中转移。

ResNet Can Be Pruned 60x: Introducing Network Purification and Unused Path Removal (P-RM) after Weight Pruning
Authors Xiaolong Ma, Geng Yuan, Sheng Lin, Zhengang Li, Hao Sun, Yanzhi Wang
现有的DNN结构涉及高计算量和对存储器存储的巨大需求，这对DNN框架资源构成了严峻的挑战。为了缓解这些挑战，已经研究了重量修剪技术。然而，极端结构化修剪的高精度解决方案结合了不同类型的结构化稀疏性，由于DNN网络中的重量极度减少，仍然在等待解开。在本文中，我们提出了一种DNN框架，它结合了两种不同类型的结构权重修剪滤波器和柱修剪，通过结合交替方向的乘法器ADMM算法，以获得更好的修剪性能。我们是第一个在结构化修剪模型中找到ADMM过程和未使用权重的非最优性，并进一步设计一个优化框架，其中包含第一个提出的网络净化和未使用路径去除算法，这些算法专用于在ADMM之后对结构化修剪模型进行后处理脚步。一些高亮显示我们在LeNet 5上实现232x压缩，在ResNet 18 CIFAR 10上实现60x压缩，在AlexNet上实现超过5倍压缩。我们以匿名链接分享我们的模型

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页

pic from pixels.com

你可能感兴趣的:(目标检测,视觉,深度学习,机器学习,计算机视觉,Papers)

目标检测领域总结：从传统方法到 Transformer 时代的革新 DoYangTan 目标检测系列目标检测 transformer 人工智能
目标检测领域总结：从传统方法到Transformer时代的革新目标检测是计算机视觉领域的一个核心任务，它的目标是从输入图像中识别并定位出目标物体。随着深度学习的兴起，目标检测方法已经取得了显著的进展。从最早的传统方法到现如今基于Transformer的先进算法，目标检测的发展经历了多个重要的阶段。本文将详细总结目标检测领域的演进，涵盖传统方法、两阶段检测方法、单阶段检测方法和基于Transform
2024MathorCup数学建模之——MathorCup奖杯”获得者经验思路分享美赛数学建模数学建模
一、经验分享1.工具选择：顺手即可。Matlab和Python都是比较主流的选择，二者的应用场合各有不同。Python在数据分析、深度学习方面的优势愈发明显，而Matlab更适合进行物理仿真和数值计算。不过随着Python社区不断发展，其功能也愈发全面与强大，因此我们比较推荐学有余力的情况下可以更早接触Python。2.模型算法：多多益善。不一定要精通所有的算法，但是手上至少要准备一些常用的算法（
194.HarmonyOS NEXT系列教程之图案锁交互反馈系统详解 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之图案锁交互反馈系统详解效果预览1.交互反馈系统概述1.1反馈类型//反馈类型定义interfaceFeedbackTypes{visual:boolean;//视觉反馈haptic:boolean;//触觉反馈message:
AI人工智能软件开发方案：开启智能时代的创新钥匙广州硅基技术官方人工智能
一、引言：AI浪潮下的软件开发新机遇近年来，人工智能（AI）技术的迅猛发展如同一股汹涌澎湃的浪潮，席卷了全球各个领域。从最初的概念提出到如今的广泛应用，AI历经了漫长的发展历程，终于迎来了属于它的黄金时代。回首过去，AI的发展并非一帆风顺，早期由于计算能力和算法的限制，经历了多次起伏。但随着大数据、云计算、机器学习、深度学习等技术的不断突破，AI迎来了爆发式增长。如今，AI已经深入到人们生活和工作
YOLOV8多模态(可见光+红外光，基于Ultralytics官方代码实现） @M_J_Y@ 目标检测 YOLO 计算机视觉目标检测 python
YOLOV8多模态(可见光+红外光，基于Ultralytics官方代码实现）各位读者麻烦给个star或者fork，求求了。YOLOV8双分支模型架构图YOLOV8多模态目标检测前言：环境配置要求1.数据集DroneVehicle数据集(可见光+热红外)2.数据集文件格式(labeles:YOLO格式)3.权重文件下载4.配置模型yaml文件和数据集yaml文件5.训练6.测试7.打印模型信息8.o
深度学习框架PyTorch——从入门到精通（6.2）自动微分机制 Fansv587 深度学习 pytorch 人工智能经验分享 python 机器学习
本节自动微分机制是上一节自动微分的扩展内容自动微分是如何记录运算历史的保存张量非可微函数的梯度在本地设置禁用梯度计算设置requires_grad梯度模式（GradModes）默认模式（梯度模式）无梯度模式推理模式评估模式（`nn.Module.eval()`）自动求导中的原地操作原地操作的正确性检查多线程自动求导CPU上的并发不确定性计算图保留自动求导节点的线程安全性C++钩子函数不存在线程安全
Pytorch深度学习教程_9_nn模块构建神经网络 tRNA做科研深度学习保姆教程深度学习 pytorch 神经网络
欢迎来到《深度学习保姆教程》系列的第九篇！在前面的几篇中，我们已经介绍了Python、numpy及pytorch的基本使用，进行了梯度及神经网络的实践并学习了激活函数和激活函数，在上一个教程中我们学习了优化算法。今天，我们将开始使用pytorch构建我们自己的神经网络。欢迎订阅专栏进行系统学习：深度学习保姆教程_tRNA做科研的博客-CSDN博客目录1.理解nn模块：(1)使用nn.Sequent
【机器学习】算法分类 CH3_CH2_CHO 什么？！是机器学习！！机器学习算法有监督学习无监督学习半监督学习强化学习
1、有监督学习1.1定义使用带标签的数据训练模型。有监督学习是机器学习中最常见的一种类型，它利用已知的输入特征和对应的输出标签来训练模型，使模型能够学习到特征与标签之间的映射关系。在训练过程中，模型会不断地调整自身的参数，以最小化预测值与真实标签之间的误差，从而提高预测的准确性。1.2回归问题1.2.1目标预测连续值。回归问题的目标是预测一个连续的数值结果，模型的输出是一个实数值。1.2.2解释回
Radiance Fields from VGGSfM和Mast3r:两种先进3D重建方法的比较与分析 2401_87458718 3d
VGGSfM和Mast3r:3D场景重建的新方向在计算机视觉和3D重建领域,如何从2D图像重建3D场景一直是一个充满挑战的研究课题。近年来,随着深度学习技术的发展,一些新的方法被提出并取得了显著的进展。本文将重点介绍两种最新的基于深度学习的3D重建方法:VGGSfM和Mast3r,并通过GaussianSplatting技术对它们的性能进行全面比较和分析。VGGSfM:基于视觉几何的深度结构运动恢
基于 PyTorch 的 MNIST 手写数字分类模型欣然～ pytorch 分类人工智能
一、概述本代码使用PyTorch框架构建了一个简单的神经网络模型，用于解决MNIST手写数字分类任务。代码主要包括数据的加载与预处理、神经网络模型的构建、损失函数和优化器的定义、模型的训练、评估以及最终模型的保存等步骤。二、依赖库torch：PyTorch深度学习框架的核心库，提供了张量操作、自动求导等功能。torch.nn：PyTorch的神经网络模块，包含了各种神经网络层、损失函数等。torc
使用 Baseten 部署和运行机器学习模型的指南 shuoac 机器学习人工智能 python
随着机器学习模型在各个行业中的广泛应用，如何高效地部署和运行这些模型成为一个关键问题。本文将介绍如何使用Baseten平台来部署和服务机器学习模型。Baseten是LangChain生态系统中的一个重要提供者，它提供了所需的基础设施来高效地运行模型。无论是开源模型如Llama2和Mistral，还是专有或经过微调的模型，Baseten都能在专用GPU上运行。技术背景介绍Baseten提供了一种不同
高效快速教你DeepSeek如何进行本地部署并且可视化对话大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
科技文章：高效快速教你DeepSeek如何进行本地部署并且可视化对话摘要：随着自然语言处理（NLP）技术的进步，DeepSeek作为一款基于深度学习的语义搜索技术，广泛应用于文本理解、对话系统及信息检索等多个领域。本文将探讨如何高效快速地在本地部署DeepSeek，并结合可视化工具实现对话过程的监控与分析。通过详尽的步骤、案例分析与代码示例，帮助开发者更好地理解和应用DeepSeek技术。同时，本
机器学习——分类、回归、聚类、LASSO回归、Ridge回归（自用）代码的建筑师模型学习模型训练机器学习机器学习分类回归正则化项 LASSO Ridge 朴素
纠正自己的误区：机器学习是一个大范围，并不是一个小的方向，比如：线性回归预测、卷积神经网络和强化学都是机器学习算法在不同场景的应用。机器学习最为关键的是要有数据，也就是数据集名词解释：数据集中的一行叫一条样本或者实例，列名称为特征或者属性。样本的数量称为数据量，特征的数量称为特征维度机器学习常用库：Numpy和sklearn朴素的意思是特征的各条件都是相互独立的机器学习（模型、策略、算法）损失函数
量化交易系统中如何处理机器学习模型的训练和部署？ openwin_top 量化交易系统开发机器学习人工智能量化交易
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位量化交易系统中，机器学习模型的训练和部署需要遵循一套严密的流程，以确保模型的可靠性、性能和安全性。以下是详细描述以及相关的示例：1.数据收集和预处理数据收集在量化交易中，数据是最重要的资产。收集的数
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set 开心星人论文阅读论文阅读
将神经网络表征为加权的无环图，直接根据模型的权重矩阵构造PD。计算相邻batch的权重矩阵PD之间的距离。比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。通常，这种误差度量或任务相关的指标是通过一个验证集（holdoutset）来计算的。因为这些数据没有直接用于更新模型参数，通常假设模型在验证集上的
【论文阅读】实时全能分割模型万里守约论文阅读论文阅读图像分割图像处理计算机视觉
文章目录导言1、论文简介2、论文主要方法3、论文针对的问题4、论文创新点总结导言在最近的计算机视觉领域，针对实时多任务分割的需求日益增长，特别是在交互式分割、全景分割和视频实例分割等多种应用场景中。为了解决这些挑战，本文介绍了一种新方法——RMP-SAM（Real-TimeMulti-PurposeSegmentAnything），旨在实现实时的多功能分割。RMP-SAM结合了动态卷积与高效的模型
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
【论文阅读】Availability Attacks Create Shortcuts 开心星人论文阅读论文阅读
还得重复读这一篇论文，有些地方理解不够透彻可用性攻击通过在训练数据中添加难以察觉的扰动，使数据无法被机器学习算法利用，从而防止数据被未经授权地使用。例如，一家私人公司未经用户同意就收集了超过30亿张人脸图像，用于构建商业人脸识别模型。为解决这些担忧，许多数据投毒攻击被提出，以防止数据被未经授权的深度模型学习。它们通过在训练数据中添加难以察觉的扰动，使模型无法从数据中学习太多信息，从而导致模型在未见
深度学习 | pytorch + torchvision + python 版本对应及环境安装 zfgfdgbhs 深度学习 python pytorch
目录一、版本对应二、安装命令（pip）1.版本（1）v2.5.1~v2.0.0（2）v1.13.1~v1.11.0（3）v1.10.1~v1.7.02.安装全过程（1）选择版本（2）安装结果参考文章一、版本对应下表来自pytorch的github官方文档：pytorch/vision:Datasets,TransformsandModelsspecifictoComputerVisionpytor
机器学习 Day01人工智能概述山北雨夜漫步机器学习人工智能
1.什么样的程序适合在gpu上运行计算密集型的程序：此类程序主要运算集中在寄存器，寄存器读写速度快，而GPU拥有强大的计算能力，能高效处理大量的寄存器运算，因此适合在GPU上运行。像科学计算中的数值模拟、密码破解等场景的程序，都属于计算密集型，在GPU上运行可大幅提升运算速度。易于并行的程序：GPU采用SIMD架构，有众多核心，同一时间每个核心适合做相同的事。易于并行的程序能充分利用GPU这一特性
机器学习：让计算机学会思考的艺术平凡而伟大. 机器学习机器学习人工智能
目录什么是机器学习？机器学习的基本步骤常见的机器学习算法机器学习的实际应用如何入门机器学习？结语在当今数字化时代，机器学习（MachineLearning,ML）已经成为一个炙手可热的话题。从推荐系统到自动驾驶汽车，再到语音助手，机器学习的应用无处不在。然而，对于许多人来说，机器学习仍然是一个神秘而复杂的领域。本文将用通俗易懂的语言，带你走进机器学习的世界，了解它的基本原理和应用。什么是机器学习？
机器学习中的 K-均值聚类算法及其优缺点平凡而伟大. 机器学习机器学习算法均值算法
K-均值聚类是一种常用的无监督学习算法，用于将数据集中的样本分成K个簇。其基本原理是将所有样本点划分到K个簇使得簇内样本点之间的距离尽可能接近，而不同簇之间的距离尽可能远。算法流程如下：随机选择K个样本点作为初始的聚类中心。将每个样本点分配到与其最近的聚类中心所在的簇。更新每个簇的聚类中心为该簇所有样本点的平均值。重复第2步和第3步，直到聚类中心不再变化或者达到最大迭代次数。优点：简单且易于实现。
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
机器学习knnlearn1 XW-ABAP 机器学习机器学习人工智能
importmatplotlib.pyplotaspltimportnumpyasnpimportoperator#定义一个函数用于创建数据集defcreateDataSet():#定义特征矩阵，每个元素是一个二维坐标点，代表不同策略数据点的坐标group=np.array([[20,3],[15,5],[18,1],[5,17],[2,15],[3,20]])#定义每个数据点对应的标签，用于区分
基于 MySQL 和 Spring Boot 的在线论坛管理系统设计与实现城南|阿洋-计算机从小白到大神 mysql spring boot 数据库
markdownCopy✌全网粉丝20W+,csdn特邀作者、博客专家、CSDN[新星计划]导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、pyhton、机器学习技术领域和毕业项目实战✌哈喽兄弟们，好久不见哦～最近整理了一下之前写过的一些小项目/毕业设计。发现还是有很多存货的，想一想既然放在电脑里面也吃灰，那么还不如分享出去，没准还可以帮助到
零基础入门机器学习：用Scikit-learn实现鸢尾花分类藍海琴泉机器学习 scikit-learn 分类
适合人群：机器学习新手|数据分析爱好者|需快速展示案例的学生一、引言：为什么要学这个案例？目的：明确机器学习解决什么问题，建立学习信心。机器学习定义：让计算机从数据中自动学习规律（如分类鸢尾花品种）。为什么选鸢尾花数据集：数据量小、特征明确，适合教学演示。Scikit-learn优势：提供现成算法和工具，无需从头写数学公式。二、环境准备：5分钟快速上手目的：搭建可运行的代码环境，避免卡在工具安装环
机器学习--DBSCAN聚类算法详解 2201_75491841 机器学习算法聚类人工智能
目录引言1.什么是DBSCAN聚类？2.DBSCAN聚类算法的原理3.DBSCAN算法的核心概念3.1邻域（Neighborhood）3.2核心点（CorePoint）3.3直接密度可达（DirectlyDensity-Reachable）3.4密度可达（Density-Reachable）3.5密度相连（Density-Connected）4.DBSCAN算法的步骤5.DBSCAN算法的优缺点5
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S

【今日CV 计算机视觉论文速览 第111期】Fri, 3 May 2019

Interesting:

Daily Computer Vision Papers

你可能感兴趣的:(目标检测,视觉,深度学习,机器学习,计算机视觉,Papers)

【今日CV 计算机视觉论文速览第111期】Fri, 3 May 2019