而与你及

【论文阅读】Learning to Paint with Model-based Deep Reinforcement Learning

Learning to Paint with Model-based Deep Reinforcement Learning

Abstract
Introduction
Related work
Painting Agent

Overview
The Model
Learning

Model-based DDPG

原始的DDPG
基于模型的DDPG

Action Bundle
WGAN Reward
Network Architectures

Stroked-based Renderer

Neural Renderer
Stroke Design

Training
Ablation Studies（对比实验的结果）

Model-based vs. Model-free DDPG
Rewards
Stroke Number and Action Bundle

Conclusion
论文地址

Abstract

通过结合神经渲染器和基于模型的深度强化学习（DRL），教机器像人类画家一样画画。agent可以产生笔画的坐标点、半径、透明度、颜色值等。

Introduction

本文定义了人工智能绘画，agent可以按顺序在画布上绘制笔画，以生成类似于给定目标图像的绘画。

agent绘制纹理丰富的图像存在三个挑战：

首先，要像人一样绘画，需要agent具有将给定目标图像在空间上分解为笔画，然后以正确顺序将它们画在画布上的能力。agent需要可视地解析目标图像，了解画布的当前状态，并制定有关未来笔画的预见计划。为了解决此问题，一种常见的方法是在每个步骤中为笔画分解提供有监督的损失。这种方法在计算上是消耗非常大的。同样，纹理丰富的图像绘画通常需要数百次笔画才能生成与目标图像相似的绘画，这比涂鸦，素描或字符书写要高数十倍。为了处理这样的长期计划任务，强化学习（RL）是一个不错的选择，因为RL的目的是使整个绘画过程的累积奖励最大化，而不是使每个步骤的监督损失最小化。这使agent具有远见卓识，计划笔画分解和大量步骤的绘画。此外，本文采用对抗训练策略来训练绘画agent。该策略已成功用于像素级图像生成任务，并且还可以帮助agent进行绘制；
第二，细微的笔画参数空间（包括笔画位置和颜色）对于绘画至关重要。先前的工作将笔画参数空间设计为离散的，并且每个参数只有有限的选择数量，这不再适用于纹理丰富的绘画。由于大多数RL算法处理细粒度参数空间的能力较弱（例如深度Q网络（DQN）和策略梯度（PG）），因此在连续空间上定义笔画参数提出了巨大挑战。相反，深度确定性策略梯度（DDPG）设计用于处理连续的动作空间，使用DDPG训练的agent已经显示出微妙的控制性能。本文在方法中采用DDPG，以使agent具有绘画能力；
第三，高效的绘画模拟器对于agent的性能至关重要，尤其是在画布上绘画数百个笔划的情况下。大多数工作通过与模拟的绘画环境进行交互来绘画。这种方法既费时又不灵活。取而代之的是，本文使用神经网络（NN）训练端到端渲染器，该渲染器将笔画参数直接映射到笔画。渲染器可以实现各种笔画设计。而且，渲染器是可以与DDPG巧妙地组合在一起的差分模型，是一种基于模型的DRL算法，极大地提高了原始DDPG的性能。

强化学习（RL）旨在最大化整个绘画过程的累积回报，而不是最小化每一步的监督损失，这使得agent有先见之明计划笔画分解和大规模步骤绘画。此外，本文采取对抗训练策略来训练绘画agent。这种策略成功地用于像素级图像生成任务，也有助于agent绘制。
使用神经网络（NN）来训练端到端渲染器，该渲染器直接将笔画参数映射到笔画。渲染器可以实现各种笔画设计。此外，渲染器是差分，可以与DDPG巧妙地结合作为一种基于模型的DRL算法，这极大地提高了原始DDPG的性能。

总而言之，本文的贡献如下：

本文使用基于模型的DRL算法解决绘画任务，允许agent按顺序将目标图像分解为数百个笔触，以生成类似于目标图像的绘画；
神经渲染器用于高效绘画，并且还与各种笔划设计兼容。此外，神经渲染器有助于本文提出的基于模型的DDPG；
本文所提出的绘画agent可以很好地处理多种类型的目标图像，包括数字，门牌号，肖像和自然场景图像。

Related work

基于笔画的渲染（SBR）是一种通过放置离散元素（例如笔画或点画）来创建非真实感图像的自动方法，这与本文提出的任务类似。大多数基于笔划的渲染算法会贪婪地专注于每个步骤或需要用户交互。

与本文的agent类似，SPIRAL是经过对抗训练的RL agent，能重建图像的高级结构。StrokeNet结合了可区分的渲染器和递归神经网络（RNN）来训练agent进行绘画，但是无法在彩色图像上进行泛化。这些方法不足以处理这项复杂的任务，并且需要大量的计算资源。Doodle-SDQ训练agent以DQN模拟人类涂鸦。先前，Sketch-RNN使用顺序数据集在草图中获得良好的结果。Artist Agent探索使用RL自动生成单个笔画。

这些算法是无模型的，这意味着agent仅需要根据来自环境的样本来最大化期望的回报。对于某些任务，agent可以通过做出预测来更好地了解环境。另一种有效的方法是建立一个生成神经网络模型。 Gu等人探索使用基于模型的方法来加速DQN。

Painting Agent

Overview

绘画agent的目标是首先用笔画表示分解给定的目标图像，然后在画布上绘制笔画以形成绘画。为了模仿人类的绘画过程，agent被设计成基于观察画布的当前状态和目标图像来预测下一个笔画。更重要的是，为了使agent获得一次预测一个合适的笔画的能力，即笔画与先前的笔画和未来的笔画很好地兼容，它需要精心设计反馈机制。本文假设反馈应该是完成一笔绘画后获得的奖励，并且agent在完成所有笔画之后追求最大化累积奖励。本文给出了图2中整体架构的图表。

（a）在每一步，the policy (aka actor)都会根据画布和目标图像给出一组笔画参数。渲染器跟据这一组笔画参数在画布上渲染笔画。（b）在学习期间，the evaluator (aka critic)根据目标图像和渲染的画布评估动作。在本文的实现中，policy，evaluator和渲染器都是使用神经网络实现。

The Model

State and Transition Function：状态空间由agent可以观察到的环境中的所有可能的信息构成。我们将状态定义为三个部分：画布，目标图像和步骤编号。

转移函数 $s_{t + 1} = trans（st; at）$ 给出状态之间的转移过程，该过程通过在当前画布上绘制笔画来实现。
Action：动作空间是agent可以执行的一组操作。一个动作 $a_{t}$ 是一组参数，用于控制在步骤 $t$ 绘制的笔画的位置，形状，颜色和透明度。We define the behavior of an agent as a policy function $Π$ that maps states to deterministic actions

agent观察状态 $s_{t}$ 然后给出下一个笔画的笔画参数 $a_{t}$ 。The state evolutes based on the transition function
Reward：奖励功能用于评估policy做出的动作。选择合适的度量来测量画布和目标图像之间的差异对于训练绘画agent至关重要。奖励的设计如下：

为了确保最终画布类似于目标图像，应该最大化上述累积奖励，因为要保证损失越来越小。即最大化累计奖励Reward：

Learning

在本节中，将介绍如何使用精心设计的基于模型的DDPG训练agent。

在原始的DDPG中，Critic需要学习隐式建模环境。在基于模型的DDPG中，通过神经渲染器对环境进行了显式建模，这有助于训练高效的代理。

Model-based DDPG

本文首先描述原始的DDPG，然后引入基于模型的DDPG来有效地训练agent。按照定义，绘画任务中的动作空间是连续的，具有高维度。将动作空间离散化以适应某些DRL方法（例如DQN和PG），将失去笔画表示的精度，并且需要手动结构设计中的大量工作来应对离散空间中参数组合的爆炸式增长。DPG被提出使用确定性策略来解决由高维连续动作空间引起的困难。此外，提出了将DPG与NN相结合的DDPG，以增强其在许多控制任务中的性能。

原始的DDPG

在原始DDPG中，有两个网络：the actor $Π (s)$ and critic $Q (s; a)$ 。

我们无法使用原始DDPG来训练一名表现出色的绘画agent，因为该agent很难在学习过程中很好地建模由任何类型的真实世界图像组成的复杂环境。（为什么不能？因为实验结果不好吗？文章中这里解释得不是很清楚）

基于模型的DDPG

本文将DDPG与可以基于环境访问渐变的actor称为基于模型的DDPG。使用基于模型的DDPG进行agent的优化与使用原始DDPG进行的优化不同。

Critic仍然预测该状态的预期奖励，但不再包括当前动作引起的奖励。

Action Bundle

跳帧是许多RL任务的强大参数。该agent只能观察环境，并且每k帧执行一次操作，而不是一帧。该技巧使agent具有更好的能力来学习在时间上更远的状态和动作之间的关联。受此技巧的启发，我们使actor每一步输出了k个笔画的参数。渲染器将同时渲染k个笔画，以大大加快绘画过程。实验发现每次增加五个笔画效果最好。值得注意的是，为了保持一致性，我们将奖励折扣系数从 $γ$ 修改为 $γ^k$ 。

WGAN Reward

GAN已被广泛用作迁移学习，文本模型和图像恢复中的特定损失函数，因为它具有测量生成数据和目标数据之间分布距离的强大能力。Wasserstein 生成对抗损失函数 (WGAN Loss)。我们需要度量画布和目标图的相似度以给出奖励函数，我们发现 WGAN Loss 是一种比欧几里得距离更好的度量，使得最后画出来的图细节更丰富。

Network Architectures

由于现实世界图像的高度可变性和高度复杂性，我们使用类似于ResNet-18的残差结构作为actor和critic中的特征提取器。actor与批处理归一化（BN）配合良好，但BN不能显着加快critic训练的速度。本文对critic使用WN和Translated ReLU（TReLU）来稳定训练。另外，本文使用CoordConv作为actor和critic的第一层。对于判别器，本文使用与PatchGAN类似的网络结构。本文在判别器中也使用了WN和Translated ReLU（TReLU）。在原始DDPG论文之后，本文使用了软目标网络，这意味着为actor和critic创建一个副本，并通过让他们缓慢地跟踪学习的网络来更新其参数。即分online network和target network。下图是网络结构图：

Stroked-based Renderer

Neural Renderer

使用神经网络生成笔画有两个优点：

首先，神经渲染器可以灵活地生成任何类型的笔画，并且比手工制作笔画模拟器更有效。
其次，神经渲染器是可微分的，可以很好地为原始DDPG建模环境，从而提高agent的性能。

具体地，向神经渲染器馈送一组笔画参数，然后输出渲染的笔画图像S。使用图形渲染器程序随机生成训练样本。神经渲染器可以通过监督学习快速训练并在GPU上运行。因此，本文获得了一个可区分且快速运行的环境。一些简单的几何渲染可以在没有神经网络的情况下完成，也可以给出渐变。但神经网络可以帮助本文省略繁琐的公式计算。神经渲染器网络由几个完全连接的层和卷积层组成。采用Sub-pixel来增加网络中笔画的分辨率。

Stroke Design

Training

Ablation Studies（对比实验的结果）

在本节中，主要研究组件或技巧（包括基于模型的DDPG，Action Bundle和WGAN奖励）如何影响agent的性能。为简单起见，本部分仅在CelebA上进行实验。

Model-based vs. Model-free DDPG

本文探索了与原始DDPG相比，基于模型的DDPG有多少优势。众所周知，原始的DDPG只能以隐式方式对环境进行建模，并具有对环境的观察和回报。此外，高维动作空间还限制了无模型方法在绘画任务中使用。为了进一步探索无模型方法的功能，我们采用了受PatchGAN启发的方法来改进原始DDPG。本文先将图像分成小块，然后再将这些小块放入critic中，然后使用小块级别的奖励来优化critic。本文将此方法称为PatchQ。通过在训练中提供更多的监督信号，PatchQ可以提高采样效率并提高agent的性能。

本文在图7（a）中显示了使用不同算法训练的agent的性能。基于模型的DDPG优于原始DDPG和带有PatchQ的DDPG。尽管与基于模型的DDPG相比性能不佳，但具有PatchQ的DDPG却在性能上大大优于原始DDPG。

Rewards

Stroke Number and Action Bundle

绘画的笔画数对于最终的绘画效果至关重要，特别是对于纹理丰富的图像而言。本文训练可以绘制100、200、400和1000笔画的agent，损失曲线如图7（c）所示。据观察，更大的笔画数有助于更好的绘画效果。因为更多的笔画有助于重建画中的细节。

Action Bundle是加快绘画过程的技巧。除此之外，我们还将探讨Action Bundle如何影响agent的性能。本文在图7（b）中显示了Action Bundle的几种设置的损耗曲线。根据损失曲线，每次增加5个笔画的可以获得最佳的效果。

Conclusion

论文地址

Learning to Paint with Model-based Deep Reinforcement Learning

OpenCV（一个C++人工智能领域重要开源基础库）简介愚梦者 OpenCV 人工智能人工智能 opencv c++图像处理计算机视觉开源
返回：OpenCV系列文章目录（持续更新中......）上一篇：OpenCV4.9.0配置选项参考下一篇：OpenCV4.9.0开源计算机视觉库安装概述引言：OpenCV（全称OpenSourceComputerVisionLibrary）是一个基于开放源代码发行的跨平台计算机视觉库，可以用来进行图像处理、计算机视觉和机器学习等领域的开发。该库由英特尔公司于1999年开始开发，最初是为了加速处理器
神经网络（深度学习，计算机视觉，得分函数，损失函数，前向传播，反向传播，激活函数） MarkHD 深度学习神经网络计算机视觉
神经网络，特别是深度学习，在计算机视觉等领域有着广泛的应用。以下是关于你提到的几个关键概念的详细解释：神经网络：神经网络是一种模拟人脑神经元结构的计算模型，用于处理复杂的数据和模式识别任务。它由多个神经元（或称为节点）组成，这些神经元通过权重和偏置进行连接，并可以学习调整这些参数以优化性能。深度学习：深度学习是神经网络的一个子领域，主要关注于构建和训练深度神经网络（即具有多个隐藏层的神经网络）。通
什么是特征检测和描述，OpenCV中常见的特征检测算法有哪些？ -Max-静- #opencv学习 opencv 算法人工智能
特征检测和描述是计算机视觉中的基本概念，它们在图像识别、对象跟踪、图像拼接等多种任务中发挥着至关重要的作用。特征检测是指识别图像中重要的特定点、区域或结构，这些特征通常具有独特性、可重复性以及对光照变化、旋转和比例变换等变化的鲁棒性。这些特征点可以用作进一步分析的参考。特征描述是基于一定的几何或者颜色信息生成特征点的特征描述符，这种描述应满足欧式空间的仿射不变性和噪声鲁棒性，并且不同特征点的特征描
opendronemap集群搭建 Robber2000 云计算容器运维云原生
需求OpenDroneMap（ODM）是一个开源项目，旨在利用无人机采集的图像数据生成地图、模型和其他地理空间数据。它主要解决以下问题：航空摄影数据处理：ODM可以处理无人机拍摄的大量航空图像数据，通过图像处理和计算机视觉技术生成高质量的地图和模型。地图制作与更新：利用ODM，用户可以快速、成本效益地生成地图，并及时更新地理空间数据，有助于城市规划、灾害监测等领域的应用。三维建模：ODM可以生成精
Canny详解 kxg916361108 计算机视觉图像处理人工智能
Canny边缘检测是一种经典的图像处理技术，被广泛应用于计算机视觉和图像处理领域。它由JohnF.Canny在1986年提出，是一种多阶段的边缘检测算法，具有高精度和低错误率的特点。Canny边缘检测的步骤：高斯滤波（GaussianBlur）：Canny边缘检测首先对图像进行高斯平滑处理，以减少图像中的噪声。高斯滤波器将图像中的每个像素与周围像素进行加权平均，从而模糊图像并减少噪声。计算图像梯度
MATLAB图像拼接算法及实现程序员小溪算法 matlab 计算机视觉 MATLAB 人工智能
图像拼接算法及实现（一）论文关键词：图像拼接图像配准图像融合全景图论文摘要：图像拼接(imagemosaic)技术是将一组相互间重叠部分的图像序列进行空间匹配对准,经重采样合成后形成一幅包含各图像序列信息的宽视角场景的、完整的、高清晰的新图像的技术。图像拼接在摄影测量学、计算机视觉、遥感图像处理、医学图像分析、计算机图形学等领域有着广泛的应用价值。一般来说,图像拼接的过程由图像获取,图像配准,图像
AI图像识别算法助力安全生产*提升风险监测效率---豌豆云豌豆云人工智能安全
2024年开年来安全生产事故频发，工厂爆炸、工程坍陷等重大安全生产事故的发生再次为我们敲响了警钟。安全生产是企业发展的生命线，而传统的安全监测手段存在盲区和延迟，难以及时发现和应对潜在风险。AI图像识别算法通过利用先进的计算机视觉和深度学习技术，能够有效提高风险监测效率，保障企业的安全生产。AI图像识别算法助力安全生产AI图像识别算法通常部署在本地服务器或边缘服务器，通过分析前端监控摄像头、无人机
深入了解OpenCVSharp中常见的图像处理功能仰望大佬007 图像处理 opencv 计算机视觉 c#
深入了解OpenCVSharp中常见的图像处理功能前言1.图像加载与保存2.图像基本操作3.图像滤波4.边缘检测5.图像分割6.特征检测与描述子7.目标识别与跟踪8.图像融合与拼接9.形状匹配与模板匹配10.颜色空间转换与直方图11.图像转换与绘制12.图像分类与机器学习13.高级图像处理算法14.GPU加速与并行计算前言OpenCVSharp是C#语言中用于图像处理和计算机视觉的开源库，它提供了
【计算机视觉面经四】基于深度学习的目标检测算法面试必备（RCNN~YOLOv5）旅途中的宽~ 计算机视觉面经总结计算机视觉深度学习目标检测 YOLO RCNN
文章目录一、前言二、两阶段目标检测算法2.1RCNN2.2Fast-RCNN2.3FasterR-CNN三、多阶段目标检测算法3.1CascadeR-CNN四、单阶段目标检测算法4.1编码方式4.1.1基于中心坐标4.1.1.1方案14.1.1.2方案24.1.1.3方案34.2YOLOv14.3SSD4.4YOLOv24.5RetinaNet4.6YOLOv34.7YOLOv44.8YOLOv5
OpenCV：开源计算机视觉的魔力之门 mikes zhang 计算机视觉
在当今这个信息爆炸的时代，图像和视频已经成为我们获取和传递信息的主要方式之一。从社交媒体上的照片分享，到安防监控、自动驾驶等领域的图像识别与处理，计算机视觉技术正日益改变着我们的生活。而在这场技术革命中，OpenCV（OpenSourceComputerVisionLibrary）这一开源计算机视觉库扮演着举足轻重的角色。本文将带你走进OpenCV的世界，一探其究竟。一、OpenCV简介OpenC
情感计算 - 情感模型无脑敲代码，bug漫天飞情感计算人工智能
1基本情感论模型--离散状态1Tomkins面部表情惩罚或奖励的反馈结果八类：基本情感2Izard具有动机的特征10中基本情感状态（言语内容表情等）神经系统电化学自主，遗传决定情感面部姿势活动情感活动输出决定脑区的反馈信息情感活动输出产生3Ekman美国心理学家早期的情感模型都是他提出的面部表情中应用广泛1972年六类情感状态90年代扩充更多的维度对于计算机视觉研究起到了推动作用泛文化意义历史进化
深度学习的进展 CuiXg 深度学习人工智能
深度学习的进展深度学习作为人工智能领域的重要分支之一，利用神经网络模拟人类大脑的学习过程，通过数据训练模型以自动提取特征、识别模式、进行分类和预测等任务。近年来，深度学习在多个领域取得显著进展，尤其在自然语言处理、计算机视觉、语音识别和机器翻译等方面实现了突破性进展。方向一：深度学习的基本原理和算法深度学习基于神经网络概念，涉及反向传播、卷积神经网络、循环神经网络等算法。这些算法模拟人脑神经元间的
05基于卷积神经网络-支持向量机（自动寻优）CNN-SVM数据分类算法机器不会学习CSJ cnn 支持向量机分类人工智能
CNN原理卷积神经网络（ConvolutionalNeuralNetwork，CNN）是一种深度学习模型，广泛用于计算机视觉领域。CNN的核心思想是通过卷积层和池化层来自动提取图像中的特征，从而实现对图像的高效处理和识别。在传统的机器学习方法中，图像特征的提取通常需要手工设计的特征提取器，如SIFT、HOG等。而CNN则可以自动从数据中学习到特征表示。这是因为CNN模型的卷积层使用了一系列的卷积核
【机器学习案例7】计算机视觉中的小物体检测：基于补丁的方法 suoge223 机器学习实用指南机器学习计算机视觉人工智能
专栏导读作者简介：工学博士，高级工程师，专注于工业软件算法研究本文已收录于专栏：《机器学习实用指南》本专栏旨在提供1.机器学习经典案例及源码；2.开源机器学习训练数据集；3.机器学习前沿专业博文。以案例的形式从实用的角度出发，快速上手机器学习项目，在案例中成长，摆脱按部就班填鸭式教学。欢迎订阅专栏，订阅用户可私聊进入机器学习交流群（知识交流、问题解答），并获赠丰厚的机器学习相关学习资料（教材、源码
图像预处理技术与算法木子n1 算法嵌入式开发算法数码相机计算机视觉
图像预处理是计算机视觉和图像处理中非常关键的第一步，其目的是为了提高后续算法对原始图像的识别、分析和理解能力。以下是一些主要的图像预处理技术：1.图像增强：对比度调整：通过直方图均衡化（HistogramEqualization）等方法改善图像整体或局部的对比度。伽玛校正：改变图像的亮度特性，用于补偿显示器或其他硬件设备的非线性响应。锐化处理：如使用高通滤波器（如拉普拉斯算子、Sobel边缘检测算
Vis-TOP：视觉Transformer叠加处理器离欢论文 Transformer 人工智能机器学习 transformer 深度学习计算机视觉
摘要近年来，Transformer[23]在自然语言处理(NLP)领域取得了良好的效果，并开始向计算机视觉(CV)领域拓展。优秀的型号如VisionTransformer[5]和SwinTransformer[17]已经出现。同时，Transformer模型平台扩展到嵌入式设备，以满足一些对资源敏感的应用场景。但是，由于Transformer模型参数多、计算流程复杂、结构变体繁多，在硬件设计中存在
【Transformer养猪】Livestock Monitoring with Transformer 离欢 Transformer 论文笔记 python 人工智能
对牲畜行为的跟踪有助于在现代动物饲养场及早发现并预防传染病。除了经济收益，这将减少畜牧业中使用的抗生素数量，否则这些抗生素将进入人类的饮食，加剧抗生素耐药性的流行，这是导致死亡的主要原因。我们可以使用大多数现代农场都有的标准摄像机来监控牲畜。然而，大多数计算机视觉算法在这项任务中表现不佳，主要原因是:(i)农场饲养的动物看起来相同，缺乏任何明显的空间特征，(ii)现有的跟踪器都不能长时间保持健壮，
【EI会议征稿通知】2024年第四届计算机视觉与模式分析国际学术大会（ICCPA 2024）搞科研的小刘选手学术会议人工智能自动化能源大数据云计算
2024年第四届计算机视觉与模式分析国际学术大会（ICCPA2024）20244thInternationalConferenceonComputerVisionandPatternAnalysis(ICCPA2024)第四届计算机视觉与模式分析国际会议（ICCPA2024）将于2024年5月17日至19日在中国鞍山召开。ICCPA2024汇集了来自世界各地的计算机视觉与模式分析领域的学者、研究人
计算机视觉学习指南（划分为20个大类） superdont 计算机视觉入门计算机视觉人工智能开发语言 python opencv
计算机视觉的知识领域广泛而庞杂，涵盖了众多重要的方向和技术。为了更好地组织这些知识，我们需要遵循无交叉无重复（MutuallyExclusiveCollectivelyExhaustive，MECE）的原则，并采用循序渐进的方式进行分类和划分。按照无交叉无重复的原则，我们将计算机视觉划分为20个重要的方向，每个方向都具有明确的定义和特定的应用领域。通过这种划分方式，可以确保每个方向都在整个计算机视
计算机视觉与图像处理面试题,深度学习图像处理算法工程师面试题 ZW9 计算机视觉与图像处理面试题
AI开发平台ModelArtsModelArts是面向开发者的一站式AI开发平台，为机器学习与深度学习提供海量数据预处理及半自动化标注、大规模分布式Training、自动化模型生成，及端-边-云模型按需部署能力，帮助用户快速创建和部署模型，管理全周期AI工作流。按需/包周期付费可选，最低0.00元/小时引入MoXingFramework模块||https://support.huaweicloud
互联网加竞赛基于计算机视觉的身份证识别系统 Mr.D学长 python java
0前言优质竞赛项目系列，今天要分享的是基于机器视觉的身份证识别系统该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1实现方法1.1原理1.1.1字符定位在Android移动端摄像头拍摄的图片是彩色图像，上传到服务器后为了读取到身份证上的主要信息，就要去除其他无关的元素，因此对身份证图
【Python】图像裁剪与匹配林九生 Python python opencv 开发语言
图像裁剪与匹配在计算机视觉领域，图像处理是一项关键的任务，其中图像裁剪和匹配是常见的操作之一。本文将介绍如何使用OpenCV库进行图像裁剪与匹配，并展示一个简单的示例代码。1.引言在图像处理中，有时需要从一张大图中截取特定区域，并在另一张图中寻找相似的部分。这可以通过裁剪和匹配操作来实现。本文将演示如何使用Python和OpenCV库进行这些操作。2.代码示例以下是一个使用OpenCV库的简单代码
深度学习——概念引入韶光流年都束之高阁深度学习日记深度学习人工智能职场和发展
深度学习深度学习简介深度学习分类根据网络结构划分：循环神经网络卷积神经网络根据学习方式划分：监督学习无监督学习半监督学习根据应用领域划分：计算机视觉自然语言处理语音识别生物信息学深度学习简介深度学习（DeepLearning，DL）是机器学习领域中的一个新的研究方向，主要是通过学习样本数据的内在规律和表示层次，让机器能够具有类似于人类的分析学习能力。深度学习的最终目标是让机器能够识别和解释各种数据
行人重识别 NineDays66 人工智能
在人的感知系统所获得的信息中，视觉信息大约占到80%～85%。行人重识别（personre-identification）是近几年智能视频分析领域兴起的一项新技术，属于在复杂视频环境下的图像处理和分析范畴，是许多监控和安防应用中的主要任务，并且在计算机视觉领域获得了越来越多的关注。下面我们就仔细来聊聊行人重识别(ReID)。1.什么是行人重识别行人重识别（PersonRe-identificat
用 Python 制作一款炫酷的二维码！ Python数据之道可视化 python 数据可视化 opencv svg
来源：https://blog.csdn.net/jinyj1转自：深度学习算法与计算机视觉1.导入myqr库下载myqr库使用windows+R键，输入cmd调出命令窗口在黑框里输入(在python3环境下，python2不行)pip install myqr等到提示下载成功就可以了导入myqr库因为我是用pycharm的，所以还需要在pycharm中导入myqr打开pycharm的file-s
【保姆级教程|YOLOv8改进】【7】多尺度空洞注意力（MSDA），DilateFormer实现暴力涨点阿_旭 YOLOv8网络结构改进 YOLO YOLOv8改进 MSDA
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
【保姆级教程|YOLOv8改进】【6】快速涨点，SPD-Conv助力低分辨率与小目标检测阿_旭 YOLOv8网络结构改进 YOLO 目标检测人工智能 YOLOv8改进
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
基于YOLOv8与ByteTrack的车辆行人多目标检测与追踪系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标追踪、运动物体追踪阿_旭深度学习实战 AI应用软件开发实战计算机视觉 python 行人车辆追踪目标追踪 YOLOv8 深度学习
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
【保姆级教程|YOLOv8改进】【5】精度与速度双提升，使用FasterNet替换主干网络阿_旭 YOLOv8网络结构改进 YOLO YOLOv8改进 FasterNet 深度学习
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
基于YOLOv8深度学习的100种中草药智能识别系统【python源码+Pyqt5界面+数据集+训练代码】目标检测、深度学习实战阿_旭深度学习实战 AI应用软件开发实战计算机视觉深度学习 python YOLOv8 中草药识别深度学习实战
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs

【论文阅读】Learning to Paint with Model-based Deep Reinforcement Learning

Learning to Paint with Model-based Deep Reinforcement Learning

Abstract

Introduction

Related work

Painting Agent

Overview

The Model

Learning

Model-based DDPG

原始的DDPG

基于模型的DDPG

Action Bundle

WGAN Reward

Network Architectures

Stroked-based Renderer

Neural Renderer

Stroke Design

Training

Ablation Studies（对比实验的结果）

Model-based vs. Model-free DDPG

Rewards

Stroke Number and Action Bundle

Conclusion

论文地址

你可能感兴趣的:(计算机视觉)