黄小米吖

论文阅读——U^2-Net:Going deeper with nested U-structure for salient object detection

U^2-Net:Going deeper with nested U-structure for salient object detection

Abstract

本文提出一种简洁高效的目标显著性检测框架——U2Net。U2Net包含两层嵌套的UNet结构，具有以下优点： 
（1）在本文提出的残差U形模块（RSU)中通过不同尺寸感受野的混合可以有效捕获不同尺度的上下文信息； 
（2）RSU模块中的池化操作在不显著增加计算成本的前提下进一步加深了网络的深度。这种网络架构使得我们可以从头训练深层网络而无需使用一些图像识别任务中的基线模型。

Section I Introduction

目标显著性检测指的是将图像中最显著的物体进行分割，广泛用于视觉追踪和图像分割任务中。随着CNN尤其是FCN在分割任务中大放异彩，目标显著性检测也获得飞速发展。我们不禁要问：我们遗漏了什么？让我们回看一下还存在什么挑战性问题。绝大多出目标检测框架的通用模式是借助已有的一些基准网络框架提取深层特征，如AlexNet,VGG,ResNet，DenseNet等，但是这些网络最初是用于图像分类的，提取的是更具表征能力的语义信息，并不是针对包含更加细节的信息或者具有全局对比性的信息的，而后面两类信息对SOD更为重要。并且他们多半需要在ImageNet上预训练，如果目标任务训练数据有限的话。 
 因此，第一个问题就是：是否可以搭建一个用于SOD的框架允许从头训练无需预训练就达到较好的性能？ 
 而SOD目前的一些网络框架还存在以下问题：首先他们一般都比较复杂，主要是需要在基准网络外添加额外的特征聚合模块；其次深度网络的搭建是以牺牲特征图谱空间分辨率为代价的，特征图谱不断通过下采样被压缩，但是空间分辨率对于分割任务至关重要。 
 因此我们的另一个问题是：能否在获得深层特征的同时保持特征图的分辨率，并且花费较少的内存和计算资源。 
 本文提出一种简洁新颖的网络架构；U2Net，通过两层UNet的嵌套搭建起来用于SOD任务，而且无需预训练支持直接从头训练。并且这一网络可以搭建至较深层次的同时保持较高分辨率，这主要通过嵌套的RSU残差U形网络（RSU）在不降低特征图分辨率的前提下提取多尺度特征。U2Net整体如Fig 5所示，在6大目标检测数据集上均取得了SOTA并且满足实时性的需求，还提供了精简版本的U2Net_Light.

Section II Related Works

传统的目标显著性检测多基于人工特征的，如foreground consistenct, heperspectural information,superpixels’ similarity,histograms等，而基于深度学习的SOD框架可以取得更加的检测性能。 
 Part A Multi-level feature integration 
 许多SOD算法通过多级特征聚合提升检测效果，如通过引入dropout和upsampling模块减轻棋盘格效应，还有借助short connections或者提出新的聚合策略，通过多级特征聚合确实大大提升了基于深度学习进行SOD检测的性能。 
 Part B Multi-scale feature extraction 
 因为目标检测需要局部和全局信息的共同参与，早期多常用的的3x3卷积可以有效提取局部信息却难以提取全局信息，而增大卷积核尺寸又会增加参数量和计算负担。因此前人有使用空间金字塔池化、多级refinement策略等来有效提取局部和全局信息，还有引入注意力模块来预测前景物体的空间分布等，也有在损失函数上进行改进的。
 这一方向的探索提出了许多新奇高效的特征提取模块。 但是也能发现几乎上述所有方法都是基于图像分类的一些基线网络进行的改进，通过增加额外的模块或策略等。而本文则是提出一种全新的架构，可以直接提取多级特征用于目标检测。

Section III Proposed method

首先介绍residual U-Block随后介绍整个nested U-NetYi以及网络的监督策略、损失函数。 
 

Part A Residual U-Blocks
  局部和全局信息对目标检测和其他分割任务均至关重要，在常用的CNN网络，如VGG,AlexNet，ResNet,DenseNet中常使用1x1,3x3等小尺寸的卷积核来提取特征，这样大小卷积核对应的感受野只能提取局部信息，如果想要提取更加全局的信息很直观的想法就是扩大感受野范围。如Fig 2(d)展示的Inception module,通过不同膨胀率的空洞卷积有效提取了局部和全局信息；但是在网络浅层就是用多个空洞卷积十分消耗内存和计算资源.
  因有的方法如PoolNet使用了金字塔池化，但还有一个问题是将不同分辨率的特征直接通过上采样后级联往往会导致精度下降。 
  受启发于UNet，本文提出RSU（Residual U-Block）残差连接的U形模块，具体如Fig 2(e)所示，其中L是U形Block中编码的层数（深度），Cin,Cout分别指的是输入输出的通道数，M指的是Block中每一层的通道数。 
  因此RSU包含3大部分： 
  （1）输入卷积层，负责将输入的特征图进行通道变换； 
  （2）U形的编解码模块负责提取多尺度的上下万信息并进行编码，L越大表明RSU越深，对应感受野越大，越能提取到全局信息，因此可以获得任意分辨率的特征图；并且是通过渐进的上采样完成深层特征图谱的编码，比直接上采样造成的损失少； 
  （3）通过残差连接有效的完成了特征的融合。
   残差连接可以表示为： 

RSU与残差模块的区别在于，RSU将单一的卷积替换为了UNet结构，这样每一个残差内部能够提取到多尺度特征，而且由于都是在降采样后的特征图谱上进行操作因此替换为:

UNet后增加的计算量并不显著。在Fig4中的对比中也能看出RSU并没有明显增加计算资源的需求，与Dense block,inception block相比，计算资源均会随内部通道数M指数增长，并且RSU增长的系数更小。
Part B U2Net
 前人的研究中通向将多个U形结构堆叠成一个序列，但会随着堆叠次数使得计算成本大大增加。
  本文则使用新的组合方式-U^n Net，通过嵌套而不是级联的方式来组合UNet,其中指数n可以是任意正数，本文取n=2.
  因此整体结构如Fig5所示，外层UNet中每一层均是一个RSU模块，外层包含6层编码网络、5层解码网络以及中间的特征融合模块。

En_1,2,3,4分别使用7,6,5,4层的RSU，而En5,6此时特征图分辨率以及很小因此采用L=4,并且使用的是空洞卷积，因此在这两层的RSU中的特征图分辨率保持不变。 而解码结构与编码网络是对应的，以及同样将解码网络对应层在上采样前进行了级联； 最后一部分则是显著性图谱融合模块，主要就是产生显著性的概率图谱，本文通过3x3卷积从前面的En_6,De_5,4,3,2,1经过sigmoid激活后获得显著性图谱，随后通过1x1 conv进行融合或者最终的概率图谱。 这样搭建的U^ 2 Net搭建个更深层次网络、能够捕获更多尺度的特征同时没有增加维阿的计算成本，并且可以灵活多变配置成不同规模，本文搭建了两种规模的U ^ 2 Net分别为176.3MB和轻量级的4.7MB的版本。
 Table 1展示了U^2 Net的具体信息。I,M,O分别代表输入通道数、中间通道数和输出通道数。NIV代表原始的UNet，RSU代表本文提出的模块，后面的数字则代表L层。
 

Part C Supervision 
 训练阶段使用与HED类似的监督手段，因此损失函数定义为：
 
包含每一层（Sup1-6）输出的显著性图谱以及最后混合后的显著性图谱Sup0,而每一层的损失函数则计算的是交叉熵损失函数。
 

Section IV Experimental results

Part A Datasets 
Training Dataset:
DUTS-TR 是DUTS数据集的一部分，包含10533张图像，是目前用于显著性目标检测最常用也是规模最大的数据集；本文还使用了水平翻转进行数据增强，因此共21106张训练图像。 
Evaluation datasets：
使用了6个基准数据集，分别是：DUT_OMRON,DUTS-TE,HKU-IS,ECSSD,PASCAL-S,SOD，分别包含5168,5019,4447,1000,850和300张图像。有的数据集十分具有挑战性。 
Part B Evaluation metrics 
显著性目标检测的输出通常与输入的分辨率一致，每一点像素在0-255之间或（0,1）之间，而GT一般是一个2分类图像，如0代表背景1代表前景物体。本文使用的评价指标包括：
 PR
 Curve maximal
 F-measure 
 Mean Absolute Error
  weighted F-measure
   structure measure 
   relaxed boundary F-measure 
   Part C Implementation details
    图像resize到（320x320)并且随机翻转裁剪至（288x288）两项损失函数的权重均设置为1 使用Adam优化器超参数设置为： 

总共训练时间：120hrs 框架 Pytorch0.4.0

Section V Ablation Study

为了验证U^2 Net的有效性开展了一系列消融实验，从以下三方面：基础模块、网络连接方式、神经网络模型进行实验分析。
 Part A Basic Blocks 
 主要就是验证RSU基础模块的有效性，对照有：
 PLN（普通的卷积模块），RSE（残差连接模块），DSE（密集连接模块），INC（Inception类模块）和PPM（金字塔池化模块），详细的结构可以回顾Fig 2(a)-(d)。
 而Table 2则展示了以上结构的性能对比，可以看到改进后的模块均比原始的UNet性能要高，因为他们要不具有更深的层次要不就提取多尺度的特征，但依旧比不过本文提出的U ^ 2 Net以及轻量级版本的U^ Net_L. 
 

Part B Architecture
  前文也提到过前人研究有通过堆叠更多类似的基本结构搭建更具表征能力的网络，如HourglassNet 和CU Net都是具有代表性的网络，因此本文选择他们与本文嵌套（nested）的方式进行对比，通过Table 2的结果也能看出本文U^2 Net采用嵌套方式比采用级联的上述两类网络性能更好，并且速度也更快。
   Part C Backbones
    前人的研究多半基于许多基准网络（如VGG,ResNet）作为编码器，本文无需任何基准网络，因此是backbone free的，但本文还是对比了将本文encoder部分替换为不同的backbone模型，也取得了比前人更为优异的结果，但最好的还是本文的U^2Net,因此本文完全由理由相信这种backbone free的方式具有足够强的表征能力用于SOD任务。

Section VI Comparison with SOTA

Part A Quantitative comparison 
本文选择了20种SOTA框架进行对比。Fig 6展示了在六类数据集上本文与其他模型的性能对比。数据对比结果罗列在Table3,4.

可以看到本文提出的U ^ 2 Net基本上都取得了最佳的性能或者前几的性能，并且值得注意的是轻量级版本的U^2 Net仅有4.7MB是目前最小的用于SOD框架，虽然性能略有下降但是非常适合计算资源和内存资源有限的应用场景。

Part B Qualitative comparison 
Fig 7则可视化了显著性目标检测的结果，（c）(d)是本文的目标检测结果，可以看到本文框架可以handle不同类型的目标，产生更加精确的目标检测结果，可以看到目标尺度从小到大都可以很好的检测，而其他模型有的会遗漏较小目标或者对大型目标检测效果不佳，而本文对一些形状复杂的目标依旧有较为突出的检测结果，主要得益于U^2 Net有效利用了不同尺度特征，并且以较高分辨率提取到了局部和全局信息。因此可以适应不同场景，产生更为精确的目标检测结果。

Section VII Conclusion

本文提出U ^ 2 Net用于显著性目标检测，主要是嵌套的两层Unet结构，借助本文提出的RSU Block使得网络得以捕获网络不同层次更为丰富的局部和全局信息，并且无需其他backbone网络支持从头训练；
本文还设计了两种不同规模的U^2 Net用于适应不同的场景，实验结果显示本文的性能与其他20种SOTA结果具有可比性。 未来本文将会进一步探索不同技术提升网络的速度、精简网络模型，用于移动端或计算及存储资源有限的应用场景。

未来运维，绝绝AI 必备 AI_运维_攻城狮 ai 运维人工智能
在当今数字化时代，运维工作对于企业的稳定运行至关重要。随着科技的不断进步，人工智能（AI）和自动化技术正逐渐改变着运维行业的面貌。本文将分析运维行业的未来发展方向，探讨人工智能在运维中的应用前景、自动化运维的发展趋势，并对未来的运维工作模式和技能需求进行预测和分析，以帮助读者更好地规划自己的职业发展。一、运维行业现状目前，运维工作主要包括服务器管理、网络管理、数据库管理、应用程序监控等方面。运维工
AttnRNN：参数更少，却断档碾压LSTM/GRU的新RNN wq舞s 人工智能 python 深度学习 deep learning ai 科技 pytorch
研究者与发布者为:CSDNwq舞s，知乎wqwsgithubwqws突破性进展！新型注意力RNN（AttnRNN）在长序列任务中全面超越传统RNN模型在深度学习领域，循环神经网络（RNN）及其变体GRU和LSTM长期以来一直是处理序列数据的首选架构。然而，它们在长序列任务中始终存在信息遗忘和梯度消失等问题。今天，我很高兴地宣布一种全新的RNN架构——AttnRNN，它在多个长序列基准测试中全面超越
打造世赛级信息安全实训室：一站式建设方案大揭秘
在当今数字化时代，信息安全已成为全球关注的焦点。随着信息技术的飞速发展，各类网络安全威胁日益复杂多样，对专业信息安全人才的需求也愈发迫切。世界职业院校技能大赛作为全球最高层级的职业技能赛事，其信息安全项目更是汇聚了各国顶尖的技能人才，展示着这一领域最前沿的技术与应用。打造一个达到世赛级别的信息安全实训室，无疑是培养高素质信息安全人才、提升国家网络安全防御能力的关键举措。以下将为您揭秘一站式建设世赛
C语言教学大变革！DeepSeek如何改变高职院校编程课堂？武汉唯众智创 c语言开发语言程序设计 Deepseek
一、引言在当今数字化转型的浪潮中，程序设计与分析能力已成为高职教育中不可或缺的核心竞争力。作为编程语言的基础，C语言不仅训练学生的计算思维，还培养其算法实现能力。然而，当前高职院校的C语言教学面临诸多挑战，如实践环节薄弱、学生创新能力不足等。DeepSeek等新一代智能编码支持系统的出现，为这一现状带来了转机。该系统融合了深度神经网络与语义解析技术，能够智能生成代码、优化缺陷检测、解构程序逻辑，并
Muduo 定时器小白书舍 c++网络
TimeQueue定时器图片转载自:muduo网络库源码解析(4):TimerQueue定时机制_李兆龙的技术博客_51CTO博客添加新的定时器TimerIdTimerQueue::addTimer(TimerCallbackcb,//用户自定义回调Timestampwhen,//定时器的超时时刻doubleinterval)//重复触发间隔,小于0则不重复触发{Timer*timer=newTi
java中对象可达性分析 + 自动回收算法盒子6910 运维专栏算法 java jvm
“对象可达性分析+自动回收算法”是JavaGC（垃圾回收）核心的两个环节，下面详细解释：1.对象可达性分析（ReachabilityAnalysis）目的：判定哪些对象“活着”，哪些对象已经变成“垃圾”可以回收。原理：JVM会用一组叫“GCRoots（垃圾收集根节点）”的基础对象为起点，从这些根出发，沿着对象之间的引用关系去递归搜索。如果某个对象能通过这条引用链与GCRoot相连，那么它就是“可达
【学习】《算法图解》第十一章学习笔记：动态规划程序员
一、动态规划概述动态规划（DynamicProgramming，简称DP）是一种通过将复杂问题分解为更简单的子问题来解决问题的方法。它是一种强大的算法设计技术，特别适用于具有重叠子问题和最优子结构性质的问题。（一）算法适用场景动态规划主要适用于以下场景：最优化问题（求最大值、最小值）计数问题（求方案数）具有重叠子问题特性的问题具有最优子结构特性的问题（二）算法基本思想动态规划的核心思想是：将原问题
图论算法的大家庭——c++中的图论算法 imlarry0616 深度优先算法图论
图论算法是处理图结构问题的核心工具，广泛应用于路径规划、社交网络分析、计算机网络等领域。以下从基础概念、经典算法及其代码实现展开详细介绍，涵盖DFS、BFS、最短路径、最小生成树等核心内容，并附C++代码示例及注释。一、图的基础概念图的定义：由顶点（Vertex）集合V和边（Edge）集合E组成，记作G=(V,E)。分类：无向图：边无方向（如社交网络中的朋友关系）。有向图：边有方向（如网页链接关系
周易算卦排盘源码（完整的周易四柱八字紫微斗数_七政四余大六壬等源码）大大的拥抱88 开发语言 python
简介本仓库提供了一个完整周易八字排盘源码：周易八卦，阴阳五行，干支，四柱八字排盘，紫微斗数，奇门遁甲，七政四余集大成者结合，事实上年周易研究，结合了紫薇运势，刑冲关系，神煞，奇门遁甲，七政四余排盘，大六壬等中国古老的周易占卜算法，结合计算机知识，在网页上可以时时展示出来，对真正的占师卜，周易弟子非常受益。这套完整的代码适合开发者和商业运营者学习和使用。资源文件描述文件名:周易算卦源码（完整的周易四
Dubbo 令牌验证：防止服务被非法调用 Java技术栈实战 dubbo 网络 ai
Dubbo令牌验证：防止服务被非法调用关键词：Dubbo、令牌验证、分布式服务、服务安全、非法调用防护摘要：在分布式系统中，服务暴露在网络中可能面临非法调用的风险。Dubbo作为国内最流行的分布式服务框架，提供了「令牌验证」这一轻量级安全机制，能有效阻止未授权服务的访问。本文将用「小区门禁卡」的生活化比喻，结合代码示例和实战案例，从原理到落地手把手教你掌握Dubbo令牌验证，彻底搞懂如何为服务调用
AI人工智能领域深度学习的跨模态检索技术 AI学长带你学AI AI人工智能与大数据应用开发 AI应用开发高级指南人工智能深度学习 ai
AI人工智能领域深度学习的跨模态检索技术关键词：跨模态检索、深度学习、多模态学习、特征提取、相似度计算、注意力机制、Transformer摘要：本文深入探讨了AI领域中基于深度学习的跨模态检索技术。我们将从基础概念出发，详细分析跨模态检索的核心算法原理、数学模型和实际应用。文章包含完整的Python实现示例，展示如何构建一个跨模态检索系统，并讨论当前的技术挑战和未来发展方向。通过本文，读者将全面理
网络安全运维与攻防演练综合实训室解决方案武汉唯众智创 web安全运维安全网络安全运维与攻防演练实训室网络安全运维攻防演练实训室网络安全运维与攻防演练
一、前言在数字化浪潮席卷全球的当下，网络已深度融入社会的各个层面，成为推动经济发展、社会进步和科技创新的关键力量。从日常生活中的移动支付、社交互动，到企业运营中的数据管理、业务拓展，再到国家关键基础设施的运行，网络的身影无处不在。在日常生活中，我们频繁地在网络上进行各种活动，如网上购物、移动支付、社交互动等，这些活动都涉及到个人敏感信息的传输和存储。一旦这些信息被泄露，个人可能面临财产损失、身份被
matlab 渐进三角网(PTD)地面滤波(基础版) 点云侠 matlab点云工具箱 matlab 开发语言算法 c++计算机视觉
目录一、算法原理1、PTD算法2、实现流程二、代码实现三、结果展示1、原始点云2、滤波结果代码是按照算法原理的复现，效率极低，只适合学习和理解算法。一、算法原理1、PTD算法渐进三角网地面滤波算法（ProgressiveTINDensification,PTD）是一种广泛应用于机载LiDAR点云数据处理的滤波方法，旨在从复杂场景中精确分离地面点，以生成数字高程模型（DEM）。2、实现流程 P
muduo 2301_80355452 php 前端开发语言
好的，我们来深入剖析陈硕老师开发的著名C++网络库——muduo。它以“简单、高效、易用”著称，是学习LinuxC++高性能网络编程的绝佳范本。我会尽量详细、通俗地讲解其核心思想、关键组件、源码结构和工作原理。核心思想：Reactor模式(Non-blocking+I/OMultiplexing)muduo的灵魂是Reactor模式。理解它就理解了muduo的一半。想象一下：传统阻塞模型的问题：想
编程语言发展史之：逻辑编程语言 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.简介逻辑编程（logicalprogramming）是一种编程范式，旨在以一种逻辑的方式来表示程序，而不是像命令式编程一样直接面向计算模型或执行指令。逻辑编程倾向于通过构造计算机所理解的数学逻辑模型来解决问题。它特别适用于那些对数据结构和算法模型十分敏感的问题。与函数式编程相比，逻辑编程更加强调数据、关系和抽象等抽象概念之间的对应关系，因此更容易设计出正确而优雅的程
脑机新手指南（二十）BCI2000 新手入门指南（下篇） Brduino脑机接口技术答疑脑机新手指南人工智能算法大数据
一、引言在上篇文章中，我们介绍了BCI2000的基本概念、特点和优势，以及安装、配置和基本使用流程。在本篇文章中，我们将深入探讨BCI2000的信号处理和分类算法，并提供一些实操的代码教程，帮助新手更好地掌握BCI2000的使用方法。二、BCI2000的信号处理（一）信号处理的基本概念在脑机接口系统中，信号处理是一个非常重要的环节，它的主要目的是从原始的脑电信号中提取有用的信息，并去除噪声和干扰。
机器视觉：ransac算法详解无水先生数字图形和图像处理算法计算机视觉
目录一、说明：二、算法步骤三、算法代码四、其它补充一、说明：RANSAC是一种常用的参数估计方法，全称为RandomSampleConsensus（随机抽样一致性）。它通过随机选择数据中的一部分，然后根据这些数据拟合模型，统计模型与其他数据的偏差，最终筛选出符合一定阈值的数据，用于估计参数。RANSAC可以应用于很多领域，如计算机视觉、机器人和地理信息系统等。其优点在于对噪声数据和异常值有很强的鲁
matlab有限元相场算法 bubiyoushang888 算法 matlab 机器学习
研究的目的是证明一种有限元相场算法，其中相场方程是完全耦合并同时求解的。不过，在这种情况下，完全耦合的方程是弹性和非守恒的阶参数；然而，该方法可作为其他相场模型完全耦合公式的模板。这是求解具有弹性不均匀性的Allen-Cohn方程的主要程序。有限元算法。该算法解决了非保守阶参数的演化问题。全耦合模式下应力列场的演化。取决于代码中Isolve参数的选择：对于Isolve-1，代码以长手格式和非优化模
Python程序设计第6章：函数和函数式编程若北辰 Python程序设计 python 开发语言
Python程序设计Python是全球范围内最受欢迎的编程语言之一，学好Python将对个人职业生涯产生很大的助力，Python在机器学习、深度学习、数据挖掘等领域应用极为广泛。在数据科学家/数据分析师、人工智能工程师、网络安全工程师、软件工程师/全栈工程师、自动化测试工程师等岗位，年入50万，很普遍，学好Python，高薪就业不是问题，因此推出Python程序设计系列文章：Python程序设计第
设计模式-模板模式 GodKeyNet 设计模式模板模式
一、所用到的类一个抽象类：里面都是固定的方法，然后外加一个调用这些固定流程方法的方法N个实现类：这些实现类去实现固定的那些方法二、代码实现抽象类publicabstractclassOneDay{abstractvoidgetup();abstractvoideat();abstractvoidsleep();publicvoidstart(){getup();eat();sleep();}}实现
半监督学习+迁移学习：低成本构建高精度AI模型 AI智能探索者 AI Agent 智能体开发实战人工智能学习迁移学习 ai
半监督学习+迁移学习：低成本构建高精度AI模型关键词：半监督学习、迁移学习、低成本、高精度AI模型、数据利用摘要：本文主要探讨了如何通过半监督学习和迁移学习相结合的方式来低成本构建高精度的AI模型。首先介绍了半监督学习和迁移学习的背景知识，然后详细解释了这两个核心概念及其相互关系，接着阐述了相关算法原理、数学模型，还给出了项目实战案例，分析了实际应用场景，推荐了相关工具和资源，最后探讨了未来发展趋
什么是神经网络和机器学习？【云驻共创】一键难忘人工智能机器学习深度学习神经网络网络
什么是神经网络和机器学习？一.背景在当今数字化浪潮中，神经网络和机器学习已成为科技领域的中流砥柱。它们作为人工智能的支柱，推动了自动化、智能化和数据驱动决策的进步。然而，对于初学者和专业人士来说，理解神经网络和机器学习的本质是至关重要的。在本文中，我们将深入探讨这两个概念的内涵、工作原理以及彼此之间的联系。二.神经网络和机器学习简介神经网络和机器学习都是人工智能领域中的重要概念，它们通常用于解决各
AI人工智能与OpenCV：实现智能图像编辑功能 AI智能探索者 AI Agent 智能体开发实战人工智能 opencv 计算机视觉 ai
AI人工智能与OpenCV：实现智能图像编辑功能关键词：人工智能、OpenCV、图像处理、计算机视觉、深度学习、智能编辑、图像增强摘要：本文深入探讨如何结合人工智能(AI)和OpenCV实现智能图像编辑功能。我们将从基础概念出发，详细介绍核心算法原理，展示实际代码实现，并分析典型应用场景。文章将涵盖从传统图像处理技术到深度学习方法的演进，重点讲解如何利用OpenCV和AI模型实现自动化的图像增强、
python学智能算法（十五）|机器学习朴素贝叶斯方法进阶-CountVectorizer多文本处理西猫雷婶人工智能机器学习 python学习笔记机器学习 python 人工智能深度学习 scikit-learn
【1】引言前序学习进程中，已经学习CountVectorizer文本处理的简单技巧，先相关文章链接为：python学智能算法（十四）|机器学习朴素贝叶斯方法进阶-CountVectorizer文本处理简单测试-CSDN博客此次继续深入，研究多文本的综合处理。【2】代码测试首先相对于单文本测试，直接将文本改成多行文本：#引入必要的模块fromsklearn.feature_extraction.te
[Unity网络游戏实战]网络游戏的“Hello，World”——Echo（回响）（新手向）码穿地球 unity 游戏引擎
网络游戏的“Hello，World”——Echo（回响）文章目录网络游戏的“Hello，World”——Echo（回响）1，Socket1.1Socket1.2IP地址1.3端口1.4Socket通信流程1.5TCP和UDP协议2.3开始网络编程：Echo2.3.1什么是Echo程序2.3.2编写客户端程序2.4完成客户端2.5创建服务端2.5.1服务端知识点2.6测试Echo程序1，Socket
《ChromaGAN》论文简读及demo运行（萌新手记） kkpeach 学习手记 python 机器学习计算机视觉
论文题目：《ChromaGAN:AdversarialPictureColorizationwithSemanticClassDistribution》《具有语义类别分布的对抗图片着色》论文地址：https://arxiv.org/pdf/1907.09837.pdf源码地址：https://github.com/pvitoria/ChromaGAN声明：仅学习用途。这是WACV2020收录的一篇
数据结构：链表和二叉树的应用和算法设计鱼弦数据结构链表
鱼弦：CSDN内容合伙人、CSDN新星导师、全栈领域创作新星创作者、51CTO(Top红人+专家博主)、github开源爱好者（go-zero源码二次开发、游戏后端架构https://github.com/Peakchen）链表：链表是一种常见的线性数据结构，由一系列节点组成，每个节点包含数据和指向下一个节点的指针。链表的优势在于可以动态添加和删除元素，不需要预先分配固定大小的内存空间。链表常用于
python自动化运维 ZZH1120KQ 运维 python 自动化
1系统性能信息模块psutilpsutl是一个跨平台库，能够轻松实现获取系统运行的进程和系统利用率(包括CPU、内存、磁盘、网络等)信息。它主要应用于系统监控，分析和限制系统资源及进程的管理。#这是一个外部模块，需要下载，通过指定源下载pip3installpsutil-ihttps://mirrors.aliyun.com/pypi/simple/importpsutil1.1内存信息memor
Java SE知识点五：面向对象之：继承时来天地皆同力. Java SE知识点 java 开发语言改行学it idea intellij idea 后端
1.什么是继承1.1继承的概念Java中的类是对事物的抽象描述，但有时候一个类与其他类有许多的共性，比如猫和狗都是动物，那么猫和狗这两个类就难免会有许多相似之处：classDog{publicStringname;publicintage;publicStringcolor;publicvoideat(){}publicvoidsleep(){}}classCat{publicStringname
双指针算法-day12（判断子序列）拾零吖力扣算法 leetcode 数据结构
1.判断子序列题目解析字符相等：双指针一起动，不相等：长字符串指针动；代码classSolution{public:boolisSubsequence(strings,stringt){//时间复杂度：O(m)//空间复杂度：O(1)intn=s.size(),m=t.size();inti=0,j=0;while(i&dictionary){stringans="";intn=ans.size(
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d