Tom Hardy

一文详解图像中的无监督学习

作者丨凤舞九天

来源丨PaperWeekly

编辑丨极市平台

导读

本文主要介绍了CV领域内的无监督学习，内容主要包括Moco、Simclr、BYOL、SimSiam、SwAV、MAE、IPT，详细介绍了这些经典工作的亮点，并附有自己实际工作中复现的心得体会，希望能够帮助大家更深刻的了解无监督学习～

前言

由于工作原因搞了相当一段时间的无监督学习，包括cv单模态的无监督，以及多模态的无监督学习，这里将自己重点关注的论文介绍一下，并且会附上自己在实验过程中的一点心得体会。这篇文章主要介绍图像（CV）领域内的无监督学习。

无监督学习的概念其实很早就有了，从最初的auto-encoder，到对图像进行不同的预处理然后进行预测的无监督学习（比如旋转后预测旋转角度、mask一部分进行复原），以及到如今对比学习（simclr、moco）、特征重构（byol，simsiam）、像素重构MAE、甚至low-level的无监督预训练（IPT），可以说图像的无监督学习获得了长足的发展，而且无监督的效果已经在逐步逼近有监督的效果。

当然，截止到目前我仍然不认为无监督学习的效果能打败有监督学习，但是在大量没有标注的数据上进行无监督训练，然后再在自己的特定任务上的少量标注数据上进行finetune，那效果确实是会好很多的，但是如果是大量的无监督训练的数据也是有标注的情况，那么效果肯定不如直接有监督训练，而且经过自己的实验，即便是先无监督再有监督、有监督无监督一起训练也不会有太大收益，所以说目前为止还是数据为王。

但是目前无论是单模态（CV、NLP）还是多模态下，都会有超大规模的预训练数据甚至能到亿级别，在这种数据量下预训练出来的模型当然会很好，但是收集整理如此量数据以及在亿级别训练数据上进行训练都是极其消耗资源的，一般的研究员都是load开源的模型参数再进一步pretrain或者finetune。

对比学习

最初做无监督的想法很简单，类似auto-encoder，重构像素、或者对图像做一些变换（比如旋转）然后进行预测，但是如此做并没有得到特别好的效果。自己个人感觉对比学习（simclr和moco）的出现算是无监督学习的一次质的飞跃，而且这些经典论文的一些思路以及结论，对其他工作都有借鉴意义，自己有关的实验也会一一介绍。

先简单介绍下对比学习的概念。我们的输入图像，经过两种不同的预处理（变换）之后可以得到两张图像和，那么经过特征提取器（encoder）之后两者的特征应该是比较相近的。但是如果直接最大化两张图像特征的距离，模型很容易陷入坍塌，即特征都映射成固定特征，那么loss为0。因此对比学习引入负样本的概念，对于来自同一张图像的特征，其特征距离尽可能近，而来自不同图像的特征，其特征距离要尽可能远，用学术上的话说就是最小化正样本距离，最大化负样本距离，也就是对比学习的损失函数。

这里对损失函数简单解释下，对比学习的输入是对每一张图像进行两种不同的变换，经过特征提取之后会得到两种特征，对任意特征来说，总会有一个特征是其正样本（同一张原始图像的两种不同的数据增强得到的特征），而一个batch中的其他图像提取到的特征就是负样本。从原理上来说（其实是各种论文的实验结果），提高对比学习的效果就是提供足够大的batch size、研究更加有效的不同预处理方式（使得经过变换后的两张图像既能保留图像最本质的信息，又尽可能不一致）以及增加模型（encoder）表达能力。下面重点讲一下对比学习领域内Moco和Simclr两个最具代表性以及影响力的文章。

MoCo: Momentum Contrast for Unsupervised Visual Representation Learning

首先是Moco，Moco研究的重点是如何增加计算loss时的负样本数据，因为总显存是有限的。Moco设计了一种巧妙的方式，在训练的过程中维护一个队列，将历史batch 中的特征（这里的特征由于没有梯度，所以占显存很小）存入到队列中，这样一个新的batch 在计算的时候，可以在队列中找到足够多的负样本进行迭代优化。但是这样有一个问题是，不同batch提取特征时的模型参数是在一直更新的，所以作者设计了一个momentum-encoder，其结构与encoder完全相同，每次更新的时候以较小的步长从encoder中copy 参数，这样momentum-encoder参数不是通过loss 来进行学习的，所以提取的特征无需梯度，占用显存就比较小，同时momentum-encoder 参数变化很缓慢，所以队列中维护负样本特征就保证了足量且相对一致（来自同一个模型参数），以保证对比学习的效果。

A Simple Framework for Contrastive Learning of Visual Representations

接下来介绍的就是Simclr这篇文章。Simclr可以说有钱任性，直接暴力加足够的机器以保证4096的batch size，这样一来损失函数就可以直接计算。Simclr主要研究了对图像的不同变换以及特征表达的影响，Simclr做了大量不同的尝试，最后发现在对比学习中，预处理效果最好。

除此之外，Cimclr还在encoder之外加了mlp结构，进一步提升了效果（其实不知道这个为什么会有效）。其模型结构为：

Moco 在借鉴的Simclr的数据增强方式以及mlp结构之后形成了moco-v2，效果也有很大的提升，说明simclr本身的实验结论十分solid。

最初在看到Moco这篇文章的时候确实觉得这个思路很巧妙，而且很明显作者将其做work了，因为论文中的指标完全可复现。不过当我复现simclr的时候设计了另外一种在一定量显存的前提下模拟大batch size的实现方式，简单讲就是小batch 先不带梯度推理保存结果，再带梯度推理计算loss，但是需要重复推理，浪费了训练时间。

我们看论文的目的除了直接用论文的方法之外，还可以借鉴论文中的部分思路。比如说Simclr中的数据增强以及mlp结构，可以说是类似文章的标配了，而Moco论文利用momentum-encoder以及队列来实现在小batch size情况下得到足够量的负样本也很值得借鉴，在我训练CLIP（多模态对比学习）的时候采用的就是Moco的思路，比如ALBEF这篇文章也是用了类似的思路（当然人家还有别的优化点，所以能发表论文）。

同时自己在做目标检测的时候发现了一篇DetCo，其实就是将Moco适配到了目标检测领域，设计了多尺度的对比以及增加了局部VS全局的对比，自己实验下来，目标检测的任务下，DetCo确实比Moco好一些。在视频领域也有由Moco改进而来的VideoMoco，不过这篇文章没实验过。

最后写一些是自己应用中的一些思考。首先是在自己的业务数据上训练类似Moco或者Simclr的时候，由于对比损失函数的特点，如果数据中相似数据占比较高的话最好做一下去重；其次是在多机多卡训练的过程中，正样本都是在同一机器同一张卡上计算，但是负样本会来自不同的机器，所以当encoder 选用ResNet等CNN结构时，BN层会有一定的信息泄漏，Moco中采用的是shuffle bn，而Simclr采用的是sync bn。

特征重构

刚刚有提到，如果直接最大化两张图像特征的距离，模型很容易陷入坍塌。但是也有一些文章进行直接进行特征重构但是却能收敛（其实从原理上并不是很清楚收敛原因）。这里主要是介绍BYOL和SimSiam。

BYOL可以说是我在尝试的论文中效果最好的一个，其最显著的特点是训练的时候不需要负样本，只需要正样本就好。

BYOL在Simclr的mlp（projection）之后额外加了新的mlp结构（predition），利用predition的结果和另一种增强方式得到的projection直接构建l2 loss。BYOL中target emcoder其实就是Moco中的momentum-encoder，其参数更新来自于online-encoder，而不是由loss计算。可以说BYOL在Moco-v2的基础上直接去掉了负样本的对比，而是在正样本projection之后再进行predition来预测图像特征。

SimSiam就更简单了，SimSiam 相当于在BYOL的基础上进一步去掉了momentum-encoder，仅用一个encoder，而且作者研究发现保证模型不坍塌的原因是target 数据的梯度不回传。

BYOL和Simsiam我自己也有有过尝试，开源的代码也并不复杂，确实能复现论文的效果，但是目前仍然不是很理解为何target 网络 stop gradient就能使得无监督训练不坍塌，对我而言仍然是有一点点玄学。

其他思路

接下来的几篇文章，是我个人觉得思路比较值得借鉴的文章，这里一并介绍下。

首先是SwAV这篇文章。这篇文章比较有意思的点是虽然loss采用的仍然是类似对比学习，但是其无需负样本计算loss。具体实现方式为其中一个增强结果所提的特征会进行聚类，得到一个one-hot编码，我个人理解为就是为这张图像打了一个label，然后对另一个增强结果进行分类（特征与聚类中心点乘）。还有一个值得借鉴的点是其数据增强引入了低分辨率（小size），一张图像经过数据增强之后可以得到8个不同的view，其中两个是高分辨率，其余六个是低分辨率，view1（利用distributed_sinkhorn 计算q）与其余7个view计算loss，view2（利用distributed_sinkhorn 计算q）与其余7个view计算loss。其loss 表达式和模型结构为：

其次是MAE这篇文章，是凯明大神继Moco系列之后的又一力作，其实自从BERT、GPT在NLP领域内被成功应用之后，在图像领域也有相当一部分研究集中在对图像进行一定mask然后重建的工作上，IGPT，BEiT是其中的代表作。其实自己也跑过类似IGPT的代码，结果当然是有点惨不忍睹。凯明大神一贯作风是思路简单，效果拔群，然而能将简单的思路实现，并最终work，才真是硬实力。MAE 选用的模型是VIT结构，首先对原图进行patch划分，mask 的粒度也是在patch上完成。AutoEncoder 的结构其实比较简单，一个encoder，一个decoder，配合上VIT以及patch 划分，整体模型结构便呼之欲出。

MAE之所以能成功，个人认为有两个比较重要的关键点。

1. 75% mask 比例，与文本不同的是，一张图像信息是非常冗余的，如果类似于BERT 采用随机15%的mask比例的话，重建任务非常简单，模型很容易就从mask部分的邻域学到信息完成重建任务。

2. 非对称的encoder、decoder结构。在论文中指出，因为训练的目的是拿到比较好的encoder模型，所以encoder模型相对重一些（参数多），而轻量级（参数少）decoder已经能很好的完成重建任务，与此同时，Mask token 不参与encoder计算，仅参与decoder计算，这样一来，参数多的encoder只输入25%的图像数据，而输入100%图像数据的decoder参数又比较少，能够加速计算。

最后是IPT这篇文章。IPT与之前文章最大的不同点在于IPT模型更加关注细粒度信息，当然其负责的任务也主要是降噪、去雨、超分等low level 的任务，其模型以及任务的设计也比较巧妙，为每个任务设计独立的head和tail模块，中间层则是共享参数的transformer结构，预训练任务就是人为对原始数据加噪声、缩小等各种操作进行复原，这篇文章感觉在low level 的任务上有很好的启发意义。

总结

以上提到的大多数文章自己都有相关的实验，但是做无监督有一点点心塞的是随着自己业务上的标注数据越来越多，无监督预训练带来的收益会越来越少，所以无监督预训练在业务上应用一般是启动的时候第一版本，手中只有少量的数据，这个时候加上无监督预训练，而后随着数据回流与标注，有监督训练的效果会越来越好。同时这里介绍的这么多篇文章，自己实验下来在业务数据上效果其实并没有差很多，同时无监督预训练也需要大量的数据，而且epoch也要更长（其实也比较消耗资源），最好是先load 各家在imagenet上预训练好的开源模型。

本文仅做学术分享，如有侵权，请联系删文。

干货下载与学习

后台回复：巴塞罗那自治大学课件，即可下载国外大学沉淀数年3D Vison精品课件

后台回复：计算机视觉书籍，即可下载3D视觉领域经典书籍pdf

后台回复：3D视觉课程，即可学习3D视觉领域精品课程

计算机视觉工坊精品课程官网：3dcver.com

1.面向自动驾驶领域的多传感器数据融合技术

2.面向自动驾驶领域的3D点云目标检测全栈学习路线！(单模态+多模态/数据+代码)
3.彻底搞透视觉三维重建：原理剖析、代码讲解、及优化改进
4.国内首个面向工业级实战的点云处理课程
5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解
6.彻底搞懂视觉-惯性SLAM：基于VINS-Fusion正式开课啦
7.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化
8.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)

9.从零搭建一套结构光3D重建系统[理论+源码+实践]

10.单目深度估计方法：算法梳理与代码实现

11.自动驾驶中的深度学习模型部署实战

12.相机模型与标定(单目+双目+鱼眼）

13.重磅！四旋翼飞行器：算法与实战

14.ROS2从入门到精通：理论与实战

15.国内首个3D缺陷检测教程：理论、源码与实战

16.基于Open3D的点云处理入门与实战教程

重磅！计算机视觉工坊-学习交流群已成立

扫码添加小助手微信，可申请加入3D视觉工坊-学术论文写作与投稿微信交流群，旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群，目前主要有ORB-SLAM系列源码学习、3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、深度估计、学术交流、求职交流等微信群，请扫描下面微信号加群，备注：”研究方向+学校/公司+昵称“，例如：”3D视觉 + 上海交大 + 静静“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球：针对3D视觉领域的视频课程（三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、激光/视觉SLAM、自动驾驶等）、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕，更有各类大厂的算法工程人员进行技术指导。与此同时，星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息，打造成集技术与就业为一体的铁杆粉丝聚集区，近4000星球成员为创造更好的AI世界共同进步，知识星球入口：

学习3D视觉核心技术，扫描查看介绍，3天内无条件退款

圈里有高质量教程资料、答疑解惑、助你高效解决问题

觉得有用，麻烦给个赞和在看~

操作系统——磁盘调度算法代码实现十指流玉笔记操作系统
磁盘调度算法先来先服务算法（FCFS）：先来先服务算法根据访问磁盘的先后顺序进行，由当前磁头位置移动到首先到达缓存区的磁盘。优点：公平/简单，该算法的平均寻道时间相对较长。voidFCFS(){intsum=0;intstart;intFind[11];cout>start;cout>Find[i];}cout";for(inti=1;i";}cout>start;cout>Find[i].loc
python笔记-Selenium谷歌浏览器驱动下载 hero.zhong python 笔记 selenium
Selenium谷歌浏览器驱动下载地址：https://googlechromelabs.github.io/chrome-for-testing/#stable下面是遇到的问题：python网络爬虫技术中使用谷歌浏览器代码，报错：OSError:[WinError193]%1不是有效的Win32应用程序：遇到错误OSError:[WinError193]%1不是有效的Win32应用程序通常意味着
【一起来学AI大模型】支持向量机（SVM）：核心算法深度解析运器123 AI大模型支持向量机机器学习人工智能 ai 大数据 AI编程算法
一、算法核心思想支持向量机（SVM）是一种强大的监督学习算法，核心思想是通过寻找最优超平面实现分类或回归：分类目标：找到能最大化两类数据间隔的超平面回归目标：找到包含最多数据点的ε带关键概念图解超平面：w·x+b=0/\/\+1|支持向量|-1|●●||●●||●●||_________________|最大间隔(margin)二、数学原理与优化问题1.线性可分情况目标函数：\min_{w,b}\
JVM垃圾回收机制深度解析真实的菜 jvm jvm
️JVM垃圾回收机制深度解析文章目录️JVM垃圾回收机制深度解析垃圾判定算法引用计数法可达性分析算法垃圾回收算法️标记-清除算法复制算法标记-整理算法️分代收集算法️常见垃圾收集器Serial收集器⚡ParNew收集器Parallel收集器CMS收集器G1收集器⚡垃圾回收调优常用JVM调优参数️调优工具使用：JConsole、VisualVMJConsoleVisualVM实战案例分析案例一：内存
网络编程底层通信（socket） En^_^Joy python应用网络 python
文章目录一、socket函数介绍二、TCP/IP服务端/客户端三、UDP/IP服务端/客户端四、多线程服务器（threading）五、网络编程常见问题（地址复用、粘包、数据长度）网络编程指通过计算机网络实现程序间通信的技术。Python提供了丰富的库支持各种网络协议和编程模式套接字是网络通信的基本操作单元，是应用层与TCP/IP协议族通信的中间软件抽象层。它提供了一组接口，允许不同主机或同一主机的
【一起来学AI大模型】算法核心：数组/哈希表/树/排序/动态规划（LeetCode精练）运器123 AI大模型 python 开发语言人工智能 AI AI编程算法散列表
以下是五大核心算法的重点解析和LeetCode经典题解，包含最优解法和模板代码：一、数组操作（双指针/滑动窗口）核心思想：通过索引指针高效遍历与操作数组1.移动零（No.283）defmoveZeroes(nums):slow=0forfastinrange(len(nums)):ifnums[fast]!=0:nums[slow],nums[fast]=nums[fast],nums[slow]
python unicode汉字转成各种进制，以及进制互相转换丧尽天良的良！ python python
例如，汉字：“五”的unicode编码为：4e94，使用二进制的结果为：100111010010100，转换为十进制是：20116对应转换如下：
Python办公—Excel嵌入图片提取&重命名(包含重复图片) 小庄-Python办公 Python办公自动化 python excel Excel图片获取 Excel批量获取嵌入图片 Excel嵌入图片
目录专栏导读背景解决方案1、背景介绍2、库的介绍①：openpyxl3、库的安装4、核心代码5、完整代码总结专栏导读欢迎来到Python办公自动化专栏—Python处理办公问题，解放您的双手️‍博客主页：请点击——>一晌小贪欢的博客主页求关注该系列文章专栏：请点击——>Python办公自动化专栏求订阅此外还有爬虫专栏：请点击——>Python爬虫基础专栏求订阅此外还有python基础专栏：请点击—
Python 是如何执行我的代码的？冰糖心书房 Python python java linux
理解Python如何执行你的代码，可以帮助我们解释很多“为什么”——为什么会有.pyc文件？为什么Python相对较慢？多线程为什么不能利用多核？我们可以用一个“厨师做菜”的比喻来理解整个过程，然后再深入技术细节。一、比喻：厨师（Python）根据菜谱（你的代码）做菜想象一下，你是一位顾客，写了一份非常精确的菜谱（你的.py文件）交给一位名叫CPython的大厨（最常见的Python解释器）。第一
探索Cachier：Python函数的持久化缓存利器胡同琥Randolph
探索Cachier：Python函数的持久化缓存利器cachierPersistent,stale-free,localandcross-machinecachingforPythonfunctions.项目地址:https://gitcode.com/gh_mirrors/ca/cachier在Python开发的世界中，性能优化和资源管理是永恒的话题。今天，我们要介绍的是一个强大的开源项目——C
Pyramda：Python 中的函数式编程利器惠悦颖
Pyramda：Python中的函数式编程利器pyramdaPythonpackagesupportingheavyfunctionalprogrammingthroughcurrying.TranslationoftheRamdalibraryfromjavascripttopython.项目地址:https://gitcode.com/gh_mirrors/py/pyramdaPyramda是
[特殊字符] Excel 读取收件人 + Outlook 批量发送带附件邮件 —— Python 自动化实战 happydog007 python自动化办公 excel outlook python
许多公司定期需要将不同部门或客户的报告发送给指定人员。手动操作容易出错、耗时且繁琐。今天这篇文章教你如何利用Python实现：从Excel中读取“收件人+抄送人+附件文件路径”；使用win32com.client调用Outlook自动生成并发送邮件；✅附加模板正文，并保持批量发送规范无需手工操作。从Excel中读取部门、收件人与附件路径fromopenpyxlimportload_workbook
[特殊字符] Python 实战 | 批量统计中文文档词频并导出 Excel happydog007 python自动化办公 python 开发语言
本文展示如何用Python脚本：批量读取文件夹中的多篇中文文档；用jieba分词并统计词频（过滤停用词与单字符）；将各文档词频输出为对应Excel文件；是文本分析、内容审查、报告编写中的实用技巧。Step1：批量加载文件夹中文本文件路径importospath='主要业务'files=[os.path.join(path,f)forfinos.listdir(path)]使用标准库os.listd
探索开源虚拟 Excel 函数模块：Python 中的 Excel 功能利器
在数据处理和分析的领域中，Excel一直是一款备受青睐的工具，它提供了丰富多样的函数，帮助用户高效地完成各种数据操作。而现在，我（董翔）开发一个基于Python的虚拟Excel函数模块，它将Excel的强大功能带到了Python的世界里，让你在Python环境中也能轻松使用类似Excel的函数。这个模块我已经在GitHub上发布，项目链接为：https://github.com/dxiang-wi
暑假算法日记第三天
目标：刷完灵神专题训练算法题单阶段目标：【算法题单】滑动窗口与双指针LeetCode题目:3439.重新安排会议得到最多空余时间I2134.最少交换次数来组合所有的1II1297.子串的最大出现次数2653.滑动子数组的美丽值1888.使二进制字符串字符交替的最少反转次数567.字符串的排列438.找到字符串中所有字母异位词30.串联所有单词的子串2156.查找给定哈希值的子串其他:今日总结往期打
写测试太烦？Copilot + Jest 让你 3 分钟搞定单元测试
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
60天python训练营打卡day46
学习目标：60天python训练营打卡学习内容：DAY46通道注意力(SE注意力)知识点回顾：1.不同CNN层的特征图：不同通道的特征图2.什么是注意力：注意力家族，类似于动物园，都是不同的模块，好不好试了才知道。3.通道注意力：模型的定义和插入的位置4.通道注意力后的特征图和热力图学习时间：2025.06.29@浙大疏锦行
python规划 t_hj python
-----------动态内容与反爬策略----------动态页面处理Selenium：自动化浏览器（点击、滚动、表单提交）Playwright（更现代的替代方案）API逆向工程分析Ajax请求（ChromeDevTools）直接调用API接口（如知乎热榜API）反爬应对User-Agent轮换、IP代理（免费/付费代理池）验证码处理（简单验证码用OCR，复杂验证码需打码平台）请求频率控制（ti
Python 训练营打卡 Day 46 2401_86382089 Python打卡 python
通道注意力一、什么是注意力注意力机制是一种让模型学会「选择性关注重要信息」的特征提取器，就像人类视觉会自动忽略背景，聚焦于图片中的主体（如猫、汽车）。transformer中的叫做自注意力机制，他是一种自己学习自己的机制，他可以自动学习到图片中的主体，并忽略背景。我们现在说的很多模块，比如通道注意力、空间注意力、通道注意力等等，都是基于自注意力机制的。从数学角度看，注意力机制是对输入特征进行加权求
如何在YashanDB中实现多级缓存策略数据库
随着大数据时代的到来，数据存储和访问的效率要求越来越高。数据库技术在面对海量数据、高并发访问时，性能瓶颈逐渐凸显，尤其是响应时间和系统吞吐量成为开发者和DBA关注的重点。为了解决这些问题，缓存策略被引入作为一种有效的解决方案。然而，不同类型的缓存（如内存缓存、磁盘缓存等）之间需要协调工作，以达到最佳性能。在此背景下，YashanDB作为一个云原生数据库，支持多级缓存策略，为数据访问提供了灵活的加速
Python训练营打卡 Day53 yunvwugua__ python自学打卡 python 开发语言
对抗生成网络知识点回顾：对抗生成网络的思想：关注损失从何而来生成器、判别器nn.sequential容器：适合于按顺序运算的情况，简化前向传播写法leakyReLU介绍：避免relu的神经元失活现象对抗生成网络（GAN）知识点回顾对抗生成网络的思想思想：就像在餐厅中，有一个厨师（生成器）负责制作假菜，一个评论家（判别器）负责区分真菜和假菜。厨师的目标是制作出评论家无法区分的假菜，而评论家的目标是找
华为OD机试 2025B卷 - 货币单位转换(C++&Python&JAVA&JS&C语言) YOLO大师华为od c++python 华为OD机试华为OD机试2025B卷华为OD2025B卷华为OD机考2025B卷
2025B卷目录点击查看：华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解2025B卷100分题型题目描述记账本上记录了若干条多国货币金额，需要转换成人民币分（fen），汇总后输出。每行记录一条金额，金额带有货币单位，格式为数字+单位，可能是单独元，或者单独分，或者元与分的组合。要求将这些货币全部换算成人民币分（fen）后进行汇总，汇总结果仅保留整数，小数部分舍弃。元和分的换算关系都是
C++编程语言入门指南 jdlxx_dongfangxing c++
一、C++语言概述C++是由丹麦计算机科学家BjarneStroustrup于1979年在贝尔实验室开发的一种静态类型、编译式、通用型编程语言。最初被称为"CwithClasses"(带类的C)，1983年更名为C++。它既具有高级语言的抽象特性，又保留了底层硬件操作能力，被广泛应用于系统软件、应用软件、驱动程序、嵌入式软件、高性能服务器和客户端应用以及娱乐软件等开发领域。作为C语言的超集，C++
C++二分查找入门指南
一、二分法概述二分查找（BinarySearch）是一种在‌有序数组‌中查找特定元素的高效算法。它的基本思想是通过不断将搜索范围减半来快速定位目标元素，时间复杂度为O(logn)，远优于线性查找的O(n)。二分法不仅用于查找，还广泛应用于求解各种数学和计算问题，如求方程的近似解、寻找最优解等。在计算机科学中，二分查找是最基础且最重要的算法之一，几乎所有程序员都需要熟练掌握。二、二分查找的基本原理二
更换SSL证书引发的异常：`sun.security.validator.ValidatorException: PKIX path building failed` `[Nginx跳转失败：501] 猿享天开技术经验 ssl nginx 网络协议
博主简介：CSDN博客专家、CSDN平台优质创作者，高级开发工程师，数学专业，10年以上C/C++,C#,Java等多种编程语言开发经验，拥有高级工程师证书；擅长C/C++、C#等开发语言，熟悉Java常用开发技术，能熟练应用常用数据库SQLserver,Oracle,mysql,postgresql等进行开发应用，熟悉DICOM医学影像及DICOM协议,业余时间自学JavaScript,Vue,
河南萌新联赛2024第（四）场的个人题解（适合小白）耳朵听不见deaf ACM 算法
河南萌新联赛2024第（四）场的题目链接文章目录ABCEGIJKLAA题目链接思路： sum=计算原来每个连通块的士兵数量总和的平方。枚举每个点，若破坏当前点，当前点所在的连通块的计算值，记录ma=没破坏前的计算值-破坏后的计算值，记录最大值涉及的知识：tarjan算法不明白的话，可以看我的第二篇博客LCA算法有用的知识：__int128 占用128字节的整数存储类型，范围为-2127~2
Python 训练营打卡 Day 50 2401_86382089 Python打卡 python
预训练模型CBAM注意力现在我们思考下，是否可以对于预训练模型增加模块来优化其效果，这里我们会遇到一个问题：预训练模型的结构和权重是固定的，如果修改其中的模型结构，是否会大幅影响其性能。其次是训练的时候如何训练才可以更好的避免破坏原有的特征提取器的参数。所以今天的内容，我们需要回答2个问题。resnet18中如何插入cbam模块？采用什么样的预训练策略，能够更好的提高效率？可以很明显的想到，如果是
Python训练营打卡 Day50
预训练模型+CBAM模块知识点回顾：resnet结构解析CBAM放置位置的思考针对预训练模型的训练策略差异化学习率三阶段微调预训练模型+CBAM模块知识点回顾ResNet结构解析残差块：ResNet的核心是残差块，它通过残差连接解决了深层网络的梯度消失问题。残差块允许梯度直接传播到后面的层，从而使得网络能够训练得更深。网络结构：ResNet由多个残差块组成，每个残差块包含两个或三个卷积层，以及一个
快速排序算法追烽少年x 数据结构数据结构
快速排序算法快速排序是一种高效的排序算法，其核心思想是通过分治法将数组分成两部分，一部分小于某个基准值，另一部分大于基准值，然后递归地对这两部分进行排序。以下是快速排序算法的C++实现：快速排序的C++实现代码：#include#includeusingnamespacestd;voidSwap(int&a,int&b){intnTemp=a;a=b;b=nTemp;}intPartition(v
Python编程电子书：从基础到实践王奥雷
本文还有配套的精品资源，点击获取简介：Python电子书汇集了基础语法、面向对象编程、标准及第三方库使用、文件操作、网络编程、并发编程、单元测试与调试、Python2与Python3的区别等核心知识点。通过实例和项目案例，帮助读者在Web开发、数据分析、人工智能等应用领域提升编程技能，跟上Python的技术进步。1.Python基础语法介绍Python作为一种高级编程语言，其易读性和简洁的语法使其
html 周华华 html
js 1，数组的排列 var arr=[1,4,234,43,52,]; for(var x=0;x<arr.length;x++){ for(var y=x-1;y<arr.length;y++){ if(arr[x]<arr[y]){ &
【Struts2 四】Struts2拦截器 bit1129 struts2拦截器
Struts2框架是基于拦截器实现的，可以对某个Action进行拦截，然后某些逻辑处理，拦截器相当于AOP里面的环绕通知，即在Action方法的执行之前和之后根据需要添加相应的逻辑。事实上，即使struts.xml没有任何关于拦截器的配置，Struts2也会为我们添加一组默认的拦截器，最常见的是，请求参数自动绑定到Action对应的字段上。 Struts2中自定义拦截器的步骤是：
make:cc 命令未找到解决方法 daizj linux 命令未知 make cc
安装rz sz程序时，报下面错误： [root@slave2 src]# make posix cc -O -DPOSIX -DMD=2 rz.c -o rz make: cc：命令未找到 make: *** [posix] 错误 127 系统：centos 6.6 环境：虚拟机错误原因：系统未安装gcc，这个是由于在安
Oracle之Job应用周凡杨 oracle job
最近写服务，服务上线后，需要写一个定时执行的SQL脚本，清理并更新数据库表里的数据，应用到了Oracle 的 Job的相关知识。在此总结一下。一：查看相关job信息 1、相关视图 dba_jobs all_jobs user_jobs dba_jobs_running 包含正在运行
多线程机制朱辉辉33 多线程
转至http://blog.csdn.net/lj70024/archive/2010/04/06/5455790.aspx 程序、进程和线程：程序是一段静态的代码，它是应用程序执行的蓝本。进程是程序的一次动态执行过程，它对应了从代码加载、执行至执行完毕的一个完整过程，这个过程也是进程本身从产生、发展至消亡的过程。线程是比进程更小的单位，一个进程执行过程中可以产生多个线程，每个线程有自身的
web报表工具FineReport使用中遇到的常见报错及解决办法（一）老A不折腾 web报表 finereport java报表报表工具
FineReport使用中遇到的常见报错及解决办法（一）这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、address pool is full：含义：地址池满，连接数超过并发数上
mysql rpm安装后没有my.cnf 林鹤霄没有my.cnf
Linux下用rpm包安装的MySQL是不会安装/etc/my.cnf文件的，至于为什么没有这个文件而MySQL却也能正常启动和作用，在这儿有两个说法，第一种说法，my.cnf只是MySQL启动时的一个参数文件，可以没有它，这时MySQL会用内置的默认参数启动，第二种说法，MySQL在启动时自动使用/usr/share/mysql目录下的my-medium.cnf文件，这种说法仅限于r
Kindle Fire HDX root并安装谷歌服务框架之后仍无法登陆谷歌账号的问题 aigo root
原文：http://kindlefireforkid.com/how-to-setup-a-google-account-on-amazon-fire-tablet/ Step 4: Run ADB command from your PC On the PC, you need install Amazon Fire ADB driver and instal
javascript 中var提升的典型实例 alxw4616 JavaScript
// 刚刚在书上看到的一个小问题,很有意思.大家一起思考下吧 myname = 'global'; var fn = function () { console.log(myname); // undefined var myname = 'local'; console.log(myname); // local }; fn() // 上述代码实际上等同于以下代码 m
定时器和获取时间的使用百合不是茶时间的转换定时器
定时器:定时创建任务在游戏设计的时候用的比较多 Timer();定时器 TImerTask();Timer的子类由 Timer 安排为一次执行或重复执行的任务。定时器类Timer在java.util包中。使用时，先实例化，然后使用实例的schedule(TimerTask task, long delay)方法，设定
JDK1.5 Queue bijian1013 java thread java多线程 Queue
JDK1.5 Queue LinkedList： LinkedList不是同步的。如果多个线程同时访问列表，而其中至少一个线程从结构上修改了该列表，则它必须保持外部同步。（结构修改指添加或删除一个或多个元素的任何操作；仅设置元素的值不是结构修改。）这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象，则应该使用 Collections.synchronizedList 方
http认证原理和https bijian1013 http https
一.基础介绍在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式，用的端口也不一样,前者是80，后
【Java范型五】范型继承 bit1129 java
定义如下一个抽象的范型类，其中定义了两个范型参数，T1，T2 package com.tom.lang.generics; public abstract class SuperGenerics<T1, T2> { private T1 t1; private T2 t2; public abstract void doIt(T
【Nginx六】nginx.conf常用指令(Directive) bit1129 Directive
1. worker_processes 8; 表示Nginx将启动8个工作者进程，通过ps -ef|grep nginx,会发现有8个Nginx Worker Process在运行 nobody 53879 118449 0 Apr22 ? 00:26:15 nginx: worker process
lua 遍历Header头部 ronin47 lua header 遍历　
local headers = ngx.req.get_headers() ngx.say("headers begin", "<br/>") ngx.say("Host : ", he
java-32.通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小(两数组的差最小)。 bylijinnan java
import java.util.Arrays; public class MinSumASumB { /** * Q32.有两个序列a,b，大小都为n,序列元素的值任意整数，无序. * * 要求：通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小。 * 例如: * int[] a = {100,99,98,1,2,3
redis 开窍的石头 redis
在redis的redis.conf配置文件中找到# requirepass foobared 把它替换成requirepass 12356789 后边的12356789就是你的密码打开redis客户端输入config get requirepass 返回 redis 127.0.0.1:6379> config get requirepass 1) "require
[JAVA图像与图形]现有的GPU架构支持JAVA语言吗？ comsci java语言
无论是opengl还是cuda，都是建立在C语言体系架构基础上的，在未来，图像图形处理业务快速发展，相关领域市场不断扩大的情况下，我们JAVA语言系统怎么从这么庞大，且还在不断扩大的市场上分到一块蛋糕，是值得每个JAVAER认真思考和行动的事情
安装ubuntu14.04登录后花屏了怎么办 cuiyadll ubuntu
这个情况，一般属于显卡驱动问题。可以先尝试安装显卡的官方闭源驱动。按键盘三个键：CTRL + ALT + F1 进入终端，输入用户名和密码登录终端：安装amd的显卡驱动 sudo apt-get install fglrx 安装nvidia显卡驱动 sudo ap
SSL 与数字证书的基本概念和工作原理 darrenzhu 加密 ssl 证书密钥签名
SSL 与数字证书的基本概念和工作原理 http://www.linuxde.net/2012/03/8301.html SSL握手协议的目的是或最终结果是让客户端和服务器拥有一个共同的密钥，握手协议本身是基于非对称加密机制的，之后就使用共同的密钥基于对称加密机制进行信息交换。 http://www.ibm.com/developerworks/cn/webspher
Ubuntu设置ip的步骤 dcj3sjt126com ubuntu
在单位的一台机器完全装了Ubuntu Server，但回家只能在XP上VM一个，装的时候网卡是DHCP的，用ifconfig查了一下ip是192.168.92.128,可以ping通。转载不是错： Ubuntu命令行修改网络配置方法 /etc/network/interfaces打开后里面可设置DHCP或手动设置静态ip。前面auto eth0，让网卡开机自动挂载. 1. 以D
php包管理工具推荐 dcj3sjt126com PHP Composer
http://www.phpcomposer.com/ Composer是 PHP 用来管理依赖（dependency）关系的工具。你可以在自己的项目中声明所依赖的外部工具库（libraries），Composer 会帮你安装这些依赖的库文件。中文文档入门指南下载安装包列表 Composer 中国镜像
Gson使用四（TypeAdapter） eksliang json gson Gson自定义转换器 gsonTypeAdapter
转载请出自出处：http://eksliang.iteye.com/blog/2175595 一.概述 Gson的TypeAapter可以理解成自定义序列化和返序列化二、应用场景举例例如我们通常去注册时（那些外国网站），会让我们输入firstName，lastName,但是转到我们都
JQM控件之Navbar和Tabs gundumw100 html xml css
在JQM中使用导航栏Navbar是简单的。只需要将data-role="navbar"赋给div即可： <div data-role="navbar"> <ul> <li><a href="#" class="ui-btn-active&qu
利用归并排序算法对大文件进行排序 iwindyforest java 归并排序大文件分治法 Merge sort
归并排序算法介绍，请参照Wikipeida zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F 基本思想：大文件分割成行数相等的两个子文件，递归（归并排序）两个子文件，直到递归到分割成的子文件低于限制行数低于限制行数的子文件直接排序两个排序好的子文件归并到父文件直到最后所有排序好的父文件归并到输入
iOS UIWebView URL拦截啸笑天 UIWebView
本文译者：candeladiao，原文：URL filtering for UIWebView on the iPhone说明：译者在做app开发时，因为页面的javascript文件比较大导致加载速度很慢，所以想把javascript文件打包在app里，当UIWebView需要加载该脚本时就从app本地读取，但UIWebView并不支持加载本地资源。最后从下文中找到了解决方法，第一次翻译，难免有
索引的碎片整理SQL语句 macroli sql
SET NOCOUNT ON DECLARE @tablename VARCHAR (128) DECLARE @execstr VARCHAR (255) DECLARE @objectid INT DECLARE @indexid INT DECLARE @frag DECIMAL DECLARE @maxfrag DECIMAL --设置最大允许的碎片数量,超过则对索引进行碎片
Angularjs同步操作http请求with $promise qiaolevip 每天进步一点点学习永无止境 AngularJS 纵观千象
// Define a factory app.factory('profilePromise', ['$q', 'AccountService', function($q, AccountService) { var deferred = $q.defer(); AccountService.getProfile().then(function(res) {
hibernate联合查询问题 sxj19881213 sql Hibernate HQL 联合查询
最近在用hibernate做项目，遇到了联合查询的问题，以及联合查询中的N+1问题。针对无外键关联的联合查询，我做了HQL和SQL的实验，希望能帮助到大家。（我使用的版本是hibernate3.3.2） 1 几个常识：（1）hql中的几种join查询，只有在外键关联、并且作了相应配置时才能使用。（2）hql的默认查询策略，在进行联合查询时，会产
struts2.xml wuai struts
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache