鲸落于北

YOLO神经网络

本文准备详细介绍一下用于目标检测的YOLO神经网络，主要是个人研读《You Only Look Once: Unified, Real-Time Object Detection》与《YOLO9000: Better, Faster, Stronger》这两篇论文的所得，以及结合网上一些对YOLO网络的解读。

首先我想说明下我个人认为YOLO网络的核心突破点。

在基于神经网络的机器视觉领域，两个问题一直居于核心，大部分流传甚广的优秀网络架构基本都是围绕这两个问题展开的，一个是目标识别，一个是目标检测。其中目标识别处于一个更基础的位置，所以很多基础的网络都是为了实现目标识别问题展开的，比如VGG、AlexNet、ResNet等。

但是，目标识别只能识别出图片中的目标的种类，但是不能分辨出其位置与外框，也就是俗称的“定位问题”。目标检测的任务就是找出图片中存在的物体位置（包括其中心与外框），以及该物体是什么，即目标定位与目标识别的结合。

其实看到这儿大家应该就想到了一个问题，那就是目标检测看似是一个问题，实际上是两个问题，这两个问题本质上不分先后，但是就我个人的知识，目前应该还没有先识别对象类别再进行定位的算法，我认为这主要是因为，目标检测问题往往一张图片上存在多个物体，同时识别多个物体种类非常复杂繁琐，而且成功率不高。

在YOLO之前，经典的目标检测算法，如RCNN、Fast-RCNN、Faster-RCNN等，其思路都是，先根据目标聚类提取ROI（Region of Interest），即可能带有物体的区域，尽可能保证每个区域有且仅有一个物体，然后对每个区域中的物体种类进行识别。这两步分别由两个神经网络来实现，一个是ROI提取，一个是目标识别。

接下来就说到YOLO的核心突破了。上面也提到，目标检测其实是两个问题，一般网络也是这样处理的，但这也就意味着，目标检测网络一般都很复杂，层数很多，运算速度很慢，处理频率很低，难以达到实时处理的效果。

所以，Joseph等人在构架YOLO网络时提出，不分步进行了，直接将对象位置与对象种类一起学习，用一个更轻便的网络来实现。从本质的本质上来讲，YOLO的核心就是这个，“You Look Only Once”，即通过一次学习直接定位对象并贴上标签。

当然，之后YOLO网络也经过了不断地改进，但是核心就是一次性学习，这里面当然也存在一些需要解决的算法问题，而且，初代的YOLO虽然在速度上已经大幅提升，但是离真正的在移动设备上实时应用还有一段距离，即使YOLO9000（YOLOv2）也不太行。不过，YOLOv4已经比较成熟了，大家可以自己到GitHub上看看源码。

下面，我将以个人理解的方式，介绍下YOLO网络中提出的一些具有创新性的算法思路：

YOLO

核心思路

首先，Joseph等人对输入图片做了一个分块的操作，将 $224\times224$ 的标准输入图片分成了 $7\times7$ 的区域，如果物体中心落入了某个网格单元，则由该网格单元负责检测该物体。每个单元格可以给出多个可能的边界框，但是存在既定上限，YOLOv1中给定的上限是2，即每个单元格最多给出两个预测边界框。

检测某物体时需要检测的参数包括边界框(x,y,w,h)、置信度(confidence)、对象概率(20类）。其中，(x,y)是边界框的中心坐标，采用单元格边长进行归一化到0-1之间，w,h则是边界框边长，采用图片边长归一化到0-1之间。

置信度则定义为 $Pr(Object)*IOU^{truth}_{pred}$ ，若该单元格存在物体， $P r (O b j e c t) = 1$ ，否则为0； $IOU^{truth}_{pred}$ 则表示预测框与真实框之间的并集比例（0-1之间）。

最后是对象概率，YOLOv1支持20类物体的检测，即对于每个物体，输出其分别属于20类物体的概率。

结合上述，最终YOLO网络输出的预测值是一个 $7\times7(单元格数)\times[2\times5(边界框参数)+20(对象概率)]$ 的张量。

至此，我们已经搞清了YOLO网络的根本思路与核心参数。剩下的就是一些网络结构与训练参数设定的问题了。

网络设计

YOLO网络的架构原型来自GoogleNet，具有24个卷积层与两个全连接层，完整的网络如上图所示。

训练（损失函数设计）

训练阶段也有一个核心问题，那就是损失函数的设计。由于YOLO的输出参数较多，损失函数的设计也会比较复杂。下面来简析以下YOLO网络的损失函数设计思路。

一开始，Joseph等人是打算用输出的和平方误差来作为损失函数，但是和平方误差并不符合最大化平均精度的目标。定位误差和分类误差的权重不应该相等，而且，在每个图像中，许多网格单元格不包含对象，导致这些单元格的置信度接近0，通常会压倒包含对象的单元格的梯度，导致模型不稳定，训练结果发散。

为了纠正这一点，Joseph等人增加边框坐标预测的损失权重，减少不包含对象的框的置信度预测的损失权重。权重调整通过 $\lambda_{coord}$ 和 $\lambda_{noobj}$ 来实现，设 $\lambda_{coord}=5$ ， $\lambda_{noobj}=0.5$ 。

和平方误差在大盒和小盒中同样加权误差，大盒子里的小偏差比小盒子里的小偏差影响小。为了部分解决这个问题，采用预测边框宽度w和高度h的平方根的误差来计算损失。

最终，损失函数设计如下：

简单解读一下： $1^{obj}_{i}$ 表示对象是否落在单元格 $i$ 中（0或1）， $1^{obj}_{ij}$ 则表示单元格 $i$ 中的第 $j$ 个预测边界框是准确的预测边界框（0或1）。

第一行是边界框中心坐标的误差；

第二行是边界框长宽的误差，由于边界框大小本身便会影响到误差的大小，为了降低边界框大小的影响，而采用了开方差来比较；

第三行是包含物体的单元格以及准确预测的边界框的置信度误差；

第四行是不包含物体的单元格中以及准确预测的边界框的置信度误差；

第五行是包含物体的单元格中，预测对象概率的各分项的误差平方之和。

至此，YOLO的几个核心问题其实已经讲完了，YOLO本身并不复杂，其重点在于创新性，但是YOLOv1无论是精度还是泛用性都还不尽如人意，所以下面再讲讲YOLO9000，可以更好地理解如何去改进YOLO网络。

YOLO9000

YOLO9000，顾名思义，其相对YOLO网络的核心优势在于将识别对象的种类从20类扩展到了9000类，另外进一步提高了网络的运行速度（简化网络）与检测精度。还有就是解决了原网络只能处理 $224\times 224$ 的输入的问题，YOLOv2能够处理任意尺寸的图片。

YOLO9000相较YOLO，究竟在哪些方面做出了改进是我们最关心的问题。一些非核心的改进，比如批处理规范化（Batch Normalization）、高分辨率的分类器（High Resolution Classifier）等。一些算法的核心改动如下：

Better（更准确）

带有锚盒的卷积（Convolutional With Anchor Boxes）

上文提到过，YOLO与Faster RCNN等网络不同，直接预测边界框的参数，而YOLOv2则返回去借鉴了Faster RCNN中用到的anchor思想。

原先的YOLO网络，每个单元格只预测两个边界框，因此一共只有 $7\times 7\times 2=98$ 个边界框，而YOLOv2引入Anchor boxes后，预测的box数量超过了1000。

box的增加是两方面的，一方面，YOLOv2的输入由 $224\times 224$ 增大到了 $416\times 416$ ，且最终的输出变成了 $13\times 13$ 的feature map。每个grid cell包含9个anchor box，一共就有1521个box。

顺便一提，Faster RCNN在输入为1000*600时，约有6000个box，增加box数量能有效提高定位准确率。

维集群（Dimension Clusters）

一般来说，box的尺寸是依靠经验设定，然后在训练过程中调整，而作者提出采用k-means的方法对Bounding Box做聚类，一开始就找出合适尺寸的anchor box，以此提高预测准确率。

然后作者发现，标准的k-means方法采用的是欧氏距离，在box尺寸较大时，差异也会比较大，但是我们希望差异与box尺寸本身无关，所以通过IOU定义了如下距离函数：

$d (b o x, c e n t r o i d) = 1 - I O U (b o x, c e n t r o i d)$

如图是VOC和COCO（两个测试集）的聚类框尺寸。最终他们通过实验选定了 $k = 5$ 作为召回率和模型复杂性的一个平衡点。

直接位置预测（Direct location prediction）

作者在引入anchor box时也遭遇了模型不稳定的问题，早期的迭代过程这个不稳定主要来自于预测box的(x,y)。

在诸如Faster RCNN一类基于Region proposal的object detection算法中，是通过预测offset来计算(x,y)值的，即：

$x=(t_x*w_a)-x_a$ $y=(t_y*h_a)-y_a$

其中， $x_a$ 与 $y_a$ 是anchor的坐标， $w_a$ 与 $h_a$ 是anchor的size，通过预测偏移量 $t_x$ 与 $t_y$ 来确定box的位置。

但是作者认为该方法并不适用于YOLO网络，因为任何anchor box都可能在图像中的任何点结束，在随机初始化的情况下，模型需要很长时间稳定预测出合理的偏移量。所以最终还是沿用了YOLOv1中直接预测(x,y)的方法。

前面提到YOLO9000的最终输出是一个 $13\times 13$ 的feature map，每个单元格预测5个bounding box（5个是由上面box先验预测决定的，5个bounding box已经能够比较准确的预测box尺寸了）。然后，每个bounding box包含5个坐标 $t_x,t_y,t_w,t_h,t_o)$ （ $t_o$ 类似于YOLO中的confidence）。

$c_x,c_y$ 表示一个cell到左上角的距离， $p_w,p_h$ 表示bounding box的宽高，最终的预测值就对应于：

$b_x=\sigma(t_x)+c_x$ $b_y=\sigma(t_y)+c_y$ $b_w=p_we^{t_w}$ $b_h=p_he^{t_h}$ $Pr(object)*IOU(b,object)=\sigma(t_o)$

光这么讲很难直观的理解，可以结合这张图看一看，黑色的虚线框是bounding box，蓝色的框是预测框。之所以搞得这么复杂主要是为了归一化方便后续计算。

细粒度特性（Fine-Grained Features）

YOLO9000输出一个13*13的feature map，对于大物体的预测已经足够了，但是对于细粒度特征识别度不够，Faster RCNN和SSD都在不同的粒度特征图上进行运行。而YOLO9000采用了一种新的方法，作者添加了一个passthrough层，从前面的层 $26\times 26$ 的feature map中提取特征，加到 $13\times 13$ 的feature map中，有点ResNet的意思，主要就是保留细粒度特征。

多尺度训练（Multi-Scale Training）

这一步主要是为了提高YOLO9000对图片尺寸的鲁棒性，简单说就是能够处理不同size的图片。

作者他们采用的方法是这样的，每隔几次迭代就改变网络。网络每10批随机选择新的图像尺寸，由于YOLO9000将图像size压缩了32倍，这个输入的size就选择了32的倍数，从 $\left \{320,352,\cdots,608 \right \}$ 中选取，最终使得该网络能够适应不同分辨率的图像。

而且，这种机制意味着网络可以在较小的规模下高速运行，在低分辨率下（ $288\times 288$ ），YOLOv2可以超过90帧，mAP与Faster RCNN几乎一样。

Faster（更快）

上面主要是在如何使网络更准确稳定的改进，而速度也是目标检测网络的一大追求。

DarkNet-19

作者做的第一项改进是使用DarkNet-19替代了YOLOv1中使用的GoogleNet，该网络只需要5.58 billion operation，而GoogleNet需要8.25，VGG甚至需要30.69。下图是DarkNet-19最终的结构，包含19个卷积层和5个max pooling层，最后用average pooling层代替全连接层进行预测。

除了直接看这个网络，我认为作者在论文中给出的一张从YOLO到YOLOv2的改进表格也很值得学习。

如图，作者分析了从YOLOv1到YOLOv2中做了哪些改进，以及这些改进对mAP的贡献。除了引入anchor box和新网络没有显著提高mAP外，不过anchor box和新网络的引入本身是为了提高召回率以及提速。

分类训练与检测训练

这里就是训练的一个小trick了，先在ImageNet上进行预训练，训练网络的目标识别能力，先实现准确的分类。

然后，开始移植网络，然后基于检测的数据再进行fine-tuning。首先把最后一个卷积层去掉，然后添加3个33的卷积层，每个卷积层有1024个filter，而且每个后面都连接一个11的卷积层，1*1卷积的filter个数根据检测的类数决定。

比如对于VOC数据，每个grid cell预测5个box，每个box有5个坐标值和20个类别值，所以每个grid cell有125个filter。

这里要注意，YOLOv1中，每个grid cell有30个filter，类别概率是由grid cell来预测的，也就是，每个单元格虽然有2个box，但是只预测一个物体的概率；而YOLOv2里面，每个box对应一个物体的类别概率，因此每个box对于25个预测值（5个坐标值+20个类别值）。

另外，作者还将最后一个33512的卷积层与倒数第二个卷积层相连，来利用细粒度特征。

Stronger（泛用性更强）

作者提出需要解决一个问题，那就是用于object classification的数据集很多，但是用于object detection的数据集相对就很少。作者提出除了构造数据集外，还可以采用WordTree和Joint classification and detection来解决。

这两个概念我也是第一次遇到，只能凭所学猜个一知半解。

首先，作者他们在训练过程中，混合使用了来自检测数据集和分类数据集的数据（分类数据集只有物体标签，但是没有物体位置）。当网络检测到输入为检测数据集数据时，可以以完整的loss函数进行反向传播，而输入为分类数据集数据时，只从体系结构的分类特定部分进行loss的反向传播。

这里面作者遇到了一个标签合并的问题，不同数据集对物体的划分程度可能不一样，如检测数据集一般只会分出“猫”“狗”，而分类数据集可能会细分出猫狗的品种。最终，作者采用了一个多标签模型来组合假定不互斥的数据集。

分级分类

即大标签套小标签，很好理解，如“猎狗”是“狗”的一类，这样一层层挖下去，形成一个WordTree或者WordNet，然后，预测出每个节点的概率，简单说就是，假如WordTree上存在这么一条分支：纽福克斯猎犬-猎犬-狗-哺乳动物-动物-物理对象，那么检测目标属于纽福克斯猎犬的概率就是：

$Pr(纽福克斯猎犬)=Pr(纽福克斯猎犬|猎犬)*Pr(猎犬|狗)*\cdots*Pr(动物|物理对象)$

作者在1000类的ImageNet上尝试构建这么一个WordTree，最终构建出了一个1369个节点的概率向量，用来表征检测目标属于某类物体的概率。

这种方法有一个核心优势，那就是当网络不确定目标是哪一种猎犬时，至少能够确定目标确实是一条狗，如果直接采用原来的标签分类，极易在不同的猎犬之间产生判断分歧，甚至导致误判，这样做虽然不能提高彻底的准确率，但是能保证大方向尽量不错。

【LeetCode 热题100】 23. 合并 K 个升序链表的算法思路及python代码 pljnb LeetCode热题100 算法 leetcode 链表
23.合并K个升序链表给你一个链表数组，每个链表都已经按升序排列。请你将所有链表合并到一个升序链表中，返回合并后的链表。示例1：输入：lists=[[1,4,5],[1,3,4],[2,6]]输出：[1,1,2,3,4,4,5,6]解释：链表数组如下：[1->4->5,1->3->4,2->6]将它们合并到一个有序链表中得到。1->1->2->3->4->4->5->6示例2：输入：lists=[
【Leetcode刷题随笔】59 螺旋矩阵 Poor_DayDreamer leetcode数组篇 Medium Tag leetcode 矩阵算法
1.题目描述给定一个正整数n，生成一个包含1到n2所有元素，且元素按顺时针顺序螺旋排列的nxn正方形矩阵matrix。可结合以下原题链接阅读。原题链接：59螺旋矩阵2.解题思路本题为模拟矩阵填充过程，不需要设计算法，只要完成正确的填充过程即可。首先初始化一个nxn的二维矩阵（涉及到动态内存分配），从矩阵左上角开始往顺时针填充，关键在于填充的转角处不要重复填充，所以对于每条边都要遵循严格的统一规则，
算法入门——二分法 Able Zhao 650829 算法数据结构 c++蓝桥杯
二分法真的很容易出错！！！在用dp学习之后总结了一下二分法二分查找关键总结一、核心思想分治策略：每次将搜索范围缩小一半，适用于有序数组。时间复杂度：O(logn)，比线性查找高效得多。二、关键点前提条件有序性：数组必须有序（升序或降序），否则需先排序（但排序成本O(nlogn)）。静态性：适合静态数据或低频更新的数据（高频更新建议用哈希表或树结构）。两种边界问题左边界：第一个等于目标的位置（或第一
大整数加、减法（Java实现）与debug找错 gfu_ java 算法数据结构
前言这篇文章主要内容涉及大整数加法的实现以及debug使用的简单记录。以前当我碰到程序报错时，总是想找别人帮忙，感觉debug太难了，自己根本看不懂。这次，自己在做一道算法题时，程序能够运行，结果却出错了。本来想找别人帮忙，但想着学习还是要脚踏实地，于是自己硬着头皮上了，先在网上了解如何debug，然后一步一步找到了错误所在。主要是想记录下第一次debug找到问题的快乐。一、大整数加法（java）
Web3身份验证技术对数据保护的影响研究清晨反侦测指纹浏览器社交媒体 web3 ClonBrowser 跨境电商隐私保护
Web3身份验证技术对数据保护的影响研究在这个数字化时代，我们的身份和数据安全比以往任何时候都更加重要。Web3技术以其去中心化和用户主权的核心理念，为个人数据的管理和保护提供了新的视角。本文将探讨Web3身份验证技术如何影响数据保护，并分析其对我们数字生活的影响。Web3身份验证技术简介Web3身份验证技术依托于区块链和先进的加密技术，如非对称加密算法和智能合约，为用户提供了一种全新的身份验证方
金三银四快过去一半了，是时候加把劲了后端go找工作面试
从复旦春招会的15000+岗位争夺战，到AI算法岗年薪百万的“神仙打架”，再到游戏行业20:1的残酷竞争比，今年的金三银四像极了《三体》里的黑暗森林：机会看似遍地，但稍有不慎就成了别人的“背景板”。但现实真的是“投晚了就凉了”吗？数据告诉你真相：智联研究院统计显示，算法工程师、机器人算法工程师等岗位需求同比激增44%，而中小企业的“捡漏窗口”才刚开启。这半个月，我整理了20+场面试实录（含小鹅通、
动态规划算法优化在资源分配问题中的应用 suyang199312 课程设计
摘要资源分配问题广泛存在于各类生产与管理场景，合理分配资源以实现效益最大化至关重要。本文深入剖析动态规划算法在资源分配问题中的应用，详细阐述其基本原理与常规解法，针对常规解法的不足提出创新优化思路，并给出具体实现步骤。通过实际案例分析与实验验证，展示优化后的动态规划算法在提升资源分配效率和效益方面的显著优势，为相关领域的决策制定提供有力支持。引言在经济、工程、计算机科学等众多领域，资源分配问题无处
加密算法的性能优化与安全性平衡研究 sigen520520 笔记
摘要在数字化信息飞速发展的当下，数据安全至关重要，加密算法作为数据保护的核心手段，其性能与安全性直接关乎信息系统的稳定运行。本文深入剖析常见加密算法，详细分析其性能指标与安全性特点，全面探讨在提升加密速度的同时确保安全的有效方法与实践，旨在为构建高效、安全的加密体系提供理论支撑与实践指导。引言随着互联网的普及和信息技术的广泛应用，数据在传输与存储过程中面临诸多安全威胁，如数据泄露、篡改、伪造等。加
Matlab 基于最小二乘向量机 LSSVM + NSGAII 多目标优化算法的工艺参数优化前程算法屋私信获取源码工艺参数优化 matlab 算法多目标优化
Matlab基于最小二乘向量机LSSVM+NSGAII多目标优化算法的工艺参数优化一、引言1.1研究背景与意义在现代工业生产中，工艺参数优化占据着举足轻重的地位。它犹如工业生产的核心引擎，直接影响着企业的生产效率、产品质量以及成本控制。从生产效率角度看，优化工艺参数能够显著提升生产速度。合理的参数设置可使生产设备处于最佳运行状态，减少不必要的停机与等待时间，让生产流程更加顺畅。以汽车制造业为例，通
获取网站流量的方法有哪些？ liuliangpuzi 互联网流量运营数据搜索引擎百度大数据
不同流量源的比例反映了网站所有者不同的管理策略和网站的发展阶段。那么，网站流量来源都有哪些？接下来小编就跟大家浅析下网站流量来源的三大途径，一起来看看吧！1、直接访问来源搜索引擎源和外部链源依赖于外部，因此通常存在较大的不确定性，如搜索引擎算法调整、业务模型调整、策略监管等，这可能会使网站的流量从每天数十万IP急剧下降到数千。对于小型商业站来说，从搜索引擎获取流量是一种更经济实惠、廉价的选择，但对
Matlab基于BP神经网络与NSGA-II的多目标工艺参数优化方法天天酷科研工艺参数优化 matlab 神经网络工艺参数优化
Matlab基于BP神经网络与NSGA-II的多目标工艺参数优化方法一、方法原理与框架BP神经网络的作用BP神经网络通过建立工艺参数与目标性能（如翘曲变形、收缩率、硬度等）之间的非线性映射关系，作为代理模型替代复杂的物理仿真或实验。其优势在于：能够处理多输入-多输出的复杂非线性关系，例如激光功率、扫描速度与熔覆层性能的关联。在注塑成型中，预测体积收缩率和翘曲变形的相对误差可控制在5%以内。通过正交
使用 TensorFlow 进行图像处理：深度解析卷积神经网络（CNN）一碗黄焖鸡三碗米饭人工智能前沿与实践 tensorflow 图像处理 cnn 人工智能机器学习 python ai
目录使用TensorFlow进行图像处理：深度解析卷积神经网络（CNN）1.什么是卷积神经网络（CNN）？CNN的基本结构为什么CNN适合图像处理？2.使用TensorFlow构建CNN2.1环境准备2.2加载并预处理MNIST数据集2.3构建CNN模型2.4编译和训练模型2.5评估模型3.CNN的优化与改进3.1使用数据增强3.2调整网络结构4.CNN在其他图像处理任务中的应用5.总结参考文献在
LeetCode 热题 100_跳跃游戏（78_55_中等_C++）（贪心算法） Dream it possible！ LeetCode 热题 100 leetcode c++贪心算法算法
LeetCode热题100_跳跃游戏（78_55）题目描述：输入输出样例：题解：解题思路：思路一（贪心算法）：代码实现代码实现（思路一（贪心算法））：以思路一为例进行调试题目描述：给你一个非负整数数组nums，你最初位于数组的第一个下标。数组中的每个元素代表你在该位置可以跳跃的最大长度。判断你是否能够到达最后一个下标，如果可以，返回true；否则，返回false。输入输出样例：示例1：输入：num
第十四届蓝桥杯省赛C++C组——子矩阵（蓝桥杯篇章完结撒花） Dawn_破晓蓝桥杯一个月速成日志蓝桥杯 c++c语言
本来想写的速成日志也没写多少，cb国二，最后一题树形DP调了一小时发现h数组没置-1，最后无果，如果没马虎可能有国一水平了，正儿八经准备用了两个月，因为要考研，每天只学2-3小时的算法，一共刷了300多道题吧，由于之前选过ACM（实验课因为周六去，懒得去还给我挂了）和算法分析课，所以还是有点基础的，如果算上一年前刷的题总共加起来也就400多道题吧。说一下历程吧，一年前的题都是老师布置的作业，迫不得
医疗行业的数据安全怎么防护？ jinan886 网络大数据安全开源软件数据分析
医疗行业的数据安全防护是一个系统工程，需要政府、医疗机构、技术提供商及社会各界共同努力，形成合力。通过构建全方位、多层次的数据安全防护体系，不断提升数据安全防护能力，才能为患者提供更加安全、高效的医疗服务，同时保障医疗行业的稳健发展。医疗行业的数据安全防护至关重要，以下是一些关键措施：1.数据加密传输加密：使用SSL/TLS等协议保护数据传输。存储加密：采用国标算法256位等上邦加密软件算法。2.
【C++篇】排队的艺术：用生活场景讲解优先级队列的实现 far away4002 C++c++stl 优先级队列向下（向上）调整算法
文章目录须知欢迎讨论：如果你在学习过程中有任何问题或想法，欢迎在评论区留言，我们一起交流学习。你的支持是我继续创作的动力！点赞、收藏与分享：觉得这篇文章对你有帮助吗？别忘了点赞、收藏并分享给更多的小伙伴哦！你们的支持是我不断进步的动力！分享给更多人：如果你觉得这篇文章对你有帮助，欢迎分享给更多对C++感兴趣的朋友，让我们一起进步！深入理解与实现：C++优先级队列的模拟实现1.引言在算法和数据结构中
实战LLM强化学习——使用GRPO（DeepSeek R1出圈算法）大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
引言近年来，深度强化学习（DRL）已经成为解决复杂决策问题的一个强有力工具，尤其是在自然语言处理（NLP）领域的广泛应用。通过不断优化决策策略，DRL能在大量数据中学习最佳行为，尤其是大型语言模型（LLM）在任务中展现出的巨大潜力。然而，随着模型规模的扩大和任务复杂性的增加，传统的强化学习算法开始暴露出训练效率低、收敛速度慢等问题。为了解决这些挑战，DeepSeek公司提出了一个新的强化学习算法—
量子密码学技术架构解析与程序员视角算法
量子计算威胁模型分析传统公钥密码体系（RSA/ECC）的安全假设基于：大数分解问题的计算复杂度（RSA）椭圆曲线离散对数问题（ECC）有限域离散对数问题（DSA）Shor算法的时间复杂度为O((logN)^3)，当量子比特数达到阈值时：2048位RSA可在8小时内破解（理论值）ECC-256的破解时间将降至多项式级别Grover算法对对称密码的影响：AES-256的有效安全性降至2^128哈希函数
Opencv计算机视觉编程攻略-第一节图像读取与基本处理 weixin_44242403 深度学习 opencv 计算机视觉
1.图像读取导入依赖项的h文件#include#include#include#include项目Valuecore.hpp基础数据结构和操作（图像存储、矩阵运算、文件I/O）highgui.hpp图像显示、窗口管理、用户交互（图像/视频显示、用户输入处理、结果保存）imgproc.hpp图像处理算法（图像滤波、几何变换、边缘检测、形态学操作）二读取图片Matimage;//图像矩阵std::co
什么是hessian矩阵红廉骑士兽矩阵线性代数算法机器学习 numpy
Hessian矩阵是一个数学概念，是用来表示函数关于其自变量的二阶偏导数的矩阵。它是一个实对称矩阵，对于多元函数来说，每一个元素是对应自变量关于该函数的二阶偏导数。Hessian矩阵在优化算法和最优化等领域有着重要的应用。
HPC综合-心得与笔记【19】 sakura_sea HPC and 3D Graphics Engine 线性规划
Dijkstra算法【2】基础距离数组dist，设置起点距离为0，其他节点距离为无穷大（∞）用最小堆创建优先队列，将起点放入队列。从队列中取出当前距离最小的节点u。遍历u的每个邻接节点v，计算从起点到v的路径长度：alt=dist[u]+weight(u,v)。如果altdist[u]:continue#遍历邻接节点forv,weightingraph[u].items():alt=dist[u]
神经网络之参数初始化硬水果糖人工智能神经网络人工智能深度学习
引言：参数初始化是训练深度神经网络的一个关键步骤，目的是给网络中权重（weights）和偏置（biases）赋予初始值。合适的参数初始化方法有助于提高训练速度、避免梯度消失/爆炸问题，并且加速网络的收敛。一、参数初始化目的避免梯度消失和梯度爆炸：在深度神经网络中，参数初始化对梯度流动非常重要。如果初始权重值太大或太小，可能导致梯度爆炸或梯度消失，从而增加网络的训练难度。加速收敛：良好的初始化可以帮
高通成都linux engineer intern 一面面经 han_xue_feng java
题解|#KNN算法#在*******里有个叫《题解--2024华南理工校赛.pdf》的文件高通成都linuxengineerintern一面面经两个面试官共25min就结束了，面试氛围还可以，问的很快。1.自我介绍2.问对高通了解多少3.对牛客鼠人传（第四十四集，2024/4/22）刷题：尝试补昨天D，题解看了半天似懂非懂，遂放弃改天再补。做题老是把复杂的问题想简单，简单的问题想复京东物流管理培训
《算法笔记》9.4小节——数据结构专题(2)-＞二叉查找树（BST）问题 A: 二叉排序树圣保罗的大教堂《算法笔记》算法
题目描述输入一系列整数，建立二叉排序数，并进行前序，中序，后序遍历。输入输入第一行包括一个整数n(1#include#include#include#include#include#include#include#include#include#include#include#include#include#defineINF0x3f3f3f3f#definedb1(x)coutleft);Fre
神经网络基础之正则化硬水果糖人工智能神经网络人工智能机器学习
引言：正则化（Regularization）是机器学习中一种用于防止模型过拟合技术。核心思想是通过在模型损失函数中添加一个惩罚项（PenaltyTerm），对模型的复杂度进行约束，从而提升模型在新数据上的泛化能力。一、正则化目的防止过拟合：当模型过于复杂（例如神经网络层数过多、参数过多）时，容易在训练数据上“记忆”噪声或细节，导致在测试数据上表现差。简化模型：正则化通过限制模型参数的大小或数量，迫
js逆向第4例：猿人学1初识-送分题，AES算法魔改，md5算法魔改，环境检测我是花臂不花 js逆向100例 javascript 算法开发语言
第二届猿人学js逆向大赛，本以为送分题分分钟搞定，没想到第一题就这么难。查看请求存在token加密参数，接下就是打断点找到加密点破解直接进入下一步函数可以看到如下代码vare=Date['now'](),f=a('crypto-js'),g='666yuanrenxue66',h=f['AES']['encrypt'](e+String(d),g,{'mode':f['mode']['ECB'],
《基于图神经网络的安卓应用检测系统设计与实现》开题报告大数据蟒行探索者毕业论文/研究报告神经网络 android 人工智能机器学习大数据深度学习 python
个人主页：@大数据蟒行探索者目录一、课题的研究目的和意义1.研究目的2.研究意义二、国内(外)研究现状及分析1.国内研究现状2.国外研究现状3.研究分析三、课题主要研究内容及可行性分析1.研究内容2.可行性分析四、研究方案和技术途径1.研究方案2.技术途径五、外部条件及解决办法1.开发环境2.解决办法六、主要参考文献一、课题的研究目的和意义1.研究目的随着智能手机的普及，安卓操作系统成为全球最为广
SMOTE算法的改进与扩展 Java 第一深情不平衡数据分类机器学习人工智能
一、SMOTE的改进算法1、Boderline-SMOTE只考虑分布在分类边界附近的少数类样本，并将其作为根样本首先通过k-NN方法将原始数据中的少数类样本划分成“Safe”、“Danger”和“Noise”3类，其中“Danger”类样本是指靠近分类边界的样本。对属于“Danger”类少数类样本进行过采样，可增加用于确定分类边界的少数类样本。这样做可以增加这些关键区域的少数类样本数量，使得模型在
DeepSeek的实际应用场景：AI技术如何赋能多领域创新 2501_91189350 人工智能
DeepSeek作为新一代智能技术平台，凭借其强大的算法能力和灵活的部署方式，正在多个行业掀起效率革命。本文将从真实案例出发，解析DeepSeek在不同场景中的落地应用。‌场景一：金融风控建模‌在信贷风险评估领域，传统模型存在数据维度单一、更新滞后等问题。某银行引入DeepSeek的‌动态特征工程模块‌，通过实时整合用户行为数据、社交网络信息等100+维度特征，成功将坏账识别准确率提升至98.5%
力扣算法Hot100——75. 颜色分类飞奔的马里奥算法 leetcode java
解法1：当然可以冒泡排序，时间复杂度O(n2n^2n2)解法2：单指针循环两次，第一次循环将所有的0交换到前面；第二次循环将所有的1交换到0的后面classSolution{publicvoidsortColorsBySinglePointer(int[]nums){intzeroCnt=0,p=0;for(inti=0;i
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

YOLO神经网络

YOLO神经网络

YOLO

核心思路

网络设计

训练（损失函数设计）

YOLO9000

Better（更准确）

带有锚盒的卷积（Convolutional With Anchor Boxes）

维集群（Dimension Clusters）

直接位置预测（Direct location prediction）

细粒度特性（Fine-Grained Features）

多尺度训练（Multi-Scale Training）

Faster（更快）

DarkNet-19

分类训练与检测训练

Stronger（泛用性更强）

分级分类

你可能感兴趣的:(神经网络学习,神经网络,算法)