object detection

YoLO V1算法解析

最近几天看目标检测的一篇论文 YOLO，这篇论文是发表于CVPR2016，作者是Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi。虽然这篇论文发表于2016年，但却不失是one stage中的一篇经典论文，V1也是YOLO系列的开山之作。

论文名称：You only look once unified real-time object detection

论文链接：https://arxiv.org/pdf/1506.02640.pdf

代码下载：https://github.com/pjreddie/darknet

预备知识

为了更好让大家理解YOLO V1，我接下来先介绍下分类，对象定位，对象检测它们之间的联系和区别。

图像分类：顾名思义，是一个输入图像，输出对该图像内容分类的描述的问题。

对象定位： 一般是指一张图有一个类别，有单个物体需要去定位，且物体较大，位于图片的中间。

目标检测：是指图片中有多个对象，有可能是不同种类，并且将图片中的多个对象位置输出

下面从分类——>对象定位——>YOLO讲。之所以这样讲，是为了方便大家理解YOLO V1的思想

由于分类比较简单，我就不详细解释，下面通过一幅图介绍下，

如图所示，输入一张图片，经过卷积操作和全连接操后，得到一个N*1维的列向量，其中N表示类别数。在这里我先假设N=4

分别是 car， dog，people，background。图片的理论输出是（1,0,0,0)T。

若我们想知道car的位置，我们该如何？这就涉及到了目标定位，如下图所示。

我们可以让神经网络多输出几个单元 0它们分别表示目标的中心位置，以及目标的宽高。所以上图的输出就变成了y=（pc,x,y,w,h,c1,c2,c3)T 其中pc表示输出的这个框是否含有目标，若有就pc=1，否则pc=0.相当于说明图像分类的background

关于目标定位的损失函数可以定义平方误差和为：

这里解释下，图片中没有目标时，即我们不关注 x,y,w,h,c1...

以上就是对分类，和目标定位的解释，可能存在偏差，望大家理解。接下来我正式介绍YOLO V1

YOLO V1算法介绍

传统的目标检测算法是将检测工作视作分类器（RCNN，Fast RCNN，Faster RCNN等)，而本文的作者在YOLO算法中把目标检测问题看作一个回归问题，也就是说用一个卷积神经网络结构就可以从输入图像直接预测Bbox和类别的概率。

YOLO算法的优点：1、YOLO的速度非常快。在Titan X GPU上的速度是45 fps（frames per second），加速版的YOLO差不多是155fps。2、YOLO是基于图像的全局信息进行预测的。这一点和基于sliding window以及region proposal等检测算法不一样。与Faster R-CNN相比，YOLO在误检测（将背景检测为物体）方面的错误率能降低一半多。3、YOLO学习目标的泛化能力强。4、准确率高，与其他的实时目标检测系统相比，map是其两倍以上。

缺点：

1、精度落后于最先进的检测系统（faster RCNN）

2、位置精确性差，对于小目标物体以及物体比较密集的也检测不好，比如一群小鸟。
3、YOLO虽然可以降低将背景检测为物体的概率，但同时导致召回率较低

YOLO过程很简单：如下图所示。结构上的主要特点就是unify detection ，即统一单个卷积网络同时预测这些盒子的多个边界框和类概率。YOLO在全图像上训练并直接优化检测性能。这就保证了模型的运行速度快，可以直接学习图像的全局信息，真正的end-to-end训练。You Only Look Once正是来源于此。

算法首先把输入图像划分为S*S的格子，然后对每个格子都预测B个Bounding boxes，每个Bounding box都包含5个预测值：x,y,w,h和confidence。其中0 ,是bounding box的中心坐标，与grid cell对于（即相对于grid cell的偏移值），w, h,进行归一化操作（分别除以整个图像的w和h，所以 0）。

在这里我说说自己对作者将图像划分为S*S的理解：在这里作者借鉴了目标定位的思想（这也就是我为什么开头介绍目标定位的原因），相当于图像中每个grid cell进行了分类定位，只不过将S*S进行一次操作，这就呼应了后面的S*S*(B*5+C)。我们可以这样想想，如果我们令S=1，而刚好图像中恰好只有一个目标，这不正是目标定位吗。不过这里也显露出YOLO V1中的一个缺点，就是一个grid cell 只能检测一类，而不能从一个grid cell中识别两类，不管一个grid cell的边界框数量B是多少，但却有可能从一个grid cell中框出一类中的两个目标（比如两个人在一个grid cell）。

还有我看来需要关于YOLO的博客评论，有许多读者对x,y,w,h 是怎么产生的？关于这个，我认为想x,y,w,h是网络中通过权重产生的，也就是一张图片经过卷积之后，自然 feature map中有一组对应数据，而最终通过整个网络，自然有对应的x,y,w,h 。至于confident就是通过Pr（Object）*IOU得到。B组的数值无法确定是否相同，因为B组的数值与权重相关，权重不同，对应的数值也就不同。

另外作者还对每个grid cell都预测C个类别的概率。作者在本篇论文中令S=7，B=2，C=20（因为PasCa VOC有20个类别），所以最后就有7*7*30个tensor。如下图所示

关于confidence的计算公式：

关于这个公式的解释：因为每个bbox都有一个对应的confidence ，如果grid cell里面没有object ，则confidence=0，若有目标存在，则confidence等于预测的Bbox和ground truth的IOU的值，公式如上。所以如何判断一个grid cell中是否包含object呢？答案是：如果一个object的ground truth的中心点坐标在一个grid cell中，那么这个grid cell就是包含这个object，也就是说这个object的预测就由该grid cell负责。

每个grid cell都预测C个类别概率，表示一个grid cell在包含object的条件下属于某个类别的概率，公式如下：

注意，这个条件类别概率针对的是grid cell，不管grid cell的边界框的数量B是多少。在这里也就说明了为什么一个grid cell只能检测一类（就假设，一个grid cell有两个class，但在这里却只能说明这个grid cell是哪一类，而不是属于这两类）

网络结构

作者受到GoogleNet图像分类模型的启发。设计的网络有24个卷积层，后面是2个全连接层。作者只使用1×1降维层，后面是3×3卷积层，这与Lin等人[22]类似，而不是GoogLeNet使用的Inception模块。完整的网络如图3所示

另外两个小细节：1、作者先在ImageNet数据集上预训练网络，而且网络只采用fig3的前面20个卷积层，输入是224*224大小的图像。然后在检测的时候再加上随机初始化的4个卷积层和2个全连接层，同时输入改为更高分辨率的448*448。2、Relu层改为pRelu，公式如下：

损失函数：损失函数是这篇论文的精华所在，里面有几个细节，我会下面一一介绍。

作者采用sum-squared error的方式把localization error（bounding box的坐标误差）和classificaton error整合在一起。细节1 ：如果二者的权值一致，容易导致模型不稳定，训练发散。因为很多grid cell是不包含任何对象的，这样的话很多bbox的confidence score为0（就比如论文图2 ，只有三个grid cell 有对象，其他46个均没有对象，如果权重相同，则会导致偏差出现）。所以采用设置不同权重方式来解决，一方面提高localization error的权重，另一方面降低没有object的box的confidence loss权值，loss权重分别是5和0.5。而对于包含object的box的confidence loss权值还是原来的1。公式如下

这里详细讲一下loss function。在loss function中，前面两行表示localization error(即坐标误差)，第一行是box中心坐标(x,y)的预测，第二行为宽和高的预测。细节2 ：用宽和高的开根号代替原来的宽和高，这样做主要是因为相同的宽和高误差对于小的目标精度影响比大的目标要大。举个例子，原来w=10，h=20，预测出来w=8，h=22，跟原来w=3，h=5，预测出来w1，h=7相比，其实前者的误差要比后者小，但是如果不加开根号，那么损失都是一样：4+4=8，但是加上根号后，变成0.15和0.7。第三、四行表示bounding box的confidence损失，就像前面所说的，分成grid cell包含与不包含object两种情况。细节3：这里注意下因为每个grid cell包含两个bounding box，所以只有当ground truth 和该网格中的某个bounding box的IOU值最大的时候，才计算这项。第五行表示预测类别的误差，细节4：注意前面的系数只有在grid cell包含object的时候才为1。具体细节参考最后的参考资料3

还是以论文2为例：在计算该图的损失时：坐标误差计算只计算了3次，含object的Bbox的confidence预测也只计算了3次，不含object的Bbox的confiden测则95次，类别损失计算也只计算了3次。

所以具体实现的时候是什么样的过程呢？

训练的时候：输入N个图像，每个图像包含M个objec，每个object包含4个坐标（x，y，w，h）和1个label。然后通过网络得到7*7*30大小的三维矩阵。每个1*30的向量前5个元素表示第一个bounding box的4个坐标和1个confidence，第6到10元素表示第二个bounding box的4个坐标和1个confidence。最后20个表示这个grid cell所属类别。注意这30个都是预测的结果。然后就可以计算损失函数的第一、二、五行。至于第三四行，confidence可以根据ground truth和预测的bounding box计算出的IOU和是否有object的0,1值相乘得到。真实的confidence是0或1值，即有object则为1，没有object则为0。这样就能计算出loss function的值了。

测试的时候：输入一张图像，跑到网络的末端得到7*7*30的三维矩阵，这里虽然没有计算IOU，但是由训练好的权重已经直接计算出了bounding box的confidence。然后再跟预测的类别概率相乘就得到每个bounding box属于哪一类的概率。过程如下

针对测试时 Bbox产生的confidence理论解释过程如下公式

它为我们提供了每个框特定类别的置信度分数。这些分数编码了该类出现在框中的概率以及预测框拟合目标的程度。也就是说这个公式让我们知道confidence与IOU的值成线性相关，同时也作为框中的类别的概率，计算过程如下：

即得到每个bounding box属于哪一类的confidence score。也就是说最后会得到20*（7*7*2）=20*98的score矩阵，括号里面是bounding box的数量，20代表类别。接下来的操作都是20个类别轮流进行：在某个类别中（即矩阵的某一行），1.将得分少于阈值（0.2）的设置为0，2.再按得分从高到低排序。3. 用NMS算法去掉重复率较大的bounding box（NMS:针对某一类别，选择得分最大的bounding box，然后计算它和其它bounding box的IOU值，如果IOU大于0.5，说明重复率较大，该得分设为0，如果不大于0.5，则不改；这样一轮后，再选择剩下的score里面最大的那个bounding box，然后计算该bounding box和其它bounding box的IOU，重复以上过程直到最后）。经过对矩阵的每一行操作之后，最后是从矩阵的每一列中（即每个bounding box），选取score中最大的非零值，那么这个bounding box就是这个socre对应的类别，如果没有大于0的score，说明这个bounding box里面没有物体，跳过即可。具体细节参考最后的参考资料3

关于NMS，参考资料5

参考资料：

1. https://blog.csdn.net/u014380165/article/details/72616238

2. https://blog.csdn.net/guleileo/article/details/80581858

3. https://www.bilibili.com/video/av23354360/?p=3

4. https://zhuanlan.zhihu.com/p/24916786

5. 吴恩达在网易云课程中卷积神经网络的视频

6. https://blog.csdn.net/shuzfan/article/details/52711706

深入解析 React 最新特性：革新、应用与最佳实践赵大仁前端 ReactNative react.js 前端前端框架
深入解析React最新特性：革新、应用与最佳实践1.引言React作为前端开发的核心技术之一，近年来不断推出新的API和优化机制，从ConcurrentRendering（并发模式）到ServerComponents（服务器组件），都在不断提升开发体验和应用性能。本文将深入解析React最新特性，包括React18并发模式、useTransition、useDeferredValue、ReactS
CIR-DFENet：结合跨模态图像表示和双流特征增强网络进行活动识别是Dream呀神经网络计算机视觉人工智能神经网络深度学习
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学业升学和求职工作的先行者！【优惠信息】•新专栏订阅前200名享9.9元优惠•订阅量破200
《Operating System Concepts》阅读笔记：p309-p330 操作系统
《OperatingSystemConcepts》学习第29天，p309-p330总结，总计22页。一、技术总结1.Python中的并发编程(1)semaphoreclassthreading.Semaphore(value=1)。(2)conditionvariableclassthreading.Condition(lock=None)书上使用的是Java,因本人在开发工作中使用的是Pytho
HarmonyOS实现如图简单页面 2301_80891383 鸿蒙系统开发 typescript
@Entry@ComponentstructIndex{@Statemessage:string='';build(){Column(){Row(){Column(){Text('玩一玩').fontSize(18).fontWeight(FontWeight.Bold)Text('签到兑礼|超多大奖超好玩').fontSize(12).fontColor('#999')}.margin(10).
鸿蒙5.0版开发：UI界面[email protected] (componentUtils) 星星不闪包退1 ArkTS 鸿蒙5.0 ArkUI harmonyos 华为 android 鸿蒙前端 UI
往期鸿蒙全套实战文章必看：鸿蒙开发核心知识点，看这篇文章就够了最新版！鸿蒙HarmonyOSNext应用开发实战学习路线鸿蒙HarmonyOSNEXT开发技术最全学习路线指南鸿蒙应用开发实战项目，看这一篇文章就够了（部分项目附源码）@ohos.arkui.componentUtils(componentUtils)提供获取组件绘制区域坐标和大小的能力。说明：从APIVersion10开始支持。后续
论文写作篇#6：在C会里，YOLO文章的摘要怎么写？Conclusion怎么写？摘要和Conclusion有哪些区别？ hjs_deeplearning YOLO 人工智能深度学习计算机视觉
前两次学习中，我们学习了C会YOLO论文的结构和消融实验的写法论文写作篇#5：想发C会，YOLO的消融实验AblationExperiment/Study怎么写？-CSDN博客https://blog.csdn.net/hjs314159/article/details/146261468?spm=1001.2014.3001.5502论文写作篇#4：YOLO还能发C会论文吗？C会论文的YOLO文
【贪心算法5】 m0_46150269 贪心算法算法
力扣738.单调递增的数字链接:link思路遇到c[i]>c[i+1]则c[i]–,然后就是给c[i+1]赋值‘9’；需要注意的是star初值问题，可见注释部分。classSolution{publicintmonotoneIncreasingDigits(intn){Strings=String.valueOf(n);char[]c=s.toCharArray();intstar=c.lengt
基于纯视觉的 GUI 代理的屏幕解析工具（OmniParser） deepdata_cn 应用软件 GUI
OmniParser是一款开源工具，可通过解析用户界面截图生成结构化数据，助力打造视觉驱动的GUI自动化代理，赋能跨平台交互。一、技术原理1.数据集构建：从流行网页和应用中提取数据，构建可交互图标检测数据集和图标描述数据集，为模型训练提供基础。2.检测模型：使用YOLOv8模型在可交互图标检测数据集上进行微调，能够识别和定位用户界面中的可交互区域，如按钮、图标等。3.描述模型：利用BLIP-v2模
cv君独家视角 | AI内幕系列七：EfficientViT模型：基于多尺度线性注意力模块，实现高效的高分辨率密集预测 cv君 cv君独家视角 AI内幕系列原创项目级实战项目深度学习与计算机视觉精品 1024程序员节 EfficientViT 高分辨率密集预测任务高分辨率视觉模型 Transformer 人工智能计算机视觉
专题概况cv君独家视角|AI内幕系列是一个专注于人工智能领域的深度专题，旨在为读者揭开AI所有领域技术的神秘面纱，展示其背后的科学原理和实际应用。通过一系列精心策划的文章，我们将带您深入了解AI的各个领域，从计算机视觉到文本语音等多模态领域，从基础理论到前沿技术，从行业应用到未来趋势。无论您是AI领域的工程师或者专家，还是对这一领域充满好奇的读者，这个系列都将为您提供高价值的见解和启发，为您带来横
HarmonyOS NEXT＜HarmonyOS第一课＞ DevEco Studio的使用DevEco Studio的使用试题答案芦苇花开鸿蒙学习试题集鸿蒙系统鸿蒙
【习题】DevEcoStudio的使用未通过/及格分80/满分100判断题1.如果代码中涉及到一些网络、数据库、传感器等功能的开发，均可使用预览器进行预览。正确(True)错误(False)正确答案：错误(False)2.module.json5文件中的deviceTypes字段中，配置了phone，tablet，2in1等多种设备类型，才能进行多设备预览。正确(True)错误(False)正确答
java24种设计模式目录,为大家整理最全的24种设计模式详解，必收藏高补 java24种设计模式目录
设计模式六大原则单一职责原则一个方法尽可能做一件事情，一般来说不应该让一个方法承担多个职责。单一职责原则的英文名称是SingleResponsibilityPrinciple，简称是SRP。单一职责原则的定义是：应该有且仅有一个原因引起类的变更。SRP的原话解释是：Thereshouldneverbemorethanonereasonforaclasstochange.单一职责原则提出了一个编写程
鸿蒙的 Stage 模型淼学派对 harmonyos 华为
鸿蒙的Stage模型在鸿蒙Next开发中，Stage模型是应用开发的核心架构之一，它为开发者提供了一种高效、灵活的方式来构建分布式应用。本文将详细介绍鸿蒙Stage模型的基本概念、应用配置文件的使用、UIAbility组件的介绍以及如何通过Stage模型开发复杂应用。一、Stage模型的基本概念（一）什么是Stage模型？Stage模型是鸿蒙HarmonyOSAPI9开始新增的应用模型，是目前主推
Django Neomodel：将Django与Neo4j图数据库无缝集成纪嫣梦
DjangoNeomodel：将Django与Neo4j图数据库无缝集成项目地址:https://gitcode.com/gh_mirrors/dj/django-neomodel项目介绍DjangoNeomodel是一个开源模块，旨在通过neomodel库，将Django框架与Neo4j图数据库结合使用。这个模块为开发者提供了一个强大的工具，使得在Django项目中使用Neo4j图数据库变得简单
Different number of columns sunyaox flink flink异常
org.apache.flink.client.program.ProgramInvocationException:Themainmethodcausedanerror:Columntypesofqueryresultandsinkforregisteredtable‘photoTradeInfoHive.db_audit.ods_photo_trade’donotmatch.Cause:Dif
向量库集成指南三月七꧁ ꧂ langchain+llm 集成学习自然语言处理语言模型机器学习人工智能 gpt llama
文章目录向量库集成指南Chroma集成Pinecone集成MiLvus集成向量库集成指南向量库是一种索引和存储向量嵌入以实现高效管理和快速检索的数据库。与单独的向量索引不同，像Pinecone这样的向量数据库提供了额外的功能，例如，索引管理、数据管理、元数据存储和过滤，以及水平扩展。特别是在处理大数据和复杂查询时，向量库在多种应用场景中发挥着关键作用。其中，语义文本搜索是一个典型的应用，用
C++每日一练——day 1 「已注销」 #C++每日一练 C++c++
年轻人，你渴望拥有C++练习题吗？？？从这篇博文开始，我每天都会更新一个C++主要知识点题目，并附上解析！~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~Dayone——解密题目描述给你这样一个任务：解密一份被加密过的文件。经过研究，你发现了加密文件有如下加密规律（括号中是一个“原文一>密文”的例子）
Caddy2使用阿里云DNS申请https证书，利用阿里云DNS境内外不同解析给Gone文档做一个同域名的国内镜像站点 dapeng-大鹏大鹏运维记录 caddy https docker docker-compose
我从头到尾实现了一个Golang的依赖注入框架，并且集成了gin、xorm、redis、cron、消息中间件等功能；自己觉得还挺好用的，并且打算长期维护！github地址：https://github.com/gone-io/gone文档原地址：https://goner.fun/zh/guide/auto-gen-priest.html请帮忙在github上点个⭐️吧，这对我很重要；万分感谢！！
Gone v2 提供 gRPC服务 dapeng-大鹏 Gone框架介绍 golang gRPC gone
项目地址：https://github.com/gone-io/gone原文地址：https://github.com/gone-io/goner/blob/main/grpc/README.md文章目录编写proto文件，生成golang代码编写服务端代码注册客户端编写配置文件测试总结首先创建一个grpc目录，在这个目录中初始化一个golangmod：mkdirgrpccdgrpcgomodin
Gone 从 v1 到 v2 的更新分析 dapeng-大鹏 Gone框架介绍 gone 依赖注入后端框架
项目地址：https://github.com/gone-io/gone原文地址：https://github.com/gone-io/gone/blob/main/docs/gone-v1-to-v2-analysis.md文章目录1.概念简化与术语变更2.接口重新设计2.1组件定义的简化2.2组件加载方式的统一2.3生命周期方法的优化3.依赖注入逻辑重写3.1注入标签的简化3.2依赖注入查找流
Python中三种表示NA的方式风语者666 python
Python中三种表示NA的方式#-*-coding:utf-8-*-importnumpyasnpimportpandasaspd#data_frame=np.load('a.npy',allow_pickle=True)#print(data_frame.columns)df=pd.DataFrame({'one':[1,2,3,pd.NA]})df=pd.DataFrame({'one':[
[免费送Claude账号密码]ChatGPT的平替——Claude赠送2个免费Claude账号密码卡密！（内附Claude注册教程） NBA首席形象大使阿坤日常小功能实现人工智能 chatgpt claude gpt-3
一、账号说明1.账号格式：登录邮箱—密码—验证邮箱2.登录方式：访问Claude官网，选择登录，输入登录邮箱、密码不多叭叭，上账号！账号1：登录邮箱:[email protected]—登录密码:c934dfqcwuz8g—验证邮箱:[email protected]账号2：登录邮箱:[email protected]—登录密码:jx68
Gone v2 中 Gone-Gin 性能测试报告 dapeng-大鹏 Gone框架介绍 gin gone 依赖注入请求参数依赖注入
项目地址：https://github.com/gone-io/gone原文地址：https://github.com/gone-io/goner/blob/main/gin/benchmark_test.mdGone-Gin性能测试报告文章目录Gone-Gin性能测试报告简介实现原理核心组件工作流程响应处理机制性能测试测试环境测试用例测试代码示例请求结构体定义Gone-Gin处理函数原生Gin处
mybatisSql拼接报错严欣铷 sql mybatis 数据库
Column'id'inwhereclauseisambiguous;nestedexceptionisjava.sql.SQLIntegrityConstraintViolationException:Column'id'inwhereclauseisambiguousSELECTs.id,s.serial_no,s.material_requisition_id,s.material_requ
pjsip dtmf发送和接收（pjsua）小gpt& Pjsip 音视频 qt c++
DTMF（双音多频，Dual-ToneMulti-Frequency）是一种用于电话系统的信号技术，通过组合两个不同频率的音频信号来表示数字和符号。以下是DTMF的主要使用背景和应用场景：电话拨号DTMF最常见的用途是电话拨号。当用户按下电话键盘上的数字或符号时，电话会生成两个特定频率的音调，交换机接收并解码这些信号以确定用户拨打的号码。交互式语音应答（IVR）系统DTMF广泛用于IVR系统，用户
YOLOv12模型详解及代码复现清风AI 深度学习算法详解及代码复现计算机视觉 YOLO 人工智能机器学习神经网络 python 算法
算法背景在计算机视觉领域不断发展壮大的背景下，YOLOv12算法应运而生。这一突破性成果源自JosephRedmon和AliFarhadi等研究人员在华盛顿大学的开创性工作。他们的目标是解决实时物体检测这一关键问题，在速度和精度之间寻求最佳平衡。YOLOv12延续了前作YOLOv1的成功理念，将其定位为一种回归问题，而非传统的区域提议+分类方法。这种创新方法不仅简化了整个检测过程，还显著提高了处理
YOLOv8涨点大全总结（源码）清风AI 深度学习 YOLO 计算机视觉神经网络人工智能 python
（需要全部源码请私信或留言）性能指标在探讨YOLOv8的性能提升之前，我们需要明确评估其性能的主要指标。这些指标不仅是衡量模型优劣的标准，也是后续改进工作的出发点。常见的性能指标包括：指标名称含义mAP5050%交并比阈值下的平均精度mAP50-9550-95%交并比阈值范围内，步长为5%的平均精度Precision预测正确的正样本占总预测正样本的比例Recall预测正确的正样本占实际正样本总数的
flutter 解决 iPhone X 等刘海屏手机导航栏/底部黑线遮挡布局的方法头发还没秃a Flutter SafeArea 导航栏/底部黑线遮挡刘海屏 iPhone X TabBar背景
在上一节（改变TabBar背景颜色的方法）中有发现的一个问题：在iPhoneX等刘海屏手机中，会出现页面被导航栏或者底部黑线遮挡的问题：解决办法有两种：使用以下代码获取手机状态栏和底部黑线的高度，然后设置Widget的Padding或者Margin：//获取状态栏高度（上边距）finaldoubletopPadding=MediaQuery.of(context).padding.top;//获取
《今日AI-人工智能-编程日报》小亦工作室人工智能
1.AI行业动态1.1Manus通用智能体初成型，开启AIAgent新时代中泰证券发布研报称，首款通用型AI智能体Manus已问世，能够将复杂任务拆解为可执行的步骤链，并在虚拟环境中灵活调用工具，标志着AI从“Reasoner”走向“Agent”阶段。Manus的成功引发了开源复现潮，DeepSeek模型已被整合到OWL项目中，并在GAIA基准测试中表现接近Manus。1.2DeepSeek-R2
Git 本地常见快捷操作笔沫拾光 git
Git本地常见快捷操作1.基本操作操作命令初始化Git仓库gitinit查看Git状态gitstatus添加所有文件到暂存区gitadd.添加指定文件gitadd提交更改gitcommit-m"提交信息"修改最后一次提交信息gitcommit--amend-m"新提交信息"显示提交历史gitlog--oneline--graph显示修改的文件gitdiff2.分支管理操作命令查看当前分支gitbr
微信小程序开发---的生命周期函数 J总裁的小芒果微信小程序小程序
onLaunch：小程序初始化完成时触发，全局只触发一次。适合进行一些初始化操作。onShow：小程序启动或者从后台进入前台时触发。每次小程序进入前台时都会触发。onHide：小程序从前台进入后台时触发，适合做一些暂停操作或存储数据等。onError：小程序发生错误时触发，接受一个错误信息作为参数，用于捕获小程序中的错误。onPageNotFound：小程序页面不存在时触发，通常是用户访问了一个不
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST

YoLO V1算法解析

预备知识

YOLO V1算法介绍

网络结构

你可能感兴趣的:(目标检测算法,计算机视觉,目标检测,one,stage,YOLO)