zyw2002

目标检测 —— YOLOv1论文精读

YOLOv1论文下载
YOLOv1代码下载 darknet版、tensorflow版、caffe版
官方博客

文章目录

论文
- Abstract (摘要)
- 1、Introduction（介绍）
- 2、Unified Detection(统一检测)
- - 2.1 Network Design (网络架构)
  - 2.2 Training(训练)
  - 2.3 Inference (推论)
  - 2.4 Limitations of YOLO(局限性)
- 3、 Comparison to Other Detection Systems
- 4、 Experiments （实验）
- 5、Real-Time Detection In The Wild （现实中的实时检测）
- 6、Conclusion（结论）

论文

Abstract (摘要)

本文提出一种新的物体检测的方法：You Only Look Once(YOLO) 它的名字也侧面说明了YOLO算法的优点在于检测速度快。
原先的物体检测算法如R-CNN, fast R-CNN, 将检测算法转换为分类问题（classify）; YOLO算法将检测问题转换为回归问题（regression）,包括检测框（Bouding boxes）位置和检测框中物体所属类别(Class)。
YOLO检测的过程只有一个CNN网络，直接输出检测框的位置和所属的类别，因此也称为端到端（end-to-end)或单阶段(one-stage)的检测方法。
与之对应的是两阶段（two-stage）的检测方法，如Faster-rcnn Mask-Rcnn系列。其中第一阶段得到预选框（proposal）,第二阶段输出结果，如下图所示。

这一段就是先夸YOLO的检测速度非常快。举例：标准版（base yolo）可以每秒处理45帧图片(45FPS)，精简版的（fast yolo）检测速度可以达到155 FPS, 检测精度是同类实时检测算法的两倍。
相较于其他的先进的物体检测系统，YOLO在物体定位（location）时更容易出错，但是在背景上错误预测出正例（false positives）的情况会少一些。【通俗的说就是：YOLO可以较为准确的判断有没有目标物体，但是对于预测目标物体的具体位置会有一定的偏差】
YOLO比DPM、R-CNN等物体检测系统能够学到更加抽象的物体的特征。

1、Introduction（介绍）

第一段主要讲了人类视觉的三大功能：what(分类)，where(定位)，how(场景)，然后介绍计算机视觉在自动驾驶上的应用。

目前的检测算法将检测问题转化为分类问题。即在图像中找到不同位置（location）和尺寸（scale）的检测框，然后在检测框内的物体进行分类（classfy）。
例如DPM算法采用滑动窗口（sliding window）在整张图像上均匀滑动，然后用分类器来评估滑窗内是否有物体。

R-CNN方法使用region proposal（区域建议）来生成整张图像中可能包含待检测物体的可能的 bounding boxes。然后在这些所建议的检测框（proposed boxes）执行分类器。
在分类结束后，对bouding boxes 进行后加工（post-processing）使之更加精确：包括消除重复的检测框、并基于整个场景中的其他物体重新对boxes进行打分。
但是缺点在于这个优化过程执行起来很慢且困难，因为每一个环节都是分开训练的。

这段很重要,点明了YOLO的核心思想。YOLO算法将目标检测问题转化为单一的回归问题(regression problem)。给卷积网络输入的是图像的像素（image pixels）, 直接输出的是检测框的位置坐标(bounding box coordinates)和类别概率(class probability)。
通过YOLO算法可以预测出这个物体是什么（what），在哪里(where)

YOLO算法很简洁：如上图，将一张图像输出卷积网络(convolutional network) 就可以同时预测出多个检测框和每个检测框所属的类别概率。
YOLO用整张图片进行训练，并且可以直接优化检测的性能（optimize detection performance）
下面就是分条介绍这种统一模型较传统模型的优点。

第一个优点就是速度快： YOLO 可以以小于 25 毫秒延迟的处理速度处理实时视频；准确度高：其mAP值（mean average presition）是其他实时检测算法的两倍。

第二个优点是YOLO算法可以更好的“看到”全局的信息。它通过结合局部的特征和上下文信息来进行检测。
因此，与R-CNN相比较，YOLO犯背景错误【background error: 将背景错误的认成是物体】的数量更少。

第三个优点：YOLO学到物体更泛化的特征表示。在这里作者举了个例子，让YOLO在自然景观的图片上训练然后在抽像的艺术图片上去测试，YOLO 的表现要优于 DPM、R-CNN。
因此，YOLO算法的适应性更强，当其应用到一个新的领域或者有非法的输入，也很很难导致网络的崩溃。

这里提及了YOLO的两个缺点：准确性仍然落后于最先进的检测系统，对于小目标的检测效果不好。

2、Unified Detection(统一检测)

我们将目标检测的不同环节统一为一个神经网络。通过网络对整张图片提取的特征来同时预测所有的检测框的位置和类别。
这种端到端的训练方式可以很好的平衡检测的速度和精度。

我们的检测系统将输入的图片划分成S*S的网格，如果一个物体的中心落在某个网格单元（grid cell）内，则该网格单元负责检测该物体。

每个检测框负责预测B个检测框(Bounding Box),和每个检测框的置信度得分（confidence score）。这个置信度得分反应了在该检测框内含有物体和物体预测类别的把握有多大。
置信度定义为 $Confidence=Pr(Object)*IOU_{pred}^{truth}$ 。其中， $P r (O b j e c t)$ 包含物体时取值为1，否则为0。 $IOU_{pred}^{truth}$ 计算的是预测框(predicted box)和真实框(ground truth)之间的交并比。 $U=\frac{S_{ {intersection}}}{S_{{union }}}$

每一个检测框包含5个预测值: $x, y, w, h, c o n f i d e n c e$
(x,y) 表示检测框的中心点相对于网格单元的位置坐标。
w,h分别表示检测框相对于整幅图片的宽和高
confidence表示预测框和真实框之间的交并比（IOU）

每个网格单元要预测C个条件类别概率（conditional class probability）。用条件概率表示为 $Pr(Class_i|Object)$ ：在这个网格单元包含物体的情况下，该物体属于类别 $i$ 的概率。
每个网格单元只预测一组类别概率，每组包含C个类别，而不考虑检测框的数量B。
在测试阶段，将条件类别概率【 $Pr(Class_i|Object)$ 】和检测框的置信度【 $Confidence=Pr(Object)*IOU_{pred}^{truth}$ 】相乘。得到对于某个检测框属于某种类别的可信度得分。
这个得分既反应了反映了bounding box是否含有该类别的Object和bounding box坐标的准确度。
$\operatorname{Pr}\left(\text { Class }_{i} \mid \text { Object }\right) * \operatorname{Pr}(\text { Object }) * \mathrm{IOU}_{\text {pred }}^{\text {truth }}=\operatorname{Pr}\left(\text { Class }_{i}\right) * \mathrm{IOU}_{\text {pred }}^{\text {truth }}$
将图片划分成S*S的网格，对于每个网格单元预测B个检测框，每个检测框有5个值：x,y,h,w,confidence。每个网格单元预测C种类别。因此最终的预测值是S*S*(B*5+C)维度的张量（Tensor）

❗️❗️❗️ 特别注意

由于输出层是全连接层，因此检测和训练时图像输入的分辨率大小应该一致。

从每个网格单元预测B个检测框中选择IOU最高的检测框作为输出。因此在一个网格单元包含多个物体或者有重叠时，只能检测出一个物体。

2.1 Network Design (网络架构)

作者采用PASCAL VOC数据集来对该模型进行评估。网络的初始卷积层(convolutional layers)用来提取特征(extract feature)，而全连接层（fully connected layers）输出预测的概率和坐标。
FAST YOLO比YOLO有更少的卷积层和更小的滤波器（filter），但是训练和预测时的参数是相同的。
YOLO网络结构借鉴了 GoogLeNet 。YOLO检测网络包括24个卷积层和2个全连接层，如下图所示。
GoogLeNet架构如下：

YOLO架构如下：
最终得到7*7*30的张量。划分的网格为7*7, 每个网格对应有2个检测框，每个检测框有5个预测值：x,y,w,h,confidence。一共有20个类别,因此每个网格共有30=(5*2+20)个预测值。

动图展示：地址

2.2 Training(训练)

预训练分类网络：在1000分类的数据集上进行预训练。这个网络的结构为：Figure3中的前20个卷积网络+平均池化层（average-pooling layer)+全连接层（ fully connected layer）
训练检测网络：根据前人的经验，为预训练添加卷积层和全连接层可以提升检测的性能。因此在原先的基础上添加4个卷积层和2个全连接层，并随机初始化权重。检测要求细粒度的视觉信息，所以把网络输入把224224变成448448。

网络的最后一层输出的是类被概率和检测框的坐标。将检测框的宽高分别除以图像的宽和高，使之取值范围位于[0,1],从而进行归一化；将检测框的位置坐标用相对于网格单元的偏移量来表示，来进行归一化（normalize）。

最后使用一个线性激活函数（linear activation function），公式如上图所示,称为Leaky RELU。与RELU 函数唯一的区别在于，当x小于0时，取值为0.1x 而不是0。这样可以解决梯度消失的问题。

如果采用平方和误差（sum-squared error）来对模型进行优化，它并不完全符合我们最大化平均精度(average precision)的目标。
问题1：因为计算平方和误差时，定位和分类的误差权重相等，但是这样做是不符合理想情况的。因为定位的只有8维，而分类的有20维度，让两者同等重要是不合理的。
问题2：在一张图像中，许多网格单元不包含任何的对象，其置信度为0，并且它的数量占比很多，从而加大了它对于整个模型梯度更新的贡献比。导致模型不稳定（instability）且训练的早期就容易发散(diverge)。

为了解决上述两种问题，首先增大了检测框位置坐标的权重。其系数为 $\lambda_{\text {coord }}=5$ (数值大于1，因此是扩大)
其次是减少那些不包含物体的网格单元的权重。其系数为 $\lambda_{\text {noobj }}=0.5$ (数值小于1，因此是缩小)

问题3：平方和误差模型使得不同大小的检测框的权重也相同。但是实际上来说，相同大小的误差在大的检测框上的相对误差会更小，因此其权重在大的检测框上也理应更小。
为了解决上述问题3，
我们采用检测框长宽的平方根（square root）来取代长宽。如下图：小的检测框（靠左边）的横轴值较小，发生偏移时，反应到y轴上的loss（下图绿色）比大的检测框(下图红色)要大。
一个网格单元会预测多个检测框，但是在训练时，一个检测框只负责预测一个物体。
如何挑选呢？我们选择检测框和真实框的IOU最大的检测框。
这种做法的好处就是每个预测器会对特定大小，类别的物体预测的更好，从而提升总体的召回率（overall recall）

损失函数(loss function)的具体定义如上，逐项的解释如下：
1️⃣ 位置坐标(x,y)的损失： $\lambda_{\text {coord }}$ 是权重系数为5，为了增大位置信息的影响。两个求和公式分别对网格单元 $i$ (取值范围0~S*S) 和每个网格单元的检测框数量 $j$ (取值范围0~B) 的位置偏移量求平方和。
2️⃣ 检测框宽和高w,h的损失：同样有系数 $\lambda_{\text {coord }}$ ，为了增大位置信息的影响。对其宽高的平方根求偏移误差的平方和
3️⃣ 网格单元有无物体的损失
4️⃣ 网格单元没有无物体的损失：前面有系数 $\lambda_{noobj}$ 为0.5，使得没有物体的单元格权重减少。
5️⃣ 网格单元物体类别判断的损失

对上述的公式做两点补充说明：一、分类误差（上述第5项）支当网格单元内有物体时才计算；二、位置坐标的误差（第一项和第二项）只针对该网格单元中IOU最大的检测框进行计算。

训练阶段（train）：从VOC中选取训练集（training）和验证集(validation)
测试阶段：测试阶段的参数配置 $b a t c h s i z e = 64, m o m e n t u m = 0.9, d e c a y = 0.0005$
学习率（learning）的调整策略：分阶段的逐步上升。因为如果一开始就有较高的学习率，不稳定的梯度导致模型容易发散(diverge)，即难以收敛。

避免过拟合（overfitting）：采用两种方法，丢弃（dropout）和扩充数据集(data augmentation)
丢弃（dropout）: 在第一个连接层后添加了一个丢弃率为0.5的dropout layer, 从而避免了层与层之间的协同适应（co-adaptation）
扩充数据集(data augmentation)：引入了高达原始图像大小20%的随机缩放和平移。我们还随机调整曝光和饱和度的图像高达1.5倍的HSV颜色空间。

2.3 Inference (推论)

较基于分类器的检测方法，YOLO只需要单个网络，检测速度快
当图像中的物体较大，或者处于网格边界的物体，可能在多个网格单元中被定位出来。可以用非极大值抑制（NMS，Non-Maximal Suppression，即选取IOU最大的检测框）进行去除重复检测的物体。

2.4 Limitations of YOLO(局限性)

局限性一：空间局限性。因为一个网格单元只能预测两个检测框，且只能有一种类别。如果物体比较小且相互间靠近，如鸟群，在一个单元网格中只能检测出一只鸟，造成漏检。

局限性二：尺度泛化能力弱。对于新物体或者不寻常的纵横比(unusual aspect ratios)检测效果不好。并且只能识别出比较粗的特征(coarse feature)，因为在网络中有许多的下采样层（downsampling layer），导致图像信息的丢失。

局限性三：损失函数不精确。一般来说，相同大小误差对于小的检测框的影响会偏小，而对于大的检测框影响会相对较小。而我们的模型对于两个却等同看待。

3、 Comparison to Other Detection Systems

下图给出了YOLO与其他物体检测方法，在检测速度和准确性方面的比较结果。

Deformable parts models ( DPM )
DMP 是使用滑窗的方法来进行物件侦测。DPM 利用几个独立的流程来进行侦测: 1. 特征提取2. 对区域做分类3. 利用区域分数来进行边界框预测
YOLO 则利用单一个CNN 结构来取代上述的全部过程。这一个CNN 会进行特征提取、边界框预测、NMS 并同时进行上下文推理。跟DPM 萃取的静态特征不同，这个CNN 结构可以对特征进行动态的持续性的训练，并且在这个侦测任务中进行优化。YOLO 这个统一的结构不论就速度或是准确度而言都胜过DPM。
R-CNN
R-CNN 及其变体都使用了region proposals 来取代滑窗侦测。Selective Search ( SS )生成出许多潜在的边界框，其次使用CNN 进行特征萃取，用SVM 进行边界框的评估，一个线性模型来调整边界框，最后再使用NMS 来消除重复的预测。这复杂流程中的每一个阶段都必须要独立进行精准的参数调整，导致最后的侦测系统速度缓慢，再测试阶段侦测每一张图像都要超过40 秒的时间。
YOLO 跟R-CNN 有跟R-CNN 有一些相似性，每一个网格利用卷积结构提出潜在边界框并且给予分数。然而YOLO 在每一个网格中加上了空间限制，这有助于处理同一个物件重复侦测的问题。此外， YOLO 提出的边界框数目每张图像最多仅98 个边界框，远小于R-CNN 利用SS 所提出的将近2000个边界框。
最后，YOLO 结合了这些单独的流程到一个单一的、共同优化的模型。
Other Fast Detectors
Fast R-CNN 与Faster R-CNN 把重点放在利用运算共享以及利用神经网路来代替SS 找出region proposals 加速R-CNN 上。虽然它们在速度与准确度的表现都胜过R-CNN，但在即时的表现上仍显不足。
许多的研究试图要利用HOG 的加速、使用级联并且在GPU 上推进运算来加速DPM 的侦测流程，然而只有30Hz DPM 可以进行即时侦测。
YOLO 试图在结构设计上加速侦测，并不在各个独立的侦测流程进行优化。
侦测器在单一类别上(人脸、人) 是可以被高度优化的，因为需要处理的变化相对少得多。YOLO 就是一个学习怎么同时侦测多种物件的通用侦测器。
Deep MultiBox
论文: Scalable object detection using deep neural networks.
MultiBox 利用CNN 来提出region proposals，与R-CNN 使用SS 来提出region proposal 不同。MultiBox 使用单一分类预测机率来取代信赖指数预测，可以针对单一分类进行物件侦测，但，MultiBox 无法进行广泛的物件侦测。而且这些都还只是庞大的侦测流程中的一小部分，后续还需要更多图像的patch (怎么翻译都怪怪的XD) 分类。
YOLO 跟MultiBox 都是使用CNN 来进行边界框的预测，但YOLO 是一个更完整的侦测系统。
OverFast
论文: Overfeat: Integrated recognition, localization and detection using convolutional networks.
OverFast 利用一个CNN 来进行定位并藉由此定位来侦测物件。它虽然使用有效率的滑窗侦测，但是一个独立的系统。OverFast 在定位上取得优化，但这样的优化却没有在侦测表现上。就如同DPM ，定位器在预测时只看到局部的资讯，无法总结上下文资讯，因此需要特别的后处理来进行一连串的侦测。
MultiGrasp
论文: Real-time grasp detection using convolutional neural networks.
YOLO 在做的其实类似于上述论文中的侦测方式，方法就是利用MultiGrasp 系统来进行回归分析以达到边界框的抓取。
然而这种抓取侦测任务比物件侦测来的简单，只需要为单一物件图像预测单一个可抓取区域，不用估算物件尺寸、定位、边界或其分类，只要找到可以抓取的区域即可。而YOLO 则是要在多分类物件上进行边界框及分类机率。

4、 Experiments （实验）

YOLO 的确在准确度上不如R-CNN 的相关变体，但是却大大降低背景误判的机率，牺牲一点准确率换得背景误判降低以及速度提升，在一些现实的考量上的确非常划算。

5、Real-Time Detection In The Wild （现实中的实时检测）

YOLO 是一个快速、准确的物件侦测系统，因此是电脑视觉应用上的理想选择。可以将YOLO 接上视讯镜头验证其即时侦测的表现，包含了撷取图像的时间以及展示这些侦测。
最后产生的系统是具互动性且迷人的。虽然YOLO 是一个独立的图像处理系统，但连接上视讯镜头后，它的功能会类似于一个追踪系统，随着物件移动或改变行为表现来进行物件侦测。
这样的系统已经开源，可以于下列网址中找到: http://pjreddie.com/yolo/.

6、Conclusion（结论）

研究团队提出YOLO 这样一个统一的物件侦测模型。YOLO 本身非常容易打造并且可以直接在整张图像上训练。不像其他以分类器为基础的方法，YOLO 直接使用检测性能来对Loss function 做训练，而且整个模型是一起训练的。

Fast YOLO 是目前文献中( 在当时) 最快的通用检测系统，而YOLO 则推进了即时物件侦测的发展。且YOLO 也可以在新的领域上泛化得很好，使得YOLO 可以成为快速、强健的物件侦测系统的理想选择。

参考
https://blog.csdn.net/shuiyixin/article/details/82533849
https://blog.csdn.net/m0_37192554/article/details/81092761
https://blog.csdn.net/guleileo/article/details/80581858
https://blog.csdn.net/c20081052/article/details/80236015
Allen Tzeng的论文讲解

华为 Ascend 平台 YOLOv5 目标检测推理教程 Lunar* 目标检测华为 YOLO 目标检测
1.背景介绍随着人工智能技术的快速发展，目标检测在智能安防、自动驾驶、工业检测等领域中扮演了重要角色。YOLOv5是一种高效的目标检测模型，凭借其速度和精度的平衡广受欢迎。华为Ascend推理框架（ACL）是AscendCANN软件栈的核心组件，专为AscendAI加速硬件（如Atlas300I）设计，可实现高性能的深度学习推理。在本文中，我们将介绍如何基于华为AscendACL推理框架对YOLO
Python学习路线 Python_JC python
Python是一门易学易用的编程语言，广泛应用于数据处理、Web开发、人工智能、自动化运维、游戏开发等领域。本篇文章将介绍Python的学习路线以及一些值得参考的书籍。Python学习路线Python的学习路线主要包括以下几个方面：掌握Python基础知识：了解变量、数据类型、表达式、流程控制、函数、模块等基础概念。学习Python面向对象编程：学习类、对象、继承、多态等面向对象编程的概念和技术。
【2025最新计算机毕业设计】基于SSM的旅游与自然保护平台【提供源码+答辩PPT+文档+项目部署】万码堂源码计算机毕设精品实战案例实战项目源码课程设计 vue.js 前端计算机毕业设计毕设项目 spring boot
作者简介：✌CSDN新星计划导师、Java领域优质创作者、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流。✌主要内容：Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能与大数据、单片机开发、物联网设计与开发设计、简历模板、学习资料、面试题库、技术互助、就业指导等。业务范围：免费功能设计、开题报告、任务书
【源码+文档】基于SpringBoot+Vue旅游网站系统【提供源码+答辩PPT+参考文档+项目部署】万码堂源码实战项目源码计算机毕设精品实战案例 spring boot vue.js 旅游
作者简介：✌CSDN新星计划导师、Java领域优质创作者、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流。✌主要内容：Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能与大数据、单片机开发、物联网设计与开发设计、简历模板、学习资料、面试题库、技术互助、就业指导等。业务范围：免费功能设计、开题报告、任务书
人工智能领域单词：英文解释周杰伦_Jay 人工智能深度学习神经网络中文分词全文检索
目录1、前言2、单词组1：15个3、单词组2：15个4、单词组3：15个5、单词组4：15个6、单词组5：15个1、前言亲爱的家人们，创作很不容易，若对您有帮助的话，请点赞收藏加关注哦，您的关注是我持续创作的动力，谢谢大家！有问题请私信或联系邮箱：[email protected]、单词组1：15个1、人工智能(ArtificialIntelligence,AI):atechnologythatsi
华为CANN架构与Ascend C算子开发 z1931195 华为
CANN架构CANN（ComputeArchitectureforNeuralNetworks）是华为专为应对人工智能场景而推出的一种新型异构计算架构。在当前快速发展的AI技术背景下，CANN致力于提供一种高效且灵活的解决方案，以支持多种AI框架的应用。其设计不仅仅关注于上层应用的兼容性，同时也服务于底层AI处理器的优化和编程需求，发挥了承上启下的关键作用，成为华为昇腾AI处理器计算效率提升的核心
昇腾NPU推理YOLOV10目标检测（C++） weixin_51923349 c++ffmpeg opencv
1.准备工作基础环境：需要安装NPU固件驱动，CANN的包在昇腾官网下载，安装最新版就可以了。C++环境搭建链接：cplusplus/environment/catenation_environmental_guidance_CN.md·Ascend/samples-Gitee.com按照上面的链接，需要安装：presentagent,opencv,ffmpeg+acllite其中ffmpeg和o
探索极致AI性能：昇腾NPU与PyTorch的完美融合 —— Ascend Extension for PyTorch 尤琦珺Bess
探索极致AI性能：昇腾NPU与PyTorch的完美融合——AscendExtensionforPyTorch去发现同类优质开源项目:https://gitcode.com/项目简介在人工智能领域，高效灵活的框架与强大的硬件加速器是实现先进算法的关键组合。AscendExtensionforPyTorch插件，即torch_npu，正是这样一个解决方案，它无缝对接PyTorch框架，将华为昇腾AI处
《盘古大模型——鸿蒙NEXT的智慧引擎》人工智能深度学习
在当今科技飞速发展的时代，华为HarmonyOSNEXT的发布无疑是操作系统领域的一颗重磅炸弹，其将人工智能与操作系统深度融合，开启了智能新时代。而盘古大模型在其中发挥着至关重要的核心作用。赋予小艺智能助手超强能力在鸿蒙NEXT中，盘古大模型赋予了小艺智能助手更强的记忆、推理和规划能力，使其能够支持23类常用记忆类型，掌握万亿token的知识量。基于盘古大模型，小艺可以实现诸如将带有表格的图片转化
《AI 造梦：解锁虚拟场景与角色逼真丰富密码》人工智能深度学习
在科技飞速发展的当下，生成式人工智能正以前所未有的态势席卷各个领域，尤其在构建虚拟世界方面，展现出令人惊叹的潜力。从沉浸式游戏世界到逼真的影视特效场景，从栩栩如生的虚拟偶像到互动性极强的虚拟角色，生成式人工智能正在改写我们对虚拟场景和角色的认知。今天，就让我们深入探寻如何利用这一前沿技术，创造出更加逼真且丰富的虚拟场景与角色。生成式AI技术基石生成式对抗网络（GANs）和变分自编码器（VAEs）是
《鸿蒙微内核与人工智能算法协同，开启智能系统新时代》人工智能深度学习
在当今科技飞速发展的时代，鸿蒙系统以其独特的微内核架构和对人工智能算法的深度融合，正引领着操作系统智能化的新潮流。本文将深入探讨鸿蒙系统的微内核架构是如何与人工智能算法高效协同，从而提升系统性能和智能化水平的。鸿蒙系统微内核架构的优势鸿蒙系统采用微内核架构，将核心功能模块化，只保留最基本的进程管理、内存管理和通信机制等功能在内核中，而文件系统、网络协议等则作为独立的模块放在用户空间运行。这种架构使
《量子AI：突破量子比特稳定性与容错性的关键瓶颈》人工智能深度学习机器学习
在量子计算的发展进程中，量子比特的稳定性和容错性问题一直是阻碍其走向广泛应用的关键障碍。量子AI作为前沿技术，正积极探索各种途径来攻克这些难题。量子纠错：守护量子比特的精准防线量子纠错是解决量子比特稳定性和容错性问题的核心技术之一。其原理是通过在量子比特之间建立量子纠错码，来检测和纠正量子比特在计算过程中发生的错误。比如谷歌量子人工智能实验室采用的“表面码”技术，通过构建物理量子比特的网格来编码逻
第78期 | GPTSecurity周报 aigcgpts
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.ChatNVD：借
智算中心建设热潮涌动 AI服务器赋能加速数据中心
在数字化浪潮汹涌的今天，人工智能新技术新发展日新月异。智算作为数字经济时代的新生产力，正逐步成为推动经济社会高质量发展的新引擎。智算中心：算力时代的“新基建”近年来，随着人工智能技术的迅猛发展和广泛应用，智能算力需求持续爆发，推动了智算中心的快速发展。2022年，随着国家“东数西算”工程启动，我国算力地图正式开始，形成八大枢纽、十大算力中心集群。据中国电信研究院发布的《智算产业发展研究报告（202
让创意在幻觉中肆虐: 认识Illusion Diffusion AI 程序员
人工智能新境界在不断发展的人工智能领域,一款非凡的新工具应运而生,它能将普通照片转化为绚丽的艺术品。敬请关注IllusionDiffusion,这是一个将现实与想象力完美融合的AI驱动平台,可创造出迷人的视错觉和超现实意境。AI算法的魔力所在IllusionDiffusion的核心是借助先进的AI模型,包括StableDiffusion和ControlNet,来解读用户输入的文本提示,并生成相应的
10 个免费的 AI 图片生成工具分享程序员
原文：https://openaigptguide.com/ai-picture-generator/在人工智能（AI）图像生成技术的推动下，各类AI图片生成网站如雨后春笋般涌现，为我们的日常生活提供了丰富多彩的视觉体验。AI图片生成技术原理人工智能（AI）图片生成技术原理是通过计算机程序使用深度学习算法从大量的数据中学习特征，并根据特征创建新的图片。该技术可以模拟人类的绘画过程，学习输入图像的潜
【Cursor】揭秘Cursor：如何免费无限使用这款AI编程神器？ ChatGPT-千鑫人工智能 AI编程
在当今科技飞速发展的时代，人工智能编程工具层出不穷，其中Cursor凭借其卓越的功能和用户友好的体验，迅速在国际市场上引发了广泛关注。最近，该公司成功获得了OpenAI的6000万美元投资，进一步验证了其潜力和市场价值。那么，Cursor究竟具备怎样的强大能力？又该如何实现免费无限制使用呢？本文将为您揭开Cursor的神秘面纱，并提供详细的使用指南，助您轻松上手！Cursor的强大功能Cursor
【人工智能】人工智能的10大算法详解（优缺点+实际案例） ChatGPT-千鑫人工智能人工智能算法 gpt-3 AI编程 gpt codemoss能用AI
人工智能（AI）是现代科技的重要领域，其中的算法是实现智能的核心。本文将介绍10种常见的人工智能算法，包括它们的原理、训练方法、优缺点及适用场景。1.线性回归（LinearRegression）模型原理线性回归用于建立自变量（特征）与因变量（目标）之间的线性关系。其目标是寻找最佳拟合直线，使得预测值与实际值之间的误差最小化。模型训练通过最小二乘法来最小化预测值与真实值之间的误差，得到线性回归方程的
YOLOv8重磅升级：引入DenseOne密集网络革新主干设计，重塑YOLO目标检测性能新高度程序员杨弋 YOLO 目标检测人工智能
随着深度学习技术的不断进步，目标检测作为计算机视觉领域的重要任务之一，其性能和应用范围也在不断扩大。作为目标检测领域的佼佼者，YOLO（YouOnlyLookOnce）系列算法以其出色的性能和实时性受到了广泛关注。而最近提出的YOLOv8更是在前代版本的基础上进行了多项优化，进一步提升了检测精度和速度。然而，尽管YOLOv8已经取得了显著的进步，但在处理复杂场景和遮挡问题时，仍然存在一定的挑战。为
【YOLOv8改进- Backbone主干】YOLOv8更换主干网络之ConvNexts，纯卷积神经网络，更快更准，，降低参数量！ YOLO大师 YOLO 网络 cnn 目标检测论文阅读 yolov8
YOLOv8目标检测创新改进与实战案例专栏专栏目录：YOLOv8有效改进系列及项目实战目录包含卷积，主干注意力，检测头等创新机制以及各种目标检测分割项目实战案例专栏链接:YOLOv8基础解析+创新改进+实战案例介绍摘要视觉识别的“咆哮20年代”开始于视觉Transformer（ViTs）的引入，ViTs迅速取代了卷积神经网络（ConvNets）成为最先进的图像分类模型。然而，普通的ViT在应用于诸
Cursor 一只爱笑的小燕子 ChatGPT html5 java 开发语言
一、什么是Cursor官网：Cursor|BuildFastCursor是一个开源的AI编程编辑器。开源地址https://github.com/pricing目前在国内是可以不需要其他东西，可以直接访问的。而且目「下面是官方的介绍：」Cursor是一个为AI编程而做的编辑器。它还处于早期阶段，但现在Cursor可以帮助你做一些事情。编写：使用Copilot更聪明的人工智能生成10-100行代码比
基于深度学习的人脸表情识别系统：YOLOv5 + YOLOv8 + YOLOv10 + UI界面 + 数据集 2025年数学建模美赛深度学习 YOLO ui 分类人工智能
引言随着人工智能的飞速发展，深度学习技术已广泛应用于各个领域，尤其是在计算机视觉领域。人脸识别和表情识别是其中的一个重要应用，能够在多种场景下提供重要的信息，例如安全监控、情感分析、智能客服、健康监测等。在人脸表情识别任务中，准确识别人脸的情感状态（如高兴、愤怒、悲伤等）是一个极具挑战性的任务。随着YOLO系列算法的不断进步，YOLOv5、YOLOv8和YOLOv10的推出大大提高了目标检测的精度
基于YOLOv8深度学习的人脸年龄检测识别系统 2025年数学建模美赛 YOLO 深度学习人工智能 ui 数据挖掘分类
引言随着人工智能和计算机视觉的飞速发展，人脸分析技术在年龄检测领域取得了显著进展。人脸年龄检测系统在安全监控、广告推荐、健康监测等领域有广泛应用。本文将基于YOLOv8目标检测模型和UI界面，开发一个完整的人脸年龄检测识别系统。我们将详细介绍项目的技术实现、数据集构建、模型训练以及UI设计，并附上完整代码。目录引言系统架构设计数据准备公开人脸年龄数据集数据标注格式数据目录结构模型训练YOLOv8环
基于深度学习的人脸表情识别系统：YOLOv8 + UI界面 + 数据集完整实现 2025年数学建模美赛深度学习 YOLO ui 人工智能代码
1.引言近年来，人脸表情识别在情感计算、智能人机交互、心理学研究等领域有着广泛的应用。深度学习的快速发展，使得高效、准确的人脸表情识别成为可能。通过利用卷积神经网络（CNN）和目标检测技术，可以实现实时、精准的人脸表情识别。本文将基于YOLOv8构建一个完整的人脸表情识别系统。系统集成了数据集准备、YOLOv8模型训练、实时推理以及基于PyQt5的图形用户界面（UI）。通过本文，你将学习如何实现一
《鸿蒙Next旅游应用：人工智能赋能个性化与智能导览新体验》人工智能深度学习
随着鸿蒙Next的推出，旅游应用迎来了全新的发展机遇，借助人工智能技术能为用户带来更出色的个性化推荐和智能导览服务。鸿蒙Next与人工智能融合优势鸿蒙Next拥有强大的分布式能力和原生智能体验。其能打破设备界限，实现多设备协同，让用户在手机、平板、智能手表等设备上无缝使用旅游应用。同时，依托华为强大的AI技术和自研的“盘古”大模型，为旅游应用提供了强大的智能支持。个性化推荐实现方式用户数据收集与分
《解锁鸿蒙系统AI与第三方应用集成的无限可能》人工智能深度学习
在当今科技飞速发展的时代，鸿蒙系统与人工智能技术的深度融合为应用开发带来了前所未有的机遇和挑战。如何让鸿蒙系统中的人工智能服务与第三方应用实现更好的集成，成为了开发者们关注的焦点。利用鸿蒙系统内置的人工智能服务鸿蒙系统提供了丰富的人工智能服务，如语音助手、视觉识别、自然语言处理等。开发者可以直接调用这些服务，无需从头开始研发。例如，在开发一款阅读类应用时，可以调用自然语言处理服务实现智能朗读功能，
《软硬协同优化，解锁鸿蒙系统AI应用性能新高度》深度学习人工智能
在当今数字化时代，鸿蒙系统与人工智能的融合正逐渐成为科技领域的热门话题。如何通过软件和硬件协同优化，进一步提升鸿蒙系统中AI应用的整体性能，成为了开发者和技术爱好者们关注的焦点。鸿蒙系统与AI应用的融合现状鸿蒙系统以其独特的微内核架构和分布式特性，为AI应用提供了良好的运行环境。目前，鸿蒙系统中的AI应用已经涵盖了语音助手、图像识别、智能推荐等多个领域，为用户带来了更加智能、便捷的体验。然而，随着
《解锁数据新动能：数据标注工具与AI模型训练平台的无缝对接热潮》人工智能深度学习
在当今人工智能飞速发展的时代，数据已然成为驱动其进步的核心燃料。而数据标注工具与人工智能模型训练平台的集成，实现数据的无缝流转，正逐渐成为行业内的关键热点，犹如为人工智能的发展装上了强劲的双引擎。为何集成如此关键数据标注是为数据赋予标签，使其能被人工智能模型理解和学习的过程。训练平台则是利用这些标注好的数据来构建和优化模型。两者若相互独立运作，数据在不同系统间的传输会面临格式不兼容、接口不匹配等难
第81期 | GPTSecurity周报 aigc网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.大语言模型与代码安
《数据质量：人工智能模型的成败关键》人工智能深度学习
在当今人工智能飞速发展的时代，数据质量对人工智能模型的影响至关重要，它直接关系到模型的性能、准确性和可靠性。以下是对这一问题的详细探讨。影响模型的准确性数据准确性的作用：准确的数据是模型准确输出的基础。如果数据中存在错误、偏差或噪声，模型就会学习到这些错误信息，从而导致预测结果不准确。例如在医疗诊断模型中，若患者的症状数据记录错误，模型可能会给出错误的诊断建议。数据完整性的影响：不完整的数据会使模
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l