weixin_39528559

yolov5分割_一文读懂YOLO V5 与 YOLO V4

YOLO之父Joseph Redmon在今年年初宣布退出计算机视觉的研究的时候，很多人都以为目标检测神器YOLO系列就此终结。然而在4月23日，继任者YOLO V4却悄无声息地来了。Alexey Bochkovskiy发表了一篇名为YOLOV4: Optimal Speed and Accuracy of Object Detection的文章。YOLO V4是YOLO系列一个重大的更新，其在COCO数据集上的平均精度(AP)和帧率精度(FPS)分别提高了10% 和12%，并得到了Joseph Redmon的官方认可，被认为是当前最强的实时对象检测模型之一。

正当计算机视觉的从业者们正在努力研究YOLO V4的时候，万万没想到，有牛人不服。6月25日，Ultralytics发布了YOLOV5 的第一个正式版本，其性能与YOLO V4不相伯仲，同样也是现今最先进的对象检测技术，并在推理速度上是目前最强。

从上图的结果可以看出，YOLO V5确实在对象检测方面的表现非常出色，尤其是YOLO V5s 模型140FPS的推理速度非常惊艳。

YOLO V5和V4集中出现让很多人都感到疑惑，一是YOLO V5真的有资格能被称作新一代YOLO吗？二是YOLO V5的性能与V4相比究竟如何，两者有啥区别及相似之处？

在本文中我会详细介绍YOLO V5和YOLO V4的原理，技术区别及相似之处，最后会从多方面对比两者的性能。

Email: [email protected]

知乎专栏: 自动驾驶全栈工程师

我在我之前的文章中介绍了YOLO V3模型，YOLO是一种快速紧凑的开源对象检测模型，与其它网络相比，同等尺寸下性能更强，并且具有很不错的稳定性，是第一个可以预测对象的类别和边界框的端对端神经网络。

YOLO V3原始模型是基于Darknet网络。Ultralytics将YOLO V3架构迁移到了Pytorch平台上，并对其自行研究和改进。Ultralytics-yolov3 代码库是目前已开源YOLO V3 Pytorch的最佳实现。

YOLO网络主要由三个主要组件组成。

1）Backbone -在不同图像细粒度上聚合并形成图像特征的卷积神经网络。

2）Neck：一系列混合和组合图像特征的网络层，并将图像特征传递到预测层。

3）Head：对图像特征进行预测，生成边界框和并预测类别。

下图是对象检测网络的通用架构：

图片引用

我们可以在上述每个主要组件上使用不同的技术或者组合不同的方案来实现属于自己的最佳对象检测框架。

实际上YOLO V5的模型架构是与V4非常相近的。在下文中，我会从下面几个方面对比YOLO V5和V4，并简要阐述它们各自新技术的特点，对比两者的区别和相似之处，评判两者的性能，并做最后总结。

Data Augmentation
Auto Learning Bounding Box Anchors
Backbone
Network Architecture
Neck
Head
Activation Function
Optimization Function
Benchmarks

Data Augmentation

图像增强是从现有的训练数据中创建新的训练样本。我们不可能为每一个现实世界场景捕捉一个图像，因此我们需要调整现有的训练数据以推广到其他情况，从而允许模型适应更广泛的情况。无论是YOLO V5还是V4，多样化的先进数据增强技术是最大限度地利用数据集，使对象检测框架取得性能突破的关键。通过一系列图像增强技术步骤，可以在不增加推理时延的情况下提高模型的性能。

YOLO V4数据增强

图片引用

YOLO V4使用了上图中多种数据增强技术的组合，对于单一图片，除了经典的几何畸变与光照畸变外，还创新地使用了图像遮挡(Random Erase，Cutout，Hide and Seek，Grid Mask ，MixUp)技术，对于多图组合，作者混合使用了CutMix与Mosaic 技术。除此之外，作者还使用了Self-Adversarial Training (SAT)来进行数据增强。

在下文中我将简单介绍以上数据增强技术。

图像遮挡

Random Erase：用随机值或训练集的平均像素值替换图像的区域。

图片引用

Cutout：仅对 CNN 第一层的输入使用剪切方块Mask。

图片引用

Hide and Seek：将图像分割成一个由 SxS 图像补丁组成的网格，根据概率设置随机隐藏一些补丁，从而让模型学习整个对象的样子，而不是单独一块，比如不单独依赖动物的脸做识别。

图片引用

Grid Mask：将图像的区域隐藏在网格中，作用也是为了让模型学习对象的整个组成部分。

图片引用

MixUp：图像对及其标签的凸面叠加。

图片引用

多图组合

Cutmix:

将另一个图像中的剪切部分粘贴到增强图像。图像的剪切迫使模型学会根据大量的特征进行预测。

图片引用

Mosaic data augmentation:

在Cutmix中我们组合了两张图像，而在 Mosaic 中我们使用四张训练图像按一定比例组合成一张图像，使模型学会在更小的范围内识别对象。其次还有助于显著减少对batch-size的需求，毕竟大多数人的GPU显存有限。

图片引用

自对抗训练(SAT)

Self-Adversarial Training是在一定程度上抵抗对抗攻击的数据增强技术。CNN计算出Loss, 然后通过反向传播改变图片信息，形成图片上没有目标的假象，然后对修改后的图像进行正常的目标检测。需要注意的是在SAT的反向传播的过程中，是不需要改变网络权值的。

使用对抗生成可以改善学习的决策边界中的薄弱环节，提高模型的鲁棒性。因此这种数据增强方式被越来越多的对象检测框架运用。

图片引用

类标签平滑

Class label smoothing是一种正则化方法。如果神经网络过度拟合和/或过度自信，我们都可以尝试平滑标签。也就是说在训练时标签可能存在错误，而我们可能“过分”相信训练样本的标签，并且在某种程度上没有审视了其他预测的复杂性。因此为了避免过度相信，更合理的做法是对类标签表示进行编码，以便在一定程度上对不确定性进行评估。YOLO V4使用了类平滑，选择模型的正确预测概率为0.9，例如[0,0,0,0.9,0...,0 ]。

从上图看出，标签平滑为最终的激活产生了更紧密的聚类和更大的类别间的分离，实现更好的泛化。

图片引用

YOLO V5 似乎没有使用类标签平滑。

YOLO V5 数据增强

YOLO V5的作者现在并没有发表论文，因此只能从代码的角度理解它的数据增强管道。

YOLOV5都会通过数据加载器传递每一批训练数据，并同时增强训练数据。数据加载器进行三种数据增强：缩放，色彩空间调整和马赛克增强。

有意思的是，有媒体报道，YOLO V5的作者Glen Jocher正是Mosaic Augmentation的创造者，他认为YOLO V4性能巨大提升很大程度是马赛克数据增强的功劳，也许是不服，他在YOLO V4出来后的仅仅两个月便推出YOLO V5，当然未来是否继续使用YOLO V5的名字或者采用其他名字，首先得看YOLO V5的最终研究成果是否能够真正意义上领先YOLO V4。

但是不可否认的是马赛克数据增强确实能有效解决模型训练中最头疼的“小对象问题”，即小对象不如大对象那样准确地被检测到。

下图是我在训练BDD100K数据时的数据增强结果。我会在我的下篇文章:YOLO V5 Transfer learning 中展示YOLO V5对象检测框架的实测效果。

Auto Learning Bounding Box Anchors-自适应锚定框

在我之前YOLO V3的文章中，我介绍过如何采用 k 均值和遗传学习算法对自定义数据集进行分析，获得适合自定义数据集中对象边界框预测的预设锚定框。

在YOLO V5 中锚定框是基于训练数据自动学习的。

对于COCO数据集来说，YOLO V5 的配置文件*.yaml 中已经预设了640×640图像大小下锚定框的尺寸：

# anchors
anchors:
  - [116,90, 156,198, 373,326]  # P5/32
  - [30,61, 62,45, 59,119]  # P4/16
  - [10,13, 16,30, 33,23]  # P3/8

但是对于你的自定义数据集来说，由于目标识别框架往往需要缩放原始图片尺寸，并且数据集中目标对象的大小可能也与COCO数据集不同，因此YOLO V5会重新自动学习锚定框的尺寸。

如在上图中, YOLO V5在进行学习自动锚定框的尺寸。对于BDD100K数据集，模型中的图片缩放到512后，最佳锚定框为：

YOLO V4并没有自适应锚定框。

Backbone-跨阶段局部网络(CSP)

YOLO V5和V4都使用CSPDarknet作为Backbone，从输入图像中提取丰富的信息特征。CSPNet全称是Cross Stage Partial Networks，也就是跨阶段局部网络。CSPNet解决了其他大型卷积神经网络框架Backbone中网络优化的梯度信息重复问题，将梯度的变化从头到尾地集成到特征图中，因此减少了模型的参数量和FLOPS数值，既保证了推理速度和准确率，又减小了模型尺寸。

CSPNet实际上是基于Densnet的思想，复制基础层的特征映射图，通过dense block 发送副本到下一个阶段，从而将基础层的特征映射图分离出来。这样可以有效缓解梯度消失问题(通过非常深的网络很难去反推丢失信号) ，支持特征传播，鼓励网络重用特征，从而减少网络参数数量。

图片引用

CSPNet思想可以和ResNet、ResNeXt和DenseNet结合，目前主要有CSPResNext50 and CSPDarknet53两种改造Backbone网络。

Neck-路径聚合网络(PANET)

Neck主要用于生成特征金字塔。特征金字塔会增强模型对于不同缩放尺度对象的检测，从而能够识别不同大小和尺度的同一个物体。在PANET出来之前，FPN一直是对象检测框架特征聚合层的State of the art，直到PANET的出现。在YOLO V4的研究中，PANET被认为是最适合YOLO的特征融合网络，因此YOLO V5和V4都使用PANET作为Neck来聚合特征。

PANET基于 Mask R-CNN 和 FPN 框架，同时加强了信息传播。该网络的特征提取器采用了一种新的增强自下向上路径的 FPN 结构，改善了低层特征的传播。第三条通路的每个阶段都将前一阶段的特征映射作为输入，并用3x3卷积层处理它们。输出通过横向连接被添加到自上而下通路的同一阶段特征图中，这些特征图为下一阶段提供信息。同时使用自适应特征池化(Adaptive feature pooling)恢复每个候选区域和所有特征层次之间被破坏的信息路径，聚合每个特征层次上的每个候选区域，避免被任意分配。

下图中pi 代表 CSP 主干网络中的一个特征层

图片引用

Head-YOLO 通用检测层

模型Head主要用于最终检测部分。它在特征图上应用锚定框，并生成带有类概率、对象得分和包围框的最终输出向量。

在 YOLO V5模型中，模型Head与之前的 YOLO V3和 V4版本相同。

图片来源

这些不同缩放尺度的Head被用来检测不同大小的物体，每个Head一共(80个类 + 1个概率 + 4坐标) * 3锚定框，一共255个channels。

Network Architecture

由于YOLO V5的作者并未放出论文，而网络上已经存在大量YOLO V4网络结构分析，因此本文不着重分析YOLO V5与V4的网络结构具体细节，但它们有着相似的网络结构，都使用了CSPDarknet53（跨阶段局部网络）作为Backbone，并且使用了PANET（路径聚合网络）和SPP（空间金字塔池化）作为Neck，而且都使用YOLO V3的Head。

我们可以通过Netron可视化YOLO V5及V4的网络结构，但是你会发现YOLO V5的网络结构非常简洁，而且YOLO V5 s，m，l，x四种模型的网络结构是一样的。原因在于Ultralytics通过depth_multiple，width_multiple两个参数分别控制模型的深度以及卷积核的个数。

# YOLO V5s
# parameters
nc: 80  # number of classes
depth_multiple: 0.33  # model depth multiple
width_multiple: 0.50  # layer channel multiple

例如*.yaml文件中，V5s的深度是0.33，而V5x的深度是1.33，也就是说V5x的Bottleneck个数是V5s的四倍。

而V5s的宽度是0.5，而V5x的宽度是1.25，表示V5s的卷积核数量是设置的一半，而V5x是设置的1.25倍，当然你也可以设置到1.5倍，搭建超巨型神经网络。下图中YOLO V5的yaml文件中的backbone的第一层是 [[-1, 1, Focus, [64, 3]]，而V5s的宽度是0.5，因此这一层实际上是[[-1, 1, Focus, [32, 3]]。

# YOLOv5 backbone
backbone:
  # [from, number, module, args]
  [[-1, 1, Focus, [64, 3]],  # 0-P1/2
   [-1, 1, Conv, [128, 3, 2]],  # 1-P2/4
   [-1, 3, BottleneckCSP, [128]],
   [-1, 1, Conv, [256, 3, 2]],  # 3-P3/8
   [-1, 9, BottleneckCSP, [256]],
   [-1, 1, Conv, [512, 3, 2]],  # 5-P4/16
   [-1, 9, BottleneckCSP, [512]],
   [-1, 1, Conv, [1024, 3, 2]], # 7-P5/32
   [-1, 1, SPP, [1024, [5, 9, 13]]],
  ]

下图中左侧为YOLO V5s的模型右侧为YOLO V5x的模型，可以明显看出卷积核数量不一样，因此参数数量也不一样。

为了方便大家了解YOLO V5与YOLO V4网络结构的区别，我已经用Netron生成了YOLO V5s，YOLO V5x，YOLO V4的网络结构图。对于对YOLO V5s网络结构基于代码理解的具体分析，我会在下篇文章YOLO V5 Transfer learning 中阐述。

点击下方链接可以查看各自的网络结构大图：

YOLO V4: https://1drv.ms/u/s!An7G4eYRvZzthI48WhoNNwWO8ElNfA?e=oG0Afh

YOLO V5s: https://1drv.ms/u/s!An7G4eYRvZzthI49NZcZHEw2Vtf-VA?e=plafXD

YOLO V5x: https://1drv.ms/u/s!An7G4eYRvZzthI47_ohzdWPz1CSrnQ?e=H2OpOO

YOLOV5S.YAML: https://1drv.ms/u/s!An7G4eYRvZzthI5A41VHiA9ncpBBfw?e=3M64Wd

Activation Function

激活函数的选择对于深度学习网络是至关重要的。YOLO V5的作者使用了 Leaky ReLU 和 Sigmoid 激活函数。

在 YOLO V5中，中间/隐藏层使用了 Leaky ReLU 激活函数，最后的检测层使用了 Sigmoid 形激活函数。而YOLO V4使用Mish激活函数。

图片来源

Mish在39个基准测试中击败了Swish，在40个基准测试中击败了ReLU，一些结果显示基准精度提高了3–5％。但是要注意的是，与ReLU和Swish相比，Mish激活在计算上更加昂贵。

图片来源

Optimization Function

YOLO V5的作者为我们提供了两个优化函数Adam和SGD，并都预设了与之匹配的训练超参数。默认为SGD。

YOLO V4使用SGD。

YOLO V5的作者建议是，如果需要训练较小的自定义数据集，Adam是更合适的选择，尽管Adam的学习率通常比SGD低。但是如果训练大型数据集，对于YOLOV5来说SGD效果比Adam好。

实际上学术界上对于SGD和Adam哪个更好，一直没有统一的定论，取决于实际项目情况。

Cost Function

YOLO 系列的损失计算是基于 objectness score, class probability score,和 bounding box regression score.

YOLO V5使用 GIOU Loss作为bounding box的损失。

YOLO V5使用二进制交叉熵和 Logits 损失函数计算类概率和目标得分的损失。同时我们也可以使用fl _ gamma参数来激活Focal loss计算损失函数。

YOLO V4使用 CIOU Loss作为bounding box的损失，与其他提到的方法相比，CIOU带来了更快的收敛和更好的性能。

图片来源

上图结果基于Faster R-CNN，可以看出，实际上CIoU 的表现比 GIoU 好。

Benchmarks- YOLO V5 VS YOLO V4

由于Ultralytics公司目前重心都放在尽快推广YOLO V5对象检测框架，YOLO V5也在不停的更新和完善之中，因此作者打算年底在YOLO V5的研究完成之后发表正式论文。在没有论文的详细论述之前，我们只能通过查看作者放出的COCO指标并结合大佬们后续的实例评估来比较两者的性能。

官方性能评估

在上面的两个图中，FPS与ms/img的关系是反转的，经过单位转换后我们可以发现，在V100GPU上YOLO V5可以达到250FPS，同时具有较高的mAP。

由于YOLO V4的原始训练是在1080TI上的，远低于V100的性能，并且AP_50与AP_val的对标不同，因此仅凭上述的表格是无法得出两者的Benchmarks。

好在YOLO V4的第二作者WongKinYiu使用V100的GPU提供了可以对比的Benchmarks。

图片引用

从图表中可以看出，两者性能其实很接近，但是从数据上看YOLO V4仍然是最佳对象检测框架。YOLO V4的可定制化程度很高，如果不惧怕更多自定义配置，那么基于Darknet的YOLO V4仍然是最准确的。值得注意的是YOLO V4其实使用了大量Ultralytics YOLOv3代码库中的数据增强技术，这些技术在YOLO V5中也被运行，数据增强技术对于结果的影响到底有多大，还得等作者的论文分析。

训练时间

根据Roboflow的研究表明，YOLO V5的训练非常迅速，在训练速度上远超YOLO V4。对于Roboflow的自定义数据集，YOLO V4达到最大验证评估花了14个小时，而YOLO V5仅仅花了3.5个小时。

图片来源

而在我自己的数据训练过程中，YOLO V5s训练速度远超YOLO V4 。我会在我的下篇文章:YOLO V5 Transfer learning 中展示YOLO V5s的实测训练速度。

模型大小

图片来源

上图中不同模型的大小分别为： V5x: 367MB，V5l: 192MB，V5m: 84MB，V5s: 27MB，YOLOV4: 245 MB

YOLO V5s 模型尺寸非常小，降低部署成本，有利于模型的快速部署。

推理时间

在单个图像（批大小为1）上，YOLOV4推断在22毫秒内，YOLOV5s推断在20毫秒内。而YOLOV5实现默认为批处理推理（批大小36），并将批处理时间除以批处理中的图像数量，单一图片的推理时间能够达到7ms，也就是140FPS，这是目前对象检测领域的State-of-the-art。我使用我训练的模型对10000张测试图片进行实时推理，YOLOV5s 的推理速度非常惊艳，每张图只需要7ms的推理时间，再加上20多兆的模型大小，在灵活性上堪称无敌。但是其实这对于YOLO V4并不公平，由于YOLO V4没有实现默认批处理推理，因此在对比上呈现劣势，接下来应该会有很多关于这两个对象检测框架在同一基准下的测试。其次YOLO V4最新推出了tiny版本，YOLO V5s 与V4 tiny 的性能速度对比还需要更多实例分析。

Summary

总的来说，YOLO V4 在性能上优于YOLO V5，但是在灵活性与速度上弱于YOLO V5。由于YOLO V5仍然在快速更新，因此YOLO V5的最终研究成果如何，还有待分析。我个人觉得对于这些对象检测框架，特征融合层的性能非常重要，目前两者都是使用PANET，但是根据谷歌大脑的研究，BiFPN才是特征融合层的最佳选择。谁能整合这项技术，很有可能取得性能大幅超越。

图片引用

尽管YOLO V5目前仍然计逊一筹，但是YOLO V5仍然具有以下显著的优点：

使用Pytorch框架，对用户非常友好，能够方便地训练自己的数据集，相对于YOLO V4采用的Darknet框架，Pytorch框架更容易投入生产
代码易读，整合了大量的计算机视觉技术，非常有利于学习和借鉴
不仅易于配置环境，模型训练也非常快速，并且批处理推理产生实时结果
能够直接对单个图像，批处理图像，视频甚至网络摄像头端口输入进行有效推理
能够轻松的将Pytorch权重文件转化为安卓使用的ONXX格式，然后可以转换为OPENCV的使用格式，或者通过CoreML转化为IOS格式，直接部署到手机应用端
最后YOLO V5s高达140FPS的对象识别速度令人印象非常深刻，使用体验非常棒

写在结尾：

其实很多人都觉得YOLO V4和YOLO V5实际上没有什么耳目一新创新，而是大量整合了计算机视觉领域的State-of-the-art，从而显著改善YOLO对象检测的性能。其实我觉得有的时候工程应用的能力同样也很重要，能有两个这么优秀的技术整合实例供我们免费使用和学习研究，已经不能奢求更多了，毕竟活雷锋还是少啊。先别管别人谁更强，自己能学到更多才是最重要的，毕竟讨论别人谁强，还不如自己强。

最后想说的是，技术发展如此之快，究竟谁能最后拿下最佳对象检测框架的头衔尤未可知，而我们处在最好的时代，让我们且行且学且珍惜。

备注：

我已经更新了:

使用YOLO V5训练自动驾驶目标检测网络zhuanlan.zhihu.com

这篇文章详细介绍YOLO V5的网络结构及组成模块，并使用YOLO V5s在BDD100K自动驾驶数据集上进行迁移学习，搭建属于自己的自动驾驶交通物体对象识别网络。

后续我也会分享新的目标检测技术，欢迎大家订阅～

如果有什么疑问，可以随时联系我的个人邮箱，文章下评论可能回复不及时。

如果你觉得我的文章对你有帮助，请帮忙点个赞～＼（≧▽≦）／～

转载请私信作者！

引用：

Responding to the Controversy about YOLOV5

Data Augmentation in YOLOV4

YOLO V5 — Explained and Demystified

你可能感兴趣的:(yolov5分割,如何用yolov5调用摄像头)

Django 实战：Celery 异步任务从环境搭建到调用全掌握
合集-Django从入门到实战(11)1.Django实战：I18N国际化与本地化配置、翻译与切换一步到位07-182.Django数据库配置避坑指南：从初始化到生产环境的实战优化06-303.Django实战：自定义中间件实现全链路操作日志记录06-274.Django实战：HTTP状态码与业务状态码的分层设计与实战应用07-025.Django+DRF实战：从异常捕获到自定义错误信息07-04
Python 线程与进程在实际项目中的问题及应对策略女码农的重启 python java 线程进程
一、引言在Python编程里，线程（Thread）和进程（Process）是实现并发与并行计算的关键工具，能有效提升程序执行效率与资源利用率。然而，实际项目应用中，因二者特性及Python运行环境（如GIL，全局解释器锁）等因素，会遭遇诸多问题。本文深入剖析这些问题，并给出应对方案。二、Python线程的问题与解决（一）GIL引发的性能瓶颈Python的全局解释器锁，限制了同一进程内多个线程并行执
Java学习----线程安全容器典孝赢麻崩乐急 java 学习开发语言
线程安全容器是指在多线程环境下能够保证数据一致性和正确性的容器类。当多个线程同时访问容器时，无需额外的同步措施，容器内部已经实现了必要的同步机制，确保所有操作都能原子性地完成。其主要作用为：简化多线程编程：开发者无需手动添加同步代码提高并发性能：相比简单的同步包装器(如synchronizedList等)，线程安全容器通常有更好的并发性能避免数据竞争：防止多线程同时修改导致的数据不一致提供原子性操
11.Django中常用过滤器孤寒者 Django框架从入门到实战 Python全栈系列教程过滤器 python django 自动转义
目录：每篇前言：（1）Django模板变量过滤器详解1.过滤器的作用与特点2.基本语法3.链式调用4.带参数的过滤器5.注意事项6.总结（2）Django中实战使用——常用的过滤器：①项目目录下的views.py文件：②项目目录下templates模板文件夹下的模板文件index.html：③效果展示：date和time过滤器格式：拓展——简介自动转义：每篇前言：作者介绍：【孤寒者】—CSDN全栈
发哥诡谈：灵异故事之死亡电话！发哥诡谈
免责声明：发哥诡谈发布的作品如涉版权等问题，请尽快联系我们（微.信ID：fageguitan），我们将在第一时间删除。转载旨在分享交流！更多同类型故事就在发哥诡谈！这年秋天，中原市公安局的警官胡军被送到公安学院进行在职培训。一年来，胡军学习勤奋刻苦，能力超群，深受教官们的赏识，只要通过了结业考试，他就可以回到工作岗位上大显身手了。可就在这节骨眼上，胡军却患了闹心的重感冒，为了不影响第二天的综合能力
2019-11-13过滤器和拦截器的区别江南皮哥厂
1过滤器依赖于servlet，回调机制拦截器依赖于web框架，基于java的反射机制2就是在service或者一个方法前，调用一个方法，或者在方法后，调用一个方法，比如动态代理就是拦截器的简单实现，在调用方法前打印出字符串（或者做其它业务逻辑的操作），也可以在调用方法后打印出字符串3捕获.PNG
元宇宙与Web3的深度融合：构建沉浸式数字体验的愿景与挑战
一、技术特征与融合基础1.元宇宙的技术架构（2025年）空间构建技术：3D建模与渲染：实时渲染引擎（如UnityHDRP）支持路径追踪光追，AI生成模型（NVIDIAGet3D）3秒生成3D场景。数字孪生：城市级建模（腾讯覆盖100+城市）、工业级精度（西门子Xcelerator达0.1mm），动态映射现实数据（如NASA火星车实时驱动虚拟环境）。交互技术：自然交互界面：手势识别（UltraLea
元宇宙经济：虚实交融下的数字文明新范式 boyedu 元宇宙域名区块链元宇宙
元宇宙经济：虚实交融下的数字文明新范式一、定义与范围：权威机构视角下的经济版图1.1核心定义与分类Gartner定义：元宇宙是包含物理世界数字孪生、增强现实（AR）叠加层、虚拟原生空间的立体生态。其经济系统以区块链为基础，涵盖虚拟货币、NFT、DeFi、DAO等核心要素，形成与现实经济平行且互通的数字文明。中国产业分类（智研咨询）：工业元宇宙：通过数字孪生技术实现工业降本增效，如宝武钢铁的AR智能
yolov5推理简单代码（网上找了好多，最终找到了） a2488220557 YOLO 计算机视觉 opencv
#yolov5#导包importtorchimportcv2frommultiprocessingimportProcess,Manager,Value#下面两个是yolov5文件夹里面的代码fromutils.generalimportnon_max_suppressionfrommodels.experimentalimportattempt_load#确保在进行对象检测时，边界框的位置可以与
《进击的智人》凛冽的南北朝Vs明末的地狱小乔非乔
周-秦（嬴政统一）-汉-（公元220年）三国两晋南北朝（三分天下-晋-少数民族纷立政权）-隋再次统一（公元589）公元225年开始一系列气候剧变拉开了帷幕，寒冷伴随着干旱，280-291年持续干旱。同时蝗灾对农业造成重创1）繁殖能力强2）以农作物为主3）食量巨大——天下大饥。气候转冷-北方农田变成草原-农牧交界线南移-少数民族大批进入中原-民族矛盾轰然爆发-特别在道德伦理上的矛盾显著，如匈奴的“收
略说NLP引入公理模型的可行性金井PRATHAMA 知识图谱与NLP 自然语言处理人工智能知识图谱
在自然语言处理（NLP）的深层语义分析中，公理化体系的引入具有理论可行性，但其实际应用仍面临挑战。以下从公理模型的设计思路、关键技术要点及注意事项三个方面展开分析，结合搜索结果的多个相关技术点进行综合说明：一、公理模型在深层语义分析中的设计思路公理的定义与语义形式化公理模型需以形式化逻辑为基础，定义语义分析中的原始概念（如谓词、实体、关系）和推理规则。例如：原始概念：将语义角色（如施事者、受事者）
NLP中情感分析如何结合知识图谱在跨文化领域提升观念分析和价值判断的准确性？
情感分析结合知识图谱，能够显著提升观念分析和价值判断的准确性。这一融合的核心在于利用知识图谱的结构化语义网络，为情感分析提供深层语境、实体关联和领域知识支撑。以下是具体机制和应用场景的分析：一、知识图谱如何提升情感分析的语义理解1.解决歧义与上下文依赖问题：情感词（如“冷”）在不同语境中含义不同（“服务态度冷”表负面，“冷静分析”表中性）。方案：知识图谱通过实体链接识别文本中的对象（如“服务态度”
k8s 基本架构一切顺势而行 k8s
基于Kubernetes(K8s)的核心设计，以下是其关键基本概念的详细解析。这些概念构成了K8s容器编排系统的基石，用于自动化部署、扩展和管理容器化应用。###一、K8s核心概念概览K8s的核心对象围绕容器生命周期管理、资源调度和服务发现展开，主要包括：1.**Pod**-**定义**：K8s最小调度单元，封装一个或多个紧密关联的容器(如主应用容器+辅助sidecar容器)。-**特性**：-共
OpenCV 入门指南 —— 从环境搭建到图像处理 m0_74751715 opencv 图像处理人工智能 python
文章目录前言一、什么是OpenCV？二、环境准备与安装1.Python虚拟环境2.安装OpenCV3.验证安装三、读取与显示图像四、常见图像处理操作1.色彩空间转换2.图像平滑（模糊）3.边缘检测（Canny算法）4.在图像上绘制图形与文字五、视频与摄像头操作六、推荐学习路线七、参考资料前言在计算机视觉领域，OpenCV（OpenSourceComputerVisionLibrary）凭借其开源、
智能体架构设计的五大核心原则：构建下一代AI系统的工程基石一休哥助手人工智能
引言：智能体架构的范式演进人工智能领域正经历从孤立模型向自主智能体的范式转变。2025年，全球AI智能体市场规模突破200亿美元，在金融、医疗、制造等领域的渗透率超40%。然而，智能体开发仍面临协作效率低（多智能体任务重叠率达30%）、安全风险高（工具调用错误率18%）和系统僵化（需求变更迭代周期超2周）三大痛点。本文基于产业实践提炼五大核心设计原则，为构建下一代智能体系统提供架构指南。传统LLM
如何用css画三角形&太极阿小经
一、如何用css画一个三角形搜索学习资源：Google>>csstricksshape>>画一个如下图这样的三角形三角形htmltrianglecss1.先设置div元素，为它上下边界设置不同颜色，方便改动2.使其高度、宽度为03.使其上边界值为0（蓝色部分）4.使绿色和红色区域变成透明色就可以得到我们要的三角形了。5.简化代码二、如何用css画一个太极(带animation动效)静态效果图用到伪
当OT遇见IT：Apache IoTDB如何用“时序空间一体化“破解工业物联网数据孤岛困局 Loving_enjoy 计算机学科论文创新点机器学习 facebook 经验分享课程设计
>在工业4.0的浪潮中，OT（运营技术）与IT（信息技术）的融合成为关键痛点。本文将深入解析ApacheIoTDB如何通过创新性的"时序空间一体化"技术，打通工业数据壁垒，并附可落地的完整解决方案代码。###一、工业数据孤岛：OT与IT的世纪之困####典型工业数据版图```mermaidgraphLROT领域-->A[设备传感器]OT领域-->B[PLC控制系统]OT领域-->C[SCADA系统
三步打造人脸识别神器：WinForm+虹软让摄像头“火眼金睛”！墨夶 C#学习资料8 c#开发语言
你的摄像头是不是还在“偷看”？想象一下这样的场景：程序员A：我的人脸识别程序检测不到戴口罩的同事！实习生：我写的摄像头预览卡成“PPT动画”！产品经理：“为什么其他系统能识别100张脸，我们只能识别1张？”别慌！今天咱们用虹软SDK，给WinForm应用装上“孙悟空的火眼金睛”，让它像《头号玩家》的“AR眼镜”一样，秒速识别人脸！准备好你的咖啡，咱们开始这场“人脸识别大作战”吧~三步打造人脸识别的
智能体架构深度解构：一次用户请求的完整旅程一休哥助手架构
引言：智能体系统的复杂性迷宫当用户向AI智能体发出一个简单请求时，背后正上演着一场精密的认知交响乐。2025年全球智能体日均处理请求量突破120亿次，但仅38%的用户理解其内部运作机制。本文通过解构一次真实请求的完整生命周期（从输入到输出），揭示智能体架构的核心流程与关键技术，涵盖11个关键步骤与23项核心技术，为开发者提供全景式架构指南。用户请求输入处理意图理解记忆检索任务规划工具调用安全管控执
人脸识别闸机系统解决方案亿晟人脸识别
需求分析针对人脸识别通行管理项目，亿晟科技Eface人脸识别通行管理解决方案，是结合亿晟Yface系列人脸识别闸机专用主板，3D双目摄像头、以及闸机核验APP和Eface智慧考勤系统于一体的软硬件整体解决方案、该方案无缝对接各类闸机、考勤机等实现一站式成品落地，并且支持口罩识别，结合Eface智慧云服务器，或者局域网版本EFace管理平台。方便客户各种使用场景。方案架构硬件推荐方案特点人脸识别闸机
Datawhale组队学习打卡-Fun-transformer-Task3Encoder 宇宙第一小甜欣学习 transformer 深度学习
今天的内容主要是Encoder部分的具体流程，多头注意力和交叉注意力，还是会有比较多的公式来厘清每部分的输入和输出以及对应的方法。Encoder如第一篇所说，Encoder是Transformer的第一部分，其主要任务是将输入序列（如文本、词语或字符）编码为一个上下文丰富的表示，Encoder的输出是Decoder的输入的一部分（用作Attention机制中的和）。1.Encoder的整体结构堆叠
curl请求一直等待但是postman访问正常的问题处理幻灭行度异常问题 curl
问题说明：研发开发的接口，使用postman工具调用时正常响应。但是使用curl时会一直等待接口响应。curl命令如下：curl-XPOST"http://localhost:8000/api/apiTest"\-H"xRequestId:5e4787a69959450f8d3f537ab1f7c149"\-H"xTimestamp:1752562369002"\-H"nodeId:9111010
phpStrom 配置Laravel代码提示 2022-03-21 阿然学编程
phpstrom安装laravel插件并启用本插件image.png重启项目右下角会跳出LaravelPlugin提示框并点击自动配置image.png或者手动启用image.png使用Composer安装barryvdh/laravel-ide-helper#推荐--dev因为这个包不需要同步到线上composerrequirebarryvdh/laravel-ide-helper--dev#如
DataWhale 二月组队学习-深入浅出pytorch-Task04 －273.15K DataWhale组队学习学习 pytorch 人工智能
一、自定义损失函数1.损失函数的作用与自定义意义在深度学习中，损失函数（LossFunction）用于衡量模型预测结果与真实标签之间的差异，是模型优化的目标。PyTorch内置了多种常用损失函数（如交叉熵损失nn.CrossEntropyLoss、均方误差nn.MSELoss等）。但在实际任务中，可能需要针对特定问题设计自定义损失函数，例如：处理类别不平衡问题（如加权交叉熵）实现特殊业务需求（如对
Java基础一键通冠位巴萨辛山の翁 java 开发语言学习
以下代码均使用IntelliJIDEA2024.1下运行，代码来源为学习java过程中所写代码。交流学习使用。1-Java入门1.1HellopublicclassHello{/***主函数执行程序的入口点*此函数没有接收任何参数，也没有返回值*它首先打印多次"Hello"，然后调用getCode()方法并打印其返回值*@paramargs命令行参数，本程序中未使用*/publicstaticvo
计算机网络体系结构与数据通信（补充）：端口拟古的新打油诗 #计算机网络系统结构与数据通信数据通信端口
端口Port，端口有物理意义上的端口和逻辑意义上的端口1、物理意义的端口如集线器、交换机、路由器等连接其他网络设备的接口、RJ-45端口（网卡端口）、RS232端口（串行端口）2、逻辑意义的端口指TCP/IP协议中的端口，用来区分不同的网络服务，占有16位，大小为65536，也就是一台计算机有65535个端口，应用进程之间的通讯都要依靠端口，一个应用进程对应一个端口。分为：公认端口：0-1023，
Traefik 中实现流量治理3种方式和场景选择老兵发新帖云原生
Traefik中实现功能扩展或流量治理，三种主流实现方式的对比及典型应用场景：⚙️1.中间件链（MiddlewareChain）——最常用、开箱即用适用场景：基础流量治理（如请求头修改、身份认证、限流等）。优势：配置简单、无需编码、原生集成。典型实现：请求头操作：通过Header中间件增删/修改Header。身份认证：使用ForwardAuth将请求转发至外部认证服务（如Keycloak）。URL
精选好文//朗读小队日报（带音频） 2021.7.6之一结子青莲
时间：2021.7.6日晚8点朗读者：知心爱人朗读文章：《梦回大宋朝》文章作者：离九思作者少年时代由于受评书、戏曲和电视剧的影响，宋代在她的眼中，是一个颠倒黑白、忠奸混淆的暗黑时代。无论是含冤屈死的岳飛、罢官而终的狄青，殒身殉国的杨业、从容就义的文天祥，似乎都难以善终。而臭名昭著如蔡京、童贯、秦桧、梁师成、贾似道等却能升官发财权势滔天。以邪压正成为两宋的常态。随着时光荏苒，大学时代再看宋代，看到的
应用集成体系深度解析：从数据互通到流程协同
一、应用集成核心概念框架应用集成功能互操作业务逻辑驱动异构系统协同语义互理解协议兼容1.本质定义核心内涵：多个应用系统基于业务逻辑的功能级互操作关键特征：业务逻辑驱动的功能调用（非简单数据传递）双向/多向的交互式通信实时或近实时的响应机制与传统集成区别：数据集成静态数据迁移字段映射应用集成动态功能协同服务调用二、分层支撑体系1.基础支撑层层级功能技术实现关键指标网络集成物理连通性TCP/IP,VL
手绘电路图的节点和端点检测一个简化版的算法实现框架 zhangfeng1133 算法
于论文描述，我将提供一个简化版的算法实现框架，用于手绘电路图的节点和端点检测，并整合生成电路原理图。以下代码结合了YOLOv5目标检测和传统图像处理技术，符合论文中提到的98.2%mAP和92%节点识别准确率的关键指标。核心算法实现（Python+OpenCV+YOLOv5）importcv2importnumpyasnpimporttorchfromyolov5importYOLOv5#需要安装
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D