灰巧克力爱松露

检测9000类物体的YOLO9000

YOLO9000

原文为Joseph Redmon与Ali Farhadi的文章“YOLO9000: Better, Faster, Stronger”。本想总结一下，看完发现整篇文章多余的话有点少。YOLO的实时性众所周知，所以还等什么，皮皮虾我们走~

摘要

多尺度训练YOLOv2；权衡速度和准确率，运行在不同大小图像上。YOLOv2测试VOC 2007 数据集： 67 FPS时， 76.8 mAP； 40 FPS时， 78.6 mAP。

联合训练物体检测和分类，可检测未标签检测数据的物体的类别。ImageNet检测验证集上，YOLO9000仅用 200 类中的 44 类检测数据获得 19.7 mAP；对COCO中缺少的 156 类检测数据获得 16.0 mAP。

1. 简介

神经网络引入后，检测框架变得更快更准确。然而，大多数检测方法受限于少量物体。相比分类和加标签等其它任务的数据集，目前物体检测的数据集有限。
将检测扩展到分类层面。然而，标注检测图像相比其它任务更加昂贵。因此，提出新方法扩展目前检测系统的范围。对物体分类的分层视图可合并不同的数据集。
检测和训练数据上联合训练物体检测器，用有标签的检测图像来学习精确定位，同时用分类图像来增加词汇和鲁棒性。

原YOLO系统上生成YOLOv2检测器；在ImageNet中超过 9000 类的数据和COCO的检测数据上，合并数据集和联合训练YOLO9000。

2. 更好

相比Fast R-CNN对YOLO误差分析，显示YOLO有显著的定位误差。YOLO与其它基于区域建议的方法召回率相对较低。因此，保持分类准确率的同时，着重改善召回率和定位。

计算机视觉一般倾向更大更深的模型。训练更大网络或集成多个模型通常会有更好的效果。然而，我们希望YOLOv2检测器保留速度的同时更加精确，因此，简化网络来易于学习表示。结果见表 2 。

2.1 块归一化（Batch Normalization）

无需其它形式的正则，块归一化收敛时显著变好。块归一化有助于模型正则，可从未过拟合的模型中删除dropout。YOLO上所有卷积层上添加块归一化，mAP提高 2 %。

2.2 分类器输入更高分辨率

所有领先的检测方法都使用ImageNet上预训练好的分类器。从AlexNet起，大多分类器的输入图像分辨率都小于 256×256 。
- 原YOLO： 224×224 大小的图像上训练分类器，检测时分辨率提高至448。网络须同时切换至学习物体检测，并调整至新的输入分辨率。
- YOLOv2：ImageNet上按 448×448 分辨率，微调分类网络 10 个周期（epochs）；检测数据上微调网络。高分辨率的分类网络使mAP提高 4 %。

2.3 用锚箱（Anchor Boxes）的卷积

YOLO用卷积特征提取器顶部的全连接层来直接预测边界框的坐标。
Faster R-CNN用精心挑选的先验来预测边界框。Faster R-CNN中的区域建议网络（RPN）仅用卷积层直接预测锚箱的偏移和置信度。因预测层为卷积层，RPN预测特征图中每个位置上锚箱的偏移。
预测偏移而非坐标，简化了问题，且使网络更易学。

删除YOLO的全连接层，用锚箱预测边界框：删除一池化层使网络卷积层的输出有更高的分辨率。将网络输入图像的分辨率从 448×448 缩小至 416×416 ，此时特征图有奇数个位置，出现了一中心单元。
输入图像分辨率为 416×416 ，YOLO卷积层按 32 倍数下采样图像，输出特征图大小为 13×13 。

锚箱的使用从空间位置中解耦出类别预测，并预测每个锚箱的类别和物体（objectness）：
- 物体预测：同YOLO，仍为预测建议框与真实框的IOU；
- 类别预测：给定已存在物体，预测该类的条件概率。

使用锚箱，准确度略降。YOLO对每幅图仅预测98个建议框，而用锚箱模型可预测上千个建议框。无锚箱时的中间模型得 69.5 mAP和 81 %召回率；有锚箱时的模型得 69.2 mAP和 88 %召回率。mAP略减，但召回率的提高说明模型仍可能改进。

2.4 维度聚类

YOLO中用锚箱会碰到两个问题。第1个问题：锚箱的维度为手动挑选，网络可学习合适地调整锚箱，但为网络挑选更好的先验能更容易学到更好的检测器。

训练集边界框上用K-means聚类来自动找好的先验：用标准K-means（欧几里德距离）时，更大的边界框会产生更大的误差。而获得好的IOU分数的先验应与建议框的大小无关。因此，使用如下距离测量：

d (b o x, c e n t r o i d) = 1 - I O U (b o x, c e n t r o i d)

选多个k值，画出最近中心的平均IOU，如下图。权衡模型复杂度和高召回率，选择

k=5 。聚类的中心与手动挑选的锚箱明显不同， 窄长的边界框更多。

比较表1中聚类策略的最近先验与手动挑选的锚箱的平均IOU。 5 个先验中心（ 61 %）与 9 个锚箱（ 60.9 %）的效果接近。 9 个先验中心的平均IOU高得多（ 67.2 %）。
K-means生成的边界框有更好的表示，任务更易学。

2.5 直接预测位置

YOLO中用锚箱时遇到的第2个问题：模型不稳定，尤其是早期迭代时。大多不稳定来自预测锚箱的位置 (x,y) 。区域建议网络预测值 tx 和 ty ，中心坐标 (x,y) 计算如下：

x = (t x * w a) + x a y = (t y * h a) + y a

如，

tx=1 时，

x=wa+xa ，预测的位置右移一个锚箱宽度；

tx=−1 时，

x=xa−wa ，预测的位置左移相同的宽度。
该公式无约束，使锚箱可到达图像中任意位置。随机初始化的模型要花很长时间稳定，才可预测出合理的偏移。
除了预测偏移，同YOLO一样，预测相对网格单元的位置坐标。真实边界框的位置范围落入

[0,1] 之间。Logistic激活约束网络预测落入该范围。

对输出特征图中的每个单元，网络预测 5 个边界框。网络预测每个边界框的 5 个坐标 tx,ty,tw,th 和 to 。若单元从图像的左上角偏移 (cx,cy) ，且边界框有先验 pw,ph ，则预测为：

b x = σ (t x) + c x b y = σ (t y) + c y b w = p w e t w b h = p h e t h P r (o b j e c t) * I O U (b, o b j e c t) = σ (t o)

约束位置预测更易学参数化，使网络更稳定。带直接预测边界框的中心位置聚类相比带锚箱的中心位置聚类提高近 5 %。

2.6 细粒度特征

更改后的YOLO在 13×13 的特征图上检测。大物体上检测充分，但小物体可能需要更为细粒度的特征。Faster R-CNN和SSD在不同大小的特征图上运行RPN，从而获得不同的分辨率。这里仅用穿越层（pass-through layer）取出分辨率为 26∗26 的上一层。

类似残差网络的恒等映射，穿越层堆叠相邻特征至不同的通道（而非空间位置）来关联高分辨率特征和低分辨率特征。此时关联原有的特征， 26×26×512 个特征图变为 13×13×2048 个特征图。扩展的特征图上运行的检测器有更精细的特征，性能提高 1 %。

2.7 多尺度训练

原YOLO的输入分辨率为 448×448 。引入锚箱后，分辨率改为 416×416 。希望YOLOv2鲁棒运行在不同大小的图像上。

每隔几次迭代改变网络结构：每 10 个图像块，网络会选择新的图像大小。因网络下采样因子为 32 ： {320,352,...608} 。因此，可选的最小分辨率为 320×320 ，且最大分辨率为 608×608 。缩放网络至相应维度，继续训练。

缩放网络至不同的维度：对图像输入分辨率最大时的网络，每个卷积层输出的特征图维度固定。所以，对不同分辨率的图像，应是优先保留顶层的权重，底层的卷积层用相同分辨率的输入图像替换来完成训练，同时屏蔽高于输入图像分辨率的卷积层。

输入 288×288 大小的图像时，YOLOv2的mAP接近Fast R-CNN的mAP时，运行速度超过 90 FPS；输入高分辨率的图像时，YOLOv2实时运行，且在VOC 2007上的mAP为 78.6 。YOLOv2与VOC 2007上其他框架的比较见表 3 和图 4 。

2.8 更多实验

VOC 2007+2012上，YOLOv2运行快过其它方法，mAP为 73.4 ，见表 4 ；COCO上，YOLOv2的mAP为 44.0 ，与SSD和Faster R-CNN差不多，见表 5 。

3. 更快

大多检测框架基于VGG-16来提取特征。VGG-16网络分类强大准确，但却不必要的复杂。VGG-16的卷积层在单幅 224×224 大小图像上 1 次传递的浮点操作 306.9 亿次。
YOLO框架基于Googlenet结构，快过VGG-16， 1 次传递仅用 85.2 亿次操作。但准确率略低于VGG-16。对 224×224 大小图像上的top- 5 准确率，用Googlenet结构的YOLO为 88 %，VGG-16为 90.0 %。

3.1 Darknet-19

类似VGG模型，大多用 3×3 的滤波器且每次池化通道数加一倍。按Network in Network用全局平均池化预测和 1×1 大小的滤波器来压缩 3×3 大小卷积间的特征表示。块归一化来稳定训练，加快收敛和正则化模型。

最终的模型 Darknet-19有 19 个卷积层和 5 个池化层，见表 6 。Imagenet上，Darknet-19处理单幅图像仅 55.8 亿次操作，但top-1和top-5准确率分别为 72.9 %和 91.2 %。

3.2 分类训练

标准Imagenet 分类数据集（1000类）上训练网络 160 个周期（epoch）。训练Darknet网络框架：学习率为 0.1 ，多项式速率衰减（?）的幂为 4 ，权重衰减为 0.0005 ，动量为 0.9 。训练时用标准的数据增广方法，包括随机裁剪，旋转，色调，饱和度和曝光偏移。
224×224 大小图像上开始训练， 448×448 大小图像上微调。微调时用初始的参数。仅 10 步训练后，学习率用 10−3 微调。更高分辨率上网络的top-1和top-5准确率为 76.5 %和 93.3 %。

3.3 检测训练

删除最后一卷积层，不用 3 个 3×3 的卷积层（每层有 1024 个滤波器），替换为 3 个 1×1 的卷积层（每层的滤波器数目等于检测所需的输出数目）。VOC上，预测 5 个框（每个框 5 个坐标，共 20 类， (5+20)×5 ），所以输出数目为 125 。添加 3×3×512 层至后面的第 2 层和最后一卷积层，模型可用到细粒度的特征。
训练网络时的初始学习率为 10−3 ， 60−90 个周期上除以 10 ；权重衰减为 0.0005 ，动量为 0.9 。类似的数据增广，COCO和VOC上用相同的训练策略。

4. 更强

联合训练检测和分类。检测时用有标签图像来预测边界框坐标，物体（objectness）和分类日常物体。用有类标签的图像来扩展可检测的类数目。

训练检测时，基于整个YOLOv2损失函数来反向传播；训练分类时，仅用网络结构中的分类部分来反传损失。
联合训练的挑战：检测数据集只有日常物体和一般的标签，如“狗”或“船”；分类数据集标签的范围更广更深。 Imagenet有上千种狗，如“诺福克梗犬”,“约克郡犬”和“贝得灵顿厚毛犬”等。所以，训练两个数据集时，须合并标签。

大多方法对所有可能的类别用 1 个softmax层来计算最后的概率分布。用softmax时假设类间互斥。合并数据集出现的问题：“诺福克梗犬”和“狗”类不互斥。

4.1 分层分类

Imagenet的标签取自WordNet（排列概念及其关联的语言数据库）。WordNet中，“诺福克梗犬”和“约克郡犬”为“小猎狗”的难判名，“小猎狗”为“狗”的一类，是“犬科动物”。大多方法却用扁平的标签结构。

WordNet的结构为有向图，而非树。如，“狗”是“犬科动物”类和“家畜”类，两者为WordNet中的同义词集。为简化问题，不用完整的图结构，仅用Imagenet中的概念来搭建分层树。

为搭建分层树，检查Imagenet中的视觉名词，从WordNet图至根节点（“物体”）寻找这些名词的路径。图中很多同义词集仅有 1 条路径，所以，先将这些名词加入树。接着迭代检查剩下的概念，一点点在树里添加路径。若 1 个概念到根节点有 2 条路，其中 1 路有 3 条边，另外 1 路有 1 条边，选择更短的路径。

最终得到WordTree，视觉名词的分层模型。用WordTree分类时，给定同义词集，预测每个节点的条件概率来获得该词集中每个难判名的概率。如，“小猎狗（terrier）”节点上预测：

P r (N o r f o l k t e r r i e r | t e r r i e r) P r (Y o r k s h i r e t e r r i e r | t e r r i e r) P r (B e d l i n g t o n t e r r i e r | t e r r i e r) . . .

沿特定节点至树的根节点，乘以路径上的条件概率，即可计算该特定节点上的绝对概率。如，计算图中为“约克郡犬”的绝对概率：

P r (N o r f o l k t e r r i e r) = P r (N o r f o l k t e r r i e r | t e r r i e r) * P r (t e r r i e r | h u n t i n g d o g) * . . . * P r (m a m m a l | a n i m a l) * P r (a n i m a l | p h y s i c a l o b j e c t)

分类时，假设图中包含物体： Pr(physical object)=1 。

1000 类Imagenet上搭WordTree，训练Darknet-19模型。搭建WordTree1k时，添加所有中间节点，标签空间从 1000 扩展至 1369 。训练时传递标签，真实标签传递至树的上层节点。若图像标签为“诺福克梗犬”，该图像也应标为“狗”和“哺乳动物”等。为计算条件概率，模型预测 1369 值的 1 个向量，计算所有相同概念下难判名的同义词集的softmax，见图 5 。

WordTree向量中，除根节点为“physical object”，从左向右名词描述得越来越具体，从而使难判名的同义词集会集中在向量的某段，便于每个softmax的连接。

用与之前相同的训练参数，分层Draknet-19的top-1和top-5准确率分别为 71.9 %和 90.4 %。尽管添加了额外的 369 个概念，并用网络预测树结构，但准确率仅略降。如此分类使新的或未知类上的表现平稳降低。如，网络看到狗，但不确定为哪种狗，此时网络仍会以高置信度来预测狗，但各难判名间的置信度会更低。

该表述同样使用于检测。分类时，假设每幅图会包含 1 个物体；但检测时，YOLOv2物体检测器要给出 Pr(physical object) 的值。检测器预测 1 个物体边界框及其概率树。沿WordTree树结构往右，找每个softmax分支的最高置信度路径直至达到某阈值，此时，路径上离根节点最远的节点名词即为预测类。

4.2 与词数（WordTree）结合的数据集

用WordTree合并Imagenet与COCO的标签，见图 6 。

4.3 联合分类与检测

用合并的数据集来联合训练分类和检测模型。为训练极大规模的检测器，合并COCO检测数据集和整个Imagenet的前 9000 类标签，创建出新的数据集。合并后数据集的WordTree有 9418 类。Imagenet为更大的数据集，所以，过采样COCO来平衡合并的数据集，此时，Imagenet大小为过采样COCO的 4 倍。

合并数据集训练YOLO9000。用基YOLOv2结构，但改为 3 个（而非 5 ）先验（见“维度聚类”）来限制输出大小。检测时，网络反传检测损失；分类时，网络反传标签所在节点以上节点的损失。如，标签为“狗”时，深入树更下层（“德国牧羊犬”还是“金毛犬”）会对预测引入误差，因为标签未给出狗种类信息。

分类时，网络仅反传分类损失。假设预测框与真实标签框的IOU大于 0.3 时，反传物体（objectness）损失。

Imagenet检测任务与COCO共享 44 个物体类，所以YOLO9000只能看到大多测试图像的分类数据，而非检测数据。YOLO9000的总体mAP为 19.7 ，未知的 156 物体类上的mAP为 16.0 。该mAP高于DPM，且仅用部分监督（partial supervision）在不同数据集上训练YOLO9000。同时实时检测9000类物体。

分析Imagenet上YOLO9000的表现，发现它很好地学到新动物物种（与COCO中动物类有很好的泛化），但衣物和设备等类学习困难（COCO无对人的衣物类标签，难学到“太阳镜”或“泳裤”），见表 7 。

YOLO9000的表现换一解释。前面提到，检测器用来检测物体（objectness），分类器用于分类对象（object）类别。训练检测器时，网络会将COCO中所包含的对象类视为物体，但COCO的对象标签不包括衣物和设备，所以，YOLO9000自然不会轻易把衣物或设备等对象视为物体。

作者实验的目的是：验证合并了COCO检测数据集和Imagenet分类数据集后，模型在Imagenet检测数据集上的效果。省去标定巨大的检测数据集的高昂成本，利用有限的检测数据集和巨大的分类数据集来完成巨大的检测数据集上的检测任务。

5. 小结

“更好”和“更快”部分可能并不会有多大影响，毕竟那些小技巧改善的效果有限。但“更强”部分现实意义很强啊，真是有意思~

全文未经校正，有问题欢迎指出。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
联邦学习 Federated learning Google I/O‘19 笔记努力搬砖的星期五笔记联邦学习机器学习机器学习 tensorflow
FederatedLearning:MachineLearningonDecentralizeddatahttps://www.youtube.com/watch?v=89BGjQYA0uE文章目录FederatedLearning:MachineLearningonDecentralizeddata1.DecentralizeddataEdgedevicesGboard:mobilekeyboa
PCL 怎样可视化深度图像 LeonDL168 PCL 计算机视觉人工智能视觉检测图像处理算法
本小节讲解如何可视化深度图像的两种方法，在3D视窗中以点云形式进行可视化（深度图像来源于点云），另一种是，将深度值映射为颜色，从而以彩色图像方式可视化深度图像。代码首先，在PCL（PointCloudLearning）中国协助发行的书提供光盘的第7章例2文件夹中，打开名为range_image_visualization.cpp的代码文件，同文件夹下可以找到相关的测试点云文件room_scan1.
el-dialog高度设置夏之小星星前端 vue.js elementui css
el-dialog高度设置::v-deep.el-dialog{height:78vh;overflow:auto;}
elementuiPlus取消el-input的边框 qq_39016177 elementui
elementuiPlus取消el-input的边框1.通常取消边框的方法设置border为none2.还有其他类似边框的例如outlinebox-shadow这两个属性都是会产生边框效果3.el-input需要更改的话–如下需要修改box-shadow为空即可上代码:deep(.el-input__wrapper){align-items:center;background-color:#F7F
【双语新闻】AGI安全与对齐，DeepMind近期工作曲奇人工智能安全 agi 安全 llama 人工智能
我们想与AF社区分享我们最近的工作总结。以下是关于我们正在做什么，为什么会这么做以及我们认为它的意义所在的一些详细信息。我们希望这能帮助人们从我们的工作基础上继续发展，并了解他们的工作如何与我们相关联。byRohinShah,SebFarquhar,AncaDragan21stAug2024AIAlignmentForumWewantedtosharearecapofourrecentoutput
Awesome TensorFlow weixin_30594001 人工智能移动开发大数据
AwesomeTensorFlowAcuratedlistofawesomeTensorFlowexperiments,libraries,andprojects.Inspiredbyawesome-machine-learning.WhatisTensorFlow?TensorFlowisanopensourcesoftwarelibraryfornumericalcomputationusin
【ShuQiHere】探索人工智能核心：机器学习的奥秘 ShuQiHere 人工智能机器学习
【ShuQiHere】什么是机器学习？机器学习（MachineLearning,ML）是人工智能（ArtificialIntelligence,AI）中最关键的组成部分之一。它使得计算机不仅能够处理数据，还能从数据中学习，从而做出预测和决策。无论是语音识别、自动驾驶还是推荐系统，背后都依赖于机器学习模型。机器学习与传统的编程不同，它不再依赖于人类编写的固定规则，而是通过数据自我改进模型，从而更灵活
综述论文“A Survey of Zero-Shot Learning: Settings, Methods, and Applications” 硅谷秋水机器学习机器学习神经网络深度学习
该零样本学习综述，发表于ACMTrans.Intell.Syst.Technol.10,2,Article13(January2019)摘要：大多数机器学习方法着重于对已经在训练中看到其类别的实例进行分类。实际上，许多应用程序需要对实例进行分类，而这些实例的类以前没有见过。零样本学习（Zero-ShotLearning）是一种强大而有前途的学习范例，其中训练实例涵盖的类别与想分类的类别是不相交的。
机器学习 VS 表示学习 VS 深度学习 Efred.D 人工智能机器学习深度学习人工智能
文章目录前言一、机器学习是什么?二、表示学习三、深度学习总结前言本文主要阐述机器学习,表示学习和深度学习的原理和区别.一、机器学习是什么?机器学习(machinelearning),是从有限的数据集中学习到一定的规律,再把学到的规律应用到一些相似的样本集中做预测.机器学习的历史可以追溯到20世纪40年代McCulloch提出的人工神经元网络,目前学界大致把机器学习分为传统机器学习和机器学习两个类别
端到端的自动驾驶论文与代码整理大别山伧父自动驾驶
LearningbyCheatinggithubcodearxivpaperconferenceonrobotlearning最新进展(May2021)Checkoutourlatestfollow-upwork:WorldonRails(2020)Checkoutoursubmissiontothe2020CARLAChallenge!pass
Lt-8 Multithreading yanlingyun0210 java
IntendedLearningOutcomesTounderstandtheconceptofconcurrency.Tounderstandthedifferenceofaprocessandathread.TodefineathreadusingtheThreadclassandRunnableinterface.TocontrolthreadswithvariousThreadmethod
如何使用Pytorch-Metric-Learning？鱼儿也有烦恼 PyTorch pytorch
文章目录如何使用Pytorch-Metric-Learning？1.Pytorch-Metric-Learning库9个模块的功能1.1Sampler模块1.2Miner模块1.3Loss模块1.4Reducer模块1.5Distance模块1.6Regularizer模块1.7Trainer模块1.8Tester模块1.9Utils模块2.如何使用PyTorchMetricLearning库中的
[Kaiming]Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification MTandHJ neural networks
文章目录概主要内容PReLUKaiming初始化ForwardcaseBackwardcaseHeK,ZhangX,RenS,etal.DelvingDeepintoRectifiers:SurpassingHuman-LevelPerformanceonImageNetClassification[C].internationalconferenceoncomputervision,2015:1
深度神经网络详解：原理、架构与应用阿达C 活动 dnn 计算机网络人工智能神经网络机器学习深度学习
深度神经网络（DeepNeuralNetwork，DNN）是机器学习领域中最为重要和广泛应用的技术之一。它模仿人脑神经元的结构，通过多层神经元的连接和训练，能够处理复杂的非线性问题。在图像识别、自然语言处理、语音识别等领域，深度神经网络展示了强大的性能。本文将深入解析深度神经网络的基本原理、常见架构及其实际应用。一、深度神经网络的基本原理1.1神经元和感知器神经元是深度神经网络的基本组成单元。一个
前端开发需要了解的算法知识史努比的大头算法前端
手写深拷贝functiondeepClone(obj){//处理基础数据类型和函数if(obj===null||typeofobj!=='object'){returnobj;}//处理数组if(Array.isArray(obj)){returnobj.map(item=>deepClone(item));}//处理对象constclonedObj={};for(constkeyinobj){i
推荐开源项目：PyTorch-Metric-Learning 潘惟妍
推荐开源项目：PyTorch-Metric-Learningpytorch-metric-learningTheeasiestwaytousedeepmetriclearninginyourapplication.Modular,flexible,andextensible.WritteninPyTorch.项目地址:https://gitcode.com/gh_mirrors/py/pytorc
推荐：FastAPI驱动的稳定扩散LLMs演示项目褚知茉Jade
推荐：FastAPI驱动的稳定扩散LLMs演示项目FastAPI-for-Machine-Learning-Live-DemoThisrepositorycontainsthefilestobuildyourveryownAIimagegenerationwebapplication!OutlinedarethecorecomponentsoftheFastAPIwebframework,anda
【python】【Ray的概述】资源存储库 python 开发语言
Overview概述Rayisanopen-sourceunifiedframeworkforscalingAIandPythonapplicationslikemachinelearning.Itprovidesthecomputelayerforparallelprocessingsothatyoudon’tneedtobeadistributedsystemsexpert.Rayminimi
什么是监督学习（Supervised Learning）救救孩子把 AI AI 学习
一、监督学习概述监督学习（SupervisedLearning）是一种极具威力的机器学习方法，能够训练算法以识别数据中的模式，并据此进行精准的预测或分类。借助已有的标记数据，监督学习模型学会了从输入到输出的映射关系，进而在各类实际问题中实现自动化决策。无论是医疗诊断、金融市场分析、客户行为预测，还是提升生产效率以及个性化推荐系统等领域，监督学习都彰显出巨大的潜力与价值。随着技术的持续进步，监督学习
LLM系列(4)：通义千问7B在Swift/DeepSpeed上微调秘诀与实战陷阱避坑指南汀、人工智能 LLM工业级落地实践人工智能自然语言处理 prompt Swifi DeepSpeed 通义千问 Qwen
LLM系列(4)：通义千问7B在Swift/DeepSpeed上微调秘诀与实战陷阱避坑指南阿里云于2023年8月3日开源通义千问70亿参数模型，包括通用模型Qwen-7B以及对话模型Qwen-7B-Chat，这也是国内首个开源自家大模型的大厂。在诸多权威大模型能力测评基准上，如MMLU、C-Eval、GSM8K、HumanEval、WMT22，通义千问7B均取得了同参数级别开源模型中的最好表现，
使用3DUNet训练自己的数据集（pytorch）— 医疗影像分割编程日记✧ 智能医疗 pytorch 人工智能 python 计算机视觉图像处理深度学习健康医疗
代码：lee-zq/3DUNet-Pytorch:3DUNetimplementedwithpytorch(github.com)文章<cicek16miccai.pdf(uni-freiburg.de)3DU-Net:LearningDenseVolumetricSegmentation
探索任务的隐秘世界：推荐Task2Vec 邓越浪Henry
探索任务的隐秘世界：推荐Task2Vecaws-cv-task2vecOfficialcodeforthepaper"Task2Vec:TaskEmbeddingforMeta-Learning"(https://arxiv.org/abs/1902.03545,ICCV2019)项目地址:https://gitcode.com/gh_mirrors/aw/aws-cv-task2vec在机器学习
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST