会飞的鱼chelmx

《FaceBoxes: A CPU Real-time Face Detector with High Accuracy》论文笔记

FaceBoxes: A CPU Real-time Face Detector with High Accuracy笔记

1. Introduction

略。

2. Related work

略。

3. FaceBoxes

本节介绍了能使 $\mathrm{FaceBoxes}$ 在 $\mathrm{CPU}$ 设备上准确而高效地运行的三点贡献：快速分解卷积层（ $\mathrm{RDCL}$ ）,多尺度卷积层（ $\mathrm{MSCL}$ ）及锚框稠化策略。最后，我们介绍了相关的训练方法。

3.1. Rapidly Digested Convolutional Layers

大多数基于 $\mathrm{CNN}$ 的人脸检测方法都会受到时间开销的限制，尤其是在 $\mathrm{CPU}$ 设备上。更准确地说，当输入、内核和输出大小较大时， $\mathrm{CPU}$ 卷积运算非常耗时。我们提出的 $\mathrm{RDCL}$ 通过采用适当的内核大小并减少输出通道数的方式快速收缩输入空间大小，这使得 $\mathrm{FaceBoxes}$ 能在 $\mathrm{CPU}$ 设备上达到实时的速度：

收缩输入空间大小：为了快速收缩输入空间大小，我们在 $\mathrm{RDCL}$ 的卷积层和池化层中采用了大步长。如下图所示， $\mathrm{Conv1}$ 、 $\mathrm{Pool1}$ 、 $\mathrm{Conv2}$ 和 $\mathrm{Pool2}$ 的步长分别为 $4$ 、 $2$ 、 $2$ 和 $2$ 。 $\mathrm{RDCL}$ 的总步长为 $32$ ，这意味着输入空间可以快速地收缩 $32$ 倍。

选择适当的内核大小：在一个网络中，前几层的内核大小应该较小，这样可以降低网络推理延迟，但从减轻由空间大小减小造成的信息损失的角度来看，内核大小应该较大。如下图所示，为了保证网络的高效与有效性，我们将 $\mathrm{Conv1}$ 、 $\mathrm{Conv2}$ 及所有池化层的内核大小分别设置为 $7\times 7$ ， $5\times 5$ 及 $3\times 3$ 。

减少输出通道数：我们利用 $\mathrm{C.ReLU}$ 激活函数（如下图 $(a)$ 所示）来减少输出通道数。有研究表明，在 $\mathrm{CNN}$ 的较低层中滤波器成对（即相位相反的滤波器）出现。 $\mathrm{C.ReLU}$ 函数将原始输出与取反输出相串联，并使用 $\mathrm{ReLU}$ 函数对串联张量进行激活，最终输出通道数会增加一倍。 $\mathrm{C.ReLU}$ 函数可以显著提高速度，同时其导致的精确度下降可以忽略不计。

$\mathrm{C.ReLU}$ ：是文献《 $U n d e r s t a n d i n g$ $a n d$ $I m p r o v i n g$ $C o n v o l u t i o n a l$ $N e u r a l$ $N e t w o r k s$ $v i a$ $C o n c a t e n a t e d$ $R e c t i f i e d$ $L i n e a r$ $U n i t s$ 》提出的激活函数。作者在研究 $\mathrm{CNN}$ 模型时发现，使用 $\mathrm{ReLU}$ 作为激活函数时，模型最初几层学习到的滤波器存在负相似性，这说明这些滤波器存在冗余。作者在 $\mathrm{AlexNet}$ 模型上进行实验，模型前 $5$ 层卷积层的滤波器余弦相似度统计如下图所示，其中蓝色表示模型滤波器相似度直方图统计，红色表示随机滤波器相似度统计。一开始，模型滤波器相似度中心位于负轴，随着层数的加深，中心逐渐向零靠拢。作者猜想由于 $\mathrm{ReLU}$ 函数会消除负值，所以模型前几层会通过学习负相似的滤波器来抵消这种影响。如果显示地利用上述先验知识，设计一种允许正负值同时通过的激活函数，那么就可以降低滤波器冗余。

3.2. Multiple Scale Convolutional Layers

本文提出的方法基于 $\mathrm{RPN}$ 改进， $\mathrm{RPN}$ 是一种在多类别目标检测场景中发展起来的与类别无关的候选器。对于单类别检测任务（如人脸检测）， $\mathrm{RPN}$ 则可以看作一种与类别相关的检测器。然而，作为一种独立的人脸检测算法， $\mathrm{RPN}$ 并不具有竞争力。我们认为这主要由两个方面造成。首先， $\mathrm{RPN}$ 锚框特征来自于最后一个卷积层，其特异性和分辨率不足以处理各种不同尺度的人脸。其次，锚框所关联的卷积层感受野单一，无法匹配不同尺度的人脸。为了解决上述两个问题，我们提出的 $\mathrm{MSCL}$ 从以下两个维度进行设计：

网络深度维度的多尺度设计. 如 $3.1$ 节图 $1$ 所示，我们设计的 $\mathrm{MSCL}$ 由多个层结构组成。这些层的尺寸逐渐减小，并且其中一部分层输出会组合形成多尺度特征图。与 $\mathrm{SSD}$ 相似，我们的默认锚框与不同尺度的特征图（即 $\mathrm{Inception3}$ 、 $\mathrm{Conv3\_2}$ 及 $\mathrm{Conv4\_2}$ ）相关联。这些层是一种沿着网络深度维度的多尺度设计，将锚框离散到不同分辨率的多个层上，可以处理不同大小的人脸。

网络宽度维度的多尺度设计. 为了学习不同尺度的人脸视觉模式，锚框相关层的输出应该对应不同大小的感受野，这可以通过 $\mathrm{Inception}$ 模块轻松实现。 $\mathrm{Inception}$ 模块由不同核的多个卷积分支组成。这些分支是一种沿着网络宽度维度的多尺度设计，能够丰富感受野。如 $3.1$ 节图 $1$ 所示， $\mathrm{MSCL}$ 的前三层基于 $\mathrm{Inception}$ 模块设计。我们的 $\mathrm{Inception}$ 模块实现如 $3.1$ 节图 $2 (b)$ 所示，这是一种性价比很高的模块，可以捕捉不同尺度的人脸。

3.3. Anchor densification strategy

如 $3.1$ 节图 $1$ 所示，我们对于默认锚框采用 $1 : 1$ 的纵横比（即正方形锚框），这是因为人脸框接近于正方形。对于 $\mathrm{Inception3}$ 层而言，其锚框尺度为 $32$ 、 $64$ 及 $128$ 像素，对于 $\mathrm{Conv3\_2}$ 及 $\mathrm{Conv4\_2}$ 层而言，其锚框分别为 $256$ 及 $512$ 像素。

在原始输入图像上，其锚框间隔等于锚框相关联层的总体步长。举个例子， $\mathrm{Conv3\_2}$ 的总体步长为 $64$ 像素，其锚框尺寸为 $256\times256$ ，这意味着在输入图像上，每 $64$ 像素就会有一个 $256\times256$ 的锚框。我们用下式定义锚框密度：
$A_{density}=A_{scale}/A_{interval}$
其中， $A_{scale}$ 表示锚框尺寸， $A_{interval}$ 表示锚框间隔。我们的默认锚框间隔分别为 $32$ ， $32$ ， $32$ ， $64$ 及 $128$ 。根据上式，其对应的锚框密度为 $1$ ， $2$ ， $4$ ， $4$ 及 $4$ ，很显然，对于不同尺度的锚框存在密度不平衡的问题。与大锚框（即 $128\times128$ 、 $256\times256$ 及 $512\times512$ ）相比，小锚框（即 $32\times32$ 及 $64\times64$ ）过于稀疏，这会导致小尺度人脸的召回率的降低。

为了消除这种不平衡，我们提出了一种锚框稠化策略。具体来说，为了稠化某一种类型的锚框，我们会在感受野中心均匀的平铺 $A_{number}=n^2$ 个而非 $1$ 个锚框，如下图所示。在本文中，我们将 $32\times32$ 的锚框稠化了 $4$ 倍， $64\times64$ 的锚框稠化了 $2$ 倍，这保证了不同尺度的锚框在输入图像上都具有相同的密度（即 $4$ ），因此不同尺度的人脸可以匹配几乎相同数量的锚框。

3.4. Training

本节我们将介绍训练数据集、数据增强、匹配策略、损失函数、难负例挖掘及其他实现细节。

训练数据集. 我们的模型在 $\mathrm{WIDER}\ \mathrm{FACE}$ 的 $12880$ 张图片的训练集上进行训练。

数据增强. 每张训练图片都通过以下数据增强策略进行顺序处理。

颜色变换：我们对原始图像应用了一些与文献《 $S o m e$ $i m p r o v e m e n t s$ $o n$ $d e e p$ $c o n v o l u t i o n a l$ $n e u r a l$ $n e t w o r k$ $b a s e d$ $i m a g e$ $c l a s s i f i c a t i o n$ 》相似的像素变换。
随机裁剪：我们会从原始图像中随机裁剪五个正方形补丁：其中一个正方形补丁按最大尺寸进行裁剪，其余正方形补丁按原始图像短边尺寸的 $[0.3, 1]$ 进行裁剪。之后，我们随机挑选一个补丁进行后续操作。
尺寸变换：随机裁剪之后，我们将挑选的正方形补丁调整至 $1024\times1024$ 。
水平翻转：调整后的图像按概率 $0.5$ 进行水平翻转。
人脸框过滤：如果人脸框中心位于上述处理过的图像中，我们会保留其重叠部分，如果保留的人脸框宽度或高度小于 $20$ 个像素，我们会将其过滤掉。

匹配策略. 在训练期间，我们需要决定哪些锚框与人脸框相关。首先我们会将人脸框按最佳** $\mathrm{jaccard}$ 重叠**匹配到相应的锚框上，其次我们也会把锚框与任意人脸框jaccard重叠超过某一阈值（如 $0.35$ ）的框相匹配。

颜色变换:

$\mathrm{jaccard}$ 重叠：

损失函数. 我们的损失函数与 $\mathrm{Fster\ R-CNN}$ 中 $\mathrm{RPN}$ 的损失函数相同。对于分类部分我们使用 $2$ 分类 $\mathrm{softmax}$ 损失，对于回归部分我们使用 $\mathrm{smooth\ L1}$ 损失。

难负例挖掘. 锚框匹配完成后，我们发现绝大部分锚框都为负例，这导致正负例严重不平衡。为了更快且更稳定地训练模型，我们会将锚框按损失值排序并选取最高的几个进行训练，同时我们在选取过程中也会保证正负例比率最多不超过 $1 : 3$ 。

其他实现细节. 所有的模型参数都采用了 $\mathrm{xavier}$ 方法随机初始化。模型使用 $\mathrm{SGD}$ 方法进行优化，动量系数为 $0.9$ ，权重衰减系数为 $0.0005$ ，批大小为 $32$ 。模型训练最大迭代次数为 $120 k$ ，在前 $80 k$ 迭代中使用 $10^{-3}$ 大小的学习速率，在后续两个 $20 k$ 迭代中分别使用 $10^{-4}$ 及 $10^{-5}$ 大小的学习速率。整体训练使用 $\mathrm{Caffe}$ 库实现。

4. Experiments

在本节中，我们首先介绍了 $\mathrm{FaceBoxes}$ 的运行效率，然后对模型进行了详细的分析，最后在常用的人脸检测基准上对其进行了评估。

4.1. Runtime efficiency

基于 $\mathrm{CNN}$ 的算法一直被诟病其运行效率不高。尽管现有的 $\mathrm{CNN}$ 人脸检测器可以通过高端 $\mathrm{GPUs}$ 进行加速，但在大多数实际的应用尤其是基于 $\mathrm{CPU}$ 的应用中，其运行速度还不够快。如下所述， $\mathrm{FaceBoxes}$ 具有满足实际需求的足够效率。

在推断过程中， $\mathrm{FaceBoxes}$ 会输出大量的边界框（例如，对于 $\mathrm{VGA}$ 分辨率的图像会输出 $8525$ 个边界框）。首先模型会根据 $0.05$ 的置信阈值过滤掉大多数边界框并保留前 $400$ 个边界框，然后根据 $0.3$ 的 $\mathrm{jaccard}$ 重叠阈值应用 $\mathrm{NMS}$ 并保留前 $200$ 个边界框。我们使用 $\mathrm{Titan\ X(Pascal)}$ 显卡及 $\mathrm{cuDNN\ v5.1}$ 加速库在 $\mathrm{Intel\ Xeon\ [email protected]}$ 中央处理器上进行速度测量。如下表所示，与近来基于 $\mathrm{CNN}$ 的算法相比， $\mathrm{FaceBoxes}$ 可以在 $\mathrm{CPU}$ 上以 $20\ \mathrm{FPS}$ 的速度运行，并且拥有最高水准的准确率。此外，模型也可以在单 $\mathrm{GPU}$ 上以 $125\ \mathrm{FPS}$ 的速度运行，并且只有 $4.1\mathrm{MB}$ 大小。

Approach	CPU-model	mAP(%)	FPS
ACF	[email protected]	85.2	20
CasCNN	[email protected]	85.7	14
FaceCraft	N/A	90.8	10
STN	[email protected]	91.5	10
MTCNN	N/[email protected]	94.4	16
Ours	[email protected]	96.0	20

4.2. Model analysis

我们在 $\mathrm{FDDB}$ 数据集上进行消融实验分析模型。相较于 $\mathrm{AFW}$ 与 $\mathrm{PASCAL}$ 人脸数据集， $\mathrm{FDDB}$ 数据集更具有挑战性，因此在 $\mathrm{FDDB}$ 数据集上分析模型是有说服力的。对于所有的实验，除了对组件进行指定的更改外，我们都使用了相同的设置。

消融设置. 为了更好地理解 $\mathrm{FaceBoxes}$ ，我们依次剔除模型组件以实验各组件对最终性能的影响。1）首先，我们剔除了锚框稠化策略。2）然后，我们将 $\mathrm{MSCL}$ 替换为三个卷积层，每层核大小为 $3\times3$ 且其输出通道数与 $\mathrm{MSCL}$ 前三个 $\mathrm{Inception}$ 模块相同。同时，我们也仅将锚框与最后一层卷积层相关联。3）最后，我们将 $\mathrm{RDCL}$ 中的 $\mathrm{ReLU}$ 替换为 $\mathrm{C.ReLU}$ 。消融实验结果如下表所示，相关实验结论也如下描述：

Contribution	FaceBoxes
RDCL				x
MSCL			x	x
Strategy		x	x	x
Accuracy(mAP)	96.0	94.9	93.9	94.0
Speed(ms)	50.98	48.27	48.23	67.48

锚框稠化策略至关重要. 锚框稠化策略通过增加小锚框的密度（如 $32\times32$ 及 $64\times64$ ）来提高模型对小尺度人脸的召回率。从上表的结果中可以看出，剔除锚框稠化策略后，模型在 $\mathrm{FDDB}$ 数据集上的 $\mathrm{mAP}$ 由 $96.0\%$ 下降至 $94.9\%$ 。 $\mathrm{mAP}$ 性能的骤降（即 $1.1\%$ ）证明了锚框稠化策略的有效性。

$\mathrm{MSCL}$ 更优. 上表第二、三列的比较表明 $\mathrm{MSCL}$ 可以将模型 $\mathrm{mAP}$ 有效地提高 $1.0\%$ ，这归功于 $\mathrm{MSCL}$ 中多种感受野及多尺度锚框的机制。

$\mathrm{RDCL}$ 是一种能保持模型精度的高效组件. $\mathrm{RDCL}$ 的设计使得 $\mathrm{FaceBoxes}$ 能在 $\mathrm{CPU}$ 上实现实时速度。如上表所示， $\mathrm{RDCL}$ 所导致的精度下降可以忽略不计，但对于模型运行速度有显著的提高。具体来说，在 $\mathrm{FDDB}$ 数据集上，模型 $\mathrm{mAP}$ 降低了 $0.1\%$ ，但换取了大约 $19.3\mathrm{ms}$ 的速度提升。

4.3. Evaluation on benchmark

我们在常见的人脸检测基准数据集上评估了 $\mathrm{FaceBoxes}$ ，包括 $\mathrm{AFW}$ ， $\mathrm{PASCAL}$ 人脸及 $\mathrm{FDDB}$ 数据集。

$\mathrm{AFW}$ 数据集. 该数据集包含 $205$ 张图片， $473$ 个人脸。我们将 $\mathrm{FaceBoxes}$ 模型与其他前沿模型及商业人脸检测模型（如 $\mathrm{Face.com}$ ， $\mathrm{Face++}$ 及 $\mathrm{Picasa}$ ）进行对比评估。结果如下图所示， $\mathrm{FaceBoxes}$ 模型相较于其他模型有很明显的优势。

$\mathrm{PASCAL}$ 人脸数据集. 该数据集收集至 $\mathrm{PASCAL}$ 人体部位测试集，包含 $851$ 张图片， $1335$ 个大尺度及不同姿态的人脸。其 $\mathrm{PR}$ 曲线如下图所示。 $\mathrm{FaceBoxes}$ 模型明显优于所有的其他模型及商业人脸检测模型（如 $\mathrm{SkyBiometry}$ ， $\mathrm{Face++}$ 及 $\mathrm{Picasa}$ ）。

$\mathrm{FDDB}$ 数据集. 该数据集包含 $2845$ 张来自 $\mathrm{Yahoo}$ 网站的新闻图片， $5171$ 个人脸。 $\mathrm{FDDB}$ 数据集采用椭圆边界框对人脸进行标注，而 $\mathrm{FaceBoxes}$ 的输出为矩形边界框。这种不一致对于模型连续性评分有很大的影响。为了更公平的评估模型连续性评分，我们训练了一个椭圆回归器用以将模型预测的矩形边界框转换为椭圆边界框。 $\mathrm{FaceBoxes}$ 与其他模型的对比评估如下图所示。 $\mathrm{FaceBoxes}$ 是目前为止性能最好模型，并且其不连续与连续 $\mathrm{ROC}$ 曲线相较于其他模型有很明显的优势。这些结果表明 $\mathrm{FaceBoxes}$ 能够鲁棒地检测出无约束的人脸。

5. Conclusion

略。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
100天持续行动—Day01 Richard_DL
今天开始站着学习，发现效率大幅提升。把fast.ai的Lesson1的后半部分和Lesson2看完了。由于Keras版本和视频中的不一致，运行notebook时经常出现莫名其妙的错误，导致自己只动手实践了视频中的一小部分内容。为了赶时间，我打算先把与CNN相关的视频过一遍。然后尽快开始做自己的项目。明天继续加油，争取把Lesson3和Lesson4看完。
yolov5＞onnx＞ncnn＞apk 图像处理大大大大大牛啊 opencv实战代码讲解 yolo onnx ncnn 安卓
一.yolov5pt模型转onnx条件：colabnotebookyolov51.安装环境!pipinstallonnx>=1.7.0#forONNXexport!pipinstallcoremltools==4.0#forCoreMLexport!pipinstallonnx-simplifier2.修改common.py在classFocus下面
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
[数据集][目标检测]汽车头部尾部检测数据集VOC+YOLO格式5319张3类别 FL1623863129 数据集目标检测汽车 YOLO
数据集制作单位：未来自主研究中心(FIRC)版权单位：未来自主研究中心(FIRC)版权声明：数据集仅仅供个人使用，不得在未授权情况下挂淘宝、咸鱼等交易网站公开售卖,由此引发的法律责任需自行承担数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：5319标注数量(xml文件
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
探索创新科技： Lite-Mono - 简约高效的小型化Mono框架杭律沛Meris
探索创新科技：Lite-Mono-简约高效的小型化Mono框架Lite-Mono[CVPR2023]Lite-Mono:ALightweightCNNandTransformerArchitectureforSelf-SupervisedMonocularDepthEstimation项目地址:https://gitcode.com/gh_mirrors/li/Lite-Mono如果你在寻找一个轻
神经网络传递函数sigmoid,神经网络传递函数作用快乐的小荣荣神经网络机器学习深度学习人工智能
神经网络传递函数选取不同会有特别大差别嘛？只是最后一层，但前面层是非线性，那么可能存在区别不大的情况。线性函数f(a*input)=af(input),一般来说，input为向量，最简化情况下，可以假设input的各个维度，a1=a2=a3。。。意味着你线性层只是简单的对输入做了scale~而神经网络能起作用的原因，在于通过足够复杂的非线性函数，来模拟任何的分布。所以，神经网络必须要用非线性函数。
Python和R均方根误差平均绝对误差算法模型亚图跨际 Python 交叉知识 R 回归模型误差指标归一化均方根误差生态状态指标神经网络成本误差气体排放气候模型多项式拟合
要点回归模型误差评估指标归一化均方根误差生态状态指标神经网络成本误差计算气体排放气候算法模型Python误差指标均方根误差和平均绝对误差均方根偏差或均方根误差是两个密切相关且经常使用的度量值之一，用于衡量真实值或预测值与观测值或估计值之间的差异。估计器θ^\hat{\theta}θ^相对于估计参数θ\thetaθ的RMSD定义为均方误差的平方根：RMSD⁡(θ^)=MSE⁡(θ^)=E((θ^−θ
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
数据分析-24-时间序列预测之基于keras的VMD-LSTM和VMD-CNN-LSTM预测风速皮皮冰燃数据分析数据分析
文章目录1普通的LSTM模型1.1数据重采样1.2数据标准化1.3切分窗口1.4划分数据集1.5建立模型1.6预测效果2VMD-LSTM模型2.1VMD分解时间序列2.2对每一个IMF建立LSTM模型2.2.1IMF1—LSTM2.2.2IMF2-LSTM2.2.3统一代码2.3评估效果3CNN-LSTM模型3.1数据预处理3.2建立模型3.3效果预测4VMD-CNN-LSTM模型4.1VMD分解
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
深度学习-13-小语言模型之SmolLM的使用皮皮冰燃深度学习深度学习
文章附录1SmolLM概述1.1SmolLM简介1.2下载模型2运行2.1在CPU/GPU/多GPU上运行模型2.2使用torch.bfloat162.3通过位和字节的量化版本3应用示例4问题及解决4.1attention_mask和pad_token_id报错4.2max_new_tokens=205参考附录1SmolLM概述1.1SmolLM简介SmolLM是一系列尖端小型语言模型，提供三种规
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p