lovep1

mobilenet系列论文解读：从v1-v3

一文看遍mobilenet，毫无疑问，移动端的轻量级网络中mobienet肯定是首当其冲，从v1-v3，有着相当的提升和改进，但究其核心，最主要的还是引入了深度可分离卷积的计算，确实很有代表性，不过在v3中引入了NAS，这就比较玄学了，v3我没有直接复现过，只玩过基于它实现的目标检测网络，v3的yolov3我记得可以在voc上做到74%左右，效果挺好的，v1和v2的目标检测网络，比如mobilenet-ssd、mobilenet-yolo在部署的时候的确相当轻量化，尤其是当年mobilenetv1-ssd结合tensorflow的object-detection api来做，可以同时完成模型缩放和量化，模型大小只有几M，非常轻量化，本文详细解读mobilenetv1-v3的技术要点和变化，但不按照论文的结构和格式来叙述。

code：本文不提供code，详见各个框架的backbone

1、mobilenet-v1

paper：https://arxiv.org/pdf/1704.04861.pdf

v1中创新式的提出了构建mobilenet的核心层，称之为深度可分离卷积（depthwise separable filters），为整个mobilenet系列奠定了基础。

depthwise separable convolutionds是分解卷积的一种形式，可以将其拆解为深度卷积和点卷积（1*1卷积），如下图所示：

如上图所示，图a代表着Dk*Dk*M的conv layer，我们将其拆分为图b和图c两个卷积，这样得到的输出维度是一致的，但计算量和模型大小却明显得到减少，具体原理如下：

一个标准的卷积输入Batch*Df*Df*M的特征图，其中Df是输入特征图的宽度和高度，M是输入通道，假定输出特征图为Batch*Df*Df*N，N为输出通道。那么，对于标准卷积的计算量为：

Batch*Df*Df*M*N*Dk*Dk

怎么理解标准卷积计算量？简单说一下，可以理解为Df*Df的特征图与Dk*Dk的卷积进行计算，计算量为Df*Df*Dk*Dk，输入特征图有M个通道，对应卷积核也有M个输入通道，则由M个Df*Df的特征图与Dk*Dk卷积进行计算，则此时计算量为Df*Df*Dk*Dk*M，最后，有N个输出通道，则再将上一步的计算重复N次，最终计算量就变成了Df*Df*M*N*Dk*Dk。

拆分后，depthwise conv的计算量为：Batch*Df*Df*Dk*Dk*M，这里要注意一下，拆分后，卷积相乘时维度是对不上的，因此其实depthwish卷积是对每个输入通道单独使用1个卷积核来处理，并且结果不累加（常规卷积会累加输入通道的结果变成一个通道输出），那么此时输出特征维度依旧为batch*Df*Df*M。

进一步的，中间输出特征图再与点卷积相乘，此时的计算量为batch*Df*Df*M*N，输出特征维度为batch*Dk*Dk*N。

此时，计算量对比如下：

上面为mobilenet v1提出来的depthwise separable 卷积，下面是mobilenet v1的网络结构（注意：深度卷积只是起到了常规卷积的作用，但并不是直接替换常规卷积就能够跟常规卷积一样的效果，同样需要依赖于特定的网络结构，举例：darknet53如果你直接替换为depthwise separable darknet53，网络是不会收敛的！！！！）

v1的基本block（与常规3*3卷积的区别）：

v1的网络结构如下：

v1的网络宽度和深度的参数调整：

上面的网络结构可以将其作为mobilenet的baseline，在这个基础上，我们进一步的引入两个参数width multiplier和resolution multiplier来对backbone进行进一步压缩裁剪。第一个参数width multiplier主要是按比例减少通道数，该参数记为 $\alpha$ ，其取值范围为(0,1]，那么输入与输出通道数将变成 $\alpha$ M 和 $\alpha$ N ，应用于depthwise separable convolution，其计算量变为：

第二个参数 $\rho$ 用于减小分辨率，即按照比例减小特征图的大小，加上这个参数 $\rho$ ，则整体计算量为：

注意，resolution multiplier仅仅影响计算量，但是不改变参数量（因为没裁剪啥卷积核什么的）。

v1总结：主要是提出了可分离卷积这个结构，然后顺势提出了mobilenet这个backbone结构，更进一步的，由于是google本身提出的，google将其应用到了object/face detection，取得了不错的效果，但是值得注意的是，不要随便修改那两个通道数和分辨率的超参数，都选择为1.0是比较好的，否则精度下降莫名其妙，相信我，都选择1是最好的，而且在cpu上跑的贼快，越烂的cpu越能够看到明显的加速效果，在gpu上加速倍数就没那么明显了，有时甚至还不如我剪枝后的网络。

2、mobilenet-v2

v1的主要思想是在于提出了深度可分离卷积和与之配套的backbone这2点，v2的核心在于在v1的基础上，发现v1的不足，基本上就是relu带来的，针对这些不足，进一步的调整基本的卷积结构，从而达到更好的效果。

paper：https://arxiv.org/abs/1801.04381

首先分析v1的不足：

1、 Relu本身会破坏高维featuremap

2、relu负半轴为0的特性带来的神经元dead。

我们看看原文怎么说：

如上图figure1所示，input是一个2维度数据，文中有一个称之为manifold of interest的东西就是蓝色的螺旋线，文中使用矩阵T将数据映射到多维空间，然后接了relu，再使用T的逆矩阵，将其映射回2d平面，我们可以看到，当维度为2、3时，映射回来信息丢失很严重，中心点坍塌了，当维度为15、30左右，损失的信息才会变得少起来。这意味着在低维的时候，relu会导致很多信息的丢失（由于负值直接映射为0的机制）

1、 relu能够保留输入manifold 的完整信息，但前提是输入manifold 位于输入空间的低维子空间中。(如上面Figure 1的示意图-哎不懂就算了，写的啥玩意，又写论文就写得让人看不懂，翻译过来更看不懂)

2、如果经过ReLU变换输出是非零的，那输入和输出之间是做了一个线性变换的，即将输入空间中的一部分映射到全维输出，换句话来说,relu的作用是线性分类器。

从上面这个实验得到，我们设计网络结构的时候，想要减少运算量，就需要尽可能将网络维度设计的低一些，但是维度如果低的话，激活变换ReLU函数可能会滤除很多有用信息。然后我们就想到了，反正ReLU另外一部分就是一个线性映射。那么如果我们全用线性分类器，会不会就不会丢失一些维度信息，同时可以设计出维度较低的层呢？

然后文章针对这个问题使用了linear bottleneck（即不使用relu激活，直接做线性变换）来代替原本的非线性激活，则思路为：在卷积模块中插入linear bottleneck来捕获manifold of interest，然后再进一步引入从linear bottlenect到深度卷积之间的维度比称之为Expansion factor（扩展系数）。

v2的模块结构（Inverted residuals）-此图来源https://zhuanlan.zhihu.com/p/98874284 侵删

如上图所示，中间层依旧为深度可分离卷积，但在前面是用了expansion layer和在后面加了projection layer：

expansion layer：使用1*1的卷积结构，目的是将低维空间映射到高维空间，上文提到该结构中包含扩展系数这个超参数，设定将维度扩展几倍（6）

projection layer：使用1*1的卷积结构，将高维空间映射到低维空间去。

Inverted residuals通道升降维示意图如下图所示：

从上图可以看出，v2的网络结构便是先对输入特征进行升维，经过深度分离卷积后，再进行降维到与原来一致的通道，同时，不再使用relu函数而改使用relu6函数，最后的线性层直接使用线性激活函数（说白了就是1*1的点卷积后面不加激活层。。。害我理解了半天代码）。

v2与v1的对比（图来源：https://zhuanlan.zhihu.com/p/33075914 侵删）：

简单来说，v2在深度卷积前新加了一个pw卷积，因为dw卷积无法升降维度，通过pw卷积升维获取更多的特征（expand factor），v2去掉了最后的非线性激活函数（不加激活函数）。

v2与resnet的对比：

简答来说，v2使用的是dw卷积，而非标准卷积；resnet先降维，再升维，v2先升维，再降维。

v2的整体网络结构如下：

参数意义：t-扩张系数（Expansion factor） c-原始通道数 n-当前residual block的block数 s 下采样stride

测试结果：

v2总结：基本上就是分析了relu的问题，认为既要在高维处理特征保证特征提取，又要在低维防止特征丢失，因此采用先升维后降维的方式，修改了一个新的block，然后又提出了新的backbone。

注意：v2的速度比v1慢？这个实际测试好像是存在这个问题，唯一可以确定是，v2精度比v1高，速度测试慢一点，不知道移动端是否会变得快一些。

参考文章：https://zhuanlan.zhihu.com/p/33075914

3、mobilenet-v3

paper：https://arxiv.org/pdf/1905.02244.pdf

回顾一下mobilenet系列，v1主要是提出了深度卷积和backbone，v2主要是提出了residual block和线性分类器（不用激活层），而到了v3，v3用重新结合了v1和v2的优点，重新设计了1个block，然后再使用nas搜索，得到一个新的网络结构v3-large/small，称之为mobilenet v3。

直接看v3的改进：

1、基本block的改进

直接看原文的改进示意图：

在DW卷积之后引入了Mnasnet的SE结构，由于SE结构会消耗时间，将expansion layer的channel变为原来的1/4。

特定看一下SE结构（下图的源码是mnasnet的源码，并非v3的），如下图所示，对然后求通道的均值（并不是pool-v3中写的是pool），然后输入特征图进行挤压降维后，加入relu激活函数，再对输出特征进行维度扩张（conv操作），最后对输出的特征执行sigmod，得到注意力参数（hard-sigmod原文），将其乘以最原始的input_tensor，

code：https://github.com/tensorflow/tpu/blob/da262fcba1d0598321d4eb9aa1954fcbf84d1807/models/official/mnasnet/mnasnet_model.py

2、nas的搜索我就不写了，不会，不理解，很难受，这种高级领域我完全不懂（没卡？）

简单提一下这个流程：先使用nas永华每一个block，得到答题的网络结构，在使用netAdapt来确定每个filter的channel数量，因此提出了v3 small和v3 large两个级别的网络。（我根本不懂，完全抄自别人的博客）

3、尾部改进

作者发现v2网络的最后阶段计算量很大，重新设计了结构，如下图所示：

在v2中，在avg pooling之前，存在在avg pooling之前，存在一个1x1的卷积层，目的是提高特征图的维度，更有利于结构的预测，但是这其实带来了一定的计算量了，所以这里作者修改了，将其放在avg pooling的后面，首先利用avg pooling将特征图大小由7x7降到了1x1，降到1x1后，然后再利用1x1提高维度，这样就减少了7x7=49倍的计算量。并且为了进一步的降低计算量，作者直接去掉了前面纺锤型卷积的3x3以及1x1卷积，进一步减少了计算量，就变成了如下图第二行所示的结构，作者将其中的3x3以及1x1去掉后，精度并没有得到损失。这里降低了大约15ms的速度。

4、网络结构-修改channels的数量

修改了整体网络卷积核的数量，v2中使用的是32*3*3，v3中变小了，改成了16，降低了3ms的速度·1，如下所示：

5、激活函数的变化

使用了hard-swish来替换swish。swish在嵌入式中并不友好，但发现在嵌入式中大部分芯片都会使用relu6，因此将swish修改为hard-swish，公式如下：

如上，利用relu6魔改为hard-swish，计算成本很小且方便模型的量化，据说推理速度增快15%（也不知道googl怎么测试的）

最后，直接看v3的结果：

总结：v3的改进点在于在v1、v2的基础上，加入了SE模块，更进一步的修改了block的结构；然后修改了尾部结构，减少了计算量；同时利用nas搜索了最佳backbone组合；然后基于嵌入式提出了hard-swish的非线性激活。

综上，便是mobilenetv1、v2、v3的细节概述了，其中v3我没那么上心，因为涉及到了nas，这有点让人无奈，v1、v2的backbone我在目标检测上也做了相当的实验，但不得不承认，如果只考虑性能，其实针对目标检测算法，剪枝和量化是不是更加实用，毕竟从我的经验来看，一般的模型剪枝一半基本上精度差异不会太大，主要还是mobilenet的移动端的速度确实有优势，复杂的网络即使剪枝到很小，深层的网络仍然需要大的计算量，但是剪枝的算法通常会比轻量化backbone精度要高（不要做到极限压缩）。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
2021-01-09 哥伦比亚《梦中的欢快葬礼和十二个异乡故事》加西亚·马尔克斯著罗秀译 juneyale
《梦中的欢快葬礼和十二个异乡故事》哥伦比亚加西亚·马尔克斯著罗秀译序《总统先生，一路走好！》“再给我一杯咖啡。”他用纯正的法语说。随即补充道：“要意式咖啡，能让人起死回生的那种。”并没有意识到话里的双关含义。当火车开始加速，荷马突然发现总统的手杖还在自己手中，于是跑到站台尽头，把手杖用力扔过去，希望总统能在半空中接住。但是手杖掉在了铁轨上，随即被碾得粉碎。那真是恐怖的一瞬。拉萨拉看到的最后一幕是那
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
助力新能源汽车产业发展，2025第五届广州国际新能源汽车产业智能制造技术展览会将于11月在广州召开 ws201907 制造汽车
助力新能源汽车产业发展，2025第五届广州国际新能源汽车产业智能制造技术展览会将于11月在广州召开伴随着全球新一轮科技革命和产业变革，汽车与能源、半导体、物联网等领域有关技术加速融合，新能源汽车已成为全球汽车产业转型升级的主要方向。近年来，在相关政策的影响下，新能源汽车市场呈现出快速增长的态势，市场规模不断扩大。截至2020年，中国新能源汽车保有量已超过500万辆，成为全球最大的新能源汽车市场。随
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
神经网络传递函数sigmoid,神经网络传递函数作用快乐的小荣荣神经网络机器学习深度学习人工智能
神经网络传递函数选取不同会有特别大差别嘛？只是最后一层，但前面层是非线性，那么可能存在区别不大的情况。线性函数f(a*input)=af(input),一般来说，input为向量，最简化情况下，可以假设input的各个维度，a1=a2=a3。。。意味着你线性层只是简单的对输入做了scale~而神经网络能起作用的原因，在于通过足够复杂的非线性函数，来模拟任何的分布。所以，神经网络必须要用非线性函数。
陈悦 | 科学学的起源及其发展斐夷所非 science history 科学学
作者|陈悦20世纪初，随着科学技术的迅猛发展和科学社会学的兴起，科学学逐渐得到关注和研究。经过百年的发展，科学学正成为一门重要的交叉学科，对科技发展和社会进步产生了深远影响。面对百年未有之大变局加速演进，尤其是世界各国都把目光聚焦于科技，希望通过科技创新找到适应变局的出路时，科学学更凸显其必要性。因此，《世界科学》杂志开设“科学学探索”栏目。一方面，促进更多的人加入科学学的研究和讨论中，深入探讨科
增长黑客和最小可复制的内核爱思考的糖
五段-增长黑客的三大步骤生活就像逆水行舟，加入你不能加速，现实中最好的情况，你也就处在一种原地打转的状况。增长，就像一辆车里的加速器。围棋爱好者，水平一直没有进步的原因。是因为没有找到提高下棋水平的增长模式有三个办法可以提高：做死活题，练习做关键决策的能力；打谱，复盘经典案例；找AI陪练。增长黑客的三个实战步骤：第一步，假设：建立最小闭环。从笨办法开始，不怕犯错，代价并不高，你可以勇敢尝试。想知道
Python和R均方根误差平均绝对误差算法模型亚图跨际 Python 交叉知识 R 回归模型误差指标归一化均方根误差生态状态指标神经网络成本误差气体排放气候模型多项式拟合
要点回归模型误差评估指标归一化均方根误差生态状态指标神经网络成本误差计算气体排放气候算法模型Python误差指标均方根误差和平均绝对误差均方根偏差或均方根误差是两个密切相关且经常使用的度量值之一，用于衡量真实值或预测值与观测值或估计值之间的差异。估计器θ^\hat{\theta}θ^相对于估计参数θ\thetaθ的RMSD定义为均方误差的平方根：RMSD⁡(θ^)=MSE⁡(θ^)=E((θ^−θ
小白 | 华为云docker设置镜像加速器伏一工具安装华为云 docker 容器
一、操作场景通过dockerpull命令下载镜像中心的公有镜像时，往往会因为网络原因而需要很长时间，甚至可能因超时而下载失败。为此，容器镜像服务提供了镜像下载加速功能，帮助您获得更快的下载体验。二、约束与限制构建镜像的客户端所安装的容器引擎（Docker）版本必须为1.11.2及以上。“华北-乌兰察布一”、“亚太-雅加达”、“拉美-墨西哥城一”、“拉美-墨西哥城二”和“拉美-圣保罗一”区域不支持该
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
基于高通主板的ARM架构服务器问就是想睡觉 arm开发服务器运维
一、ARM架构服务器的崛起（一）市场需求推动消费市场寒冬，全球消费电子需求下行，服务器成半导体核心动力之一。Arm加速布局服务器领域，如9月推出NeoverseV2。长久以来，x86架构主导服务器市场，现面临挑战。Arm2008年入服务器领域，虽因性能与生态问题未大突破，但近几年重新冲刺。（二）技术创新引领Arm的Neoverse平台不断发展。2018年推出参考架构，2020年衍生出E、N、V系列
为用户都喜欢购买阿里云服务器？阿里云服务器有何优势？阿里云最新优惠和活动汇总
随着企业数字化转型的加速和云计算技术的日益成熟，云服务器已成为企业搭建应用、存储和处理数据的重要基础设施。在众多云服务提供商中，阿里云以其卓越的性能、丰富的产品线、出色的技术支持和强大的生态系统，赢得了众多用户的青睐。那么，阿里云服务器到底有哪些优势？为何如此多的用户选择使用阿里云服务器呢？阿里云服务器优势图.jpg阿里云服务器的优势一、技术领先，性能卓越阿里云作为国内最早涉足云计算领域的企业之一
如何控制焦虑？《人性的弱点》摘抄不找一点借口
萧伯纳把这些总结起来就是：“人们之所以忧虑，就是因为有空闲时间来琢磨自己到底快不快乐。”因此，让我们摩拳擦掌地去忙碌起来吧，不去思考它就可以克服忧虑。忙碌的生活会让你的血液加速循环，让你的思维变得灵活敏锐——让自己一直忙着，这是世界上最便宜、也是最好的一种良药。改掉忧虑习惯的第一条规则：“让自己不停地忙着。忧虑的人一定要让自己沉浸于工作中，否则将挣扎在绝望之中。”要在忧虑毁了你之前，先戒掉忧虑的恶
Pyorch中 nn.Conv1d 与 nn.Linear 的区别迪三 #NN_Layer 神经网络
即一维卷积层和全联接层的区别nn.Conv1d和nn.Linear都是PyTorch中的层，它们用于不同的目的，主要区别在于它们处理输入数据的方式和执行的操作类型。nn.Conv1d通过应用滑动过滤器来捕捉序列数据中的局部模式，适用于处理具有时间或序列结构的数据。nn.Linear通过将每个输入与每个输出相连接，捕捉全局关系，适用于将输入数据作为整体处理的任务。1.维度与输入nn.Conv1d（一
国内SAP实施公司大盘点哲讯智能科技制造运维
随着企业数字化转型的加速推进，SAP作为全球有名的企业软件解决方案提供商，受到了越来越多企业的青睐。然而，要充分发挥SAP软件的潜力，企业需要依赖专业的SAP实施公司来提供技术支持和咨询服务。在国内，有许多优秀的SAP实施公司，他们拥有丰富的经验和专业知识，能够为企业提供全方位的SAP实施解决方案。在本文中，我们将盘点一些国内的SAP实施公司排名，了解他们的服务和解决方案。1.无锡哲讯智能科技有限
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本

mobilenet系列论文解读：从v1-v3

1、mobilenet-v1

2、mobilenet-v2

3、mobilenet-v3

你可能感兴趣的:(模型压缩加速,神经网络,深度学习,卷积,计算机视觉)