黑暗星球

WRN 论文笔记

WRN：Wide Residual Networks

摘要

深度残差网络能够将网络深度扩大到上千层，并且有很好的性能提升。但是，分类准确率每提高百分之一的代价几乎是层数的两倍。所以训练非常深的残差网络有一个问题：特征利用率逐渐下降，这使得残差网络的训练非常慢。为了解决这些问题，本文中，我们对残差块进行了详细的实验研究。基于该研究，我们提出了一个新架构，这个架构减少了深度并且增加了残差网络的宽度。我们称这个新的架构为wide residual networks (WRNs)，WRN比通常使用的细且深的残差网络有着更好的性能。在文中，我们研究了一个简单的16层深的WRN网络。这个WRN网络比以前的残差网络（包括上千层的网络）的准确率更高且效率更高。并且在CIFAR、SVHN、COCO数据集上取得了新的state of art，在ImageNet上大福度地提高了性能。我们的模型的代码详见 https://github.com/szagoruyko/wide-residual-networks.

摘要（英文）

Deep residual networks were shown to be able to scale up to thousands of layers and still have improving performance. However, each fraction of a percent of improved accuracy costs nearly doubling the number of layers, and so training very deep residual networks has a problem of diminishing feature reuse, which makes these networks very slow to train. To tackle these problems, in this paper we conduct a detailed experimental study on the architecture of ResNet blocks, based on which we propose a novel architecture where we decrease depth and increase width of residual networks. We call the resulting network structures wide residual networks (WRNs) and show that these are far superior over their commonly used thin and very deep counterparts. For example, we demonstrate that even a simple 16-layer-deep wide residual network outperforms in accuracy and efficiency all previous deep residual networks, including thousand-layer deep networks, achieving new state-of-the-art results on CIFAR, SVHN, COCO, and significant improvements on ImageNet. Our code and models are available at https://github.com/szagoruyko/wide-residual-networks.

1. 简介

从AlexNet、VGG、Inception到ResNet，卷积神经网络在近几年越来越深，深度的增加与性能的提升直接相关。近几年的一些研究已经表明了网络深度至关重要。但是训练深度神经网络有很多难点：梯度爆炸、梯度消失和网络性能退化。现在已经有很多方法来训练更深的神经网络，例如：精心设计的初始化策略(well-designed initialization strategies)，更好的优化器(better optimizers)，跳跃连接(skip connections)、网络迁移(knowledge transfer)和逐层训练(layer-wise training)。

最新的残差网络在ImageNet和COCO 2015比赛中获胜并且在很多基准上取得了state of art（ImageNet和CIFAR的分类比赛，PASCAL VOC及MS COCO数据上的物体探测，分割比赛）。与Inception架构相比，ResNet表现出更好的泛化性能，这意味着提取到的特征在迁移学习中有很高的效率。同时，对ResNet的其它研究表明残差连接能够加速网络的收敛速度。ResNet_v2探究了残差网络的activations的次序，并且提高了非常深的网络的训练。highway网络的使用使得非常深的网络的训练变得可能。highway的提出早于ResNet网络。ResNet和highway的主要区别是resnet中的残差连接有门（gated）并且门的权重是学习得到的（weights of these gates are learned）。

因此，到目前为止，残差网络的研究主要关注ResNet块内部的activations的顺序和残差网络的深度。在本文，我们尝试去进行一个实验研究。通过这个研究，我们的目标是去进一步地探索残差块，并且进一步地研究除activations的顺序之外的一些影响性能的因素。正如我们下面解释的一样，这样的架构探索让我们对残差网络有了有趣的新发现。

Width vs depth in residual networks
网络的深浅问题在机器学习中已经讨论了很长时间，circuit complexity theory的研究表明在复杂性相同的情况下，浅层网络比深层网络多指数倍的部件（shallow circuits can require exponentially more components than deeper circuits）。残差网络的作者尝试去加深网络深度来使得网络变得细长并且有更少的参数，甚至引入了一个瓶颈块（使得残差单元更加细长）。

但是，我们注意到包含identity mapping的残差块允许我们去训练非常深的网络的同时，这个残差块也是残差网络的一个缺点。当梯度流通过整个网络时，网络不会强迫梯度流过权重层（这会导致训练中学习不到什么）。所以很有可能少量的块能够学习有用的表达，或者很多的块分享非常少的信息，对最终结果影响很小。（As gradient flows through the network there is nothing to force it to go through residual block weights and it can avoid learning anything during training, so it is possible that there is either only a few blocks that learn useful representations, or many blocks share very little information with small contribution to the final goal.）这个问题可以被总结为diminishing feature reuse。有人尝试通过随机停用残差网络的一些块的思路来解决这个问题。这个方法被看作dropout的一个特例，每一个残差块有一个identity权重，dropout就是对这个权重进行dropout。这个方法的有效性证明了上面的假设。

受上述观察的启发，我们的工作建立在resnet_v2的基础上，并试图回答wide deep residual networks应该如何解决和解决训练问题。在这种情况下，我们表明，以正确的方式加宽残差块提供了一种更加高效的提高残差网络性能的方法，而不是增加网络深度。尤其，我们提出的wider deep residual网络（WRN）在ResNet_v2的基础上提高了挺多。WRN的深度只有原始深度的五十分之一，推理速度快2倍。我们称产生的网络架构为wider residual networks。在实践中，16层深的WRN网络和1000层的ResNet有着相同的准确率，参数量基本一样，但训练快了很多倍。这种类型的实验看起来表明了深度残差网络的main power是残差块，深度的效应是补充。我们注意到我们能够训练更宽的残差网络（参数量比原始的resnet的两倍或更多），这暗示我们如果想通过增加深度来提高性能，我们需要去增加上千层。

Use of dropout in ResNet blocks
Dropout是Hinton等人提出的，然后被很多成功的架构所使用。Dropout一般用在有很多参数的顶层去防止过拟合。后来，dropout主要被BN替代，提出BN是为了去减少神经网络activations的内部协方差（通过标准化），从而activations是一个特殊的分布。BN同时也作为一个正则器，BN的作者用实验说明包含BN的网络能够获得比不包含dropout的网络更高的准确率。在我们的例子中，加宽残差块导致参数量增加，所以我们在WRN里研究了dropout在训练过程中的正则效果和预防过拟合的效果。前人的研究中x，dropout被插入到了残差网络中的identity连接上，这导致性能下降。与前人不同，我们认为dropout应该被插入到卷积层之间。WRN的实验结果表明这能产生性能提升，甚至达到新的state of art（例如，16层的WRN-dropout在SVHN数据集上取得了1.64%的错误率）。

总结一下，本文的主要贡献：

我们对残差网络架构进行了一个详尽的实验研究，对残差块结构的很多重要方面进行了彻底的测试。
我们提出了一个新的WRN架构（将ResNet块进行了加宽）。WRN架构相对与ResNet，性能有了较大提高。
我们提出了一个在深度残差网络内部使用dropout的新方法，从而在训练中，进行正确的正则并且防止过拟合。
最后，我们说明了我们提出的WRN架构取得了在很多数据集上取得了state of art，并且准确率和速度都提高了很多。

2. Wide residual networks(WRN)

包含identity mapping的残差块能够用下面的公式表示：

x l + 1 = x l + F (x l, W l)

这里

xl+1 x l + 1 和

xl x l 是网络第

l l 个单元的输入和输出，

F F 是一个残差函数，

Wl W l 该块的参数。残差网络包含很多顺序堆叠的残差块。

在残差网络中包含两种类型的块：

basic ：包含两个3x3卷积，卷积后面都跟BN及ReLU。卷积的堆叠顺序是： conv3×3−conv3×3 ，图1a。
bottleneck ：包含一个3x3卷积，3x3卷积前后都是1x1卷积，两个1x1卷积分别用来降维和升维。卷积的堆叠顺序是： conv1×1−conv3×3−conv1×1 ，图1b。

与ResNet_v1和v2的原始残差架构相比，BN、ReLU和卷积在块中的顺序从原始的 conv-BN-ReLU 改为了 BN−ReLU−conv 。更改顺序后，训练的更快，并且能取得更好的结果（不考虑原始版本）。进一步，bottleneck块使用的初衷是去减少因为层数的增加带来的计算量。因为我们想要去研究加快的作用，而bottleneck的作用是使得网络变得细长，所以我们也不考虑bottleneck，只关注于basic残差架构。

基本上有三种简单的方法去增加残差块的表示能力：

每个残差块内部增加更多的卷积层
通过增加特征面来加宽卷积层（to widen the convolutional layers by adding more feature planes）
增加卷积层的卷积核的尺寸

因为在VGG和Inception v4中，已经说明小卷积核在很多情况下更高效，所以我们使用的卷积核都不超过3x3。让我们引入两个系数：深度系数 l 和宽度系数 k ，这里 l 为一个残差块内部的conv的数量； k 为卷积层的特征平面数（multiplies the number of features in convolutional layers），因此在basic块中， l=2 ， k=1 。图1a和1c说明了basic和basic-wide块的方案。

表1是我们的残差网络的通用框架。它包含一个初始的卷积层 conv1 ，conv1后跟三组（每组的尺寸为N）残差块： conv2 ， conv3 ， conv4 ，最后接 averagepooling 和分类层。在我们的实验中，conv1的尺寸是固定的，引入的宽度系数 k 用来缩放三组残差块（ conv2−4 ）的尺寸。我们想要去研究残差块的表达能力的影响，我们进行并测试很多basic的修改版本，这在下面的章节会进行详细描述。

2.1 残差块里的卷积的类型(Type of convolutions in residual block)

用 B(M) 表示残差块的结构，这里 M 是块内使用的卷积层的卷积核的尺寸组成list。例如， B(3,1) 表示由一个3x3卷积层和一个1x1卷积层组成的残差块（这里假设所有的卷积核都是？x？）。注意，因为我们没有考虑 bottleneck ，特征平面数在块中保持不变。我们想要去探究 basic 块中的每个3x3卷积层的重要性，另外，它们是否能用计算量更低的1x1卷积层或者1x1和3x3卷积层的结合来替代（例如 B(1,3) ， B(3,1) ）。这能够增加或降低块的表示能力。我们因此对下面的几种结合方案进行了试验，例如 B(3,1,1) 与NIN网络的效率相似：

B(3,3) ：原始的 basic 块
B(3,1,3) ：在 basic 的基础上增加一个1x1卷积层
B(1,3,1) ：所有的卷积的维度是一样，可以看作是straightened的 bottleneck
B(1,3) ：1x1和3x3卷积交替
B(3,1) ：与上一种情况类似
B(3,1,1) ：NIN网络风格的块

2.2 每一个残差块中的卷积层的数量(Number of convolutional layers per residual block)

我们也对深度系数 l 进行了试验，去看下 l 对性能的影响。对比的网络的参数量相同，所以我们需要去用不同的 l 和 d 来构建网络（这里 d 表示块的总数量），从而保证网络的总的复杂性大概保持不变。这意味着，当 l 增加时， d 应该减小。

2.3 残差块的宽度(Width of residual blocks)

除了上面的实验，我们也对宽度系数 k 进行了实验。模型的参数量随 l 线性增加，模型的参数和计算量与 k 为立方次关系。但是，因为GPU在大的tensor上的并行计算更加高效，所以加宽层的方法比上千个小核更加高效，所以我们对 d 和 k 的最优比例很感兴趣（However, it is more computationally effective to widen the layers than have thousands of small kernels as GPU is much more efficient in parallel computations on large tensors, so we are interested in an optimal d to k ratio）。

对于WRN的一个观点是残差网络之前，几乎所有的架构（包括Inception、VGG）都比ResNet_v2宽的多。例如，WRN-22-8和WRN-16-10（详细解释见后面）的宽度、深度和参数量和VGG架构非常接近。

我们将原始的ResNet（ k=1 ）称为“thin”，当 k>1 时称为“wide”。在后面，我们使用下面的标记：WRN- n - k 表示一个有 n 个卷积层，宽度系数为 k 的残差网络（例如，40层， k=2 的网络将被记作WRN-40-2）。同时，必要时，我们将用后缀表明块的类型（例如WRN-40-2- B (3,3)）。

2.4 残差网络中的dropout（Dropout in residual blocks）

因为网络的加宽导致参数量增加，所以我们将研究正则化方法。残差网络中的BN已经提供了一个正则，但是它需要强有力的数据增强（heavy data augmentation），我们想要避免使用它，并且这并不总是可能的（it is not always possible）。我们在每个残差块中的卷积层之间增加一个dropout层（图1d），并且在ReLU之后去对下一个残差块内的BN进行扰动，防止它过拟合（after ReLU to perturb batch normalization in the next residual block and prevent it from overfitting）。在非常深的残差网络中，这应该有助于解决特征重用问题（In very deep residual networks that should help deal with diminishing feature reuse problem enforcing learning in different residual blocks）。

3. 实验结果

对于实验，我们选择著名的CIFAR-10、CIFAR-100、SVHN和ImageNet图像分类数据集。CIFAR-10和CIFAR-100数据集包含32x32的彩色图像，50000张训练图片，10000张测试图片。对于数据增强，我们使用水平翻转和随机裁剪（首先在图片的各个边填充4个像素，再随机裁剪，填充的像素值采用reflections of original image）。我们不使用参考文献9中的heavy数据增强。SVHN是谷歌的一个数据集，大概包含600000张图片。对于SVHN上的实验，不进行任何预处理（除了像素值除以255）。除ImageNet外的实验都采用ResNet_v2中的预激活残差块，我们将这组实验作为基线。对于ImageNet，我们发现在少于100层的网络中使用预激活与否没有差异，所以我们去使用原始的ResNet架构。除了特殊说明，对于CIFAR，我们对图片进行ZCA白化处理。但是对于一些CIFAR实验，我们只是用简单的mean/std标准化，这样我们能够直接与参考文献13进行对比。其他的残差网络相关工作根据对比决定是否需要。

在下面，我们描述了WRN架构并且分析了WRN的性能。
CIFAR上的实验

几种方案差别不大，B(3,3)能稍微好点，就选B(3,3)

WRN40-4与ResNet1001结果相似，参数数量相似，但是前者训练快8倍。
总结：
1. 宽度的增加提高了性能
2. 增加深度和宽度都有好处，直到参数太大，regularization不够
3. 相同参数时，宽度比深度好训练

ResNet-164不如WRN28-10了

在卷积层之间加dropout确实能提高性能
ImageNet和COCO上的实验

计算效率

WRN简介：https://blog.csdn.net/bea_tree/article/details/51865100

个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
linux挂载文件夹小码快撩 linux
1.使用NFS（NetworkFileSystem）NFS是一种分布式文件系统协议，允许一个系统将其文件系统的一部分共享给其他系统。检查是否安装NFSrpm-qa|grepnfs2.启动和启用NFS服务假设服务名称为nfs-server.service，你可以使用以下命令启动和启用它：sudosystemctlstartnfs-server.servicesudosystemctlenablenf
py获取系统缩放比例 xu-jssy Python自动化脚本 python 前端
fromwin32.libimportwin32conimportwin32api,win32gui,win32printscaling=1.0defget_real_resolution():"""获取真实的分辨率"""hDC=win32gui.GetDC(0)wide=win32print.GetDeviceCaps(hDC,win32con.DESKTOPHORZRES)high=win32
相对与绝对路径、命令：cd、mkdir、rmdir、rm 强出头
2.6相对和绝对路径绝对路径：都是从根目录/开始的就是绝对路径，无论在任何目录下都能通过该路径找到该文件相对路径：不是以根目录开头的，相对当前目录的路径[root@mylinuxetc]#cat/etc/sysconfig/network-scripts/ifcfg-ens33（这里我们使用绝对路径查看文件ifcfg-ens33）[root@mylinuxetc]#cd/etc/sysconfig
【NLP5-RNN模型、LSTM模型和GRU模型】一蓑烟雨紫洛 nlp rnn lstm gru nlp
RNN模型、LSTM模型和GRU模型1、什么是RNN模型RNN（RecurrentNeuralNetwork)中文称为循环神经网络，它一般以序列数据为输入，通过网络内部的结构设计有效捕捉序列之间的关系特征，一般也是以序列形式进行输出RNN的循环机制使模型隐层上一时间步产生的结果，能够作为当下时间步输入的一部分（当下时间步的输入除了正常的输入外还包括上一步的隐层输出）对当下时间步的输出产生影响2、R
深度学习--对抗生成网络（GAN, Generative Adversarial Network） Ambition_LAO 深度学习生成对抗网络
对抗生成网络（GAN,GenerativeAdversarialNetwork）是一种深度学习模型，由IanGoodfellow等人在2014年提出。GAN主要用于生成数据，通过两个神经网络相互对抗，来生成以假乱真的新数据。以下是对GAN的详细阐述，包括其概念、作用、核心要点、实现过程、代码实现和适用场景。1.概念GAN由两个神经网络组成：生成器（Generator）和判别器（Discrimina
Linux网络服务配置：从基础到高级 M78NB666 linux 运维服务器
一、网络服务配置基础1.网络接口配置Linux系统中，网络接口的配置通常通过/etc/network/interfaces文件（Debian/Ubuntu）或/etc/sysconfig/network-scripts/ifcfg-文件（RedHat/CentOS）来完成。配置内容包括IP地址、子网掩码、网关等。2.DNS配置DNS配置通常在/etc/resolv.conf文件中设置，包括指定DN
前端发布 CDN缓存跳动的世界线前端缓存 CDN
公司给服务器加了CDN，导致有时前端代码上传打包后，正式环境页面效果却不更新。每次都需要去找运维刷CDN…让我彻底记住了CDN缓存CDN（ContentDeliveryNetwork，内容分发网络）是一种广泛使用的互联网技术，旨在提高用户访问网站的速度和可靠性。CDN的核心思想是将网站的内容缓存到全球分布的边缘节点上，让用户能够从最近的节点获取数据，从而减少延迟和带宽消耗。CDN缓存机制的基本原理
边缘计算PCDN的使用场景及优势神鸟云-Hu 边缘计算人工智能
一、定义PCDN，全称为PrivateContentDeliveryNetwork，即私有内容分发网络。它是一种基于P2P技术和CDN的内容分发加速网络，通过在网络中添加大量的低成本缓存服务器，将用户请求的内容从原始服务器分发到这些缓存服务器，从而实现内容更快、更稳定地传输到终端用户。二、功能PCDN的主要功能是加速内容传输。通过在CDN网络中加入更多的缓存服务器，将热点内容分布到更广泛的网络上，
概率图模型（PGM）综述医学影像处理概率图模型概率图模型综述
RefLink:http://www.sigvc.org/bbs/thread-728-1-1.htmlGraphicalModel的基本类型基本的GraphicalModel可以大致分为两个类别：贝叶斯网络(BayesianNetwork)和马尔可夫随机场(MarkovRandomField)。它们的主要区别在于采用不同类型的图来表达变量之间的关系：贝叶斯网络采用有向无环图(DirectedAc
【加密社】深入理解TON智能合约 (FunC语法) 加密社闲侃 Nethereum教程区块链智能合约
king:摘要：在TON（TheOpenNetwork）区块链平台中，智能合约扮演着举足轻重的角色。本文将通过分析一段TON智能合约代码带领读者学习dict（字典）和list（列表）在FunC语言中的用法，以及如何在实际场景中实现高效的验证者选举。一、引言TON区块链平台的智能合约采用FunC语法一、引言TON区块链平台的智能合约采用FunC语言编写，该语言提供了丰富的数据结构，如dict和lis
Ubuntu 22.04网络无法连接的解决方法威桑 Linux ubuntu linux
在使用Ubuntu22.04系统时，在一次重启后桌面右上角并没有有线网络图标，并且打开浏览器无法访问百度。虚拟机网络连接方式是NAT模式，电脑主机也是有网络的。删除NetworkManager缓存文件，重启网络后问题就解决了。sudoserviceNetworkManagerstopsudorm/var/lib/NetworkManager/NetworkManager.statesudoserv
探索深度学习的奥秘：从理论到实践的奇幻之旅小周不想卷深度学习
目录引言：穿越智能的迷雾一、深度学习的奇幻起源：从感知机到神经网络1.1感知机的启蒙1.2神经网络的诞生与演进1.3深度学习的崛起二、深度学习的核心魔法：神经网络架构2.1前馈神经网络（FeedforwardNeuralNetwork,FNN）2.2卷积神经网络（CNN）2.3循环神经网络（RNN）及其变体（LSTM,GRU）2.4生成对抗网络（GAN）三、深度学习的魔法秘籍：算法与训练3.1损失
VMware工具下centos7虚拟机无法使用yum的解决方法 hardly study centos linux 运维服务器 centos
一、检查网络配置是否正常执行pingwww.baidu.com，如果测试不通，则需进一步检查网卡配置（建议安装虚拟机时选择NAT模式）二、检查网卡信息2.1确认并修改网卡信息路径：/etc/sysconfig/network-scripts/ifcfg-ens33ONBOOT=no表示在系统启动时不激活ens33的网卡设备，修改onboot=yes，激活网卡2.2重启network服务system
CycleGAN学习：Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks, 2017. 屎山搬运工深度学习 CycleGAN GAN 风格迁移
【导读】图像到图像的转换技术一般需要大量的成对数据，然而要收集这些数据异常耗时耗力。因此本文主要介绍了无需成对示例便能实现图像转换的CycleGAN图像转换技术。文章分为五部分，分别概述了：图像转换的问题；CycleGAN的非成对图像转换原理；CycleGAN的架构模型；CycleGAN的应用以及注意事项。图像到图像的转换涉及到生成给定图像的新的合成版本，并进行特定的修改，例如将夏季景观转换为冬季
arXiv综述论文“Graph Neural Networks: A Review of Methods and Applications” 硅谷秋水自动驾驶
arXiv于2019年7月10日上载的GNN综述论文“GraphNeuralNetworks:AReviewofMethodsandApplications“。摘要：许多学习任务需要处理图数据，该图数据包含元素之间的丰富关系信息。建模物理系统、学习分子指纹、预测蛋白质界面以及对疾病进行分类都需要一个模型从图输入学习。在其他如文本和图像之类非结构数据学习的领域中，对提取的结构推理，例如句子的依存关系
go-etcd实战小书go golang 实战演练 golang etcd 服务发现服务注册微服务
etcd简介etcdisastronglyconsistent,distributedkey-valuestorethatprovidesareliablewaytostoredatathatneedstobeaccessedbyadistributedsystemorclusterofmachines.Itgracefullyhandlesleaderelectionsduringnetwork
C# 网口通信（通过Sockets类）萨达大 c#服务器网络网口通讯上位机
文章目录1.引入Sockets2.定义TcpClient3.连接网口4.发送数据5.关闭连接1.引入SocketsusingSystem.Net.Sockets;2.定义TcpClientprivateTcpClienttcpClient;//TcpClient实例privateNetworkStreamstream;//网络流，用于与服务器通信3.连接网口tcpClient=newTcpClie
Centos7配置网络挨踢的懒猫
我们的机器刚装完系统不能上网，需要根据信息技术部分配的IP对网络进行配置。一、列出网卡ifconfig会发现列出了两张网卡，ens160：主机的以太网卡lo：本地回环网卡。二、配置网络由于我们的IP都是静态分配，而CentOS默认是使用DHCP动态获取IP，所以ens160网卡没有IP，需要手动配置IP等信息。1.配置以太网卡sudovi/etc/sysconfig/network-scripts
【干货】你可能不知道的 20个 Linux 网络工具迷途不归路
转载自公众号：DevOps技术栈原文链接：http://linoxide.com/monitoring-2/network-monitoring-tools-linux/如果要在你的系统上监控网络，那么使用命令行工具是非常实用的，并且对于Linux用户来说，有着许许多多现成的工具可以使用，如：nethogs,ntopng,nload,iftop,iptraf,bmon,slurm,tcptrack
TextCNN：文本卷积神经网络模型一只天蝎编程语言---Python cnn 深度学习机器学习
目录什么是TextCNN定义TextCNN类初始化一个model实例输出model什么是TextCNNTextCNN（TextConvolutionalNeuralNetwork）是一种用于处理文本数据的卷积神经网（CNN）。通过在文本数据上应用卷积操作来提取局部特征，这些特征可以捕捉到文本中的局部模式，如n-gram（连续的n个单词或字符）。定义TextCNN类importtorch.nnasn
MDN的简介印第安老斑鸠_333
MDNWebDocs（旧称MozillaDeveloperNetwork、MozillaDeveloperCenter，简称MDN）是一个汇集众多Mozilla基金会产品和网络技术开发文档的免费网站[1]。该项目始于2005年，最初由Mozilla公司员工DebRichardson领导。自2006年以来，文档工作由EricShepherd领导[2]。网站最初的内容是由DevEdge提供，但在AOL
鸿蒙开发（NEXT/API 12）【应用传输体验反馈】网络加速服务移动开发技术栈鸿蒙开发 harmonyos 网络华为 openharmony 鸿蒙移动开发鸿蒙系统
场景介绍当应用传输体验发生变化时，应用将传输体验和传输的业务类型信息通过实时反馈接口传输给系统网络业务模块，系统网络业务模块进行精细化调度，实现网络加速。例如：视频类App播放过程中卡顿，将卡顿信息上报后，NetworkBoostKit将信息反馈给系统网络加速模块，该模块会记录播放卡顿信息，并根据当前网络情况，启用网络加速能力。接口说明接口名描述reportQoe(appQoe:AppQoe):v
获取指定城市的路网数据（Python+Openstreetmap） FORGIVEN_H PYTHON入门 python 开发语言 arcgis
在物流或者交通领域，经常需要获取某个地区或城市的路网数据，但是没有接触过这方面的人一开始都会有点摸不着头脑，刚好今天帮室友处理了一下这个问题，借助AI的力量解决了，浅做记录也方便大家使用。importosmnxasox#设置城市名称和国家代码city="Caofeidian,China"#下载路网数据graph=ox.graph_from_place(city,network_type='driv
docker 网络模式李庆政370 docker 网络模式
四种模式介绍宿主机可上网,容器内便可上网.且能ping通宿主机同网段服务Docker网络模式配置说明host模式--net=host容器和宿主机共享Networknamespace。container模式--net=container:NAME_or_ID容器和另外一个容器共享Networknamespace。kubernetes中的pod就是多个容器共享一个Networknamespace。no
TCP/IP模型成功与OSI模型失败的深层原因：技术、理念与市场化路径的比较 kaixin_啊啊 tcp/ip php 服务器
目录TCP/IP体系结构模型1.网络接口层（NetworkInterfaceLayer）2.互联网层（InternetLayer）3.传输层（TransportLayer）4.应用层（ApplicationLayer）TCP/IP模型与OSI模型的比较：OSI模型OSI模型的七层结构：OSI模型的优点：OSI模型与TCP/IP模型的区别：TCP/IP模型成功与OSI模型失败的深层原因1.技术适用性
qt --如何获取本地联网的网口mac地址橘子味的茶二日常 qt 开发语言
单独的获取某一个网卡的mac地址在代码里可能出现意料之外的bug如果你本地的网卡较多QListABC::getMac(){QListnets=QNetworkInterface::allInterfaces();//获取所有网络接口列表intnCnt=nets.count();QListstrMacAddrs;for(inti=0;i
k8s防火墙networkPolicy，的核心是“自己” 技术服务于生态 kubernetes linux 网络
k8s防火墙的核心是“自己”这个“自己”，包括两层含义1.“我”是哪个名称空间的2.“我”是这个名称空间的哪些pod设置防火墙选择好核心之后看是允许哪些流量来访问我，就是ingressfrom，从哪进来的，你是谁？1.从哪个端口进来的，就设置ports，具体port包括端口号和协议号，比如tcp/802.从哪个名称空间进来的，就设置namespaceSelector，具体名称空间用其标签指定mat
深度神经网络详解：原理、架构与应用阿达C 活动 dnn 计算机网络人工智能神经网络机器学习深度学习
深度神经网络（DeepNeuralNetwork，DNN）是机器学习领域中最为重要和广泛应用的技术之一。它模仿人脑神经元的结构，通过多层神经元的连接和训练，能够处理复杂的非线性问题。在图像识别、自然语言处理、语音识别等领域，深度神经网络展示了强大的性能。本文将深入解析深度神经网络的基本原理、常见架构及其实际应用。一、深度神经网络的基本原理1.1神经元和感知器神经元是深度神经网络的基本组成单元。一个
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl