Learning both Weights and Connections for Efficient Neural Networks

摘要

神经网络是计算密集型和内存密集型的，这使得它们很难部署在嵌入式系统上。此外，传统的网络在训练开始前就确定了架构;因此，训练不能改善网络结构。为了解决这些限制，我们提出了一种方法，通过只学习重要的连接参数，来减少存储和计算所需的神经网络数量级，而不影响其准确性。我们的方法使用三步方法删除冗余连接。首先，我们训练网络了解哪些连接是重要的。接下来，我们修剪不重要连接。最后，我们对网络进行重新训练，以微调剩余连接的权重。在ImageNet数据集上，我们的方法将AlexNet的参数数量减少了9倍，从6100万个减少到670万个，而不会造成准确性损失。VGG-16的类似实验发现，总参数可以减少13倍，从1.38亿减少到1030万，同样没有丢失精度。

引言

神经网络在从计算机视觉到语音识别和自然语言处理的应用中无处不在。我们考虑卷积神经网络用于随着时间的推移而增长的计算机视觉任务。1998年Lecun等设计了参数小于1M的CNN模型LeNet-5对手写数字进行分类，2012年Krizhevsky等以60M参数赢得ImageNet竞赛。Deepface用120M的参数对人脸进行分类，Coates等将网络缩放到10B的参数。
虽然这些大型神经网络非常强大，但它们的大小消耗了相当大的存储空间、内存带宽和计算资源。对于嵌入式移动应用程序，这些需要的资源是非常难以满足的。图1显示了45nm CMOS过程中基本算术和内存操作的能量消耗。从这些数据中我们看到，每次连接的能量主要由内存访问决定，范围从片上SRAM中的32位系数的5pJ到片外DRAM中的32位系数的640pJ。大型网络不适合芯片存储，因此需要更昂贵的DRAM访问。例如，运行一个10亿连接的神经网络，在20Hz时，仅DRAM访问就需要(20Hz)(1G)(640pJ) = 12.8W，这远远超出了典型移动设备的功率范围。模型尺寸的削减也有利于存储和传输的移动应用合并了DNNs。

为了实现这一目标，我们提出了一种以保持原始精度的方式裁剪网络连接的方法。在初始训练阶段之后，我们删除所有权值低于阈值的连接。这种修剪将稠密的、完全连接的层转换为稀疏层。第一阶段学习网络的拓扑结构，学习哪些连接是重要的，并删除不重要的连接。然后我们对稀疏网络进行重新训练，这样剩余的连接就可以弥补被删除的连接。修剪和再训练阶段可以重复进行，以进一步降低网络的复杂性。实际上，这个训练过程不仅学习了权重，还学习了网络连接——就像哺乳动物的大脑一样，在儿童发育的最初几个月里，突触就在那里形成，然后逐渐删除很少使用的连接，下降到典型的成人价值。

除了权重之外还要学习连接方式

我们的修剪方法采用了一个三步过程，如图2所示，首先通过常规的网络训练来学习连接性。然而，与传统的训练不同，我们不是在学习权重的最终值，而是在学习哪些联系是重要的。然而，与传统的训练不同，我们不是在学习权重的最终值，而是在学习哪些联系是重要的。第二步是修剪低重量的连接。将权值低于阈值的所有连接从网络中移除，将密集网络转换为稀疏网络，如图3所示。最后一步是对网络进行重新训练，以学习剩余稀疏连接的最终权值。这一步至关重要。如果不进行再训练而使用修剪后的网络，准确率会受到很大影响。

正则化

选择正确的正则化方法会影响剪枝和再训练的性能。L1正则化惩罚非零参数，导致更多的参数接近零。这在修剪之后，重新训练之前，提供了更好的准确性。然而，其余的连接不如L2正规化的好，导致再训练后精度较低。总的来说，L2正则化给出了最好的剪枝结果。这将在实验部分进一步讨论。

Dropout 比例调整

Dropout被广泛用于防止过拟合，这也适用于再训练。然而，在再训练期间，dropout比率必须根据模型容量的变化进行调整。在dropout中，每个参数在训练过程中概率性的切除，但在推理过程中会返回。在剪枝过程中，参数在剪枝后被永久删除，并且在训练和推理过程中都没有机会返回。随着参数的稀疏化，分类器选择信息最丰富的预测器，预测方差更小，减少了过拟合。由于裁减已经降低了模型容量，再训练的dropout率应该更小。
定量, $C_i$ 第 $i$ 层的连接数， $C_io$ 原始网络连接数, $C_ir$ 再训练后的连接数, $N_i$ 是第 $i$ 层的神经元数量。因此当dropout作用与神经元之后， $C_i$ 与 $N_i$ 成二次方变化，根据方程1因此，dropout比例修剪后的参数应该遵循方程2， $D_o$ 代表原始的辍学率， $D_r$ 代表培训期间的辍学率。

局部剪枝和参数协同适应

在再训练期间，保留那些在初始训练阶段幸存下来的连接的权值，要比重新初始化修剪后的层要好。cnn包含脆弱的协同适应特征:梯度下降在网络初始训练时能够找到很好的解决方案，但在对一些层进行重新初始化和再训练后则不能。因此，当我们重新训练修剪过的层时，我们应该保留幸存的参数，而不是重新初始化它们。
从保留权重开始重新训练修剪过的层需要较少的计算量，因为我们不需要在整个网络中反向传播。同时，随着网络深度的增加，神经网络容易出现梯度消失问题，这使得深度网络的剪枝错误更难恢复。为了防止这种情况发生，我们固定CONV层的参数，并且只在修剪了FC层之后再训练FC层，反之亦然。

迭代剪枝

学习正确的连接方式是一个反复的过程。修剪后再训练是一次迭代，多次这样的迭代后，可以找到最小连接数。在不损失准确率的情况下，该方法在AlexNet上的剪枝率由5倍提高到9倍。每次迭代都是一次贪婪的搜索，因为我们要找到最好的连接。我们也实验了基于绝对值的概率剪枝参数，但这给出了更糟糕的结果。

剪枝神经元

在修剪连接之后，输入连接为零或输出连接为零的神经元可以被安全地修剪。这种修剪通过删除与修剪后的神经元之间的所有连接来进一步进行。再训练阶段会自动达到这样的结果，即死神经元的输入连接和输出连接都为零。这是由于梯度下降和正则化。一个输入连接为零(或输出连接为零)的神经元对最终的损失没有贡献，导致其输出连接(或输入连接)的梯度分别为零。只有正则化项会将权重推到零。因此，在再训练时，死亡的神经元会被自动移除。

实验

我们在Caffe中实现了网络剪枝。对Caffe进行了修改，增加了一个掩码，该掩码在对每个权值张量进行网络操作时忽略了剪枝参数。选择剪枝阈值作为质量参数乘以一层权重的标准差。我们在Nvidia TitanX和GTX980 gpu上进行了实验。
我们修剪了四个代表性的网络:MNIST数据集上的Lenet-300-100和Lenet-5。ImageNet数据集上的AlexNet和VGG-16。网络参数和精度修剪前后见表1。

MNIST数据集上案例

我们首先用LeNet-300-100和LeNet-5网络对MNIST数据集进行了实验。LeNet -300-100是两个隐含层的全连接网络，每个隐含层有300和100个神经元，在MNIST上错误率为1.6%。LeNet-5是一个卷积网络，有两个卷积层和两个全连接层，在MNIST上误差率为0.8%。修剪后，网络以原网络初始学习率的1/10重新训练。表2表明剪枝可以减少这些网络中12倍的参数。每一层的网络表显示(左到右)原始数量权重、所有层的激活函数浮点运算数量,非零激活函数的百分比,修剪后非零权重的百分比，实际上需要浮点运算的百分比。
一个有趣的副产品是，网络剪枝检测视觉注意力区域。图4显示了透镜LeNet-300-100的第一完全连接层的稀疏模式，矩阵大小为784∗300。它有28个频带，每个频带的宽度为28，对应于输入像素的28×28。图形的彩色区域，表示非零参数，对应于图像的中心。因为数字写在图像的中心，这些是重要的参数。图的左右是稀疏的，对应于t的顶部和底部的不那么重要的区域。剪枝后，神经网络发现图像中心更重要，与不重要区域连接神经元被剪枝更多。

AlexNet在ImageNet数据集上实验

我们进一步检查了ImageNet ILSVRC-2012数据集上剪接的性能，该数据集有1.2M训练集和50k验证集。我们使用AlexNet Caffe模型作为参考模型，该模型在5个卷积层和3个完全连接层上拥有6100万个参数。AlexNet Caffe模型的 top-1准确率为57.2%， top-5的准确率为80.3%。最初的AlexNet在NVIDIA Titan X GPU上花了75个小时进行训练。修剪后，整个网络以原网络初始学习率的1/100重新训练。它花了173个小时再次训练剪枝的 AlexNet。在迭代地构建模型原型时不使用剪枝，而是在模型准备部署时用于模型精简。因此，再训练时间就不那么重要了。从表1可以看出，AlexNet可以在不影响精度的情况下被修剪到原来大小的1/9，计算量可以减少3倍。

VGG-16在ImageNet数据集上实验

在AlexNet上有了很好的结果，我们也在同一个ILSVRC-2012数据集上研究了一个更大的，更新的网络，VGG-16。VGG -16有更多的卷积层，但仍然只有三个完全连接的层。采用类似的方法，我们积极地修剪卷积层和全连接层，以实现权值的显著减少，见表5所示。我们对再训练进行了五次修剪。VGG-16的结果和AlexNet一样，非常有希望。整个网络的大小已经减少到原来的7.5%(比原来小13倍)。特别要注意的是，两个最大的完全连接层都可以被修剪到原来大小的4%以下。这种减少对于实时图像处理至关重要，因为在实时图像处理中，几乎没有跨图像的完全连接层的重用(不像训练期间的批处理)。

讨论

精度与参数的权衡曲线如图5所示。删除的参数越多，精度越低。我们用L1和L2正则化进行了实验，有再训练的也有无再训练的，再加上迭代修剪，得到了5条权衡曲线。比较实线和虚线，再训练的重要性很明显:不进行再训练，准确性下降得更快——原来连接的1/3，而不是1/10。有趣的是，我们有免费的午餐，减少联系而不损失准确性，甚至无需再培训;而通过再培训，我们可以巧妙地将联系减少9倍。

L1正则化比L2在经过剪枝(蓝色点和紫色线)后直接得到更好的精度，因为它将更多的参数推向接近于零的位置。但是，通过比较黄线和绿线可以看出，L2在再训练后的表现要优于L1，因为进一步将值推向零没有任何好处。一种扩展是使用L1正则化进行剪枝，然后使用L2进行再训练，但这并不是简单地在两个阶段使用L2。一种模式的参数与另一种模式的参数不太适应。

最大的收获来自于迭代剪枝(实心圆圈的实心红线)。这里，我们采取剪枝和再训练网络(实心绿线和圆圈)，剪枝和再训练它。曲线最左边的点对应于修剪到80%(5倍修剪)时绿线上的点8，9倍没有精度损失。直到10倍精度才开始急剧下降。

两个绿点的精度略优于原始模型。我们认为，这种精度的提高是由于寻找合适的网络容量，从而减少过拟合。

CONV和FC层都可以被剪枝，但灵敏度不同。图6显示了各层对网络剪枝的敏感性。该图显示了随着参数逐层修剪，准确性如何下降。CONV层(左边)比完全连接的层(右边)对修剪更敏感。第一卷积层直接与输入图像交互，对剪枝最敏感。我们怀疑这种灵敏度是由于输入层只有3信道，因此冗余比其他卷积层少。我们利用灵敏度结果找到每一层的阈值:例如，最小的阈值应用于最敏感的层，即第一卷积层。

将修剪后的层存储为稀疏矩阵的存储开销仅为15.6%。存储相对索引而不是绝对索引可以将FC层索引占用的空间减少到5位。同样的,CONV层索引只能用8位表示。
修剪后,存储需求AlexNet和VGGNet足够小,所有的重量都可以存储在芯片上,而不是片外DRAM以数量级的更多的能量来访问(表1)。我们针对修剪方法固定功能硬件专门用于稀疏款,鉴于通用硬件的限制在稀疏的计算。

图7显示了修剪之前(左)和之后(右)权重分布的直方图。权重来自AlexNet的第一个全连接层。这两个面板有不同的y轴刻度。权值的原始分布以零为中心，尾部迅速下降。几乎所有的参数都在[- 0.015,0.015]之间。修剪后去除较大的中心区域。网络参数在再训练阶段进行自我调整。结果是，参数形成了双峰分布，并在x轴[- 0.025,0.025]之间分布得更广。

结论

我们提出了一种方法，以提高能源效率和存储的神经网络，而不影响准确性找到正确的连接。在某种程度上，我们的方法是由哺乳动物大脑中学习的运作方式所激发的，通过学习哪些连接是重要的，剔除不重要的连接，然后再训练剩余的稀疏网络。我们在ImageNet上的AlexNet和VGGNet上的实验表明，完全连接层和卷积层都可以被修剪，连接数从9倍减少到13倍而不损失准确性。这使得实时图像处理所需的内存容量和带宽更小，更容易部署在移动系统上。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
神经网络传递函数sigmoid,神经网络传递函数作用快乐的小荣荣神经网络机器学习深度学习人工智能
神经网络传递函数选取不同会有特别大差别嘛？只是最后一层，但前面层是非线性，那么可能存在区别不大的情况。线性函数f(a*input)=af(input),一般来说，input为向量，最简化情况下，可以假设input的各个维度，a1=a2=a3。。。意味着你线性层只是简单的对输入做了scale~而神经网络能起作用的原因，在于通过足够复杂的非线性函数，来模拟任何的分布。所以，神经网络必须要用非线性函数。
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
Python和R均方根误差平均绝对误差算法模型亚图跨际 Python 交叉知识 R 回归模型误差指标归一化均方根误差生态状态指标神经网络成本误差气体排放气候模型多项式拟合
要点回归模型误差评估指标归一化均方根误差生态状态指标神经网络成本误差计算气体排放气候算法模型Python误差指标均方根误差和平均绝对误差均方根偏差或均方根误差是两个密切相关且经常使用的度量值之一，用于衡量真实值或预测值与观测值或估计值之间的差异。估计器θ^\hat{\theta}θ^相对于估计参数θ\thetaθ的RMSD定义为均方误差的平方根：RMSD⁡(θ^)=MSE⁡(θ^)=E((θ^−θ
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
【机器学习与R语言】1-机器学习简介苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
1.基本概念机器学习：发明算法将数据转化为智能行为数据挖掘VS机器学习：前者侧重寻找有价值的信息，后者侧重执行已知的任务。后者是前者的先期准备过程：数据——>抽象化——>一般化。或者：收集数据——推理数据——归纳数据——发现规律抽象化：训练：用一个特定模型来拟合数据集的过程用方程来拟合观测的数据：观测现象——数据呈现——模型建立。通过不同的格式来把信息概念化一般化：一般化：将抽象化的知识转换成可用
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod

Learning both Weights and Connections for Efficient Neural Networks

Learning both Weights and Connections for Efficient Neural Networks

摘要

引言

相关工作

除了权重之外还要学习连接方式

正则化

Dropout 比例调整

局部剪枝和参数协同适应

迭代剪枝

剪枝神经元

实验

MNIST数据集上案例

AlexNet在ImageNet数据集上实验

VGG-16在ImageNet数据集上实验

讨论

结论

你可能感兴趣的:(论文翻译,神经网络,机器学习,神经网络)