qq_26898461

深度学习总结

转载自：

深度学习总结 - xudong0612的专栏 - 博客频道 - CSDN.NET
http://blog.csdn.net/xudong0612/article/details/8930891

最近一时兴起打算研究下深度学习，这个名词近来很火，貌似成为了人工智能领域一根新的稻草。经过几天的查资料和看论文，已经初步有了第一印象，闲话少说，结合一些资料，进入正题。

深度学习的起源

深度学习（Deep Learning）是机器学习中一个非常接近AI的领域，其动机在于建立、模拟人脑进行分析学习的神经网络。深度学习属于无监督学习。

深度学习的概念源于人工神经网络的研究。深度学习是相对于简单学习而言的，目前多数分类、回归等学习算法都属于简单学习，其局限性在于有限样本和计算单元情况下对复杂函数的表示能力有限，针对复杂分类问题其泛化能力受到一定制约。深度学习可通过学习一种深层非线性网络结构，实现复杂函数逼近，表征输入数据分布式表示，并展现了强大的从少数样本集中学习数据集本质特征的能力。含多隐层的多层感知器就是一种深度学习结构。深度学习模拟更多的神经层神经活动，通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示，深度学习的示意图如图1所示。

深度学习的概念由Hinton等人于2006年提出。基于深信度网(DBN)提出非监督贪心逐层训练算法，为解决深层结构相关的优化难题带来希望，随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法，它利用空间相对关系减少参数数目以提高训练性能。

图1 深度学习示意图

什么是深度学习

研究人员通过分析人脑的工作方式发现：通过感官信号从视网膜传递到前额大脑皮质再到运动神经的时间，推断出大脑皮质并未直接地对数据进行特征提取处理，而是使接收到的刺激信号通过一个复杂的层状网络模型，进而获取观测数据展现的规则。也就是说，人脑并不是直接根据外部世界在视网膜上投影，而是根据经聚集和分解过程处理后的信息来识别物体。因此视皮层的功能是对感知信号进行特征提取和计算，而不仅仅是简单地重现视网膜的图像。人类感知系统这种明确的层次结构极大地降低了视觉系统处理的数据量，并保留了物体有用的结构信息。深度学习正是希望通过模拟人脑多层次的分析方式来提高学习的准确性。

实际生活中，人们为了解决一个问题，如对象的分类（对象可是文档、图像等），首先必须做的事情是如何来表达一个对象，即必须抽取一些特征来表示一个对象，因此特征对结果的影响非常大。在传统的数据挖掘方法中，特征的选择一般都是通过手工完成的，通过手工选取的好处是可以借助人的经验或者专业知识选择出正确的特征；但缺点是效率低，而且在复杂的问题中，人工选择可能也会陷入困惑。于是，人们就在寻找一种能够自动的选择特征，而且还能保证特征准确的方法。DeepLearning就是能实现这一点，它能够通过多层次通过组合低层特征形成更抽象的高层特征，从而实现自动的学习特征，而不需要人参与特征的选取。

深度学习的核心思想

假设我们有一个系统S，它有n层（S1,…Sn），它的输入是I，输出是O，形象地表示为： I=>S1=>S2=>…..=>Sn => O，如果输出O等于输入I，即输入I经过这个系统变化之后没有任何的信息损失，保持了不变，这意味着输入I经过每一层Si都没有任何的信息损失，即在任何一层Si，它都是原有信息（即输入I）的另外一种表示。现在回到我们的主题DeepLearning，我们需要自动地学习特征，假设我们有一堆输入I（如一堆图像或者文本），假设我们设计了一个系统S（有n层），我们通过调整系统中参数，使得它的输出仍然是输入I，那么我们就可以自动地获取得到输入I的一系列层次特征，即S1，…, Sn。
另外，前面是假设输出严格地等于输入，这个限制太严格，我们可以略微地放松这个限制，例如我们只要使得输入与输出的差别尽可能地小即可。

深度学习的动机

学习基于深度架构的学习算法的主要动机是：

①不充分的深度是有害的；

在许多情形中深度2就足够(比如logicalgates, formal [threshold] neurons, sigmoid-neurons, Radial Basis Function [RBF]units like in SVMs)表示任何一个带有给定目标精度的函数。但是其代价是：图中所需要的节点数(比如计算和参数数量)可能变的非常大。理论结果证实那些事实上所需要的节点数随着输入的大小指数增长的函数族是存在的。这一点已经在logicalgates, formal [threshold] neurons 和rbf单元中得到证实。在后者中Hastad说明了但深度是d时，函数族可以被有效地(紧地)使用O(n)个节点(对于n个输入)来表示，但是如果深度被限制为d-1，则需要指数数量的节点数O(2^n)。

我们可以将深度架构看做一种因子分解。大部分随机选择的函数不能被有效地表示，无论是用深地或者浅的架构。但是许多能够有效地被深度架构表示的却不能被用浅的架构高效表示(seethe polynomials example in the Bengio survey paper)。一个紧的和深度的表示的存在意味着在潜在的可被表示的函数中存在某种结构。如果不存在任何结构，那将不可能很好地泛化。

②大脑有一个深度架构；

例如，视觉皮质得到了很好的研究，并显示出一系列的区域，在每一个这种区域中包含一个输入的表示和从一个到另一个的信号流(这里忽略了在一些层次并行路径上的关联，因此更复杂)。这个特征层次的每一层表示在一个不同的抽象层上的输入，并在层次的更上层有着更多的抽象特征，他们根据低层特征定义。

需要注意的是大脑中的表示是在中间紧密分布并且纯局部：他们是稀疏的：1%的神经元是同时活动的。给定大量的神经元，仍然有一个非常高效地(指数级高效)表示。

③认知过程是深度的；

人类层次化地组织思想和概念；

人类首先学习简单的概念，然后用他们去表示更抽象的；

工程师将任务分解成多个抽象层次去处理；

深度学习结构

目前深度学习按照结构和技术应用的方式，可以把结构分为三类：

生成性深度结构

该结构描述数据的高阶相关特性，或观测数据和相应类别的联合概率分布。与传统区分型神经网络不同，可获取观测数据和标签的联合概率分布，这方便了先验概率和后验概率的估计，而区分型模型仅能对后验概率进行估计。论文Afast learning algorithm for deep learning中采用的深度信念网（DBN）就属于生成性深度结构。DBN解决传统BP算法训练多层神经网络的难题：1）需要大量含标签训练样本集；2）较慢的收敛速度；3）因不合适的参数选择陷入局部最优。

DBN由一系列受限波尔兹曼机（RBM）单元组成。RBM是一种典型神经网络，该网络可视层和隐层单元彼此互连（层内无连接），隐单元可获取输入可视单元的高阶相关性。相比传统sigmoid信度网络，RBM权值的学习相对容易。为了获取生成性权值，预训练采用无监督贪心逐层方式来实现。在训练过程中，首先将可视向量值映射给隐单元；然后可视单元由隐层单元重建；这些新可视单元再次映射给隐单元，这样就获取了新的隐单元。通过自底向上组合多个RBM可以构建一个DBN。应用高斯—伯努利RBM或伯努利—伯努利RBM，可用隐单元的输出作为训练上层伯努利—伯努利RBM的输入，第二层伯努利和伯努利的输出作为第三层的输入等，如图2所示。

图2 DBN模型

区分性深度结构

目的是提供对模式分类的区分性能力，通常描述数据的后验分布。卷积神经网络（Convolutional neural network, CNNs）是第一个真正成功训练多层网络结构的学习算法，与DBNs不同，它属于区分性训练算法。受视觉系统结构的启示，当具有相同参数的神经元应用于前一层的不同位置时，一种变换不变性特征就可获取了。后来LeCun等人沿着这种思路，利用ＢＰ算法设计并训练了CNNs。CNNs作为深度学习框架是基于最小化预处理数据要求而产生的。受早期的时间延迟神经网络影响。CNNs靠共享时域权值降低复杂度。CNNs是利用空间关系减少参数数目以提高一般前向BP训练的一种拓扑结构，并在多个实验中获取了较好性能。在CNNs中被称作局部感受区域的图像的一小部分作为分层结构的最底层输入。信息通过不同的网络层次进行传递，因此在每一层能够获取对平移、缩放和旋转不变的观测数据的显著特征。

混合型结构

它的目标是区分性的，但通常利用了生成型结构的输出会更易优化。混合型结构的学习过程包含两个部分，即生成性部分和区分性部分。现有典型的生成性单元通常最终用于区分性任务，生成性模型应用于分类任务时，预训练可结合其他典型区分性学习算法对所有权值进行优化。这个区分性寻优过程通常是附加一个顶层变量来表示训练集提供的期望输出或标签。BP算法可用于优化DBN权值，它的初始权值通过在RBM和DBN预训练中得到而非随机产生，这样的网络通常会比仅通过BP算法单独训练的网络性能优越。可以认为BP对DBNs训练仅完成局部参数空间搜索，与前馈型神经网络相比加速了训练和收敛时间。

里程碑式的论文

目前，深度学习的成果主要集中在计算机视觉和语音识别方面，并且相关成果已经被Google，Microsoft等公司采用。除此之外，自然语言处理、信息检索等领域也对深度学习产生了浓厚的兴趣，但是目前还没有突出的成果。

计算机视觉

ImageNetClassification with Deep Convolutional Neural Networks, Alex Krizhevsky, IlyaSutskever, Geoffrey E Hinton, NIPS 2012.

LearningHierarchical Features for Scene Labeling, Clement Farabet, Camille Couprie,Laurent Najman and Yann LeCun, IEEE Transactions on Pattern Analysis andMachine Intelligence, 2013.

LearningConvolutional Feature Hierachies for Visual Recognition, Koray Kavukcuoglu,Pierre Sermanet, Y-Lan Boureau, Karol Gregor, Michaël Mathieu and YannLeCun, Advances in Neural Information Processing Systems (NIPS 2010), 23, 2010.

语音识别

Dahl,George E., et al. Large vocabulary continuous speech recognition withcontext-dependent DBN-HMMs. Acoustics, Speech and Signal Processing (ICASSP),2011 IEEE International Conference on. IEEE, 2011.

Mohamed,A-R., et al. Deep belief networks using discriminative features for phonerecognition. Acoustics, Speech and Signal Processing (ICASSP), 2011 IEEEInternational Conference on. IEEE, 2011.

Fasel,Ian, Jeff Berry. Deep belief networks for real-time extraction of tonguecontours from ultrasound during speech. Pattern Recognition (ICPR), 2010 20thInternational Conference on. IEEE, 2010.

Deng,Li, et al. Binary coding of speech spectrograms using a deep auto-encoder.Proc. Interspeech. 2010.

自然语言处理

DESELAERST,HASANS, BENDERO, et al. A deep learning approach to machine transliteration[C].Proc of the 4th Workshop on Statistical Machine Translation. 2009:233-241.

开发工具

Theano 是一个 Python 的扩展库，用来定义、优化和模拟数学表达式计算，可以高效的解决多维数组的计算问题。利用Theano更容易的实现深度学习模型。

使用Theano要求首先熟悉Python和numpy（如果你不了解，可以先看看这里：python、numpy）。接下来学习Theano建议先看Theano basic tutorial，然后按照Getting Started 下载相关数据并用gradient descent的方法进行学习。

学习了Theano的基本方法后，可以练习写以下几个算法：

有监督学习：

Logistic Regression - using Theano for something simple
Multilayer perceptron - introduction to layers
Deep Convolutional Network - a simplified version of LeNet5

无监督学习：

Auto Encoders, Denoising Autoencoders - description of autoencoders
Stacked Denoising Auto-Encoders - easy steps into unsupervised pre-training for deep nets
Restricted Boltzmann Machines - single layer generative RBM model
Deep Belief Networks - unsupervised generative pre-training of stacked RBMs followed by supervised fine-tuning

参考文献

[1] http://deeplearning.net

[2] 机器学习前沿热点–Deep Learning

[3] 深度学习(Deep Learning, DL)的相关资料总结

[4] UFLDL教程

[5] Hinton, Geoffrey E., Simon Osindero, Yee-Whye Teh. A fast learning algorithm for deep belief nets. Neural computation 18.7 (2006): 1527-1554.

[6] 孙志军, 薛磊, 许阳明, 王正. (2012). 深度学习研究综述. 计算机应用研究,29(8), 2806-2810.

第N2周：构建词典 OreoCC NLP
本人往期文章可查阅：深度学习总结我的环境：语言环境：Python3.11编译器：PyCharm深度学习环境：Pytorchtorch==2.0.0+cu118torchvision==0.18.1+cu118显卡：NVIDIAGeForceGTX1660本周任务：使用N1周的.txt文件构建词典，停用词请自定义1.导入数据fromtorchtext.vocabimportbuild_vocab_f
第N3周：NLP中的数据集构建 OreoCC 自然语言处理深度学习 pytorch
本人往期文章可查阅：深度学习总结对于初学者，NLP中最烦人的问题之一就是数据集的构建问题，处理不好就会引起shape问题（各种由于shape错乱导致的问题）。这里我给出一个模板，大家可根据这个模板来构建。torch.utils.data是PyTorch中用于数据加载和预处理的模块。其中包括Dataset和DataLoader两个类，它们通常结合使用来加载和处理数据。1.Datasettorch.u
第N4周：NLP中的文本嵌入 OreoCC 自然语言处理人工智能
本人往期文章可查阅：深度学习总结词嵌入是一种用于自然语言处理（NLP）的技术，用于将单词表示为数字，以便计算机可以处理它们。通俗的讲就是，一种把文本转为数值输入到计算机中的方法。之前文章中提到的将文本转换为字典序列、one-hot编码就是最早期的词嵌入方法。Embedding和EmbeddingBag则是PyTorch中的用来处理文本数据中词嵌入（wordembedding）的工具，它们将离散的词
第G9周：ACGAN理论与实战 OreoCC GAN
>-**本文为[365天深度学习训练营]中的学习记录博客**>-**原作者：[K同学啊]**本人往期文章可查阅：深度学习总结我的环境：语言环境：Python3.11编译器：PyCharm深度学习环境：Pytorchtorch==2.0.0+cu118torchvision==0.18.1+cu118显卡：NVIDIAGeForceGTX1660论文地址：ConditionalImageSynthe
机器学习 VS 表示学习 VS 深度学习 Efred.D 人工智能机器学习深度学习人工智能
文章目录前言一、机器学习是什么?二、表示学习三、深度学习总结前言本文主要阐述机器学习,表示学习和深度学习的原理和区别.一、机器学习是什么?机器学习(machinelearning),是从有限的数据集中学习到一定的规律,再把学到的规律应用到一些相似的样本集中做预测.机器学习的历史可以追溯到20世纪40年代McCulloch提出的人工神经元网络,目前学界大致把机器学习分为传统机器学习和机器学习两个类别
吴恩达深度学习-L1 神经网络和深度学习总结向来痴_ 深度学习人工智能
作业地址：吴恩达《深度学习》作业线上版-知乎(zhihu.com)写的很好的笔记：吴恩达《深度学习》笔记汇总-知乎(zhihu.com)我的「吴恩达深度学习笔记」汇总帖（附18个代码实战项目）-知乎(zhihu.com)此处只记录需要注意的点，若想看原笔记请移步。1.1深度学习入门我们只需要管理神经网络的输入和输出，而不用指定中间的特征，也不用理解它们究竟有没有实际意义。1.2简单的神经网络——逻
【PyTorch】PyTorch中张量(Tensor)统计操作咸鱼鲸 PyTorch pytorch 人工智能 python
PyTorch深度学习总结第五章PyTorch中张量(Tensor)统计操作文章目录PyTorch深度学习总结前言一、最值查找二、特殊值查询前言上文介绍了PyTorch中张量(Tensor)的计算操作，本文将介绍张量的统计操作。一、最值查找函数描述torch.max()找出张量中的最大值torch.argmax()输出最大值所在位置torch.min()找出张量中的最小值torch.argmin(
【PyTorch】PyTorch中张量(Tensor)计算操作咸鱼鲸 PyTorch pytorch 人工智能 python
PyTorch深度学习总结第五章PyTorch中张量(Tensor)计算操作文章目录PyTorch深度学习总结前言一、张量比较大小1、torch.allclose()2、torch.eq()和torch.equal()3、ge、gt、le、lt、ne函数4、torch.isnan()二、基本运算1、四则运算(加减乘除)2、其他计算前言上文介绍了PyTorch中张量(Tensor)的拆分和拼接操作，
[PyTorch]PyTorch中张量(Tensor)拼接和拆分操作咸鱼鲸 pytorch 人工智能 python
PyTorch深度学习总结第四章PyTorch中张量(Tensor)拼接和拆分操作文章目录PyTorch深度学习总结前言一、张量拼接二、张量拆分前言上文介绍了PyTorch中张量(Tensor)的切片操作，本文主要介绍张量的拆分和拼接操作。一、张量拼接函数描述torch.cat()将张量按照指定维度关系进行拼接torch.stack()将张量按照指定维度关系进行拼接（用法同cat相同）#引入库im
【PyTorch】改变张量(Tensor)形状操作咸鱼鲸 PyTorch pytorch 人工智能 python
PyTorch深度学习总结第二章PyTorch中改变张量(Tensor)形状操作文章目录PyTorch深度学习总结一、前言二、改变张量形状一、前言上文讲解了张量生成和信息获取的知识，本文将针对张量的操作进行详细讲解。二、改变张量形状1、改变张量形状的函数总结：函数描述A.reshape(3,4)改变张量A形状为3*4A.resize_(3,4)改变张量A形状为3*4A.resize_as_(B)改
【PyTorch】PyTorch中张量(Tensor)切片操作咸鱼鲸 PyTorch pytorch 人工智能 python
PyTorch深度学习总结第三章PyTorch中张量(Tensor)切片操作文章目录PyTorch深度学习总结一、前言二、获取张量中的元素1、切片（行、列数）方法2、torch.where()函数3、使元素置零的操作一、前言上文介绍了PyTorch中改变张量(Tensor)形状的操作，本文主要介绍张量切片操作。二、获取张量中的元素1、切片（行、列数）方法①#引入库importtorch#生成张量A
【PyTorch】张量(Tensor)的生成咸鱼鲸 PyTorch pytorch 人工智能 python
PyTorch深度学习总结第一章Pytorch中张量(Tensor)的生成文章目录PyTorch深度学习总结一、什么是PyTorch？二、张量(Tensor)1、张量的数据类型2、张量生成和信息获取总结一、什么是PyTorch？PyTorch是一个开源的深度学习框架，基于Python语言。它由Facebook的人工智能研究团队于2016年开发并发布。PyTorch提供了一种灵活的、动态的计算图模型
花书学习笔记-深度学习概念 iwill323 人工智能深度学习
目录什么是机器学习函数类别机器学习举例步骤第一步：猜测函数第二步：定义Loss第三步：优化从线性到非线性：从函数逼近的角度理解多个特征变量逼近连续曲线表示更有弹性的模型总结用多个Featuresigmoid->ReLU从机器学习到深度学习早期的人工智能机器学习表征学习(representationlearning)深度学习总结主题SupervisedLearningSelf-supervisedL
深度学习笔记（二十四）—— 深度学习总结与回顾 Nino_Lau
本周是深度学习实验课的最后一次课，让我们回顾一下在这个学期中大家都学习到了哪些内容。在前面的课程中我们首先了解了神经网络的结构，如何去搭建神经网络，怎样去训练神经网络，以及神经网络的优化、微调。紧接着我们又学习了深度学习领域当前比较流行的几个大方向，例如分类、语义分割、目标检测、对抗神经网络、自然语言处理等等。接下来的内容是对我们所学的知识的一个总结和升华。1.神经网络的基础内容1.框架当前训练神
深度学习总结：tensorflow和pytorch关于RNN的对比,tf.nn.dynamic_rnn,nn.LSTM 萤火虫之暮 DL 学习 tensorflow torch.LSTM pytorch
tensorflow和pytorch关于RNN的对比：tf.nn.dynamic_rnn很难理解，他的意思只是用数据走一遍你搭建的RNN网络。可以明显看出pytorch封装更高，更容易理解，动态图的优势。##tensorflow#RNN#num_units=64代表h_t,c_t的维度rnn_cell=tf.contrib.rnn.BasicLSTMCell(num_units=64)#这个累加的
第三期第二次示范班深度学习总结刘丽华L
自己为什么对新教育“情有独钟，有情执”？首次接触新教育是17年夏天在九江看到突破班的孩子在台上的展示，感受他们的精气神不一样，精气神体现在看到他们运动能力强，另在用餐时见这群孩子聊天时全英语交流，有礼貌，他们在一起没有乱哄哄的，他们口语水平让我很惊讶，相比之下这群孩子从外在呈现的就比我身边的孩子强很多，当时有一个最深的感触是，自己白养了孩子，很对不起孩子，自己只给到了孩子吃喝穿等物质，其他的没有给
2023.08.13 学习周报 MoxiMoses 深度学习
文章目录摘要文献阅读1.题目2.要点3.问题4.解决方案5.本文贡献6.方法6.1特征选择6.2时间序列平稳性检测与数据分解6.3基于GRU神经网络的PM2.5浓度预测7.实验7.1网络参数7.2实验结果7.3对比实验8.讨论9.结论10.展望PINNS模型1.自动微分2.全连接神经网络3.PINNs模型的PI4.可能存在的问题深度学习总结摘要Thisweek,Ireadacomputerscie
机器学习简介 @kc++ 机器学习人工智能
文章目录引言1.从找规律说起2.机器学习应用2.1有监督学习2.2无监督学习2.2.1聚类2.2.2降维3.机器学习一般流程4.机器学习常用概念5.深度学习简介5.1引入--猜数字5.2深度学习5.2.1隐含层/中间层5.2.2随机初始化5.2.3损失函数5.2.4导数与梯度5.2.5梯度下降5.2.6优化器5.2.7MiniBatch&epoch5.2.8深度学习总结6.总结引言机器学习是人工智
【李宏毅深度学习课程笔记--【1】】 all_about_fresh 李宏毅深度学习课程深度学习 python 人工智能
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档目录前言一、什么是机器学习二、本课程专注于深度学习总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、什么是机器学习机器学习就是在找一个函数：这个函数是人类写不出来的，但
关于吴恩达深度学习总结(一) 南阳北海
关于吴恩达深度学习总结(一)相关函数文章目录关于吴恩达深度学习总结(一)相关函数一、costfunction(成本函数)二、lossfunction(损失函数)三、sigmoidfunction（sigmoid函数）四、yhat五、参数的更新规则六、w，b的导数七、向量化logistic回归八、激活函数1.sigmoidfunction（sigmoid函数）2.tanh函数3.ReLU函数（max
深度学习总结——用自己的数据集微调CLIP lzl2040 计算机视觉深度学习计算机视觉人工智能
CLIP概述CLIP（ContrastiveLanguage-ImagePretraining）是由OpenAI开发的一种深度学习模型，用于将图像和自然语言文本进行联合编码。它采用了多模态学习的方法，使得模型能够理解图像和文本之间的语义关系。它的核心思想是将图像和文本视为同等重要的输入，并通过联合训练来学习它们之间的联系。CLIP模型使用了一个共享的编码器，它将图像和文本分别映射到一个共享的特征空
深度学习总结综述地理探险家遥感与深度学习深度学习人工智能计算机视觉
深度学习总结综述一、深度学习目前的关键进展与应用深度学习是机器学习的一个子领域，它通过模拟人类大脑中的神经网络来解决复杂问题。目前，深度学习在许多领域都取得了重要的突破。以下是一些关键的进展和应用：自然语言处理（NLP）：机器翻译：谷歌翻译采用了Transformer架构，显著提高了翻译质量和速度。情感分析：利用BERT等预训练模型进行微博、电影评论等情感倾向分析。文本摘要：OpenAI的GPT-
第三期第三次课深度学习总结刘丽华L
末尾老师讲到关于写日记的方法及个人态度现象，反思昨天写日记当中又有一点原有模式出现，只是在记录一件事情，而没有进行总结，貌似是时间问题觉得好晚了，自己该睡觉，身体疲惫了，因此草草写完实际上还是目标与对持学习的态度，忘了写日记不仅是记录昨天还更重要的通过写提高写作水平及梳理自己前后的想法，去看见做的好的点，需要改善的点。例如:前天邀请一个客户去参加产说会，去邀约客之前有害怕客户会拒绝，不如约参加。二
算法岗面试——深度学习总结早上起来闹钟又丢了
BatchNormalization介绍参考知乎深度学习中BatchNormalization为什么效果好？参考CSDN对Batch_Normalization的理解神经网络在训练的时候随着网络层数的加深,激活函数的输入值的整体分布逐渐往激活函数的取值区间上下限靠近,从而导致在反向传播时低层的神经网络的梯度消失。而BatchNormalization的作用是通过规范化的手段,将越来越偏的分布拉回到
深度学习总结 MoxiMoses 机器学习深度学习
文章目录前言一、机器学习的概念二、机器学习的三个步骤三、Regression四、Classification五、DeepLearning六、CNN七、RNN八、LSTM九、Transformer十、GAN总结前言在这段时间地学习中，我通过深度学习的相关视频学习到了一些基础知识，现在对这些学习到的知识进行以下总结。一、机器学习的概念机器学习是从数据中自动分析获得模型，并利用模型对未知数据进行预测。简
CVPR 2015 之深度学习总结南山牧笛深度学习
Part1－AlexNet和VGG-Net摘要－今年的CVPR非常的火爆，总共有2800多人参与，相比去年增加了700多人，这与deeplearning的异军突起是不无关系的。CVPR2015基本是“theyearofdeeplearning”，有大概70%的文章是关于deeplearning的。今年的CVPR非常的火爆，总共有2800多人参与，相比去年增加了700多人，这与deeplearnin
CNN超进化史（1）——从人工智能到深度学习 my日月星空深度学习深度学习 python
提示：文章内容仅代表作者个人理解和观点文章目录前言一、深度学习、机器学习和人工智能之间的关系二、人工智能弱人工智能：强人工智能：超人工智能：三、机器学习1.模式识别2.数据挖掘3.统计学习4.计算机视觉5.语音识别6.自然语言识别四.深度学习总结前言提示：这里可以添加本文要记录的大概内容：博主也正在学习深度学习，同样是名技术小白，突然在写学习笔记之后想将想法和学习历程分享出来，于是…。前几天看到一
亚马逊---人工智能入门---学习笔记认真写博客的夏目浅石. 我的CSDN活动之旅人工智能学习
writeinfront个人主页：认真写博客的夏目浅石.欢迎各位→点赞+收藏⭐️+留言系列专栏：蓝桥杯算法笔记总结：希望你看完之后，能对你有所帮助，不足请指正！共同学习交流✉️为什么我们不知疲倦，因为我们都在做自己所热爱的事♐文章目录writeinfront一、本节的学习重点是什么？二、什么是AI？三、为什么AI是重要的？四、什么是机器学习和深度学习？五、机器学习六、深度学习总结writeinfr
【第三周深度学习总结】文海傲舟深度学习神经网络人工智能
第三周深度学习总结论文学习ResNet重要结构结构创新点通过在block中加入identitymap，假设之前想要学习的映射为H(x)H(x)H(x)，那么现在可以知道H(x)=F(x)+xH(x)=F(x)+xH(x)=F(x)+x，则现在网络底层学习的映射变为了H(x)−xH(x)-xH(x)−x，这个部分的学习较之前更为容易。同时由于添加了shortcut结构，使得整个网络在反向梯度传播的过
3D深度学习总结（聚焦3D深度学习的现在于未来） xiaobai_Ry #点云处理深度学习 3d 人工智能 3D检测点云
3D深度学习总结（聚焦3D深度学习的现在于未来）本文经机器之心（微信公众号：almosthuman2014）授权转载，禁止二次转载选自Thegradient【点击此处】，作者：MihirGarimella、PrathikNaidu机器之心编译，参与：Geekai、晓坤【微信号链接点击此处】备注：2021年最新3D检测发展与未来介绍讲解（来源于PointNet作者本人）3D物体检测的发展与未来-祁芮
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本