凌风探梅

CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的内部网络结构有什么区别？

CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的内部网络结构有什么区别？以及他们的主要用途是什么？只知道CNN是局部感受和参数共享，比较适合用于图像这方面。刚入门的小白真心求助

1 条评论

按投票排序按时间排序

12 个回答

606

Ph.D(er) ，每周六提供一份高质量回答。

林星瞬、uniblue、鱼雷等人赞同

首先，我感觉不必像 @李Shawn 同学一样认为DNN、CNN、RNN完全不能相提并论。从广义上来说，NN（或是更美的DNN）确实可以认为包含了CNN、RNN这些具体的变种形式。在实际应用中，所谓的深度神经网络DNN，往往融合了多种已知的结构，包括卷积层或是LSTM单元。但是就题主的意思来看，这里的DNN应该特指全连接的神经元结构，并不包含卷积单元或是时间上的关联。因此，题主一定要将DNN、CNN、RNN等进行对比，也未尝不可。

其实，如果我们顺着神经网络技术发展的脉络，就很容易弄清这几种网络结构发明的初衷，和他们之间本质的区别，希望对题主有所帮助。

=========================== 分割线就是我 ================================

神经网络技术起源于上世纪五、六十年代，当时叫感知机（perceptron），拥有输入层、输出层和一个隐含层。输入的特征向量通过隐含层变换达到输出层，在输出层得到分类结果。早期感知机的推动者是Rosenblatt。（扯一个不相关的：由于计算技术的落后，当时感知器传输函数是用线拉动变阻器改变电阻的方法机械实现的，脑补一下科学家们扯着密密麻麻的导线的样子…）

但是，Rosenblatt的单层感知机有一个严重得不能再严重的问题，即它对稍复杂一些的函数都无能为力（比如最为典型的“异或”操作）。连异或都不能拟合，你还能指望这货有什么实际用途么o(╯□╰)o

随着数学的发展，这个缺点直到上世纪八十年代才被Rumelhart、Williams、Hinton、LeCun等人（反正就是一票大牛）发明的多层感知机（multilayer perceptron）克服。多层感知机，顾名思义，就是有多个隐含层的感知机（废话……）。好好，我们看一下多层感知机的结构：

图1上下层神经元全部相连的神经网络——多层感知机

多层感知机可以摆脱早期离散传输函数的束缚，使用sigmoid或tanh等连续函数模拟神经元对激励的响应，在训练算法上则使用Werbos发明的反向传播BP算法。对，这货就是我们现在所说的神经网络NN——神经网络听起来不知道比感知机高端到哪里去了！这再次告诉我们起一个好听的名字对于研（zhuang）究（bi）很重要！

多层感知机解决了之前无法模拟异或逻辑的缺陷，同时更多的层数也让网络更能够刻画现实世界中的复杂情形。相信年轻如Hinton当时一定是春风得意。

多层感知机给我们带来的启示是，神经网络的层数直接决定了它对现实的刻画能力——利用每层更少的神经元拟合更加复杂的函数[1]。

（Bengio如是说：functions that can be compactly represented by a depth k architecture might require an exponential number of computational elements to be represented by a depth k − 1 architecture.）

即便大牛们早就预料到神经网络需要变得更深，但是有一个梦魇总是萦绕左右。随着神经网络层数的加深，优化函数越来越容易陷入局部最优解，并且这个“陷阱”越来越偏离真正的全局最优。利用有限数据训练的深层网络，性能还不如较浅层网络。同时，另一个不可忽略的问题是随着网络层数增加，“梯度消失”现象更加严重。具体来说，我们常常使用sigmoid作为神经元的输入输出函数。对于幅度为1的信号，在BP反向传播梯度时，每传递一层，梯度衰减为原来的0.25。层数一多，梯度指数衰减后低层基本上接受不到有效的训练信号。

2006年，Hinton利用预训练方法缓解了局部最优解问题，将隐含层推动到了7层[2]，神经网络真正意义上有了“深度”，由此揭开了深度学习的热潮。这里的“深度”并没有固定的定义——在语音识别中4层网络就能够被认为是“较深的”，而在图像识别中20层以上的网络屡见不鲜。为了克服梯度消失，ReLU、maxout等传输函数代替了sigmoid，形成了如今DNN的基本形式。单从结构上来说，全连接的DNN和图1的多层感知机是没有任何区别的。

值得一提的是，今年出现的高速公路网络（highway network）和深度残差学习（deep residual learning）进一步避免了梯度消失，网络层数达到了前所未有的一百多层（深度残差学习：152层）[3,4]！具体结构题主可自行搜索了解。如果你之前在怀疑是不是有很多方法打上了“深度学习”的噱头，这个结果真是深得让人心服口服。

图2缩减版的深度残差学习网络，仅有34层，终极版有152层，自行感受一下

如图1所示，我们看到全连接DNN的结构里下层神经元和所有上层神经元都能够形成连接，带来的潜在问题是参数数量的膨胀。假设输入的是一幅像素为1K*1K的图像，隐含层有1M个节点，光这一层就有10^12个权重需要训练，这不仅容易过拟合，而且极容易陷入局部最优。另外，图像中有固有的局部模式（比如轮廓、边界，人的眼睛、鼻子、嘴等）可以利用，显然应该将图像处理中的概念和神经网络技术相结合。此时我们可以祭出题主所说的卷积神经网络CNN。对于CNN来说，并不是所有上下层神经元都能直接相连，而是通过“卷积核”作为中介。同一个卷积核在所有图像内是共享的，图像通过卷积操作后仍然保留原先的位置关系。两层之间的卷积传输的示意图如下：

图3卷积神经网络隐含层（摘自Theano教程）

通过一个例子简单说明卷积神经网络的结构。假设图3中m-1=1是输入层，我们需要识别一幅彩色图像，这幅图像具有四个通道ARGB（透明度和红绿蓝，对应了四幅相同大小的图像），假设卷积核大小为100*100，共使用100个卷积核w1到w100（从直觉来看，每个卷积核应该学习到不同的结构特征）。用w1在ARGB图像上进行卷积操作，可以得到隐含层的第一幅图像；这幅隐含层图像左上角第一个像素是四幅输入图像左上角100*100区域内像素的加权求和，以此类推。同理，算上其他卷积核，隐含层对应100幅“图像”。每幅图像对是对原始图像中不同特征的响应。按照这样的结构继续传递下去。CNN中还有max-pooling等操作进一步提高鲁棒性。

图4一个典型的卷积神经网络结构，注意到最后一层实际上是一个全连接层（摘自Theano教程）

在这个例子里，我们注意到输入层到隐含层的参数瞬间降低到了100*100*100=10^6个！这使得我们能够用已有的训练数据得到良好的模型。题主所说的适用于图像识别，正是由于CNN模型限制参数了个数并挖掘了局部结构的这个特点。顺着同样的思路，利用语音语谱结构中的局部信息，CNN照样能应用在语音识别中。

全连接的DNN还存在着另一个问题——无法对时间序列上的变化进行建模。然而，样本出现的时间顺序对于自然语言处理、语音识别、手写体识别等应用非常重要。对了适应这种需求，就出现了题主所说的另一种神经网络结构——循环神经网络RNN。

在普通的全连接网络或CNN中，每层神经元的信号只能向上一层传播，样本的处理在各个时刻独立，因此又被成为前向神经网络(Feed-forward Neural Networks)。而在RNN中，神经元的输出可以在下一个时间戳直接作用到自身，即第i层神经元在m时刻的输入，除了（i-1）层神经元在该时刻的输出外，还包括其自身在（m-1）时刻的输出！表示成图就是这样的：

图5 RNN网络结构

我们可以看到在隐含层节点之间增加了互连。为了分析方便，我们常将RNN在时间上进行展开，得到如图6所示的结构：

图6 RNN在时间上进行展开

Cool，（t+1）时刻网络的最终结果O(t+1)是该时刻输入和所有历史共同作用的结果！这就达到了对时间序列建模的目的。

不知题主是否发现，RNN可以看成一个在时间上传递的神经网络，它的深度是时间的长度！正如我们上面所说，“梯度消失”现象又要出现了，只不过这次发生在时间轴上。对于t时刻来说，它产生的梯度在时间轴上向历史传播几层之后就消失了，根本就无法影响太遥远的过去。因此，之前说“所有历史”共同作用只是理想的情况，在实际中，这种影响也就只能维持若干个时间戳。

为了解决时间上的梯度消失，机器学习领域发展出了长短时记忆单元LSTM，通过门的开关实现时间上记忆功能，并防止梯度消失，一个LSTM单元长这个样子：

图7 LSTM的模样

除了题主疑惑的三种网络，和我之前提到的深度残差学习、LSTM外，深度学习还有许多其他的结构。举个例子，RNN既然能继承历史信息，是不是也能吸收点未来的信息呢？因为在序列信号分析中，如果我能预知未来，对识别一定也是有所帮助的。因此就有了双向RNN、双向LSTM，同时利用历史和未来的信息。

图8双向RNN

事实上，不论是那种网络，他们在实际应用中常常都混合着使用，比如CNN和RNN在上层输出之前往往会接上全连接层，很难说某个网络到底属于哪个类别。不难想象随着深度学习热度的延续，更灵活的组合方式、更多的网络结构将被发展出来。尽管看起来千变万化，但研究者们的出发点肯定都是为了解决特定的问题。题主如果想进行这方面的研究，不妨仔细分析一下这些结构各自的特点以及它们达成目标的手段。入门的话可以参考：

Ng写的Ufldl：UFLDL教程 - Ufldl

也可以看Theano内自带的教程，例子非常具体：Deep Learning Tutorials

欢迎大家继续推荐补充。

当然啦，如果题主只是想凑个热闹时髦一把，或者大概了解一下方便以后把妹使，这样看看也就罢了吧。

参考文献：

[1] Bengio Y. Learning Deep Architectures for AI[J]. Foundations & Trends® in Machine Learning, 2009, 2(1):1-127.

[2] Hinton G E, Salakhutdinov R R. Reducing the Dimensionality of Data with Neural Networks[J]. Science, 2006, 313(5786):504-507.

[3] He K, Zhang X, Ren S, Sun J. Deep Residual Learning for Image Recognition. arXiv:1512.03385, 2015.

[4] Srivastava R K, Greff K, Schmidhuber J. Highway networks. arXiv:1505.00387, 2015.

编辑于 2016-01-30 27 条评论感谢收藏 • 没有帮助 • • 禁止转载

知乎用户，我是机器鼓励师

金尚赟、与析赞同

在序列信号的应用上，CNN是只响应预先设定的信号长度（输入向量的长度），RNN的响应长度是学习出来的

发布于 2015-08-22 添加评论感谢收藏 • 没有帮助 • • 作者保留权利

李Shawn ，人工智能研究人员/学生

河堤轻语、Dorniwang、百步飞剑等人赞同

个人觉得CNN、RNN和DNN不能放在一起比较。
DNN是一个大类，CNN是一个典型的空间上深度的神经网络，RNN是在时间上深度的神经网络。
推荐你从UFLDL开始看，这是斯坦福深度学习的课程，了解一些神经网络的基础，会对你的学习有很大帮助。
=============================分割线======================================
前面一位同学回答得非常详细完整，我再回来谈一谈怎么学习这些模型，我来分享一下我的学习历程。我也是在学习中，以后会慢慢继续补充。
1、 http:// ufldl.stanford.edu/wiki /index.php/UFLDL 教程
这是我最开始接触神经网络时看的资料，把这个仔细研究完会对神经网络的模型以及如何训练（反向传播算法）有一个基本的认识，算是一个基本功。

2、 Deep Learning Tutorials
这是一个开源的深度学习工具包，里面有很多深度学习模型的python代码还有一些对模型以及代码细节的解释。我觉得学习深度学习光了解模型是不难的，难点在于把模型落地写成代码，因为里面会有很多细节只有动手写了代码才会了解。但Theano也有缺点，就是极其难以调试，以至于我后来就算自己动手写几百行的代码也不愿意再用它的工具包。所以我觉得Theano的正确用法还是在于看里面解释的文字，不要害怕英文，这是必经之路。PS：推荐使用python语言，目前来看比较主流。

3、 Stanford University CS231n: Convolutional Neural Networks for Visual Recognition
斯坦福的一门课：卷积神经网络，李飞飞教授主讲。这门课会系统的讲一下卷积神经网络的模型，然后还有一些课后习题，题目很有代表性，也是用python写的，是在一份代码中填写一部分缺失的代码。如果把这个完整学完，相信使用卷积神经网络就不是一个大问题了。

4、斯坦福大学公开课：机器学习课程
这可能是机器学习领域最经典最知名的公开课了，由大牛Andrew Ng主讲，这个就不仅仅是深度学习了，它是带你领略机器学习领域中最重要的概念，然后建立起一个框架，使你对机器学习这个学科有一个较为完整的认识。这个我觉得所有学习机器学习的人都应该看一下，我甚至在某公司的招聘要求上看到过：认真看过并深入研究过Andrew Ng的机器学习课程，由此可见其重要性。

编辑于 2016-03-07 6 条评论感谢收藏 • 没有帮助 • • 作者保留权利

知乎用户

知乎用户、黄成炎、知乎用户等人赞同

DNN以神经网络为载体，重在深度，可以说是一个统称。
RNN，回归型网络，用于序列数据，并且有了一定的记忆效应，辅之以lstm。
CNN应该侧重空间映射，图像数据尤为贴合此场景。

发布于 2015-08-31 添加评论感谢收藏 • 没有帮助 • • 作者保留权利

魏秀参，铁打的人儿，流水的饭

知乎用户、张弛、崔强等人赞同

蟹妖，可参阅我关于深度学习入门的回答。
深度学习入门必看的书和论文？有哪些必备的技能需学习？ - 魏秀参的回答

编辑于 2015-08-20 添加评论感谢收藏 • 没有帮助 • • 作者保留权利

eastflowing ，一起进步

建议还是看论文和代码

发布于 15:44 添加评论感谢收藏 • 没有帮助 • • 作者保留权利

知乎用户，梅吹，老司机。

maydaycode、知乎用户、袁彬等人赞同

CNN就是全连接权值太多，取的一个折衷策略，只取部分连接边扫描一遍整个输入，最后再汇总（求max等等操作）。
RNN就是在隐层加入了自连边和互连边（即隐层可以相互连接），可以按时序展开为一系列FNN。常见训练算法为bptt和lstm。
DNN个人理解就是隐层有很多层，bp反传时可能梯度会锐减或剧增，导致误差传不回来，可以通过重新设计网络结构（类似lstm）的办法来解决。

发布于 2015-08-18 3 条评论感谢收藏 • 没有帮助 • • 禁止转载

知乎用户，Shallow Learning

潇洒小妞、俗人赞同

中文不好解释，用英文试试，不当之处请谅解。

Artificial neural networks use networks of activation units (hidden units) to map inputs to outputs. The concept of deep learning applied to this model allows the model to have multiple layers of hidden units where we feed output from the previous layers. However, dense connections between the layers is not efficient, so people developed models that perform better for specific tasks.

The whole "convolution" in convolutional neural networks is essentially based on the fact that we're lazy and want to exploit spatial relationships in images. This is a huge deal because we can then group small patches of pixels and effectively "downsample" the image while training multiple instances of small detectors with those patches. Then a CNN just moves those filters around the entire image in a convolution. The outputs are then collected in a pooling layer. The pooling layer is again a down-sampling of the previous feature map. If we have activity on an output for filter a, we don't necessarily care if the activity is for (x, y) or (x+1, y), (x, y+1) or (x+1, y+1), so long as we have activity. So we often just take the highest value of activity on a small grid in the feature map called max pooling.

If you think about it from an abstract perspective, the convolution part of a CNN is effectively doing a reasonable way of dimensionality reduction. After a while you can flatten the image and process it through layers in a dense network. Remember to use dropout layers! (because our guys wrote that paper :P)

I won't talk about RNN for now because I don't have enough experience working with them and according to my colleague nobody really knows what's going on inside an LSTM...but they're insanely popular for data with time dependencies.

Let's talk RNN. Recurrent networks are basically neural networks that evolve through time. Rather than exploiting spatial locality, they exploit sequential, or temporal locality. Each iteration in an RNN takes an input and it's previous hidden state, and produces some new hidden state. The weights are shared in each level, but we can unroll an RNN through time and get your everyday neural net. Theoretically RNN has the capacity to store information from as long ago as possible, but historically people always had problems with the gradients vanishing as we go back further in time, meaning that the model can't be differentiated numerically and thus cannot be trained with backprop. This was later solved in the proposal of the LSTM architecture and subsequent work, and now we train RNNs with BPTT (backpropagation through time). Here's a link that explains LSTMs really well: http:// colah.github.io/posts/2 015-08-Understanding-LSTMs/

Since then RNN has been applied in many areas of AI, and many are now designing RNN with the ability to extract specific information (read: features) from its training examples with attention-based models.

编辑于 2016-02-15 添加评论感谢收藏 • 没有帮助 • • 作者保留权利

知乎用户，计算机专业

我个人的看法是，DNN是深度学习思想的一个统称，狭义上它是一种逐层贪婪无监督的学习方法，注意它只是一种思想，需要依赖具体的模型去实现，即深度学习 = 逐层贪婪无监督方法 + 特定深度学习模型。而具体的深度学习模型有CNN、RNN、SDA、RBM、RBM等。逐层贪婪无监督的深度学习思想是2006年提出来的，能有效解决深层网络结构训练的梯度弥散等问题。而CNN等网络模型其实很早就提出来了，之前用BP之类的老方法效果一直不太好，等到深度学习思想提出来后，这些老模型就都焕发了新生，带来了今天深度学习的火热。回归到问题上来，就是CNN、RNN、DNN不是一个层次上的东西，分别是具体的模型和通用的思想。这是我的个人理解，还在学习中，如有错误欢迎指出。

编辑于 2016-02-13 添加评论感谢收藏 • 没有帮助 • • 作者保留权利

CJ Zhang ，学习，学习，再学习。

受教了。

发布于 2016-02-24 添加评论感谢收藏 • 没有帮助 • • 作者保留权利

Gundam ，The truth is what it is, not what you c

DNN区别于浅层神经网络，是所有深度学习中的网络模型统称，包括CNN、RNN等，以后还会有新的网络模型提出。题主说的CNN应该是三大特点：local receptive fields、shared weights 和pooling。他们的用途都是拿数据来训练学习特征（太笼统了，嘿嘿），省去手工提取特征的过程，类似是一个通用的学习框架。 @helloworld00回答中提到的课程不错，针对卷积神经网络和视觉识别的，题主可以深入学习一下。UFLDL也很适合初学者。另外如果真想研究深度学习，还是要看论文的--> Reading List « Deep Learning

编辑于 2016-02-28 添加评论感谢收藏 • 没有帮助 • • 作者保留权利

知乎用户，大王派我来巡山。

知乎用户赞同

想学专业知识就要少上知户多看书

Stanford University CS231n: Convolutional Neural Networks for Visual Recognition

编辑于 2016-02-15 添加评论感谢收藏 • 没有帮助 • • 作者保留权利

深度学习详解：通过案例了解机器学习基础 beist 深度学习机器学习人工智能
引言机器学习（MachineLearning，ML）和深度学习（DeepLearning，DL）是现代人工智能领域中的两个重要概念。通过让机器具备学习的能力，机器可以从数据中自动找到函数，并应用于各种任务，如语音识别、图像识别和游戏对战等。在这篇笔记中，我们将通过一个简单的案例，逐步了解机器学习的基础知识。1.1机器学习案例学习1.1.1回归问题与分类问题在机器学习中，根据所要解决的问题类型，任务
深度学习学习指南努力的Lorre 深度学习人工智能
本帖子将以本书的逻辑和顺序做一个梳理：CS基础->AI算法->模型压缩->异构计算->AI框架->AI编译器《DeepLearningSystems》(https://deeplearningsystems.ai/)CS基础推荐书单所需的编程语言(C/C++、Python)就不多讲了，数据结构算法也是大学基础课程，不多赘述。对于操作系统需要多了解，推荐多看一看《深入理解计算机系统》(传说中的面试圣
Java全栈AI平台实战：从模型训练到部署的革命性突破——Spring AI+Deeplearning4j+TensorFlow Java API深度解析墨夶 Java学习资料3 java 人工智能 spring
一、背景与需求：为什么需要Java驱动的AI平台？某医疗影像公司面临以下挑战：多语言开发混乱：Python训练模型，C++部署推理，Java调用服务，导致维护成本高昂部署效率低下：PyTorch模型需手动转换ONNX格式，TensorRT优化耗时2小时/模型实时性不足：视频流分析延迟达3秒，无法满足急诊场景需求通过Java全栈AI平台，我们实现了：端到端开发：Java调用PyTorch训练模型，直
大规模胰腺癌检测通过非对比增强CT和深度学习| 文献速递-视觉通用模型与疾病诊断有Li 深度学习人工智能
Title题目Large-scalepancreaticcancerdetectionvianon-contrastCTanddeeplearning大规模胰腺癌检测通过非对比增强CT和深度学习01文献速递介绍胰腺导管腺癌（PDAC）是最致命的实体恶性肿瘤，通常在晚期和不可手术的阶段被检测到。早期或偶然发现与延长生存期相关，但使用单一测试筛查无症状个体的PDAC仍然不可行，因为假阳性的潜在危害和低
文献速递：深度学习乳腺癌诊断---使用深度学习改善乳腺癌诊断的MRI技术有Li 深度学习人工智能
Title题目ImprovingbreastcancerdiagnosticswithdeeplearningforMRI使用深度学习改善乳腺癌诊断的MRI技术01文献速递介绍乳腺磁共振成像（MRI）是一种高度敏感的检测乳腺癌的方式，报道的敏感性超过80%。传统上，其在筛查中的使用被限制在高风险患者身上。新的证据支持在中等风险和普通风险女性中进行筛查MRI的作用4）。诊断MRI对于额外的指示也很有
《基于超声的深度学习模型用于降低BI-RADS 4A乳腺病变的恶性率》论文笔记 MobileNet 往事随风、、论文笔记机器学习深度学习论文阅读人工智能机器学习健康医疗
《APPLICATIONOFDEEPLEARNINGTOREDUCETHERATEOFMALIGNANCYAMONGBI-RADS4ABREASTLESIONSBASEDONULTRASONOGRAPHY》《基于超声的深度学习模型用于降低BI-RADS4A乳腺病变的恶性率》原文地址：链接文章目录摘要简介方法患者图像获取与处理深度学习模型统计分析结果讨论结论摘要本研究旨在开发一个基于超声（US）图像
SAE层、BPNN层结合的深度学习模型 sbc-study 深度学习人工智能机器学习
EarlyFaultDetectionofMachineToolsBasedonDeepLearningandDynamicIdentificationBoLuo,HaotingWang,HongqiLiu,BinLi,andFangyuPengIEEETRANSACTIONSONINDUSTRIALELECTRONICS,VOL.66,NO.1,JANUARY2019一SAE层(栈式自编码器层-
多标签分类的激活函数和损失函数通过幸福的路唯有奋斗深度学习
刚入门DeepLearning不久，前一段时间一直在学习cifar10的分类，突然最近要做一个多标签的任务，突然有点不知所措，不知从何下手了。于是查阅了一些资料，了解一下多分类任务与多标签分类任务的异同。-多分类任务：只有一个标签，但是标签有多种类别。-多标签分类任务：一条数据可能有一个或者多个标签，比如一个病人的眼底检测报告，它可能被标记患有糖尿病、高血压多个标签。多标签分类任务的特点：1.类别
Deep Lake 简介
DeepLake简介DeepLake是由Activeloop开发的一款开源深度学习数据湖（DeepLearningDataLake），专为人工智能时代设计，旨在解决深度学习项目中数据管理的复杂性与低效问题。核心特点特性说明多模态数据支持支持图像、视频、音频、文本、点云等多种数据类型，适用于各类AI场景。张量存储数据以张量格式存储，兼容主流深度学习框架（如PyTorch、TensorFlow）。数据
【深度学习】自编码器：数据压缩与特征学习的神经网络引擎瑶光守护者深度学习学习神经网络人工智能机器学习强化学习
作者选择了由IanGoodfellow、YoshuaBengio和AaronCourville三位大佬撰写的《DeepLearning》(人工智能领域的经典教程，深度学习领域研究生必读教材),开始深度学习领域学习，深入全面的理解深度学习的理论知识。之前的文章参考下面的链接：【深度学习】线性因子模型：数据降维与结构解析的数学透镜【学习笔记】强化学习：实用方法论【学习笔记】序列建模：递归神经网络（RN
aws flask_如何将屏幕日志记录添加到Flask应用程序并将其部署在AWS Elastic Beanstalk上... weixin_26742939 java python linux mysql leetcode
awsflaskAttheendof2019Deeplearning.aireportedthatonly22%ofcompaniesthatusemachinelearningactuallydeployedamodel.Mostcompaniesdonotgetbeyondaproofofconcept,oftenbymeansofamodelinaJupyterNotebooks.Asare
GeoTorchAI 项目使用与配置指南尤贝升Sherman
GeoTorchAI项目使用与配置指南GeoTorchAIGeoTorchAI:AFrameworkforTrainingandUsingSpatiotemporalDeepLearningModelsatScale项目地址:https://gitcode.com/gh_mirrors/ge/GeoTorchAI1.项目目录结构及介绍GeoTorchAI的目录结构如下：GeoTorchAI/├──
Dive-into-DL-PyTorch项目解析：目标检测中的R-CNN系列算法演进陆或愉
Dive-into-DL-PyTorch项目解析：目标检测中的R-CNN系列算法演进Dive-into-DL-PyTorch本项目将《动手学深度学习》(DiveintoDeepLearning)原书中的MXNet实现改为PyTorch实现。项目地址:https://gitcode.com/gh_mirrors/di/Dive-into-DL-PyTorch引言目标检测是计算机视觉领域的核心任务之一
Java 人工智能应用：使用 DL4J 实现深度学习算法向哆哆 Java入门到精通人工智能 java 深度学习
Java人工智能应用：使用DL4J实现深度学习算法在当今数字化时代，人工智能技术正以前所未有的速度改变着各个行业的发展格局。而Java作为一种广泛应用于企业级开发的编程语言，在人工智能领域也发挥着越来越重要的作用。其中，深度学习作为人工智能的核心技术之一，为解决复杂问题提供了强大的能力。本篇文章将深入探讨如何使用Java深度学习库DL4J（Deeplearning4j）实现深度学习算法，助力开发者
学习笔记--Structural-RNN: Deep Learning on Spatio-Temporal Graphs Giving_Kore CV论文笔记 Structural RNN RNN CV spatiotemporal
论文链接：https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Jain_Structural-RNN_Deep_Learning_CVPR_2016_paper.pdf此为原创笔记，如需转载请注明Structural-RNN:DeepLearningonSpatio-TemporalGraphs [–AsheshJai
《Transformer如何进行图像分类：从新手到入门》机器学习司猫白深度学习 transformer 分类深度学习图像分类
引言如果你对人工智能（AI）或深度学习（DeepLearning）感兴趣，可能听说过“Transformer”这个词。它最初在自然语言处理（NLP）领域大放异彩，比如在翻译、聊天机器人和文本生成中表现出色。但你知道吗？Transformer不仅能处理文字，还能用来分类图像！这听起来是不是有点神奇？别担心，这篇博客将带你从零开始，了解Transformer的基本概念、它如何被应用到图像分类，以及通过
深度学习入门:如何从零开始搭建自己的深度学习模型? AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介深度学习（DeepLearning）近几年已经成为人们关注的热点话题。从2012年的ImageNet竞赛开始，激起了众多研究者的兴趣，也带来了越来越多的应用场景。随着技术的飞速发展，深度学习已经成为了各个领域最具潜力的技术。作为一名AI科研工作者，了解、掌握深度学习相关知识可以帮助你更好地理解并解决实际问题。本文将全面介绍深度学习的基础知识、技术要点及其应用。文
神经网络入门书籍推荐,神经网络的书籍推荐阳阳2013哈哈物联网神经网络深度学习机器学习
有什么适合深度学习的书单吗？。12本最好的深度学习书籍：1.用Scikit-Learn和TensorFlow进行机器学习2.深度学习（DeepLearning）3.DeepLearningfortheLayman(为外行准备的深度学习)4.建立你自己的神经网络（MakeYourOwnNeuralNetwork）5.深度学习初学者（DeepLearningforBeginners）6.神经网络和深度
探秘 Alfred：一款强大的 macOS 生产力工具宋韵庚
探秘Alfred：一款强大的macOS生产力工具alfredalfred-py:Adeeplearningutilitylibraryfor**human**,moredetailabouttheusageoflibto:https://zhuanlan.zhihu.com/p/341446046项目地址:https://gitcode.com/gh_mirrors/al/alfred在程序员和效
2025转行指南：Java开发工程师转AI工程师，附全网最详细的大模型学习路线 AI小白熊 java 人工智能学习大模型程序员 ai 开发语言
关键要点研究表明，Java开发工程师转AI工程师需要学习数学、Python编程、机器学习和深度学习等技能。证据显示，掌握TensorFlow、PyTorch等框架和云部署技术（如Aliyun、AWS）也很重要。学习资源包括Coursera的免费课程、DiveintoDeepLearning书和国内平台如PaddlePaddle。技能和学习资料概述所需技能要从Java开发工程师成功转型为AI工程师，
SuperVINS：实时视觉-惯性SLAM框架，应对挑战性成像条件秋泉律Samson
SuperVINS：实时视觉-惯性SLAM框架，应对挑战性成像条件SuperVINSAreal-timevisual-inertialSLAMframeworkforchallengingimagingconditions(integrateddeeplearningfeatures)项目地址:https://gitcode.com/gh_mirrors/su/SuperVINS项目介绍Super
探秘空间基因表达的 “地形图”：GASTON 算法重磅来袭！阔跃生物阔跃云阔跃AI 阔跃生物算法阔跃生物阔跃云阔跃AI 人工智能
在生命科学的浩瀚宇宙中，空间基因表达模式的解析一直是科研人员苦苦追寻的目标。近期，一篇发表于《NatureMethods》的重磅研究《Mappingthetopographyofspatialgeneexpressionwithinterpretabledeeplearning》为我们点亮了新的希望。该研究由PrincetonUniversity的BenjaminJ.Raphael团队主导，历
神经网络在MATLAB中是如何实现的？ tyatyatya MATLAB教程神经网络 matlab 人工智能
文章目录前言MATLAB环境配置一、图形化界面工具（适合快速上手）1.NeuralNetworkToolboxGUI2.DeepLearningToolboxGUI二、编程实现（适合高级定制）1.基础神经网络（前馈网络）2.深度学习（CNN、RNN）3.循环神经网络（RNN）三、关键步骤总结数据准备：网络构建：模型训练：模型评估与部署：四、常用函数与工具箱前言在MATLAB中实现神经网络主要有两种
AI人工智能深度学习算法：在流体动力学中的应用 AI天才研究院计算 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
欢迎您的阅读，接下来我将为您一步步分析：AI人工智能深度学习算法在流体动力学中的应用。让我们通过多个角度来探讨这个问题。文章目录AI人工智能深度学习算法：在流体动力学中的应用AIDeepLearningAlgorithms:ApplicationsinFluidDynamics1.理解深度学习和流体动力学的基本概念1.UnderstandingtheBasicConceptsofDeepLearn
Generative Pre-trained Transformer 科学禅道大模型专栏深度学习模型专栏 transformer 深度学习人工智能
GenerativePre-trainedTransformer(GPT)referstoaclassofdeeplearningmodelsdevelopedbyOpenAI,specificallydesignedfornaturallanguageprocessingtasks.GPTmodelsarebasedonthetransformerarchitectureandarepre-tr
从理论到落地，大模型评测体系综合指南 LLM. 人工智能深度学习 opencv 计算机视觉注意力机制
1956年夏，“人工智能”这一概念被提出。距今已有近70年的发展历史。中国科学院将其划分为六个阶段：起步发展期（1956年—1960s），反思发展期（1960s-1970s）,应用发展期（1970s-1980s),低迷发展期（1980s-1990s）,稳步发展期（1990s-2010）,以及蓬勃发展期（2011-）。真正的大模型历史还要从2006年DeepLearning首次在Science上发表
【学习笔记】深度学习：典型应用瑶光守护者学习笔记深度学习人工智能计算机视觉语音识别
作者选择了由IanGoodfellow、YoshuaBengio和AaronCourville三位大佬撰写的《DeepLearning》(人工智能领域的经典教程，深度学习领域研究生必读教材),开始深度学习领域学习，深入全面的理解深度学习的理论知识。之前的文章参考下面的链接：【学习笔记】强化学习：实用方法论【学习笔记】序列建模：递归神经网络（RNN）【学习笔记】理解深度学习和机器学习的数学基础：数值
PyTorchVideo：视频理解研究的深度学习库虞亚竹Luna
PyTorchVideo：视频理解研究的深度学习库pytorchvideoAdeeplearninglibraryforvideounderstandingresearch.项目地址:https://gitcode.com/gh_mirrors/py/pytorchvideo项目介绍PyTorchVideo是一个专注于视频理解研究的深度学习库。由FacebookResearch开发，PyTorch
机器学习 vs 深度学习：深入浅出解析两者的区别海豹工匠机器学习深度学习人工智能神经网络卷积神经网络
在当今科技飞速发展的时代，**机器学习（MachineLearning）和深度学习（DeepLearning）**成为了人工智能（AI）领域的热门话题。无论你是技术专家、学生，还是对AI感兴趣的普通读者，理解这两者的区别都是至关重要的。本文将以通俗易懂的方式，深入浅出地解析机器学习与深度学习的区别，帮助你全面掌握这一知识。什么是机器学习？机器学习是人工智能的一个子领域，专注于开发能够从数据中自动学
机器学习与深度学习的区别详解云端.代码农夫CloudFarmer 机器学习深度学习人工智能
机器学习与深度学习的区别详解在数据科学和人工智能领域，机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是两个非常重要的概念。尽管这两个术语常常被提及，并且有时会被混淆，但它们之间有着显著的区别。本文将详细介绍机器学习和深度学习的不同之处，帮助读者更好地理解这两个技术的特点和应用场景。一、基本概念1.机器学习机器学习是一种通过数据训练模型，以便使计算机能够
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修

CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的内部网络结构有什么区别？

CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的内部网络结构有什么区别？

12 个回答

你可能感兴趣的:(DeepLearning)