我是管小亮 :)

深度学习入门笔记（五）：神经网络的编程基础

专栏——深度学习入门笔记

声明

1）该文章整理自网上的大牛和机器学习专家无私奉献的资料，具体引用的资料请看参考文献。
2）本文仅供学术交流，非商用。所以每一部分具体的参考资料并没有详细对应。如果某部分不小心侵犯了大家的利益，还望海涵，并联系博主删除。
3）博主才疏学浅，文中如有不当之处，请各位指出，共同进步，谢谢。
4）此属于第一版本，若有错误，还需继续修正与增删。还望大家多多指点。大家都共享一点点，一起为祖国科研的推进添砖加瓦。

文章目录

专栏——深度学习入门笔记
声明
深度学习入门笔记（五）：神经网络的编程基础

1、Jupyter/iPython Notebooks快速入门
2、Python 中的广播
3、关于numpy向量的说明
4、编程框架的选择问题

推荐阅读
参考文章

深度学习入门笔记（五）：神经网络的编程基础

1、Jupyter/iPython Notebooks快速入门

学到现在，你需要知道常用的python的编译器，推荐使用anaconda而不是官方的python，这样的话更容易安装各种第三方库，如何安装可以看一下这个博客——Windows10 下 Anaconda和 PyCharm 的详细的安装教程（图文并茂）。

至于IDE的话，pycharm 适合于大型项目的编写和调试，Jupyter Notebook 适合于学习和数据挖掘探索，这里我们就快速地学习一下 Jupyter Notebook 工具。

这就是 Jupyter Notebook 的界面，让我快速地讲解下它的一些特性。

这里有一些空白区域的代码块，可以编写代码，而较长的灰色区域就是代码块。

比如，编写打印输出著名的程序员入门语句——Hello World 的代码，然后执行这一代码块，最终，它就会输出我们想要的 Hello World。

在运行一个单元格 cell 时，你也可以选择运行其中的一块代码区域。通过点击 Cell 菜单的 Run Cells 执行这部分代码。

在你的计算机上，运行 cell 的键盘快捷方式是 Ctrl + enter。但是也可以使用 shift + enter 来运行 cell，不过这样会默认跳转到下一个代码区域。

当阅读指南时，如果不小心双击了它，点中的区域就会变成 markdown 语言形式。如果不小心使其变成了这样的文本框，只要运行下单元格 cell，就可以回到原来的形式。所以，点击 cell 菜单的 Run Cells 或者使用 Ctrl + enter，就可以使得它变回原样。markdown 格式可以用来写笔记，以免自己忘记了代码中的知识。

这里还有一些其他的小技巧。比如当执行上面所使用的代码时，它实际上会使用一个内核在服务器上运行这段代码。如果你正在运行超负荷的进程，或者电脑运行了很长一段时间，或者在运行中出了错，又或者网络连接失败，这里依然有机会让 Kernel 重新工作。你只要点击 Kernel，选择 Restart，它会重新运行 Kernel 使程序继续工作。

所以，如果只是运行相对较小的工作并且才刚刚启动你的台式电脑或笔记本电脑，这种情况应该是不会发生的。但是，如果你看见错误信息，比如 Kernel 已经中断或者其他信息,你可以试着重启 Kernel，这样就简单地重启程序了。

当使用 Notebook 时会有多个代码区域块。尽管并没有在前面的代码块中添加自己的代码，但还是要确保先执行这块代码。因为在这个例子，它导入了 numpy 包并另命名为 np 等，并声明了一些可能需要的变量。为了能顺利地执行下面的代码，就必须确保先执行上面的代码，即使不要求写其他的代码，这样其他程序就可以默认是在这些库的调用下运行了。

最后就是编译环境的选择，正常情况下 Notebook 的编译环境是默认的，但是你也可以自己新建一个环境，这个具体操作在这个博客中——Windows10 下 Anaconda和 PyCharm 的详细的安装教程（图文并茂），比如我这里新建的环境 Pytorch for Deeplearning，就是专门为 pytorch 的学习而建立的，可以通过 Kernel 下的 Change kernel，选择 Pytorch for Deeplearning，就ok了。

这个就是默认的 kernel。

这个是我自己建的 kernel。

你会发现这种交互式的 shell 命令，在 Notebooks 是非常有用的，能使你快速地实现代码并且查看输出结果，便于学习，同时还可以记录在这个过程中的想法。好好学习它的使用，你会发现更多的惊喜。

2、Python 中的广播

这是一个不同食物(每100g)中不同营养成分的卡路里含量表格，表格为3行4列，列表示不同的食物种类，从左至右依次为苹果（Apples），牛肉（Beef），鸡蛋（Eggs），土豆（Potatoes）。行表示不同的营养成分，从上到下依次为碳水化合物，蛋白质，脂肪。

那么，现在假设我们想要计算不同食物中不同营养成分中的卡路里百分比，应该怎么做？

以计算苹果中的碳水化合物卡路里百分比含量为例，首先计算苹果（Apples）（100g）中三种营养成分卡路里总和 56+1.2+1.8 = 59，然后用 56 / 59 = 94.9% 算出结果。可以明显地看出苹果（Apples）中的卡路里大部分来自于碳水化合物（Carb），而牛肉（Beef）则不同。对于其他食物，计算方法类似。首先，按列求和，计算每种食物中（100g）三种营养成分总和，然后分别用不用营养成分的卡路里数量除以总和，计算百分比。

那么，能否在向量化（深度学习入门笔记（四）：向量化）的基础上用代码完成这样的一个计算过程呢？

当然是可以的，假设上图的表格是一个4行3列的矩阵 $A$ ，记为 $A_{3\times 4}$ ，接下来使用 Python 的 numpy 库完成这样的计算。使用两行代码就可以完成整个过程，第一行代码对每一列进行求和，第二行代码分别计算每种食物每种营养成分的百分比。

在 jupyter notebook 中输入如下代码，按 Ctrl + Enter 运行，输出如下：

下面再计算每列的和，可以看到输出是每种食物(100g)的卡路里总和。

其中 sum 的参数 axis=0 表示求和运算按列执行，之后会详细解释。

接下来计算百分比，这条指令将 $3\times 4$ 的矩阵 $A$ 除以一个 $\times 4$ 的矩阵，得到了一个 $\times 4$ 的结果矩阵，这个结果矩阵就是要求的百分比含量。

到这里问题就解决了，现在来解释一下 A.sum(axis = 0) 中的参数 axis。axis用来指明将要进行的运算是沿着哪个轴执行，在numpy中，0轴是垂直的，也就是列，而1轴是水平的，也就是行。 而第二个 A / cal.reshape(1, 4) 指令则调用了 numpy 中的广播机制。这里使用 $\times 4$ 的矩阵 $A$ 除以 $\times 4$ 的矩阵 $c a l$ 。技术上来讲，其实并不需要再将矩阵 $c a l$ reshape (重塑)成 $\times 4$ ，因为矩阵 $c a l$ 本身已经是 $\times 4$ 了。但是当我们写代码的过程中出现不确定矩阵维度的时候，通常会对矩阵进行重塑来确保得到想要的列向量或行向量。重塑操作 reshape 是一个常量时间的操作，时间复杂度是 $O (1)$ ，它的调用代价极低，所以使用是没问题的，也推荐大家使用。

那么一个 $\times 4$ 的矩阵是怎么和 $\times 4$ 的矩阵做除法的呢？来看一些广播的例子：

在 numpy 中，当一个 $\times 1$ 的列向量与一个常数做加法时，实际上会将常数扩展为一个 $\times 1$ 的列向量，然后两者做逐元素加法。结果就是右边的这个向量。这种广播机制对于行向量和列向量均可以使用。

再看下一个例子。

用一个 $\times 3$ 的矩阵和一个 $\times 3$ 的矩阵相加，其泛化形式是 $\times n$ 的矩阵和 $\times n$ 的矩阵相加。在执行加法操作时，其实是将 $\times n$ 的矩阵复制成为 $\times n$ 的矩阵，然后两者做逐元素加法得到结果。针对这个具体例子，相当于在矩阵的第一列全部加100，第二列全部加200，第三列全部加300。这就是在前面例子中计算卡路里百分比的广播机制，只不过那里是除法操作，这里是加法操作（广播机制与执行的运算种类无关）。

下面是最后一个例子。

这里相当于是一个 $\times n$ 的矩阵加上一个 $\times 1$ 的矩阵。在进行运算时，会先将 $\times 1$ 矩阵水平复制 $n$ 次，变成一个 $\times n$ 的矩阵，然后再执行逐元素加法。

广播机制的一般原则如下：

首先是 numpy 广播机制

这里的广播和播音广播是完全不同的，它的要求是什么呢？什么样的条件下可以使用广播？

要求：如果两个数组的后缘维度的轴长度相符或其中一方的轴长度为1，则认为它们是广播兼容的。广播会在缺失维度和轴长度为1的维度上进行。

如何计算后缘维度的轴长度？可以使用代码 A.shape[-1] 即矩阵维度元组中的最后一个位置的值，就是矩阵维度的最后一个维度，比如卡路里计算的例子中，矩阵 $A_{3,4}$ 后缘维度的轴长度是4，而矩阵 $cal_{1,4}$ 的后缘维度也是4，故满足了后缘维度轴长度相符的条件，可以进行广播。广播会在轴长度为1的维度上进行，轴长度为1的维度对应 axis=0，即垂直方向，矩阵 $cal_{1,4}$ 沿 axis=0 (垂直方向)复制成为 $calTemp_{3,4}$ ，之后两者进行逐元素除法运算。

简单概括总结就是，先变成一样大，再逐元素除法。

然后解释图中的例子

矩阵 $A_{m,n}$ 和矩阵 $B_{1,n}$ 进行四则运算，后缘维度轴长度相符，符合条件，可以广播，广播沿着轴长度为1的轴进行，即 $B_{1,n}$ 广播成为 ${B_{m,n}}'$ ，之后做逐元素四则运算。

矩阵 $A_{m,n}$ 和矩阵 $B_{m,1}$ 进行四则运算，后缘维度轴长度不相符，但其中一方轴长度为1，符合条件，可以广播，广播沿着轴长度为1的轴进行，即 $B_{m,1}$ 广播成为 ${B_{m,n}}'$ ，之后做逐元素四则运算。

矩阵 $A_{m,1}$ 和常数 $R$ 进行四则运算，后缘维度轴长度不相符，但其中一方轴长度为1，符合条件，可以广播，广播沿着缺失维度的轴进行，缺失维度就是 axis=0，轴长度为1的轴是 axis=1，即 $R$ 广播成为 ${B_{m,1}}'$ ，之后做逐元素四则运算。

最后总结一下 broadcasting，可以看看下面的图：

3、关于numpy向量的说明

Python 的特性允许你使用 广播（broadcasting） 功能，这是 Python 的 numpy 程序语言库中最灵活的地方，但这是程序语言的优点，也是缺点。

优点的原因，在于它们创造出语言的表达性，Python 语言巨大的灵活性使得你仅仅通过一行代码就能做很多事情。
缺点的原因，由于广播巨大的灵活性，有时候对于广播的特点以及广播的工作原理这些细节不熟悉的话，可能会产生很细微或者看起来很奇怪的 bug。

为了演示 Python-numpy 的一个容易被忽略的效果，特别是怎样在 Python-numpy 中构造向量，来做一个快速示范。

首先设置 $a = n p . r a n d o m . r a n d n (5)$ ，这样会生成存储在数组 $a$ 中的5个高斯随机数变量；然后输出 $a$ ，从屏幕上可以得知，此时 $a$ 的 shape（形状） 是一个 $(5,)$ 的结构同样地， $a . T$ 的 shape 也是这样的。这在 Python 中被称作 一个一维数组。它既不是一个行向量也不是一个列向量，这也导致它有一些不是很直观的效果。

比如 $a$ 和 $a$ 的转置阵最终结果看起来一样，shape 也是一样的。但是输出 $a$ 和 $a$ 的转置阵的内积，你可能会想， $a$ 乘以 $a$ 的转置，返回的可能会是一个矩阵。但如果这样做，你只会得到一个数。

所以在编写神经网络时，不要使用 shape 为 (5,)、(n,) 或者其他一维数组的数据结构。相反，设置 $a$ 为 $(5, 1)$ ，这样就是一个5行1列的向量。在先前的操作里 $a$ 和 $a$ 的转置看起来一样，而现在这样的 $a$ 变成一个新的 $a$ 的转置，并且它是一个行向量。当输出 $a$ 的转置时有两对方括号，而之前只有一对方括号，所以这就是 1行5列的矩阵和一维数组的差别。

如果这次再输出 $a$ 和 $a$ 的转置的乘积，会返回一个向量的外积，也就是一个矩阵。这就符合我们的预期了，也就是在可控范围内了，因为你知道自己的代码输出是什么了。

除了，输入确定维度的矩阵或向量之外，还有一件事，就是如果你不能完全确定一个向量的维度，建议你扔一个 断言语句(assertion statement) 进去。这样，就可以确保在这种情况下是否是一个 $(5, 1)$ 向量了，或者说是一个列向量。

如果不对的话，就会报一个叫做 AssertionError 的错误！！！

4、编程框架的选择问题

这个我在大话卷积神经网络CNN（干货满满）中讲过，目前主流的是 Google的TensorFlow、Facebook的pytorch 还有 百度的paddlepaddle，如果是研究的话，我建议使用TensorFlow，因为它更好理解一下基础原理，而不是单纯的调包侠。大话卷积神经网络CNN（干货满满）博客中也写了相关的资源推荐，这里就不详细说了。

参考文章

吴恩达——《神经网络和深度学习》视频课程

深度学习入门笔记（九）自编码器 zhanghui_cuc 深度学习笔记深度学习笔记人工智能
自编码器是一个无监督的应用，它使用反向传播来更新参数，它最终的目标是让输出等于输入。数学上的表达为，f(x)=x，f为自编码器，x为输入数据。自编码器会先将输入数据压缩到一个较低维度的特征，然后利用这个较低维度的特征重现输入的数据，重现后的数据就是自编码器的输出。所以，从本质上来说，自编码器就是一个压缩算法。自编码器由3个部分组成：编码器（Encoder）：用于数据压缩。压缩特征向量（Compre
深度学习入门笔记（八）可以不断思考的模型：RNN与LSTM zhanghui_cuc 深度学习笔记深度学习 rnn 笔记
8.1循环神经网络RNN之前学到的CNN和全连接，模型的输入数据之间是没有关联的，比如图像分类，每次输入的图片与图片之间就没有任何关系，上一张图片的内容不会影响到下一张图片的结果。但在自然语言处理领域，这就成了一个短板。RNN因此出现，它是一类用于处理序列数据的神经网络。其基本单元结构如下自底向上的三个蓝色的节点分别是输入层、隐藏层和输出层。U和V分别是连接两个层的权重矩阵。如果不考虑右边的棕色环
深度学习入门笔记（五）前馈网络与反向传播 zhanghui_cuc 深度学习笔记深度学习笔记人工智能
接着上一节，本节讲解模型自我学习的数学计算过程究竟是怎么样的。5.1前馈网络一个最简单的前馈神经网络如图所示，对于每一个隐藏层，输入对应前一层每一个节点权重乘以节点输出值，输出则是经过激活函数（例如sigmoid函数）计算后的值。在这样的网络中，输入的数据x经过网络的各个节点之后，即可计算出最终的模型结果。这样就完成了一个最基本的前馈网络从输入到输出的计算过程。5.2反向传播在实际工作中这部分的内
深度学习入门笔记（1）——什么是深度学习？ ZRX_GIS 深度学习深度学习数据挖掘机器学习神经网络 pytorch
深度学习入门笔记（1）——什么是深度学习？在很多人眼里，深度学习（DeepLearning）是一个十分高大上的研究手段，它可以模拟人的判断，让数据处理和结果输出具有“人性”，在没接触过的人看来，深度学习简直是“玄学”范畴，网络一通，谁都不爱。但是，在所有人追捧深度学习的同时，对学习这一手段却是望而却步，更有甚者在网上买完“韭菜课”后，原理部分还没看完就不在继续学习。其实，说句实话，深度学习只是被过
深度学习入门笔记（6）—— Logistic Regression cnhwl 深度学习入门笔记深度学习机器学习逻辑回归人工智能 python
对比第三节中的Adaline和LogisticRegression，可以发现它们只有两点不同：1、激活函数，Adaline中的激活函数是恒等函数（线性），而LogisticRegression中的激活函数是Sigmoid函数（非线性）；2、损失函数，Adaline中的损失函数是均方误差，而LogisticRegression中的损失函数则是交叉熵。Sigmoid函数如图所示，其值域为0到1，输入为
深度学习入门笔记（三）常用AI术语 zhanghui_cuc 深度学习笔记人工智能深度学习笔记
本节我们介绍一些深度学习领域常用的术语。训练确定模型中的参数的过程，我们就称为“训练”。Epoch遍历一遍训练数据就叫作“一个Epoch”。训练模型的时候，我们要告诉模型预计训练多少个Epoch，但这个值并不是固定的，因为并没有一个准确的Epoch数能一定能得到一个比较好的模型。我们有一个标准：模型训练的Epoch数必须要让模型达到一个收敛的状态。并且为了模型有更多的选择，我们可以让模型收敛后，再
深度学习入门笔记4 深度神经网络深度学习从入门到放弃深度学习笔记神经网络深度学习人工智能机器学习算法
多层感知器在之前的课程中，我们了解到，感知器（指单层感知器）具有一定的局限——无法解决异或问题，即线性不可分的问题。将多个单层感知器进行组合，就可以得到一个多层感知器（MLP——Multi-LayerPerceptron）结构。多层感知器包含输入层，一个或多个隐藏层以及一个输出层。每层的神经元与下一层进行完全连接。如果网络中包含一个以上的隐层，则称其为深度人工神经网络。说明：通常我们说的神经网络的
深度学习入门笔记：第二章感知机维持好习惯深度学习深度学习笔记人工智能
深度学习入门笔记：第二章感知机笔记来源书籍：《深度学习入门：基于+Python+的理论与实现》文章目录深度学习入门笔记：第二章感知机前言为什么学习感知机2.1感知机是什么2.2简单逻辑电路2.2.1与门2.2.2与非门和或门2.3感知机实现2.3.1简单的实现2.3.2导入权重和偏置2.3.3使用权重和偏置的实现2.4感知机的局限性2.4.1异或门2.4.2线性和非线性2.5多层感知机2.5.1已
深度学习入门笔记（二）神经元激励函数神经网络花落雨微扬神经网络网络深度学习人工智能机器学习
声明：本文内容源自《白话深度学习与tensorflow》高扬卫峥编著一书读书笔记！！！神经网络：神经网络又称为人工神经网络（artificialneutralnetwork,ANN）。神经网络是一种人类由于受到生物神经细胞结构启发而研究出的一种算法体系神经元：如上图所示是一个最简单的神经元，有一个输入，一个输出。我们现在所使用的神经元通常有两个部分组成，一个是“线性模型”，另一个是“激励函数”。假
深度学习入门笔记（二）神经元的结构 zhanghui_cuc 深度学习笔记深度学习笔记人工智能
神经网络的基本单元是神经元，本节我们介绍神经元的结构。2.1神经元一个神经元是由下面5部分组成的：输入：x1,x2,…,xk。权重：w1,w2,…,wk。权重的个数与神经元输入的个数相同。偏移项：可省略。激活函数：一般都会有，根据实际问题也是可以省略的。输出。2.2激活函数激活函数有很多种，不同的激活函数适用于不同的问题。二分类问题我们一般采用Sigmoid函数，多分类问题我们采用Softmax函
深度学习入门笔记（七）卷积神经网络CNN zhanghui_cuc 深度学习笔记深度学习笔记 cnn
我们先来总结一下人类识别物体的方法：定位。这一步对于人眼来说是一个很自然的过程，因为当你去识别图标的时候，你就已经把你的目光放在了图标上。虽然这个行为不是很难，但是很重要。看线条。有没有文字，形状是方的圆的，还是长的短的等等。看细节。纹理、颜色、方向等。卷积神经网络就是对上述过程的程序实现。7.1卷积卷积在卷积神经网络中的主要作用是提取图片的特征，同时保留原来图片中各个像素的相对位置（空间）关系。
深度学习入门笔记（八）实战经验 zhanghui_cuc 深度学习笔记深度学习笔记性能优化
前面几节介绍了很多理论，难免会好奇：理论如何与实战结合呢？本节我们就穿插一点实战经验，来换换脑子~1.显卡warmup进行深度学习训练和推理时，往往第一次运行的耗时比较高，这是因为显卡需要warm-up，就是“热身”，才能发挥出显卡的性能。关于热身，个人理解，显卡开始工作时控制单元需要对资源进行调度，例如分配warp等。这些应该都是在第一次推理的时候进行。类似的，举个栗子，在F1比赛中，每场赛车的
深度学习入门笔记（六）线性回归模型 zhanghui_cuc 深度学习笔记深度学习笔记线性回归
本节，我们用线性回归为例子，回顾一些基本概念6.1相关性相关性的取值范围是-1到1，越接近1或者-1代表越相关，越接近0则越不相关。相关系数大于0称为正相关，小于0称为负相关。假如A与B正相关，则是说A（B）会随着B（A）的增大而增大，减小而减小。假如A与B负相关，则是说A（B）会随着B（A）的增大而减小，减小而增大。皮尔逊系数就是常用的相关性方法。6.2什么是线性回归顾名思义，就是用一种线性关系
深度学习入门笔记（四）函数与优化方法 zhanghui_cuc 深度学习笔记深度学习笔记人工智能
深度学习有三大部分模型表征（包括模型设计、网络表示等）模型评估（上一篇文章提到的准确召回和损失函数等）优化算法（模型如何学习或更新）本节我们就来介绍模型是如何学习或更新的。4.1损失函数模型的学习，实际上就是对参数的学习。参数学习的过程需要一系列的约束，这个约束就是损失函数。以函数曲线拟合为例，对于每一个样本点，真实值和拟合值之间就存在了一个误差，我们可以通过一个公式来表示这个误差：L(x)=(F
深度学习入门笔记（7）—— Multinomial Logistic Regression / Softmax Regression cnhwl 深度学习入门笔记深度学习机器学习人工智能 pytorch 算法
首先介绍一个非常著名的多分类数据集MNIST，也就是0到9的手写数字数据集。每个图像都是28*28，用于Pytorch数据读取的格式是NCHW，即Number、Channel、Height、Weight。读取图像之后，就能看到一个只有单通道的（灰度）图像，实际上就是一行行像素值的组合，用于SoftmaxRegression时输入得是一个向量，所以要将一行行的像素进行拼接，成为一个长的向量。同时，将
计算机视觉深度学习入门笔记-从理论到实战案例 HopES0 计算机视觉深度学习笔记
计算机视觉深度学习入门笔记-从理论到实战案例第一章深度学习概论1.1神经网络基础1.1.1为什么是神经网络？1.1.2为什么神经网络有效？1.1.3神经网络的运行1.2卷积神经网络1.2.1图像——矩阵1.2.2为什么是卷积？1.2.3卷积神经网络的传播1.3VGG模型——传统串行网路的大成之作1.3.1网络结构1.3.2运行过程1.3.3模型的优化第二章神经网络的训练2.1pytorch与面向对
深度学习入门笔记：第一章python入门维持好习惯深度学习 python 深度学习笔记
深度学习入门笔记：第一章python入门笔记来源书籍：《深度学习入门：基于+Python+的理论与实现》文章目录深度学习入门笔记：第一章python入门前言第一章python入门1.1深度学习为什么使用python？1.2python环境1.3python解释器1.3.1算术计算和数据类型1.3.2变量定义1.3.3列表1.3.4字典1.3.5布尔型1.3.6if语句1.3.7for语句1.3.8
TensorFlow深度学习入门笔记（四）一些基本函数长青_changqingqingge01 深度学习深度学习入门 TensorFlow
写在前面学习建议：以下学习过程中有不理解可以简单查找下资料，但不必纠结（比如非得深究某一个函数等），尽量快速的学一遍，不求甚解无妨。多实操代码，不能只复制代码，或者感觉懂了就只看。熟能生巧，我亦无他，唯手熟尔今天介绍一些基础函数及其用法，基本全是代码，一些解释都放在代码的注释里了。直接看代码吧，记得在你本地跑一下看哦代码1#tensor.get_shape()获取tensor的shape，就是维度
深度学习入门笔记（二）梯度下降法 _CyberAngel 深度学习笔记费曼笔记本逻辑回归算法机器学习
如愚见指月，观指不观月。目录上节回顾——logistic回归模型和成本函数梯度下降梯度下降法的执行过程计算图logistic模型中的梯度下降算法上节回顾——logistic回归模型和成本函数是在条件下，的概率。。如果想要让我们的模型更加精确的话，就要让尽可能的接近。所以，我们定义了损失函数和成本函数，用于评估与的接近程度，以及模型的准确率。损失函数是对单个样本来说的。成本函数是对整个数据集来说的。
PyTorch深度学习入门笔记（一）PyTorch环境配置及安装雪天鱼
@[Toc]OS：ubuntu20.04（虚拟机）一、工具安装1.1Anaconda安装首先安装Anaconda,我是去清华大学镜像站下载，版本为Anaconda3-5.2.0-Linux-x86_64.sh参考这篇CSDN博客安装好。安装成功测试：在这里插入图片描述首先创建一个虚拟环境：condacreate-npytorchpython=3.6在这里插入图片描述输入sourceactivate
深度学习入门笔记1--梯度下降之--为什么是负方向--为什么局部下降最快的是负梯度方向闪闪发亮的小星星深度学习入门机器学习人工智能 python
本节目标理解梯度下降的原理，主要围绕以下几个问题展开：梯度下降法的用途？什么是梯度？为什么是负的梯度为什么局部下降最快的方向就是梯度的负方向。需要的知识储备：一级泰勒展开公式向量内积计算公式1.梯度下降算法无论是在线性回归（LinearRegression）、逻辑回归（LogisticRegression）还是神经网络（NeuralNetwork）等等，都会用到梯度下降算法。梯度下降算法主要用于辅
深度学习入门笔记2-从零开始实现线性回归闪闪发亮的小星星深度学习入门深度学习笔记线性回归
该节内容主要摘自李沐大神的动手学AI。sec_linear_scratch在了解线性回归的关键思想之后，我们可以开始通过代码来动手实现线性回归了。在这一节中，(我们将从零开始实现整个方法，包括数据流水线、模型、损失函数和小批量随机梯度下降优化器)。虽然现代的深度学习框架几乎可以自动化地进行所有这些工作，但从零开始实现可以确保我们真正知道自己在做什么。同时，了解更细致的工作原理将方便我们自定义模型、
TensorFlow深度学习入门笔记（三）基本概念与代码2 长青大哥
写在前面学习建议：以下学习过程中有不理解可以简单查找下资料，但不必纠结（比如非得深究某一个函数等），尽量快速的学一遍，不求甚解无妨。多实操代码，不能只复制代码，或者感觉懂了就只看。熟能生巧，我亦无他，唯手熟尔今天突然有个想法，准备把部分英文也贴上。因后期是不可避免的要接触英文(论文之类)，现在就少量穿插在文章中，大家试着读下看。常量Constants与变量Variable前面已经使用过consta
PyTorch深度学习入门笔记（四）TensorBoard的使用雪天鱼深度学习 pytorch 深度学习 python
课程学习笔记，课程链接学习笔记同步发布在我的个人网站上，欢迎来访查看。文章目录一、TensorBoard1.1SummaryWriter1.2add_image()首先安装TensorBoard:pipinstalltensorboard一、TensorBoard1.1SummaryWriterfromtorch.utils.tensorboardimportSummaryWriter从函数介绍可
TensorFlow深度学习入门笔记（四）一些基本函数长青大哥
写在前面学习建议：以下学习过程中有不理解可以简单查找下资料，但不必纠结（比如非得深究某一个函数等），尽量快速的学一遍，不求甚解无妨。多实操代码，不能只复制代码，或者感觉懂了就只看。熟能生巧，我亦无他，唯手熟尔今天介绍一些基础函数及其用法，基本全是代码，一些解释都放在代码的注释里了。直接看代码吧，记得在你本地跑一下看哦代码1#tensor.get_shape()获取tensor的shape，就是维度
深度学习入门笔记 life情怀神经网络机器学习
前言博客内容均是对《深度学习入门—基于Python的理论与实现》一书2-6章的总结。以前也或多或少接触过一些相关知识，但都不成体系，故于此总结,大佬轻喷。文章目录前言感知机神经网络激活函数损失函数神经网络学习中的技巧参数更新方法权重的初始化抑制过拟合的方法超参数的选择感知机信号特征：感知机有多输入，而仅一输出。以两输入一输出为例，其数学模型如下：y={0(ω1x1+ω2x2)+b⩽01(ω1x1+
PyTorch深度学习入门笔记（十一）神经网络池化层雪天鱼深度学习 pytorch 深度学习神经网络
我是雪天鱼，一名FPGA爱好者，研究方向是FPGA架构探索和数字IC设计。关注公众号【集成电路设计教程】，获取更多学习资料，并拉你进“IC设计交流群”。QQIC设计&FPGA&DL交流群群号：866169462。课程学习笔记，课程链接文章目录一、MaxPool2d简介二、代码演示一、MaxPool2d简介这一节讲解池化层。还是通过Pytorch官方文档来进行学习：打开torch.nn的poolin
PyTorch深度学习入门笔记（九）卷积操作雪天鱼深度学习 pytorch 深度学习 python
课程学习笔记，课程链接学习笔记同步发布在我的个人网站上，欢迎来访查看。Pytorch的nn模块有ConvolutionLayers,有3种卷积操作，nn.Conv1d、nn.Conv2d、nn.Conv3d分别对应一维二维以及三维：注：在Pytorch官网文档左侧，有torch.nn和torch.nn.fuctional，torch.nn是对torch.nn.fuctional进行了一个封装，方便
深度学习入门笔记系列 ( 四 ) weixin_34015336 人工智能 python 数据结构与算法
基于tensorflow的回归代码实现本系列将分为8篇。今天是第四篇。总是理论有些枯燥，今天来动手基于TF框架实现两个简单的案例，以小搏大熟悉一下整个过程。整体来说，训练神经网络分为3个步骤：定义神经网络的结构和前向传播的输出结果定义损失函数以及选择反向传播优化的算法生成会话（tf.Session)并在训练数据上反复运行反向传播优化算法现以直线拟合和回归拟合两个简单案例来熟悉以上3个步骤。1.直线
PyTorch深度学习入门笔记（六）torchvision 中的数据集使用雪天鱼深度学习 pytorch 深度学习 python
课程学习笔记，课程链接学习笔记同步发布在我的个人网站上，欢迎来访查看。文章目录一、torchvision二、CIFAR数据集2.1下载数据集2.2数据集的使用2.3transforms的使用2.3其他数据集的使用目的：如何把数据集和Transforms结合在一起介绍科研中使用的一些标准数据集和下载、查看、使用方法一、torchvisionpytorch官网：https://pytorch.org/
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修

深度学习入门笔记（五）：神经网络的编程基础

专栏——深度学习入门笔记

声明

文章目录

深度学习入门笔记（五）：神经网络的编程基础

1、Jupyter/iPython Notebooks快速入门

2、Python 中的广播

3、关于numpy向量的说明

4、编程框架的选择问题

推荐阅读

参考文章

你可能感兴趣的:(#,深度学习入门笔记)