我是管小亮 :)

深度学习入门笔记（十一）：深度学习数据读取

专栏——深度学习入门笔记

声明

1）该文章整理自网上的大牛和机器学习专家无私奉献的资料，具体引用的资料请看参考文献。
2）本文仅供学术交流，非商用。所以每一部分具体的参考资料并没有详细对应。如果某部分不小心侵犯了大家的利益，还望海涵，并联系博主删除。
3）博主才疏学浅，文中如有不当之处，请各位指出，共同进步，谢谢。
4）此属于第一版本，若有错误，还需继续修正与增删。还望大家多多指点。大家都共享一点点，一起为祖国科研的推进添砖加瓦。

文章目录

专栏——深度学习入门笔记
声明
深度学习入门笔记（十一）：深度学习数据读取

1、Mini-batch 梯度下降
2、数据读取之 h5py
3、数据读取之 TFRecords
4、六种 Python 图像库读取

推荐阅读
参考文章

深度学习入门笔记（十一）：深度学习数据读取

1、Mini-batch 梯度下降

机器学习的应用是一个高度依赖经验的过程，伴随着大量迭代的过程，需要训练诸多模型，才能找到合适的那一个，所以，优化算法能够帮助你快速训练模型。

其中一个难点在于，虽然深度学习在大数据领域的效果不错，但是如果利用一个巨大的数据集来训练神经网络的话，训练速度往往很慢，比如我现在跑一次训练，需要一天一夜。。。因此，你会发现，使用快速的、好用的优化算法，能够大大提高你和团队或者实验室的效率。

那么，首先来谈谈 mini-batch 梯度下降法，这应该是大部分人第一个学习的数据读取方式。

之前学过，向量化（深度学习入门笔记（四）：向量化）能够有效地对所有 $m$ 个样本进行计算，允许处理整个训练集，而无需某个明确的公式。所以如果要把训练样本放大巨大的矩阵 $X$ 当中去， $\lbrack x^{(1)}\ x^{(2)}\ x^{(3)}\ldots\ldots x^{(m)}\rbrack$ ， $Y$ 也是如此， $\lbrack y^{(1)}\ y^{(2)}\ y^{(3)}\ldots \ldots y^{(m)}\rbrack$ ，所以 $X$ 的维数是 $n_{x},m)$ ， $Y$ 的维数是 $(1, m)$ 。

向量化能够相对较快地处理所有 $m$ 个样本。但是如果 $m$ 很大的话，处理速度仍然缓慢。比如， $m$ 是500万或5000万或者更大的一个数，在对整个训练集执行梯度下降法时，你要做的是，必须处理整个训练集，然后才能进行一步梯度下降法，然而这个时候你需要再重新处理500万个训练样本，才能进行下一步梯度下降法，所以如果在处理完整个500万个样本的训练集之前，先让梯度下降法处理一部分，算法的速度会不会更快？准确地说，这是你可以做的一些事情！

我们可以把训练集分割为小一点的子集训练，这些子集被取名为 mini-batch，假设每一个子集中只有1000个样本，那么把其中的 $x^{(1)}$ 到 $x^{(1000)}$ 取出来，将其称为第一个子训练集，也叫做 mini-batch，然后再取出接下来的1000个样本，从 $x^{(1001)}$ 到 $x^{(2000)}$ ，然后再取1000个样本，…以此类推。

接下来把 $x^{(1)}$ 到 $x^{(1000)}$ 称为 $X^{\{1\}}$ ， $x^{(1001)}$ 到 $x^{(2000)}$ 称为 $X^{\{2\}}$ ，等等…如果训练样本一共有500万个，每个 mini-batch 都有1000个样本，也就是说，你有5000个 mini-batch，因为5000乘以1000就是5000万。有5000个 mini-batch，就意味着最后得到的是 $X^{\left\{ 5000 \right\}}$ 。

对 $Y$ 也要进行相同处理，也要相应地拆分 $Y$ 的训练集，所以这是 $Y^{\{1\}}$ ，然后从 $y^{(1001)}$ 到 $y^{(2000)}$ ，这个叫 $Y^{\{2\}}$ ，一直到 $Y^{\{ 5000\}}$ 。

mini-batch 的数量 $t$ 组成了 $X^{\{ t\}}$ 和 $Y^{\{t\}}$ ，这就是1000个训练样本，包含相应的输入输出对。

来一起确定一下符号， $x^{(i)}$ 是第 $i$ 个训练样本， $z^{\lbrack l\rbrack}$ 表示神经网络中第 $l$ 层的 $z$ 值，大括号 ${t}$ 代表不同的 mini-batch。如果 $X^{\{1\}}$ 是一个有1000个样本的训练集，或者说是1000个样本的 $x$ 值，所以维数应该是 $n_{x},1000)$ ， $X^{\{2\}}$ 的维数应该是 $n_{x},1000)$ ，以此类推，所有的子集维数都是 $n_{x},1000)$ ，而这些（ $Y^{\{ t\}}$ ）的维数都是 $(1, 1000)$ 。

其实这个词有一点拗口，不过如果你了解了意思之后，就明白这个词的作用了。

batch 是批量的意思，mini 就是小的意思，现在再来解释一下这个算法的名称，batch 梯度下降法指的是之前讲过的梯度下降法算法，就是同时处理整个训练集，这个名字就是来源于能够同时看到整个 batch 训练集的样本被处理，这个名字不怎么样，但就是这样叫它，所以记住就行。相比之下，mini-batch 梯度下降法，指的是每次同时处理的单个的 mini-batch $X^{\{t\}}$ 和 $Y^{\{ t\}}$ ，而不是同时处理全部的 $X$ 和 $Y$ 训练集，也就是小批量数据的梯度下降法。

那么究竟 mini-batch 梯度下降法的原理是什么？

在训练集上运行 mini-batch 梯度下降法，你运行 for t=1……5000，因为有5000个各有1000个样本的组，在 for 循环里要做得基本就是对 $X^{\{t\}}$ 和 $Y^{\{t\}}$ 执行一步梯度下降法，就好比现在有一个拥有1000个样本的训练集，而且假设你已经很熟悉一次性处理完的方法，要用向量化去一次性处理1000个样本，这就是其中一个过程，然后共计执行5000次，这样就算是完成了一个 mini-batch。

现在你应该大概了解了什么是 mini-batch，我们来详细地说一下整个过程。

首先对输入也就是 $X^{\{ t\}}$ ，执行前向传播，然后执行 $z^{\lbrack 1\rbrack} =W^{\lbrack 1\rbrack}X + b^{\lbrack 1\rbrack}$ ，之前只有一个数据，但是现在正在处理整个训练集，即第一个 mini-batch，故 $X$ 变成了 $X^{\{ t\}}$ ，即 $z^{\lbrack 1\rbrack} = W^{\lbrack 1\rbrack}X^{\{ t\}} + b^{\lbrack1\rbrack}$ ，然后执行 $A^{[1]k} =g^{[1]}(Z^{[1]})$ ，之所以用大写的 $Z$ 是因为这是一个向量内涵，…以此类推，直到 $A^{\lbrack L\rbrack} = g^{\left\lbrack L \right\rbrack}(Z^{\lbrack L\rbrack})$ ，这就是网络的输出，即模型的预测值。注意这里需要用到一个向量化的执行命令，是一次性处理1000个而不是500万个数据样本。接下来计算损失成本函数 $J$ ，因为子集规模是1000， $\frac{1}{1000}\sum_{i = 1}^{l}{L(\hat y^{(i)},y^{(i)})}$ ，说明一下，这（ $L(\hat y^{(i)},y^{(i)})$ ）指的是来自于 mini-batch $X^{\{ t\}}$ 和 $Y^{\{t\}}$ 中的样本，这一块一定不要弄混了，是完成一个 batch 内的数据训练过程，即1000。

如果用到了正则化（深度学习入门笔记（十）：正则化）， $=\frac{1}{1000}\sum_{i = 1}^{l}{L(\hat y^{(i)},y^{(i)})} +\frac{\lambda}{2 1000}\sum_{l}^{}{||w^{[l]}||}_{F}^{2}$ ，因为这是一个 mini-batch 的损失，所以将 $J$ 损失记为上角标 $t$ ，放在大括号里（ $J^{\{t\}} = \frac{1}{1000}\sum_{i = 1}^{l}{L(\hat y^{(i)},y^{(i)})} +\frac{\lambda}{2 1000}\sum_{l}^{}{||w^{[l]}||}_{F}^{2}$ ）。到这里了，你应该会注意到，我们做的一切都是那么的似曾相识，其实跟之前执行梯度下降法如出一辙，除了现在的对象不是 $X $ ， $Y $ ，而是 $X^{\{t\}}$ 和 $Y^{\{ t\}}$ 。

接下来，执行反向传播来计算 $J^{\{t\}}$ 的梯度，只是使用 $X^{\{ t\}}$ 和 $Y^{\{t\}}$ ，然后更新加权值， $W $ 实际上是 $W^{\lbrack l\rbrack}$ ，更新为 $W^{[l]}:= W^{[l]} - adW^{[l]}$ ，对 $b $ 做相同处理， $b^{[l]}:= b^{[l]} - adb^{[l]}$ 。这是使用 mini-batch 梯度下降法训练样本的一步，写下的代码也可被称为进行 一代（1 epoch） 的训练，一代的意思是只是一次遍历了训练集。

使用 batch 梯度下降法，一次遍历训练集只能让你做一个梯度下降，使用 mini-batch 梯度下降法，一次遍历训练集，能让你做5000个梯度下降。mini-batch 梯度下降法比 batch 梯度下降法运行地更快，所以几乎每个研习深度学习的人在训练巨大的数据集时都会用到，希望你可以好好理解理解。

2、数据读取之 h5py

HDF（Hierarchical Data Format）指一种为存储和处理大容量科学数据设计的文件格式及相应库文件。其中当前比较流行的版本是 HDF5。它拥有一系列的优异特性，使其特别适合进行大量科学数据的存储和操作，如支持非常多的数据类型，灵活，通用，跨平台，可扩展，高效的 I/O 性能，支持几乎无限量（高达 EB）的单文件存储等，详见其官方介绍：https://support.hdfgroup.org/HDF5/ 。

HDF5 三大要素：

hdf5 files：能够存储两类数据对象 dataset 和 group 的容器，其操作类似 python 标准的文件操作；File 实例对象本身就是一个组，以 / 为名，是遍历文件的入口
dataset(array-like)：可类比为 Numpy 数组，每个数据集都有一个名字（name）、形状（shape）和类型（dtype），支持切片操作
group(folder-like)：可以类比为字典，它是一种像文件夹一样的容器；group 中可以存放 dataset 或者其他的 group，键就是组成员的名称，值就是组成员对象本身(组或者数据集)

Python 中有一系列的工具可以操作和使用 HDF5 数据，其中最常用的是 h5py 和 PyTables。目前比较火热的pytorch就可以使用 h5py 进行数据的读取，这样相较于 minibatch 也会更好。

入门的建议博客是这个——深度学习之10分钟入门h5py，如果你比较迷惑的话，就把它当成是一个存储数据的工具即可，可以类比于Excel表格存储数据一样。

3、数据读取之 TFRecords

关于 TensorFlow 读取数据的方法，官网给出了三种方法：

供给数据：在 TensorFlow 程序运行的每一步，让 Python 代码来供给数据。
从文件读取数据：在 TensorFlow 图的起始，建立一个输入管线从文件中读取数据。
预加载数据：在 TensorFlow 图中定义常量或变量来保存所有数据(仅适用于数据量比较小的情况)。

输入数据集一般被存储在各种类型的文件系统中，根据文件系统类型和输入数据集大小，有两种不同的数据读取方法：

大数据集(如 ImageNet )一般由大量数据文件构成，因为数据规模太大，所以无法一次性全部加载到内存中，因为太耗内存，这个时候最好使用 TensorFlow 提供的队列 queue ，也就是第二种方法从文件读取数据。
小数据集(如 MNIST )可能仅包含一个文件，因此用户可以在模型训练开始前一次性地将其加载到内存处理，然后再分batch 输入网络进行训练，也就是第三种方法预加载数据。

小数据集时多采用 minibatch，而大数据集时则多采用 TFRecords 格式。

入门的建议是这个博客——TensorFlow学习笔记之30分钟学会 TFRecords 格式高效处理数据，如果你还是很迷糊的话，只要记得 TFRecords 格式和 h5py 格式是类似的效用即可。

4、六种 Python 图像库读取

主流Python图像库有：

opencv——cv2.imread
OpenCV 作为最常用的图像处理库，实现了图像处理和计算机视觉方面的很多通用算法，可以说是很全面和强大了。如果你只想掌握一个图像库的话，OpenCV 是你的最佳选择。
PIL——PIL.Image.open
PIL 即 Python Imaging Library，也即为我们所称的 Pillow，已经是 python 平台事实上的图像处理标准库了。PIL 功能非常强大，但 API 却非常简单易用。它比 OpenCV 更为轻巧，正因如此，它深受大众的喜爱。
matplotlib——matplotlib.image.imread
Matplotlib 是 python 的 2D 绘图库，它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。它可与 NumPy 一起使用，提供了一种有效的 MatLab 开源替代方案。
scipy.misc——scipy.misc.imread
Scipy 是一个 python 中用于进行科学计算的工具集，有很多功能，如计算机统计学分布、信号处理、计算线性代数方程等。
skimage——skimage.io.imread
skimage 对 scipy.ndimage 进行了扩展，提供了更多的图片处理功能，是基于 python 脚本语言开发的数字图片处理包。
Tensorflow——tf.image.decode
tf.image.decode 函数可以对图像进行很多操作，如放大缩小，旋转，平移，等等。

详细的实例和代码可以看这个博客——你不能不知道的六种 Python 图像库的图片读取方法总结。

参考文章

吴恩达——《神经网络和深度学习》视频课程

深度学习入门笔记（九）自编码器 zhanghui_cuc 深度学习笔记深度学习笔记人工智能
自编码器是一个无监督的应用，它使用反向传播来更新参数，它最终的目标是让输出等于输入。数学上的表达为，f(x)=x，f为自编码器，x为输入数据。自编码器会先将输入数据压缩到一个较低维度的特征，然后利用这个较低维度的特征重现输入的数据，重现后的数据就是自编码器的输出。所以，从本质上来说，自编码器就是一个压缩算法。自编码器由3个部分组成：编码器（Encoder）：用于数据压缩。压缩特征向量（Compre
深度学习入门笔记（八）可以不断思考的模型：RNN与LSTM zhanghui_cuc 深度学习笔记深度学习 rnn 笔记
8.1循环神经网络RNN之前学到的CNN和全连接，模型的输入数据之间是没有关联的，比如图像分类，每次输入的图片与图片之间就没有任何关系，上一张图片的内容不会影响到下一张图片的结果。但在自然语言处理领域，这就成了一个短板。RNN因此出现，它是一类用于处理序列数据的神经网络。其基本单元结构如下自底向上的三个蓝色的节点分别是输入层、隐藏层和输出层。U和V分别是连接两个层的权重矩阵。如果不考虑右边的棕色环
深度学习入门笔记（五）前馈网络与反向传播 zhanghui_cuc 深度学习笔记深度学习笔记人工智能
接着上一节，本节讲解模型自我学习的数学计算过程究竟是怎么样的。5.1前馈网络一个最简单的前馈神经网络如图所示，对于每一个隐藏层，输入对应前一层每一个节点权重乘以节点输出值，输出则是经过激活函数（例如sigmoid函数）计算后的值。在这样的网络中，输入的数据x经过网络的各个节点之后，即可计算出最终的模型结果。这样就完成了一个最基本的前馈网络从输入到输出的计算过程。5.2反向传播在实际工作中这部分的内
深度学习入门笔记（1）——什么是深度学习？ ZRX_GIS 深度学习深度学习数据挖掘机器学习神经网络 pytorch
深度学习入门笔记（1）——什么是深度学习？在很多人眼里，深度学习（DeepLearning）是一个十分高大上的研究手段，它可以模拟人的判断，让数据处理和结果输出具有“人性”，在没接触过的人看来，深度学习简直是“玄学”范畴，网络一通，谁都不爱。但是，在所有人追捧深度学习的同时，对学习这一手段却是望而却步，更有甚者在网上买完“韭菜课”后，原理部分还没看完就不在继续学习。其实，说句实话，深度学习只是被过
深度学习入门笔记（6）—— Logistic Regression cnhwl 深度学习入门笔记深度学习机器学习逻辑回归人工智能 python
对比第三节中的Adaline和LogisticRegression，可以发现它们只有两点不同：1、激活函数，Adaline中的激活函数是恒等函数（线性），而LogisticRegression中的激活函数是Sigmoid函数（非线性）；2、损失函数，Adaline中的损失函数是均方误差，而LogisticRegression中的损失函数则是交叉熵。Sigmoid函数如图所示，其值域为0到1，输入为
深度学习入门笔记（三）常用AI术语 zhanghui_cuc 深度学习笔记人工智能深度学习笔记
本节我们介绍一些深度学习领域常用的术语。训练确定模型中的参数的过程，我们就称为“训练”。Epoch遍历一遍训练数据就叫作“一个Epoch”。训练模型的时候，我们要告诉模型预计训练多少个Epoch，但这个值并不是固定的，因为并没有一个准确的Epoch数能一定能得到一个比较好的模型。我们有一个标准：模型训练的Epoch数必须要让模型达到一个收敛的状态。并且为了模型有更多的选择，我们可以让模型收敛后，再
深度学习入门笔记4 深度神经网络深度学习从入门到放弃深度学习笔记神经网络深度学习人工智能机器学习算法
多层感知器在之前的课程中，我们了解到，感知器（指单层感知器）具有一定的局限——无法解决异或问题，即线性不可分的问题。将多个单层感知器进行组合，就可以得到一个多层感知器（MLP——Multi-LayerPerceptron）结构。多层感知器包含输入层，一个或多个隐藏层以及一个输出层。每层的神经元与下一层进行完全连接。如果网络中包含一个以上的隐层，则称其为深度人工神经网络。说明：通常我们说的神经网络的
深度学习入门笔记：第二章感知机维持好习惯深度学习深度学习笔记人工智能
深度学习入门笔记：第二章感知机笔记来源书籍：《深度学习入门：基于+Python+的理论与实现》文章目录深度学习入门笔记：第二章感知机前言为什么学习感知机2.1感知机是什么2.2简单逻辑电路2.2.1与门2.2.2与非门和或门2.3感知机实现2.3.1简单的实现2.3.2导入权重和偏置2.3.3使用权重和偏置的实现2.4感知机的局限性2.4.1异或门2.4.2线性和非线性2.5多层感知机2.5.1已
深度学习入门笔记（二）神经元激励函数神经网络花落雨微扬神经网络网络深度学习人工智能机器学习
声明：本文内容源自《白话深度学习与tensorflow》高扬卫峥编著一书读书笔记！！！神经网络：神经网络又称为人工神经网络（artificialneutralnetwork,ANN）。神经网络是一种人类由于受到生物神经细胞结构启发而研究出的一种算法体系神经元：如上图所示是一个最简单的神经元，有一个输入，一个输出。我们现在所使用的神经元通常有两个部分组成，一个是“线性模型”，另一个是“激励函数”。假
深度学习入门笔记（二）神经元的结构 zhanghui_cuc 深度学习笔记深度学习笔记人工智能
神经网络的基本单元是神经元，本节我们介绍神经元的结构。2.1神经元一个神经元是由下面5部分组成的：输入：x1,x2,…,xk。权重：w1,w2,…,wk。权重的个数与神经元输入的个数相同。偏移项：可省略。激活函数：一般都会有，根据实际问题也是可以省略的。输出。2.2激活函数激活函数有很多种，不同的激活函数适用于不同的问题。二分类问题我们一般采用Sigmoid函数，多分类问题我们采用Softmax函
深度学习入门笔记（七）卷积神经网络CNN zhanghui_cuc 深度学习笔记深度学习笔记 cnn
我们先来总结一下人类识别物体的方法：定位。这一步对于人眼来说是一个很自然的过程，因为当你去识别图标的时候，你就已经把你的目光放在了图标上。虽然这个行为不是很难，但是很重要。看线条。有没有文字，形状是方的圆的，还是长的短的等等。看细节。纹理、颜色、方向等。卷积神经网络就是对上述过程的程序实现。7.1卷积卷积在卷积神经网络中的主要作用是提取图片的特征，同时保留原来图片中各个像素的相对位置（空间）关系。
深度学习入门笔记（八）实战经验 zhanghui_cuc 深度学习笔记深度学习笔记性能优化
前面几节介绍了很多理论，难免会好奇：理论如何与实战结合呢？本节我们就穿插一点实战经验，来换换脑子~1.显卡warmup进行深度学习训练和推理时，往往第一次运行的耗时比较高，这是因为显卡需要warm-up，就是“热身”，才能发挥出显卡的性能。关于热身，个人理解，显卡开始工作时控制单元需要对资源进行调度，例如分配warp等。这些应该都是在第一次推理的时候进行。类似的，举个栗子，在F1比赛中，每场赛车的
深度学习入门笔记（六）线性回归模型 zhanghui_cuc 深度学习笔记深度学习笔记线性回归
本节，我们用线性回归为例子，回顾一些基本概念6.1相关性相关性的取值范围是-1到1，越接近1或者-1代表越相关，越接近0则越不相关。相关系数大于0称为正相关，小于0称为负相关。假如A与B正相关，则是说A（B）会随着B（A）的增大而增大，减小而减小。假如A与B负相关，则是说A（B）会随着B（A）的增大而减小，减小而增大。皮尔逊系数就是常用的相关性方法。6.2什么是线性回归顾名思义，就是用一种线性关系
深度学习入门笔记（四）函数与优化方法 zhanghui_cuc 深度学习笔记深度学习笔记人工智能
深度学习有三大部分模型表征（包括模型设计、网络表示等）模型评估（上一篇文章提到的准确召回和损失函数等）优化算法（模型如何学习或更新）本节我们就来介绍模型是如何学习或更新的。4.1损失函数模型的学习，实际上就是对参数的学习。参数学习的过程需要一系列的约束，这个约束就是损失函数。以函数曲线拟合为例，对于每一个样本点，真实值和拟合值之间就存在了一个误差，我们可以通过一个公式来表示这个误差：L(x)=(F
深度学习入门笔记（7）—— Multinomial Logistic Regression / Softmax Regression cnhwl 深度学习入门笔记深度学习机器学习人工智能 pytorch 算法
首先介绍一个非常著名的多分类数据集MNIST，也就是0到9的手写数字数据集。每个图像都是28*28，用于Pytorch数据读取的格式是NCHW，即Number、Channel、Height、Weight。读取图像之后，就能看到一个只有单通道的（灰度）图像，实际上就是一行行像素值的组合，用于SoftmaxRegression时输入得是一个向量，所以要将一行行的像素进行拼接，成为一个长的向量。同时，将
计算机视觉深度学习入门笔记-从理论到实战案例 HopES0 计算机视觉深度学习笔记
计算机视觉深度学习入门笔记-从理论到实战案例第一章深度学习概论1.1神经网络基础1.1.1为什么是神经网络？1.1.2为什么神经网络有效？1.1.3神经网络的运行1.2卷积神经网络1.2.1图像——矩阵1.2.2为什么是卷积？1.2.3卷积神经网络的传播1.3VGG模型——传统串行网路的大成之作1.3.1网络结构1.3.2运行过程1.3.3模型的优化第二章神经网络的训练2.1pytorch与面向对
深度学习入门笔记：第一章python入门维持好习惯深度学习 python 深度学习笔记
深度学习入门笔记：第一章python入门笔记来源书籍：《深度学习入门：基于+Python+的理论与实现》文章目录深度学习入门笔记：第一章python入门前言第一章python入门1.1深度学习为什么使用python？1.2python环境1.3python解释器1.3.1算术计算和数据类型1.3.2变量定义1.3.3列表1.3.4字典1.3.5布尔型1.3.6if语句1.3.7for语句1.3.8
TensorFlow深度学习入门笔记（四）一些基本函数长青_changqingqingge01 深度学习深度学习入门 TensorFlow
写在前面学习建议：以下学习过程中有不理解可以简单查找下资料，但不必纠结（比如非得深究某一个函数等），尽量快速的学一遍，不求甚解无妨。多实操代码，不能只复制代码，或者感觉懂了就只看。熟能生巧，我亦无他，唯手熟尔今天介绍一些基础函数及其用法，基本全是代码，一些解释都放在代码的注释里了。直接看代码吧，记得在你本地跑一下看哦代码1#tensor.get_shape()获取tensor的shape，就是维度
深度学习入门笔记（二）梯度下降法 _CyberAngel 深度学习笔记费曼笔记本逻辑回归算法机器学习
如愚见指月，观指不观月。目录上节回顾——logistic回归模型和成本函数梯度下降梯度下降法的执行过程计算图logistic模型中的梯度下降算法上节回顾——logistic回归模型和成本函数是在条件下，的概率。。如果想要让我们的模型更加精确的话，就要让尽可能的接近。所以，我们定义了损失函数和成本函数，用于评估与的接近程度，以及模型的准确率。损失函数是对单个样本来说的。成本函数是对整个数据集来说的。
PyTorch深度学习入门笔记（一）PyTorch环境配置及安装雪天鱼
@[Toc]OS：ubuntu20.04（虚拟机）一、工具安装1.1Anaconda安装首先安装Anaconda,我是去清华大学镜像站下载，版本为Anaconda3-5.2.0-Linux-x86_64.sh参考这篇CSDN博客安装好。安装成功测试：在这里插入图片描述首先创建一个虚拟环境：condacreate-npytorchpython=3.6在这里插入图片描述输入sourceactivate
深度学习入门笔记1--梯度下降之--为什么是负方向--为什么局部下降最快的是负梯度方向闪闪发亮的小星星深度学习入门机器学习人工智能 python
本节目标理解梯度下降的原理，主要围绕以下几个问题展开：梯度下降法的用途？什么是梯度？为什么是负的梯度为什么局部下降最快的方向就是梯度的负方向。需要的知识储备：一级泰勒展开公式向量内积计算公式1.梯度下降算法无论是在线性回归（LinearRegression）、逻辑回归（LogisticRegression）还是神经网络（NeuralNetwork）等等，都会用到梯度下降算法。梯度下降算法主要用于辅
深度学习入门笔记2-从零开始实现线性回归闪闪发亮的小星星深度学习入门深度学习笔记线性回归
该节内容主要摘自李沐大神的动手学AI。sec_linear_scratch在了解线性回归的关键思想之后，我们可以开始通过代码来动手实现线性回归了。在这一节中，(我们将从零开始实现整个方法，包括数据流水线、模型、损失函数和小批量随机梯度下降优化器)。虽然现代的深度学习框架几乎可以自动化地进行所有这些工作，但从零开始实现可以确保我们真正知道自己在做什么。同时，了解更细致的工作原理将方便我们自定义模型、
TensorFlow深度学习入门笔记（三）基本概念与代码2 长青大哥
写在前面学习建议：以下学习过程中有不理解可以简单查找下资料，但不必纠结（比如非得深究某一个函数等），尽量快速的学一遍，不求甚解无妨。多实操代码，不能只复制代码，或者感觉懂了就只看。熟能生巧，我亦无他，唯手熟尔今天突然有个想法，准备把部分英文也贴上。因后期是不可避免的要接触英文(论文之类)，现在就少量穿插在文章中，大家试着读下看。常量Constants与变量Variable前面已经使用过consta
PyTorch深度学习入门笔记（四）TensorBoard的使用雪天鱼深度学习 pytorch 深度学习 python
课程学习笔记，课程链接学习笔记同步发布在我的个人网站上，欢迎来访查看。文章目录一、TensorBoard1.1SummaryWriter1.2add_image()首先安装TensorBoard:pipinstalltensorboard一、TensorBoard1.1SummaryWriterfromtorch.utils.tensorboardimportSummaryWriter从函数介绍可
TensorFlow深度学习入门笔记（四）一些基本函数长青大哥
写在前面学习建议：以下学习过程中有不理解可以简单查找下资料，但不必纠结（比如非得深究某一个函数等），尽量快速的学一遍，不求甚解无妨。多实操代码，不能只复制代码，或者感觉懂了就只看。熟能生巧，我亦无他，唯手熟尔今天介绍一些基础函数及其用法，基本全是代码，一些解释都放在代码的注释里了。直接看代码吧，记得在你本地跑一下看哦代码1#tensor.get_shape()获取tensor的shape，就是维度
深度学习入门笔记 life情怀神经网络机器学习
前言博客内容均是对《深度学习入门—基于Python的理论与实现》一书2-6章的总结。以前也或多或少接触过一些相关知识，但都不成体系，故于此总结,大佬轻喷。文章目录前言感知机神经网络激活函数损失函数神经网络学习中的技巧参数更新方法权重的初始化抑制过拟合的方法超参数的选择感知机信号特征：感知机有多输入，而仅一输出。以两输入一输出为例，其数学模型如下：y={0(ω1x1+ω2x2)+b⩽01(ω1x1+
PyTorch深度学习入门笔记（十一）神经网络池化层雪天鱼深度学习 pytorch 深度学习神经网络
我是雪天鱼，一名FPGA爱好者，研究方向是FPGA架构探索和数字IC设计。关注公众号【集成电路设计教程】，获取更多学习资料，并拉你进“IC设计交流群”。QQIC设计&FPGA&DL交流群群号：866169462。课程学习笔记，课程链接文章目录一、MaxPool2d简介二、代码演示一、MaxPool2d简介这一节讲解池化层。还是通过Pytorch官方文档来进行学习：打开torch.nn的poolin
PyTorch深度学习入门笔记（九）卷积操作雪天鱼深度学习 pytorch 深度学习 python
课程学习笔记，课程链接学习笔记同步发布在我的个人网站上，欢迎来访查看。Pytorch的nn模块有ConvolutionLayers,有3种卷积操作，nn.Conv1d、nn.Conv2d、nn.Conv3d分别对应一维二维以及三维：注：在Pytorch官网文档左侧，有torch.nn和torch.nn.fuctional，torch.nn是对torch.nn.fuctional进行了一个封装，方便
深度学习入门笔记系列 ( 四 ) weixin_34015336 人工智能 python 数据结构与算法
基于tensorflow的回归代码实现本系列将分为8篇。今天是第四篇。总是理论有些枯燥，今天来动手基于TF框架实现两个简单的案例，以小搏大熟悉一下整个过程。整体来说，训练神经网络分为3个步骤：定义神经网络的结构和前向传播的输出结果定义损失函数以及选择反向传播优化的算法生成会话（tf.Session)并在训练数据上反复运行反向传播优化算法现以直线拟合和回归拟合两个简单案例来熟悉以上3个步骤。1.直线
PyTorch深度学习入门笔记（六）torchvision 中的数据集使用雪天鱼深度学习 pytorch 深度学习 python
课程学习笔记，课程链接学习笔记同步发布在我的个人网站上，欢迎来访查看。文章目录一、torchvision二、CIFAR数据集2.1下载数据集2.2数据集的使用2.3transforms的使用2.3其他数据集的使用目的：如何把数据集和Transforms结合在一起介绍科研中使用的一些标准数据集和下载、查看、使用方法一、torchvisionpytorch官网：https://pytorch.org/
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key

深度学习入门笔记（十一）：深度学习数据读取

专栏——深度学习入门笔记

声明

文章目录

深度学习入门笔记（十一）：深度学习数据读取

1、Mini-batch 梯度下降

2、数据读取之 h5py

3、数据读取之 TFRecords

4、六种 Python 图像库读取

推荐阅读

参考文章

你可能感兴趣的:(#,深度学习入门笔记)