Liaojiajia2019

深度学习课程 | 《卷积神经网络》概念笔记——卷积神经网络

卷积神经网络

1. padding
2. 卷积步长
3. 单层卷积网络
3. 池化层
4. 全连接层
5. 经典网络
6. 残差网络 Residual Networks（ResNets）
7. Inception 网络
8. 数据增强 Data Augmentation
9. 滑动窗口算法
10. 边界框预测 Bounding Box Predictions
11. 交并比 IoU
12. 非最大抑制 NMS
13. Anchor Boxes
14. RPN网络
15. add和concat的不同

1. padding

padding译为扩充，对原始图片尺寸进行扩充，一般使用“0”。

在卷积过程中，如果原始图片尺寸是n×n，filter尺寸是f×f，则卷积后的图片尺寸是(n-f+1)×(n-f+1)，一般f取奇数。

经过上面卷积操作，可能会导致两个问题：

卷积后，输出图片尺寸缩小；
原始图片边缘信息对输出图片贡献比较少，输出图片会丢失边缘信息。

为了解决这个问题，因此使用padding方法，把原始图片尺寸进行扩充。

经过padding之后，原始尺寸变为(n+2p) x (n+2p)，filter还是f×f，输出图片尺寸则变为(n+2p-f+1) x (n+2p-f+1)。

若要保证卷积前后图片尺寸大小不变，则p应该为： $\frac{f-1}{2}$

valid conv： 表示没有进行padding操作，即p=0。
same conv： 表示输入和输出是一致的尺寸，p用上面的公式计算。

2. 卷积步长

步长stride表示filter在图片尺寸中水平方向和垂直方向每次进行的步进长度。默认是stride = 1。若stride = 2表示filter每次步进长度是2，即每隔一个点移动一次。

同样的，原始图片尺寸是n x n，filter尺寸为f x f，那么卷积后的图片尺寸是： $\left \lfloor \frac{n+2p-f}{s}+1 \right \rfloor ×\left \lfloor \frac{n+2p-f}{s}+1 \right \rfloor$ 其中，上面符号表示向下取整，即选取不大于该值的整数。

在目前深度学习领域，使用的卷积操作其实是相关系数操作，因为能够这样等价，是因为滤波器算子一般是水平或者垂直对称的，180°旋转影响并不大，而且最后滤波器算子需要通过CNN网络梯度下降算法计算得到，旋转部分可以看作是包含在CNN模型算法中的。

3. 单层卷积网络

CNN的单层结构多了激活函数ReLU和偏移量b。整个卷积过程和标准的神经网络单层结构很相似。卷积对应着乘积运算，滤波器组的数值对应着权重 $W^{[l]}$ ，激活函数 $g^{[l]}$ 选的是ReLU。
$Z^{[l]}=W^{[l]}A^{[l-1]}+b$
$A^{[l]}=g^{[l]}(Z^{[l]})$

卷积操作的参数是与输入图片大小无关的，由滤波器组的参数来决定的。例如，每个滤波器组有3x3x3=27个参数，还有1个偏移量b，则每个滤波器组有27+1=28个参数，两个滤波器组总共包含28x2=56个参数。

单层卷积网络的参数总结：

$f^{[l]}$ ：filter size
$g^{[l]}$ ：padding大小
$s^{[l]}$ ：stride大小
$n_{c}^{[l]}$ ：filters的数量
输入维度： $n_{H}^{[l-1]}\times n_{W}^{[l-1]}\times n_{c}^{[l-1]}$
每个滤波器组的维度： $f^{[l]}\times f^{[l]}\times n_{c}^{[l-1]}$
权重维度： $f^{[l]}\times f^{[l]}\times n_{c}^{[l-1]}\times n_{c}^{[l]}$
偏置维度： $1\times 1\times 1\times n_{c}^{[l]}$
输出维度： $n_{H}^{[l]}\times n_{W}^{[l]}\times n_{c}^{[l]}$
其中， $n_{H}^{[l]}=\left \lfloor \frac{n_{H}^{[l-1]}+2p^{[l]}-f^{[l]}}{s^{[l]}} +1\right \rfloor$
$n_{W}^{[l]}=\left \lfloor \frac{n_{W}^{[l-1]}+2p^{[l]}-f^{[l]}}{s^{[l]}} +1\right \rfloor$
如果有m个样本，则进行向量化运算，输出维度为： $m\times n_{H}^{[l]}\times n_{W}^{[l]}\times n_{c}^{[l]}$

3. 池化层

定义： 池化层是用于CNN中用来减小尺寸的，提高运算速度的，减小噪声的影响，让特征更具有鲁棒性。

池化层分为：Max pooling和 Average pooling。

Max pooling的优势在于保留区域内的最大值（特征），忽略其他值，降低噪声的影响。Max pooling需要的超参数为滤波器尺寸 $f$ 和步长 $s$ ，不需要其他的参数。

Average pooling是滤波器算子滑动区域计算平均值，同样只需要滤波器尺寸 $f$ 和步长 $s$ 。

在实际应用中，Max pooling比Average pooling更常用。

4. 全连接层

定义： 全连接层中的每个神经元与前一个层的所有神经元进行全连接，整合前面卷积层与池化层的信息。全连接的核心操作就是矩阵向量乘积。

作用： 在CNN中起到”分类器“的作用

5. 经典网络

LeNet-5： 大约包括6万个参数。
AlexNet： 大约有6千万个参数。
VGG-16： 大约有1亿3千万个参数。

6. 残差网络 Residual Networks（ResNets）

定义： 当CNN层数增多，网络越深时，可能会引起梯度消失和梯度爆炸，使得整个网络模型不能进行更好地训练或者不能到达拟合，因此就需要采取一种弱化每层相互关系的方法，为的是能够训练更深的网络。这种方法是人为地让神经网络某些层跳过下一层神经元的连接，隔层或者各几层相连。

如下图表示的是Residual block：

下图表示的是Residual Network：

为什么ResNets能够训练更深的神经网络？

输入x经过Big NN后，输出的是 $a^{[l]}$ ， $a^{[l]}$ 经过一个Residual block输出 $a^{[l+2]}$ 。 $a^{[l+2]}$ 表达式为： $a^{[l+2]}=g(z^{[l+2]}+a^{[l]})=g(W^{[l+2]}a^{[l+1]}+b^{[l+2]}+a^{[l]})$
若 $W^{[l+2]}≈0$ ， $b^{[l+2]}≈0$ ，且当 $a^{[l]}≥0$ ，有： $a^{[l+2]}=g(a^{[l]})=ReLU(a^{[l]})=a^{[l]}$
从公式可以知道，即使发生梯度消失或者梯度爆炸，也能够得到恒等公式： $a^{[l+2]}=a^{[l]}$ 。因此，整个过程就相当于忽略了 $a^{[l+1]}$ ，弱化了某些神经层之间的联系，就能够训练更深的神经网络了。

如果Residual blocks中 $a^{[l]}$ 和 $a^{[l+2]}$ 的维度不同，则需要引入 $W_{s}$ ，与 $a^{[l]}$ 相乘，使得 $W_{s}*a^{[l]}$ 的维度与 $a^{[l+2]}$ 一致。

那么参数 $W_{s}$ 该怎么计算得到呢？

第一，将 $W_{s}$ 作为学习参数，通过模型训练得到；第二，设置固定的 $W_{s}$ 值，不需要训练， $W_{s}$ 与 $a^{[l]}$ 的乘积只需要将 $a^{[l]}$ 截断或者补零。

7. Inception 网络

作用： 代替人工来确定卷积层中的过滤器类型或是否需要创建卷积层或池化层。该网络是使用不同尺寸的滤波器，并将卷积层和池化层结合起来使用，将所有的输出组合拼接起来，再由神经网络本身去学习参数并选择最佳的模块。

不足： Inception 网络会导致计算量过大的问题。如下图所示：

此时的计算量为： $28 * 28 * 32 * 5 * 5 * 192 = 120 M$ （million）。

因此，可以使用1×1CONV可以用于减少计算量，如下图所示：
通常1×1CONV称为“瓶颈层”（bottleneck layer）。引入1×1CONV后，此时的计算量为： $28 * 28 * 16 * 192 + 28 * 28 * 32 * 5 * 5 * 16 = 12.4 M$ （million）。可见，计算量减少了近90%。

下图是使用了1×1CONV后的Inception 模块：

然后，多个Inception模块就组成了Inception网络，如下图所示：

8. 数据增强 Data Augmentation

常用的数据增强方法有：镜像、随意裁剪、颜色变化（颜色扭曲、PCA颜色增强）等。

正如yolov4提到的trick中，关于数据增强的还有图像遮挡、多图组合、自对抗训练等方法，请参考链接。

当构建大型神经网络时，数据增强和训练可以由两个不同的线程来进行。

（上述图片来源）

9. 滑动窗口算法

滑动窗口算法可以使用卷积来实现，作用是提高运行速度，节约计算成本。

要进行滑动窗口算法，那么就需要把全连接层变成卷积层，具体操作是使用上一层尺寸一致的滤波器算子进行卷积运算即可。

下图是单个滑动窗口区域卷积结构。

那要是整张图片呢？对于整张图片，就需要使用该网络参数和结构进行计算。比如下图，16 x 16 x 3的输入图片，步长为2，经过CNN得到输出2 x 2 x 4，其中，2 x 2 表示有4个窗口结果。更复杂的输入图片28 x 28 x3，经过CNN得到的输出为8 x 8 x 4。（注意，上面是使用CNN正向进行反复计算的，比如16 x 16 x 3的图片需进行4次，28 x 28 x3的图片需进行64次）

当使用卷积操作代替滑动窗口算法时，不管原始图片有多大，都仅仅一次CNN正向计算即可（因为计算步骤里很多都是共享的），而且窗口的步进长度与Maxpooling的大小有关。

10. 边界框预测 Bounding Box Predictions

滑动窗口算法不能完全框中所有的目标，如下图所示：

为了解决整个问题，提出了YOLO算法，一次性生成多个框进行预测。

具体操作： 将原始图片切割成n x n个网格，每个网格代表一块区域。然后用卷积形式实现滑动窗口算法，对该原始图片构建卷积神经网络，得到输出的维度是3 x 3 x 8，其中，3 x 3 对应的是9个网格，8对应的是每个网格包括8个参数（是否在框内，xywh，类别）。 $y=\begin{bmatrix} P_{c}\\ b_{x}\\ b_{y}\\ b_{h}\\ b_{w}\\ c_{1}\\ c_{2}\\ c_{3}\\ \end{bmatrix}$

$P_{c}$ 表示目标中心在不在其中的方框内，若是在方框内则 $P_{c}=1$ ，否则 $P_{c}=0$ 。 $b_{x}$ 和 $b_{y}$ 限定在[0,1]内， $b_{w}$ 和 $b_{h}$ 可以大于1，目标可以存在在多个网格内。

11. 交并比 IoU

定义： 顾名思义就是交集与并集的比值，用于评价目标检测区域是否准确。

如下图，计算公式： $=\frac{绿色区域}{紫色区域}$ ，其中，IoU的数值范围是[0,1]。

12. 非最大抑制 NMS

目标检测算法中，可能会出现很多网格中都检测出了同一个目标的情况，那需要用什么方法来解决这个问题呢？

为了解决这个问题，提出了使用NMS（非最大值抑制）的方法，即根据IoU大于某个特定的数值（如0.5，0.6等人为规定的数值）。

对于bbox的表达式来说，即，用 $P_{c}$ 值的大小来进行NMS。

具体操作是：

选取 $P_{c}$ 中最大的值对应的网格与区域；
然后，计算该区域与其他区域的IoU，删掉IoU小于阈值（如0.5）的所有网格与区域；
最后，再从留下的网格中选取最大 $P_{c}$ 值的网格，利用IoU，删掉与该网格交叠较大的网格；
重复以上操作，直到找到最后一个最大的网格为止。

13. Anchor Boxes

在目标检测中，Anchor box一般设置有三种尺寸，三种比例（1：1， 1：2， 2：1）。当一个网格中出现两个目标的中心点时，使用不同的Anchor box来检测不同的目标。

使用Anchor box后，则YOLO输出项的表达式变为：
（根据Anchor box的数量改变输出的维度，Anchor boxes之间可以并行实现的） $y=\begin{bmatrix} P_{c}\\ b_{x}\\ b_{y}\\ b_{h}\\ b_{w}\\ c_{1}\\ c_{2}\\ c_{3}\\ P_{c}\\ b_{x}\\ b_{y}\\ b_{h}\\ b_{w}\\ c_{1}\\ c_{2}\\ c_{3}\\ \end{bmatrix}$

Anchor box和bbox有什么不同呢？

Anchor box可以同时检测重叠的目标，bbox只能检测单个目标。

14. RPN网络

RPN网络是用于二阶段网络的。

首先，提取出候选区域，然后，根据候选区域对目标进行回归与分类的预测。

（上述图片来源）

15. add和concat的不同

add：保证tensor的通道数不变，特征图相加
concat：通道数相加，特征图不变。

你可能感兴趣的:(#,深度学习笔记)

LangGraph 深度学习笔记：构建真实世界的智能代理成都犀牛人工智能大模型 Agent 深度学习笔记人工智能 pytorch python
LangGraph不仅仅是一个图框架，它是构建具有长期记忆、决策能力和复杂交互的智能代理（IntelligentAgents）的强大引擎。它通过将应用程序解构为可控的状态机，让你的LLM应用从简单的问答升级为能够自主思考、行动和适应的复杂系统。借用官方给的说法，其中重要点已经做了单独标注，下面的内容地址在文章最后有做说明LangGraphisalibraryforbuildingstateful,
深度学习笔记16-VGG-16算法-Pytorch实现人脸识别 boooo_hhh 深度学习机器学习 pytorch
目录前言一、前期准备1.设置GPU2.导入数据3.划分数据集二、调用官方的VGG-16模型三、训练模型1.编写训练函数2.编写测试函数3.设置动态学习率4.正式训练四、结果可视化1.Loss与Accuracy图2.指定图片进行预测3.模型评估五、总结前言本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、前期准备1.设置GPU如果设备上支持GPU就使用GPU,否则使用CPUimport
深度学习笔记疯狂成瘾者深度学习笔记人工智能
文章目录聚类导入模块生成模拟数据建立并训练K-Means聚类模型创建图形绘制散点图（聚类结果）获取聚类中心可视化聚类中心设置图形标题和标签输出效果数据降维一、常见的数据降维方法二、Python降维示例（用PCA将3D数据降至2D）✅第1部分：导入模块✅第2部分：生成模拟数据✅第3部分：PCA降维处理✅第4部分：开始绘图✅第5部分：绘制散点图✅第6部分：完善图像细节并显示✨最终效果数据降维的作用✅一
【深度学习】嘿马深度学习笔记第1篇：深度学习基本概要【附代码文档】某miao 深度学习笔记人工智能
图片无法加载本教程的知识点为：深度学习介绍1.1深度学习与机器学习的区别TensorFlow介绍2.4张量2.4.1张量(Tensor)2.4.1.1张量的类型TensorFlow介绍1.2神经网络基础1.2.1Logistic回归1.2.1.1Logistic回归TensorFlow介绍总结每日作业神经网络与tf.keras1.3神经网络基础神经网络与tf.keras1.3Tensorflow实
动手学深度学习笔记1 a3040218 深度学习深度学习笔记人工智能
介绍定义：深度学习是一类基于人工神经网络的机器学习技术，通过构建具有多个层次的神经网络模型，让计算机自动从大量数据中学习特征和模式。它模拟人类大脑的神经元结构，通过大量神经元之间的相互连接和信息传递，实现对复杂数据的学习和理解。Tips:与传统机器学习的区别：传统机器学习通常需要人工手动设计特征，这依赖于领域专家的经验和知识，且设计的特征往往具有局限性。而深度学习能够自动从数据中学习到复杂的特征表
深度学习笔记（一）：卷积变种（分组卷积、空洞卷积、深度可分离卷积、可形变卷积）卷积中的不一样的操作生活需要深度深度学习笔记人工智能
文章目录常规卷积（Convolution）分组卷积（GroupConvolution）原理用途空洞（扩张）卷积（Dilated/AtrousConvolution）深度可分离卷积（depthwiseseparableconvolution）标准卷积与深度可分离卷积的不同深度可分离卷积的过程深度可分离卷积的优点可变形卷积网络背景想法评价卷积神经网络中十大拍案叫绝的操作一、卷积只能在同一组进行吗？--
AIGC视频生成模型：ByteDance的PixelDance模型好评笔记 AIGC 深度学习人工智能计算机视觉机器学习 transformer 论文阅读
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance，论文于2023年11月发布，模型上线于2024年9月，同时期上线的模型还有Seaweed（论文未发布）。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录热门专栏机器学习深度学习
Meta的AIGC视频生成模型——Emu Video 好评笔记 AIGC 深度学习人工智能机器学习 transformer 校招面试八股
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍Meta的视频生成模型EmuVideo，作为Meta发布的第二款视频生成模型，在视频生成领域发挥关键作用。优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录论文摘要引言相关工作文本到图像（T2I）扩散模型视频生成/预测文本到视频（T2V）生成分解生成方法预备知识EmuVideo生成步骤图
深度学习笔记12-mnist手写数字识别(Pytorch) m0_67869333 深度学习深度学习笔记 pytorch
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊目录一、前期准备1.导入数据2.数据可视化二、构建简单的CNN网络三、训练模型1.设置超参数2.编写训练函数3.编写测试函数4.正式训练编辑四、结果可视化编辑五、总结1.Pytorch自带数据库：torchvision.dataset2.Pytorch自带数据加载器：torch.utils.data.DataLoader3.Pytorch
动手深度学习笔记（二十九）5.5. 读写文件落花逐流水 pytorch实践 pytorch pytorch
动手深度学习笔记（二十九）5.5.读写文件5.深度学习计算5.5.读写文件5.5.1.加载和保存张量5.5.2.加载和保存模型参数5.5.3.小结5.5.4.练习5.深度学习计算5.5.读写文件到目前为止，我们讨论了如何处理数据，以及如何构建、训练和测试深度学习模型。然而，有时我们希望保存训练的模型，以备将来在各种环境中使用（比如在部署中进行预测）。此外，当运行一个耗时较长的训练过程时，最佳的做法
AIGC视频生成模型：ByteDance的PixelDance模型好评笔记 AIGC 音视频机器学习人工智能深度学习计算机视觉 transformer
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance，论文于2023年11月发布，模型上线于2024年9月，同时期上线的模型还有Seaweed（论文未发布）。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录热门专栏机器学习深度学习
深度学习笔记——Resnet和迁移学习肆—— 深度学习深度学习笔记迁移学习
1.ResNet的提出深度学习与网络深度的挑战：在深度学习中，网络的“深度”(即层数)通常与模型的能力成正比。然而，随着网络深度的增加，一些问题也随之出现，最突出的是梯度消失/爆炸问题。这使得深层网络难以训练。梯度消失：梯度消失是指在训练深度神经网络时，通过多层传递的梯度(误差)变得非常小，接近于零。这导致网络中较早层的权重更新非常缓慢，甚至几乎不更新。梯度爆炸：梯度爆炸是指在训练深度神经网络时，
深度学习笔记——神经网络肆—— 深度学习深度学习笔记神经网络人工智能 python
本文为在拓尔思智能举办的训练营中学习内容的总结，部分内容摘自百度百科个人在这里推荐一个好用的软件，Trae，主要是免费。人工神经元是人工神经网络的基本单元。模拟生物神经元，人工神经元有1个或者多个输入（模拟多个树突或者多个神经元向该神经元传递神经冲动）；对输入进行加权求和（模拟细胞体将神经信号进行积累和树突强度不同）；对输入之和使用激活函数计算活性值（模拟细胞体产生兴奋或者抑制）；输出活性值并传递
深度学习笔记——基础部分肆—— 深度学习深度学习笔记人工智能 python pytorch
深度学习是一种机器学习的方式，通过模仿人脑吃力信息的方式，使用多层神经网络来学习数据的复杂模式和特征。深度学习和机器学习的区别：在机器学习中，特征提取通常需要人工设计和选择，依赖于领域专家的知识来确定哪些特征对模型最为重要;而在深度学习中，特征提取是自动进行的，通过多层神经网络结构直接从原始数据(也可能需要初步处理)中学习复杂特征，减少了对人工干预的依赖，使得模型能够处理更加复杂的数据和任务。计算
深度学习笔记线性代数方面，记录一些每日学习到的知识肆—— 人工智能深度学习 python
记录一些每日学习到的新知识：torch：Torch是一个有大量机器学习算法支持的科学计算框架，是一个与Numpy类似的张量(Tensor)操作库jupyter：JupyterNotebook的本质是一个Web应用程序，便于创建和共享程序文档，支持实时代码，数学方程，可视化和markdown。用途包括：数据清理和转换，数值模拟，统计建模，机器学习等等。只有一个轴的张量，形状只有一个元素torch.a
深度学习笔记——循环神经网络RNN 好评笔记补档深度学习 rnn 人工智能机器学习计算机视觉神经网络 AIGC
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍面试过程中可能遇到的循环神经网络RNN知识点。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集文章目录热门专栏机器学习深度学习文本特征提取的方法1.基础方法1.1词袋模型（BagofWords,BOW）工作原理举例优点缺点1.2TF-IDF（TermFrequency-InverseDocumentFr
机器学习笔记——特征工程好评笔记补档机器学习笔记人工智能 AIGC 深度学习计算机视觉面试八股
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本笔记介绍机器学习中常见的特征工程方法、正则化方法和简要介绍强化学习。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集文章目录热门专栏机器学习深度学习特征工程（FzeatureEngineering）1.特征提取（FeatureExtraction）手工特征提取（ManualFeatureExtraction）：自
深度学习笔记——常见的Transformer位置编码好评笔记深度学习笔记深度学习 transformer 人工智能
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍3种常见的Transformer位置编码——正弦/余弦位置编码（sin/cos）、基于频率的二维位置编码（2DFrequencyEmbeddings）、旋转式位置编码（RoPE）文章目录Transformer中常见的编码方式正弦/余弦位置编码（SinusoidalPositionalEncoding）基于频率的
深度学习面试八股文——决战金三银四 Good Note 补档深度学习面试人工智能机器学习 AIGC 校招春招
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本笔记的任务是解读深度学习实践/面试过程中可能会用到的知识点，内容通俗易懂，入门、实习和校招轻松搞定。公主号合集地址点击进入优惠地址：深度学习笔记合集笔记介绍本笔记的任务是解读深度学习实践/面试过程中可能会用到的知识点，内容通俗易懂，入门、实习和校招轻松搞定。涵盖深度学习八股文和常用算法、模型，包括深度学习基础知识，前向传
SD模型微调之LoRA 好评笔记补档深度学习计算机视觉人工智能面试 AIGC SD stable diffusion
大家好，这里是Goodnote（好评笔记），关注公主号Goodnote，专栏文章私信限时Free。本文是SD模型微调方法LoRA的详细介绍，包括数据集准备，模型微调过程，推理过程，优缺点等。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集文章目录热门专栏机器学习深度学习论文概念核心原理优点训练过程预训练模型加载选择微调的层LoRA优化的层Cross-Attention（跨注意力）层Self
深度学习笔记之自然语言处理(NLP) 电棍233 深度学习笔记自然语言处理
深度学习笔记之自然语言处理(NLP)在行将开学之时，我将开始我的深度学习笔记的自然语言处理部分，这部分内容是在前面基础上开展学习的，且目前我的学习更加倾向于通识。自然语言处理部分将包含《动手学深度学习》这本书的第十四章，自然语言处理预训练和第十五章，自然语言处理应用。并且参考原书提供的jupyternotebook资源。自然语言处理，预训练自然语言处理（NaturalLanguageProcess
动手学深度学习笔记|3.2线性回归的从零开始实现（附课后习题答案） lusterku 动手学深度学习深度学习笔记线性回归
动手学深度学习笔记|3.2线性回归的从零开始实现（附课后习题答案）线性回归的从零开始实现生成数据集读取数据集初始化模型参数定义模型定义损失函数定义优化算法训练练习1.如果我们将权重初始化为零，会发生什么。算法仍然有效吗？2.计算二阶导数时可能会遇到什么问题？这些问题可以如何解决？3.为什么在`squared_loss`函数中需要使用`reshape`函数？4.尝试使用不同的学习率，观察损失函数值下
深度学习笔记——pytorch构造数据集 Dataset and Dataloader 旺仔喔喔糖机器学习笔记 pytorch 人工智能深度学习
系列文章目录机器学习笔记——梯度下降、反向传播机器学习笔记——用pytorch实现线性回归机器学习笔记——pytorch实现逻辑斯蒂回归Logisticregression机器学习笔记——多层线性（回归）模型Multilevel(LinearRegression)Model深度学习笔记——pytorch构造数据集DatasetandDataloader深度学习笔记——pytorch解决多分类问题M
吴恩达深度学习笔记（七）——机器学习策略子非鱼icon 深度学习自学笔记深度学习机器学习人工智能神经网络吴恩达
一、正交化通俗的理解就是：要能够诊断出系统性能瓶颈在哪里，以有策略刚好解决这个问题。一个“按钮”只负责解决一件事情。二、单一数字评估指标准确率（precision）：在分类器中标记为猫的例子中，有多少是真的猫召回率（recall）：对于所有的真猫图片，你的分类器正确识别了多少。但如果有两个评估指标，就很难去选择一个更好的分类器，如下图所示。所以有一个结合这两个指标的标准方法，也即F1分数，定义如下
AIGC视频生成模型：Meta的Emu Video模型好评笔记 #Meta AIGC-视频 AIGC 机器学习人工智能 transformer 论文阅读深度学习面试
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍Meta的视频生成模型EmuVideo，作为Meta发布的第二款视频生成模型，在视频生成领域发挥关键作用。优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录论文摘要引言相关工作文本到图像（T2I）扩散模型视频生成/预测文本到视频（T2V）生成分解生成方法预备知识EmuVideo生成步骤图
AIGC视频生成国产之光：ByteDance的PixelDance模型好评笔记 AIGC-视频补档 AIGC 计算机视觉人工智能深度学习机器学习论文阅读面试
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance，论文于2023年11月发布，模型上线于2024年9月，同时期上线的模型还有Seaweed（论文未发布）。优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录论文摘要引言输入训练和推理时的数据处理总结相关工作视频生成长视频生成方法模型架构
深度学习笔记——模型部署好评笔记深度学习笔记深度学习笔记人工智能 transformer 模型部署大模型部署大模型
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文简要概括模型部署的知识点，包括步骤和部署方式。文章目录模型部署模型部署的关键步骤常见的模型部署方式优势与挑战总结边缘端部署方案总结历史文章机器学习深度学习模型部署模型部署是指将训练好的机器学习或深度学习模型集成到生产环境中，使其能够在实际应用中处理实时数据和提供预测服务。模型部署的流程涉及模型的封装、部署环境的选择、部
深度学习笔记——前向传播与反向传播、神经网络（前馈神经网络与反馈神经网络）、常见算法概要汇总好评笔记深度学习笔记深度学习笔记神经网络人工智能
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文简要介绍深度学习的前向传播与反向传播，以及前馈神经网络与反馈神经网络。文章目录前向传播与反向传播前向传播（ForwardPropagation）反向传播（BackPropagation）总结神经网络简介结构类型前馈神经网络（FeedforwardNeuralNetwork,FFNN）特点常见变体反馈神经网络（Feedb
深度学习笔记——生成对抗网络GAN 好评笔记深度学习笔记深度学习生成对抗网络人工智能神经网络 aigc gan 机器学习
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍早期生成式AI的代表性模型：生成对抗网络GAN。文章目录一、基本结构生成器判别器二、损失函数判别器生成器交替优化目标函数三、GAN的训练过程训练流程概述训练流程步骤1.初始化参数和超参数2.定义损失函数3.训练过程的迭代判别器训练步骤生成器训练步骤4.交替优化5.收敛判别GAN训练过程的挑战四、GAN的常见变体
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他