Pytorch Document学习笔记

Pytorch Document学习笔记
- 1. 网络层
- - 1.1 torch.nn.Conv2d
  - 1.2 torch.nn.MaxPool2d / torch.nn.MaxUnpool2d
  - 1.3 torch.nn.ReLU
  - 1.4 torch.nn.BatchNorm2d
- 2. 优化器
- - 2.1 torch.optim.SGD
  - 2.2 torch.optim.Adagrad
  - 2.3 torch.optim.RMSprop
  - 2.4 torch.optim.Adam
- 3. 损失函数
- - 3.1 torch.nn.L1Loss
  - 3.2 torch.nn.MSELoss
  - 3.3 torch.nn.CrossEntropyLoss
- 4. 初始化
- - 4.1 torch.nn.init.uniform
  - 4.2 torch.nn.init.normal
  - 4.3 torch.nn.init.constant
  - 4.4 torch.nn.init.xavier_uniform / torch.nn.init.xavier_normal
  - 4.5 torch.nn.init.kaiming_uniform / torch.nn.init.kaiming_normal

Pytorch Document学习笔记

最近花了些时间补充了Pytorch相关的知识，正好借着Pytorch的官方文档补充下深度学习的基础知识，主要是看看Pytorch中封装有哪些库函数，搞清楚这些库函数后面具体使用的算法，由于面比较广，可能深度不是很够

1. 网络层

1.1 torch.nn.Conv2d

卷积层的目的主要是提取特征，in_channels和out_channels分别控制着输入通道和输出通道的数量，kerner_size, stride和padding组合控制这卷积后输出特征层的大小，另外：
dilation为空洞卷积的间隔，在图像分割领域，在dilation提出来之前，主要通过pooling和up sampling来提高单个像素的感受野，dilation的主要作用就是在不用pooling的情况下也能够增大像素的感受野，以达到更好的分割效果，如下图所示：

groups为分组卷积，所谓分组卷积就是将32通道的卷积任务分为两个16通道卷积进行，主要作用是减少参数量，因为减少了参数量，对于网络来说相当于进行了正则化。
bias为卷积偏置，偏置的存在主要是为两个更好地拟合数据

1.2 torch.nn.MaxPool2d / torch.nn.MaxUnpool2d

池化层的作用主要是去掉特征中的冗余信息，相当于下采样操作，当return_indices设置为True时，函数会输出最大值的序号，而最大反池化则等同于上采样，输入为最大池化操作的输出以及序号，将非最大值部分设置为0
pytorch中出来最大池化操作，池化操作还包括AvgPool2d, FractionalMaxPool2d, LPPool2d, AdaptiveMaxPool2d, AdaptiveAvgPool2d

1.3 torch.nn.ReLU

非线性激活层存在的目的是为了让网络对非线性的数学模型具有拟合效果，与其类似的激活函数还包括ELU, PReLU, LeakyReLU, Threshold, Sigmoid, Tanh等等等等

1.4 torch.nn.BatchNorm2d

批归一化层相对来说会复杂一些，起主要目的是改变小批量数据的分布（均值和方差），批归一化的位置如果放在激活层之前则是对节点的输出进行归一化，如果放在激活后则是对下一个节点的输入进行归一化，都是可以的，批归一化层的公式如下 $y=\frac{x-\operatorname{mean}[x]}{\sqrt{\operatorname{Var}[x]}+\epsilon} * \text { gamma }+\text { beta }$ 其中 $m e a n$ 和 $v a r$ 分别为批数据的均值和方差， $g a m m a$ 和 $b e t a$ 为可以学习的参数，在训练过程中通过反向传播更新该参数，而在预测过程中则将该参数固定，Batch Normalization（BN）超详细解析对批归一化层进行了详细的解释，参考其总结一下加入批归一层带来的好处：

可以使用更大的学习率，学习过程更加稳定
可以将卷积层中的偏置设置为0，因为批归一化过程中会移除数据流中的直流分量
对初始化权重不再敏感
抑制了梯度消失同时具备正则化的效果

2. 优化器

2.1 torch.optim.SGD

随机梯度下降法的定义是随机选取批量数据中单个样本梯度进行梯度下降，其优势是算法收敛速度快，但是精度会有所损失，在实际应用为了权衡速度和精度，通常我们是批量样本中随机选取小批量样本进行梯度计算，例如我们随机随机了 $m$ 个样本 $\left\{x^{(1)}, \ldots, x^{(m)}\right\}$ ，对应的目标为 $y^{(i)}$ ，进行梯度估计有 $\leftarrow \frac{1}{m} \nabla_{w} \sum_{i} L\left(f\left(x^{(i)} ;w \right), y^{(i)}\right)$ 进行权重更新有 $\leftarrow w+g$ 随机梯度下降法中有如下几个参数：
动量因子momentum，在上面例子的基础上，多了一步速度更新 $\leftarrow \alpha v-\epsilon g$ 然后在进行权重更新 $\leftarrow w+v$ 这样改进之后，当前时刻的梯度与历史时刻梯度相似时，这种趋势在当前时刻会加强，如果不同，则当前时刻的梯度方向减弱，由此动量因子可以让那些因为学习率太大而来回摆动的参数梯度前后抵消，从而阻止发散。
权重衰减系数weight_decay，该系数和L2正则化有关，所谓L2正则化就是在代价函数后面再加上一个正则化项 $C=C_{0}+\frac{\lambda}{2 n} \sum_{w} w^{2}$ L2正则化的作用主要是的权重 $w$ 变小，防止过拟合。我们对加入L2正则化后的代价函数进行推导有： $\frac{\partial C}{\partial w}=\frac{\partial C_{0}}{\partial w}+\frac{\lambda}{n} w$ $\frac{\partial C}{\partial b}=\frac{\partial C_{0}}{\partial b}$ 我们发现，L2正则化后对偏置 $b$ 没有影响，但是对于权重 $w$ 的更新有影响： $KaTeX parse error: Undefined control sequence: \alphaC at position 56: …frac{\partial \̲a̲l̲p̲h̲a̲C̲_{0}}{\partial …$ 在不适用L2正则化时，求导结果中的 $w$ 之前的系数是1，而 $1-\frac{\eta \lambda}{n}$ 小于1，其效果是减小 $w$ ，这就是权重衰减系数的由来，在he实际应用中，学习率衰减通常有线性衰减（间隔固定epoch学习率减半）和指数衰减（间隔固定epoch学习率乘以0.9998）两种。
Nesterov加速梯度是在动量因子的基础上可以进一步加快收敛速度，使得收敛曲线更加稳定，经典动量的公式如下： $v_{t}=\alpha v_{t-1}-\epsilon g\left(w_{t-1}\right)$ $w_{t}=w_{t-1}+v_{t}$

而Nesterov加速梯度后的公式如下： $w_{t-1}^{a h e a d}=w_{t-1}+\mu v_{t-1}$ $v_{t}=\alpha v_{t-1}-\epsilon g\left(w_{t-1}^{a h e a d}\right)$ $w_{t}=w_{t-1}+v_{t}$ 即Nesterov加速梯度中计算的梯度是在当前权重加上累计速度后的梯度

2.2 torch.optim.Adagrad

Adagrad算法相对SGD算法能够更加有效地收敛，能够在数据分布系数的场景，更好利用系数梯度的信息，我们计算梯度有： $\leftarrow \frac{1}{m} \nabla_{\boldsymbol{w}} \sum_{i} L\left(f\left(\boldsymbol{x}^{(i)} ; \boldsymbol{w}\right), \boldsymbol{y}^{(i)}\right)$ 累积平方梯度： $\leftarrow r+g \odot g$ 计算更新 $\Delta \boldsymbol{\theta} \leftarrow-\frac{\epsilon}{\delta+\sqrt{r}} \odot g$ 应用更新 $\theta \leftarrow \theta+\Delta \theta$ 通常Adagrad算法一开始是激励收敛的，后面慢慢就变成惩罚收敛，这也就导致了会出现学习绿收缩到太小而无法进行有效收敛的情况

2.3 torch.optim.RMSprop

RMSprop算法与Adagrad算法唯一的不同就在于累积平方梯度的方法不同，其累积平方梯度的方式为： $\leftarrow \rho r+(1-\rho) g \odot g$ 其实就是添加了一个衰减系数来控制历史信息获取多少，在该函数中同样可以配置动量因子momentum以及权重衰减系数weight_decay

2.4 torch.optim.Adam

Adam算法全称为adaptive moment estimation，Adam算法其实就是momentum和RMSporp的结合，其通过计算梯度的一阶矩估计和二阶矩估计而为不同的参数设计独立的自适应学习率，具体算法如下，同样先估计梯度： $\boldsymbol{g} \leftarrow \frac{1}{m} \nabla_{\boldsymbol{w}} \sum_{i} L\left(f\left(\boldsymbol{x}^{(i)} ; \boldsymbol{w}\right), \boldsymbol{y}^{(i)}\right)$ 然后是更新一阶矩估计，也就是momenturm项： $\leftarrow \rho_{1} s+\left(1-\rho_{1}\right) g$ 更新二阶矩估计,相当于二阶矩估计： $\leftarrow \rho_{2} r+\left(1-\rho_{2}\right) g \odot g$ 然后分别修正一阶矩偏差和二阶矩偏差 $\hat{\boldsymbol{s}} \leftarrow \frac{\boldsymbol{s}}{1-\rho_{1}^{t}}$ $\hat{\boldsymbol{r}} \leftarrow \frac{\boldsymbol{r}}{1-\rho_{2}^{t}}$ 然后逐元素计算更新 $\Delta \theta=-\epsilon \frac{\hat{\boldsymbol{s}}}{\sqrt{\hat{\boldsymbol{r}}}+\delta}$ 最后应用更新： $\theta \leftarrow \theta+\Delta \theta$ Adam算法的优势是适合解决大规模数据的参数优化问题，同时适用于非稳态目标

pytorch中还有的优化方法有Adadelta，Adamax，ASGD，LBFGS以及RProp

3. 损失函数

3.1 torch.nn.L1Loss

计算输入 $x$ 和目标 $y$ 之间的绝对值的平均值 $\operatorname{loss}(x, y)=1 / n \sum \mid x_{i}-y_{i}|$

3.2 torch.nn.MSELoss

计算输入 $x$ 和目标 $y$ 之间的均方误差 $\operatorname{loss}(x, y)=1 / n \sum\left(x_{i}-y_{i}\right)^{2}$

3.3 torch.nn.CrossEntropyLoss

用于多分类器的交叉熵损失 $\operatorname{loss}(x, \text { class })=-\log \frac{\exp (x[\text { class }])}{\left.\sum_{j} \exp (x[j])\right)} \quad=-x[\text { class }]+\log \left(\sum_{j} \exp (x[j])\right)$

pytorch中还有的损失函数有NLLLoss，KLDivLoss，BCELoss，MarginRankingLoss，HingeEmbeddingLoss，MultiLabelMarginLoss，SmoothL1Loss，SoftMarginLoss，MultiLabelSoftMarginLOss，CosineEmbeddingLoss，MultiMarginLoss

4. 初始化

4.1 torch.nn.init.uniform

从给定的上下界的均匀分布中生成值，然后填充入张量或者变量进行初始化

4.2 torch.nn.init.normal

从给定的均值和方差的正态分布中生成值，然后填充入张量或者变量进行初始化

4.3 torch.nn.init.constant

将给定的常量填充入张量或者变量进行初始化

4.4 torch.nn.init.xavier_uniform / torch.nn.init.xavier_normal

为了使得网络中信息更好的流动，每一层输出的方差应该尽量相同，这就是xavier算法的核心思想，对于一层卷积有
$y=w_{1} x_{1}+\cdots+w_{n_{i}} x_{n_{i}}+b$ 其中 $n_i$ 表示输入个数，根据概率统计知识我们有如下方差公式： $\operatorname{Var}\left(w_{i} x_{i}\right)=E\left[w_{i}\right]^{2} \operatorname{Var}\left(x_{i}\right)+E\left[x_{i}\right]^{2} \operatorname{Var}\left(w_{i}\right)+\operatorname{Var}\left(w_{i}\right) \operatorname{Var}\left(x_{i}\right)$ 特别地，当我们假设输入和权重都是0均值时有 $\operatorname{Var}\left(w_{i} x_{i}\right)=\operatorname{Var}\left(w_{i}\right) \operatorname{Var}\left(x_{i}\right)$ 进一步假设输入的 $x$ 和 $w$ 都是独立同分布，则有： $\operatorname{Var}(y)=n_{i} \operatorname{Var}\left(w_{i}\right) \operatorname{Var}\left(x_{i}\right)$ 于是，为了保证输入与输出方差一致，则应该有： $\operatorname{Var}\left(w_{i}\right)=\frac{1}{n_{i}}$ 对于一个多层网络，某一层的方差可以用累计的形式表达： $\operatorname{Var}\left[z^{i}\right]=\operatorname{Var}[x] \prod_{i^{\prime}=0}^{i-1} n_{i^{\prime}} \operatorname{Var}\left[W^{i^{\prime}}\right]$ 反向传播时具有类似的形式： $\operatorname{Var}\left[\frac{\partial \text { Cost }}{\partial s^{i}}\right]=\operatorname{Var}\left[\frac{\partial \text { Cost }}{\partial s^{d}}\right] \prod_{i^{\prime}=i}^{d} n_{i^{\prime}+1} \operatorname{Var}\left[W^{i^{\prime}}\right]$ 则为了保证前向传播和反向传播时每一层的方差一致，则应该满足 $\forall i, \quad n_{i} \operatorname{Var}\left[W^{i}\right]=1$ $\forall i, \quad n_{i+1} \operatorname{Var}\left[W^{i}\right]=1$ 但是实际中输入和输出的个数通常不相等，因此最终我们的权重方差应该满足： $\forall i, \quad \operatorname{Var}\left[W^{i}\right]=\frac{2}{n_{i}+n_{i+1}}$ 对于[a, b]区间中的均匀分布的方差为： $\operatorname{Var}=\frac{(b-a)^{2}}{12}$ 那么，满足xavier算法的均匀分布是 $\sim U\left[-\frac{\sqrt{6}}{\sqrt{n_{j}+n_{j+1}}}, \frac{\sqrt{6}}{\sqrt{n_{j}+n_{j+1}}}\right]$ 同理我们可知满足xavier算法的高斯分布是 $W\sim N\left[0, \frac{\sqrt{2}}{\sqrt{n_{j}+n_{j+1}}}\right]$

4.5 torch.nn.init.kaiming_uniform / torch.nn.init.kaiming_normal

上述xavier初始化的问题主要在只适用于线性激活函数，但实际上，对于深层神经网络来说，线性激活函数没有价值。kaiming算法就是针对是非线性的Relu激活函数设计的一种初始化方法。对于均值为0的输出来说，Relu激活函数会将小于零的部分都置为0，这样上述xavier初始化中均值为0的假设就不成立了，具体的推到可以参考论文Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification

pytorch中还有的初始化方式有eye，dirac，sparse

深度学习速通系列:LoRA微调是什么 Ven% 深度学习速通系列人工智能深度学习 python 机器学习 nlp
LoRA微调（Low-RankAdaptation）是一种用于大型预训练语言模型（LLM）的高效微调技术。它的核心思想是在不改变预训练模型权重的前提下，通过在模型的Transformer层中引入可训练的低秩矩阵来实现模型的微调。这种方法可以显著减少训练参数的数量，从而降低对计算资源的需求。LoRA微调的原理：LoRA微调方法建议冻结预训练模型的权重，并在每个Transformer块中注入可训练的低
torch.stack()方法在数据集构造中的应用大多_C pytorch 人工智能 python
torch.stack()是PyTorch中用于将多个张量沿着新维度进行堆叠的操作。在你的代码中，e1_encodings和e2_encodings是从每个句子中提取的和的向量，形状为[hidden_size]。当我们对它们使用torch.stack()时，多个向量会堆叠成一个新的二维张量，形状为[num_sentences,hidden_size]，其中num_sentences是句子的数量。如
基于深度学习的基因组数据分析 SEU-WYL 深度学习dnn 深度学习数据分析人工智能
基于深度学习的基因组数据分析利用深度学习技术来处理和分析基因组数据，帮助解决基因组学领域中一些复杂且具有挑战性的问题。这种方法已经在疾病预测、基因功能预测、变异检测、基因表达调控分析、个性化医疗等方面取得了显著进展。1.基因组数据分析的核心挑战基因组数据分析涉及以下主要挑战：高维数据与稀疏性：基因组数据通常包括数百万到数十亿个碱基对，数据维度非常高。同时，许多基因变异事件是稀有的，这种稀疏性使得数
Pytorch维度转换操作：view，reshape，permute，flatten函数详解 ghx3110 深度学习笔记 pytorch 维度转换操作
引言Pytorch中常见的维度转换函数有view,reshape,permute,flatten。本文将详细介绍这几个函数的作用与使用方式，并给出了具体的代码示例，希望能够帮助大家。常见的维度有四维：比如（batch,channel,height,width）；三维：比如（b,n,c）；二维：比如（h,w）。下面介绍如何使用上述函数进行维度之间的转换。1.view函数作用tensor.view()
基于深度学习的信号滤波：创新技术与应用挑战逼子歌深度学习神经网络信号滤波图像去噪卷积神经网络长短期记忆网络
一、引言1.1研究背景随着科技的不断发展，信号处理领域面临着越来越复杂的挑战。在众多信号处理技术中，基于深度学习的信号滤波技术逐渐崭露头角，成为研究的热点。基于深度学习的信号滤波在信号处理领域具有至关重要的地位。如今，我们生活在一个数据爆炸的时代，各种信号源不断产生大量的复杂数据。例如，在通信领域，信号常常受到噪声干扰，传统的滤波方法在处理复杂、非线性信号时可能效果不佳。而深度学习技术具有自动特征
pytorch计算网络参数量和Flops Mr_Lowbee PyTorch pytorch 深度学习人工智能
fromtorchsummaryimportsummarysummary(net,input_size=(3,256,256),batch_size=-1)输出的参数是除以一百万（/1000000）M，fromfvcore.nnimportFlopCountAnalysisinputs=torch.randn(1,3,256,256).cuda()flop_counter=FlopCountAna
Sora文本生成影像模型背后的创新原理与挑战 noVonN c语言深度学习算法区块链人工智能
引言随着人工智能技术的飞速发展，OpenAI作为行业领导者，在文本生成领域取得重大突破之后，近日又推出了其在影像生成领域的最新力作——Sora。这款模型将自然语言处理与计算机视觉技术相结合，旨在通过输入文本描述来快速创作出逼真的电影场景，为内容创作者提供了前所未有的艺术表达工具。然而，正如OpenAI所指出的那样，尽管Sora展现出了令人惊叹的创造力，但它在仿真复杂物理现象和理解具体事例因果关系方
Pytorch ResNet Fashion-Mnist hyhchaos
pytorch实现ResNetonFashion-MNISTfrom__future__importprint_functionimporttorchimporttimeimporttorch.nnasnnimporttorch.nn.functionalasFimporttorchvisionimporttorchvision.transformsastransformsfromtorchimp
ONNXRuntime与CUDA版本对应 zy_destiny 部署 YOLO onnxruntime onnX 部署 cuda python
onnxruntime-gpu版本可以说是一个非常简单易用的框架，因为通常用pytorch训练的模型，在部署时，会首先转换成onnx，而onnxruntime和onnx又是有着同一个爸爸，无疑，在op的支持上肯定是最好的。通常在安装onnxruntime时，需要将其版本与pytorch版本和CUDA版本进行对应，其中ONNXRuntime与CUDA版本对应关系表如下表所示。ONNXRuntimeC
【已解决】torch包下载缓慢烟花节已解决 pytorch 深度学习 python pip
方法一直接将PyTorch安装指引中的https://download.pytorch.org/whl替换为https://mirrors.aliyun.com/pytorch-wheels即可。这个是阿里云的镜像，如pip3installtorchtorchvisiontorchaudio--index-urlhttps://download.pytorch.org/whl/cu121改为这个，
MoveNet: PyTorch实现的轻量级人体姿态估计框架侯深业Dorian
MoveNet:PyTorch实现的轻量级人体姿态估计框架movenet.pytorch项目地址:https://gitcode.com/gh_mirrors/mo/movenet.pytorchMoveNet是一个基于PyTorch的人体姿态估计算法实现，由开发者fire717贡献至GitCode平台。该项目旨在提供一个高效、易用的解决方案，用于实时处理视频或图像中的人体动作识别。通过其强大的性
MoveNet PyTorch 项目教程邢琛高
MoveNetPyTorch项目教程movenet.pytorch项目地址:https://gitcode.com/gh_mirrors/mo/movenet.pytorch项目介绍MoveNet是一个超快速且精确的模型，用于检测人体的17个关键点。本项目是GoogleMoveNet的PyTorch实现，包含了训练代码和预训练模型。Google最近发布了预训练模型（tfjs或tflite），但这些
pytorh基础知识和函数的学习：torchvision.transforms() 深蓝海拓机器视觉和人工智能学习学习 pytorch
transforms是PyTorch的torchvision库中用于图像处理的一个模块。它提供了一组工具，用于在图像数据集上进行常见的预处理和数据增强操作，以便更好地训练深度学习模型。以下是一些常用的torchvision.transforms转换：基础图像转换：transforms.ToTensor():将PIL图像或NumPy数组转换为PyTorch的张量，并将像素值范围从[0,255]缩放到
使用PyTorch实现的DeepSpeech模型: 强大的语音识别利器毕艾琳
使用PyTorch实现的DeepSpeech模型:强大的语音识别利器deepspeech.pytorchSpeechRecognitionusingDeepSpeech2.项目地址:https://gitcode.com/gh_mirrors/de/deepspeech.pytorch在今天的数字化世界中，语音识别技术已成为人机交互的关键组成部分。deepspeech.pytorch是一个由Sea
深度学习驱动下的字符识别：挑战与创新逼子歌神经网络深度学习字符识别卷积神经网络图像处理特征提取
一、引言1.1研究背景深度学习在字符识别领域具有至关重要的地位。随着信息技术的飞速发展，对字符识别的准确性和效率要求越来越高。字符识别作为计算机视觉领域的一个重要研究方向，其主要目的是将各种形式的字符转换成计算机可识别的文本信息。近年来，深度学习技术在字符识别领域取得了显著的进展。国内研究者主要使用基于模板匹配的方法、基于统计模型的方法、基于神经网络的方法等各种方法进行字符识别研究。目前，国内各大
Adam优化器：深度学习中的自适应方法 2401_85743969 深度学习人工智能
引言在深度学习领域，优化算法是训练神经网络的核心组件之一。Adam（AdaptiveMomentEstimation）优化器因其自适应学习率调整能力而受到广泛关注。本文将详细介绍Adam优化器的工作原理、实现机制以及与其他优化器相比的优势。深度学习优化器概述优化器在深度学习中负责调整模型的参数，以最小化损失函数。常见的优化器包括SGD（随机梯度下降）、RMSprop、AdaGrad、AdaDelt
【pytorch】register_buffer的使用 Aha_aho pytorch 人工智能 python
这篇文章讲解很清晰，以下内容仅做补充，探讨哪些对象需要手动注册，哪些会自动注册。在PyTorch中，哪些对象会自动注册为模型的一部分取决于它们的类型以及你如何定义它们。下面列出不需要手动注册、会自动注册的几种情况：1.nn.Parameter自动注册：任何你在nn.Module中定义为nn.Parameter的张量都会自动注册为模型的参数。它们会被视为模型的可训练参数，并且会被包含在模型的stat
研1日记5 qq_55033799 人工智能深度学习
x=torch.tensor(x),numpy转tensor三维矩阵相加screen-Spid进入之前创建好的screentranspose()只能一次操作两个维度；permute()可以一次操作多维数据，且必须传入所有维度数，transpose()中的dim没有数的大小区分；permute()中的dim有数的大小区分PyTorch两大转置函数transpose()和permute(),以及Run
旧版中 pytorch.rfft 函数与新版 pytorch.fft.rfft 函数对应修改问题带鱼的鱼香肉丝 pytorch Python pytorch python fft
旧版中pytorch.rfft函数与新版pytorch.fft.rfft函数对应修改问题前言一、旧版pytorch.rfft()函数解释二、新版pytorch.fft.rfft()函数解释三、总结前言这两天整理谱池化操作，需要用到傅里叶变换这个函数。后来提升了pytorch的版本以后，发现之前的torch.rfft()函数在新版的pytorch中使用会报错，后来查阅资料，发现是新版的参数有些变动。
【深度学习实战】行人检测追踪与双向流量计数系统【python源码+Pyqt5界面+数据集+训练代码】YOLOv8、ByteTrack、目标追踪、双向计数、行人检测追踪、过线计数阿_旭 AI应用软件开发实战深度学习实战深度学习 python 行人检测行人追踪过线计数
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
【PyTorch】常用网络层layers总结遥感小萌新 python 深度学习 pytorch 人工智能 python 深度学习
文章目录前言一、ConvolutionLayers二、PoolingLayers三、PaddingLayers总结前言PyTorch中网络搭建主要是通过调用layers实现的，这篇文章总结了putorch中最常用的几个网络层接口及其参数。一、ConvolutionLayerspytorch官方文档介绍了众多卷积层算法，以最新的pytorch2.4为例，针对处理的数据维度不同，有如下卷积层layer
【激活函数总结】Pytorch中的激活函数详解： ReLU、Leaky ReLU、Sigmoid、Tanh 以及 Softmax 阿_旭深度学习知识点 pytorch 人工智能 python 激活函数深度学习
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体检测系统开发】5.【图片风格快速迁移软件开发】6.【人脸表表情识别系统】7.
【PyTorch】使用容器(Containers)进行网络层管理(Module) 遥感小萌新深度学习 python pytorch 人工智能 python 深度学习
文章目录前言一、Sequential二、ModuleList三、ModuleDict四、ParameterList&ParameterDict总结前言当深度学习模型逐渐变得复杂，在编写代码时便会遇到诸多麻烦，此时便需要Containers的帮助。Containers的作用是将一部分网络层模块化，从而更方便地管理和调用。本文介绍PyTorch库常用的nn.Sequential，nn.ModuleLi
利用 pip 安装 PyTorch 问题记录 yyywxk #软件安装使用问题 pip pytorch 人工智能 python
目录1.pytorch源下载安装缓慢2.ERROR:HTTPerror4031.pytorch源下载安装缓慢利用pip安装pytorch时，官方源下载速度十分缓慢：pipinstalltorch==2.1.1torchvision==0.16.1torchaudio==2.1.1--index-urlhttps://download.pytorch.org/whl/cu118可以考虑换源：pipi
pytorch训练后pt模型中保存内容详解(yolov8n.pt为例) yueguang8 yolo算法 pytorch YOLO 人工智能
在PyTorch中，.pt模型文件通常包含以下几类数据：模型参数：存储模型的权重和偏置参数。优化器状态：包含优化器的状态信息，以便在恢复训练时能够从中断的地方继续。训练状态：一些训练过程中的信息，例如当前的epoch数和训练进度。其他元数据：包括模型的配置、训练时使用的超参数等。在讲解pytorchpt(pth)文件中保存了什么内容之前，需要先了解pt在保存时保存了那些参数。以YOLO系列pt保存
深度学习之sigmoid函数介绍 yueguang8 人工智能深度学习人工智能
1.基本概念Sigmoid函数，也称为Logistic函数，是一种常用的数学函数，其数学表达式为：其中，e是自然对数的底数，Zj是输入变量。Sigmoid函数曲线如下所示：计算示例：原始输出结果Zj：[-0.6,1.4,2.5]使用Sigmoid函数后输出为：[0.35,0.8,0.92]2.Sigmoid函数特点Sigmoid函数具有以下特点：值域限定在(0,1)之间：Sigmoid函数的输出范
Deep learning for Computer Vision with Python（1）从零开始入门计算机视觉 Hazelyu27 计算机视觉大数据计算机视觉深度学习
本书的内容分成三个部分：1.初始阶段初始阶段学习：机器学习、神经网络、卷积神经网络、建立数据集。2.实践阶段实践阶段：深入学习深度学习，理解先进技术，发现最佳实践方式。3.图像网络阶段完成计算机视觉领域的经验积累。使用大规模数据集和真实图片案例作为数据集，包括年龄和性别预测，交通工具模型识别。本书提供了对应网站：http://pyimg.co/fnkxk本文介绍前两章内容：基本介绍和深度学习简介。
实训day4 yolo1代码运行 Hazelyu27
yolo1代码运行今天主要是在pycharm上运行pytorch的yolo1训练和测试代码。主要遇到的问题：1.训练文件路径的修改，开始没有找到tmp_file文件，就在该文件夹下创建了这个txt文件，但是发现：ifisinstance(list_file,list):#Catmultiplelistfilestogether.#Thisisespeciallyusefulforvoc07/voc
使用matlab的热门问题七十二五值得关注 matlab 开发语言青少年编程算法经验分享
MATLAB广泛应用于科学计算、数据分析、信号处理、图像处理、机器学习等多个领域，因此热门问题也涵盖了这些方面。以下是一些可能被认为当前最热门的MATLAB问题：深度学习与神经网络：如何使用MATLAB的深度学习工具箱（DeepLearningToolbox）来构建和训练神经网络？如何利用MATLAB进行图像识别、语音识别或自然语言处理等深度学习应用？数据分析与可视化：如何使用MATLAB进行大数
深度学习目标检测入门COCO数据集日暮途远z 深度学习目标检测人工智能
常见数据集类型：COCO数据集：Pytorch加载COCO数据集：COCO数据集的读取COCO_dataset=torchvision.datasets.CocoDetection(root="./dataset/val2017",annFile="./instances_val2017/instances_val2017.json")root(strorpathlib.Path)–Rootdir
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1

Pytorch Document学习笔记