TJUTCM-策士之九尾

[深度学习实战]基于PyTorch的深度学习实战(上)[变量、求导、损失函数、优化器]

一、前言
二、深度学习框架——PyTorch
- 2.1 PyTorch介绍
- 2.2 Python安装详解
- 2.3 PyTorch安装详解
三、变量
四、求导
五、损失函数
- 5.1 nn.L1Loss
- 5.2 nn.SmoothL1Loss
- 5.3 nn.MSELoss
- 5.4 nn.BCELoss
- 5.5 nn.CrossEntropyLoss
- 5.6 nn.NLLLoss
- 5.7 nn.NLLLoss2d
六、优化器Optim
- 6.1 SGD
- - 6.1.1 用法
  - 6.1.2 参数
  - 6.1.3 好处
- 6.2 RMSprop
- - 6.2.1 具体实现
  - 6.2.2 每步迭代过程
  - 6.2.3 用法
  - 6.2.4 参数
- 6.3 Adagrad
- - 6.3.1 具体实现
  - 6.3.2 每步迭代过程
  - 6.3.3 优点
  - 6.3.4 缺点
  - 6.3.5 用法
  - 6.3.6 参数
- 6.4 Adadelta
- - 6.4.1 用法
  - 6.4.2 参数
- 6.5 Adam
- - 6.5.1 具体实现
  - 6.5.2 每步迭代过程
  - 6.5.3 用法
  - 6.5.4 参数
- 6.6 Adamax
- - 6.6.1 参数

PyTorch——开源的Python机器学习库

一、前言

用了Matlab搭建神经网络才愈发感觉"人生苦短，我用PyTorch“是多么正确。毕竟新的神经网络架构还是得自己一点点敲，现在是一点都笑不出来了，指望Matlab提供的老框架和训练算法也做不出什么算法方法的突破，顶多就是在实现功能上方便点罢了。
本博文要求读者有一定的Python编程基础！，对机器学习和神经网络有一定的了解！。如果是零基础学习人群，请参看我之前的Python基础语法博文和人工智能相关博文。读完它们不会花费你太多的时间，并且如果你能做到简单地阅览完这些博文，就完全有足够的知识储备来彻底搞懂这篇博文的全部内容了。
以下贴上我之前写的关于神经网络相关的博文，Python相关的也可以去我的博客主页去找。
[深度学习入门]基于Python的理论与实现[感知机、神经网络、误差反向传播法及相关技巧]

[深度学习入门]什么是神经网络？[神经网络的架构、工作、激活函数]

二、深度学习框架——PyTorch

2.1 PyTorch介绍

PyTorch是 Facebook 发布的一款深度学习框架，和Tensorflow，Keras，Theano等其他深度学习框架都不同。作为动态计算图模式，其应用模型支持在运行过程中根据运行参数动态改变，而其他几种框架都是静态计算图模式，其模型在运行之前就已经确定。
Python模块可以通过pip安装，临时使用时可以使用下述命令：

pip install pythonModuleName -i
https://pypi.douban.com/simple

也可以永久更改：/root/.pip/pip.conf：

[global]
index-url = https://pypi.douban.com/simple

2.2 Python安装详解

安装Python就略去不写了，都是可视化界面也没什么可说的。安装后查看当前版本：

[root@iZ25ix41uc3Z ~]# python --version
Python 3.10.9

下载 setuptools：

wget --no-check-certificate 
http://pypi.python.org/packages/source/s/setuptools/setuptools-
解压之后进入目录setuptools-0.6c11
安装python setup.py install

安装 pip，和 setuptools 过程类似：

wget --no-check-certificate 
https://github.com/pypa/pip/archive/1.5.5.tar.gz
解压之后进入目录pip-1.5.5
安装python setup.py install

看看 pip 安装是否成功，执行：

pip list

如果显示的不是上方的画面，则我们先安装 openssl：

yum install openssl openssl-devel -y

然后再重新安装 python，别的不用重新安装了。

[root@iZ25ix41uc3Z Python-3.10.9]# pip list
pip (1.5.4)
setuptools (27.3.0)
wsgiref (0.1.2)

最后我们就可以安装 numpy，scipy 等科学计算库了。

pip install numpy
pip install scipy

最后验证一下 numpy：

大功告成，如此一来我们已经成功安装 numpy。

2.3 PyTorch安装详解

先试试看 pip 安装能不能成功。输入命令 pip install pytorch，显示结果如下：

看来PyTorch不支持pip安装，这里提示到 pytorch.org 下载安装，同时，浏览器自动打开网址：
http://pytorch.org/#pip-install-pytorch
跟着上面的安装步骤安装就是了，这里也可以去网上找找安装教程。因为这里不是我们的重点，讲多了也没什么意思。
安装完成后，我们输入命令 python，进入 python 交互环境，写一段 pytorch 程序验证一下是不是安装成功了，这段代码调用 torch 的ones 方法，看看能不能正常显示结果：

看来没什么问题，安装成功了。下面，我们来一步步学习 pytorch 吧。

三、变量

先看看 Tensor，pytorch 中的数据都是封装成 Tensor 来引用的，Tensor实际上就类似于 numpy 中的数组，两者可以自由转换。
我们先生成一个3*4维的数组：

import torch
x = torch.Tensor(3,4)
print("x Tensor: ",x)

可以看到 torch.Tensor() 方法生成制定维度的随机数。
下面看看 Variable 的基本操作，引用 Variable：

import torch
from torch.autograd import Variable
x=Variable(torch.Tensor(2,2))
print("x variable: ",x)

Variable 不光包含了数据，还包含了其他东西，那么，还包含什么东西呢？
默认 Variable 是有导数 grad 的，x.data 是数据，这里 x.data 就是 Tensor。x.grad 是计算过程中动态变化的导数。

print ("x.data: ",x.data, ",x.grad: ",x.grad)

此时 Variable 还未进行计算，因此 x.grad 为 None。

四、求导

神经网络中的求导的作用是用导数对神经网络的权重参数进行调整。
Pytorch 中为求导提供了专门的包，包名叫autograd。如果用autograd.Variable 来定义参数，则 Variable 自动定义了两个变量：data代表原始权重数据；而 grad 代表求导后的数据，也就是梯度。每次迭代过程就用这个 grad 对权重数据进行修正。

import torch
from torch.autograd import Variable
x = Variable(torch.ones(2, 2), requires_grad=True)
print(x)

输出为：

y=x+2
print(y)

输出为：

z = y * y * 3
out = z.mean()
print(z, out)

输出为：

out.backward()

反向传播，也就是求导数的意思。输出 out 对 x 求导：

print(x.grad)

4.5 是怎么算出来的呢，从前面的公式可以看出 z=(x+2) * (x+2) * 3，它的导数是 3 * (x+2) / 2，当 x=1 时导数的值就是 3 * (1+2) / 2=4.5，和 pytorch 计算得出的结果是一致的。
权值更新方法：

weight = weight + learning_rate * gradient

learning_rate = 0.01
for f in model.parameters():
f.data.sub_(f.grad.data * learning_rate)

learning_rate 是学习速率，多数时候就叫做 lr，是学习步长，用步长 * 导数就是每次权重修正的 delta 值，lr 越大表示学习的速度越快，相应的精度就会降低。

五、损失函数

损失函数，又叫目标函数，是编译一个神经网络模型必须的两个参数之一。另一个必不可少的参数是优化器。
损失函数是指用于计算标签值和预测值之间差异的函数，在机器学习过程中，有多种损失函数可供选择，典型的有距离向量，绝对值向量等。

上图是一个用来模拟线性方程自动学习的示意图。粗线是真实的线性方程，虚线是迭代过程的示意，w1 是第一次迭代的权重，w2 是第二次迭代的权重，w3 是第三次迭代的权重。随着迭代次数的增加，我们的目标是使得 wn 无限接近真实值。
那么怎么让 w 无限接近真实值呢？其实这就是损失函数和优化器的作用了。图中 1/2/3 这三个标签分别是 3 次迭代过程中预测 Y 值和真实 Y 值之间的差值（这里差值就是损失函数的意思了，当然了，实际应用中存在多种差值计算的公式），这里的差值示意图上是用绝对差来表示的，那么在多维空间时还有平方差，均方差等多种不同的距离计算公式，也就是损失函数了。
这里示意的是一维度方程的情况，扩展到多维度，就是深度学习的本质了。
下面介绍几种常见的损失函数的计算方法，pytorch 中定义了很多类型的预定义损失函数，需要用到的时候再学习其公式也不迟。
我们先定义两个二维数组，然后用不同的损失函数计算其损失值。

import torch
from torch.autograd import Variable
import torch.nn as nn
import torch.nn.functional as F
sample = Variable(torch.ones(2,2))
a=torch.Tensor(2,2)
a[0,0]=0
a[0,1]=1
a[1,0]=2
a[1,1]=3
target = Variable (a)

sample 的值为：[[1,1],[1,1]]。
target 的值为：[[0,1],[2,3]]。

5.1 nn.L1Loss

L1Loss 计算方法很简单，取预测值和真实值的绝对误差的平均数即可。

criterion = nn.L1Loss()
loss = criterion(sample, target)
print(loss)

最后的结果为1，计算步骤为：
先计算绝对差总和：|0-1|+|1-1|+|2-1|+|3-1|=4；
然后再平均：4/4=1。

5.2 nn.SmoothL1Loss

SmoothL1Loss 也叫作 Huber Loss，误差在 (-1,1) 上是平方损失，其他情况是 L1 损失。

criterion = nn.SmoothL1Loss()
loss = criterion(sample, target)
print(loss)

最后结果是：0.625。

5.3 nn.MSELoss

平方损失函数。其计算公式是预测值和真实值之间的平方和的平均数。

criterion = nn.MSELoss()
loss = criterion(sample, target)
print(loss)

最后结果是：1.5。

5.4 nn.BCELoss

二分类用的交叉熵，其计算公式较复杂，这里主要是有个概念即可，一般情况下不会用到。

criterion = nn.BCELoss()
loss = criterion(sample, target)
print(loss)

最后结果是：-50。

5.5 nn.CrossEntropyLoss

交叉熵损失函数

该公式用的也较多，比如在图像分类神经网络模型中就常常用到该公式。

criterion = nn.CrossEntropyLoss()
loss = criterion(sample, target)
print(loss)

最后结果是：2.0794。
看文档我们知道 nn.CrossEntropyLoss 损失函数是用于图像识别验证的，对输入参数有各式要求，这里有这个概念就可以了，在后续的图像识别方向中会有正确的使用方法。

5.6 nn.NLLLoss

负对数似然损失函数（Negative Log Likelihood）

在前面接上一个 LogSoftMax 层就等价于交叉熵损失了。注意这里的xlabel 和上个交叉熵损失里的不一样，这里是经过 log 运算后的数值。
这个损失函数一般也是用在图像识别模型上。

criterion = F.nll_loss()
loss = criterion(sample, target)
print(loss)
loss=F.nll_loss(sample,target)

最后结果为报错，看来不能直接调用。
Nn.NLLLoss 和 nn.CrossEntropyLoss 的功能是非常相似的。通常都是用在多分类模型中，实际应用中我们一般用 NLLLoss 比较多。

5.7 nn.NLLLoss2d

和上面类似，但是多了几个维度，一般用在图片上。

input, (N, C, H, W)
target, (N, H, W)

比如用全卷积网络做分类时，最后图片的每个点都会预测一个类别标签。

最后结果报错，看来不能直接这么用。

六、优化器Optim

优化器用通俗的话来说就是一种算法，是一种计算导数的算法。
各种优化器的目的和发明它们的初衷其实就是能让用户选择一种适合自己场景的优化器。
优化器的最主要的衡量指标就是优化曲线的平稳度，最好的优化器就是每一轮样本数据的优化都让权重参数匀速的接近目标值，而不是忽上忽下跳跃的变化。因此损失值的平稳下降对于一个深度学习模型来说是一个非常重要的衡量指标。
pytorch 的优化器都放在 torch.optim 包中。常见的优化器有：SGD，Adam，Adadelta，Adagrad，Adamax 等。如果需要定制特殊的优化器，pytorch 也提供了定制化的手段，不过这里我们就不去深究了，毕竟预留的优化器的功能已经足够强大了。

6.1 SGD

SGD 指stochastic gradient descent，即随机梯度下降，随机的意思是随机选取部分数据集参与计算，是梯度下降的 batch 版本。SGD 支持动量参数，支持学习衰减率。SGD 优化器也是最常见的一种优化器，实现简单，容易理解。

6.1.1 用法

optimizer = optim.SGD(model.parameters(), lr = 0.01, momentum=0.9)

6.1.2 参数

lr：大于 0 的浮点数，学习率。
momentum：大于 0 的浮点数，动量参数。
parameters：Variable 参数，要优化的对象。

对于训练数据集，我们首先将其分成 n 个 batch，每个 batch 包含 m 个样本。我们每次更新都利用一个 batch 的数据 ，而非整个训练集，即：

xt+1=xt+Δxt
Δxt=-ηgt

其中，η 为学习率，gt 为 x 在 t 时刻的梯度。

6.1.3 好处

这么做的好处在于：
（1）当训练数据太多时，利用整个数据集更新往往时间上不现实。batch的方法可以减少机器的压力，并且可以更快地收敛。
（2）当训练集有很多冗余时（类似的样本出现多次），batch 方法收敛更快。以一个极端情况为例，若训练集前一半和后一半梯度相同，那么如果前一半作为一个 batch，后一半作为另一个 batch，那么在一次遍历训练集时，batch 的方法向最优解前进两个 step，而整体的方法只前进一个 step。

6.2 RMSprop

RMSProp 通过引入一个衰减系数，让 r 每回合都衰减一定比例，类似于Momentum 中的做法，该优化器通常是面对递归神经网络时的一个良好选择。

6.2.1 具体实现

需要：全局学习速率 ϵ，初始参数 θ，数值稳定量 δ，衰减速率 ρ。
中间变量：梯度累计量 r（初始化为 0）。

6.2.2 每步迭代过程

（1）从训练集中的随机抽取一批容量为 m 的样本 {x1,…,xm} 以及相关的输出 yi 。
（2）计算梯度和误差，更新 r，再根据 r 和梯度计算参数更新量 。

6.2.3 用法

keras.optimizers.RMSprop(lr=0.001, rho=0.9, epsilon=1e-06)

6.2.4 参数

lr：大于 0 的浮点数，学习率。
rho：大于 0 的浮点数。
epsilon：大于 0 的小浮点数，防止除 0 错误。

6.3 Adagrad

AdaGrad 可以自动变更学习速率，只是需要设定一个全局的学习速率 ϵ，但是这并非是实际学习速率，实际的速率是与以往参数的模之和的开方成反比的。也许说起来有点绕口，不过用公式来表示就直白的多：

其中 δ 是一个很小的常量，大概在 10-7，防止出现除以 0 的情况.。

6.3.1 具体实现

需要：全局学习速率 ϵ，初始参数 θ，数值稳定量 δ 。
中间变量：梯度累计量 r（初始化为 0） 。

6.3.2 每步迭代过程

（1） 从训练集中的随机抽取一批容量为 m 的样本 {x1,…,xm} 以及相关。
（2）计算梯度和误差，更新r，再根据 r 和梯度计算参数更新量 。

6.3.3 优点

能够实现学习率的自动更改。如果这次梯度大，那么学习速率衰减的就快一些；如果这次梯度小，那么学习速率衰减的就慢一些。

6.3.4 缺点

仍然要设置一个变量 ϵ 。
经验表明，在普通算法中也许效果不错，但在深度学习中，深度过深时会造成训练提前结束。

6.3.5 用法

keras.optimizers.Adagrad(lr=0.01, epsilon=1e-06)

6.3.6 参数

lr：大于 0 的浮点数，学习率。
epsilon：大于 0 的小浮点数，防止除 0 错误。

6.4 Adadelta

Adagrad 算法存在三个问题：
(1)其学习率是单调递减的，训练后期学习率非常小。
(2)其需要手工设置一个全局的初始学习率。
(3)更新 xt 时，左右两边的单位不统一。
Adadelta 针对上述三个问题提出了比较漂亮的解决方案。
首先，针对第一个问题，我们可以只使用 adagrad 的分母中的累计项离当前时间点比较近的项，如下式：

这里ρ 是衰减系数 ，通过这个衰减系数，我们令每一个时刻的 gt 随时间按照 ρ 指数衰减，这样就相当于我们仅使用离当前时刻比较近的gt信息，从而使得还很长时间之后，参数仍然可以得到更新。
针对第三个问题，其实 sgd 跟 momentum 系列的方法也有单位不统一的问题。sgd、momentum 系列方法中：

类似的，adagrad 中，用于更新 Δx 的单位也不是 x 的单位，而是 1。
而对于牛顿迭代法：

其中 H 为 Hessian 矩阵，由于其计算量巨大，因而实际中不常使用。其单位为：

注意，这里f 无单位 。因而，牛顿迭代法的单位是正确的。
所以，我们可以模拟牛顿迭代法来得到正确的单位。注意到：

这里，在解决学习率单调递减的问题的方案中，分母已经是 ∂f/∂x 的一个近似了。这里我们可以构造 Δx 的近似，来模拟得到 H-1 的近似，从而得到近似的牛顿迭代法。具体做法如下：

可以看到，如此一来adagrad 中分子部分需要人工设置的初始学习率也消失了 ，从而顺带解决了上述的第二个问题。

6.4.1 用法

keras.optimizers.Adadelta(lr=1.0, rho=0.95, epsilon=1e-06)

建议保持优化器的默认参数不变。

6.4.2 参数

lr：大于 0 的浮点数，学习率。
rho：大于 0 的浮点数。
epsilon：大于 0 的小浮点数，防止除 0 错误。

6.5 Adam

Adam 是一种基于一阶梯度来优化随机目标函数的算法。
Adam 这个名字来源于 adaptive moment estimation，自适应矩估计。概率论中矩的含义是：如果一个随机变量 X 服从某个分布，X 的一阶矩是E(X)，也就是样本平均值，X 的二阶矩就是 E(X^2)，也就是样本平方的平均值。
Adam 算法根据损失函数对每个参数的梯度的一阶矩估计和二阶矩估计动态调整针对于每个参数的学习速率。Adam 也是基于梯度下降的方法，但是每次迭代参数的学习步长都有一个确定的范围，不会因为很大的梯度导致很大的学习步长，参数的值比较稳定。
Adam（Adaptive Moment Estimation）本质上是带有动量项的 RMSprop，它利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率。Adam 的优点主要在于经过偏置校正后，每一次迭代学习率都有个确定范围，使得参数比较平稳。

6.5.1 具体实现

需要:步进值 ϵ，初始参数 θ，数值稳定量 δ，一阶动量衰减系数 ρ1，二阶动量衰减系数 ρ2 。
其中几个取值一般为：δ=10-8,ρ1=0.9,ρ2=0.999 。
中间变量：一阶动量 s，二阶动量 r，都初始化为 0 。

6.5.2 每步迭代过程

（1）从训练集中的随机抽取一批容量为 m 的样本 {x1,…,xm} 以及相关的输出 yi 。
（2）计算梯度和误差，更新 r 和 s，再根据 r 和 s 以及梯度计算参数更新量 。

6.5.3 用法

keras.optimizers.Adam(lr=0.001, beta_1=0.9, beta_2=0.999, epsilon=1e-08)

6.5.4 参数

lr：大于 0 的浮点数，学习率。
beta_1/beta_2：浮点数， 0 epsilon：大于 0 的小浮点数，防止除0错误。

6.6 Adamax

keras.optimizers.Adamax(lr=0.002, beta_1=0.9, beta_2=0.999, epsilon=1e-08)

Adamax 优化器的方法是基于无穷范数的 Adam 方法的变体。

6.6.1 参数

lr：大于 0 的浮点数，学习率。
beta_1/beta_2：浮点数， 0 epsilon：大于 0 的小浮点数，防止除 0 错误。

你可能感兴趣的:(人工智能,深度学习,pytorch,人工智能,机器学习,python,神经网络,numpy)

python在线编辑器-在线编译或编辑Python的5个最佳工具编程大乐趣
离线Python编辑器和编译器都具有许多功能，但是在线编译器通常在功能上受到限制，并试图满足特定需求而不是满足所有需求，其中在线编译大多数是免费的，所以也受到开发者的热爱。在本文中，我们将浏览各种狂野的在线Python编译器，其中大多数是免费的，我们还列出了一些，它们是有价的，主要用于大型项目开发。在线Python编译器的功能和使用？通常提供的功能范围从简单的外壳到功能齐全的PythonIDE。在
poetry使用经验汇总 enjoy编程程序员实用工具集合 python poetry virtualenv 依赖
什么是poetryPoetry是一个Python依赖管理和打包工具，它旨在解决Python项目中常见的依赖问题，提供更简洁、更可靠的依赖管理方式。以下是Poetry的一些主要功能和特点的总结：依赖解析：Poetry使用pyproject.toml文件来管理项目依赖，它能够自动解析依赖关系，确保依赖的一致性和可重复性。虚拟环境：Poetry为每个项目创建独立的虚拟环境，避免了不同项目之间的依赖冲突。
在亚马逊云科技上通过LangChain ReAct Agent开发金融多模态数据AI分析中台佛州小李哥 AWS技术科技 langchain 人工智能云计算亚马逊云科技 aws 数据分析
项目简介：小李哥将继续每天介绍一个基于亚马逊云科技AWS云计算平台的全球前沿AI技术解决方案，帮助大家快速了解国际上最热门的云计算平台亚马逊云科技AWSAI最佳实践，并应用到自己的日常工作里。本次介绍的是如何在亚马逊云科技机器学习托管服务AmazonSageMaker上搭建一个多模态LangChainAgent，通过ReAct逻辑让Agent通过AmazonBedrockAI模型托管服务上的大模型
大模型蒸馏与大模型微调技术有啥差别? kcarly 大模型知识乱炖杂谈大模型蒸馏大模型微调大模型 AI
大模型蒸馏与大模型微调是当前人工智能领域中两种重要的技术手段，它们在模型优化、性能提升和资源利用方面各有特点。以下将从定义、技术原理、应用场景及优缺点等方面对这两种技术进行深入对比。一、定义与基本概念大模型蒸馏（KnowledgeDistillation）蒸馏是一种将大型复杂模型（教师模型）的知识迁移到小型模型（学生模型）的技术。通过训练学生模型模仿教师模型的行为，实现模型压缩和性能保留的目标。蒸
DeepSeek大模型技术深度解析：揭开Transformer架构的神秘面纱不一样的信息安全网络杂烩 AI DeepSeek
摘要DeepSeek大模型由北京深度求索人工智能基础技术研究有限公司开发，基于Transformer架构，具备卓越的自然语言理解和生成能力。该模型能够高效处理智能对话、文本生成和语义理解等复杂任务，标志着人工智能在自然语言处理领域的重大进展。关键词DeepSeek模型,Transformer架构,自然语言,智能对话,文本生成,语义理解一、DeepSeek大模型的架构解析1.1DeepSeek大模型
Python Poetry 的使用 YOUFDJ python linux 服务器 Python
PythonPoetry的使用PythonPoetry是一个用于管理Python项目依赖的工具。它提供了一个简洁的界面，使得创建、发布和管理Python包变得更加容易。本文将介绍如何安装Poetry，并使用它来创建一个新的Python项目并管理其依赖关系。安装Poetry首先，我们需要安装Poetry。可以通过在命令行中运行以下命令来安装Poetry：curl-sSLhttps://install
几款语言python在线编辑器 Stestack python 编辑器开发语言
在当今数字化时代，编程已成为一项不可或缺的技能。Python作为一种简单易学且功能强大的编程语言，受到了广大编程爱好者和专业开发人员的青睐。为了方便大家随时随地编写和运行Python代码，市面上涌现了许多优秀的在线Python编辑器。本文将为您推荐几款目前非常火爆的Python在线编辑器。1、LightlyPythonIDE支持在线编辑、编译、运行Python代码。它适用于任何操作系统，用户只需打
[python]poetry安装和使用 FL1623863129 Pytorch python
Python新建Poetry环境一、安装Poetry：1、windows直接安装：(Invoke-WebRequest-Urihttps://install.python-poetry.org-UseBasicParsing).Content|python-2、pip安装pipinstallpoetry二、创建项目1、指定虚拟环境存放目录poetryconfigvirtualenvs.pathD:
《DeepSeek-R1 问世，智能搜索领域迎来新变革》黑金IT 智能搜索
DeepSeek-R1是由DeepSeek公司开发的一款创新型人工智能模型，自2024年5月7日发布以来，迅速在AI领域引起广泛关注。该模型凭借其卓越的语言理解能力、高效的数据处理能力、自适应学习能力、高安全性与可靠性以及广泛的应用场景与拓展性，在众多人工智能模型中脱颖而出。DeepSeek-R1的核心特点强大的语言理解能力：DeepSeek-R1采用先进的深度学习算法，能够精准解析复杂的语义结构
AI绘画关键词（咒语）分析与热点研究集eee AI作画 midjourney chatgpt 人工智能 prompt text2img stable diffusion
语义文本图像生成技术关键词分析与热点研究一、研究背景与研究意义随着深度学习的发展，语义文本到图像的生成技术已经取得长足进步，AI绘画也因此快速崛起。只需输入关键词，AI系统就能自动生成符合语义描述的图像，这一技术的出现,使绘画的创作方式发生革命性变化。目前主流的AI绘画模型有Midjourney、Stablediffusion和文心一格等，其使用方式多为输入一段含有图片描述的“prompt（指令）
Python连接MinIO进阶教程：文件类型指定、上传与获取预览链接北海yy python 前端服务器
文章目录概要1.指定文件内容类型2.获取文件的预览链接（PresignedURL）使用fput_object上传文件4.完整示例与总结概要在上一篇文章中，我们介绍了如何使用Python连接MinIO服务器，并进行了基本的文件上传和下载操作。这次，我们将深入探讨一些进阶功能，包括在上传文件时指定内容类型（Content-Type）、获取文件的预览链接（PresignedURL），以及处理文件类型猜测
【ProxyBroker】用Python打破网络限制的利器山河不见老 python python 开发语言
ProxyBroker1.什么是ProxyBroker2.ProxyBroker的功能3.ProxyBroker的优势4.ProxyBroker的使用方法5.ProxyBroker的应用场景6.结语项目地址：1.什么是ProxyBrokerProxyBroker是一个开源工具，它可以异步地从多个来源找到公共代理，并同时对它们进行检查。在当今互联网世界中，隐私保护和访问限制已经成为了许多人关注的焦点
【Healpix】python一种用于将球面划分为均匀区域的技术山河不见老 python python 开发语言
Healpix1、简介2、Healpix的基本原理3、Healpix的优点4、安装及使用4.1安装healpy4.2创建Healpix地图4.3读取和写入Healpix数据4.4数据插值5、案例5.1案例一：宇宙微波背景辐射（CMB）分析5.2案例二：星系分布分析5.3案例三：天文图像处理6、结论1、简介在天文学和宇宙学中，Healpix（HierarchicalEqualAreaisoLatit
【Pydantic】Python 数据验证入门山河不见老 python 数据处理 python 运维开发
Pydantic1.什么是Pydantic?2.安装3.基础使用3.1创建基础模型3.2数据验证3.3嵌套模型4.常用验证规则4.1基础验证规则4.2列表验证4.3自定义验证器4.4条件验证4.5常用验证类型5.实际应用示例5.1API请求验证5.2配置管理6.小技巧6.1.数据转换:6.2错误处理:1.什么是Pydantic?Pydantic是一个功能强大的Python数据验证库，它通过Pyth
ajax实现动态及时刷新表格数据_如何利用Python3和PyQt5来实现控件数据动态刷新... weixin_39904116
最近笔者在做一个pyqt5的界面，由于在日常生活中，一些实际运用的场合都需要对数据进行实时的刷新，例如对某个数值的监控，水温，室温的监控等等，都需要实时的刷新控件显示的数据。对于实现这样的一种功能，pyqt5在面板生成的同时就固定住了UI中的数据，例如我们产生一个QLineEdit控件，然后布局在面板上，但是控件中的数据是固定的，如果这个数据是实时更新的，想要改变空间中的数据时，就要去刷新面板，p
清华镜像安装 Jupyter 并一键启动外网访问时光旅人01号 jupyter 网络 linux python 神经网络
1.安装JupyterNotebook由于国内访问官方Python包源较慢，我们将使用清华大学的镜像源加速安装过程。1.1配置清华镜像源首先，在安装Jupyter之前，建议将pip配置为使用清华大学的镜像源，这样可以加速Python包的下载速度。创建或编辑pip配置文件（~/.pip/pip.conf或C:\Users\pip\pip.ini）并添加以下内容：index-url=https://p
【OpenGL】使用 python + Qt + OpenGL 的现代渲染无水先生 3D图形渲染和OpenGL编程 python qt 计算机图形学
伴随资源目录一、说明二、关于PyQt6.x2.1QOpenGLWidget详细说明2.2绘画技巧三、PyOpenGL四、OpenGL管线五、Python集成开发环境5.1Emacs配置5.2pycharm环境六、你好，OpenGL！七、QGL控件八、平截头体.svg九、定义几何9.1立即模式与保留模式9.2使用VBO定义Cube十、渲染立方体十一、渲染循环十二、添加旋转滑块一、说明在本教程中，我们
Python实现链接MinIO，并将文件数据从MinIO批量下载并保存到本地写python的鑫哥 Python课堂 python MinIO 文件下载数据存储存储桶 Buckets 文件夹下载
前言本文是该专栏的第43篇，后面会持续分享python的各种干货知识，值得关注。MinIO是一个高性能的对象存储服务，它兼容亚马逊S3云存储服务接口，非常适合于存储大容量非结构化的数据，比如说“图片、视频、日志文件、备份数据和容器/虚拟机镜像”等。MinIO原生支持Kubernetes，可以用于构建云存储服务。MinIO可以在标准硬件上运行，非常适合私有云和边缘计算场景。MinIO提供了存储桶级粒
CondaValueError: Malformed version string ‘~‘: invalid character(s). 椰椰荔枝糖 python conda
这个错误通常表示conda命令中使用了无效的版本字符串，其中包含了不允许的字符。在这种情况下，提到了波浪号~，它可能被解释为无效字符。尝试使用一个有效的版本号来安装PyTorchLightning，例如：condainstallpytorch-lightning这会安装最新版本的PyTorchLightning。如果需要特定版本的PyTorchLightning，可以指定版本号：condainst
基于深度学习的大规模模型训练 SEU-WYL 深度学习dnn 深度学习人工智能 dnn
基于深度学习的大规模模型训练涉及训练具有数百万甚至数十亿参数的深度神经网络，以处理复杂的任务，如自然语言处理、计算机视觉和语音识别。以下是关于基于深度学习的大规模模型训练的详细介绍：1.背景和动机数据和模型规模增长：随着数据量和模型复杂度的增加，传统的单机或小规模集群训练难以满足需求。计算资源需求：大规模模型训练需要大量计算资源和存储，单一设备无法满足。任务复杂性：处理复杂任务（如GPT-3、BE
Python打印等边三角形 weixin_33720956 python ui 开发工具
示例1:#!/usr/bin/python#-*-coding:UTF-8-*-#根据输入打印rows=int(raw_input('pleaseinputnumber:'))#等边三角形foriinrange(0,rows+1):forjinrange(0,rows-i):print"",j+=1forkinrange(0,2*i-1):ifk==0ork==2*i-2ori==rows:ifi
python输出星号等腰三角形_Python 打印矩形、直角三角形、等腰三角形、菱形 weixin_39594296 python输出星号等腰三角形
#1）打印一个星号print('*')ViewCode#2）打印一行6个星号******foriinrange(6):print('*',end='')ViewCode#3）打印6列星号******
柯西变异和正余弦改进的麻雀搜索算法及python实现闲人编程进阶算法案例 python 人工智能开发语言柯西变异正余弦改进麻雀搜索
目录柯西变异和正余弦改进的麻雀搜索算法第一部分：麻雀搜索算法概述1.1麻雀搜索算法简介1.2算法特点1.3算法流程1.初始化阶段2.觅食者搜索阶段3.监视者逃逸阶段4.判断收敛条件1.4公式描述第二部分：改进方法——柯西变异与正余弦机制2.1改进思路2.2柯西变异公式2.3正余弦公式2.4改进后的流程第三部分：基于改进麻雀搜索算法的Python实现第四部分：案例1——函数优化问题（适配器模式）Ra
Python中的海象运算符（:=）：让代码更简洁高效叫我DPT python python
Python中的海象运算符（:=）：让代码更简洁高效目录引言：什么是海象运算符？语法与基本用法使用场景与优势注意事项与潜在陷阱总结1.引言：什么是海象运算符？海象运算符（:=）是Python3.8版本引入的新特性，因其符号:=形似海象的眼睛和牙齿而得名。它的主要功能是在表达式中同时完成赋值和返回值操作，简化需要重复计算的场景。为什么要用它？传统写法中，若需要在条件判断或循环中使用某个表达式的值，可
python打印等边三角形早日成大佬 python 前端 javascript
i=4num=4whilei>0:i-=1forjinrange(i):print("",end='')forkinrange(num-i):print("*",end='')print()
【SpringMVC】——Json数据交互处理 Y小夜 ssm框架 json
个人主页：【Y小夜】作者简介：一位双非学校的大二学生，编程爱好者，专注于基础和实战分享，欢迎私信咨询！入门专栏：【MySQL，Java基础，Rust】热门专栏：【Python，Javaweb，Vue框架】感谢您的点赞、关注、评论、收藏、是对我最大的认可和支持！❤️目录Json概述Json构成要素JSON与JavaScript的关系JSON的优点JSON的应用JSON工具的使用返回json字符串统一
【python】字典介绍 Yui_ python python 数据库开发语言学习笔记编程
文章目录1.函数2.列表与元组3.字典3.1创建字典3.2查找key3.3新增修改元素3.4删除元素3.5遍历字典元素3.6取出所有key和value3.7合法的key类型1.函数函数2.列表与元组列表与元组3.字典字典是一种存储键值对的结构。和生活中的字典一样，当你查一个英语的意思时：apple就对应着苹果。它们就是一个键值对，其中apple就是key，而苹果就是value。这些键（key）和值
【学习心得】几种特殊但非常必要学习的pip安装小知识小oo呆【学习心得】学习 pip python
在学习Python全栈的过程中要接触非常多的库，很多库都是直接pipinstall就搞定了！但有一些总是特立独行！一、安装时的名字与导包时名字不同的首先举例大名鼎鼎的OpenCV#安装OpenCVpipinstallopencv-python#导包importcv2再来一个大名鼎鼎的sklearn#安装pipinstallscikit-learn#导包举例fromsklearn.preproces
AttributeError: ‘NoneType‘ object has no attribute ‘xxx‘v m0_69514319 python 开发语言
分析：在Python中，NoneType是一个类型，如同int、float一样。如：>>>a=None>>>type(a)>>>a=1>>>type(a)注：Nonetype类型不支持任何运算也没有内建方法解决方法：本案例中通过jsonpath读取json格式的数据时，使用了$.access_token,即路径使用了相对路径，应改成绝对路径。当再次实验时因为移动了文件夹再次导致同样的报错，修改绝对
【Numpy核心编程攻略：Python数据处理、分析详解与科学计算】1.25 视觉风暴：NumPy驱动数据可视化精通代码大仙 numpy python numpy python 信息可视化
1.25视觉风暴：NumPy驱动数据可视化目录视觉风暴：NumPy驱动数据可视化百万级点云实时渲染优化CT医学影像三维重建实战交互式数据分析看板开发地理空间数据可视化进阶WebAssembly前端渲染融合1.25.1百万级点云实时渲染优化1.25.2CT医学影像三维重建实战1.25.3交互式数据分析看板开发1.25.4地理空间数据可视化进阶1.25.5WebAssembly前端渲染融合视觉风暴：N
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla