Waldocsdn

PyTorch相关笔记(不断补充)

文章目录

Mac M1环境安装参考文章
环境安装成功测试代码
关于MPS
PyTorch中linspace的详细用法
torch.randn()
torch.sin()
Python中item()和items()的用法
- item()
- items()
PyTorch之torch.utils.data.DataLoader详解
- 参数说明
- 好处
- 注意
- 实例
- - 实例1 BATCH_SIZE 刚好整除数据量
  - 实例2 BATCH_SIZE 不整除数据量：会输出余下所有数据
关于PyTorch中的zero_grad()函数
torch.clamp()
numpy.transpose(images, (1,2,0))
torch.max()
- torch.max(input, dim)函数
- 准确率计算
torch.eye()函数
torch.mul()、torch.mm()、torch.dot()和torch.mv()之间的区别
torch.rand()
torch.randn()
torch.normal()
torch.linespace()
torch.argsort()—输出值为索引
Pytorch关于requires_grad_(True)的理解
问题: grad can be implicitly created only for scalar outputs
transforms.Normalize
cifar10数据集_提取torchvision.datasets.CIFAR10中的图像及标签
argparse基本用法
tensor.copy_()
[Python dict() 函数](https://www.runoob.com/python/python-func-dict.html)
什么是状态字典：state_dict?
transform.ToTensor(), transform.Normalize((0.5,0.5,0.5),(0.5,0.5,0.5))作用
torchvision.transforms 数据预处理：Normalize()
- 1、Normalize() 的作用
- - 1.1 Normalize() 的源码
  - 1.2 代码示例
- 2、ToTensor() 和 Normalize() 的结合使用
关于“shape”和“ndim”的一些点
PyTorch保存与加载模型
代码“with torch.set_grad_enabled(False):”的作用

Mac M1环境安装参考文章

Installing PyTorch on Apple M1 chip with GPU Acceleration

注：用pip命令安装torch

MacBook M1配置 Pytorch(主要关注这里面的numpy重装)
Mac M1芯片安装miniAnaconda、Jupyter、TensorFlow环境(主要关注这里面的给Jupyter添加内核步骤)

环境安装成功测试代码

import torch
import math
dtype = torch.float
device = torch.device("mps")

# Create random input and output data
x = torch.linspace(-math.pi, math.pi, 2000, device=device, dtype=dtype)
y = torch.sin(x) # 返回一个新张量，包含输入张量x中的每个元素的正弦

# Randomly initialize weights
a = torch.randn((), device=device, dtype=dtype)
b = torch.randn((), device=device, dtype=dtype)
c = torch.randn((), device=device, dtype=dtype)
d = torch.randn((), device=device, dtype=dtype)

learning_rate = 1e-6
for t in range(2000):
    # Forward pass: compute predicted y
    y_pred = a + b * x + c * x ** 2 + d * x ** 3

    # Compute and print loss
    loss = (y_pred - y).pow(2).sum().item()
    if t % 100 == 99:
        print(t, loss)

	# Backprop to compute gradients of a, b, c, d with respect to loss
    grad_y_pred = 2.0 * (y_pred - y)
    grad_a = grad_y_pred.sum()
    grad_b = (grad_y_pred * x).sum()
    grad_c = (grad_y_pred * x ** 2).sum()
    grad_d = (grad_y_pred * x ** 3).sum()

    # Update weights using gradient descent
    a -= learning_rate * grad_a
    b -= learning_rate * grad_b
    c -= learning_rate * grad_c
    d -= learning_rate * grad_d


print(f'Result: y = {a.item()} + {b.item()} x + {c.item()} x^2 + {d.item()} x^3')

相关解读见下面几个点

关于MPS

苹果有自己的一套GPU实现API Metal。而Pytorch此次的加速就是基于Metal。具体来说，使用苹果的Metal Performance Shaders (MPS) 作为PyTorch的后端，可以实现加速GPU训练。MPS后端扩展了PyTorch框架，提供了在Mac上设置和运行操作的脚本和功能。MPS通过针对每个Metal GPU系列的独特特性进行微调的内核来优化计算性能。新设备在MPS图形框架和MPS提供的调整内核上映射机器学习计算图形和基元。

PyTorch中linspace的详细用法

“linspace”是“linear space”的缩写，中文含义为“线性等分向量”、“线性平分矢量”、“线性平分向量”。

linspace()函数详细参数为:

函数的作用是: 返回一个一维的tensor（张量），这个张量包含了从start到end（包括端点）的等距的steps个数据点
torch.linspace(start, end, steps=100, out=None, dtype=None, layout=torch.strided, device=None, requires_grad=False) → Tensor

常用的几个参数含义:
start：开始值;
end：结束值;
steps：分割的点数，默认是100;
dtype：返回值（张量）的数据类型

函数的作用是: 返回一个一维的tensor（张量），这个张量包含了从start到end（包括端点）的等距的steps个数据点

示例:

import torch
print(torch.linspace(3,10,5))
#输出: tensor([ 3.0000,  4.7500,  6.5000,  8.2500, 10.0000])

type=torch.float
print(torch.linspace(-10,10,steps=6,dtype=type))
#输出: tensor([-10.,  -6.,  -2.,   2.,   6.,  10.])

torch.linspace(-10, 10, steps=21,dtype=type)
#输出: tensor([-10.,  -9.,  -8.,  -7.,  -6.,  -5.,  -4.,  -3.,  -2.,  -1.,   0.,   1.,   2.,   3.,   4.,   5.,   6.,   7.,   8.,   9.,  10.])

torch.randn()

有时我们想通过从某个特定的概率分布中随机采样来得到张量中每个元素的值。例如，当我们构造数组来作为神经网络中的参数时，我们通常会随机初始化参数的值。以下代码创建一个形状为(3, 4)的张量。其中的每个元素都从均值为0、标准差为1的标准高斯分布(正态分布)中随机采样

torch.randn(3, 4)

输出:
tensor([[-0.5582, -0.0443,  1.6146,  0.6003],
        [-1.7652,  1.3074,  0.5233,  1.4372],
        [ 0.2452,  2.2281,  1.3483,  0.1783]])

torch.sin()

函数说明:
返回一个新张量，包含输入input张量每个元素的正弦。
torch.sin(input, out=None) → Tensor

参数：
input (Tensor) – 输入张量
out (Tensor, optional) – 输出张量

示例:

>>> a = torch.randn(4)
>>> a
-0.6366
 0.2718
 0.4469
 1.3122
[torch.FloatTensor of size 4]

>>> torch.sin(a)
-0.5944
 0.2684
 0.4322
 0.9667
[torch.FloatTensor of size 4]

Python中item()和items()的用法

item()

item()的作用是取出单元素张量的元素值并返回该值，保持该元素类型不变。
听起来和使用索引来取值的作用好像一样，接下来我们看一看使用两种方法取元素值的区别：
首先定义一个张量：

1、直接使用索引取值：

2、使用item()取出

由此可以看出使用item()函数取出的元素值的精度更高，所以在求损失函数等时我们一般用item()

items()

items()的作用是把字典中的每对key和value组成一个元组，并把这些元祖放在列表中返回。
举个例子：

PyTorch之torch.utils.data.DataLoader详解

参数说明

dataset: 输入的数据集
batch_size(数据类型:int)
批训练数据量的大小，根据具体情况设置即可（默认：1）。PyTorch训练模型时调用数据不是一行一行进行的（这样太没效率），而是一捆一捆来的。这里就是定义每次喂给神经网络多少行数据，如果设置成1，那就是一行一行进行。每次是随机读取大小为batch_size。如果dataset中的数据个数不是batch_size的整数倍，这最后一次把剩余的数据全部输出。若想把剩下的不足batch size个的数据丢弃，则将drop_last设置为True，会将多出来不足一个batch的数据丢弃。
shuffle(数据类型:bool)
洗牌。默认设置为False。在每次迭代训练时是否将数据洗牌，默认设置是False。将输入数据的顺序打乱，是为了使数据更有独立性，但如果数据是有序列特征的，就不要设置成True了。
collate_fn:(数据类型 callable，没见过的类型)
将一小段数据合并成数据列表，默认设置是False。如果设置成True，系统会在返回前会将张量数据（Tensors）复制到CUDA内存中。
batch_sampler:(数据类型 Sampler)
批量采样，默认设置为None。但每次返回的是一批数据的索引（注意：不是数据）。其和batch_size、shuffle 、sampler and drop_last参数是不兼容的。我想，应该是每次输入网络的数据是随机采样模式，这样能使数据更具有独立性质。所以，它和一捆一捆按顺序输入，数据洗牌，数据采样，等模式是不兼容的。
sampler:(数据类型 Sampler)
采样，默认设置为None。根据定义的策略从数据集中采样输入。如果定义采样规则，则洗牌（shuffle）设置必须为False。
num_workers:(数据类型 Int)
工作者数量，默认是0。使用多少个子进程来导入数据。设置为0，就是使用主进程来导入数据。注意：这个数字必须是大于等于0的，负数估计会出错。
pin_memory:(数据类型 bool)
内存寄存，默认为False。在数据返回前，是否将数据复制到CUDA内存中。
drop_last:(数据类型 bool)
丢弃最后数据，默认为False。设置了 batch_size 的数目后，最后一批数据未必是设置的数目，有可能会小些。这时你是否需要丢弃这批数据。
timeout:(数据类型 numeric)
超时，默认为0。是用来设置数据读取的超时时间的，但超过这个时间还没读取到数据的话就会报错。所以，数值必须大于等于0。
worker_init_fn:(数据类型 callable，没见过的类型)
子进程导入模式，默认为Noun。在数据导入前和步长结束后，根据工作子进程的ID逐个按顺序导入数据。

好处

torch.utils.data.DataLoader 主要是对数据进行 batch 的划分。在训练模型时使用到此函数，用来把训练数据分成多个小组，此函数每次抛出一组数据。直至把所有的数据都抛出。就是做一个数据的初始化。使用DataLoader的好处是，可以快速的迭代数据。用于生成迭代数据非常方便。

注意

除此之外，特别要注意的是输入进函数的数据一定得是可迭代的。如果是自定的数据集的话可以在定义类中用def__len__、def__getitem__定义。

实例

实例1 BATCH_SIZE 刚好整除数据量

"""
    批训练，把数据变成一小批一小批数据进行训练。
    DataLoader就是用来包装所使用的数据，每次抛出一批数据
"""
import torch
import torch.utils.data as Data

BATCH_SIZE = 5       # 批训练的数据个数

x = torch.linspace(1, 10, 10)   # 训练数据
print(x)
y = torch.linspace(10, 1, 10)   # 标签
print(y)
# 把数据放在数据库中
torch_dataset = Data.TensorDataset(x, y)  # 对给定的 tensor 数据，将他们包装成 dataset

loader = Data.DataLoader(
    # 从数据库中每次抽出batch size个样本
    dataset=torch_dataset,       # torch TensorDataset format
    batch_size=BATCH_SIZE,       # mini batch size
    shuffle=True,                # 要不要打乱数据 (打乱比较好)
    num_workers=2,               # 多线程来读数据
)

def show_batch():
    for epoch in range(3):
        for step, (batch_x, batch_y) in enumerate(loader):
            # training
            print("steop:{}, batch_x:{}, batch_y:{}".format(step, batch_x, batch_y))

show_batch()

输出结果：

tensor([ 1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9., 10.])
tensor([10.,  9.,  8.,  7.,  6.,  5.,  4.,  3.,  2.,  1.])
step:0, batch_x:tensor([8., 9., 3., 5., 6.]), batch_y:tensor([3., 2., 8., 6., 5.])
step:1, batch_x:tensor([ 4.,  7., 10.,  2.,  1.]), batch_y:tensor([ 7.,  4.,  1.,  9., 10.])
step:0, batch_x:tensor([ 4.,  9., 10.,  1.,  5.]), batch_y:tensor([ 7.,  2.,  1., 10.,  6.])
step:1, batch_x:tensor([8., 2., 3., 7., 6.]), batch_y:tensor([3., 9., 8., 4., 5.])
step:0, batch_x:tensor([10.,  3.,  6.,  9.,  5.]), batch_y:tensor([1., 8., 5., 2., 6.])
step:1, batch_x:tensor([7., 4., 8., 1., 2.]), batch_y:tensor([ 4.,  7.,  3., 10.,  9.])

说明：共有 10 条数据，设置 BATCH_SIZE 为 5 来进行划分，能划分为 2 组（step 为 0 和 1）。这两组数据互斥。

实例2 BATCH_SIZE 不整除数据量：会输出余下所有数据

将上述代码中的 BATCH_SIZE 改为 4 ：

"""
    批训练，把数据变成一小批一小批数据进行训练。
    DataLoader就是用来包装所使用的数据，每次抛出一批数据
"""
import torch
import torch.utils.data as Data

BATCH_SIZE = 4       # 批训练的数据个数

x = torch.linspace(1, 10, 10)   # 训练数据
print(x)
y = torch.linspace(10, 1, 10)   # 标签
print(y)
# 把数据放在数据库中
torch_dataset = Data.TensorDataset(x, y)  # 对给定的 tensor 数据，将他们包装成 dataset

loader = Data.DataLoader(
    # 从数据库中每次抽出batch size个样本
    dataset=torch_dataset,       # torch TensorDataset format
    batch_size=BATCH_SIZE,       # mini batch size
    shuffle=True,                # 要不要打乱数据 (打乱比较好)
    num_workers=2,               # 多线程来读数据
)

def show_batch():
    for epoch in range(3):
        for step, (batch_x, batch_y) in enumerate(loader):
            # training
            print("steop:{}, batch_x:{}, batch_y:{}".format(step, batch_x, batch_y))

show_batch()

输出结果:

tensor([ 1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9., 10.])
tensor([10.,  9.,  8.,  7.,  6.,  5.,  4.,  3.,  2.,  1.])
step:0, batch_x:tensor([10.,  6.,  5.,  8.]), batch_y:tensor([1., 5., 6., 3.])
step:1, batch_x:tensor([1., 7., 4., 9.]), batch_y:tensor([10.,  4.,  7.,  2.])
step:2, batch_x:tensor([3., 2.]), batch_y:tensor([8., 9.])
step:0, batch_x:tensor([ 7., 10.,  9.,  3.]), batch_y:tensor([4., 1., 2., 8.])
step:1, batch_x:tensor([5., 4., 2., 8.]), batch_y:tensor([6., 7., 9., 3.])
step:2, batch_x:tensor([6., 1.]), batch_y:tensor([ 5., 10.])
step:0, batch_x:tensor([10.,  9.,  1.,  7.]), batch_y:tensor([ 1.,  2., 10.,  4.])
step:1, batch_x:tensor([4., 8., 2., 6.]), batch_y:tensor([7., 3., 9., 5.])
step:2, batch_x:tensor([5., 3.]), batch_y:tensor([6., 8.])

说明：共有 10 条数据，设置 BATCH_SIZE 为 4 来进行划分，能划分为 3 组（steop 为 0 、1、2）。分别有 4、4、2 条数据。

关于PyTorch中的zero_grad()函数

zero_grad()函数的应用：
在pytorch中做随机梯度下降时往往会用到zero_grad()函数，相关代码如下:

函数	作用
optimizer.zero_grad()	将模型的参数梯度初始化为0
outputs=model(inputs)	前向传播计算预测值
loss = cost(outputs, y_train)	计算当前损失
loss.backward()	反向传播计算梯度
optimizer.step()	更新所有参数

zero_grad()函数的作用：
根据pytorch中backward()函数的计算，当网络参量进行反馈时，梯度是累积计算而不是被替换，但在处理每一个batch时并不需要与其他batch的梯度混合起来累积计算，因此需要对每个batch调用一遍zero_grad()将参数梯度置0。
另外，如果不是处理每个batch清除一次梯度，而是两次或多次再清除一次，相当于提高了batch_size，对硬件要求更高，更适用于需要更高batch_size的情况。

torch.clamp()

torch.clamp(input, min, max, out=None) → Tensor

将输入input张量每个元素夹紧到区间 [min,max]，并返回结果到一个新张量。

操作定义如下：

      | min, if x_i < min
y_i = | x_i, if min <= x_i <= max
      | max, if x_i > max

参数：

input (Tensor) – 输入张量
min (Number) – 限制范围下限
max (Number) – 限制范围上限
out (Tensor, optional) – 输出张量

例子:

>>> a = torch.randn(4)
>>> a
 1.3869
 0.3912
-0.8634
-0.5468
[torch.FloatTensor of size 4]

>>> torch.clamp(a, min=-0.5, max=0.5)
 0.5000
 0.3912
-0.5000
-0.5000
[torch.FloatTensor of size 4]

torch.clamp(input, min, *, out=None) → Tensor

将输入input张量每个元素的限制到不小于min，并返回结果到一个新张量。

参数：

input (Tensor) – 输入张量
value (Number) – 限制范围下限
out (Tensor, optional) – 输出张量

>>> a = torch.randn(4)
>>> a
 1.3869
 0.3912
-0.8634
-0.5468
[torch.FloatTensor of size 4]

>>> torch.clamp(a, min=0.5)
 1.3869
 0.5000
 0.5000
 0.5000
[torch.FloatTensor of size 4]

torch.clamp(input, *, max, out=None) → Tensor

将输入input张量每个元素的限制到不大于max，并返回结果到一个新张量。

参数：

input (Tensor) – 输入张量
value (Number) – 限制范围上限
out (Tensor, optional) – 输出张量

>>> a = torch.randn(4)
>>> a
 1.3869
 0.3912
-0.8634
-0.5468
[torch.FloatTensor of size 4]

>>> torch.clamp(a, max=0.5)
 0.5000
 0.3912
-0.8634
-0.5468
[torch.FloatTensor of size 4]

numpy.transpose(images, (1,2,0))

有一段代码:

def imshow(img,text,should_save=False):
    npimg = img.numpy()  # 将torch.FloatTensor 转换为numpy
    plt.axis("off")  # 不显示坐标尺寸
    if text:
        plt.text(75, 8, text, style='italic',fontweight='bold',
            bbox={'facecolor':'white', 'alpha':0.8, 'pad':10})  # facecolor前景色
    # pytorch 图片的显示问题
    plt.imshow(np.transpose(npimg, (1, 2, 0)))
    plt.show()

解释这句话：plt.imshow(np.transpose(npimg, (1, 2, 0)))。因为在plt.imshow在现实的时候输入的是（imagesize,imagesize,channels）,而def imshow(img,text,should_save=False)中，参数img的格式为（channels,imagesize,imagesize）,这两者的格式不一致，我们需要调用一次np.transpose函数，即np.transpose(npimg,(1,2,0))，将npimg的数据格式由（channels,imagesize,imagesize）转化为（imagesize,imagesize,channels）,进行格式的转换后方可进行显示。

总结一下，pytorch在载入数据集是元组tuple的形式，里面包括了数据及标签，其中的数据可以转换为torch .Tensor的形式，方便后面计算使用。在显示数据的时候，需要将torchtensor转换为numpy。
在pytorch中，读入图片并进行显示的方式有两种。
方式一
将读取出来的torch.FloatTensor转换为numpy，然后将其（1 ,imagesize,imagesize）给reshape一下，变成（imagesize,imagesize）的形式，最后进行显示，上代码：

# dataset的格式为:([torch.FloatTensor of size 1x28x28]，3)  其中图片的格式为（1x28x28）图片的标签为3
# 这里我们只取这一张图片本身，先不管它的标签。
img=dataset[0]
# First 将 torch.FloatTensor 转换为 numpy的格式
img=img.numpy()
# Second 将shape（1,28,28）转化为（28,28）
img=img.reshape(28,28)
# Third 调用plt 将图片显示出来
plt.imshow(img,cmap='gray')
plt.show()
#然后就可以显示图片了

方式二：调用torch的接口

img=torchvision.utils.make_grid(img).numpy()
plt.imshow(np.transpose(img,(1,2,0)))
plt.show()

这里用np.transpose（img，(1,2,0)）将图片的格式由（channels,imagesize,imagesize）转化为（imagesize,imagesize,channels）,这样plt.show()就可以显示图片了。

torch.max()

torch.max(input, dim)函数

在分类问题中，通常需要使用max()函数对softmax函数的输出值进行操作，求出预测值索引。下面讲解一下torch.max()函数的输入及输出值都是什么。

output = torch.max(input, dim)

输入

input是Softmax函数输出的一个tensor

dim是max函数索引的维度0/1，0是每列的最大值，1是每行的最大值

输出

函数会返回两个tensor，第一个tensor是每行的最大值，softmax的输出中最大的是1，所以第一个tensor是全1的tensor；第二个tensor是每行最大值的索引。

我们通过一个实例可以更容易理解这个函数的用法:

import torch
a = torch.tensor([[1,5,62,54], [2,6,2,6], [2,65,2,6]])
print(a)

输出：

tensor([[ 1,  5, 62, 54],
        [ 2,  6,  2,  6],
        [ 2, 65,  2,  6]])

索引每行的最大值：

torch.max(a, 1)

输出:

torch.return_types.max(
values=tensor([62,  6, 65]),
indices=tensor([2, 3, 1]))

在计算准确率时第一个tensor的“values”属性是不需要的，所以我们只需提取第二个tensor，并将tensor格式的数据转换成array格式。

torch.max(a, 1)[1].numpy()

输出:

array([2, 3, 1], dtype=int64)

*注：在有的地方我们会看到torch.max(a, 1).data.numpy()的写法，这是因为在早期的pytorch的版本中，variable变量和tenosr是不一样的数据格式，variable可以进行反向传播，tensor不可以，需要将variable转变成tensor再转变成numpy。现在的版本已经将variable和tenosr合并，所以只用torch.max(a,1).numpy()就可以了。

准确率计算

pred_y = torch.max(predict, 1)[1].numpy()
y_label = torch.max(label, 1)[1].data.numpy()
accuracy = (pred_y == y_label).sum() / len(y_label)

torch.eye()函数

torch.mul()、torch.mm()、torch.dot()和torch.mv()之间的区别

torch.mul()是矩阵的点乘，即对应的位相乘，要求shape一样, 返回的还是个矩阵
torch.mm()是矩阵正常的矩阵相乘，（a, b）* ( b, c ) = ( a, c )
torch.dot()类似于mul()，它是向量(即只能是一维的张量)的对应位相乘再求和，返回一个tensor数值
torch.mv()是矩阵和向量相乘，类似于torch.mm()

import torch
A = torch.tensor([[1,2,3],
                   [4,5,6]])
x = torch.tensor([1,2,3])
torch.mv(A, x) # 第一个参数是矩阵，第二个参数只能是一维向量 

输出：tensor([14, 32])

等价于A * X^T

torch.rand()

torch.randn()

torch.normal()

torch.linespace()

torch.argsort()—输出值为索引

第一步：先定义一个array数据
import numpy as np
x=np.array([2,4,5,3,-10,1])

第二步：输出结果：
y=np.argsort(x)
print(y)
输出结果为：y=[4 5 0 3 1 2]

第三步：总结：
argsort()函数是将x中的元素从小到大排列，提取其对应的index(索引号)
例如：x[4]=-10最小，所以y[0]=4,
同理：x[2]=5最大，所以y[5]=2。

看以下官方案例：

One dimensional array:一维数组
>>> x = np.array([3, 1, 2])
>>> np.argsort(x)
array([1, 2, 0])

Two-dimensional array:二维数组
>>> x = np.array([[0, 3], [2, 2]])
>>> x
array([[0, 3],
       [2, 2]])

>>> np.argsort(x, axis=0) #按列排序
array([[0, 1],
       [1, 0]])

>>> np.argsort(x, axis=1) #按行排序
array([[0, 1],
       [0, 1]])

>>> x = np.array([3, 1, 2])
>>> np.argsort(x) #按升序排列
array([1, 2, 0])
>>> np.argsort(-x) #按降序排列
array([0, 2, 1])

Pytorch关于requires_grad_(True)的理解

import torch
x = torch.tensor([1, 2], dtype=torch.float32, requires_grad=True)
a = torch.tensor([3, 4], dtype=torch.float32, requires_grad=True)
y = x * 2 + a
y.requires_grad_(True)
z = torch.mean(y)

z.backward()
print(x.grad, x.requires_grad)
print(a.grad, a.requires_grad)
print(y.grad, y.requires_grad)
print(z.grad, z.requires_grad)

#  以下结果需要设置a的requires_grad=False或取消这个参数。
#  tensor([1., 1.]) True
#  None False
#  None True
#  None True

问题: grad can be implicitly created only for scalar outputs

Autograd：自动求导
torch.Tensor 是这个包的核心类。如果设置它的属性 .requires_grad 为 True，那么它将会追踪对于该张量的所有操作。当完成计算后可以通过调用 .backward()，来自动计算所有的梯度。这个张量的所有梯度将会自动累加到.grad属性.

要阻止一个张量被跟踪历史，可以调用 .detach() 方法将其与计算历史分离，并阻止它未来的计算记录被跟踪。

为了防止跟踪历史记录(和使用内存），可以将代码块包装在 with torch.no_grad(): 中。在评估模型时特别有用，因为模型可能具有 requires_grad = True 的可训练的参数，但是我们不需要在此过程中对他们进行梯度计算。

还有一个类对于autograd的实现非常重要：Function。

Tensor 和 Function 互相连接生成了一个无圈图(acyclic graph)，它编码了完整的计算历史。每个张量都有一个 .grad_fn 属性，该属性引用了创建 Tensor 自身的Function(除非这个张量是用户手动创建的，即这个张量的 grad_fn 是 None )。

如果需要计算导数，可以在 Tensor 上调用 .backward()。如果 Tensor 是一个标量(即它包含一个元素的数据），则不需要为 backward() 指定任何参数，但是如果它有更多的元素，则需要指定一个 gradient 参数，该参数是形状匹配的张量。

若遇到: grad can be implicitly created only for scalar outputs
根据文档如果 Tensor 是一个标量(即它包含一个元素的数据)，则不需要为 backward() 指定任何参数，但是如果它有更多的元素，则需要指定一个 gradient 参数，该参数是形状匹配的张量。

所以当：

x = torch.ones(2,requires_grad=True)
print(x)
z = x + 2
print(z)
z.backward()
print(x.grad)
# 出现grad can be implicitly created only for scalar outputs 
# 因为此时的 z 并不是一个标量(即它包含一个元素的数据）
# 意思是只有对标量输出它才会计算梯度，而求一个矩阵对另一矩阵的导数束手无策。
RuntimeError: grad can be implicitly created only for scalar outputs

即：

那么我们只要想办法把矩阵转变成一个标量不就好了？比如我们可以对z求和，然后用求和得到的标量在对x求导，这样不会对结果有影响，例如：

我们可以看到对z求和后再计算梯度没有报错，结果也与预期一样：

x = torch.ones(2,requires_grad=True)
z = x + 2
z.sum().backward()
print(x.grad)

>>> tensor([1., 1.])

再回到文档但是如果它有更多的元素，则需要指定一个 gradient 参数，该参数是形状匹配的张量。

也就是对于矩阵求导来说，需要一个额外的参数矩阵和需要求导的矩阵做点乘。一般点乘的矩阵为全1的对应形状的矩阵。也就是乘以全1的矩阵，等价于sum()。

参考 Pytorch autograd, backward详解

也就是比如:

x = torch.tensor([2., 1.], requires_grad=True)
y = torch.tensor([[1., 2.], [3., 4.]], requires_grad=True)

z = torch.mm(x.view(1, 2), y)
print(f"z:{z}")
z.backward(torch.Tensor([[1., 0]]), retain_graph=True)
print(f"x.grad: {x.grad}")
print(f"y.grad: {y.grad}")

>>> z:tensor([[5., 8.]], grad_fn=<MmBackward>)
x.grad: tensor([[1., 3.]])
y.grad: tensor([[2., 0.],
        [1., 0.]])

结果解释如下：

上面这里并没使用全为1的矩阵，因此grad_tensors 如果自定义，会产生对应自定义产生的结果。一般来说都定义为全1的矩阵。（可以看作等价与sum())

transforms.Normalize

cifar10数据集_提取torchvision.datasets.CIFAR10中的图像及标签

torchvision.datasets中包含了很多常用的数据集，比如mnist，fashion-mnist，cifar10等。这些数据集都是以压缩包的格式存储的，有时候我们特别想将这些数据集解压出来，将数据和标签分布存储在不同的文件夹下。下面是一个处理cifar10数据集的例子，其它数据集处理类似，源码如下：

import torch
import torchvision
import torchvision.transforms as transforms
import os
import numpy as np
from skimage import io
import matplotlib.pyplot as plt
 
trainset = torchvision.datasets.CIFAR10(root='/mnt/liguanlin/DataSets/cifar', train=True,
                                        download=True,transform=None)
 
testset = torchvision.datasets.CIFAR10(root='/mnt/liguanlin/DataSets/cifar', train=False,
                                       download=True, transform=None)
 
train_set_size = len(trainset)
print(train_set_size)
 
test_set_size = len(testset)
print(test_set_size)
 
print(type(trainset[0])) # 
 
trainset_labels = np.zeros(train_set_size)
print(trainset_labels.shape)
 
testset_labels = np.zeros(test_set_size)
print(testset_labels.shape)
 
for i in range(train_set_size):
    img_path = '/mnt/liguanlin/DataSets/cifar/train/{i}.png'.format(i=i+1)
    sample = trainset[i][0]
    sample.save(img_path)
    trainset_labels[i] = trainset[i][1]
 
for i in range(test_set_size):
    img_path = '/mnt/liguanlin/DataSets/cifar/test/{i}.png'.format(i=i+1)
    img = testset[i][0]
    img.save(img_path)
    testset_labels[i] = testset[i][1]
 
np.savetxt(fname='/mnt/liguanlin/DataSets/cifar/train/trainset_label.csv', X= trainset_labels, delimiter=',')
np.savetxt(fname='/mnt/liguanlin/DataSets/cifar/test/testset_label.csv', X= testset_labels, delimiter=',')
 
trainset_labels_read = np.loadtxt("/mnt/liguanlin/DataSets/cifar/train/trainset_label.csv", delimiter=',')
testset_labels_read = np.loadtxt("/mnt/liguanlin/DataSets/cifar/test/testset_label.csv", delimiter=',')
print(trainset_labels_read.shape)
print(testset_labels_read.shape)
 
print(trainset_labels_read[0])
print(trainset_labels_read[1])
print(testset_labels_read)
 
#https://cloud.tencent.com/developer/article/1144751

有几个注意的点：

加载数据集时，要想好什么时候添加transforms.ToTensor()转换

trainset = torchvision.datasets.CIFAR10(root='/mnt/liguanlin/DataSets/cifar', train=True,
                                        download=True,transform=None)

即如上，需要设置transform=None。如果不经过任何转换，则trainset中保存的图片的格式是类型的（其它数据集在不加转换的情况下也是这种格式）。

由于是对象，所以我们可以直接使用Image.save（）函数将图片保存起来。

如何在trainset中找到图片对象和标签

for i in range(train_set_size):
    img_path = '/mnt/liguanlin/DataSets/cifar/train/{i}.png'.format(i=i+1)
    sample = trainset[i][0]
    sample.save(img_path)
    trainset_labels[i] = trainset[i][1]

如上，trainset中保存的是所有图片的一个tuple，tuple的第一个元素是Image对象，第二个元素是标签。
所以如果我们要获取第i个tuple的图片和标签，可以这样搞：
sample = trainset[i][0]
trainset_labels[i] = trainset[i][1]

3，对于标签的存储使用的是np.savetxt 直接将标签组成的一维的numpy array存储起来即可。

argparse基本用法

文章 1
文章 2

tensor.copy_()

tensor.copy_(src)
将src中的元素复制到tensor中并返回这个tensor; 两个tensor应该有相同shape

例子:

x = torch.tensor([[1,2], [3,4], [5,6]])
y = torch.rand((3,2))
print(y)
y.copy_(x)
print(y)

输出:

tensor([[0.1604, 0.0176],
        [0.3737, 0.2009],
        [0.1438, 0.8394]])
        
tensor([[1., 2.],
        [3., 4.],
        [5., 6.]])
[Finished in 1.9s]

Python dict() 函数

什么是状态字典：state_dict?

在PyTorch中，torch.nn.Module模型的可学习参数（即权重和偏差）包含在模型的参数中，（使用model.parameters()可以进行访问）。 state_dict是Python字典对象，它将每一层映射到其参数张量。注意，只有具有可学习参数的层（如卷积层，线性层等）的模型才具有state_dict这一项。目标优化torch.optim也有state_dict属性，它包含有关优化器的状态信息，以及使用的超参数。

因为state_dict的对象是Python字典，所以它们可以很容易的保存、更新、修改和恢复，为PyTorch模型和优化器添加了大量模块。

下面通过从简单模型训练一个分类器中来了解一下state_dict的使用。

# 定义模型
class TheModelClass(nn.Module):
    def __init__(self):
        super(TheModelClass, self).__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 16 * 5 * 5)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

# 初始化模型
model = TheModelClass()

# 初始化优化器
optimizer = optim.SGD(model.parameters(), lr=0.001, momentum=0.9)

# 打印模型的状态字典
print("Model's state_dict:")
for param_tensor in model.state_dict():
    print(param_tensor, "\t", model.state_dict()[param_tensor].size())

# 打印优化器的状态字典
print("Optimizer's state_dict:")
for var_name in optimizer.state_dict():
    print(var_name, "\t", optimizer.state_dict()[var_name])

输出:

Model's state_dict:
conv1.weight     torch.Size([6, 3, 5, 5])
conv1.bias   torch.Size([6])
conv2.weight     torch.Size([16, 6, 5, 5])
conv2.bias   torch.Size([16])
fc1.weight   torch.Size([120, 400])
fc1.bias     torch.Size([120])
fc2.weight   torch.Size([84, 120])
fc2.bias     torch.Size([84])
fc3.weight   torch.Size([10, 84])
fc3.bias     torch.Size([10])

Optimizer's state_dict:
state    {}
param_groups     [{'lr': 0.001, 'momentum': 0.9, 'dampening': 0, 'weight_decay': 0, 'nesterov': False, 'params': [4675713712, 4675713784, 4675714000, 4675714072, 4675714216, 4675714288, 4675714432, 4675714504, 4675714648, 4675714720]}]

transform.ToTensor(), transform.Normalize((0.5,0.5,0.5),(0.5,0.5,0.5))作用

torchvision.transforms 数据预处理：Normalize()

1、Normalize() 的作用

Normalize() 是pytorch中的数据预处理函数，包含在 torchvision.transforms 模块下。一般用于处理图像数据，其输入数据格式是 torch.Tensor，而不是 np.array。

1.1 Normalize() 的源码

看一下 Normalize() 函数的源码：

class Normalize(torch.nn.Module):
    """Normalize a tensor image with mean and standard deviation.
    This transform does not support PIL Image.
    Given mean: ``(mean[1],...,mean[n])`` and std: ``(std[1],..,std[n])`` for ``n``
    channels, this transform will normalize each channel of the input
    ``torch.*Tensor`` i.e.,
    ``output[channel] = (input[channel] - mean[channel]) / std[channel]``

    .. note::
        This transform acts out of place, i.e., it does not mutate the input tensor.

    Args:
        mean (sequence): Sequence of means for each channel.
        std (sequence): Sequence of standard deviations for each channel.
        inplace(bool,optional): Bool to make this operation in-place.

    """

大意是：使用均值和标准差对输入的tensor的每个通道进行标准化，计算公式是：

output[channel] = (input[channel] - mean[channel]) / std[channel]

这里要与正态分布标准化进行区分，将一个正态分布转化为标准正态分布（即高斯分布）的公式为 Z=(X-mean)/variance，这里的分母是方差而不是标准差。

1.2 代码示例

这里用代码来演示一下Normalize()的作用：

import numpy as np
from torchvision import transforms

data = np.array([
    [0., 5, 10, 20, 0],
    [255, 125, 180, 255, 196]
])    # 因为 Normalize() 的输入必须是 float 类型，所以这里定义一个 np.float64类型的 array
tensor = transforms.ToTensor()(data)
norm = transforms.Normalize((0.5), (0.5))   # mean=0.5   std=0.5

print(f"tensor = {tensor}")
print(f"norm(tensor) = {norm(tensor)}")

"""
tensor = tensor([[[  0.,   5.,  10.,  20.,   0.],
         [255., 125., 180., 255., 196.]]], dtype=torch.float64)
norm(tensor) = tensor([[[ -1.,   9.,  19.,  39.,  -1.],
         [509., 249., 359., 509., 391.]]], dtype=torch.float64)
"""

很容易可以验证：

(0 - 0.5) / 0.5 = -1
(5 - 0.5) / 0.5 = 9
(255 - 0.5) / 0.5 = 509

2、ToTensor() 和 Normalize() 的结合使用

在图像预处理中，Normalize() 通常和 ToTensor() 一起使用。
首先 ToTensor() 将 [0,255] 的像素值归一化为 [0,1]，然后使用 Normalize(0.5, 0.5) 将 [0,1] 进行标准化为 [-1,1]

ToTensor() 和Normalize() 结合使用的代码示例：

import numpy as np
from torchvision import transforms

data = np.array([
    [0, 5, 10, 20, 0],
    [255, 125, 180, 255, 196]
], dtype=np.uint8)
tensor = transforms.ToTensor()(data)
norm = transforms.Normalize(0.5, 0.5)

print(f"tensor = {tensor}")
print(f"norm(tensor) = {norm(tensor)}")

"""
tensor = tensor([[[0.0000, 0.0196, 0.0392, 0.0784, 0.0000],
         [1.0000, 0.4902, 0.7059, 1.0000, 0.7686]]])
norm(tensor) = tensor([[[-1.0000, -0.9608, -0.9216, -0.8431, -1.0000],
         [ 1.0000, -0.0196,  0.4118,  1.0000,  0.5373]]])
"""

使用 transforms.Compose() 函数进行图像预处理：

from torchvision import transforms
import cv2

filePath = "Dataset/FFHQ/00000.png"
img = cv2.imread(filePath)

transform = transforms.Compose([transforms.ToTensor(),
                                transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])
img = transform(img)
print(img)

"""
tensor([[[ 0.1451,  0.1294,  0.1059,  ...,  0.2157,  0.2000,  0.1843],
         [ 0.1529,  0.1137,  0.1294,  ...,  0.1843,  0.1843,  0.1922],
         [ 0.1216,  0.1137,  0.1529,  ...,  0.2314,  0.1686,  0.1529],
         ...,
         [-0.8118, -0.7961, -0.7725,  ...,  0.0980,  0.0824,  0.0588],
         [-0.8196, -0.8196, -0.8039,  ...,  0.0588,  0.0353,  0.0275],
         [-0.8667, -0.8510, -0.8275,  ...,  0.0431,  0.0431,  0.0510]]])
"""

关于“shape”和“ndim”的一些点

代码示例
代码块1：

import numpy as np
a = np.array([1,2,3,3])
print('a的shape是：')
print(a.shape)
b = np.array([[1,1],[1,1],[1,1]])
print('b的shape是：')
print(b.shape)

输出为：

a的shape是：
(4,)
b的shape是：
(3, 2)

代码块2：

import numpy as np
a = np.array([1,2,3,3])
print('a的维度是：')
print(a.ndim)
b = np.array([[1,1],[1,1],[1,1]])
print('b的维度是：')
print(b.ndim)

输出为：

a的维度是：
1
b的维度是：
2

代码讲解
2.1 维度判断方式：
1. 根据shape中数字个数判断。如代码块1所示，a中的输出为（4，），有一个数字，那么a是一维；b中的输出为（3,2），有两个数字（分别为3和2），则b是二维。
2. 根据ndim方法判断如代码块2所示。可以直接运用ndim进行维度的输出。
2.2 shape中数字的含义：
如代码块1：
3. a.shape 输出（4，），其中只有一个数字4，表示一维；数字4表示含有4个数据。
4. b.shape 输出（3,2），其中含有两个数字（分别是3,2）表示二维数组。3,2的含义为：3表示其中含有3个一维数组，2表示一维数组中含有2个数据

PyTorch保存与加载模型

首先定义一个简单的模型，这里使用一个两层的全连接神经网络作为例子：

import torch.nn as nn
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.fc1 = nn.Linear(10, 20)
        self.fc2 = nn.Linear(20, 1)
    def forward(self, x):
        x = self.fc1(x)
        x = nn.functional.relu(x)
        x = self.fc2(x)
        return x

然后创建一个模型实例：

net = Net()

接下来，训练模型并保存：

import torch.optim as optim
# 定义优化器和损失函数
optimizer = optim.SGD(net.parameters(), lr=0.01)
criterion = nn.MSELoss()
# 训练模型
for epoch in range(100):
    # 输入数据和标签
    input_data = torch.randn(32, 10)
    labels = torch.randn(32, 1)
    # 清零梯度
    optimizer.zero_grad()
    # 前向传播，计算损失
    output = net(input_data)
    loss = criterion(output, labels)
    # 反向传播，更新参数
    loss.backward()
    optimizer.step()
# 保存模型
torch.save(net.state_dict(), 'model.pt')

最后，加载模型并使用：

# 创建模型实例
net = Net()
# 加载模型参数
net.load_state_dict(torch.load('model.pt'))
# 使用模型进行预测
input_data = torch.randn(1, 10)
output = net(input_data)
print(output)

在这个例子中，定义了一个简单的神经网络模型，训练模型并将模型参数保存到文件中。然后，我们重新创建了一个模型实例，并从文件中加载了模型参数。最后，我们使用加载的模型进行预测。

代码“with torch.set_grad_enabled(False):”的作用

这行代码的作用是关闭PyTorch的自动求导功能。PyTorch的自动求导机制可以记录张量的计算历史，并且可以在反向传播时自动计算梯度，方便地进行深度学习模型的训练。但是，有些情况下我们不需要梯度信息，例如在推断（inference）阶段或者是在对模型进行评估时，我们只需要利用前向传播计算出模型的预测结果，而不需要进行反向传播计算梯度。此时，关闭自动求导功能可以减少计算开销，提高程序的运行效率。
具体而言，with torch.set_grad_enabled(False)是一个上下文管理器，它会在代码块内部关闭自动求导功能。例如，下面的代码块将会计算模型在测试集上的准确率，但是不需要梯度信息：

with torch.set_grad_enabled(False):
    correct = 0
    total = 0
    for images, labels in test_loader:
        outputs = model(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()
    print('Accuracy of the network on the test images: %d %%' % (100 * correct / total))

在上面的代码中，我们使用了with torch.set_grad_enabled(False)来关闭自动求导功能，然后在代码块内部计算模型的预测结果，并根据预测结果计算模型在测试集上的准确率。由于我们不需要梯度信息，因此关闭自动求导功能可以减少计算开销，提高程序的运行效率。当代码块执行完毕后，自动求导功能会自动恢复到之前的状态。

你可能感兴趣的:(CV&NLP学习,#,———基础入门系列,pytorch,python)

LangChain 源码剖析（二）：LangChain 流程编排的核心骨架——Chain 基类源码剖析 ATM006 人工智能 langchain 大模型 Agent
每一篇文章都短小精悍，不啰嗦。在LangChain框架中，Chain是连接各种组件（模型、工具、数据库等）的核心骨架，负责将多个步骤按逻辑串联成可执行的工作流。无论是简单的「提问-回答」流程，还是复杂的「检索-思考-工具调用」pipeline，都依赖Chain基类提供的基础能力。本文将从架构设计、核心功能到实现细节，全面解析这一基类的设计智慧。一、架构定位：为什么需要Chain基类？Chain基类
非对称加密算法（RSA、ECC、SM2）——密码学基础
对称加密算法（AES、ChaCha20和SM4）Python实现——密码学基础(Python出现Nomodulenamed“Crypto”解决方案)这篇的续篇，因此实践部分少些；文章目录一、非对称加密算法基础二、RSA算法2.1RSA原理与数学基础2.2RSA密钥长度与安全性2.3RSA实现工具与库2.4RSA的局限性三、椭圆曲线密码学(ECC)3.1ECC原理与数学基础3.2常用椭圆曲线标准3.
0727今天感到寂寞徐镁鑫
1.昨天没有午睡，晚上又晚睡，直接导致今天晚起了许多，包括霏，起床了又跑去沙发睡了二十分钟。等吃完早餐（鲜花饼、酸奶、鸡蛋、珍珠李）开始学习，都准备十一点了！我跟着学了十来分钟英语，又补写了昨天的日记。2.医生同学来信息告知前天我去她医院做的糖筛结果，还好，血糖在正常范围内。就是有轻微贫血，同学说，多吃点红枣红皮花生，还有动物血和内脏吧。真没想到我会有贫血，明明那么胖。~胖跟贫血没有关系好吗？！~
WPF利用NotifyIcon创建任务栏图标（菜鸟教程）不喜欢打篮球的厨师不是好程序员 c#windows
学习目标：记录从WPF应用创建开始，一步步到任务栏图标创建的全过程。流程：1、环境：Win10+VS2017打开VS2017，选择文件->新建->项目->VisualC#->Windows桌面->WPF应用->更改项目名为TasbarIcon->确定2、添加图标类右键项目->添加->引用，找到System.Windows.Forms和System.Drawing两个程序集，打上勾添加进去。双击打开
2018-05-25 张景_b55f
姓名:张景公司:扬州方圆建筑有限公司363期（哈尔滨）《六项精进》“谦虚二组”【日精进打卡第62天】【知～学习】背诵《六项精进》5遍背诵《大学》5遍共计570遍【经典名句分享】只要认真的为自己活过，只要为生命中重要的人，努力奋斗过，这本身已是一种完美。【行～实践】一、修身：默背《六项精进》五遍默背《大学》五遍微信步数:20000二、齐家：与父母视频和女友聊天三、建功：淀粉车间B去放线，放控制线A去
大数据领域 Kafka 入门指南：从安装到基础使用大数据洞察大数据与AI人工智能大数据 kafka linq ai
大数据领域Kafka入门指南：从安装到基础使用关键词：Kafka、消息队列、分布式系统、大数据处理、实时数据流、生产者消费者模型、ZooKeeper摘要：本文是一篇全面介绍ApacheKafka的入门指南，从基本概念到实际应用。我们将详细讲解Kafka的核心架构、工作原理，并提供从安装配置到基础使用的完整实践指导。文章包含Kafka的生产者-消费者模型实现、集群部署策略、性能优化技巧，以及在大数据
在NLP深层语义分析中，深度学习和机器学习的区别与联系
在自然语言处理（NLP）的深层语义分析任务中，深度学习与机器学习的区别和联系主要体现在以下方面：一、核心区别特征提取方式机器学习：依赖人工设计特征（如词频、句法规则、TF-IDF等），需要领域专家对文本进行结构化处理。例如，传统情感分析需人工定义“情感词库”或通过词性标注提取关键成分。深度学习：通过神经网络自动学习多层次特征。例如，BERT等模型可从原始文本中捕获词向量、句法关系甚至篇章级语义，无
《沟通的艺术》Day2 张鑫Jackie
1“评价”我们每个人总是太容易去评价别人，更容易去评价自己给别人的评价往往都是负面内容先蹦出来，评价自己往往是只有好的，也只能看到好的评价别人的成本要远小于评价自己，评别人容易评自己难当然，有一定修炼和基础的人，他们能专气致柔，严以律己，宽以待人对待自己严格要求，对待别人宽以待人2今天的一个感悟：给孩子的惊喜，很大一部分是成人营造出来的小朋友获得开心，大人们保护好奇2019.06.04张鑫祝近安
20220812成就感日志225/365 kidII
奋斗是人生的底色，你会经历很多人事物，学会更多的东西。从学习上掌握技能，从学习上享受生活，即便是辛苦也没有关系，生活没有不辛苦的，但是要辛苦的有意义。与其说平凡的过一辈子，不如吃苦耐劳，选择自己喜欢的生活，一点点的付出，积累很多的经验，未来才会有希望。虽然我们渴望成就感，但也需要平衡生活，让自己越来越幸福。1.【日思】：今日最重要的一件事情。调整（训练3h，4k+2h信息1+1.5h信息2+自私的
JAVA 和Python对比 xiayu98020214 在深蓝的日子 python
JAVA和Python对比1.数据类型pythonInt，float，complexnumbers都没有定义到底占用多少个字节空间。都是没有取值范围，也没有无符号的情况。JAVAJAVA有基础数据类型，都有确定占多少个字节2.全局变量python类似c语言，可以定义全局变量，全局的函数。JAVAjava都要定义类才行。3.变量声明python无需声明类型，直接使用。会造成一个困扰，这个变量到底是新
什么情况下需要心理咨询？——中原焦点团队，坚持分享776天，2022-03-13 归鸿_66
心理咨询对象恰恰是正常人，而不是心理有疾病的人（这要去医院就诊，需要药物治疗的。）当正常人有了情绪困扰，工作、学业压力、家庭矛盾，或者其它内心烦恼的话，在咨询室里可以得到释放，能够对自己、对事情认识的更深刻。这样你能心理状态更好更轻松的去应对外边的挑战，面对当下的生活学习。尤其正在成长中的青少年。可以这么说，心理咨询室就是你的解压的驿站，情绪的安放地。走出咨询室，你会变得轻松、自信、有力量。当然，
牛客华为机试题解（python版更新中）
目录一、字符串（知识点）HJ1字符串最后一个单词的长度（简单）HJ2计算某字符出现次数（简单）HJ4字符串分隔（简单）HJ5进制转换（简单）HJ10字符个数统计（简单）HJ11数字颠倒（简单）HJ12字符串反转（简单）HJ14字符串排序（简单）HJ17坐标移动（中等）HJ18识别有效的IP地址和掩码并进行分类统计（较难）自己研究的题解，也有借鉴评论区牛人思路，答案不唯一，仅供学习参考，也欢迎大家指
Three.js入门第一步：两种方式搭建你的3D项目[特殊字符]️
上一篇我们聊了学习Three.js前的“地基”知识，现在地基牢固，该正式动工了！在创造炫酷的3D世界之前，我们得先把开发环境给搭好。官方手册提供了两种主流的安装方式，分别适用于不同场景。选对方法，事半功倍！方式一：CDN+Importmap(极速上手)这是官方最为推荐的、也是最简单的入门方式，尤其适合学习、做小练习、或者快速验证一个想法。优点：无需安装任何东西！只需要一个能联网的浏览器。操作方法：
python比java_对比java和python对比
对比java和python对比java和python2011年04月18日1.难易度而言。python远远简单于java。2.开发速度。Python远优于java3.运行速度。java远优于标准python，pypy和cython可以追赶java，但是两者都没有成熟到可以做项目的程度。4.可用资源。java一抓一大把，python很少很少，尤其是中文资源。5.稳定程度。python3和2不兼容，造
欣诚幼儿园小六班：冬日相伴，温暖如初欣诚幼儿园郑雅文
太阳当空照花儿对我笑小鸟说早早早你为什么背上小书包我去上学校天天不迟到爱学习爱劳动长大要为人民立功劳集体活动：周一：《哈巴狗》1.学习歌曲《哈巴狗》，能够边唱边跟随歌曲内容变换动作。2.愿意表演歌曲，体验表演的乐趣。周二：《小鱼游游》1.愿意和同伴一起玩“捉迷藏”游戏，感受游戏的乐趣。2.会使用水彩笔或者油画棒画曲线。周三：《咪咪猫》1.喜欢并尝试模仿儿歌中的语言，体会其中的乐趣。2.理解儿歌内容
58、JavaScript中的类定义与对象创建 pepper JavaScript 类定义对象创建
JavaScript中的类定义与对象创建1.引言在现代Web开发中，JavaScript已经成为不可或缺的一部分。随着JavaScript的发展，面向对象编程（OOP）的概念也逐渐融入其中。通过定义类和创建对象，可以使代码更加模块化、易于维护和复用。本文将详细介绍如何在JavaScript中定义新类，并创建自定义对象，包括属性和方法的添加。2.构造函数的基础构造函数是一种特殊的函数，主要用于创建和
致自己的几句话 sundy007
图片发自App1.昨天的成功对今天的你来说，如果还是大事，说明你今天什么大事都没做！2.如果现在的你和一年前的你一样，意味着你没有成长。即使成绩依旧表现不错，让客户着迷，那依然是吃老本的行为！3.一个人最难做的是否定自己，尤其是自己过去成功的经验，如果不否定，总重复过去的套路，就没有了学习进步的空间！4.这个世界有偶然的运气，也有必然的运气。人应该追求必然的运气，通过努力踏踏实实的达到某个状态，某
深度学习--利用梯度下降法进行多变量的二分类（感知机）白话学生nit 深度学习分类人工智能
其实这一节涉及到了感知机的相关知识，就把这一节当作是学习感知机的引子吧。什么是二分类我们先来说一下什么是二分类，二分类指的是将结果分为两个互斥的类别，通常用来表示问题的两种可能。为什么用感知机学习二分类常见的解决问题的模型有很多，这里我们使用感知机模型。至于为什么，因为感知机模型很多地方用起来比较简便，就拿我们这一节的问题举一下例子，我们需要依照房子的价格对房子进行分类。在感知机模型中，我们可以使
Self-Consistency：跨学科一致性的理论与AI推理的可靠性基石大千AI助手人工智能 Python #Prompt 人工智能机器学习神经网络算法大模型幻觉 LLM
本文综合其在逻辑学、心理学及人工智能领域的核心定义、技术实现与前沿进展来对Self-Consistency（自洽性）进行系统性解析。本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与跨学科内涵基础概念逻辑学定义：指理论或系统内部逻辑自洽，无矛盾或悖论。例如物理理论中，狭义相对论的速度变换
*SFT深度实践指南：从数据构建到模型部署的全流程解析大千AI助手人工智能 Python #OTHER 人工智能深度学习算法大模型 SFT 微调 Lora
一、SFT技术原理与定位核心定义SFT是在预训练语言模型（如LLaMA、GPT）基础上，利用标注数据优化模型以适应特定任务的技术。其本质是通过调整模型参数，将通用语言能力迁移至专业领域（如法律、医疗）或任务（如对话生成、代码补全）。与预训练的区别预训练：使用无标注数据（如维基百科）学习通用表征，消耗千亿级token算力。SFT：使用标注数据（如指令-答案对）进行任务适配，成本仅为预训练的1/100
迁移学习：知识复用的智能迁移引擎 | 从理论到实践的跨域赋能范式大千AI助手人工智能 Python #OTHER 迁移学习人工智能机器学习算法神经网络大模型迁移
让AI像人类一样“举一反三”的通用学习框架本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与基本概念迁移学习（TransferLearning）是一种机器学习范式，其核心思想是：将源领域（SourceDomain）学到的知识迁移到目标领域（TargetDomain），以提升目标任务的性能
QuecPython-正则表达式移远通信正则表达式 python
该模块通过正则表达式匹配数据。目前支持的操作符较少，部分操作符暂不支持。示例：importureres='''$GNRMC,133648.00,A,3149.2969,N,11706.9027,E,0.055,,311020,,,A,V*18$GNGGA,133648.00,3149.2969,N,11706.9027,E,1,24,1.03,88.9,M,,M,,*6C$GNGLL,3149.2
春节假期已经过去了三天半！我慌！我玩耍悟道！成帅康
今天是我放假的第三天，我已经三天不上班了，不是我已经用了三天假期，我三天假期消失了！！！我都干了啥？？？-01-复盘前两天第一天，完成5个20分钟学习时间，写了100个以上字，和二狗爬山（我负重绑腿），和朋友聊了电子烟，看《三体》第二天，完成5个20分钟学习时间，写了100个以上字，找二狗玩，他和初中同学出去了找铁柱，他说车上人满了找铁皮，他和朋友们在买肉找欠我钱的闰土，他说过两天我孤独的洗车，孤
华为牛客网python考试题库及答案 2401_86114846 服务器
亲爱的朋友们，今天我们要讨论，牛客网华为软件测试题库牛客网华为机试题答案，让我们开始吧！目录一、字符串（知识点）HJ1字符串最后一个单词的长度（简单）HJ2计算某字符出现次数（简单）HJ4字符串分隔（简单）HJ5进制转换（简单）HJ10字符个数统计（简单）HJ11数字颠倒（简单）HJ12字符串反转（简单）HJ14字符串排序（简单）HJ17坐标移动（中等）HJ18识别有效的IP地址和掩码并进行分类统
【Python】LEGB作用域 + re模块 + 正则表达式
文章目录一LEGB作用域二re（RegularExpression）预览1.`re.match()`——从字符串开头匹配2.`re.search()`——搜索整个字符串3.`re.findall()`——返回所有匹配的字符串列表4.`re.finditer()`——返回所有匹配的迭代器5.`re.sub()`——替换匹配的字符串6.`re.split()`——按正则表达式分割字符串7.`re.co
java和ptyhon对比悟能不能悟 java 开发语言
1.语言特性对比维度JavaPython语法风格静态类型，需显式声明变量类型；代码冗长（需分号、大括号）动态类型，变量类型自动推断；简洁（缩进代替大括号，无分号）编程范式严格面向对象（OOP），强制类与对象结构多范式支持（OOP、函数式、命令式），更灵活执行方式编译型（JVM运行字节码）解释型（逐行执行）⚡2.性能与效率执行速度：Java：编译优化后运行效率高，尤其擅长高并发（如电商秒杀系统）。P
计算机发展史：集成电路时代的微缩革命 jdlxx_dongfangxing 计算机发展史计算机发展史
当晶体管计算机在性能提升和应用拓展中逐渐遇到瓶颈时，一场新的技术革命正在悄然酝酿。集成电路的诞生，如同在电子世界掀起了一场“微缩革命”，将计算机带入了一个全新的时代——集成电路时代。从20世纪60年代末到70年代末，集成电路技术的飞速发展使得计算机在体积、功耗、性能和成本等方面发生了翻天覆地的变化，为个人计算机的出现和普及奠定了坚实的基础。集成电路的诞生：电子元件的集成化突破集成电路的发明是电子技
数字图像处理与Python语言实现-Box模糊CUDA实现视觉与物联智能数字图像处理与Python实现 python 深度学习计算机视觉图像处理 CUDA
Box模糊CUDA实现文章目录Box模糊CUDA实现1、Box模糊的基本原理2、算法优化：滑动窗口技术3、参数对模糊效果的影响4、Box模糊的优缺点5、与高斯模糊的对比6、实际应用场景7、算法实现7.1PyCUDA实现7.2CuPy实现7.3C++与CUDA实现8、总结在图像处理领域，**Box模糊（方框模糊或均值模糊）**是一种基础且高效的模糊算法，其核心思想是通过对像素邻域内的颜色值取平均值来
端午安康 yizhi雯子
端午，有一个不在家过的日子。离了家，什么节日都没有氛围了，就连粽子也不想吃了，今天早上还是舍友硬要我拿一个粽子，我才勉勉强强拿了一个三角粽，和另外一个人对半分了。粽子的味道不错，但是就是没有家的那种感觉。每年端午，都会包粽子，因为大家都放假了，家里也都热闹起来了。可现如今，我是一个在外求学的人，家里的热闹与我无关，但是好像，现在的家里一点也不热闹了。几乎所有人都外出学习了，还能热闹到哪里去，今年好
【爬虫】某某查cookie逆向 kisloy 逆向爬虫爬虫 python
代码仅供技术人员进行学习和研究使用，请勿将其用于非法用途或以任何方式窃取第三方数据。使用该代码产生的所有风险均由用户自行承担，作者不对用户因使用该代码而造成的任何损失或损害承担任何责任。加密参数加密参数主要是cookie，其中只有三个cookie最重要，BAIDUIDBAIDUID_BFESS和一个ab开头的cookiecookie获取BAIDUID和BAIDUID_BFESS在访问百度系的产品时
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs