孟孟单单

PyTorch深度学习-跟着小土堆学习

学习视频链接
一些问题
P4：Python/PyTorch学习中两大法宝函数-dir()、help()
P5：PyCharm及Jupyter使用及对比
P6：PyTorch加载数据初认识
P7：Dataset类代码实战
P8：TensorBoard的使用（一）
P9：TensorBoard的使用（二）
P10-11：Transeforms的使用（一）（二）
P12-13：常见的transforms（一）（二）
P14：torchvision中的数据集使用
P15：DataLoader的使用
P16：神经网络的基本骨架-nn.Module的使用
P17：土堆说卷积操作（可选看）torch.nn.functional.conv2d
P18：神经网络-卷积层 torch.nn.Conv2d
P19：神经网络-最大池化的使用 torch.nn.MaxPool2d
P20：神经网络-非线性激活
P21：神经网络-线形层及其他层介绍
P22：神经网络-搭建小实战和Sequential的使用
P23：损失函数与反向传播
P24：优化器（一）
P25：现有网络模型的使用及修改
P26：自定义的网络模型的保存与读取
P27：完整的模型训练套路（一）~（四）

学习视频链接

学习非一日之功，而我又是脑子转得慢，只有慢慢学起来呀！

先从第一个【小土堆】的视频学起来！

PyTorch深度学习快速入门教程（绝对通俗易懂！）【小土堆】
《PyTorch深度学习实践》完结合集-刘二大人

【小土堆】给出的资料：（2021-5-31完结的）

个人公众号：土堆碎念

各种资料，请自取。
代码：https://github.com/xiaotudui/PyTorch-Tutorial
蚂蚁蜜蜂/练手数据集：链接: https://pan.baidu.com/s/1jZoTmoFzaTLWh4lKBHVbEA 密码: 5suq
课程资源：https://pan.baidu.com/s/1CvTIjuXT4tMonG0WltF-vQ?pwd=jnnp 提取码:jnnp

有用的链接：

cv2、plt 、PIL显示图像
解决 OpenCV cv2.imread()、cv2.imwrite()函数无法读取、写入以中文命名的图像文件及含有中文路径的图像文件
图像的3种表示格式的每个维度的含义：
- tensor：tensor.shape -> torch.Size([C, H, W]) # 在训练过程中通常会在0维上扩充一个维度来表示batchsize，即torch.Size([batchsize, C, H, W])
- numpy.ndarray：ndarray.shape -> (H, W, C) # 这个格式通常是用cv2.imread(img_path)读取到的，或者用np.array(PIL.Image)转换得到的。
- PIL.Image：Image.size -> (W, H) # 注意这个使用的是size而不是shape，而且是只有两个元素的tuple，且分别表示的宽W、高H。（而不似tensor、numpy那样有3个元素且先表示的高H，再表示的宽W）

一些问题

tensorboard中的x轴是step还是epoch？这是自己去设定的嘛？

P4：Python/PyTorch学习中两大法宝函数-dir()、help()

dir() 函数，打开工具箱（例如PyTorch，进一步打开某一些分隔区）

help() 函数，查看工具包中某一个工具函数的用法（说明书）

(1) 查看torch工具包有哪些分割区

dir(torch)
# ['AVG', 'AggregationType', 'AnyType', 'Argument', 'ArgumentSpec', 'BFloat16Storage', 'BFloat16Tensor',...]

(2) 查看torch.cuda有哪些分隔区

dir(torch.cuda)
# ['Any', 'BFloat16Storage', 'BFloat16Tensor', 'BoolStorage', 'BoolTensor', 'ByteStorage', ...]

(3) 查看torch.cuda.is_available()有哪些分隔区

dir(torch.cuda.is_available())	# 函数后面的()去掉，效果一样
# ['__abs__', '__add__', '__and__', '__bool__', '__ceil__', '__class__', ...]

此时发现前后都是带有两个下划线的：__这说明是规定好不可更改的，也就说明是torch.cuda.is_available不再是一个分隔区而是一个函数，因此可调用help()来查看该函数的基本作用。

help(torch.cuda.is_available) 	# 注意这后面不能跟有()

# 打印结果，该函数会返回一个bool值
# Help on function is_available in module torch.cuda:
# is_available() -> bool
#     Returns a bool indicating if CUDA is currently available.

P5：PyCharm及Jupyter使用及对比

在这个教程中获得了一个在指定环境中打开Jupyter的小tips：

打开cmd，然后依次键入以下两行命令，然后将cmd中出现的URL粘贴进浏览器打开即可：

activate yolov5
jupyter notebook

---------------------------------------------------------------------------

oh！从这里开始就在编写另外一个博客了：关于使用Jupyter的几个tips

继续学习！！！

---------------------------------------------------------------------------

P6：PyTorch加载数据初认识

P7：Dataset类代码实战

如果是小白的话，真的很建议去看看这个视频！UP主用了PyCharm + Python Console配合着来看结果的生成的，非常棒！

主要内容：

手写加载数据集的类：MyData。主要是要重写__init__()、__getitem__()、__len()__这3个类。
get到一个小技巧，可以直接用+对两个Data类进行拼接（可用于数据集不足时，直接将两个数据集这样加起来一起使用）
new_path = os.path.join(path1,path2,...)将所有路径联合起来，返回一个整合路径（str）
file_name_list = os.listdir(path)读取path路径中的所有文件名称，返回一个名称列表（list）

read_data.py:

from torch.utils.data import Dataset
from PIL import Image
import os

# 构造一个子文件夹数据集类MyData
class MyData(Dataset):
    def __init__(self, root_dir, label_dir):    # root_dir是指整个数据集的根目录，label_dir是指具体某一个类的子目录
        # 在init初始化函数中，定义一些类中的全局变量，即跟在self.后的变量们
        self.root_dir = root_dir
        self.label_dir = label_dir
        self.path = os.path.join(self.root_dir, self.label_dir)
        self.img_list = os.listdir(self.path)

    def __getitem__(self, index):   # 传入下标获取元素
        img_name = self.img_list[index]
        img_item_path = os.path.join(self.path, img_name)
        img = Image.open(img_item_path)
        label = self.label_dir
        return img, label[:-6]	# 返回的是一个元组
        # 这里进行了截取，因为我不想要label_dir最后面的'_image'这6个元素

    def __len__(self):
        return len(self.img_list)

# --------------实例化ants_data和bees_data------------- #
root_dir = 'dataset/train'
ants_dir = 'ants_image'
bees_dir = 'bees_image'
ants_data = MyData(root_dir, ants_dir)
bees_data = MyData(root_dir, bees_dir)
# ---------------------------------------------------- #

# -------------返回一个元组，分别赋值给img和label------- #
img, label = ants_data[0]
# ----------------------------------------------------- #

# ---因为是元组，所以可用[0]、[1]直接提取出img、label---- #
print(label == ants_data[0][1])		# true
# ----------------------------------------------------- #

# ----------将ants_data和bees_data相加起来使用---------- #
y = ants_data + bees_data
len_ants = len(ants_data)	# 124
len_bees = len(bees_data)	# 121
len_y = len(y)				# 245
print(len_y == len_ants+len_bees)	# True
print(y[123][1])			# ants
print(y[124][1])			# bees

P8：TensorBoard的使用（一）

之前写过一篇文章，可能会有点帮助：tensorboard初体验

主要内容：

调用SummaryWriter类：from torch.utils.tensorboard import SummaryWriter（摘要编写器）

Writes entries directly to event files in the log_dir to be consumed by TensorBoard.
The SummaryWriter class provides a high-level API to create an event file in a given directory and add summaries and events to it. The class updates the file contents asynchronously. This allows a training program to call methods to add data to the file directly from the training loop, without slowing down training.
将条目直接写入log_dir中的事件文件，供TensorBoard使用。
“SummaryWriter”类提供了一个高级API，用于在给定目录中创建事件文件，并向其中添加摘要和事件。该类异步更新文件内容。这允许训练程序调用方法直接从训练循环中向文件添加数据，而不会降低训练速度。

如果调用SummaryWriter类没有传入log_dir参数的话，会默认在当前目录下新建一个runs文件夹用于存放训练过程中的event事件文件。（SummaryWriter的其他参数一般用不到）

官方给出的例子：

(1) 使用自动生成的文件夹名称runs创建SummaryWriter()。

writer = SummaryWriter()
# folder location: runs/May04_22-14-54_s-MacBook-Pro.local/

(2) 使用指定的文件夹名称my_experiment创建SummaryWriter()。

writer = SummaryWriter("my_experiment")
# folder location: my_experiment

(3) 创建一个附加注释的SummaryWriter()。

writer = SummaryWriter(comment="LR_0.1_BATCH_16")
# folder location: runs/May04_22-14-54_s-MacBook-Pro.localLR_0.1_BATCH_16/

主要会用到两种方法：
writer.add_image(tag, tensor, step) # 添加图像（模型图像，观察训练结果）
writer.add_scalar(tag, tensor, step) # 添加标量（就是一些数据的变化曲线，比如loss）
writer.add_graph(model, input) # 查看模型计算图（在P22有使用到）

(1) writer.add_image() # 添加图像（模型图像，观察训练结果）

def add_image(self, tag, img_tensor, global_step=None, walltime=None, dataformats='CHW'):

     Note that this requires the ``pillow`` package.

     Args:
         tag (string): Data identifier	# 数据标识符（就是图标的title）
         img_tensor (torch.Tensor, numpy.array, or string/blobname): Image data	# 图像数据（指明传入的数据类型只能是torch.Tensor，numpy.array，string）
         global_step (int): Global step value to record	# 要训练多少步（就是x轴）
         walltime (float): Optional override default walltime (time.time())
           seconds after epoch of event
           
     Shape:
         img_tensor: Default is :math:`(3, H, W)`. You can use ``torchvision.utils.make_grid()`` to
         convert a batch of tensor into 3xHxW format or call ``add_images`` and let us do the job.
         Tensor with :math:`(1, H, W)`, :math:`(H, W)`, :math:`(H, W, 3)` is also suitable as long as
         corresponding ``dataformats`` argument is passed, e.g. ``CHW``, ``HWC``, ``HW``.

     Examples::
         from torch.utils.tensorboard import SummaryWriter
         import numpy as np
         img = np.zeros((3, 100, 100))
         img[0] = np.arange(0, 10000).reshape(100, 100) / 10000
         img[1] = 1 - np.arange(0, 10000).reshape(100, 100) / 10000

         img_HWC = np.zeros((100, 100, 3))
         img_HWC[:, :, 0] = np.arange(0, 10000).reshape(100, 100) / 10000
         img_HWC[:, :, 1] = 1 - np.arange(0, 10000).reshape(100, 100) / 10000

         writer = SummaryWriter()
         writer.add_image('my_image', img, 0)

         # If you have non-default dimension setting, set the dataformats argument.
         writer.add_image('my_image_HWC', img_HWC, 0, dataformats='HWC')
         writer.close()

     Expected result:

     .. image:: _static/img/tensorboard/add_image.png
        :scale: 50 %

(2) writer.add_scalar() # 添加标量（就是一些数据的变化曲线，比如loss）

def add_scalar(self, tag, scalar_value, global_step=None, walltime=None):

    Args:
        tag (string): Data identifier	# 数据标识符（就是图标的title）
        scalar_value (float or string/blobname): Value to save	# 要保存的数值（就是y轴）
        global_step (int): Global step value to record	# 要训练多少步（就是x轴）
        walltime (float): Optional override default walltime (time.time())
          with seconds after epoch of event
          
	Examples::
        from torch.utils.tensorboard import SummaryWriter
        writer = SummaryWriter()
        x = range(100)
        for i in x:
            writer.add_scalar('y=2x', i * 2, i)
        writer.close()
        
    Expected result:
	.. image:: _static/img/tensorboard/add_scalar.png
	    :scale: 50 %

最后还需要关闭：writer.close()
打开tensorboard观察图表的方式：在pycharm的终端Terminal中键入tensorboard --logdir=logs --port=6007（最后指定端口的操作是可选的，这里指定端口是为了避免：当前有多人在使用同一个服务器的默认端口进行训练而造成的拥塞）
注意：
1）当前面3步运行完之后，再通过第4步指定event文件的存放路径，将event文件们显示进行观察。
2）如果同一logdir下存放了多个相同tag的event文件，则绘图时会发生混乱。解决方案：将此logdir下的文件全部删除，然后重新运行。or构建子文件夹，也就是说创建新的SummaryWriter(‘新文件夹’)

本节例子只使用到了writer.scalar()：

from torch.utils.tensorboard import SummaryWriter

writer = SummaryWriter('logs')  # 实例化一个SummaryWriter为writer，并指定event的保存路径为logs
for i in range(10):
    writer.add_scalar('y=2x', 2 * i, i)
writer.close()  # 最后还需要将这个writer关闭

P9：TensorBoard的使用（二）

主要内容：

运用writer.add_image()。由上节 P8 可知，add_image能处理的图像数据类型是：torch.Tensor、numpy.array、String。
（而在 P7 中运用的 PIL.Image 读取的数据类型是PIL.JpegImagePlugin.JpegImageFile，所以需要转换成 numpy.array 才可放进 add_image 中使用。本节课直接采用的opencv读取numpy数据）
利用numpy.array() 将 PIL 转为 numpy.ndarray

from PIL import Image
image_path = 'dataset/train/ants_image/0013035.jpg'
img = Image.open(image_path)
print(type(img))	# 

import numpy as np
img_array = np.array(img)	
print(type(img_array))	#

又是一个重点，由 P8 可知，img_tensor的shape是有要求的！

img_tensor: Default is :math:(3, H, W). You can use torchvision.utils.make_grid() to convert a batch of tensor into 3xHxW format or call add_images and let us do the job.
Tensor with :math:(1, H, W), :math:(H, W), :math:(H, W, 3) is also suitable as long as corresponding dataformats argument is passed, e.g. CHW, HWC, HW.

要求：

img_tensor的默认shape是(3, H, W)
如果要使用其他的shape，则需要通过dataformats来指明一下，即：dataformats=‘CHW’、dataformats=‘HWC’、dataformats=‘HW’

通过方式2将PIL转换为numpy后，虽然满足了img_tensor的数据类型要求，但是没有满足img_tensor的默认shape要求。

因为转换后的numpy的shape是(H,W,C)，也就是说channel=3在最后一维，所以还需要在add_image()中添加参数dataformats=(H,W,C)（或者手动调整一下维度，代码为img_array = img_array.transepose(2, 0, 1)，然后就不用添加dataformats参数了）。

print(img_array.shape)	# (512, 768, 3)

opencv是按照BGR读取的图像，记得转换为RGB：cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

整体代码为：

from torch.utils.tensorboard import SummaryWriter
from PIL import Image
import numpy as np

writer = SummaryWriter('logs_3')  # 实例化一个SummaryWriter为writer，并指定event的保存路径为logs

image_path1 = 'dataset/train/ants_image/0013035.jpg'
image_path2 = 'dataset/train/bees_image/16838648_415acd9e3f.jpg'

img = Image.open(image_path2)	# image_path1
img_array = np.array(img)
print(type(img))  # 
print(type(img_array))  # 
print(img_array.shape)

# 这里的add_image中的tag为'test_image'没有变化，所以在tensorboard中可通过拖动滑块来展示这两张图像
# writer.add_image('test_image', img_array, 1, dataformats='HWC')
writer.add_image('test_image', img_array, 2, dataformats='HWC')

for i in range(10):	# 这个add_scalar暂时没有管它，虽然tag没有变，但是因为每次写入的数据都是y=3x所以曲线没有显示混乱
    writer.add_scalar('y=3x', 3 * i, i)

writer.close()  # 最后还需要将这个writer关闭

（1）同一个tag显示多张图像（拖动滑条）

（2）多个tag显示

P10-11：Transeforms的使用（一）（二）

主要内容：

torchvision中的transeforms，主要是对图像进行变换（预处理）。from torchvision import transforms

transeforms中常用的就是以下几种方法：（Alt+7可唤出左侧的Structure结构）

“Compose”, “ToTensor”, “PILToTensor”, “ConvertImageDtype”, “ToPILImage”, “Normalize”, “Resize”, “Scale”,“CenterCrop”

Compose: Composes several transforms together. Args:list of transforms to compose.将几个变换组合在一起。参数：[Transform对象列表]，例如transforms.Compose([transforms.CenterCrop(10),transforms.ToTensor(),…])
ToTensor: Convert a PIL Image or numpy.ndarray to tensor.
ToPILImage: Convert a tensor or an ndarray to PIL Image.
Normalize(torch.nn.Module): Normalize a tensor image with mean and standard deviation.This transform does not support PIL Image.用平均值和标准偏差归一化张量图像。此转换不支持PIL图像。（为n个维度给定mean:(mean[1],…,mean[n])和std:(std[1],…,std[n])，此转换将对每个channel进行归一化）
Resize(torch.nn.Module): Resize the input image (PIL Image or Tensor) to the given size.Return PIL Image or Tensor: Rescaled image.将输入的图像(PIL Image or Tensor)的大小缩放到指定的size尺寸。size (sequence or int)，当是sequence时则调整到指定的(h, w)；当是int时，就将原图的min(h,w)调整到size大小，然后另一条边进行等比例缩放。
RandomCrop(torch.nn.Module): Crop the given image (PIL Image or Tensor) at a random location.在随机位置裁剪给定的size大小的图像（size的输入要求跟Resize一样）。

python的用法 -> tensor数据类型

通过transforms.ToTensor去看两个问题：
（1）transforms该如何使用（python）
（2）为什么我们需要Tensor数据类型：因为在tensor中封装了许多训练神经网络中会用到的参数，例如requires_grad等。

（1）用ToTensor()将PIL Image转为tensor

也可以用 ToTensor() 将 numpy.ndarray 转为tensor（用opencv读入的数据类型是numpy.ndarray）

import numpy as np
from torchvision import transforms
from PIL import Image

image_path = 'dataset/train/ants_image/0013035.jpg'
image = Image.open(image_path)

# 1.transforms该如何使用(python)
tensor_trans = transforms.ToTensor()	# ToTensor()中不带参数
tensor_img = tensor_trans(image)		# 不能直接写成transforms.ToTensor(image)

print(np.array(image).shape)	# (512, 768, 3)
print(tensor_img.shape)			# torch.Size([3, 512, 768])，通道数变到第0维了

（2）ToTensor与Tensorboard配合使用

import numpy as np
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms
from PIL import Image

image_path = 'dataset/train/ants_image/0013035.jpg'
image = Image.open(image_path)

# 1.transforms该如何使用(python)
tensor_trans = transforms.ToTensor()
tensor_img = tensor_trans(image)

print(np.array(image).shape)
print(tensor_img.shape)

# 写入tensorboard
writer = SummaryWriter('logs')
writer.add_image('tag', tensor_img, 1)
writer.close()

P12-13：常见的transforms（一）（二）

这张图挺棒的！因为图像的数据类型在不同场景往往不同，很容易出错，需要转换为特定格式才能使用！

主要内容：

了解python中某个类的内置函数__call__的用法（用__表示是内置函数）

参考链接：详解Python的__call__()方法

__call__()方法的作用：把一个类的实例化对象变成了可调用对象。调用该实例对象就是执行__call__()方法中的代码。
可以通过内置函数callable来判断是否是可调用对象。例如判断p是否为可调用对象：print(callable(p))返回 True 或 False。

CallTest.py

class Person:
    def __call__(self, name):
        print('__call__' + ' Hello ' + name)

    def hello(self, name):
        print('hello ' + name)


person = Person()               # 实例化一个对象person
person('zhangsan')              # 像调用函数一样调用person对象
person.__call__('zhangshan_2')  # 也可像调用类函数调用
person.hello('wangwu')          # 调用类函数person

# __call__ Hello zhangsan
# __call__ Hello zhangshan_2
# hello wangwu

例子ToTensor、Normalize、Resize、Compose

Compose: Composes several transforms together. Args:list of transforms to compose.将几个变换组合在一起。参数：[Transform对象列表]，例如transforms.Compose([transforms.CenterCrop(10),transforms.ToTensor(),…])
注意：Compose的参数列表是会按照参数的顺序来对图像进行操作的，相当于list[0]的输出会作为list[1]的输入，以此类推，要注意每种transforms函数的输入数据格式要求，有些是要求为tensor，有些是PIL。
ToTensor: Convert a PIL Image or numpy.ndarray to tensor.
ToPILImage: Convert a tensor or an ndarray to PIL Image.
Normalize(torch.nn.Module): Normalize a tensor image with mean and standard deviation.This transform does not support PIL Image.用平均值和标准偏差归一化张量图像。此转换不支持PIL图像。（为n个维度给定mean:(mean[1],…,mean[n])和std:(std[1],…,std[n])，此转换将对每个channel进行归一化）
Resize(torch.nn.Module): Resize the input image (PIL Image or Tensor) to the given size.Return PIL Image or Tensor: Rescaled image.将输入的图像(PIL Image or Tensor)的大小缩放到指定的size尺寸。size (sequence or int)，当是sequence时则调整到指定的(h, w)；当是int时，就将原图的min(h,w)调整到size大小，然后另一条边进行等比例缩放。
RandomCrop(torch.nn.Module): Crop the given image (PIL Image or Tensor) at a random location.在随机位置裁剪给定的size大小的图像（size的输入要求跟Resize一样）。

总结使用方法：

查看函数的官方文档（Ctrl+点击进去）：主要关注它的输入和输出是什么数据格式、所需的输入参数、作用是什么。
配合使用Debug：不清楚到变量image某一步的时候值或类型是什么的时候，可以打上断点，用Debug，然后在Debug的console执行type(image)、image.shape等操作进行查看。（可看下我的这篇文章：PyCharm的Debug和中断方法）

use_transforms.py

from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms
from PIL import Image

image_path = 'images/cat2.jpg'
image = Image.open(image_path)

writer = SummaryWriter('logs_2')

# 1.Totensor
trans_totensor = transforms.ToTensor()
img_tensor = trans_totensor(image)
writer.add_image('ToTensor', img_tensor)  # 这里只传入了tag和image_tensor，没有写入第3个参数global_step，则会默认是第0步

# 2.Normalize 可以改变色调
trans_norm = transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
img_norm = trans_norm(img_tensor)
writer.add_image('Normalize', img_norm)

trans_norm = transforms.Normalize([1, 3, 5], [3, 2, 1])
img_norm_2 = trans_norm(img_tensor)
writer.add_image('Normalize', img_norm_2, 1)

trans_norm = transforms.Normalize([2, 0.5, 3], [5, 2.6, 1.5])
img_norm_3 = trans_norm(img_tensor)
writer.add_image('Normalize', img_norm_3, 2)

# 3.Resize 将PIL或者tensor缩放为指定大小然后输出PIL或者tensor
w, h = image.size   # PIL.Image的size先表示的宽再表示的高

trans_resize = transforms.Resize(min(w, h) // 2)    # 缩放为原来的1/2
img_resize = trans_resize(image)  # 对PIL进行缩放
writer.add_image('Resize', trans_totensor(img_resize))  # 因为在tensorboard中显示，所以需要转换为tensor或numpy类型

trans_resize = transforms.Resize(min(w, h) // 4)    # 缩放为原来的1/4
img_resize_tensor = trans_resize(img_tensor)
writer.add_image('Resize', img_resize_tensor, 1)

# 4.compose 组合这些操作
trans_compose = transforms.Compose(
    [transforms.Resize(min(w, h) // 2), transforms.ToTensor(), transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])])
img_campose = trans_compose(image)  # image是PIL.Image格式
writer.add_image('Compose', img_campose)

# 5.Randomcrop 随机裁剪
trans_randomcrop = transforms.RandomCrop(min(w, h) // 4)    # 从原图中任意位置裁剪1/4
# img_ranomcrop = trans_randomcrop(img_tensor)
for i in range(10):
    img_ranomcrop = trans_randomcrop(img_tensor)
    writer.add_image('RandomCrop', img_ranomcrop, i)

# close()一定要记得写啊！
writer.close()

P14：torchvision中的数据集使用

主要内容：

之前的课程中transforams是对单张图片进行处理，而制作数据集的时候，是需要对图像进行批量处理的。因此本节是将torchvision中的datasets和transforms联合使用对数据集进行预处理操作。

（torchvision官方文档地址：https://pytorch.org/vision/stable/index.html）
torchvision.datasets中提供了内置数据集和自定义数据集所需的函数（DatasetFolder、ImageFolder、VisionDataset）。（torchvision.datasets官方文档地址：https://pytorch.org/vision/stable/datasets.html）
torchvision.models中包含了已经训练好的图像分类、图像分割、目标检测的神经网络模型。（torchvision.models的官方文档地址：https://pytorch.org/vision/stable/models.html）
（图像分类还比较全面，目标检测不太全，没有包含yolo，可以去下载mmdetection包：https://github.com/open-mmlab/mmdetection）
torchvision.transforms对图像进行转换和增强。（torchvision.transforms的官方文档地址：https://pytorch.org/vision/stable/transforms.html）
torchvision.utils包含各种实用工具,主要用于可视化（tensorboard是在torch.utils.tensorboard中）。（torchvision.utils的官方文档地址：https://pytorch.org/vision/stable/utils.html）

太宝藏的UP主了，迅雷下载也教！源代码中会提供数据集的下载链接。例如用Ctrl+点击CIFAR10跳进其源码，往上翻一下就能看到下载链接是url = "https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz"。然后将这个链接粘贴进迅雷中就可以快速下载了！

import torchvision
from torch.utils.tensorboard import SummaryWriter
from torchvision.transforms import transforms

# 1. 用transforms设置图片转换方式
data_transform = transforms.Compose([  # 用Compose将所有转换操作集合起来
    transforms.ToTensor()  # 因为CIFAR10数据集的每张图像size=(32,32)比较小，所以只进行ToTensor的操作
])

# 2. 加载内置数据集CIFAR10，并设置transforms（download最好一直设置成True）
#   1. root:（若要下载的话）表示数据集存放的根目录
#   2. train=True 或者 False，分别表示是构造训练集train_set还是测试集test_set
#   3. transform = data_transform，用自定义的data_transform对数据集中的每张图像进行预处理
#   4. download=True 或者 False，分别表示是否从网上下载数据集到root中（如果root下已有数据集，尽管设置成True也不会再下载了，所以download最好一直设置成True）
train_set = torchvision.datasets.CIFAR10('./dataset', train=True, transform=data_transform, download=True)
test_set = torchvision.datasets.CIFAR10('./dataset', train=False, transform=data_transform, download=True)

# 3. 写进tensorboard查看
writer = SummaryWriter('CIFAR10')
for i in range(10):
    img, label = test_set[i]    # test_set[i]返回的依次是图像(PIL.Image)和类别(int)
    writer.add_image('test_set', img, i)

writer.close()

P15：DataLoader的使用

官方文档地址：torch.utils.data.DataLoader

CLASS torch.utils.data.DataLoader(dataset, batch_size=1, shuffle=False, 
	sampler=None, batch_sampler=None, num_workers=0, collate_fn=None, 
	pin_memory=False, drop_last=False, timeout=0, worker_init_fn=None, 
	multiprocessing_context=None, generator=None, *, prefetch_factor=2, 
	persistent_workers=False)

除了dataset（指明数据集的位置）之外的参数都设置了默认值。

torch.utils.data.DataLoader重点关注的参数有：

dataset (Dataset)：指明从哪个数据集加载数据（如上节中自定义的train_set）
batch_size (int)：每个批次（batch）加载多少样本。
shuffle (bool)：每轮（epoch）是否打乱样本的顺序。（最好设置成True）
num_workers (int)：有多少个子流程用于数据加载。0表示主进程加载。（在Windows下只能设置成0，不然会出错！虽然default=0，但是最好还是手动再设置一下num_workers=0）
drop_last (bool)：如果数据集大小不能被batch_size整除，则最后一个批次将会不完整（即样本数（默认为False，即会保存最后那个不完整的批次）。

P16：神经网络的基本骨架-nn.Module的使用

主要内容：

搭建Neural Network骨架主要用到的包是torch.nn，官方文档网址：https://pytorch.org/docs/stable/nn.html，其中torch.nn.Module很重要，是所有所有神经网络模块的基类（即自己搭建的网络必须继承torch.nn.Module基类），官方文档地址：https://pytorch.org/docs/stable/generated/torch.nn.Module.html#torch.nn.Module。
自己搭建模型时，集成torch.nn.Module后必须要重写两个函数：__init__()和forward()。

import torch.nn as nn
import torch.nn.functional as F

class Model(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Conv2d(1, 20, 5)
        self.conv2 = nn.Conv2d(20, 20, 5)

    def forward(self, x):
        x = F.relu(self.conv1(x))
        return F.relu(self.conv2(x))

P17：土堆说卷积操作（可选看）torch.nn.functional.conv2d

主要内容：

torch.nn包含了torch.nn.functional，两者中都包含了Conv、Pool等层操作，且用法和效果都是一样的（但是具体的输入参数有所不同）。本节是用的torch.nn.functional.conv2d举例，但其实在以后使用中，torch.nn.Conv2d更常用。

torch.nn.functional.conv2d(input, weight, bias=None, stride=1, padding=0, dilation=1, groups=1) → Tensor

CLASS torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True, padding_mode=‘zeros’, device=None, dtype=None)

torch.nn.functional.conv2d中的Input、weight（也就是kernel）都必须是4维张量，每维的含义是[batch_size, C, H, W]，必要的时候，可用reshape()或unsqueeze()对张量进行扩维。
(1) reshape是对改变tensor的形状，各维度的乘积与原本保持一致。
(2) unsqueeze是在指定维度上扩充一个1维。

import torch

x = torch.arange(15)
x2 = torch.reshape(x, [3, 5])	# 用list或tuple表示形状都可以
y1_reshape = torch.reshape(x, [1, 1, 3, 5])  # reshape:只要所有维度乘在一起的积不变，就可以任意扩充多个维度
y2_unsqueeze = torch.unsqueeze(x2, 2)	# unsequeeze:第二个参数的数据类型是int，所以只能在指定维度上扩充一个1维(升维)
c_squeeze = torch.squeeze(y1_reshape)	# sequeeze:只传入一个tensor参数，然后将tensor的所有1维删掉(降维)

print('x.shape:{}'.format(x.shape))
print('x2.shape:{}'.format(x2.shape))
print('y1_reshape.shape:{}'.format(y1_reshape.shape))
print('y2_unsqueeze.shape:{}'.format(y2_unsqueeze.shape))
print('c_squeeze.shape:{}'.format(c_squeeze.shape))

代码

import torch
import torch.nn.functional as F

input = torch.tensor([[1, 2, 0, 3, 1],
                      [0, 1, 2, 3, 1],
                      [1, 2, 1, 0, 0],
                      [5, 2, 3, 1, 1],
                      [2, 1, 0, 1, 1]])
kernel = torch.tensor([[1, 2, 1],
                       [0, 1, 0],
                       [2, 1, 0]])

print(input.shape)
print(kernel.shape)

# input、kernel都扩充到4维
input = torch.reshape(input, (1, 1, 5, 5))
kernel = torch.reshape(kernel, (1, 1, 3, 3))

out = F.conv2d(input, kernel, stride=1)
print('out={}'.format(out))

out2 = F.conv2d(input, kernel, stride=2)
print('out2={}'.format(out2))

out3 = F.conv2d(input, kernel, stride=1, padding=1)
print('out3={}'.format(out3))

P18：神经网络-卷积层 torch.nn.Conv2d

torch.nn.Conv2d的官方文档地址

CLASS torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True, padding_mode=‘zeros’, device=None, dtype=None)

卷积动画的链接：https://github.com/vdumoulin/conv_arithmetic/blob/master/README.md

注意：

默认bias=True，这说明PyTorch中Con2d是默认给卷积操作加了偏置的。
还有一些默认值：stride=1，padding=0等。
out_channels输出通道数，相当于就是卷积核的个数。
dilation：需要使用空洞卷积时再进行设置。

import torch
from torch import nn
from torch.nn import Conv2d
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
from torchvision import datasets
from torchvision.transforms import transforms

# 1. 加载数据
dataset = datasets.CIFAR10('./dataset', train=False, transform=transforms.ToTensor(), download=True)
dataloader = DataLoader(dataset, batch_size=64, shuffle=True, num_workers=0, drop_last=False)


# 2. 构造模型
class Model(nn.Module):
    def __init__(self):
        super(Model, self).__init__()
        self.conv1 = Conv2d(in_channels=3, out_channels=6, kernel_size=3, stride=1)

    def forward(self, x):
        return self.conv1(x)


writer = SummaryWriter('./logs/Conv2d')

# 3. 实例化一个模型对象，进行卷积
model = Model()
step = 0

for data in dataloader:
    imgs, targets = data
    writer.add_images('imgs_ch3', imgs, step)

# 4. 用tensorboard打开查看图像。但是注意，add_images的输入图像的通道数只能是3
#    所以如果通道数>3，则可以先采用小土堆的这个不严谨的做法，在tensorboard中查看一下图片
    outputs = model(imgs)
    outputs = torch.reshape(outputs, (-1, 3, 30, 30))
    writer.add_images('imgs_ch6', outputs, step)

    step += 1

writer.close()

P19：神经网络-最大池化的使用 torch.nn.MaxPool2d

池化也可成为下采样（就是缩小输入图像尺寸，但是不会改变输入图像的通道数）。常见的有MaxPool2d、AvgPool2d等。相反有上采样MaxUnPool2d。

MaxPool2d的官方文档地址：https://pytorch.org/docs/stable/generated/torch.nn.MaxPool2d.html#torch.nn.MaxPool2d

CLASS torch.nn.MaxPool2d(kernel_size, stride=None, padding=0, dilation=1, return_indices=False, ceil_mode=False)

注意：

stride默认=kernel_size
ceil_mode默认是False，也就是说事向下取整

pool和conv后的图像尺寸N计算公式是一样的： $N = (W - F + 2 * P) / S + 1$ ，且都是默认N向下取整。

主要内容：

在构造tensor的时候，最好指定元素的数据类型是float，即在最后加上dtype=torch.float32，这样后面有些操作才不会出错。
池化的作用：保持输入图像的特征，且减小输入量，能加快训练。
（就类似于B站视频有10080P的也会有720P的，720P虽然不如1080P那么高清，但是仍然能够看出视频中物体的特征信息，有点像打了马赛克一样）
代码：

import torch
import torchvision.datasets
from torch import nn
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter


class Model(nn.Module):
    def __init__(self):
        super(Model, self).__init__()
        self.maxpool1 = nn.MaxPool2d(kernel_size=3)  # 默认:stride=kernel_size,ceil_mode=False
        self.maxpool2 = nn.MaxPool2d(kernel_size=3, ceil_mode=True)

    def forward(self, x):
        return self.maxpool1(x), self.maxpool2(x)


model = Model()

# -------------1.上图例子，查看ceil_mode为True或False的池化结果--------------- #
input = torch.tensor([[1, 2, 0, 3, 1],
                      [0, 1, 2, 3, 1],
                      [1, 2, 1, 0, 0],
                      [5, 2, 3, 1, 1],
                      [2, 1, 0, 1, 1]], dtype=torch.float32)

input = torch.reshape(input, (-1, 1, 5, 5))
out1, out2 = model(input)
print('out1={}\nout2={}'.format(out1, out2))

# --------------2.加载数据集，并放入tensorboard查看图片----------------------- #
dataset = torchvision.datasets.CIFAR10('dataset', train=False, transform=torchvision.transforms.ToTensor(),
                                       download=True)
dataloader = DataLoader(dataset, batch_size=64, shuffle=True)

writer = SummaryWriter('./logs/maxpool')
step = 0
for data in dataloader:
    imgs, targets = data
    writer.add_images('imgs', imgs, step)

    imgs, _ = model(imgs)
    writer.add_images('imgs_maxpool', imgs, step)
    step += 1

writer.close()

P20：神经网络-非线性激活

官方文档地址：https://pytorch.org/docs/stable/nn.html#non-linear-activations-weighted-sum-nonlinearity

常用的：Sigmoid、ReLU、LeakyReLU等。
(1) $\operatorname{Sigmoid}(x)=\sigma(x)=\frac{1}{1+\exp (-x)}$
(2) $ReLU(x)=(x)^+=max(0,x)$
(3) $negative_slope × x , otherwise \operatorname{LeakyRELU}(x)= \begin{cases}x, & \text { if } x \geq 0 \\ \text { negative\_slope } \times x, & \text { otherwise }\end{cases}$
作用：为模型引入非线性特征，这样才能在训练过程中训练出符合更多特征的模型。
其中有个参数是inplace，默认为False，表示是否就地改变输入值，True则表示直接改变了input不再有另外的返回值；False则没有直接改变input并有返回值（建议是inplace=False）。

import torch
from torch import nn

input = torch.tensor([[3, -1],
                      [-0.5, 1]])
input = torch.reshape(input, (1, 1, 2, 2))

relu = nn.ReLU()
input_relu = relu(input)

print('input={}\ninput_relu:{}'.format(input, input_relu))

# input=tensor([[[[ 3.0000, -1.0000],
#           [-0.5000,  1.0000]]]])
# input_relu:tensor([[[[3., 0.],
#           [0., 1.]]]])

P21：神经网络-线形层及其他层介绍

主要内容：

本节课主要讲Linear Layers中的torch.nn.Linear(in_features, out_features, bias=True)。默认bias=True。

对传入数据应用线性变换： $y=xA^T+b$

Parameters：

in_features – size of each input sample（每个输入样本的大小）
out_features – size of each output sample（每个输出样本的大小）
bias – If set to False, the layer will not learn an additive bias. Default: True（如果为False，则该层不会学习加法偏置，默认为true）

Shape：（相当于 $H_{in}$ 和 $H_{out}$ 都是只分别关注输入、输出的最后一个维度的大小，在训练过程中，nn.Linear往往是当作的展平为一维后最后几步的全连接层，所以此时就只关注了通道数，即往往Input和Outputs是一维的）

Input： $H_{in})$ where $*$ means any number of dimensions including none and $H_{in}=in\_features$ .
Outputs： $H_{out})$ where all but the last dimension are the same shape as the input and $H_{out}=out\_features$ .

“展平为一维”经常用到torch.nn.Flatten(start_dim=1, end_dim=- 1)

想说一下start_dim，它表示“从start_dim开始把后面的维度都展平到同一维度上”，默认是是1，在实际训练中从start_dim=1开始展平，因为在训练中的tensor是4维的，分别是[batch_size, C, H, W]，而第0维的batch_size不能动它，所以是从1开始的。

还比较重要的有：torch.nn.BatchNorm2d、torch.nn.Dropout、Loss Functions（之后再讲）。其它的Transformer Layers、Recurrent Layers都不是很常用。

import torch

# 对4维tensor展平，start_dim=1

input = torch.arange(54)
input = torch.reshape(input, (2, 3, 3, 3))

y_0 = torch.flatten(input)
y_1 = torch.flatten(input, start_dim=1)

print(input.shape)
print(y_0.shape)
print(y_1.shape)

# torch.Size([2, 3, 3, 3])
# torch.Size([54])
# torch.Size([2, 27])

P22：神经网络-搭建小实战和Sequential的使用

主要内容：

torch.nn.Sequential的官方文档地址，模块将按照它们在构造函数中传递的顺序添加。
本节代码实现的是下图：

版本1——未用Sequential

import torch
from torch import nn
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear


class Model(nn.Module):
    def __init__(self):
        super(Model, self).__init__()
        # 3,32,32 ---> 32,32,32
        self.conv1 = Conv2d(in_channels=3, out_channels=32, kernel_size=5, stride=1, padding=2)
        # 32,32,32 ---> 32,16,16
        self.maxpool1 = MaxPool2d(kernel_size=2, stride=2)
        # 32,16,16 ---> 32,16,16
        self.conv2 = Conv2d(in_channels=32, out_channels=32, kernel_size=5, stride=1, padding=2)
        # 32,16,16 ---> 32,8,8
        self.maxpool2 = MaxPool2d(kernel_size=2, stride=2)
        # 32,8,8 ---> 64,8,8
        self.conv3 = Conv2d(in_channels=32, out_channels=64, kernel_size=5, stride=1, padding=2)
        # 64,8,8 ---> 64,4,4
        self.maxpool3 = MaxPool2d(kernel_size=2, stride=2)
        # 64,4,4 ---> 1024
        self.flatten = Flatten()  # 因为start_dim默认为1，所以可不再另外设置
        # 1024 ---> 64
        self.linear1 = Linear(1024, 64)
        # 64 ---> 10
        self.linear2 = Linear(64, 10)

    def forward(self, x):
        x = self.conv1(x)
        x = self.maxpool1(x)
        x = self.conv2(x)
        x = self.maxpool2(x)
        x = self.conv3(x)
        x = self.maxpool3(x)
        x = self.flatten(x)
        x = self.linear1(x)
        x = self.linear2(x)
        return x


model = Model()
print(model)

input = torch.ones((64, 3, 32, 32))
out = model(input)
print(out.shape)	# torch.Size([64, 10])

版本2——用Sequential

代码更简洁，而且会给每层自动从0开始编序。

import torch
from torch import nn
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear, Sequential


class Model(nn.Module):
    def __init__(self):
        super(Model, self).__init__()
        self.model = Sequential(
            Conv2d(in_channels=3, out_channels=32, kernel_size=5, stride=1, padding=2),
            MaxPool2d(kernel_size=2, stride=2),
            Conv2d(in_channels=32, out_channels=32, kernel_size=5, stride=1, padding=2),
            MaxPool2d(kernel_size=2, stride=2),
            Conv2d(in_channels=32, out_channels=64, kernel_size=5, stride=1, padding=2),
            MaxPool2d(kernel_size=2, stride=2),
            Flatten(),
            Linear(1024, 64),
            Linear(64, 10)
        )

    def forward(self, x):
        return self.model(x)


model = Model()
print(model)

input = torch.ones((64, 3, 32, 32))
out = model(input)
print(out.shape)	# torch.Size([64, 10])

在代码最末尾加上writer.add_gragh(model, input)就可看到模型计算图，可放大查看。

writer = SummaryWriter('./logs/Seq')
writer.add_graph(model, input)
writer.close()

P23：损失函数与反向传播

害，不是很能理解每一个损失函数的计算过程，先放一个在这儿，只有在结合官方文档学习一下吧！pytorch损失函数之nn.CrossEntropyLoss()、nn.NLLLoss()

主要内容：

概念

所需的Loss计算函数都在torch.nn的LossFunctions中，官方网址是：https://pytorch.org/docs/stable/nn.html#loss-functions。本节课举例了L1Loss、MSELoss、CrossEntropyLoss。
在这些Loss函数的使用中，有以下注意的点：
(1) 参数reduction='mean'，默认是'mean'表示对差值的和求均值，还可以是'sum'则不会求均值。
(2) 一定要注意Input和target的shape。

L1Loss

创建一个标准，用于测量中每个元素之间的Input: $x$ 和 target: $y$ 。

创建一个标准，用来测量Input: $x$ 和 target: $y$ 中的每个元素之间的平均绝对误差(MAE)（ $L_1$ 范数）。

Shape:

Input: ( $*$ ), where $*$ means any number of dimensions. 会对所有维度的loss求均值
Target: ( $*$ ), same shape as the input. 与Input的shape相同
Output: scalar.返回值是标量。

假设 $a$ 是标量，则有：

type(a) = torch.Tensor
a.shape = torch.Size([])
a.dim = 0

MSELOSS

创建一个标准，用来测量Input: $x$ 和 target: $y$ 中的每个元素之间的均方误差(平方L2范数)。

Shape:

Input: ( $*$ ), where $*$ means any number of dimensions. 会对所有维度求loss
Target: ( $*$ ), same shape as the input. 与Input的shape相同
Output: scalar.返回值是标量。

CrossEntropyLoss

----------以下是自己对官方文档不准确的翻译----------

CLASS torch.nn.CrossEntropyLoss(weight=None, size_average=None, ignore_index=- 100, reduce=None, reduction='mean', label_smoothing=0.0)

该标准计算 input 和 target 之间的交叉熵损失。

非常适用于当训练 $C$ 类的分类问题（即多分类问题，若是二分类问题，可采用BCELoss）。如果要提供可选参数 $w e i g h t$ ，那 $w e i g h t$ 应设置为1维tensor去为每个类分配权重。这在训练集不平衡时特别有用。

期望的 input应包含每个类的原始的、未标准化的分数。input必须是大小为 $C$ (input未分批)、( $miniba t c h, C$ ) or ( $minibatch,C,d_1,d_2,...d_k$ )的Tensor。最后一种方法适用于高维输入，例如计算2D图像的每像素交叉熵损失。

期望的 target应包含以下内容之一：

(1) （target包含了）在 $[0, C)$ 区间的类别索引， $C$ 是类别总数量。如果指定了 ignore_index，则此损失也接受此类索引（此索引不一定在类别范围内）。reduction='none'情况下的loss为：

注意： $l o g$ 默认是以10为底的。

$ignore_index } \ell(x, y)=L=\left\{l_{1}, \ldots, l_{N}\right\}^{\top}, \quad l_{n}=-w_{y_{n}} \log \frac{\exp \left(x_{n, y_{n}}\right)}{\sum_{c=1}^{C} \exp \left(x_{n, c}\right)} \cdot 1\left\{y_{n} \neq \text { ignore\_index }\right\}$

$x$ 是input， $y$ 是target， $w$ 是权重weight， $C$ 是类别数量， $N$ 涵盖minibatch维度且 $d_1,d_2...,d_k$ 分别表示第k个维度。（N太难翻译了，总感觉没翻译对）如果reduction='mean'或'sum'，则公式为：

$ignore_index } l n , if reduction = ’mean’; ∑ n = 1 N l n , if reduction = ’sum’ \ell(x, y)= \begin{cases}\sum_{n=1}^{N} \frac{1}{\sum_{n=1}^{N} w_{y_{n}} \cdot 1\left\{y_{n} \neq \text { ignore\_index }\right\}} l_{n}, & \text { if reduction }=\text { 'mean'; } \\ \sum_{n=1}^{N} l_{n}, & \text { if reduction }=\text { 'sum' }\end{cases}$

Note that this case is equivalent to the combination of LogSoftmax and NLLLoss.
nn.CrossEntropyLoss()是nn.logSoftmax()和nn.NLLLoss()的整合,可以直接使用它来替换网络中的这两个操作。（softmax输出，所有输出概率和为1。NLLLoss:The negative log likelihood loss 负数对数似然损失）

(2) Probabilities for each class。这种不常用，官方也更建议使用第一种方式，那就不写了。

Shape：

好像一般采用的是：input.shape=(N,C)，target.shape=(N)

import torch
import torchvision
from torch import nn
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear, Sequential
from torch.utils.data import DataLoader
from torchvision.transforms import transforms

dataset = torchvision.datasets.CIFAR10('./dataset', train=False, transform=transforms.ToTensor(), download=True)
dataloader = DataLoader(dataset, batch_size=2, shuffle=True)


class Model(nn.Module):
    def __init__(self):
        super(Model, self).__init__()
        self.model = Sequential(
            Conv2d(in_channels=3, out_channels=32, kernel_size=5, stride=1, padding=2),
            MaxPool2d(kernel_size=2, stride=2),
            Conv2d(in_channels=32, out_channels=32, kernel_size=5, stride=1, padding=2),
            MaxPool2d(kernel_size=2, stride=2),
            Conv2d(in_channels=32, out_channels=64, kernel_size=5, stride=1, padding=2),
            MaxPool2d(kernel_size=2, stride=2),
            Flatten(),
            Linear(1024, 64),
            Linear(64, 10)
        )

    def forward(self, x):  # 模型前向传播
        return self.model(x)


model = Model()  # 定义模型
loss_cross = nn.CrossEntropyLoss()  # 定义损失函数

for data in dataloader:
    imgs, targets = data
    outputs = model(imgs)
    # print(outputs)    # 先打印查看一下结果。outputs.shape=(2, 10) 即(N,C)
    # print(targets)    # target.shape=(2) 即(N)
    # 观察outputs和target的shape，然后选择使用哪个损失函数
    res_loss = loss_cross(outputs, targets)
    res_loss.backward()  # 损失反向传播
    print(res_loss)

#
# inputs = torch.tensor([1, 2, 3], dtype=torch.float32)
# targets = torch.tensor([1, 2, 5], dtype=torch.float32)
#
# inputs = torch.reshape(inputs, (1, 1, 1, 3))
# targets = torch.reshape(targets, (1, 1, 1, 3))
#
# # -------------L1Loss--------------- #
# loss = nn.L1Loss()
# res = loss(inputs, targets)  # 返回的是一个标量,ndim=0
# print(res)  # tensor(1.6667)
#
# # -------------MSELoss--------------- #
# loss_mse = nn.MSELoss()
# res_mse = loss_mse(inputs, targets)
# print(res_mse)
#
# # -------------CrossEntropyLoss--------------- #
# x = torch.tensor([0.1, 0.2, 0.3])  # (N,C)
# x = torch.reshape(x, (1, 3))
# y = torch.tensor([1])  # (N)
# loss_cross = nn.CrossEntropyLoss()
# res_cross = loss_cross(x, y)
# print(res_cross)

P24：优化器（一）

官方文档地址：torch.optim

Debug过程中查看的grad所在的位置：

model --> Protected Atributes --> _modules --> ‘model’ --> Protected Atributes --> _modules --> ‘0’（任选一个conv层） --> weight（查看weight下的data和grad的变化）

简易训练代码，添加了Loss、Optim。

import torch
import torchvision
from torch import nn
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear, Sequential
from torch.utils.data import DataLoader
from torchvision.transforms import transforms

dataset = torchvision.datasets.CIFAR10('./dataset', train=False, transform=transforms.ToTensor(), download=True)
dataloader = DataLoader(dataset, batch_size=2, shuffle=True)


class Model(nn.Module):
    def __init__(self):
        super(Model, self).__init__()
        self.model = Sequential(
            Conv2d(in_channels=3, out_channels=32, kernel_size=5, stride=1, padding=2),
            MaxPool2d(kernel_size=2, stride=2),
            Conv2d(in_channels=32, out_channels=32, kernel_size=5, stride=1, padding=2),
            MaxPool2d(kernel_size=2, stride=2),
            Conv2d(in_channels=32, out_channels=64, kernel_size=5, stride=1, padding=2),
            MaxPool2d(kernel_size=2, stride=2),
            Flatten(),
            Linear(1024, 64),
            Linear(64, 10)
        )

    def forward(self, x):  # 模型前向传播
        return self.model(x)


model = Model()  # 定义模型
loss_cross = nn.CrossEntropyLoss()  # 定义损失函数
optim = torch.optim.SGD(model.parameters(), lr=0.01)  # lr不能过大或者过小。刚开始的lr可设置得较大一点，后面再对lr进行调节
len = len(dataloader)

for epoch in range(20):
    total_loss = 0.0
    for imgs, targets in dataloader:
        outputs = model(imgs)
        res_loss = loss_cross(outputs, targets)

        optim.zero_grad()  # 优化器对model中的每一个参数进行梯度清零
        res_loss.backward()  # 损失反向传播
        optim.step()  # 对model参数开始调优
        total_loss += res_loss
    print('epoch:{}\ttotal_loss:{}\tmean_loss:{}.'.format(epoch, total_loss, total_loss / len))
# epoch:0	total_loss:9374.806640625	mean_loss:1.8749613761901855.
# epoch:1	total_loss:7721.240234375	mean_loss:1.544248104095459.
# epoch:2	total_loss:6830.775390625	mean_loss:1.3661550283432007.

P25：现有网络模型的使用及修改

这节课以VGG为例，官方文档地址为：torchvision.models中的vgg。常用的是VGG16、VGG19。

注意：参数pretrained=True表示加载模型架构+训练好的参数，pretrained=False(default)表示只加载模型架构。一般最好设定为true。

预训练权重自己就默认下载到C:\Users\dadandan\.cache\torch\hub\checkpoints\vgg16-397923af.pth中了，大小为528MB。（想要更改pth默认下载位置，可参考这篇文章：Pytorch中更改预训练权重文件的下载位置）

VGG16是在ImageNet数据集中训练的，对1000种物体分类。那如何对自己的数据集分类呢？以CIFAR10为例，需要分出10个类别。

（嗨呀！真可恶！本来开弹幕是想看能不能学到另外的好方法，结果全是在说“早就没跟着写代码了，写代码太费时间了”，我就是老老实实跟着写代码，学了一个星期还没学完！本就心情不好了，还看到这样的话，就仿佛我跟着写代码是一种很蠢的行为一样！我不管，我要坚持把最后几节也学了！TMD）

方法1：直接在VGG16的模型架构后面再添加一层全连接层nn.Linear(1000,10)，其中1000表示ImageNet分1000个类别，10表示CIFAR10要分出10个类别。

import torchvision
from torch import nn

# 1.加载现有模型，并通过设置pretrained是否选择也加载预训练权重参数
# 下载到C:\Users\dadandan\.cache\torch\hub\checkpoints\vgg16-397923af.pth
vgg16_false = torchvision.models.vgg16(pretrained=False)
vgg16_true = torchvision.models.vgg16(pretrained=True)

train_data = torchvision.datasets.CIFAR10('./dataset', train=True, transform=torchvision.transforms.ToTensor(),
                                          download=True)

# 在vgg16最后面添加一层，取名叫'add_linear'
vgg16_true.add_module('add_linear', nn.Linear(1000, 10))

print(vgg16_true)

方法2：直接在VGG16的模型架构classifier中的后面再添加一层全连接层nn.Linear(1000,10)。可直接索引下标查看：print(vgg16_true.classifier[7])（'add_linear’层在classifier中下标排序是7）。

# classifier的最后面添加一层，取名叫'add_linear'
vgg16_true.classifier.add_module('add_linear', nn.Linear(1000, 10))

方法3：直接更改VGG16的模型架构classifier中的最后一层。

# 直接更改classifier的最后面一层
cls_len = len(vgg16_true.classifier)    # 获取classifier共有多少层
vgg16_true.classifier[cls_len - 1] = nn.Linear(4096, 10)

P26：自定义的网络模型的保存与读取

模型保存：model_save.py

import torch
from torch import nn
from torch.nn import Sequential, Conv2d, MaxPool2d, Flatten, Linear

# 自定义的模型Model
class Model(nn.Module):
    def __init__(self):
        super(Model, self).__init__()
        self.model = Sequential(
            Conv2d(in_channels=3, out_channels=32, kernel_size=5, stride=1, padding=2),
            MaxPool2d(kernel_size=2, stride=2),
            Conv2d(in_channels=32, out_channels=32, kernel_size=5, stride=1, padding=2),
            MaxPool2d(kernel_size=2, stride=2),
            Conv2d(in_channels=32, out_channels=64, kernel_size=5, stride=1, padding=2),
            MaxPool2d(kernel_size=2, stride=2),
            Flatten(),
            Linear(1024, 64),
            Linear(64, 10)
        )

    def forward(self, x):  # 模型前向传播
        return self.model(x)


# 加载和保存自定义的模型
model = Model()  # 还没有训练过，所以还没有参数，因此以下两种方式保存的文件大小应该是差不多的

# 保存方式1，保存模型 + 参数，文件体积会比方法2大
torch.save(model, './model/model1.pth')

# 保存方式2，保存参数为字典模式，文件体积会稍微小一些（官方推荐）
torch.save(model.state_dict(), './model/model2.pth')

模型加载：model_load.py

import torch
from model_save import Model  # 导入自定义的模型

# way1：直接加载 模型+参数
model1 = torch.load('./model/model1.pth')
print(model1)

# way2：先构建模型，再加载参数（字典类型）
model2 = Model()
model2.load_state_dict(torch.load('./model/model2.pth'))
print(model2)

way1通过from model_save import Model导入自定义模型，但是这句话仍然会是灰色的。但是没有这句话就会报下面的错误。

P27：完整的模型训练套路（一）~（四）

在P30和P31，老师讲了怎么用Google Colab进行GPU加速，很值得看看！

注意：

加在代码中训练和验证阶段的model.train()和model.eval()的意思分别是：将模块设置为训练模式、验证模式。这只对某些模块有影响（Doprout和batchNormalize）可详见官方文档解释。
（但是以防万一，还是加上model.train()、model.eval()比较好，因为就算没有Dropout和BatchNorm模块，加上也不会有错和不好的影响）
argmax(1) 行方向或 argmax(0)列方向取最大值

import torch
# axis=0 行方向
# axis=1 列方向

output = torch.tensor([[0.1, 0.2],
                       [0.5, 0]])
target = torch.tensor([1, 0])
pred = output.argmax(1)

print(pred == target)
# 得到对应位置相等（为True）的个数
num = (pred == target).sum()
print(num)

to(device)利用GPU训练：网络模型、数据（输入、标注）、损失函数，loss和model可以直接写成loss.to(device)、model.to(device)，但是数据必须要再接收一次：imgs = imgs.to(deivce)、targets = targets.to(device)。（为了减少记忆，就直接loss、model、imgs、targets全都再赋值回去吧）

# 定义训练的设备
device = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')

计时，导入包import time，再打点计时start = time.time()，end = time.time()，时间差t1 = end-start，是s级。
转换RGB三通道：image=image.convert('RGB')。png是4通道，除了RGB外还有一个透明度通道；jpg是RGB三通道。

在test.py中需要先对图像大小Resize成符合模型的输入大小32x32。
在train.py的验证阶段和test.py中，一定要记得使用with torch.no_grad()，因为不用再优化梯度，这样可以节约内存、节约性能。
模型训练的数据集CIFAR10组成：

P27的完整代码：

迅雷网盘分享：

链接：https://pan.xunlei.com/s/VN2LZwrGbf20guxIWpLph6WXA1
提取码：aggh

(1) model.py

import torch
from torch import nn
import torchvision
from torch.utils.data import DataLoader
from torchvision.transforms import transforms
from torch.utils.tensorboard import SummaryWriter


# 写模型
class Model(nn.Module):
    def __init__(self):
        super(Model, self).__init__()
        self.model = nn.Sequential(
            nn.Conv2d(3, 32, 5, 1, 2),
            nn.MaxPool2d(2),
            nn.Conv2d(32, 32, 5, 1, 2),
            nn.MaxPool2d(2),
            nn.Conv2d(32, 64, 5, 1, 2),
            nn.MaxPool2d(2),
            nn.Flatten(),
            nn.Linear(64 * 4 * 4, 64),
            nn.Linear(64, 10)
        )

    def forward(self, x):
        return self.model(x)


if __name__ == '__main__':
    model = Model()
    print(model)
    input = torch.ones((64, 3, 32, 32))
    out = model(input)
    print(out.shape)

(2) train.py

import os
import torch
from torch import nn
import torchvision
from torch.utils.data import DataLoader
from torchvision.transforms import transforms
from model import Model
from torch.utils.tensorboard import SummaryWriter

# ------------------1. 一些定义---------------- #
# 定义训练的设备
device = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')
print('device: {}'.format(device))

# 指定pth存储文件夹
pth_dir = './model_pth'
if not os.path.exists(pth_dir):  # os模块判断并创建
    os.mkdir(pth_dir)

# 训练的轮数
epoch = 10
train_step = 0
test_step = 0
lr = 1e-2

# ------------------2.构建数据集----------------- #
trans = transforms.Compose([
    transforms.Resize(32),
    transforms.ToTensor()
])

train_data = torchvision.datasets.CIFAR10('../dataset', train=True, transform=trans, download=True)
test_data = torchvision.datasets.CIFAR10('../dataset', train=False, transform=trans, download=True)

# 数据集的长度
len_train = len(train_data)
len_test = len(test_data)

# -----------------3. 加载数据集（按照batchsize=64打包）-------------- #
train_load = DataLoader(train_data, 64, shuffle=True)
test_load = DataLoader(test_data, 64, shuffle=True)

# -----------------4. 模型、损失函数、优化器、摘要器------------- #
# 构建模型
model = Model()
model.to(device)  # 用gpu训练

# 损失函数
loss_fn = nn.CrossEntropyLoss()
loss_fn.to(device)

# 优化器
optim = torch.optim.SGD(model.parameters(), lr=lr)
# 构建tensoroboard摘要器
writer = SummaryWriter('logs_train')

# 开始训练
for i in range(epoch):
    print('-----------第 {} 轮训练开始-------------'.format(i + 1))

    # 训练步骤开始
    model.train()
    for data in train_load:  # train_load，每个循环包含了64张
        imgs, targets = data
        imgs = imgs.to(device)
        targets = targets.to(device)
        out = model(imgs)
        loss = loss_fn(out, targets)

        # optim 优化模型
        optim.zero_grad()  # 梯度清零
        loss.backward()  # 损失反向传播
        optim.step()  # 优化

        # writer
        if train_step % 200 == 0:
            print('训练步数: {}, Loss: {}'.format(train_step, loss.item()))
            writer.add_scalar('train_loss', loss.item(), train_step)

        train_step += 1

    # 验证步骤开始
    model.eval()
    total_test_loss = 0
    total_test_accuracy = 0
    with torch.no_grad():  # 没有梯度，不会对其进行调优
        for data in test_load:
            imgs, targets = data
            imgs = imgs.to(device)
            targets = targets.to(device)
            out = model(imgs)
            loss = loss_fn(out, targets)
            total_test_loss += loss.item()
            accuracy = (out.argmax(1) == targets).sum().item()
            total_test_accuracy += accuracy

    print('整体测试集上的Loss: {}'.format(total_test_loss))
    print('整体数据集上的准确率Acc: {}'.format(total_test_accuracy / len_test))
    writer.add_scalar('test_loss', total_test_loss, test_step)
    writer.add_scalar('test_Acc', total_test_accuracy / len_test, test_step)
    test_step += 1

    # 保存方式1
    torch.save(model, pth_dir + '/model_{}.pth'.format(i))
    # 保存方式2（官方推荐）
    # torch.save(model.state_dict(), pth_dir + '/model_{}.pth'.format(i))
    print('model_{}.pth 已保存'.format(i))

writer.close()

(3) test.py：对整个文件夹中的图像分类，并打印出类别，如’dog’。

注意看这里面的注释，写的挺清楚的，hhh~

import os
import torch
import torchvision
from PIL import Image
import time

device = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')
classes = ['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']

# Resize成符合模型的输入大小
transform = torchvision.transforms.Compose([
    torchvision.transforms.Resize((32, 32)),
    torchvision.transforms.ToTensor()
])

imagetype = ['bmp', 'dib', 'png', 'jpg', 'jpeg', 'pbm', 'pgm', 'ppm', 'tif', 'tiff']
imagelist_path = 'images'
imagelist = os.listdir(imagelist_path)

for imagename in imagelist:
    start = time.perf_counter()
    if imagename.split('.')[1] not in imagetype:
        print('{} is not an image.'.format(imagename))
    else:
        # ----------------读取图像---------------- #
        image_path = os.path.join(imagelist_path, imagename)
        image = Image.open(image_path)

        # ----------------调整图像---------------- #
        image = image.convert('RGB')  # 1.转为3通道图像
        image = transform(image)  # 2.调整图像尺寸为model输入的32x32
        image = torch.unsqueeze(image, 0)  # 3.升维为4维张量：[batchsize, C, H,W]
        image = image.to(device)  # 4.因为模型使用gpu训练的，所以验证时报错，让我也用gpu验证

        # ----------------加载模型-------------- #
        model = torch.load('./model_pth/model_9.pth')
        model.to(device)  # 5.model也用gpu加载，好像要比cpu快些

        # ----------------开始测试-------------- #
        model.eval()
        with torch.no_grad():
            output = model(image)  # 输出的是各类别得分

        # ----------------打印类别-------------- #
        index = output.argmax(1).item()
        print('这张图象的类别是：{}'.format(classes[index]))

        end = time.perf_counter()
        print('这张图像测试用时：{} s'.format(end - start))

完结，撒花❀❀❀❀❀❀❀❀❀❀❀

你可能感兴趣的:(pytorch学习,pytorch,深度学习,学习)

图论基础知识深度优先（Depth First Search, 简称DFS），广度优先（Breathe First Search, 简称BFS） mmaerd Leetcode刷题学习记录深度优先图论宽度优先机考
图论基础知识学习记录自代码随想录dfs与bfs区别dfs是沿着一个方向去搜，不到黄河不回头，直到搜不下去了，再换方向（换方向的过程就涉及到了回溯）。bfs是先把本节点所连接的所有节点遍历一遍，走到下一个节点的时候，再把连接节点的所有节点遍历一遍，搜索方向更像是广度，四面八方的搜索过程。深度优先搜索理论（DepthFirstSearch,简称DFS）搜索方向，是认准一个方向搜，直到碰壁之后再换方向换
深度解析基于贝叶斯的垃圾邮件分类大千AI助手人工智能 Python #OTHER 分类数据挖掘人工智能机器学习算法贝叶斯 Bayes
贝叶斯垃圾邮件分类的核心逻辑是基于贝叶斯定理，利用邮件中的特征（通常是单词）来计算该邮件属于“垃圾邮件”或“非垃圾邮件”的概率，并根据概率大小进行分类。它是一种朴素贝叶斯分类器，因其假设特征（单词）之间相互独立而得名（虽然这在现实中不完全成立，但效果通常很好）。本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的
【Go】入门Go应该怎么学 CodeWithMe Go golang 开发语言后端
Go语言学习路线图一、为什么学Go？简洁、直观，容易上手，语法像C又比C简洁天然支持并发（goroutine+channel）编译速度快、跨平台强、部署简单（一个二进制）在云原生（K8s）、微服务、工具链开发领域非常受欢迎拥有丰富的标准库与成熟的社区二、学习阶段与资源第一阶段：Go基础语法&核心概念内容：变量、常量、类型流程控制（if、for、switch）数组、切片、map、字符串函数、返回值、
从零开始：Python实现语音识别的完整教程_副本 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 python 语音识别开发语言 ai
从零开始：Python实现语音识别的完整教程关键词：Python、语音识别、语音转文本、音频处理、机器学习、深度学习、自然语言处理摘要：本文将带你从零开始学习如何使用Python实现语音识别功能。我们将从基础概念讲起，逐步深入到实际代码实现，涵盖音频处理、特征提取、模型训练等关键环节，最终构建一个完整的语音识别系统。无论你是初学者还是有一定经验的开发者，都能从本教程中获得实用的知识和技能。背景介绍
爬虫实战之图片及人物信息爬取 nightunderblackcat Python进阶爬虫 python
爬虫对于许多Python初学者来说都是一个好玩有趣的技能,但大多数人都是从网上得来的经验,会认为学习爬虫是件很难的事,像处理反爬机制以及反反爬,总是让人望而却步,今天我们来进行爬虫实操,需要注意爬虫本身并不违法,但恶意爬取文件将会涉及相关法律,为避免不必要的纠纷,本文采取一个不存在的网站进行演示,本文适合Python初学者以及爬虫初学者学习,博主是大一.所以讲的话和相关技能并不特别专业,望大家谅解
Unity引擎开发：VR渲染技术_（19）.VR项目实例开发 chenlz2007 虚拟现实游戏2 unity vr lucene 游戏引擎 json 全文检索
VR项目实例开发在本节中，我们将通过一个具体的虚拟现实项目实例，详细介绍如何在Unity引擎中实现VR渲染技术。我们将从项目的基本设置开始，逐步讲解如何创建VR场景、配置相机、添加交互元素、优化性能等方面的内容。通过本节的学习，您将能够掌握在Unity中开发VR项目的基本流程和技术要点。1.项目基本设置1.1创建新的VR项目首先，打开UnityHub并创建一个新的项目。选择“3D”模板，然后在项目
七天学完十大机器学习经典算法-05.从投票到分类：K近邻(KNN)算法完全指南
接上一篇《七天学完十大机器学习经典算法-04.随机森林：群众智慧的机器学习实践》想象一下，你搬进了一个新小区。想知道这个小区整体氛围如何？最直接的方法就是看看你最近的几家邻居是什么样的人——如果邻居们都很安静、整洁，小区大概率不错；如果邻居们深夜喧哗、环境杂乱，你可能就得重新考虑了。K近邻（K-NearestNeighbors,KNN）算法的核心思想，就如同这个观察邻居的过程。它是机器学习中最直观
信息抽取数据集全景分析：分类体系、技术演进与挑战_DEEPSEEK 致Great 分类数据挖掘人工智能
信息抽取数据集全景分析：分类体系、技术演进与挑战摘要信息抽取（IE）作为自然语言处理的核心任务，是构建知识图谱、支持智能问答等应用的基础。近年来，随着深度学习技术的发展和大规模预训练模型的兴起，IE数据集呈现爆发式增长，其分析与评估对模型研发和领域迁移至关重要。本文基于对158个主流IE数据集的系统性梳理，首次提出“信息提取与命名实体识别数据集分类体系”。该体系涵盖8大类别（命名实体识别、关系提取
Android Gantt View 安卓实现项目甘特图 netkiller-BG7NYT Android 手札 android 甘特图
需要做一个项目管理工具，其中使用到了甘特图。发现全网甘特图解决方案比较少，于是自动动手丰衣足食。前面我用Python和Node.js前端都做过，这次仅仅是移植到Android上面。其实甘特图非常简单，开发也不难，如果我专职去做，能做出一个非常棒产品。我写这个只是消遣，玩玩，闲的蛋痛，所以不怎么上心，就搞成下面这德行吧。仅仅供大家学习，参考。那天心情好了，完善一下。屏幕布局文件
机电一体化c语言程序设计,机电一体化专业《C语言程序设计》课程标准爱吃糖的果子狸机电一体化c语言程序设计
山东海事职业学院机电一体化专业《C语言程序设计》课程标准一、课程性质与任务《C语言程序设计》是机电一体化专业的职业能力素质课程之一，并且是本专业的核心专业课程之一，理论性和实践性均较强，既要掌握理论概念，又要动手编程，还要上机调试运行。通过本课程的学习，使学生掌握基本的程序设计过程和技巧，熟练应用MicrosoftVisualC6.0集成环境进行C语言的编写、编译与调试，培养学生的逻辑思维能力、抽
使用Ultralytics YOLO进行数据增强 alpszero YOLO计算机视觉应用 YOLO 人工智能机器学习
概述数据增强是计算机视觉领域的一项重要技术，它通过对现有图像进行各种转换，人为地扩展训练数据集。在训练深度学习模型时，数据增强有助于提高模型的鲁棒性，减少过拟合，并增强对真实世界场景的泛化。在训练计算机视觉模型的过程中，数据增强具有多种重要作用：扩展数据集：通过创建现有图像的变体，可以有效增加训练数据集的规模，而无需收集新数据。提高泛化能力：模型学会在各种条件下识别物体，使其在实际应用中更加稳健。
算法竞赛备考冲刺必刷题（C++） | 洛谷 P1001 A+B Problem 热爱编程的通信人 c++算法
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺
Python 数据分析与可视化 Day 11 - 特征工程基础蓝婷儿 python python 数据分析人工智能
✅今日目标理解特征工程在数据分析和机器学习中的意义掌握常见特征类型的处理方式：数值型、类别型、时间型学习特征提取、转换、标准化、独热编码（One-HotEncoding）等核心操作为后续建模任务做好特征准备工作一、什么是特征工程？特征工程是将原始数据转换为模型可学习的“特征向量”的过程，是机器学习效果好坏的核心因素之一。常见任务包括：缺失值处理（已学）异常值处理（已学）数值归一化、标准化类别变量编
分布式学习嘉陵妹妹分布式学习
1.列举三个非冯·诺依曼计算结构非冯结构是指不遵循传统冯·诺依曼体系的计算架构，包括：数据流结构（DataflowArchitecture）：指令执行取决于数据的可用性而不是程序计数器。神经网络结构（NeuralNetworkArchitecture）：模拟生物神经元连接，用于人工智能。量子计算结构（QuantumComputingArchitecture）：利用量子比特和量子叠加原理进行计算。2
C++———类与对象（中） dragoooon34 C++c++开发语言学习学习方法
引言书接上文类与对象（上），我们学习类与对象的一些基础知识，接下来我们接着学习。类的默认成员函数在C++中，当你定义一个类时，即使没有显式地声明某些成员函数，编译器也会为该类自动生成一些默认的成员函数。⼀个类，我们不写的情况下编译器会默认生成以下6个默认成员函数，需要注意的是这6个中最重要的是前4个，最后两个取地址重载不重要，我们稍微了解⼀下即可。其次就是C++11以后还会增加两个默认成员函数，移
线性代数-第9篇：二次型与正定矩阵：优化问题的数学基础程序员勇哥人工智能(AI)线性代数人工智能大数据 python
线性代数-第9篇：二次型与正定矩阵：优化问题的数学基础在人工智能、量化投资和大数据分析中，优化问题无处不在，比如机器学习的损失函数最小化、量化投资组合的风险最小化等。而二次型与正定矩阵作为线性代数中的重要概念，为解决这些优化问题提供了坚实的数学基础。本篇将深入解析它们的原理及其在实际场景中的关键应用。一、二次型：从向量到函数的桥梁1.定义与表达式二次型是一个关于向量x\mathbf{x}x的二次齐
激活函数和批归一化（BatchNorm）
简单记录学习~。在神经网络中，激活函数和批归一化（BatchNorm）的配合使用是为了解决‌数据分布偏移‌和‌梯度不稳定‌问题。以下是逐步解释：1.激活函数为何导致值向上下限移动？‌以Sigmoid/Tanh为例‌：这类饱和型激活函数（如Sigmoid、Tanh）的导数在输入绝对值较大时会趋近于0（饱和区）。例如：Sigmoid的输出范围是(0,1)当输入≫0时，输出接近1；x≪0时，输出接近0。
Python虚拟环境管理：conda、venv、pipenv三国杀 network爬虫 python conda 数据库 jupyter
Python虚拟环境管理：conda、venv、pipenv三国杀作为一名在Python生态系统中学习实践了六年的开发者，我深刻体会到了Python虚拟环境管理工具的重要性和复杂性。从最初接触virtualenv时的懵懂，到现在熟练使用conda、venv、pipenv等工具，每一次的学习和实践都让我对Python环境管理有了更深的理解。今天，我想和大家分享一下这几年来对这三个主流工具的使用心得，
C#教程（2）———— 各式各样的数据类型值类型篇大朋Sir C#教程 c#
C#教程（2）————各式各样的数据类型前言1数据类型概述2值类型2.1数值类型2.1.1整数类型2.2浮点数类型2.3字符类型2.4布尔类型2.5其它值类型2.6sizeof关键字总结前言在上一篇文章中，我们简单介绍了C#语言的历史，并通过一个简单的打印“HelloWorld”的程序，一起了解了C#程序的基本结构，那么在今天，我们将进一步学习更多的内容。我们的现实生活中总是存在着各式各样的数据，
【C#面向对象】第二课——深入C#数据类型、值类型和引用类型的学习逍遥小丸子 C#面向对象 C#数据类型数据类型值类型和引用类型拆箱和装箱枚举
知识点：理解值类型和引用类型的区别、掌握结构类型的定义、掌握拆箱和装箱的概念、掌握使用值类型和引用类型作为方法的参数1、值类型和引用类型我们在前面学习过C#中的常用数据类型，常用的数据类型有：C#中的数据类型说明用法举例
元学习的认知思维棱镜由数入道 AI辅助教学学习元学习思维模型认知框架思维棱镜
在学习这场马拉松中，大多数人只关注如何跑得更快（学习方法），但元学习关注的却是如何学会规划路线、调整呼吸、监测体能，甚至理解身体（大脑）的运作机制，从而跑得更远、更有效率。元学习（Meta-Learning）——“学会学习”的底层操作系统本质：元学习，简而言之，就是我们的大脑如何学习、如何反思学习过程、并如何优化学习策略的能力。它不是学习具体知识，而是学习如何学习知识本身。它好比你手中的智能手机，
Linux下基于C++11的socket网络编程（基础版本）吃拉面的小波 C++网络编程 linux 网络 c++
第一：socket的基础知识略，网上有很多这样的知识，我觉得他们应该讲的比我好。我是跟着韩国人尹圣雨写的《TCP/IP网络编程》这本书学的。第二：使用的线程库C++11std::thread在经过自己简单的封装第三：声明因为我也是初学，可能写的不好，封装的也不好，我写这篇文章，只是希望帮助很基础的初学者，慢慢的接触socket，也给自己记录一下学习的经过。所以，如果错误的，或者不好的地方，望各位多
用Pytorch训练手写签名模型并进行签名识别 TBM矩阵 #AI体系学习 pytorch 人工智能 python
整体思路收集至少两个人的手写签名图片，每个人至少20张使用Pytorch进行模型训练使用Flask搭建Web服务使用Html/JavaScript实现前端调用进行签名识别项目结构signature-systemdatatrainuser001001.png...user002001.png...templatesindex.htmlapp.pymodel.pytrain.py建模：model.py
Ubuntu下安装Moodle平台 swy520 ubuntu Moodle ubuntu Moodle
一前言Moodle是一个开源课程管理系统（CMS），也被称为学习管理系统（LMS）或虚拟学习环境（VLE），它通常用来播放符合SCORM标准的课件，但功能远不止课程管理，作业模块等功能。这里主要介绍moodle的安装方法。二安装准备Moodle通常在Linux操作系统上，基于Apache，PostgreSQL/MySQL/MariaDB和PHP进行开发。为了平台的稳定性，我们选择Linux操作系统
FlatBuffers（概念、原理及优势、在TS中的使用）前端杂货铺 TodoList 100个小知识 FlatBuffers JSON 序列化反序列化
个人简介个人主页：前端杂货铺‍♂️学习方向：主攻前端方向，正逐渐往全干发展个人状态：研发工程师，现效力于中国工业软件事业人生格言：积跬步至千里，积小流成江海推荐学习：前端面试宝典100个小功能Vue2Vue3Vue2/3项目实战Node.js实战Three.js个人推广：每篇文章最下方都有加入方式，旨在交流学习&资源分享，快加入进来吧文章目录介绍在Vue中使用FlatBuffersFlatBuff
ros学习之路径规划许卿768503 学习
一、全局路径规划中的地图1、栅格地图（GridMap）2、概率图（CostMap）3、特征地图（FeatureMap4、拓扑地图（TopologicalMap）二、全局路径规划算法1、Dijkstra算法2、最佳路径优先搜索算法（BFS）3、A*搜索算法双向A*搜索算法重复A*搜索算法AnytimeRepairingA*(ARA*)搜索算法实时学习A*搜索（LRTA*）算法实时适应性A*搜索（RT
学而思编程周赛语言普及奠基组 | 2025年春第15周T1 新二进制热爱编程的通信人算法 c++
欢迎大家订阅我的专栏：算法题解：C++与Python实现！本专栏旨在帮助大家从基础到进阶，逐步提升编程能力，助力信息学竞赛备战！专栏特色1.经典算法练习：根据信息学竞赛大纲，精心挑选经典算法题目，提供清晰的代码实现与详细指导，帮助您夯实算法基础。2.系统化学习路径：按照算法类别和难度分级，从基础到进阶，循序渐进，帮助您全面提升编程能力与算法思维。适合人群：准备参加蓝桥杯、GESP、CSP-J、CS
学而思编程周赛语言普及奠基组 | 2025年春第15周T2 散步热爱编程的通信人算法 c++
欢迎大家订阅我的专栏：算法题解：C++与Python实现！本专栏旨在帮助大家从基础到进阶，逐步提升编程能力，助力信息学竞赛备战！专栏特色1.经典算法练习：根据信息学竞赛大纲，精心挑选经典算法题目，提供清晰的代码实现与详细指导，帮助您夯实算法基础。2.系统化学习路径：按照算法类别和难度分级，从基础到进阶，循序渐进，帮助您全面提升编程能力与算法思维。适合人群：准备参加蓝桥杯、GESP、CSP-J、CS
React系统学习之路莲华君 react.js 学习前端
React系统学习之路学习目录第1章：React入门介绍React的基本概念和应用场景安装Node.js和npm创建第一个React应用React的JSX语法组件的基本结构和生命周期第2章：组件与状态管理函数组件与类组件的区别状态（State）和属性（Props）的使用受控组件与非受控组件高阶组件（HOC）的概念和实现使用ContextAPI进行跨层级状态传递第3章：ReactHooksuseSt
AI人工智能领域知识图谱在深度学习中的应用拓展
AI人工智能领域知识图谱在深度学习中的应用拓展关键词：知识图谱、深度学习、神经网络、图嵌入、知识表示学习、推理机制、应用场景摘要：本文深入探讨了知识图谱与深度学习的融合应用，系统性地分析了知识图谱在深度学习中的关键技术路径和应用场景。文章首先介绍了知识图谱的基本概念和表示方法，然后详细阐述了知识图谱与深度学习结合的多种技术路线，包括图神经网络、知识嵌入和推理机制等。接着通过具体案例展示了知识图谱增
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户