慕溪同学

pytorch实现迁移训练-resnet18训练花朵识别模型【深度学习】

完整训练花朵数据集思路！

- 一、训练模型三大步骤：
- - 1、数据预处理部分
  - 2、网络模块设置
  - 3、网络模型的保存与测试
- 二、模型训练具体步骤
- - 1、导入所需要的模块包
  - 2、设置数据集文件路径
  - 3、数据预处理模块
  - 4、获取数据集
  - - （1）`.classes`
    - （2） `datasets.ImageFolder`
  - 5、读取标签对应的实际名字
  - 6、加载models中提供的模型，并且直接用训练的好权重当做初始化参数
  - 7、把模型输出层改成自己的
  - 8、设置哪些层需要进行训练(目前只设置全连接进行训练)
  - - `parameters`与`named_parameters`
  - 9、优化器设置
  - 10、模型训练模块（重点）
  - - 只训练全连接层结果：
    - （1）model.state_dict()
    - （2）copy.deepcopy()
    - （2）_，preds=torch.max(outputs,1)
    - （4）loss.item() * inputs.size(0)
  - 11、继续训练其他网络层
  - - 训练所有网络层结果：
  - 12、加载训练好的模型（不在完整训练过程里面）
  - 13、测试数据预处理
  - 14、获取概率最大的结果
  - 15、图片处理模块
  - - （1）tensor.to('cpu').clone().detach()
    - （2）image.clip(0, 1)
  - 16、绘制图片
  - 识别结果

一、训练模型三大步骤：

1、数据预处理部分

数据增强：使用torchvision中的transform模块自带的图像处理功能

Resize(128x128)：固定设置图片大小为128
RandomRotation(45)：随机旋转度数-45~45之间
CenterCrop(64)：从中心开始裁剪，从原图裁剪64x64
RandomHorizontalFlip（p=0.5）：随机水平翻转，设置概率为0.5
RandomVerticalFlip(p=0.5)：设置随机垂直翻转概率为0.5
ColorJitter(brightness=0.2, contrast=0.1, saturation=0.1, hue=0.1)：参数1为亮度，参数2为对比度，参数3为饱和度，参数4为色相
RandomGrayscale(p=0.025)：概率转换成灰度图
Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])：前面是均值，后面是标准差，分别对应的是R G B三个通道

数据标准化——transforms.Normalize

功能：逐channel的对图像进行标准化（均值变为0，标准差变为1），可以加快模型的收敛

output=(input-mean)/std
mean:各通道的均值
std:各通道的标准差
inplace:是否原地操作

2、网络模块设置

加载预训练模型，torchvision中有很多经典网络架构，调用起来十分方便，并且可以用人家训练好的权重参数来继续训练，也就是所谓的迁移学习
需要注意的是别人训练好的任务跟咱们的可不是完全一样，需要把最后的输出层改一改，一般也就是最后的全连接层，改成咱们自己的任务所需要的输出
训练时可以全部重头训练，也可以只训练最后咱们任务的层，因为前几层都是做特征提取的，本质任务目标是一致的

3、网络模型的保存与测试

模型保存的时候可以带有选择性，例如在验证集中如果当前效果好则保存

二、模型训练具体步骤

1、导入所需要的模块包

import os
import matplotlib.pyplot as plt
%matplotlib inline
import numpy as np
import torch
from torch import nn
import torch.optim as optim
import torchvision
from torchvision import transforms, models, datasets
import imageio
'''用于读取、写入和处理各种图像和视频格式。它提供了一个简单而灵活的接口，
可以轻松地读取和写入各种图像和视频格式，包括JPEG、PNG、GIF、BMP、TIFF、AVI、MPEG等常见格式，
还支持许多科学和医学图像格式'''
import time
import warnings
warnings.filterwarnings("ignore")
#函数将警告信息忽略掉，这样在程序运行过程中就不会显示任何警告信息了。
import random
import copy
import json
from PIL import Image

2、设置数据集文件路径

data_dir='./flower_data/'
train_dir='/train'
valid_dir='/valid'

3、数据预处理模块

data_transforms = {
    'train': 
    #compose里面内容按照顺序执行
        transforms.Compose([
        transforms.Resize([96, 96]), #用cpu跑的时候需要将图像大小设置小一点；
        transforms.RandomRotation(45),#随机旋转，-45到45度之间随机选
        transforms.CenterCrop(64),#从中心开始裁剪，从原图随机裁剪64x64 这个应该是最小了 尽量不要低于64
        transforms.RandomHorizontalFlip(p=0.5),#随机水平翻转 选择一个概率概率
        transforms.RandomVerticalFlip(p=0.5),#随机垂直翻转
        transforms.ColorJitter(brightness=0.2, contrast=0.1, saturation=0.1, hue=0.1),#参数1为亮度，参数2为对比度，参数3为饱和度，参数4为色相
        transforms.RandomGrayscale(p=0.025),#概率转换成灰度率，3通道就是R=G=B
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])#前面是均值，后面是标准差，分别对应的是R G B三个通道
    ]),
    'valid': 
        transforms.Compose([
        transforms.Resize([64, 64]),
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
    ]),
}

我们预处理的图片并不是将处理之后的图片保存到本地，而且通过dataloaders处理之后，直接传入到模型训练当中

4、获取数据集

batch_size = 128
image_datasets={x: datasets.ImageFolder(os.path.join(data_dir,x),data_transforms[x]) for x in ['train','valid']}##获取训练集和测试集数据，并进行预处理
dataloaders={x: torch.utils.data.DataLoader(image_datasets[x],batch_size=batch_size,shuffle=True) for in ['train','valid']}
#用dataloader设置验证集和训练集
dataset_sizes={x: len(image_datasets[x]) for in ['train','valid']} ##获取训练集和验证集总数
class_names=image_datasets['train'].classes # 获取子文件夹名，只有使用datasets.ImageFolder加载数据集才能使用classes

（1）`.classes`

image_datasets['train'].classes是在使用PyTorch中的torchvision.datasets.ImageFolder类加载图像数据集时，用于获取所有类别名称的属性。具体来说，torchvision.datasets.ImageFolder类会将数据集中每个子目录视为一个类别，并将该目录下所有图像文件视为该类别的样本。在加载数据集时，我们需要将数据集的根目录和各个类别的子目录传递给ImageFolder类，然后可以使用ImageFolder类的实例对象获取所有类别名称的列表。这个列表可以用于后续的模型训练和预测，方便我们对不同类别的样本进行分类。

案例

import torchvision.datasets as datasets
# 加载数据集
train_dataset = datasets.ImageFolder(root="./data/train")
# 获取所有类别名称
classes = train_dataset.classes
print(classes)

在上述示例中，我们首先使用ImageFolder类加载了训练集数据，然后使用classes属性获取了所有类别名称的列表，并打印出来。注意，如果数据集的子目录名称不是按照字母表顺序排列的，那么classes属性返回的列表也不会按照字母表顺序排列，而是按照子目录的创建顺序排列。如果需要按照字母表顺序排列，可以使用Python的sorted()函数对classes列表进行排序。

（2） `datasets.ImageFolder`

datasets.ImageFolder是PyTorch中一个用于加载图像数据集的类。它可以帮助我们快速地加载和预处理图像数据集，并将其转换为PyTorch中的Dataset对象，方便我们在训练神经网络时进行批量读取和处理。datasets.ImageFolder的基本用法非常简单，只需要指定数据集的根目录和各个类别的子目录即可自动扫描所有图像文件并将其转换为Dataset对象。具体来说，datasets.ImageFolder会将每个子目录视为一个类别，并将该目录下所有图像文件视为该类别的样本。在转换为Dataset对象后，我们可以使用DataLoader类进行批量读取和处理。

案例：

import torch
import torchvision.datasets as datasets
import torchvision.transforms as transforms
# 定义数据预处理
transform = transforms.Compose([
    transforms.Resize((224, 224)),  # 调整图像大小为224x224
    transforms.ToTensor(),  # 将图像转换为Tensor格式
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])  # 像素值归一化
])
# 加载数据集
train_dataset = datasets.ImageFolder(root="./data/train", transform=transform)
val_dataset = datasets.ImageFolder(root="./data/val", transform=transform)
# 创建数据加载器
train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=32, shuffle=True)
val_loader = torch.utils.data.DataLoader(val_dataset, batch_size=32, shuffle=False)

在上述示例中，我们首先定义了数据预处理的变换，包括调整图像大小、转换为Tensor格式、像素值归一化等。然后使用datasets.ImageFolder类分别加载了训练集和验证集，其中root参数指定了数据集的根目录，transform参数指定了数据预处理的变换。最后使用DataLoader类创建了训练集和验证集的数据加载器，可以方便地进行批量读取和处理。

5、读取标签对应的实际名字

with open('cat_to_name.json','r') as f:
  cat_to_name=json.load(f)

json.load(f)是Python中用于从文件中加载JSON数据的函数。JSON是一种轻量级的数据交换格式，常用于Web应用程序中的数据传输。在Python中，我们可以使用json标准库中的load()函数将JSON数据加载为Python中的数据类型，如字典、列表等。而json.load(f)函数则是将JSON数据从文件中加载到Python中。

6、加载models中提供的模型，并且直接用训练的好权重当做初始化参数

（迁移学习）

model_name='resnet18' #可选的比较多 ['resnet', 'alexnet', 'vgg', 'squeezenet', 'densenet', 'inception']
feature_extract=True #都用人家特征，咱先不更新，将别人的模型冻住，只有输出层进行更新

#是否使用GPU来进行训练
train_on_gpu=torch.cuda.is_available()

if not train_on_gpu:
  print('CUDA is not available.  Training on CPU ...')
else:
  print('CUDA is available!  Training on GPU ...')

device=torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')

#将网络中的每一层都冻结
def set_parameter_requires_grad(model,feature_extracting)
  if feature_extracting:
    for param in model.parameters():
      param.requires_grad=False

feature_extract = True是在使用迁移学习（transfer learning）进行图像分类模型训练时，一种常用的模型微调（fine-tuning）策略。在迁移学习中，我们通常使用预先训练好的模型来提取图像特征，然后将这些特征输入到一个新的分类器中进行训练。而在模型微调中，我们可以选择冻结（freeze）预训练模型的所有层，只训练新的分类器层，也可以解冻（unfreeze）预训练模型的部分或全部层，与新的分类器层一起进行训练。feature_extract = True就是指冻结预训练模型的所有层，只训练新的分类器层，即只更新新的分类器层的权重参数，不更新预训练模型的权重参数。这种策略可以降低模型训练的复杂度和计算量，加快模型训练的速度，同时可以避免过拟合（overfitting）的风险。

7、把模型输出层改成自己的

注意：当我重新设置全连接层的输出，虽然之前的梯度都设置为false了，但是新添加全连接层的梯度为True

def initialize_model(model_name,num_classes,feature_extract,use_pretrained):
  mode_ft=models.model_name(pretrained=use_pretrained)#pretrained=True：下载resnet18模型
  # 注意：resnet 只有18层 50层 101层 152层 没有其他的
  set_parameter_requires_grad(model_ft,feature_extract)#调用函数，将每一层的参数都设置位false
  num_ftrs = model_ft.fc.in_features #拿出最后一层的输入512
  model_ft.fc = nn.Linear(num_ftrs, num_classes) #类别数自己根据自己任务来
  
  input_size=64 # 输入大小根据自己配置来
  return model_ft,input_size

resnet模型最后一层:AdaptiveAvgPool2d全局平均池化，output_size=(1, 1)将每一维度求一个平均值，经过平均池化之后，我们得到的是一个512维的向量

8、设置哪些层需要进行训练(目前只设置全连接进行训练)

model.input_size=initialize_model(model_name,102,feature_extract,True)

#设置模型使用gpu还是cpu训练
model_ft=model_ft.to(device)

#设置模型保存的名字
filename='best.pt'

#是否训练所有网络层
params_to_update=model_ft.parameters() #将模型当中每一层的参数先储存下来
print("Params to learn:")
if feature_extract:
  params_to_update=[]
  for name,param in model_ft.named_parameters():
    if param.requires_grad==True:
      params_to_update.append(param)  #将有梯度的参数保存到列表list当中 此时params_to_update只保存了最后一层的参数
      print(name)
else:
    for name,param in model_ft.named_parameters():
        if param.requires_grad == True:
            print("\t",name)

`parameters`与`named_parameters`

在PyTorch中，model_ft.parameters()和model_ft.named_parameters()都是用于获取模型中需要更新的参数的方法，但它们返回的对象类型不同。 model_ft.parameters()方法返回一个Python迭代器，包含了模型中需要更新的所有参数。每个参数都是一个torch.Tensor类型的对象，可以通过梯度下降等优化算法进行更新。这个方法通常用于获取所有需要更新的参数，例如在定义优化器时使用。在迁移学习中，我们常常使用预训练模型中的部分或全部层作为特征提取器，只更新新的分类器层的参数。这时，我们可以通过设置requires_grad属性，决定哪些参数需要更新，哪些参数不需要更新。 model_ft.named_parameters()方法返回一个Python迭代器，包含了模型中需要更新的所有参数以及它们的名称。每个参数都是一个元组(name, parameter)，其中name是参数的名称，parameter是一个torch.Tensor类型的对象，可以通过梯度下降等优化算法进行更新。这个方法通常用于获取所有需要更新的参数以及它们的名称，例如在保存和加载模型时使用。在加载预训练模型时，我们通常需要根据参数名称匹配预训练模型中的参数，来恢复预训练模型的权重参数。

代码案例：

import torch
import torchvision.models as models
# 加载预训练模型
model_ft = models.resnet18(pretrained=True)
# 冻结所有层，只训练新的分类器层
for param in model_ft.parameters():
    param.requires_grad = False
model_ft.fc.requires_grad = True  # 解冻新的分类器层
# 获取需要更新的参数列表和名称
params_to_update = []
for name, param in model_ft.named_parameters():
    if param.requires_grad == True:
        params_to_update.append(param)
        print(name)  # 输出需要更新的参数名称
# 定义优化器
optimizer = torch.optim.SGD(params_to_update, lr=0.001, momentum=0.9)

在上述示例中，我们首先使用models.resnet18()函数加载了预训练的ResNet-18模型，然后使用for循环冻结了所有层的权重参数，只解冻了新的分类器层的权重参数。接着，我们使用model_ft.named_parameters()方法获取了所有需要更新的参数以及它们的名称，并将需要更新的参数添加到了一个列表中。同时，我们输出了需要更新的参数名称。最后，我们使用torch.optim.SGD()函数定义了优化器，并传递需要更新的参数列表params_to_update给优化器。

9、优化器设置

optimizer_ft=optim.Adam(param_to_update,lr=le-2) #要训练啥参数，你来定 这里设置只更新fc最后一层
schduler=optim.lr_scheduler.StepLR(optimizer_ft,step_size=10,gamma=0.1) # 定义学习率衰减 学习率每10个epoch衰减成原来的1/10
criterion=nn.CrossEntropyLoss() #设置交叉熵损失函数

optim.lr_scheduler.StepLR是PyTorch中的学习率调整器（learning rate scheduler）之一。学习率调整器用于在训练过程中动态地调整模型的学习率，以提高训练效果。

10、模型训练模块（重点）

def train_model(model,dataloaders,criterion,optimizer,num_epochs,filename)
  #记录训练开始时间
  since=time.time()
  
  #记录最好的一次精度
  best_acc=0
  
  #模型放到你的CPU或者GPU
  model.to(device)
  #训练过程中打印一堆损失和指标
  train_acc_history=[] #训练集的准确率
  val_acc_history=[]
  
  #训练损失
  train_losses=[]
  val_losses=[]
  
  #取当前的学习率
  LRs=[optimizer.param_groups[0]['lr']]
  
  #将最好的模型参数保存下来：model.state_dict()取出模型参数
  best_model_wts=copy.deepcopy(model.state_dict())
  
  #一个一个epoch来遍历
  for epoch in range(num_epochs):
  print('Epoch {}/{}'.format(epoch, num_epochs - 1))
  print('-' * 10)
    #训练和验证
    for phase in ['train','valid']:
      if phase == 'train':
        model.train()
      else:
        model.val()
      #初始化损失和预测正确的个数
      running_loss=0.0
      running_corrects=0
      
      #将所有数据都遍历一遍
      for inputs,labels in dataloaders[phase]:
        #把数据取出来的数据放到你的CPU或GPU
        inputs=inputs.to(device)
        labels=labels.to(device)
        
        #梯度清零
        optimizer.zero_grad()
        
        #只有训练的时候计算和更新梯度
        outputs=model(inputs)  #outputs=102
        loss=criterion(outputs,labels) #计算损失
        _，preds=torch.max(outputs,1) #取出我们的预测最大值的索引 用来计算后面的准确率
        
        # 训练阶段更新权重
        if phase=='train':
          loss.backward() #损失反向传播
          optimizer.step() #参数的更新
        
        #计算损失
        running_loss+=loss.item()*input.size(0)  #inputs:torch.Size([128, 3, 64, 64])
        #0表示batch那个维度，计算当前batch的一个损失
        running_corrects+=torch.sum(preds==labels.data)#预测结果最大索引的和真实值是否一致，保存预测正确的值
      epoch_loss=running_loss/len(dataloaders[phase].dataset)  # 算平均损失
      epoch_acc=running_corrects.double()/len(dataloaders[phase].dataset)
      
      time_elapsed = time.time() - since#一个epoch我浪费了多少时间
      
      print('Time elapsed {:.0f}m {:.0f}s'.format(time_elapsed // 60, time_elapsed % 60))
      print('{} Loss: {:.4f} Acc: {:.4f}'.format(phase, epoch_loss, epoch_acc))
      
      # 得到最好那次的模型
      if phase=='vaild' and epoch_acc>best_acc:
        best_acc=epoch_acc
        best_model_wts=copy.deepcopy(model.state_dict()) #将精度最好的模型参数拷贝下来
        state={#将精度最好模型参数，精度，优化器参数保存
          'state_dict':model.state_dict(),
          'best_acc':best_acc,
          'optimizer':optimizer.state_dict(),
        }
        torch.save(state, filename)
        
        #保存每一轮验证集和训练集的精度以及损失
      if phase=='valid':
        val_acc_history.append(epoch_acc)
        valid_losses.append(epoch_loss)
      if phase=='train':
        train_acc_history.append(epoch_acc)
        train_losses.append(epoch_loss)
    print('Optimizer learning rate : {:.7f}'.format(optimizer.param_groups[0]['lr']))
    LRs.append(optimizer.param_groups[0]['lr']) #保存当前学习率
    scheduler.step()#学习率衰减 一个step增加一次，当10次step之后(也就是10次epoch)，会进行一次学习率衰减
    
  time_elapsed=time.time()-since #计算所有epoch所花费的时间
  print('Training complete in {:.0f}m {:.0f}s'.format(time_elapsed // 60, time_elapsed % 60))
  print('Best val Acc: {:4f}'.format(best_acc))
  
  model.load_state_dict(best_model_wts)# 训练完后用最好的一次当做模型最终的结果,等着一会测试
  return model,val_acc_history,train_acc_history,valid_losses,train_losses,LRs

model_ft,val_acc_history,train_acc_hitory,valid_losses,train_losses,LRs=train_model(model_ft,dataloader,criterion,optimizer_ft,20,filename)

只训练全连接层结果：

可以看出训练集精度比验证集高，说明发生了过拟合；而且只训练全连接层的化，精度达到一定程度后将不在提高；

（1）model.state_dict()

model.state_dict()是PyTorch中用于返回模型的参数（权重和偏置）的字典形式。模型的参数包括了模型各个层的权重和偏置，这些参数在训练过程中会不断更新。 model.state_dict()返回的是一个字典，字典的键是每个层的名称，值是对应层的参数。可以将这个字典保存下来，以便后续恢复该模型的参数或在不同的设备上加载模型。

代码案例：

import torch
import torch.nn as nn
# 创建一个简单的模型
class SimpleModel(nn.Module):
    def __init__(self):
        super(SimpleModel, self).__init__()
        self.fc = nn.Linear(10, 1)
    def forward(self, x):
        return self.fc(x)
model = SimpleModel()
# 保存模型的参数
torch.save(model.state_dict(), 'model_params.pth')
# 加载模型的参数
new_model = SimpleModel()
new_model.load_state_dict(torch.load('model_params.pth'))

在上述示例中，我们首先创建了一个简单的模型SimpleModel，并保存了它的参数到文件"model_params.pth"中。然后，我们创建了一个新的模型new_model，并使用load_state_dict()方法加载之前保存的参数。这样，我们就可以使用model.state_dict()来获取模型的参数，并使用load_state_dict()来加载模型的参数，方便地保存和加载模型的状态。

（2）copy.deepcopy()

copy.deepcopy()是Python中用于创建一个对象的深拷贝的函数。它可以创建一个原对象的完全独立的副本，包括对象本身及其所有嵌套的对象。深拷贝与浅拷贝的区别在于，浅拷贝只会复制对象本身，而不会复制对象内部的嵌套对象，而深拷贝则会递归地复制对象及其嵌套对象。

代码案例：

import copy
# 原对象
original_list = [1, 2, [3, 4]]
# 深拷贝
copied_list = copy.deepcopy(original_list)
# 修改原对象
original_list[2][0] = 5
# 打印结果
print(original_list)  # [1, 2, [5, 4]]
print(copied_list)  # [1, 2, [3, 4]]

在上述示例中，我们首先创建了一个原对象original_list，它包含了一个嵌套的列表。然后，我们使用copy.deepcopy()对原对象进行深拷贝，得到一个独立的副本copied_list。接着，我们修改了原对象的嵌套列表中的一个元素。可以看到，原对象和副本对象的值不同，说明深拷贝创建了原对象及其嵌套对象的完全独立的副本。

（2）_，preds=torch.max(outputs,1)

_, preds = torch.max(outputs, 1)是一个常见的PyTorch操作，用于从模型的输出中获取预测结果。在这个操作中，outputs是经过模型前向传播后的输出结果，通常是一个张量。torch.max()函数会返回张量中每行或每列的最大值以及对应的索引。具体地，torch.max(outputs, 1)的第一个参数是要操作的张量，第二个参数1表示在每行上进行操作。这意味着函数会返回每行的最大值和对应的索引。返回的结果是一个元组，其中第一个元素是最大值，第二个元素是对应的索引。在这个操作中，我们使用了一个下划线_来表示我们不关心最大值，只关心索引。因此，通过_, preds = torch.max(outputs, 1)，我们将最大值丢弃，只保留了预测的索引，赋值给preds变量。这样，preds就是模型输出中每个样本的预测类别索引。我们可以进一步使用这些预测索引进行后续的评估、计算损失等操作。

（4）loss.item() * inputs.size(0)

loss.item() * inputs.size(0)用于计算一个batch中的总损失值。在这个操作中，loss.item()返回了一个标量值，表示一个batch中的平均损失。inputs.size(0)返回了一个整数值，表示一个batch中样本的数量。乘法运算 loss.item() * inputs.size(0) 将平均损失乘以样本数量，得到了整个batch的总损失值。这是因为平均损失只是单个样本的损失的统计量，要得到整个batch的损失值，需要将平均损失乘以样本数量。通过计算整个batch的总损失值，可以更好地理解模型在整个batch上的性能，并与其他batch进行比较。这在训练过程中、模型选择或性能评估中都是常见的操作。例如，如果loss.item()为0.5，inputs.size(0)为64（表示一个batch中有64个样本），那么loss.item() * inputs.size(0)的结果将为32，表示整个batch的总损失值为32。

11、继续训练其他网络层

上面的训练结果是只对全连接层进行训练，其他网络层都是冻结状态，下面开始训练所有网络结构

for param in model_ft.parameters():
  param.requires_grad=True #将每一层网络梯度都设置为True
  
#继续训练所有的参数，学习率降低一点
optimizer=optim.Adam(model_ft.paramters(),lr=1e-3) #1e-3表示科学计数法中的小数1乘以10的负3次方，即0.001。
scheduler=optim.lr_scheduler.StepLR(optimizer_ft, step_size=7, gamma=0.1) #7轮之后进行衰减

# 损失函数
criterion = nn.CrossEntropyLoss()

# 加载之前训练好的权重参数
checkpoint=torch.load(filename)
best_acc = checkpoint['best_acc']
model_ft.load_state_dict(checkpoint['state_dict']) #用我们训练好的权重参数，代替原来模型的权重参数


#所有网络层开始训练
model_ft,val_acc_history,train_acc_history,valid_losses,train_losses, LRs =train_model(model_ft, dataloaders, criterion, optimizer, 
num_epochs=10,filename)

训练所有网络层结果：

最好的一次精度达到了60%

12、加载训练好的模型（不在完整训练过程里面）

如果训练中断，可以继续加载模型进行训练，注意：两次训练的网络结构必须一样，同时每一层结构都不能发生改变

model_ft, input_size = initialize_model(model_name, 102, feature_extract, use_pretrained=True)

# GPU模式
model_ft = model_ft.to(device)

# 保存文件的名字
filename='best.pt'

# 加载模型
checkpoint = torch.load(filename)
best_acc = checkpoint['best_acc'] #取出之前保存的最好的准确率
model_ft.load_state_dict(checkpoint['state_dict'])

13、测试数据预处理

测试数据处理方法需要跟训练时一直才可以
crop操作的目的是保证输入的大小是一致的
标准化操作也是必须的，用跟训练数据相同的mean和std,但是需要注意一点训练数据是在0-1上进行标准化，所以测试数据也需要先归一化
最后一点，PyTorch中颜色通道是第一个维度，跟很多工具包都不一样，需要转换

Python中，iter()是一个内置函数，用于创建一个迭代器对象。在深度学习中，iter()函数常用于将数据加载器（dataloader）对象转换为一个可迭代的迭代器对象。在iter(dataloaders['valid'])中，dataloaders['valid']是一个验证数据加载器对象。通过调用iter()函数，可以将验证数据加载器对象转换为一个迭代器对象。迭代器对象可以通过next()函数逐个返回数据集中的元素。每次调用next()函数时，迭代器会返回下一个元素，直到遍历完所有元素为止。迭代器对象通常用于循环中，逐个处理数据集中的元素。在深度学习中，使用迭代器对象可以方便地遍历数据集中的批次（batches），并将它们输入到模型中进行训练或验证。通过iter(dataloaders['valid'])将验证数据加载器对象转换为迭代器对象后，可以使用循环来逐个访问验证数据集中的批次，并进行相应的操作。

dataiter=iter(dataloaders['valid']) #转换成可迭代对象，因为验证集我们设置的batch_size是128，所以每一次迭代取128个数据
images, labels = dataiter.next()# 所以每次next都会取一个batch_size 128个图片
model_ft.eval()

# 判断我们有没有GPU，验证也可以使用gpu验证
if train_on_gpu:
    output = model_ft(images.cuda())
else:
    output = model_ft(images)

model_ft(images.cuda())是将输入数据images传递给已经移动到GPU上的模型model_ft进行推理（inference）的操作。在这个操作中，images是一个张量（tensor），表示输入的图像数据。.cuda()是一个PyTorch方法，用于将张量移动到GPU上进行计算。通过调用.cuda()方法，images张量被移动到GPU上。 model_ft是一个已经定义好的模型对象，通常是一个神经网络模型。通过将images.cuda()作为输入传递给model_ft，可以将移动到GPU上的图像数据输入到模型中进行推理。

14、获取概率最大的结果

_, preds_tensor = torch.max(output, 1)
preds = np.squeeze(preds_tensor.numpy()) if not train_on_gpu else np.squeeze(preds_tensor.cpu().numpy())

np.squeeze是NumPy库中的一个函数，用于去除数组中维度为1的维度，从而减少数组的维度。具体而言，np.squeeze(a, axis=None)函数的作用是将数组 a 中维度为1的维度去除。参数 axis 可选，用于指定要去除的维度。当 axis 为 None 时（默认情况下），np.squeeze 将会去除所有维度为1的维度；当 axis 为整数或整数元组时，np.squeeze 将只去除指定的维度。

代码案例：

import numpy as np
a = np.array([[[1], [2], [3]]])  # shape: (1, 3, 1)
b = np.squeeze(a)  # shape: (3,)
c = np.squeeze(a, axis=0)  # shape: (3, 1)
print(b)
print(c)

#输出结果
[1 2 3]
[[1]
 [2]
 [3]]

在上述示例中，数组 a 的维度为 (1, 3, 1)，使用 np.squeeze 函数去除维度为1的维度后，得到的数组 b 的维度为 (3,)；当指定 axis=0 时，得到的数组 c 的维度为 (3, 1)。

15、图片处理模块

def im_convert(tensor):
'''展示数据'''
  image=tensor.to('cpu').clone().detach()
  image = image.numpy().squeeze() #转换为numpy类型
  image = image.transpose(1,2,0)# torch得到的数据一般是(c,h,w)格式，但是很多任务里面，第一个值并不是维度，这个操作我们可以把维度放到最后面
  image = image * np.array((0.229, 0.224, 0.225)) + np.array((0.485, 0.456, 0.406))
  image = image.clip(0, 1)
  return image

（1）tensor.to(‘cpu’).clone().detach()

是对一个PyTorch张量进行操作的代码片段。它的作用是将张量移动到CPU上，创建它的副本，并且将副本从计算图中分离（detach）。具体而言，这个操作包含了以下几个步骤：

tensor.to("cpu")将张量移动到CPU上进行计算。在PyTorch中，可以通过调用.to()方法并传递"cpu"作为参数，将张量从GPU上移动到CPU上。
clone()创建了张量的副本。副本是原始张量的一个完全独立的拷贝，两者之间没有任何关联。
detach()将副本从计算图中分离。在PyTorch中，张量默认是连接到计算图中的，这意味着它们可以追踪其计算历史并进行自动微分。调用detach()方法可以将张量从计算图中分离，使其成为一个独立的张量，不再与原始计算图相关联。通过tensor.to("cpu").clone().detach()操作，可以获得一个在CPU上的张量副本，该副本不再与原始计算图相关联，可以进行后续的计算或操作，而不会对原始张量造成影响。

（2）image.clip(0, 1)

是对一个图像数组进行操作的代码片段。它的作用是将图像数组中的像素值限制在指定的范围内，即将小于0的像素值设为0，大于1的像素值设为1。具体而言，image.clip(0, 1)会对图像数组中的每个像素值进行处理，如果像素值小于0，则将其设为0；如果像素值大于1，则将其设为1。这样可以确保图像中的像素值在合理的范围内，通常是0到1之间。这个操作常用于图像处理中，特别是在对图像进行预处理或后处理时，用于保证图像的像素值不超过指定的范围。将像素值限制在0到1之间可以避免因为像素值过大或过小而导致的图像质量问题，同时也可确保图像的像素值符合预期的数据范围。

16、绘制图片

fig=plt.figure(figsize=(20,20))
columns =4
rows = 2
for idx in range (columns*rows):
    ax = fig.add_subplot(rows, columns, idx+1, xticks=[], yticks=[])
    plt.imshow(im_convert(images[idx]))
    ax.set_title("{} ({})".format(cat_to_name[str(preds[idx])], cat_to_name[str(labels[idx].item())]),
                 color=("green" if cat_to_name[str(preds[idx])]==cat_to_name[str(labels[idx].item())] else "red"))
plt.show()

plt.figure(figsize=(20, 20))是用于创建一个具有指定尺寸的图像窗口的代码。它使用了Matplotlib库中的plt.figure()函数，并通过figsize参数指定了图像窗口的尺寸。

ax = fig.add_subplot(rows, columns, idx+1, xticks=[], yticks=[])是用于在图像窗口中添加子图的代码。它使用了Matplotlib库中的add_subplot()方法，并通过参数指定子图的位置和属性。具体而言，rows表示图像窗口中子图的行数，columns表示图像窗口中子图的列数，idx+1表示子图的索引（从1开始计数）。 xticks=[]和yticks=[]表示在子图中不显示x轴和y轴的刻度。

识别结果

红色title表示识别错误

你可能感兴趣的:(Pytorch,深度学习,pytorch,人工智能)

android前台服务 Android西红柿 Android基础 android
关于作者：CSDN内容合伙人、技术专家，从零开始做日活千万级APP。专注于分享各领域原创系列文章，擅长java后端、移动开发、商业变现、人工智能等，希望大家多多支持。未经允许不得转载目录一、导读二、使用2.1添加权限2.2新建一个服务2.3构建通知消息2.4启动与停止服务三、推荐阅读一、导读我们继续总结学习基础知识，温故知新。今天记录下android前台服务（ForegroundService），
[论文总结] 深度学习在农业领域应用论文笔记14 落痕的寒假论文总结深度学习论文阅读人工智能
当下，深度学习在农业领域的研究热度持续攀升，相关论文发表量呈现出迅猛增长的态势。但繁荣背后，质量却不尽人意。相当一部分论文内容空洞无物，缺乏能够落地转化的实际价值，“凑数”的痕迹十分明显。在农业信息化领域的顶刊《ComputersandElectronicsinAgriculture》中也大面积存在。众多论文在研究方法上存在严重缺陷，过于简单粗放。只是机械地把深度学习方法生硬地套用到特定农业问题中
详解三种常用标准化：Batch Norm、Layer Norm和RMSNorm yyytucj batch 开发语言
在深度学习中，标准化技术是提升模型训练速度、稳定性和性能的重要手段。本文将详细介绍三种常用的标准化方法：BatchNormalization（批量标准化）、LayerNormalization（层标准化）和RMSNormalization（RMS标准化），并对其原理、实现和应用场景进行深入分析。一、BatchNormalization1.1BatchNormalization的原理BatchNor
企业数字化转型AI能力中台（总体架构、系统功能）建设方案公众号：优享智库数字化转型数据治理主数据数据仓库人工智能架构
**企业数字化转型AI能力中台建设方案**一、建设背景与目标随着大数据、云计算、人工智能等技术的快速发展，企业正面临着数字化转型的重要机遇。为了提升企业的智能化水平，加快业务创新，建设AI能力中台成为企业的迫切需求。本方案旨在为企业打造一套功能完善的AI能力中台，实现数据采集与整合、算法模型管理、智能分析与可视化等核心功能，推动企业在各个业务领域实现智能化升级和创新。二、总体架构设计AI能力中台采
单片机与人工智能：融合创新的未来之路嵌入式大圣单片机人工智能嵌入式硬件
摘要：本文深入探讨了单片机与人工智能的融合，阐述了单片机在人工智能应用中的角色、挑战与机遇。通过对相关技术的分析、实际案例的展示以及未来发展趋势的展望，揭示了这一融合在推动科技创新和产业发展中的巨大潜力。目录一、引言二、单片机与人工智能的基础概念三、单片机与人工智能的融合技术四、单片机与人工智能融合的应用场景五、单片机与人工智能融合面临的挑战六、单片机与人工智能融合的发展趋势七、结论一、引言随着科
构建高效AI中台：解析人工智能中台架构的五大核心层脱泥不tony 人工智能架构大语言模型大模型 AI大模型 LLM AI
在人工智能技术蓬勃发展的今天，企业迫切需要一种高效、灵活的方式来整合、管理和应用AI技术。人工智能中台（AIMiddlePlatform）应运而生，它为企业提供了一个统一的技术平台，能够有效支撑多样化的业务需求，实现数字化转型。在本文中，我们将详细解析人工智能中台的整体架构，逐层深入，帮助大家理解如何从底层硬件到上层应用，实现全方位的AI能力构建。一、基础设施层（IaaS）：奠定坚实基础任何一个高
Baklib揭示内容中台与人工智能技术的创新协同效应清风徐徐de来其他
内容概要在当今信息爆炸的时代，内容的高效生产与分发已成为各行业竞争的关键。内容中台与人工智能技术的结合，为企业提供了一种新颖的解决方案，使得内容创造的流程更加智能化和高效化。内容中台作为信息流动的核心，能够集中管理和分发多元化的内容资源，为各类用户需求提供服务。同时，人工智能技术则在数据分析、用户行为预测、个性化推荐等方面展现出强大的能力。两者相辅相成，推动了在内容生产过程中的创新与发展。以下表格
智安护航：基于人工智能与物联网的智能车祸报警系统设计与实现 IT源码大师人工智能物联网科技 opencv 计算机视觉
详细描述：1.引言：智能车祸报警器的背景与意义交通事故是全球范围内导致伤亡和财产损失的主要原因之一。在车祸发生后，及时的报警和救援可以显著降低伤亡率和损失程度。然而，传统的车祸报警方式依赖于目击者或驾驶员的主动报警，存在延迟性和不可靠性。特别是在驾驶员受伤或昏迷的情况下，报警可能无法及时发出，导致救援延误。“智安护航”是一款基于人工智能（AI）与物联网（IoT）技术的智能车祸报警器，旨在通过实时监
机器人介绍 max500600 机器人机器人
以下是关于机器人的介绍：定义机器人是一种能够自动执行任务的机器系统，它集成了机电、机构学、材料学及仿生学等多个学科技术，可以接受人类指挥，运行预先编排的程序，或根据人工智能技术制定的原则纲领行动，具备感知、决策、执行等基本特征，可辅助甚至替代人类完成各种任务。发展历程萌芽期：1954年第一台可编程的机器人在美国诞生，1959年世界上第一台工业机器人研制成功，随着机构理论和伺服理论的发展，机器人进入
利用 PyTorch 动态计算图和自动求导机制实现自适应神经网络 drebander AI 编程 pytorch 神经网络人工智能
在深度学习任务中，不同任务的复杂度千差万别。为了解决复杂任务对模型容量的需求，同时避免简单任务因过度拟合导致的性能下降，我们可以构建一个能够根据任务自动调整网络结构的神经网络。在PyTorch中，动态计算图和自动求导机制为实现这一目标提供了强大的工具。动态网络结构设计PyTorch的动态计算图允许我们根据运行时的输入数据或任务复杂度，动态创建和修改网络结构。动态添加/移除层：可以在训练过程中根据需
通义千问 Qwen2-VL-2B：技术架构、核心原理、微调操作与场景应用详解 zhangjiaofa 大模型通义千问大模型多模态模型微调
通义千问Qwen2-VL-2B：技术架构、核心原理、微调操作与场景应用详解引言近年来，多模态大模型在人工智能领域取得了显著进展，尤其是在视觉语言理解（Vision-LanguageUnderstanding,VL）方面。阿里云通义千问团队推出的Qwen2-VL-2B模型，作为Qwen2-VL系列中的轻量级版本，凭借其高效的计算性能和强大的多模态处理能力，成为开源社区和工业界关注的焦点。本文将深入解
可解释性：走向透明与可信的人工智能一位小说男主人工智能入门深度学习机器学习人工智能神经网络
随着深度学习和机器学习技术的迅速发展，越来越多的行业和领域开始应用这些技术。然而，这些技术的“黑盒”特性也带来了不容忽视的挑战。在许多任务中，尽管这些模型表现出色，取得了相当高的精度，但其决策过程不透明，这对于依赖于机器决策的应用（如金融、医疗、法律等）来说，可能是无法接受的。因此，如何提高模型的可解释性、实现透明和可信的人工智能，成为了当下人工智能领域的重要课题。❤️本文将深入探讨机器学习中的可
**LLM Gateway：您的智能对话门户** 芮奕滢Kirby
LLMGateway：您的智能对话门户llm-gatewayGatewayforsecure&reliablecommunicationswithOpenAIandotherLLMproviders项目地址:https://gitcode.com/gh_mirrors/ll/llm-gateway在人工智能和自然语言处理的浪潮中，LLMGateway以其卓越的设计与功能脱颖而出，为开发者和用户提供
单目测距（yolo-目标检测+标定+深度学习目标检测_测距）计算机C9硕士_算法工程师 YOLO 目标检测深度学习
YOLOv5模型介绍YOLOv5是目前最先进的目标检测算法之一，在多个数据集上取得了优秀的表现。相较于YOLOv4，YOLOv5采用了更深的Backbone网络和更高的分辨率输入图像，以提高检测精度和速度。单目测距实现方法在目标检测的基础上，我们可以通过计算物体在图像中的像素大小来估计其距离。具体方法是，首先确定某个物体的实际尺寸，然后根据该物体在图像中的像素大小计算其距离。这个方法可以应用于各种
Depth Anything V2：单目深度估计的更强基线武朵欢Nerissa
DepthAnythingV2：单目深度估计的更强基线项目地址:https://gitcode.com/gh_mirrors/de/Depth-Anything-V2项目介绍DepthAnythingV2是由HKU与TikTok团队合作开发的单目深度估计算法的升级版本。这个框架显著提升了细节处理能力和鲁棒性，相比于基于深度学习的方法，它提供了更快的推理速度、更少的参数量以及更高的深度预测精度。本项
使用PyTorch实现逻辑回归：从训练到模型保存与加载 Luzem0319 pytorch 逻辑回归人工智能
1.引入必要的库首先，需要引入必要的库。PyTorch用于构建和训练模型，pandas和numpy用于数据处理，matplotlib用于结果的可视化。importtorchimporttorch.nnasnnimporttorch.optimasoptimfromtorch.utils.dataimportDataLoader,TensorDatasetimportpandasaspdimport
AI如何帮助解决生活中的琐碎难题？ HUIBUR科技人工智能
引言：AI已经融入我们的日常生活你有没有遇到过这样的情况——早上匆忙出门却忘了带钥匙，到了公司才想起昨天的会议资料没有打印，或者下班回家还在纠结晚饭吃什么？这些看似微不足道的小事，往往让人疲惫不堪。而如今，人工智能（AI）的出现，正在悄然改变这一切。从语音助手到智能家居，从健康管理到购物推荐，AI正在帮助人们处理生活中的琐碎事务，让每一天变得更高效、更轻松。只需要动动嘴或者点一点手机，就能完成过去
DeepSeek是由杭州深度求索人工智能基础技术研究有限公司（简称“深度求索”）发布的一系列人工智能模型大霸王龙人工智能
DeepSeek是由杭州深度求索人工智能基础技术研究有限公司（简称“深度求索”）发布的一系列人工智能模型，其在知识类任务上展现出了卓越的性能。以下是对DeepSeek的详细介绍，内容虽无法达到10000字，但会尽可能全面且深入地解析其各个方面。一、公司背景与核心理念DeepSeek的母公司深度求索由幻方量化在2023年4月创立。幻方量化是国内量化私募领域的巨头之一，管理规模庞大。DeepSeek的
数据挖掘的常用算法北柠陌寒0207 笔记
在大数据时代,数据挖掘是最关键的工作。大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程,也是一种决策支持过程。其主要基于人工智能,机器学习,模式学习,统计学等。通过对大数据高度自动化地分析,做出归纳性的推理,从中挖掘出潜在的模式,可以帮助企业、商家、用户调整市场政策、减少风险、理性面对市场,并做出正确的决策。目前,在很多领域尤其
OpenAI的编程语言和框架，给程序员带来了帮助有哪些 API技术大佬Anzexi58 OpenAI 人工智能人工智能深度学习
OpenAI是一个人工智能开发公司，成立于2015年，总部位于美国旧金山。这家公司致力于研究和开发先进的人工智能技术，旨在将这些技术应用到解决全球一些最棘手的问题上。OpenAI以其卓越的技术和实验室出品的groundbreakingAIpapers而闻名。OpenAI的研究涉及深度学习、自然语言处理、视觉感知、强化学习等多个领域，并已在各种应用中取得了令人瞩目的成果。例如，在机器人领域，Open
LangGraph系列-1：用LangGraph构建简单聊天机器人梦想画家机器学习 LangGraph LangChain
在快速发展的人工智能和大型语言模型（llm）世界中，开发人员不断寻求创建更灵活、更强大、更直观的人工智能代理的方法。虽然LangChain已经改变了这个领域的游戏规则，允许创建复杂的链和代理，但对代理运行时的更复杂控制的需求也在不断增长。LangGraph是建立在LangChain之上的重要模块，它将彻底改变我们设计和实施人工智能工作流的方式。在这篇博客中，我们提供了一个关于构建聊天机器人和彻底改
探索OpenAI Python SDK: 智能编程新里程周澄诗Flourishing
探索OpenAIPythonSDK:智能编程新里程openai-pythonTheofficialPythonlibraryfortheOpenAIAPI项目地址:https://gitcode.com/gh_mirrors/op/openai-python如果你对人工智能和自然语言处理有浓厚的兴趣，那么这个项目将为你开启新的探索之门——。这是一个由OpenAI开发的Python库，用于与他们的A
Upgini: 智能数据搜索与丰富化引擎 - 提升机器学习和人工智能模型准确性的利器 2401_87189860 人工智能机器学习
Upgini:智能数据搜索与丰富化引擎在当今数据驱动的世界中,机器学习和人工智能模型的准确性至关重要。然而,提高模型准确性往往是一项艰巨的任务,需要大量的特征工程和数据处理工作。幸运的是,Upgini这一创新的Python库为数据科学家和机器学习工程师提供了一个强大的解决方案。Upgini的核心功能Upgini是一个智能数据搜索和丰富化引擎,专为机器学习和AI设计。它的主要功能包括:自动特征发现与
CopilotForXcode: 为Xcode带来AI辅助编程的强大扩展 2401_87189860 xcode 人工智能 macos
CopilotForXcode:为Xcode带来AI辅助编程的强大扩展在人工智能快速发展的今天，AI辅助编程工具正在成为开发者提升效率的重要助手。对于使用Xcode进行iOS、macOS等Apple平台开发的Swift程序员来说，一款名为CopilotForXcode的扩展正在受到越来越多的关注。本文将详细介绍CopilotForXcode的主要功能、安装配置过程以及使用技巧，帮助开发者充分利用这
Pytorch 基础之张量索引攻城狮随笔 Pytorch 机器学习 pytorch 深度学习 python
本次将介绍一下Tensor张量常用的索引与切片的方法：1.index索引index索引值表示相应维度值的对应索引a=torch.rand(4,3,28,28)print(a[0].shape)#返回维度一的第0索引tensorprint(a[0,0].shape)#返回维度一0索引位置，维度二0索引位置的tensorprint(a[0,0,0].shape)#返回维度一0索引，维度二0索引，维度三
DeepSeek：突破传统的AI算法与下载排行分析 smart_ljh 行业搜索人工智能 AI
DeepSeek的AI算法突破DeepSeek相较于OpenAI以及其它平台的性能对比DeepSeek的下载排行分析（截止2025/1/28AI人工智能相关DeepSeek甚至一度被推上了搜索）未来发展趋势总结在人工智能技术飞速发展的当下，搜索引擎市场也迎来了新的变革。DeepSeek，作为一款基于深度学习技术和大数据算法的搜索引擎，以其独特的优势在国内外市场上引起了广泛关注。下面介绍一下针对De
数学与机器学习：共舞于智能时代的双璧每天五分钟玩转人工智能机器学习人工智能
随着人工智能的崛起，机器学习作为其核心技术之一，正引领着新一轮的科技革命。而在这场革命中，数学以其深邃的理论和精妙的工具，为机器学习提供了坚实的支撑。数学与机器学习之间的关系，如同琴瑟和鸣，共同编织出智能时代的华美乐章。数学，作为自然科学的皇后，以其严谨的逻辑和精确的推理，为机器学习提供了坚实的理论基础。机器学习算法的设计、优化和应用，都离不开数学的支持。无论是线性代数、概率统计，还是微积分、最优
动物产生式识别系统（人工智能实验）不爱编程的程序媛人工智能数据结构算法
1.实验原理首先，定义两个整数数组`base`和`temp`，分别用于存储特征值和临时存储输入的特征值。输出特征值代表的信息，包括每个特征值对应的动物类型。提示输入特征值的总数，并使用`Scanner`类从控制台读取输入。使用循环遍历输入的特征值，将其存储在`temp`数组中，并在`base`数组中将对应特征值的位置设为1。根据输入的特征值，设置`base`数组中其他位置的值。例如，如果输入的特征
大模型应用：探索AI大模型的50个应用场景：让科技改变生活。 AGI大模型资料分享员人工智能科技生活 agi 语言模型自然语言处理
随着人工智能技术的迅猛发展，AI大模型在各个领域的应用日益广泛。百度创始人、董事长兼首席执行官李彦宏在2024年世界人工智能大会上表示，目前AI技术发展路线发生了方向性改变，已从过去辨别式人工智能转向了未来生成式人工智能。他更是呼吁：“大家不要卷模型，要卷应用！”本文将为大家盘点AI大模型的50个应用场景，并按应用频率从高到低进行排列，带您了解AI如何深刻改变我们的工作与生活。1.自然语言处理(N
从模型到实际：人工智能项目落地的关键要素 IT猫仔科技人工智能语言模型自然语言处理搜索引擎服务器机器学习
引言近年来，人工智能技术从实验室走向实际应用，其潜力在各行各业得到了初步的验证。然而，AI技术的落地并非一蹴而就，许多企业在尝试部署AI项目时，却发现自己陷入了“模型很好看，应用却难做”的困境。无论是数据准备不足、算法与场景的不匹配，还是缺乏持续优化的机制，这些问题都可能导致项目停滞，甚至功亏一篑。前排提示，文末有大模型AGI-CSDN独家资料包哦！对于企业来说，人工智能的价值不仅在于模型的高精度
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

pytorch实现迁移训练-resnet18训练花朵识别模型【深度学习】

完整训练花朵数据集思路！

一、训练模型三大步骤：

1、数据预处理部分

2、网络模块设置

3、网络模型的保存与测试

二、模型训练具体步骤

1、导入所需要的模块包

2、设置数据集文件路径

3、数据预处理模块

4、获取数据集

（1）.classes

（2） datasets.ImageFolder

5、读取标签对应的实际名字

6、加载models中提供的模型，并且直接用训练的好权重当做初始化参数

7、把模型输出层改成自己的

8、设置哪些层需要进行训练(目前只设置全连接进行训练)

parameters与named_parameters

9、优化器设置

10、模型训练模块（重点）

只训练全连接层结果：

（1）model.state_dict()

（2）copy.deepcopy()

（2）_，preds=torch.max(outputs,1)

（4）loss.item() * inputs.size(0)

11、继续训练其他网络层

训练所有网络层结果：

12、加载训练好的模型（不在完整训练过程里面）

13、测试数据预处理

14、获取概率最大的结果

15、图片处理模块

（1）tensor.to(‘cpu’).clone().detach()

（2）image.clip(0, 1)

16、绘制图片

识别结果

你可能感兴趣的:(Pytorch,深度学习,pytorch,人工智能)

（1）`.classes`

（2） `datasets.ImageFolder`

`parameters`与`named_parameters`