Leon_winter

pytorch笔记：一些常见操作，构建全连接神经网络，验证操作，评估模式

文章目录

生成tensor

格式转换
设置requires_grad参数

构建全连接神经网络

构建全连接神经网络模型
选择损失函数
选择优化方法
反向传播
批训练操作
GPU加速
保存和读取模式
所有代码

快速搭建模型与添加模型结构

快速搭建模型
添加模型结构

输出模型结构或者中间层权重

输出模型结构
输出参数取值

验证操作与模型的评估模式

验证操作
评估模式

torchvision

Pytorch是神经网络届的numpy，numpy会把array放到CPU中加速计算，torch会把tensor放到GPU中加速计算。torch和numpy有很多用法是一样的，只不过numpy的方法接受的是array或者matrix，torch接受的是tensor。

按照官网安装，一般是两行命令，第一行装的是pytorch的主模块，第二行安装的torchvision，会包含一些数据库，例如图片数据库，还有一些预先训练好的模型，例如VGG，ResNet，在写神经网络模型时，可以直接照搬里面的模板。

在使用之前需要导入库，一般有

import torch       
from torch import nn    # 这个库用于构建神经网络的结构，neural networks的缩写
                        # 里面包括线性层，卷积层，循环神经网络单元等， 当然也包括很多的激活函数
from torch import optim   # 优化方法，MSE，交叉熵等
from torch.utils.data import DataLoader    # 用于mini-batch SGD的喂数据的类

还有一些类可以根据需要选择是否导入

from torch.autograd import Variable     # 变量类，以前需要把tensor类型变成variable类型才可以反向传播
                                        # 现在版本一般合并了tensor类型和variable类型，直接用tensor类型就可以反向传播  
from collections import OrderedDict  # 字典一般没有先后顺序，OrderedDict 用以生成有先后顺序的字典
from torch.utils.data.sampler import SubsetRandomSampler    # 手动抽样的类，根据需要选择是否导入这个库

我们可以通过下面的方法，查看pytorch的版本，以及是否支持使用GPU加速

print(torch.__version__) 
print(torch.cuda.is_available())

可以通过下面的方法查看可以使用多少GPU

print(torch.cuda.device_count())

生成tensor

使用pytorch时，要注意三种大的数据类型，一是传统python的List和numpy的nd.array，二是pytorch中的tensor，三是pytorch中的variable；早期版本，我们需要沿着这条线，从传统python数据结构转换到tensor，在从tensor转换到variable，只有variable才可以进行反向传播，但是较新的版本的pytorch合并了tensor和variable的功能(variable类仍然存在，仍可以按照老版代码写)，不需要转换variable，只需要把tensor的requires_grad参数设置为True，如果requires_grad=Fasle时不需要更新梯度，适用于冻结某些层的梯度。

# 法一：从numpy库生成模板
data = [1,2,3,4]
data = np.array(data)
tensor = torch.from_numpy(data)    # 默认生成torch.int

data = [1.,2,3,4]    
data = np.array(data)
tensor = torch.from_numpy(data)    # 默认生成torch.float64

## 同样也可以把tensor转换成numpy形式
data2 = tensor.numpy()

#  法二：利用pytorch的一些函数，这些函数一般和numpy中的类似
tensor = torch.zeros(1, requires_grad=True)  # 对应numpy中的np.zeros()     
                #  requires_grad=True表示tensor写入计算图，进行梯度反向传播
tensor = torch.linspace(-5,5,200)   # 对应numpy中的np.linspace()
tensor = torch.add(tensor,tensor)  # 对应numpy中的np.add()
tensor = torch.mean(tensor)  # 对应numpy中的np.mean()

# 法三：当然也可以直接转换成FloatTensor等tensor形式
tensor = torch.FloatTensor([[1,2],[3,4]])   # 直接把list转化成浮点形式的tensor

格式转换

data = [1,2,3,4]
data = np.array(data)
tensor = torch.from_numpy(data)    # 默认生成torch.int
tensor = tensor.type(torch.float)    # 转化为torch.float32
tensor = tensor.type(torch.float64)    # 转化为torch.float64
tensor = tensor.type(torch.float16)    # 转化为torch.float16
tensor = tensor.type(torch.int8)     # 转化为torch.int8

设置requires_grad参数

# 生成tensor变量时就设置requires_grad
tensor = torch.zeros(1, requires_grad=True)   # 生成时默认requires_grad参数是False， 除非声明requires_grad=True

# 单个tensor变量改变requires_grad
tensor = torch.FloatTensor([[1,2],[3,4]])   # 生成时默认requires_grad参数是False，torch.FloatTensor没有requires_grad参数
tensor.requires_grad = False

# 或者
tensor.requires_grad_(True)

# 整个模型改变requires_grad
for param in model.parameters():
    param.requires_grad = False

注意：只有浮点类型支持backword自动求导，且求导，只能是【标量】对标量，或者【标量】对向量/矩阵求导！，一般loss函数求出来的就是一个标量。如果自变量是向量、矩阵、张量等，需要定义backword()中的gradients参数。

构建全连接神经网络

在PyTorch中，所有的neural network module都是class torch.nn.Module的子类，在Modules中可以包含其它的Modules。

构建全连接神经网络模型

# 搭建神经网络
class Net(torch.nn.Module):   # 标准模板
    def __init__(self, n_features, n_hidden, n_output):   # 标准模板，定义生成模型时传入的参数
        super(Net, self).__init__()    # 标准模板
        self.hidden = torch.nn.Linear(n_features, n_hidden)   # 全连接层，输入n_features, 输出n_hidden
        self.predict = torch.nn.Linear(n_hidden, n_output)   # 全连接层，输入n_hidden, 输出n_output
        
    def forward(self, x):  # 标准模板，  定义前向传播， self一定要有， x是输入模型的数据
        self.x = x
        self.x = F.relu(self.hidden(self.x))
        self.x = self.predict(self.x)
        
        return self.x

选择损失函数

# 回归一般用MSE
loss_func = torch.nn.MSELoss()
# 分类一般用交叉熵
loss_func = torch.nn.CrossEntropyLoss()

选择优化方法

如果没有特殊的选择，就选择Adam，Adam可以适用于大多数的场景。

opt = torch.optim.Adam(net.parameters(), lr = 0.2)

pytorch中，学习率可以动态更新，例如在迭代了75%的epoch时，把学习率缩小为原来的十分之一

lr_new = 0.001        # 新定义的学习率
for param_group in opt.param_groups:
        param_group['lr'] = lr_new

反向传播

opt.zero_grad()   # 标准流程，梯度清零，猜测是因为要根据batch中的所有数据的梯度求平均，
                      # 所以每个参数位置都有batch个梯度，在进入下一个batch循环前，要清零
loss.backward()  # 标准流程，反向传播计算梯度，进行一次反向传播，计算图就会被销毁，如果不想让计算图销毁，可以retain_graph=True
opt.step()  # 标准流程，更新所有参数
# backward只把梯度传给每个变量，优化器再根据梯度来优化这些变量的值

批训练操作

生成dataloader：

# 批数据训练
BATCH_SIZE = 10
torch_dataset = Data.TensorDataset(x,y)   # 这一步是把x，y融合在一起，
                            # 当然可以不做这一步，dataloader中的dataset传入list，list的size是 
                            # 依次为list类型，list或tuple类型，ndarray，而不是全ndarray
                            # 这样的输入有效避免了特征和标签数据量不匹配生成ndarray.object，使得dataloader报错。
loader = Data.DataLoader(
    dataset = torch_dataset,
    batch_size = BATCH_SIZE,
    shuffle = True,         # 是否打乱数据
)

当然dataloader可以传入sampler参数(一个列表)，自定义从数据集中提取样本的顺序。如果指定sampler，则忽略shuffle参数。

使用dataloader时，利用了python的enumerate

for epoch in range(10):
    for step, (batch_x, batch_y) in enumerate(loader)：
            
        pred = net(batch_x)
        loss = loss_func(pred, batch_y)
        
        opt.zero_grad()
        loss.backward()
        opt.step()

GPU加速

先定义使用哪个GPU或CPU，默认GPU是从零开始编号，也就是说，如果设置torch.device(“cuda:3”)，就使用了第4块显卡。

device = torch.device("cuda:3" if torch.cuda.is_available() else "cpu")
print(device)

# 输出:
# device(type='cuda', index=3)

pytorch中想要使用GPU加速，只需把模型、数据后面加上" .to(device) "即可，优化方法和损失函数加不加都可以。注意这个时候数据类型已经不同，如果CPU下数据类型是torch.FloatTensor，GPU模式下数据类型就变成了torch.cuda.FloatTensor。

print(torch.FloatTensor([1.]))    # 输出：tensor([1.])
print(torch.FloatTensor([1.]).to(device))     # 输出：tensor([1.], device='cuda:3')

在变回numpy前，需要用.cpu()切回CPU模式

print(torch.FloatTensor([1.]).to(device).cpu())    # 输出：tensor([1.])
print(torch.FloatTensor([1.]).to(device).cpu().numpy())     # 输出：[1.]

保存和读取模式

保存

# 保存
# 法一，保存整个神经网络
torch.save(net, 'net.pkl')

# 法二，保存神经网络的参数
torch.save(net.state_dict(), 'net_para.pkl')

# 以元祖形式保存，可以保存更多的东西
torch.save({'epoch': i, 'model': model, 'train_loss': train_loss,
                        'valid_loss': valid_loss},  model_filename + '.model')

提取

# 提取
# 存储方法一对应的读取，整个神经网络
net2 = torch.load('net.pkl')
prediction = net2(x)

# 存储方法二对应的读取，神经网络的参数，需要先搭建神经网络，然后把参数放进去   # 这里是一种快速搭建法
net3 = torch.nn.Sequential(
    torch.nn.Linear(1,10),
    torch.nn.ReLU(),      # 注意这里的ReLU的大写成分
    torch.nn.Linear(10,1)
)
net3.load_state_dict(torch.load('net_para.pkl'))
prediction = net3(x)

# 元祖对应读取
best_model = torch.load(model_filename + '.model').get('model')

所有代码

# 初始化数据
x = torch.unsqueeze(torch.linspace(-1, 1, 100), dim=1)  # x data (tensor), shape=(100, 1)  
   # 注意这里x不需要requires_grad=True，如果设置为True，就会放到计算图中，一次backward后就会销毁
   # 第二次循环的backward就会报错
y = x.pow(2) + 0.2*torch.rand(x.size()) # noisy y data (tensor), shape=(100, 1)
  # 同样，这里y也不需要requires_grad=True

# 批数据训练
BATCH_SIZE = 10
torch_dataset = Data.TensorDataset(x,y)   # 这一步是把x，y融合在一起，
loader = Data.DataLoader(
    dataset = torch_dataset,
    batch_size = BATCH_SIZE,
    shuffle = True,         # 是否打乱数据
)

# 搭建神经网络
class Net(torch.nn.Module):
    def __init__(self, n_features, n_hidden, n_output):
        super(Net, self).__init__()
        self.hidden = torch.nn.Linear(n_features, n_hidden)
        self.predict = torch.nn.Linear(n_hidden, n_output)
        
    def forward(self, x):
        self.x = x
        self.x = F.relu(self.hidden(self.x))
        self.x = self.predict(self.x)
        
        return self.x
    
# 实例化
net = Net(1,10,1)

# 训练模式
net.train()   
    
# 优化方法和损失函数
loss_func = torch.nn.MSELoss()
opt = torch.optim.Adam(net.parameters(), lr = 0.2)


# 迭代训练
for epoch in range(10):
    total_train_loss = 0
    for step, (batch_x, batch_y) in enumerate(loader):
        
        pred = net(batch_x)
        loss = loss_func(pred, batch_y)
        
        total_train_loss += loss.item()
        
        opt.zero_grad()
        loss.backward()
        opt.step()
    
    print('epoch:', epoch, 'total_train_loss:', total_train_loss)

快速搭建模型与添加模型结构

快速搭建模型

pytorch除了像上面那样中规中矩的定义模型之外，还可以快速的定义模型结构，用到了torch.nn.Sequential

net = torch.nn.Sequential(OrderedDict([
    ('linear0', torch.nn.Linear(2,10)),
    ('relu0', torch.nn.ReLU()),      # 注意这里的ReLU的大写成分
    ('linear1', torch.nn.Linear(10,2))
]))

添加模型结构

如果模型比较庞大，我们可以通过循环定义，这需要添加模型结构

net.add_module('linear_last', torch.nn.Linear(2, 2))

循环定义

ACTIVATION = torch.tanh

class Net(nn.Module):
    def __init__(self, batch_normalization=False):
        super(Net, self).__init__()
        self.do_bn = batch_normalization
        self.fcs = []
        self.bns = []
        self.input_bn = nn.BatchNorm1d(1, momentum=0.5)
        for i in range(N_HIDDEN):
            input_size = 1 if i == 0 else 10
            fc = nn.Linear(input_size, 10)
#             setattr(self, 'fc%i' % i, fc)
            self.add_module('fc%i' % i, fc)
            self.fcs.append(fc)
            if self.do_bn:
                bn = nn.BatchNorm1d(10, momentum=0.5)
#                 setattr(self, 'bn%i' % i, bn)
                self.add_module('bn%i' % i, bn)
                self.bns.append(bn)
        self.predict = nn.Linear(10,1)
        self._set_init(self.predict)
        
    def _set_init(self, layer):
        init.normal_(layer.weight, mean=0., std=.1)
        init.constant_(layer.bias, B_INIT)
        
    def forward(self, x):
        pre_activation = [x]
        if self.do_bn: x = self.input_bn(x) 
        input_layer = [x]
        for i in range(N_HIDDEN):
            x = self.fcs[i](x)
            pre_activation.append(x)
            if self.do_bn:
                x = self.bns[i](x)
            x = ACTIVATION(x)
            input_layer.append(x)
        out = self.predict(x)
        return out, pre_activation, input_layer
        
net = Net(True)
print(net)

# 输出：
Net(
#   (input_bn): BatchNorm1d(1, eps=1e-05, momentum=0.5, affine=True, track_running_stats=True)
#   (fc0): Linear(in_features=1, out_features=10, bias=True)
#   (bn0): BatchNorm1d(10, eps=1e-05, momentum=0.5, affine=True, track_running_stats=True)
#   (fc1): Linear(in_features=10, out_features=10, bias=True)
#   (bn1): BatchNorm1d(10, eps=1e-05, momentum=0.5, affine=True, track_running_stats=True)
#   (fc2): Linear(in_features=10, out_features=10, bias=True)
#   (bn2): BatchNorm1d(10, eps=1e-05, momentum=0.5, affine=True, track_running_stats=True)
#   (fc3): Linear(in_features=10, out_features=10, bias=True)
#   (bn3): BatchNorm1d(10, eps=1e-05, momentum=0.5, affine=True, track_running_stats=True)
#   (fc4): Linear(in_features=10, out_features=10, bias=True)
#   (bn4): BatchNorm1d(10, eps=1e-05, momentum=0.5, affine=True, track_running_stats=True)
#   (fc5): Linear(in_features=10, out_features=10, bias=True)
#   (bn5): BatchNorm1d(10, eps=1e-05, momentum=0.5, affine=True, track_running_stats=True)
#   (fc6): Linear(in_features=10, out_features=10, bias=True)
#   (bn6): BatchNorm1d(10, eps=1e-05, momentum=0.5, affine=True, track_running_stats=True)
#   (fc7): Linear(in_features=10, out_features=10, bias=True)
#   (bn7): BatchNorm1d(10, eps=1e-05, momentum=0.5, affine=True, track_running_stats=True)
#   (predict): Linear(in_features=10, out_features=1, bias=True)
# )

输出模型结构或者中间层权重

输出模型结构

在PyTorch中，所有的neural network module都是class torch.nn.Module的子类，在Modules中可以包含其它的Modules，以一种树状结构进行嵌套。当需要返回神经网络中的各个模块时，Module.modules()方法返回网络中所有模块的一个iterator，而Module.children()方法返回所有直接子模块的一个iterator。

import torchvision.models as models
resnet18 = models.resnet18()

# 法一：直接print
print(resnet18)

# 法二：利用model.modules迭代器，返回一个包含 当前模型所有模块的迭代器，输出的比children()多很多
for i in resnet18.modules():
    print(i)

# 法三：利用model.children()迭代器
for i in resnet18.children():
    print(i)

输出参数取值

参数包括权重，偏置等

import torchvision.models as models
resnet18 = models.resnet18()

# 法一：
print(resnet18.state_dict())

# 法二：
for param in resnet18.parameters():
    print(param)
    
# 法三
for name,parameters in resnet18.named_parameters():
    print(name,':',parameters.size())

验证操作与模型的评估模式

验证操作

早期版本可以设置volatile=True相当于requires_grad=False，适用于推断阶段，不需要反向传播。这个现在已经取消了，可以使用with torch.no_grad()来替代，在跑验证集数据或测试集数据时用的多。

x = torch.zeros(1, requires_grad=True)
with torch.no_grad(): # 将y 从计算图中排除
    y = x * 2
print(y.requires_grad)
# 输出：False

使用with.no_grad()可以减少内存消耗，同时增加训练速度。

评估模式

如果模型中有dropout操作和batch normalization操作，在每次迭代训练后，要进行验证前，要把模型切入评估模式。模型有两种模式，model.train()是训练模式，用于训练集，model.eval()是评估模式，用于验证集和测试集，表示我们用验证集或测试集进行评估时，不改变dropout和batch normalization的参数。

注意model.eval()并不会阻止模型进行反向梯度更新，在pytorch的官方讨论中，有人曾提出这个问题

So why is torch.no_grad() is not enabled by default inside model.eval() function? Is there a situation where we want to compute some gradients when in evaluation mode? Even if that’s the case, it seems like no_grad() method should be made an optional argument to eval(), and set to True by default.

意思是问什么torch.no_grad()不嵌在model.eval()中，即进入评估模式，自动设置成不求梯度，而不用像现在这样单独分成两个操作，在实际使用中，我们基本不会碰到在评估模式求梯度的场景，即使有，也可以把torch.no_grad()当做model.eval()的一个参数。

回答如下：

Some user can have a use case for this. The problem with doing this I guess is that no_grad is a context manager to work with the autograd engine while eval() is changing the state of an nn.Module.

就是说有些人真会碰到这种使用场景，为何分开torch.no_grad()与model.eval()，可能是因为这两种操作的性质确实不同，一个设置不求梯度，一个设置进入评估模式。

目前并不知道模型通过torch.load()读取后会进入哪个模式，但是如果保存模型时是评估模式，读取模式时应该也是评估模式。

torchvision

https://blog.csdn.net/qq_34097715/article/details/83345189

参考文献：
莫烦python
pytorch加载模型和初始化权重：https://msd.misuland.com/pd/2884250137616453910
PyTorch简明笔记[2]-Tensor的自动求导(AoutoGrad)：https://www.jianshu.com/p/a105858567df

PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
如何使用Python实现交通工具识别
如何使用Python实现交通工具识别文章目录技术架构功能流程识别逻辑用户界面增强特性依赖项主要类别内容展示该系统是一个基于深度学习的交通工具识别工具，具备以下核心功能与特点：技术架构使用预训练的ResNet50卷积神经网络模型（来自ImageNet数据集）集成图像增强预处理技术（随机裁剪、旋转、翻转等）采用多数投票机制提升预测稳定性基于置信度评分的结果筛选策略功能流程用户通过GUI界面选择待识别图
Python OpenCV教程从入门到精通的全面指南【文末送书】一键难忘 python opencv 开发语言
文章目录PythonOpenCV从入门到精通1.安装OpenCV2.基本操作2.1读取和显示图像2.2图像基本操作3.图像处理3.1图像转换3.2图像阈值处理3.3图像平滑4.边缘检测和轮廓4.1Canny边缘检测4.2轮廓检测5.高级操作5.1特征检测5.2目标跟踪5.3深度学习与OpenCVPythonOpenCV从入门到精通【文末送书】PythonOpenCV从入门到精通OpenCV(Ope
第八周 tensorflow实现猫狗识别降花绘 365天深度学习 tensorflow系列 tensorflow 深度学习人工智能
本文为365天深度学习训练营内部限免文章（版权归K同学啊所有）**参考文章地址：[TensorFlow入门实战｜365天深度学习训练营-第8周：猫狗识别（训练营内部成员可读）]**作者：K同学啊文章目录一、本周学习内容:1、自己搭建VGG16网络2、了解model.train_on_batch（）3、了解tqdm，并使用tqdm实现可视化进度条二、前言三、电脑环境四、前期准备1、导入相关依赖项2、
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路一、医疗领域：AI驱动的精准诊疗与效率提升1.医学影像诊断AI算法通过深度学习技术，已实现对X光、CT、MRI等影像的快速分析，辅助医生检测癌症、骨折等疾病。例如，GoogleDeepMind的AI系统在乳腺癌筛查中，误检率比人类专家低9.4%；中国的推想医疗AI系统可在20秒内完成肺部CT扫描分析，为急诊救治争取黄金时间。2.药物研发传统药
专题：2025云计算与AI技术研究趋势报告|附200+份报告PDF、原数据表汇总下载
原文链接：https://tecdat.cn/?p=42935关键词：2025,云计算，AI技术，市场趋势，深度学习，公有云，研究报告云计算和AI技术正以肉眼可见的速度重塑商业世界。过去十年，全球云服务收入激增8倍，中国云计算市场规模突破6000亿元，而深度学习算法的应用量更是暴涨400倍。这些数字背后，是企业从“自建机房”到“云原生开发”的转型，是AI从“实验室”走向“产业级应用”的跨越。本报告
【深度学习解惑】在实践中如何发现和修正RNN训练过程中的数值不稳定？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 人工智能 tensorflow pytorch 神经网络机器学习
在实践中发现和修正RNN训练过程中的数值不稳定目录引言与背景介绍原理解释代码说明与实现应用场景与案例分析实验设计与结果分析性能分析与技术对比常见问题与解决方案创新性与差异性说明局限性与挑战未来建议和进一步研究扩展阅读与资源推荐图示与交互性内容语言风格与通俗化表达互动交流1.引言与背景介绍循环神经网络(RNN)在处理序列数据时表现出色，但训练过程中常面临梯度消失和梯度爆炸问题，导致数值不稳定。当网络
【深度学习实战】当前三个最佳图像分类模型的代码详解云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习人工智能分类模型机器学习 Transformer EfficientNet ConvNeXt
下面给出三个在当前图像分类任务中精度表现突出的模型示例，分别基于SwinTransformer、EfficientNet与ConvNeXt。每个模型均包含：训练代码（使用PyTorch）从预训练权重开始微调（也可注释掉预训练选项，从头训练）数据集目录结构：└──dataset_root├──buy#第一类图像└──nobuy#第二类图像随机拆分：80%训练，20%验证每个Epoch输出一次loss
第35周—————糖尿病预测模型优化探索
目录目录前言1.检查GPU2.查看数据编辑3.划分数据集4.创建模型与编译训练5.编译及训练模型6.结果可视化7.总结前言本文为365天深度学习训练营中的学习记录博客原作者：K同学啊1.检查GPUimporttorch.nnasnnimporttorch.nn.functionalasFimporttorchvision,torch#设置硬件设备，如果有GPU则使用，没有则使用cpudevice=
深度学习预备知识 AmazingMQ 深度学习人工智能
1.Tensor张量定义：张量（tensor）表示一个由数值组成的数组，这个数组可能有多个维度（轴）。具有一个轴的张量对应数学上的向量，具有两个轴的张量对应数学上的矩阵，具有两个以上轴的张量目前没有特定的数学名称。importtorch#arange创建一个行向量x，这个行向量包含以0开始的前12个整数。x=torch.arange(12)print("x=",x)#x=tensor([0,1,2
根茎式装配体（RA）作为下一代协同智能范式的理论、架构与应用由数入道人工智能思维框架软件工程智能体
一、引言——范式危机与新大陆的召唤1.1表征主义的黄昏：当前AI协同范式的认知天花板自艾伦·图灵在《计算机器与智能》中播下思想的种子以来，人工智能的漫长征途始终被一个强大而内隐的哲学范式所笼罩——我们称之为“表征主义”（Representationism）。这一范式，无论其外在形态如何演变，从早期的符号逻辑、专家系统，到如今风靡全球的深度学习神经网络，其核心信念从未动摇：智能的核心，在于构建一个关
Manus AI与多语言手写识别
ManusAI与多语言手写识别背景与概述手写识别技术的发展现状与挑战ManusAI的核心技术与应用场景多语言手写识别的市场需求与难点ManusAI的技术架构深度学习在手写识别中的应用多语言支持的模型设计数据预处理与特征提取方法多语言手写识别的关键挑战不同语言字符的多样性处理上下文语义与书写风格适应性低资源语言的训练数据获取解决方案与优化策略迁移学习在多语言任务中的应用端到端模型的优化与轻量化用户反
基于LIDC-IDRI肺结节肺癌数据集的人工智能深度学习分类良性和恶性肺癌（Python 全代码）全流程解析（二）
基于LIDC-IDRI肺结节肺癌数据集的人工智能深度学习分类良性和恶性肺癌（Python全代码）全流程解析（二）1环境配置和数据集预处理1.1环境配置1.1数据集预处理2深度学习模型训练和评估2.1深度学习模型训练2.1深度学习模型评估笑话一则开心一下喽完整代码如下：模型文件如下深度学习模型讲解---待续第一部分内容的传送门第三部分传送门1环境配置和数据集预处理1.1环境配置环境配置建议使用ana
深度学习交互式图像分割技术演进与突破 wang1776866571 深度学习交互式分割深度学习人工智能交互式分割
说明本文为作者读研期间基于交互式图像分割领域公开文献的系统梳理与个人理解总结，所有内容均为原创撰写（ai辅助创作），未直接复制或抄袭他人成果。文中涉及的算法、模型及实验结论均参考自领域内公开发表的学术论文（具体文献见文末参考文献列表）。本文旨在为交互式图像分割领域的学习者提供一份结构化的综述参考，内容涵盖技术演进、核心方法、关键技术优化及应用前景，希望能为相关研究提供启发。摘要：本文系统综述了基于
前沿交叉：Fluent与深度学习驱动的流体力学计算体系 m0_75133639 流体力学深度学习人工智能航空航天 fluent 流体力学材料科学 CFD
基础模块流体力学方程求解1、不可压缩N-S方程数值解法（有限差分/有限元/伪谱法）·Fluent工业级应用：稳态/瞬态流、两相流仿真（圆柱绕流、入水问题）·Tecplot流场可视化与数据导出2、CFD数据的AI预处理·基于PCA/SVD的流场数据降维·特征值分解与时空特征提取深度学习核心3.物理机理嵌入的神经网络架构·物理信息神经网络（PINN）：将N-S方程嵌入损失函数（JAX框架实现）·神经常
如何使用目标检测深度学习框架yolov8训练钢管管道表面缺陷VOC+YOLO格式1159张3类别的检测数据集步骤和流程 FL1623863129 深度学习目标检测深度学习 YOLO
【数据集介绍】数据集中有很多增强图片，大约300张为原图剩余为增强图片数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1159标注数量(xml文件个数)：1159标注数量(txt文件个数)：1159标注类别数：3所在仓库：firc-dataset标注类别名称(注意yo
2025年人工智能、虚拟现实与交互设计国际学术会议学术小八学术人工智能 vr 交互
重要信息官网：www.aivrid.com时间：2025年10月17-19日地点：中国-东莞部分介绍征稿主题包括但不限于：生物特征模式识别机器视觉专家系统深度学习智能搜索自动编程智能控制智能机器人系统组件虚拟现实平台用于VR/AR的AI平台数据和生成、操作、分析和验证浸入式环境和虚拟世界的生成优化和现实的渲染人工智能与用户体验个性化推荐系统情感计算与用户响应虚拟现实与沉浸式技术沉浸式环境设计交互设
机器学习深度学习驱动在光子学设计中的应用与未来【专题培训会议邀您共探科技前沿】软研科技信息与通信信号处理量子计算人工智能
一、背景介绍在智能科技飞速发展的今天，光子学设计与智能算法的结合正成为科研创新的热点。深度学习、机器学习等算法在光子器件的逆向设计、超构表面材料设计、光学神经网络构建等方面展现出巨大潜力。二、会议亮点由北京软研国际信息技术研究院主办的“智能算法驱动的光子学设计与应用”专题培训会议，将深入探讨以下核心内容：光子器件的逆向设计：利用深度学习优化多参数光子器件设计。超构表面与超材料设计：智能算法在新型光
【第三章:神经网络原理详解与Pytorch入门】02.深度学习框架PyTorch入门-(4)Pytorch实战 IT古董人工智能课程深度学习神经网络 pytorch
第三章:神经网络原理详解与Pytorch入门第二部分：深度学习框架PyTorch入门第四节：Pytorch模型构建内容：如何搭建复杂网络以及如何修改模型与保存一、构建复杂神经网络结构在PyTorch中，构建复杂模型通常通过继承nn.Module类，分模块组织层与前向传播逻辑。示例：自定义一个卷积神经网络（CNN）importtorch.nnasnnimporttorch.nn.functional
探秘AI大模型：一键获取深度学习精华-PPT全面解读曹筱习Dwayne
探秘AI大模型：一键获取深度学习精华-PPT全面解读【下载地址】AI大模型PPT资源下载本仓库提供了一个名为“ai大模型ppt”的资源文件下载。该资源文件详细介绍了AI大模型的相关内容，包括但不限于AI大模型的定义、应用场景、技术架构、发展趋势等。通过这份PPT，您可以深入了解AI大模型的核心概念和实际应用，为您的学习和研究提供有力支持项目地址:https://gitcode.com/open-s
人工智能基础知识PPT课件智慧化智能化数字化方案方案解读馆人工智能入门人工智能学习人工智能课件人工智能PPT
人工智能基础知识定义与概念：人工智能是研究、开发用于模拟、延伸和扩展人类智能行为的综合性科学，其目的是让计算机系统具备执行人类智能任务的能力。涉及计算机科学、数学等多学科，研究对象是让系统具备智能，智能包括认知、适应和自主能力等维度。学派与方法学派：有符号主义、联结主义、行为主义等学派，分别从不同角度研究人工智能。方法：包括基于知识、学习和仿生的方法，如专家系统、机器学习、深度学习等。分类与发展分
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite