ZeroRains

pytorch入门——个人总结

PyTorch入门

PyTorch入门
一、Pytorch的tensor类型
二、pytorch的生成tensor数组
三、pytorch的运算
四、pytorch.autofrad()中的Variable对象
五、pytorch自定义模型
六、pytorch损失函数定义(lost function)
七、pytorch.optim参数自动优化
八、 torchvision中的datasets和trainsforms
九、pytorch装载数据集(data_train为例)
十、模型导入与修改
十一、OS文件操作
十二、从外部导入数据
模型保存与引入

PyTorch入门

前言:

会用到的工具包pytorch(导入方式为import torch,import torchvision)、numpy、matplotlib.pyplot,os，PIL

参考资料：《深度学习之pytorch实战计算机视觉》

一、Pytorch的tensor类型

正如numpy的nadrry与pandas的dataframe一样，pytorch也有自己的类型叫做tensor，我们认识一样tensor类型如何转化

torch.FloatTensor():
- 这个与np.array()类似，当你在括号中输入一个列表他就能帮你转化成浮点型的Tensor类型
torch.IntTensor():
- 在括号中输入一个列表，使得他将这个列表转化成一个整形的Tensor类型

二、pytorch的生成tensor数组

这个也跟numpy中的np.random类似,下面来演示几个常用的

torch.rand()
- 在括号中输入维度，无需元组括起来，就可以随机生成0-1之间的指定维度的随机浮点数tensor数组
torch.randn()
- 在括号中输入维度，无需元组括起来，就可以随机生成均值为的指定维度的随机浮点数tensor数组
torch.range()
- 在指定的范围内生成等差数列，第一个参数，起始点，第二个参数，终点，第三个参数步长
torch.zeros()
- 类似于np.zeros()，在输入维度后，无需元组括起来，就会生成每个元素的值都为0的指定维度的tensor数组

三、pytorch的运算

加减乘除，数乘，点乘等方法

加法:torch.add(),参数可输入两个tensor，也可输入一个tensor一个常量
绝对值：torch.abs()
裁剪：torch.clamp()三个参数：第一个数据集，第二个下界，第三个上界
除法:torch.div() 参数可输入两个tensor，也可输入一个tensor一个常量
点乘：torch.mul()两个tensor,对应位置相乘，一个常量乘tensor每一个元素的位置
求幂运算：torch.pow()可两个tensor，也可一个tensor一个常量
阵乘法：torch.mm()注意维度
矩阵乘法（矩阵和向量）:torch.mv()注意维度

四、pytorch.autofrad()中的Variable对象

Variable(数据集，requires_grad = False)

requires_grad：为False时，自动梯度计算的过程中不会保留梯度值，Ture时则会保留梯度值
获取Variable对象a的值:a.data,当对象只有一个数据时使用a.item()
查看其梯度:a.grad.data
将梯度重置：a.grad.data.zero_()

五、pytorch自定义模型

需要引入torch.nn.Module类来完成

首先定义一个类，让他继承torch.nn.Module这个类
假设我们的这个类叫做Model(class Model(torch.nn.Moduele):)
然后我们定义它的初始化方法__init__:用super函数来引入父类的初始化方法。（super(Model,self).__init__()）
然后用self.名称 = torch.nn.Sequential(模型内容)来定义模型
torch.nn.Sequential表示的是一个容器，比如卷积中的卷积层，池化层，激活层都可以放置在里面，我们还可以设置另一个新的torch.nn.Sequential来存放全连接层
- 在这个容器中我们可以存放很多模型
- torch.nn.Linear():线性激活，接收参数有三个：输入的特征数，输出的特征数，是否使用偏置（b）
- torch.nn.ReLU():ReLU激活函数
- torch.nn.Conv2d():卷积层：接收参数第一第二分别是输入的通道数，输出的通道数，kernel_size:卷积核（过滤器）大小，stride:步长，padding：填充值
- torch.nn.MaxPool2d():最大池化层，kernel_size:池化窗口大小，stride:步长，padding：填充值
- torch.nn.Dropout():随机失活，p每个节点随机丢失的概率，在卷积神经网络中一般用在全连接层的部分中
- torch.nn.RNN():input_size:输入数据特征数，hidden_size:隐藏层的输出特征数，num_layers:循环层对叠数，默认1，bias:是否使用偏置默认True,batch_first:布尔值，False(序列长度，批次数量，输入或输出特征) True:(批次数量,序列长度,输入或输出特征)
- torch.nn.Upsample(scale_factor=2,mode="nearest")
  - 重采样，用于解压池化层的压缩，
  - scale_factor：解压的倍数
  - mode:默认nearest(最邻近法)，还有linear(线性插值法),bilinear（双线性插值法）,trilinear（三线性插值法）
model.parameters()获得模型中的各个参数

如果想要吧模型放入GPU里面计算，在定义好model后加个.cuda(),再对Variable对象后面加个.cuda()

六、pytorch损失函数定义(lost function)

torch.nn.MSELoss():均方误差函数计算损失值，prew_y,y
torch.nn.L1Loss():平均绝对误差
torch.nn.CrossEntropyLoss():交叉熵
关于小批量计算损失值的说明：
- 记住最后输出的损失值，应该是使用：$ loss = \frac {每个批量的损失值之和 * 每个批量的样本数}{总样本数}$

七、pytorch.optim参数自动优化

主要类型有:SGD,AdaGrad,RMSProp,Adam

使用流程：

在开始训练时，定义优化算法(Adam自动调整learning_rate,但是可以设定lr，其他优化方法也可以)，将需要优化的参数作为

# 定义优化参数方法
optimzer = torch.optim.Adam(model.parameter())
# 定义损失函数方法
loss_f = torch.nn.CrossEntropyLoss()
# 在更新参数前使用，将梯度清零
optimzer.zero_grad()
# 计算损失值
loss = loss_f(prev_y,y)
# 计算梯度
loss.backward()
# 更新参数
optimizer.step()

八、 torchvision中的datasets和trainsforms

torchvision是专门用来解决CV（Computer Vision）问题的一个工具包

一般我们使用
from torchvision import trainsforms,datasets来导入

transforms用于对导入的数据集进行转化
常用方法：
- trainsforms.Compose（）转化容器，参数是用列表括起来的转化方式
- transforms.Resize()：按照我们的需求对图片进行缩放，一般输入一个（h,w）的参数，h高度，w宽度
- transforms.Scale()：和Resize一样
- transforms.CenterCrop():以图片中心为原点按照输入参数的进行裁剪,输入元组宽高
- transforms.RandomCrop():对图片，按照输入参数的尺寸进行随机裁剪
- transforms.RandomVerticalFlip(),对载入图片按照随机概率进行垂直翻转，输入的参数随机概率，默认值为0.5
- （常用）transforms.ToTensor(),对载入的图片数据进行类型转换，将之前的构造PIL图片转换成Tensor数据类型
- （常用）ransforms.Normalize(mean=[0.5],std=[0.5]),对数据进行标准化，参数可以修改
- transforms.ToPILImage()用于将tensor变量的数据转化成PIL图片
一般使用transform = transforms.Compose([转化内容])来定义转化方式
获取框架自带的数据集：

data_train = datasets.数据名(root="目录"，trannsform=转化方式，train=True(是否为训练集)，download=True(从网上下载))
data_test = datasets.数据名(root="目录"，transform=转化方式，train=Flase)

九、pytorch装载数据集(data_train为例)

需要的工具：torch.utils.data.DataLoader（）

参数: datasets是数据集，batch_size是批量的大小，shuffle是是否进行随机打乱

data_loader_train = torch.utils.data.DataLoader(dataset=data_train,batch_size=64,shuffle=True)

数据装载有两种用途，一种用于展示，一种用于训练预测：

用于展示：
- 我们生成的是一个可迭代对象，我们需要使用
- images,labels = next(iter(data_loader_train))将其提取出来
- 然后将其网格化（使每张图片都存放在自己的网格中）
- img = torchvision.utils.make_grid(images)
- 由于我们用plt输出的时候要求图像的维度是（样本数，高度，宽度，通道），但是我们的tensor中是（样本数，通道，高度，宽度）
- 所以我们要使用img = img.numpy().transpose(1,2,0)来实现转换plt输出格式，对用GPU训练后的数据，需要在numpy前面加上.cpu()
- 然后就可以plt.imshow(img)了，如果没有出现图片就加一个plt.show()
用于训练、预测
- 首先要了解enumerate()函数，他用于返回可迭代对象中的索引和数据，第一个参数输入可迭代对象，第二个参数输入索引起始位置
- 使用for循环：for batch,data in enumerate(dataloader,1):遍历这个可迭代对象
- 我们的data由数据集合标签集组成，我们分别用X，y存放X,y=data
- 将X和y转化成Variable对象，看情况是否加.cuda
- 进行预测:y_pred = model(X)
- 预测结束后他不会直接告诉我们标签，而是是某个标签的可能性
- 我们要使用_,pred = torch.max(y_pred.data,1)来提取
  - 这个方法可以找到我们指定维度的最大值，然后返回他的值和索引，由于他的索引就是他的标签，因此我们只取索引。
  - 他有两个参数,第一个是预测后的数据(input)，第二个是指定的维度(dim)

十、模型导入与修改

在计算机视觉领域中，要训练一个好的模型是很耗费时间和精力的，于是我们产生了迁移学习，在别人训练过的模型基础上我们进行再训练，从而使得这个模型倾向于解决我们的问题。

要引用别人的模型，我们需要使用到torchvision中的models

引入别人模型model = models.vgg16(pretrained=True)
- pretrained = True,引入别人已经训练好的参数，需要下载
我们要使用别人的模型，但是最后我们输出的特征一般和别人的模型不同，于是我们就要对其进行一定的修改
在引入模型之后我们要对未修改的部分进行冻结，使得在训练的过程中只更新我们修改部分的参数而不修改原有的参数

for parma in model.parameters():
  parme.requires_grad = False

然后修改他们输出的那部分，我们可以用print(model)查看他们输出部分的模型叫什么名字
使用model.名字 = torch.nn.Sequential()进行修改
如果我们使用的是卷积模型，就是对全连接层进行修改

     model.fc = torch.nn.Sequential(
    修改内容（其他的可以不改变，但是在最后输出的一句Linear中我们需要把输出维度改成我们希望的）
 )

由于其他部分不需要训练参数，但是修改部分需要，于是我们定义optimizer来实现训练修改部分的参数

optimizer = torch.optim.Adam(model.fc.parameters())

十一、OS文件操作

需要的python包os

os.path.dirname()用于返回目录的目录名
os.path.exists()用于测试输入参数指定的文件是否存在
os.path.isdir()用于测试输入参数是否是目录名
os.path.isfile()用于测试输入参数是否为一个文件
os.path.samefile()用于测试两个输入的路径参数是否指向同一个文件
os.path.split()用于对输入参数中的目录名进行分割，返回一个元组，元组由目录名和文件名组成
os.path.join()将输入参数中的两个名字拼接成一个完整的文件路径

十二、从外部导入数据

分为两种，提取单个数据和提取数据集，需要PIL中的Image

提取单个数据：
- 定义转换方式transform
- 导入图片img = Image.open("路径")
- 对图片进行转换img =tranform(img)
- 因为我们的图片可能不只一张，于是我们需要提高他的维度
- img = img.unsqueeze(0) 在0维度前增加一个维度，0的数值可以修改
- 这样提取一张的步骤就完成了
提取数据集
- 定义数据集路径（到数据集所在文件夹即可，这里的文件夹中还有子文件夹，子文件夹中的子文件夹分别表示他们的标签）
- 定义转化方式transform,以字典的形式
- 然后无脑执行以下操作(在我的文件夹中包含train和valid的两个子文件夹，这两个子文件夹中还有两个不同的标签的文件夹)

# 转换类型
data_transform = {x:transforms.Compose([transforms.Resize([224,224]),transforms.ToTensor(),transforms.Normalize(mean=[0.5],std=[0.5])]) for x in ["train","valid"]}
# 打开文件并转换
image_datasets = {x:datasets.ImageFolder(root = os.path.join(data_dir,x),transform=data_transform[x]) for x in ["train","valid"]}
# 装载数据
dataloader = {x:torch.utils.data.DataLoader(dataset = image_datasets[x],batch_size=16,shuffle=True) for x in ["train","valid"]}

模型保存与引入

保存整个模型：torch.save(model,Path)
保存模型参数：torch.save(net.state_dict(),Path)

加载整个模型:model = torch.load(Path)
加载参数：model = model.load_state_dict(torch.load(Path))

Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set 开心星人论文阅读论文阅读
将神经网络表征为加权的无环图，直接根据模型的权重矩阵构造PD。计算相邻batch的权重矩阵PD之间的距离。比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。通常，这种误差度量或任务相关的指标是通过一个验证集（holdoutset）来计算的。因为这些数据没有直接用于更新模型参数，通常假设模型在验证集上的
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
深度学习 | pytorch + torchvision + python 版本对应及环境安装 zfgfdgbhs 深度学习 python pytorch
目录一、版本对应二、安装命令（pip）1.版本（1）v2.5.1~v2.0.0（2）v1.13.1~v1.11.0（3）v1.10.1~v1.7.02.安装全过程（1）选择版本（2）安装结果参考文章一、版本对应下表来自pytorch的github官方文档：pytorch/vision:Datasets,TransformsandModelsspecifictoComputerVisionpytor
卷积神经网络 - 理解卷积核的尺寸 k×k×Cin 谦亨有终 AI学习笔记 cnn 人工智能神经网络深度学习机器学习
卷积神经网络中，每个卷积核的尺寸为k×k×Cin，这一设计的核心原因在于多通道输入的数据结构和跨通道特征整合的需求。以下是详细解释：1.输入数据的结构输入形状：假设输入数据为三维张量，形状为H×W×Cin，其中：H：高度（Height）W：宽度（Width）Cin：通道数（Channelsin）多通道的物理意义：对于RGB图像，Cin=3（红、绿、蓝三通道）。对于中间层的特征图，Cin可能为64、
PyTorch核心基础知识点 niuTaylor 编程区 pytorch 人工智能 python
PyTorch核心基础知识点，结合最新特性与工业级实践，按优先级和逻辑关系分层解析：▍核心基石：张量编程（TensorProgramming）1.张量创建（8种生产级初始化）#设备自动选择（2024最佳实践）device="cuda"iftorch.cuda.is_available()else"mps"iftorch.backends.mps.is_available()else"cpu"#关键
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
Linux部署模型报错OSError: Error no file named pytorch_model.bin, tf_model.h5, model.ckpt.index or flax_mod dkgee linux pytorch 运维
报错内容：OSError:Errornofilenamedpytorch_model.bin,tf_model.h5,model.ckpt.indexorflax_model.msgpackfoundindirectory主要原因是transformer版本不对，需要升级pipinstall--upgradehuggingface_hubpipinstalltransformers[torch]其
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
模型优化驱动产业应用创新智能计算研究中心其他
内容概要当前模型优化技术的迭代正沿着多维路径快速演进，其核心驱动力在于突破算法性能与产业需求间的适配瓶颈。以自适应学习机制与迁移学习框架为基础的优化策略，显著提升了模型在跨场景应用中的泛化能力，而超参数自动调优技术则通过PyTorch、TensorFlow等主流框架的接口标准化，降低了复杂模型的开发门槛。在部署层面，边缘计算与联邦学习的协同应用不仅缩短了金融预测、医疗影像分析等场景的响应延迟，更通
【第1章＞第6节】CMAC小脑模型神经网络的理论学习与MATLAB仿真 fpga和matlab #第1章·神经网络学习 matlab CMAC 小脑模型神经网络人工智能
目录1.使用软件和版本2.CMAC小脑模型神经网络概述2.1CMAC网络结构2.2CMAC地址映射2.3学习过程3.CMAC网络的MATLAB编程实现4.分辨率，重叠度，学习率对CMAC网络的训练性能影响分析4.1分辨率4.2重叠度4.3学习率5.视频操作步骤演示欢迎订阅FPGA/MATLAB/Simulink系列教程《★教程1:matlab入门100例》《★教程2:fpga入门100例》《★教程
基于roop/insightface将视频中包含指定人脸的视频片段提取并合并成新视频阆遤 python roop pytorch insightface
利用insightface.app.FaceAnalysis提最一个视频中包含指定人脸的视频片段，并将其合并成一个新视频，使用“buffalo_l”模型，模型需安装在代码当前目录下的.\models中。需要roop或其他支持pytorch、insightface、moviepy的环境。pytorch安装请见我其他文章。#cython:language_level=3str#-*-coding:ut
关于pytorch3d的安装诚威_lol_中大努力中人工智能 pytorch 人工智能 python
更新1：2025_2_04今天发现，原来的pytorch3d不见了，在我的aaa1环境中。重新安装，我发现最好用的还是去github下载最新的pytorch3d的zip，unzip之后，进去pipinstall-e.然后安装成功！1、参考文章1：windows安装PyTorch3D详细指南-哔哩哔哩(bilibili.com)这篇文章巨好2、参考文章2：pytorch3d/INSTALL.mdat
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
深度学习 Deep Learning 第8章深度学习优化 odoo中国 AI编程人工智能深度学习人工智能优化
深度学习第8章深度学习的优化章节概述本章深入探讨了深度学习中的优化技术，旨在解决模型训练过程中面临的各种挑战。优化是深度学习的核心环节，直接关系到模型的训练效率和最终性能。本章首先介绍了优化在深度学习中的特殊性，然后详细讨论了多种优化算法，包括随机梯度下降（SGD）、动量法、Nesterov动量法、AdaGrad、RMSProp和Adam等。此外，还探讨了参数初始化策略、自适应学习率方法以及二阶优
【零基础入门】一篇弄懂nn.Sequential以及ModuleList的使用（呕心沥血版）十二月的猫 PyTorch深度学习 pytorch 零基础入门
个人主页：十二月的猫-CSDN博客系列专栏：《PyTorch科研加速指南：即插即用式模块开发》CSDN博客十二月的寒冬阻挡不了春天的脚步，十二点的黑夜遮蔽不住黎明的曙光目录1.前言2.Sequential类的使用2.1序列容器简单注入2.2序列容器字典注入2.3序列容器函数注入2.4序列容器修改2.5序列容器删除3.nn.ModuleList()的使用3.1定义模型3.2使用模型4.总结1.前言《
景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
深度学习篇---对角矩阵&矩阵的秩&奇异矩阵 Ronin-Lotus 程序代码篇深度学习篇深度学习矩阵人工智能线性代数
文章目录前言一、对角矩阵（DiagonalMatrix）1.1定义1.2特性行列式运算简化1.3应用领域深度学习信号处理量子力学经济学二、矩阵的秩（RankofaMatrix）2.1定义2.2特性满秩降秩影响2.3应用领域深度学习图像压缩推荐系统控制理论三、奇异矩阵（SingularMatrix）3.1定义3.2特性秩不足行列式为零3.3应用领域深度学习正则化损失函数结构工程统计学数值计算四、跨领
DeepSeek、Grok 与 ChatGPT 三巨头：技术架构与应用场景的全方位解析云策量化 Deepseek chatgpt deepseek grok
前言在当今人工智能领域，DeepSeek、Grok和ChatGPT作为语言模型的三巨头，各自凭借独特的技术架构和广泛的应用场景，在自然语言处理领域占据着重要地位。本文将对这三款模型的技术架构和应用场景进行全方位解析，以期为读者提供深入的了解和有价值的参考。一、技术架构（一）DeepSeekDeepSeek是由DeepSeek团队开发的一款大型语言模型，其技术架构基于深度学习中的Transforme
OpenCV 4.2.0与扩展模块安装与应用指南土城三富
本文还有配套的精品资源，点击获取简介：OpenCV4.2.0是一个先进的计算机视觉库，包含了图像处理、计算机视觉和机器学习算法。本压缩包包含OpenCV核心库和扩展模块（opencv_contrib），版本均为4.2.0。该版本引入了性能增强、API优化以及对深度学习框架和硬件加速技术的更新支持。扩展模块提供了额外的实验性算法和功能，有助于研究和开发新算法。指南详细介绍了如何安装和配置这些库，并提
OpenCV ML 模块使用指南 ice_junjun OpenCV opencv 人工智能计算机视觉
一、模块概述OpenCV的ML模块提供了丰富的机器学习算法，可用于解决各种计算机视觉和数据分析问题。本指南将详细介绍该模块中主要的机器学习算法，包括支持向量机（SVM）、K均值聚类（K-Means）和神经网络（ANN），并结合图像分类和聚类分析这两个典型应用场景进行代码实现与解释。二、主要函数及类详解（一）支持向量机（SVM）：cv.ml.SVM_create()功能支持向量机（SVM）是一种强大
强化学习中策略网络模型设计与优化技巧数字扫地僧计算机视觉深度学习
I.引言强化学习（ReinforcementLearning,RL）是一种通过与环境交互，学习如何采取行动以最大化累积奖励的机器学习方法。策略网络（PolicyNetwork）是强化学习中一种重要的模型，它直接输出动作的概率分布或具体的动作。本篇博客将深入探讨策略网络的设计原则、优化技巧，并结合具体实例展示其应用。II.策略网络的基本概念A.策略网络的定义策略网络是一种神经网络，它接受当前状态作为
介于YOLOv5的裂缝识别系统程序员～小强 YOLO
介于YOLOv5的裂缝识别系统在现代工业中，裂缝监测是的保障设施安全的重要环节。我们公司的新项目——基于YOLOv5的裂缝识别系统，将为您提供高效、精准的解决方案，助力各类工程项目的质量管理。系统优势我们的裂缝识别系统借助YOLOv5进行深度学习，经过精心训练，拥有强大的图像识别能力。只需简单的步骤，您就能将复杂的裂缝检测转化为轻松的操作，让分析变得更加简单、高效。核心功能图片上传与场景选择用户可
pytorch v1.4.0安装问题大柠丶 pytorch 人工智能 python
直接使用conda安装报错：(CenterNet)C:\Users\16323>condainstallpytorch==1.4.0torchvision==0.5.0cudatoolkit=10.1-cpytorch-cconda-forgeChannels:-pytorch-conda-forge-defaultsPlatform:win-64Collectingpackagemetadata
Vision mamba(mamba_ssm)安装踩坑指南 ggitjcg 深度学习 python
在这篇博客中，我将分享我在linux环境安装和使用VisionMamba（mamba_ssm）过程中遇到的一些问题和解决方法。前置检查：PyTorch和Python版本在安装mamba_ssm前，请确保你的PyTorch和Python环境版本正确。以下代码可用来检查环境信息：importtorchprint("PyTorchVersion:{}".format(torch.__version__)
关于forward函数 oioz 深度学习
定义forward函数是模型的核心前向传播逻辑，定义了输入数据如何在模型中传递和计算。它将输入数据通过模型的各层（如卷积层、全连接层等），计算出模型的输出。作用负责模型的主要计算逻辑。在训练和验证过程中都会被调用。特点必须实现：在PyTorch中，forward函数是模型的核心部分，必须显式定义。灵活性高：可以根据模型需要，自由定义forward函数的内容，包括各种计算操作。示例（PyTorch）
卷积神经网络Batch Normalization的作用 arron8899 cnn batch 人工智能
BatchNormalization的作用（通俗版）1.像“稳定器”一样校准每层输入想象你在烤多层蛋糕，每层蛋糕的烘烤温度不同（相当于神经网络的每一层数据分布不同）。没有BN时，烤箱温度忽高忽低，导致有的层烤焦（梯度爆炸），有的层不熟（梯度消失）。BN的作用相当于给每一层装了一个自动温度调节器，实时将输入数据调整到标准温度（均值为0，方差为1），保证每层都能均匀受热，训练更稳定。2.让模型训练“少
使用Dall-E生成图像：文本到图像的魔力 shuoac 计算机视觉人工智能 python
使用Dall-E生成图像：文本到图像的魔力技术背景介绍Dall-E是OpenAI开发的一个强大的文本到图像生成模型，它能够根据自然语言描述创造出全新的数字图像。这一技术基于深度学习的方法，使得创意与AI图像生成的结合更具可能性。本文将介绍如何调用Dall-EAPI来生成图像，从而使开发者能够将这一技术应用到自己的项目中。核心原理解析Dall-E利用大型语言模型（LLM）从用户提供的文本描述中提取详
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin

pytorch入门——个人总结

PyTorch入门

PyTorch入门

一、Pytorch的tensor类型

二、pytorch的生成tensor数组

三、pytorch的运算

四、pytorch.autofrad()中的Variable对象

五、pytorch自定义模型

六、pytorch损失函数定义(lost function)

七、pytorch.optim参数自动优化

八、 torchvision中的datasets和trainsforms

九、pytorch装载数据集(data_train为例)

十、 模型导入与修改

十一、OS文件操作

十二、从外部导入数据

模型保存与引入

你可能感兴趣的:(pytorch,深度学习,神经网络)

十、模型导入与修改