CoreJT

PyTorch中文教程 | (5) 模型保存与加载

GitHub 地址

本文提供有关Pytorch模型保存和加载的各种用例的解决方案。您可以随意阅读整个文档，或者只是跳转到所需用例的代码部分。

当保存和加载模型时，有三个核心功能需要熟悉：

1) torch.save: 将序列化对象保存到磁盘。此函数使用 Python 的pickle模块进行序列化。使用此函数可以保存如模型、tensor、字典等各种对象。

2）torch.load: 使用 pickle的 unpickling 功能将pickle对象文件反序列化到内存。此功能还可以有助于设备加载数据。

3）torch.nn.Module.load_state_dict: 使用反序列化函数 state_dict 来加载模型的参数字典

1. 什么是状态字典？

2. 保存和加载推断模型

3. 保存和加载Checkpoint用于推理/继续训练

4. 在一个文件中保存多个模型

5. 使用在不同模型参数下的热启动模式

6. 通过设备保存/加载模型

1. 什么是状态字典？

在Pytorch中，torch.nn.Module 模型的可学习参数(即权重和偏差)包含在模型的 parameters 中，(使用model.parameters()可以进行访问)。 state_dict 仅仅是python字典对象，它将每一层映射到其参数张量。注意，只有具有可学习参数的层(如卷积层、线性层等)的模型才具有 state_dict 这一项。优化目标 torch.optim 也有 state_dict 属性，它包含有关优化器的状态信息，以及使用的超参数。

因为 state_dict 的对象是python字典，所以他们可以很容易的保存、更新、更改和恢复，为Pytorch模型和优化器添加了大量模块。

实例

让我们从简单模型训练一个分类器中了解一下 state_dict 的使用。

import torch
from torch import nn
import torch.nn.functional as F
import torch.optim as optim

# Define model
class TheModelClass(nn.Module):
    def __init__(self):
        super(TheModelClass, self).__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 16 * 5 * 5)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

# Initialize model
model = TheModelClass()

# Initialize optimizer
optimizer = optim.SGD(model.parameters(), lr=0.001, momentum=0.9)

# Print model's state_dict
print("Model's state_dict:")
for param_tensor in model.state_dict():
    print(param_tensor, "\t", model.state_dict()[param_tensor].size())

# Print optimizer's state_dict
print("Optimizer's state_dict:")
for var_name in optimizer.state_dict():
    print(var_name, "\t", optimizer.state_dict()[var_name])

2. 保存和加载推断模型

保存/加载 state_dict （推荐）

保存：

torch.save(model.state_dict(), PATH)

加载：

model = TheModelClass(*args, **kwargs)
model.load_state_dict(torch.load(PATH))
model.eval()

当保存好模型用来推断的时候，只需要保存模型学习到的参数，使用 torch.save()函数来保存模型 state_dict ,它会给模型恢复提供最大的灵活性，这就是为什么要推荐它来保存的原因。

在 Pytorch 中最常见的模型保存使用 ‘.pt’ 或者是 ‘.pth’ 作为模型文件扩展名。

请记住，在运行推理之前，务必调用 model.eval() 去设置 dropout 和 batch normalization 层为评估模式。如果不这么做，可能导致模型推断结果不一致。

请注意 load_state_dict() 函数只接受字典对象，而不是保存对象的路径。这就意味着在你传给 load_state_dict() 函数之前，你必须反序列化你保存的 state_dict。例如，你无法通过 model.load_state_dict(PATH)来加载模型。

保存/加载完整模型

保存：

torch.save(model, PATH)

加载：

# Model class must be defined somewhere
model = torch.load(PATH)
model.eval()

此部分保存/加载过程使用最直观的语法并涉及最少量的代码。以Pythonpickle模块的方式来保存模型。这种方法的缺点是序列化数据受限于某种特殊的类而且需要确切的字典结构。这是因为pickle无法保存模型类本身。相反，它保存包含类的文件的路径，该文件在加载时使用。因此，当在其他项目使用或者重构之后，您的代码可能会以各种方式中断。

在 Pytorch 中最常见的模型保存使用 ‘.pt’ 或者是 ‘.pth’ 作为模型文件扩展名。

请记住，在运行推理之前，务必调用 model.eval() 去设置 dropout 和 batch normalization 层为评估模式。如果不这么做，可能导致模型推断结果不一致。

3. 保存和加载Checkpoint用于推理/继续训练

保存

torch.save({
            'epoch': epoch,
            'model_state_dict': model.state_dict(),
            'optimizer_state_dict': optimizer.state_dict(),
            'loss': loss,
            ...
            }, PATH)

加载

model = TheModelClass(*args, **kwargs)
optimizer = TheOptimizerClass(*args, **kwargs)

checkpoint = torch.load(PATH)
model.load_state_dict(checkpoint['model_state_dict'])
optimizer.load_state_dict(checkpoint['optimizer_state_dict'])
epoch = checkpoint['epoch']
loss = checkpoint['loss']

model.eval()
# - or -
model.train()

当保存成 checkpoint 的时候，可用于推理或者是恢复训练，您保存的不仅仅是模型的 state_dict 。保存优化器的 state_dict 也很重要, 因为它包含作为模型训练更新的缓冲区和参数。你也许想保存其他项目，比如最新记录的训练损失，外部的 torch.nn.Embedding 层等等。

要保存多个组件，请在字典中组织它们并使用 torch.save() 来序列化字典。 Pytorch 中常见的保存checkpoint 是使用 .tar 文件扩展名。

要加载项目，首先需要初始化模型和优化器，然后使用 torch.load() 来加载本地字典。这里，您可以非常容易的通过简单查询字典来访问您所保存的项目。

请记住在运行推理之前，务必调用 model.eval() 去设置 dropout 和 batch normalization 为评估。如果不这样做，有可能得到不一致的推断结果。如果你想要恢复训练，请调用 model.train() 以确保这些层处于训练模式。

4. 在一个文件中保存多个模型

保存

torch.save({
            'modelA_state_dict': modelA.state_dict(),
            'modelB_state_dict': modelB.state_dict(),
            'optimizerA_state_dict': optimizerA.state_dict(),
            'optimizerB_state_dict': optimizerB.state_dict(),
            ...
            }, PATH)

加载

modelA = TheModelAClass(*args, **kwargs)
modelB = TheModelBClass(*args, **kwargs)
optimizerA = TheOptimizerAClass(*args, **kwargs)
optimizerB = TheOptimizerBClass(*args, **kwargs)

checkpoint = torch.load(PATH)
modelA.load_state_dict(checkpoint['modelA_state_dict'])
modelB.load_state_dict(checkpoint['modelB_state_dict'])
optimizerA.load_state_dict(checkpoint['optimizerA_state_dict'])
optimizerB.load_state_dict(checkpoint['optimizerB_state_dict'])

modelA.eval()
modelB.eval()
# - or -
modelA.train()
modelB.train()

当保存一个模型由多个 torch.nn.Modules组成时，例如GAN(对抗生成网络), sequence-to-sequence (序列到序列模型), 或者是多个模型融合, 您可以采用与保存常规检查点相同的方法。换句话说，保存每个模型的 state_dict 的字典和相对应的优化器。如前所述，您可以通过简单地将它们附加到字典的方式来保存任何其他项目，这样有助于您恢复训练。

Pytorch 中常见的保存checkpoint 是使用 .tar 文件扩展名。

5. 使用在不同模型参数下的热启动模式

保存

torch.save(modelA.state_dict(), PATH)

加载

modelB = TheModelBClass(*args, **kwargs)
modelB.load_state_dict(torch.load(PATH), strict=False)

在迁移学习或训练新的复杂模型时，部分加载模型或加载部分模型是常见的情况。利用训练好的参数，有助于热启动训练过程，并希望帮助您的模型比从头开始训练更快地收敛。

无论是从缺少某些键的 state_dict 加载还是从键数多于加载模型的 state_dict , 您可以通过在load_state_dict()函数中将strict参数设置为 False 来忽略非匹配键的函数。

如果要将参数从一个层加载到另一个层，但是某些键不匹配，主要修改正在加载的 state_dict 中的参数键的名称以匹配要加载到模型中的键即可。

6. 通过设备保存/加载模型

保存到GPU，加载到CPU

保存：

torch.save(model.state_dict(), PATH)

加载：

device = torch.device('cpu')
model = TheModelClass(*args, **kwargs)
model.load_state_dict(torch.load(PATH, map_location=device))

当从CPU上加载在GPU上训练的模型时, 将 torch.device('cpu') 传递给 torch.load() 函数中的 map_location参数.在这种情况下，使用map_location参数将张量下的存储器动态重新映射到CPU设备。

保存到GPU，加载到GPU

保存：

torch.save(model.state_dict(), PATH)

加载：

device = torch.device("cuda")
model = TheModelClass(*args, **kwargs)
model.load_state_dict(torch.load(PATH))
model.to(device)
# Make sure to call input = input.to(device) on any input tensors that you feed to the model

当在GPU上训练并把模型保存在GPU，只需要使用 model.to(torch.device('cuda'))，将初始化的 model 转换为CUDA优化模型。另外，请务必在所有模型输入上使用 .to(torch.device('cuda')) 函数来为模型准备数据。请注意，调用 my_tensor.to(device) 会在GPU上返回my_tensor 的副本。因此，请记住手动覆盖张量：my_tensor= my_tensor.to(torch.device('cuda'))。

保存到CPU，加载到GPU

保存：

torch.save(model.state_dict(), PATH)

加载：

device = torch.device("cuda")
model = TheModelClass(*args, **kwargs)
model.load_state_dict(torch.load(PATH, map_location="cuda:0"))  # Choose whatever GPU device number you want
model.to(device)
# Make sure to call input = input.to(device) on any input tensors that you feed to the model

在CPU上训练好并保存的模型加载到GPU时，将torch.load() 函数中的 map_location 参数设置为 cuda:device_id。这会将模型加载到指定的GPU设备。接下来，请务必调用 model.to(torch.device('cuda')) 将模型的参数张量转换为 CUDA 张量。最后，确保在所有模型输入上使用 .to(torch.device('cuda')) 函数来为CUDA优化模型。请注意，调用 my_tensor.to(device) 会在GPU上返回 my_tensor 的新副本。它不会覆盖 my_tensor。因此，请手动覆盖张量 my_tensor = my_tensor.to(torch.device('cuda'))。

保存torch.nn.DataParallel模型

保存：

torch.save(model.module.state_dict(), PATH)

加载：

# Load to whatever device you want

torch.nn.DataParallel 是一个模型封装，支持并行GPU使用。要一般性的保存 DataParallel 模型, 请保存 model.module.state_dict()。这样，您就可以非常灵活地以任何方式加载模型到您想要的设备中。

【图像去噪】论文复现：TPAMI 2025！全面提升单图像去噪泛化性！像素级零样本去噪方法Pixel2Pixel的Pytorch源码复现，跑通源码，修改各种报错，框架详解，注释详细！十小大 pytorch 人工智能 python 深度学习计算机视觉图像处理图像去噪
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）完整代码和训练好的模型权重文件下载链接见本文底部，订阅专栏免费获取！本文亮点：跑通Pixel2Pixel全部源码，包含数据集准备、制作像素库(PixelBank)、训练和推理等，
【JVM实践】（6）full gc分析与实战 xiyubaby.17 jvm
FullGC全解析教程，涵盖触发机制、问题诊断、调优策略和实战案例：FullGC终极指南：深度解析与调优实践[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nsRlZAi8-1741613536305)(https://plumbr.io/wp-content/uploads/2016/01/g1-06-full-collection.png)]一、核心概念体系1.1
分布式训练中的参数local_rank 挨打且不服66 python 分布式 python
local_rank是一个常用于分布式训练中的参数，用于指示当前进程的本地编号。它帮助在分布式环境中区分不同的进程。通常情况下，local_rank的值为-1表示不进行分布式训练，值为0表示第一个（主）进程，其它正数表示其它辅助进程。在分布式训练中，我们常常需要确保某些操作（例如下载模型和词汇表）只由一个进程完成，以避免重复工作和资源浪费。以下是local_rank在不同情况下的用法解释：loca
深度学习中的异构特征介绍赫连达深度学习人工智能
深度学习，特别是现在的大模型，数据永远是最紧要的基础和前提。数据中有大量的各种各样的特征，这些特征类型不同、来源不同，因此称之为”异构特征“。这些特征没有一个明确的结构来描述它们之间的关系，这些特征的多样性和复杂性给数据处理和分析带来了挑战。这些特征包括：高基数ids：每个实体的唯一标识。交叉特征：两个或多个特征之间的组合关系。计数特征：某个特征出现的次数。比例特征：某个特征在整体中的占比。异构特
Epoch 和 Batch Size的设计 + 模型的早停策略（基于上篇）一只小铁柱 batch 开发语言
一.epoch和batchsize的设计epoch和batchsize是训练神经网络时的两个关键超参数，它们的设计会直接影响模型的训练速度、收敛性和最终性能。1.Epoch的设计epoch表示整个数据集被模型完整遍历一次。设计epoch时需要考虑以下因素：1.1数据集大小小数据集（例如几MB的文本数据）：模型容易过拟合，因此epoch不宜过大（例如10-30）。可以使用早停（earlystoppi
使用Argostranslate模型进行翻译（python）一只小铁柱 python 开发语言
1.环境准备：#创建虚拟环境python-mvenvmyenv#激活虚拟环境#Windowsmyenv\Scripts\activate#macOS/Linuxsourcemyenv/bin/activate#安装argostranslatepipinstallargostranslate2.下载语言模型importargostranslate.packageimportargostranslat
(4-8)基于DeepSeekMoE架构的DeepSeek-V3：测试模型码农三叔训练 RAG 多模态)架构 transformer deekseek 人工智能大模型
4.8测试模型DeepSeek-V3是一款基于PyTorch的深度学习模型，主要用于文本生成任务。在加载模型时，首先需要从指定路径加载模型的配置文件和预训练权重。加载完成后，模型被设置为评估模式，并移动到GPU上以加速推理过程。在生成文本时，用户可以输入提示文本，模型会根据这些提示生成相应的文本输出。生成过程支持交互式输入和批量处理两种模式，用户可以根据需要选择适合的方式进行文本生成。此外，模型的
Unity3D 游戏黑屏问题解决方法详解 Thomas_YXQ 游戏数码相机 Unity
前言Unity3D作为一款广泛使用的游戏开发引擎，在开发过程中难免会遇到各种问题，其中黑屏问题尤为常见且令人头疼。黑屏问题可能由多种原因引起，包括但不限于资源加载问题、脚本错误、硬件或驱动问题、渲染设置错误等。本文将详细探讨Unity3D游戏黑屏问题的可能原因及相应的解决方法，并给出技术详解及代码实现。对惹，这里有一个游戏开发交流小组，大家可以点击进来一起交流一下开发经验呀！一、可能原因分析1.资
docker安装eclipse-mosquitto记录（实践可用）丶Navy docker eclipse java mqtt
背景：由于课程设计需要在服务器上安装mqtt，选择先搭建docker环境，再安装eclipse-mosquitto应用。原因：网上的教程大多是一样的，但是有几个步骤出错或者漏了，使得我在docker中安装eclipse-mosquitto花费了大量时间。因此在完成课程设计以后，将个人实践成功的步骤发出。参考：https://www.freesion.com/article/5453220951/及
人工智能 - TensorRT与DeepDP终极指南：释放GPU潜能的深度学习推理优化之道天机️灵韵具身智能 VLA 人工智能人工智能算法深度学习 pytorch
TensorRTTensorRT（TensorRuntime）是英伟达（NVIDIA）推出的高性能深度学习推理（Inference）优化器和运行时库，专为在NVIDIAGPU上高效部署深度学习模型而设计。它通过模型压缩、计算图优化、硬件级加速等技术，显著提升推理速度并降低资源消耗，广泛应用于自动驾驶、工业检测、实时视频分析等对延迟敏感的领域。一、TensorRT的核心功能模型优化与加速层融合（La
AI大模型：教育行业的革新引擎 AI360labs_atyun 人工智能 AI deepseek
凌晨两点，高中生小林对着数学卷子抓耳挠腮。她轻触桌面的全息投影，AI助手“DeepSeek-R1”立刻扫描题目：“这道几何题需要先构建辅助线，还记得昨天练习的相似三角形判定法吗？”随即调出3D动态演示，讲解着自己的解题思路。指导小林轻松愉快的完成了复杂的作业。我们再试想一下：深夜两点，某重点中学教师仍在伏案批改作业‌这在以前可能是教师职业的常态，但是随着AI的普及。借助DeepSeek大模型，教师
AIGC论文查重和传统论文查重有什么区别？真不二价825 论文查重 AI论文写作 AIGC 论文查重
AIGC论文查重和传统论文查重在多个方面存在显著区别，以下是对两者的详细比较：一、检测目标和技术原理AIGC论文查重检测目标：主要用于检测和分析文本内容是否由AI生成，特别是在要求提供真实人类经验的领域，如新闻发布、文学创作等。技术原理：主要利用自然语言处理和深度学习技术，分析文本的风格、语法结构和语义连贯性，以判断内容是否可能由AI模型产生。传统论文查重检测目标：主要检测论文中是否存在抄袭或剽窃
图像识别技术与应用超帅的好吧笔记
第一节课这节课了解了这门专业的就业职位：工资是怎么样的岗位职责和任职要求看到了人类工业文明的演变了解了人工智能的研究、开发、模拟、延伸、理论、方法和技术看到了生活方式的转变比如智能语音闹钟控制系统、自动驾驶和人脸识别考勤智能购物、医疗日常生活的智能比如指纹、淘宝、抖音还能用软件看到天气的好坏了解了典型训练和机器学习中的关键组件机器学习中的关键组件包含：数据模型目标函数优化算法这节课学习了第一节剩下
Anaconda与Jupyter Notebook入门级详细使用教程_anaconda jupyter notebook 2401_84165919 程序员 jupyter ide python
Anaconda简介我们用Anaconda发行版作为Python的使用环境。Anaconda指的是一个开源的Python发行版本，其包含了conda、Python等180多个科学包及其依赖项。注意：anaconda就安装了python，不需要额外另装pythonAnaconda支持Linux,Mac,Windows,包含了众多流行的科学计算、数据分析的Python包。Anaconda和Jupyte
【AIGC】计算机视觉-YOLO系列家族 LeeZhao@ 计算机视觉 AIGC 计算机视觉 YOLO
YOLO系列家族（1）YOLO发展史（2）YOLOX（3）YOLOv6（4）YOLOv7（5）YOLOv8（6）YOLOv9（7）YOLOv10（8）YOLOv11（9）YOLOv12（1）YOLO发展史YOLO(YouOnlyLookOnce）是一种流行的物体检测和图像分割模型，由华盛顿大学的约瑟夫-雷德蒙（JosephRedmon）和阿里-法哈迪（AliFarhadi）开发。YOLO于2015
【零基础入门unity游戏开发——进阶篇】Unity Microphone类处理麦克风相关信息，录制音频并实时处理或保存录制的音频数据向宇it #unity 音视频 c#游戏引擎开发语言编辑器
考虑到每个人基础可能不一样，且并不是所有人都有同时做2D、3D开发的需求，所以我把【零基础入门unity游戏开发】分为成了C#篇、unity通用篇、unity3D篇、unity2D篇。【C#篇】：主要讲解C#的基础语法，包括变量、数据类型、运算符、流程控制、面向对象等，适合没有编程基础的同学入门。【unity通用篇】：主要讲解unity的基础通用的知识，包括unity界面、unity脚本、unit
一个基于LSTM的字符级文本生成模型的训练+使用(pytorch) 一只小铁柱 lstm pytorch 人工智能
一、代码实现1.配置文件config.pyimporttorch#设备配置DEVICE=torch.device('cuda'iftorch.cuda.is_available()else'cpu')#超参数和配置SEQ_LENGTH=100#输入序列长度BATCH_SIZE=64#批大小EMBEDDING_DIM=256#嵌入层维度HIDDEN_SIZE=512#LSTM隐藏层大小NUM_LAY
backbone和head分开转onnx的优势 yuweififi 人工智能深度学习机器学习
模型转换为ONNX格式时，将其分成backbone和head两个部分，通常是出于以下原因：1.模块化设计backbone通常是模型的特征提取部分（例如卷积神经网络的主干部分），负责从输入数据中提取高级特征。head是模型的输出部分，负责根据backbone提取的特征生成最终的预测结果（例如分类、检测、分割等）。将模型分成两部分可以实现模块化设计，便于在不同任务中复用backbone或head。例如
Centos7 下安装 MongoDB Amo Xiang 开发环境搭建合集 mongodb 数据库 nosql centos7
目录一、使用YUM的方式安装一、使用YUM的方式安装1、sudovi/etc/yum.repos.d/mongodb-org.repo修改为如下内容保存：[mongodb-org-5.0]name=MongoDBRepositorybaseurl=https://repo.mongodb.org/yum/redhat/$releasever/mongodb-org/5.0/x86_64/gpgch
模型训练和推理一杯水果茶！视觉与网络 python 梯度反向传播训练推理
训练时需要梯度，推理时不需要怎么理解“梯度”？计算图以及前向后向传播训练时需要梯度，推理时不需要阶段是否计算梯度是否反向传播是否更新参数用例写法训练✅✅✅loss训练默认即可，requires_grad=True推理❌❌❌采样、预测、部署用@torch.inference_mode()或withtorch.no_grad()训练阶段必须开启梯度计算：要计算loss（损失函数）然后通过loss.ba
【YOLOv11[基础]】目标检测OD | 导出ONNX模型 | ONN模型推理以及检测结果可视化 | python Jackilina_Stone 【改进】YOLO系列人工智能 python 计算机视觉 YOLO 深度学习目标检测
本文将导出YOLO11.pt模型对应的ONNX模型，并且使用ONNX模型推理以及结果的可视化。话不多说，先看看效果图吧！！！目录一导出ONNX模型二推理及检测结果可视化1代码2效果图
PyTorch安装与环境配置终极指南：从零搭建高效深度学习开发环境（一） WHCIS python pytorch 人工智能深度学习机器学习
一、环境搭建的核心意义与准备工作1.1深度学习环境的核心挑战深度学习开发环境涉及复杂的软件栈依赖关系：硬件兼容性：GPU型号（NVIDIA系列）与CUDA版本的匹配软件依赖链：Python版本→PyTorch版本→CUDA驱动→cuDNN加速库环境隔离需求：不同项目可能依赖冲突的库版本1.2硬件准备清单硬件类型最低要求推荐配置CPU4核8核以上内存8GB32GB+GPU支持CUDANVIDIART
AI概率学预测足球大小球让球数据分析 sanx18 人工智能数据分析数据挖掘
在足球数据分析中，AI概率学预测主要涉及大小球和让球盘口的分析。以下是关键点：1.大小球分析大小球指机构设定的进球数预期，投注者预测实际进球数是否超过或低于该值。AI应用：历史数据：AI通过分析球队的历史进球、失球等数据，预测未来比赛进球数。机器学习：使用回归模型、神经网络等预测进球数，考虑球队实力、比赛风格、天气等因素。实时数据：结合实时比赛数据动态调整预测。2.让球分析让球是机构为平衡双方实力
JVM 详解：Java 虚拟机的核心机制一点多余. jvm
目录引言：为什么JVM是Java生态的基石？一、什么是JVM？1.1JVM的核心作用二、JVM的架构2.1类加载器（ClassLoader）2.2运行时数据区（RuntimeDataAreas）2.3执行引擎（ExecutionEngine）2.4本地方法接口（JNI）三、JVM的工作原理3.1类加载过程3.2字节码执行3.3垃圾回收四、JVM的垃圾回收机制4.1垃圾回收算法4.2垃圾回收器五、J
DeepSeek API 速成教程 ftpeak Python AI python 开发语言 AI编程
1.获取API密钥要想使用DeepSeekAPI，必须拥有API密钥。方法如下：进入DeepSeek（DeepSeek）平台，并免费注册（用手机号或微信账号注册）。找到创建API密钥的入口，按照指引生成属于你的API密钥。这个密钥是调用API的重要凭证，务必妥善保管，不要泄露给他人。（如下图：）2.安装必要的库（1）Request模式在Python环境中，你可以使用requests库来发送HTTP
Python网络爬虫实战：抓取猫眼TOP100电影信息莱财一哥
本文还有配套的精品资源，点击获取简介：在Python中，Web爬虫是获取互联网数据的关键技能。本教程将指导如何结合使用requests库和正则表达式来从猫眼电影网站的TOP100榜单中抓取电影信息。首先通过requests库发送HTTP请求获取网页内容，然后运用正则表达式提取电影名和评分等信息。在进行网络爬虫时，遵守robots.txt规则，设置请求延时，并考虑处理网站的反爬虫策略。对于更复杂的网
Python面向对象(OOP)速成教程 ftpeak Python python 开发语言
Python是一门支持面向对象编程（OOP）的语言，面向对象编程的核心概念包括类、对象、封装、继承和多态。下面通过具体的范例来详细介绍这些概念的使用一、类和对象类是对象的设计稿，定义了对象的属性和方法；对象是类的实例。#定义一个类classDog:#类属性species="Canisfamiliaris"def__init__(self,name,age):#实例属性self.name=names
onnx处理和TensorRT量化推理相关代码工具天亮换季人工智能算法深度学习
一.说明在模型量化过程中，经常要使用一些工具对onnx或者量化后的模型（这里以TensorRT为例）进行推理，往往需要一些处理工具，比如：拆分或者合并onnx；修改onnx中的量算子QuantizeLinear的scale值；以及使用onnxruntime进行推理；TensorRT的序列化文件的inference；隐式量化生成量化校准表…现提供一些封装好的工具，作为记录，方便日后查阅使用"
word处理控件Aspose.Words教程：使用 Python 删除 Word 中的空白页 CodeCraft Studio 文档管理控件 word python 开发语言
Aspose.Words是一种高级Word文档处理API，用于执行各种文档管理和操作任务。API支持生成，修改，转换，呈现和打印文档，而无需在跨平台应用程序中直接使用MicrosoftWord。AsposeAPI支持流行文件格式处理，并允许将各类文档导出或转换为固定布局文件格式和最常用的图像/多媒体格式。Aspose.wordsfor.net下载Aspose.wordsforforPython下载
【Agent实战】RAG方式+结构化prompt（CoT）+API工具结合ChatGPT4o能力Agent项目实践（货物上架位置推荐助手）姚瑞南 RAG技术应用探索大模型落地探索及agent搭建 prompt chatgpt 自然语言处理人工智能 AIGC
本文原创作者：姚瑞南AI-agent大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。（转载需经授权）目录结论效果图示1.prompt2.API工具封装3.知识库搭建4.测试用例结论成功利用ChatGPT4o版本结合RAG知识库方式，通过结构化prompt（CoT）调用API工具为用
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1

PyTorch中文教程 | (5) 模型保存与加载

1. 什么是状态字典？

2. 保存和加载推断模型

3. 保存和加载Checkpoint用于推理/继续训练

4. 在一个文件中保存多个模型

5. 使用在不同模型参数下的热启动模式

6. 通过设备保存/加载模型

你可能感兴趣的:(PyTorch中文教程,模型加载,模型保存,PyTorch中文教程,PyTorch教程)