学不来我就死

pytorch学习笔记——3.6~3.7Pytorch中定义网络的方式以及模型保存和加载方法

摘要：

在Pytorch中提供了多种高搭建网络的方式，我们这里会以一个简单的全连接神经网络作为例子来介绍pytorch中定义网络的两种方式：Module以及Sequential。在本文中我们将使用boston房价数据，分别使用 Module以及Sequential两种方式来定义一个简单的全连接神经网络，并用于网络模型的训练。在最后我们会介绍模型的保存和加载的方法。

一、导入模块以及数据准备

在本文中我们将使用boston房价数据，分别使用 Module以及Sequential两种方式来定义一个简单的全连接神经网络，并用于网络模型的训练。

首先我们导入需要使用的模块以及库：nn模块方便用户使用网络中的层，Data模块用于对数据进行预处理，load_boston模块用于导入需要使用的boston房价数据集，StandardScaler用于对数据进行标准化处理。

import torch
import torch.nn as nn
from torch.optim import SGD
import torch.utils.data as Data
from sklearn.datasets import load_boston
from sklearn.preprocessing import StandardScaler
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

接下来，在定义网络之前，我们需要先导入数据，并对数据进行预处理，代码如下：

#读取数据
boston_X,boston_y = load_boston(return_X_y=True)
print("boston_X.shape=",boston_X.shape)
print("boston_y.shape=",boston_y.shape)
#对因变量y可视化
plt.figure()
plt.hist(boston_y,bins=20)
plt.show()

如上代码通过sklearn库中的datasets模块使用load_boston()函数来导入数据，导入成功后我们使用直方图对数据集的因变量y进行可视化处理，用于查看数据的分布，结果如下：

boston_X.shape= (506, 13)
boston_y.shape= (506,)

接下来，我们使用StanardScaler()函数对数据集中的自变量进行标准化处理，在标准化处理后我们需要将数据集转化为张量并设置为一个DataLoader用于模型的训练，代码如下：

#数据标准化处理
ss = StandardScaler(with_mean=True,with_std=True)
#with_meanT对数据中心化，F使数据平均值为0
#with_stdT对数据缩放到单位标准差，F使标准差为1
boston_Xs = ss.fit_transform(boston_X)
#将数据预处理为可以使用Pytorch进行训练的格式

#训练集X转化为张量 
train_xt = torch.from_numpy(boston_Xs.astype(np.float32))
#训练集y转化为张量
train_yt = torch.from_numpy(boston_y.astype(np.float32))

#将训练集转化为张量后，使用TensorDataset将X,Y整理到一起
train_data = Data.TensorDataset(train_xt,train_yt)


#定义数据加载器
train_loader = Data.DataLoader(
    dataset=train_data,
    batch_size=64,
    shuffle=True,
    num_workers=1,)

在上面的代码中，我们首先使用了StandardScaler()函数对数据集的自变量进行了标准化处理，然后使用torch.from_numpy将标准化处理得到的数组转换为张量。然后，我们针对转化为张量后的train_xt和train_yt使用Data.TensorDataset()函数将数据集整合到一起，并使用Data.DataLoader()函数定义了一个数据加载器，方便模型训练。

二、网络定义与训练方式1——继承Module方式

在对数据进行预处理后，我们可以使用继承Module的方式定义一个包含层的全连接神经网络。代码如下：

#使用继承module方式定义全连接神经网络
class MLPmodel(nn.Module):
    def __init__(self):
        super(MLPmodel,self).__init__()
        #定义第一个隐藏层
        self.hidden1 = nn.Linear(
            in_features=13,#第一个隐藏层的输入，数据的特征数
            out_features=10,#第一个隐藏层的输出，神经元的数量
            bias=True#默认偏置
        )
        self.active1 = nn.ReLU()
        #定义第二个隐藏层
        self.hidden2 = nn.Linear(10,10)
        self.active2 = nn.ReLU()
        #定义预测回归层
        self.regression = nn.Linear(10,1)
    #定义网络的前向传播路径
    def forward(self,x):
            x = self.hidden1(x)
            x = self.active1(x)
            x = self.hidden2(x)
            x = self.active2(x)
            output = self.regression(x)
            return output

在上面的程序里，我们定义了一个类MLPmodel，在继承nn.Module基础上对功能进行了定义：第一部分是定义网络结构，第二部分是定义前向传播过程函数。在程序中网络结构使用3个使用nn.Linear()定义的全连接层和2个使用nn.ReLU()定义的激活函数层。在前向传播过程中，通过对输入x进行一系列层运算得到输出output。

对于定义好的网络结构可以使用MLPmodel（）函数类得到网络结构并输出展示：

#输出网络结构
mlp1 = MLPmodel()
print(mlp1)

结果为：

MLPmodel(
  (hidden1): Linear(in_features=13, out_features=10, bias=True)
  (active1): ReLU()
  (hidden2): Linear(in_features=10, out_features=10, bias=True)
  (active2): ReLU()
  (regression): Linear(in_features=10, out_features=1, bias=True)
)

可以看到网络包含hidden1、active1、hidden2、active2、regression等五个层。

定义好网络后，我们使用已经预处理的数据集进行模型的训练，代码如下：

#对回归模型mlp1进行训练并输出损失函数的变化情况，定义优化器和损失函数
optimizer = SGD(mlp1.parameters(),lr=0.001)#优化器
loss_func = nn.MSELoss()#均方根误差损失函数
train_loss_all = []#输出每个batch的损失函数
#进行训练 输出每个batch的损失函数
for epoch in range(30):
    for step,(b_x,b_y) in enumerate(train_loader):
        output = mlp1(b_x).flatten()#MLP在训练batch上的输出
        train_loss = loss_func(output,b_y)#均方根误差
        optimizer.zero_grad()#每步迭代的梯度初始化为0
        train_loss.backward()#损失后向传播 计算梯度
        optimizer.step()#用梯度进行优化，更新网络参数
        train_loss_all.append(train_loss.item())#使用item是为了更好的精度
    print("training:epoch:{},loss is:{}".format(epoch,train_loss))

在上面程序中，我们使用SGD优化算法对网络进行优化，并使用最小均方根误差（nn.MSELoss）作为损失函数。在代码中我们使用两层for循环对模型进行训练。第一层for循环定义了epoch次数——30次，第二层for循环利用dataloader中的每一个batch对模型参数进行优化，并在优化训练的过程中，把每个batch的损失函数保存到train_loss_all列表中。结果为：

training:epoch:0,loss is:651.8478393554688
training:epoch:1,loss is:451.8705139160156
training:epoch:2,loss is:222.9663543701172
training:epoch:3,loss is:43.8781852722168
training:epoch:4,loss is:36.01059341430664
training:epoch:5,loss is:34.02287673950195
training:epoch:6,loss is:16.315336227416992
training:epoch:7,loss is:27.012081146240234
training:epoch:8,loss is:27.3387508392334
training:epoch:9,loss is:15.65408706665039
training:epoch:10,loss is:11.391887664794922
training:epoch:11,loss is:14.950801849365234
training:epoch:12,loss is:7.878189563751221
training:epoch:13,loss is:10.389168739318848
training:epoch:14,loss is:38.699710845947266
training:epoch:15,loss is:33.012184143066406
training:epoch:16,loss is:16.20742416381836
training:epoch:17,loss is:8.10318374633789
training:epoch:18,loss is:11.674643516540527
training:epoch:19,loss is:12.047943115234375
training:epoch:20,loss is:9.584135055541992
training:epoch:21,loss is:8.645150184631348
training:epoch:22,loss is:12.71487808227539
training:epoch:23,loss is:21.70963478088379
training:epoch:24,loss is:15.55139446258545
training:epoch:25,loss is:16.53809356689453
training:epoch:26,loss is:8.164796829223633
training:epoch:27,loss is:8.541359901428223
training:epoch:28,loss is:20.232585906982422
training:epoch:29,loss is:15.832387924194336

在训练完成后，我们将train_loss进行可视化，输出每个batch上的损失函数值，代码如下;

#将loss可视化
plt.figure()
plt.plot(train_loss_all,"r-")
plt.title("Train loss per iteration")
plt.show()

结果为：

三、网络定义与训练方式2——使用Sequential方式

我们在定义网络结构时，每个层都指定了一个名称，在pytorch中我们有可以将多个功能层连接在一起的函数nn.Sequential，用来方便网络前向传播函数的定义。代码如下：

#定义网络时使用nn.sequential形式

class MLPmodel2(nn.Module):
    def __init__(self):
        super(MLPmodel2,self).__init__()
        #定义隐藏层
        self.hidden = nn.Sequential(
            nn.Linear(13,10),
            nn.ReLU(),
            nn.Linear(10,10),
            nn.ReLU()
            )
        self.regression = nn.Linear(10,1)
    #定义网络的前向传播路径
    def forward(self,x):
        x = self.hidden(x)
        output = self.regression(x)
        return output

由于使用了nn.Sequential()函数，上面的程序定义网络的结构和前向传播过程得到了简化，网络中通过nn.Sequential()函数将两个nn.Linear()层和两个nn.ReLU()层统一打包为self.hidden()层，从而简化了前向传播过程。

下面我们输出新的网络模型，代码如下：

#输出网络结构
mlp2 = MLPmodel2()
print(mlp2)

结果为：

MLPmodel2(
  (hidden): Sequential(
    (0): Linear(in_features=13, out_features=10, bias=True)
    (1): ReLU()
    (2): Linear(in_features=10, out_features=10, bias=True)
    (3): ReLU()
  )
  (regression): Linear(in_features=10, out_features=1, bias=True)
)

下面使用与上一个模型相同的训练方式对mlp2进行训练，并可视化损失函数的变化情况，代码如下：

#对回归模型mlp2进行训练并输出损失函数的变化情况，定义优化器和损失函数
optimizer = SGD(mlp2.parameters(),lr=0.001)#优化器
loss_func = nn.MSELoss()#均方根误差损失函数
train_loss_all = []#输出每个batch的损失函数
#进行训练 输出每个batch的损失函数
for epoch in range(30):
    for step,(b_x,b_y) in enumerate(train_loader):
        output = mlp2(b_x).flatten()#MLP在训练batch上的输出
        train_loss = loss_func(output,b_y)#均方根误差
        optimizer.zero_grad()#每步迭代的梯度初始化为0
        train_loss.backward()#损失后向传播 计算梯度
        optimizer.step()#用梯度进行优化，更新网络参数
        train_loss_all.append(train_loss.item())#使用item是为了更好的精度
    print("training:epoch:{},loss is:{}".format(step,train_loss))


#将loss可视化
plt.figure()
plt.plot(train_loss_all,"r-")
plt.title("Train loss per iteration")
plt.show()

结果为：

training:epoch:0,loss is:436.60546875
training:epoch:1,loss is:582.7129516601562
training:epoch:2,loss is:409.6592712402344
training:epoch:3,loss is:173.41856384277344
training:epoch:4,loss is:44.96323013305664
training:epoch:5,loss is:17.938114166259766
training:epoch:6,loss is:15.396425247192383
training:epoch:7,loss is:21.345027923583984
training:epoch:8,loss is:21.450403213500977
training:epoch:9,loss is:31.526996612548828
training:epoch:10,loss is:16.86117172241211
training:epoch:11,loss is:13.187933921813965
training:epoch:12,loss is:16.603776931762695
training:epoch:13,loss is:11.954453468322754
training:epoch:14,loss is:13.164793014526367
training:epoch:15,loss is:16.980178833007812
training:epoch:16,loss is:10.694413185119629
training:epoch:17,loss is:26.266019821166992
training:epoch:18,loss is:9.10973834991455
training:epoch:19,loss is:25.490833282470703
training:epoch:20,loss is:30.570960998535156
training:epoch:21,loss is:8.850362777709961
training:epoch:22,loss is:17.68893051147461
training:epoch:23,loss is:11.046181678771973
training:epoch:24,loss is:26.081111907958984
training:epoch:25,loss is:37.37417221069336
training:epoch:26,loss is:10.504935264587402
training:epoch:27,loss is:15.730428695678711
training:epoch:28,loss is:33.034278869628906
training:epoch:29,loss is:12.501280784606934

四、Pytorch模型保存和加载方法

在Pytorch中，保存模型有两种方法，分别是保存整个模型和保存模型的参数。下面我们分别简单介绍一下：

1、保存整个模型：

保存整个模型的代码如下，使用torch.save()函数将已经训练好的mlp1模型保存到指定路径下的mlp1.pkl文件。

##保存整个模型
#pth/pkl都一样
torch.save(mlp1,"model/chap3/mlp1.pkl")

在保存整个模型后，我们可以使用torch.load()函数，将指定的模型导入，代码如下：

#导入保存的模型
mlp1load = torch.load("model/chap3/mlp1.pkl")

输出导入的模型，结果为：

mlp1load

MLPmodel(
  (hidden1): Linear(in_features=13, out_features=10, bias=True)
  (active1): ReLU()
  (hidden2): Linear(in_features=10, out_features=10, bias=True)
  (active2): ReLU()
  (regression): Linear(in_features=10, out_features=1, bias=True)
)

2、保存模型的参数：

保存模型参数的代码如下，使用torch.save()函数并通过mlp2.state_dict()来获取网络中已经训练好的参数，从而将已经训练好的mlp2模型参数保存到指定路径下的mlp2.pkl文件。

torch.save(mlp2.state_dict(),"model/chap3/mlp2_param.pkl")

在保存整个模型后，我们可以使用torch.load()函数，将指定的模型导入，代码如下：

#导入保存的模型
mlp2load = torch.load("model/chap3/mlp2_param.pkl")

输出导入的模型，结果为：

mlp2load

OrderedDict([('hidden.0.weight',
              tensor([[-0.2132,  0.2305, -0.3366, -0.2649, -0.1252,  0.8415,  0.0502,  0.0361,
                       -0.4234, -0.5494, -0.4924, -0.0738, -0.1656],
                      [ 0.0830, -0.0911, -0.0362,  0.1496,  0.1463, -0.2113, -0.1137, -0.1642,
                       -0.2623, -0.0793, -0.1016, -0.1717, -0.1972],
                      [-0.2800, -0.1617, -0.0751,  0.0053, -0.1634,  0.2190,  0.0618, -0.2121,
                        0.2654,  0.1841, -0.1182,  0.1035, -0.4117],
                      [-0.3292, -0.2940,  0.0461,  0.2259, -0.0652, -0.4952, -0.1125, -0.2642,
                        0.2339, -0.0210,  0.2419,  0.2453, -0.0510],
                      [-0.1584, -0.2223, -0.0186, -0.1980, -0.2813,  0.1431,  0.0585,  0.0022,
                        0.0581, -0.2585, -0.0291, -0.0165, -0.0530],
                      [-0.3257, -0.2950,  0.3473,  0.3138, -0.0478,  0.0700,  0.0868, -0.5014,
                        0.4903,  0.2924,  0.0558, -0.0344, -0.7907],
                      [-0.2362,  0.0233, -0.0668,  0.0022,  0.0403,  0.0933,  0.0418,  0.0439,
                        0.0411,  0.1725,  0.1417, -0.1404,  0.0076],
                      [ 0.1142,  0.1649,  0.2305, -0.2533, -0.0381, -0.1338, -0.0340,  0.1816,
                       -0.0655,  0.2694,  0.1025, -0.0261,  0.1683],
                      [-0.0852,  0.1490, -0.3265,  0.0026, -0.1440,  0.0172, -0.4110,  0.0871,
                       -0.1492, -0.4246,  0.2714, -0.0912,  0.0300],
                      [ 0.0357, -0.1156,  0.2167,  0.0893, -0.0908,  0.5137, -0.1228, -0.4114,
                       -0.2889, -0.2757, -0.2907,  0.0744, -0.0991]])),
             ('hidden.0.bias',
              tensor([ 0.5015, -0.3119,  0.3757,  0.5223,  0.7213,  0.4269, -0.2002,  0.2302,
                       0.4658,  0.8910])),
             ('hidden.2.weight',
              tensor([[-1.0036e-01,  1.2591e-01, -6.5946e-02,  1.0771e-01,  1.3281e-01,
                       -6.9875e-02, -3.0611e-01,  2.8797e-01, -2.6753e-01, -2.5118e-01],
                      [-2.3740e-01, -5.1535e-02,  2.0969e-01, -1.9276e-01,  1.6560e-01,
                        3.2547e-01, -2.0438e-01,  1.2305e-01, -1.1501e-01,  2.7024e-01],
                      [-1.4445e-01,  3.1008e-01,  1.7482e-01,  2.4565e-01, -1.6996e-01,
                        3.1134e-01,  2.4297e-01, -9.9022e-02, -2.3332e-01,  5.4664e-02],
                      [ 1.1616e+00, -1.6310e-01,  5.3211e-01,  5.8448e-01,  6.6959e-01,
                        1.0986e+00, -2.1371e-01,  1.6244e-01,  7.2628e-01,  9.9944e-01],
                      [-2.9865e-01,  1.1893e-01,  1.6788e-01, -9.2804e-02,  1.0962e-01,
                        7.4962e-02,  1.1354e-02, -2.5429e-01,  2.0920e-01,  6.6796e-02],
                      [-3.1396e-01,  1.9069e-01, -2.8313e-01, -1.5441e-01,  1.7565e-01,
                       -7.0314e-02, -2.9698e-01, -8.1007e-03,  2.7669e-01,  3.7587e-02],
                      [ 5.2378e-01, -9.6923e-03,  4.2255e-01,  5.9688e-01,  4.1674e-01,
                        4.0357e-01, -1.4318e-01, -4.9639e-02,  3.4439e-01,  5.6091e-01],
                      [ 1.8507e-01, -2.8330e-01, -2.9120e-01, -2.3122e-01,  6.0142e-04,
                       -2.4921e-01,  8.9442e-02, -1.2345e-01, -2.5589e-01, -1.2468e-01],
                      [-1.0434e-01, -2.6015e-01, -1.2560e-01, -4.5251e-02, -8.1023e-02,
                       -1.6459e-01,  6.4637e-02, -2.8821e-01, -2.7937e-01,  1.9763e-01],
                      [ 2.0804e-01,  1.5478e-01, -1.6674e-02, -2.9766e-01, -5.3503e-02,
                        2.1896e-01, -1.7699e-01, -6.8683e-02, -6.4342e-02, -3.1080e-01]])),
             ('hidden.2.bias',
              tensor([-0.2832,  0.0673,  0.4857,  1.4254, -0.2284, -0.2674,  0.2271,  0.0914,
                       0.1870, -0.1923])),
             ('regression.weight',
              tensor([[-0.0588,  0.1831,  0.4805,  2.6274, -0.1797, -0.1955,  1.1210, -0.1403,
                       -0.1191, -0.2867]])),
             ('regression.bias', tensor([1.6694]))])

Go语言的学习路线技术的探险家包罗万象 golang 开发语言后端
Go语言的学习路线随着科技的迅速发展，编程语言也在不断进化，Go（又称Golang）作为一种现代化的编程语言，其简单性、高效性和强大的并发支持吸引了越来越多的开发者。本文将为您提供一条系统的Go语言学习路线，帮助您从零基础逐步掌握这门语言。一、Go语言简介Go语言是Google于2007年开发的一种开源编程语言，旨在提高编程的效率，与传统的编程语言相比，Go具有以下几个显著的优点：简洁性：Go设计
洞察事件驱动架构的灵魂——Java中实现高度可观察性的艺术墨夶 Java学习资料1 架构 java 开发语言
在当今的软件开发领域，构建一个既能够高效响应变化又具备强大监控能力的应用系统已成为开发者们追求的目标。事件驱动架构（EDA）因其天然的支持异步处理、松耦合特性而备受青睐。然而，如何确保这样一个复杂且动态变化的系统具有良好的可见性和可控性？这就需要我们深入探讨“可观察性”这一概念，并学习如何通过精心设计让Java应用程序中的每一个事件都能被清晰地追踪和理解。本文将带您走进事件驱动架构的核心，揭示增强
用Python进行websocket接口测试代码小念软件测试自动化测试技术分享 python websocket 开发语言
这篇文章主要介绍了用Python进行websocket接口测试，帮助大家更好的理解和使用python，感兴趣的朋友可以了解下我们在做接口测试时，除了常见的http接口，还有一种比较多见，就是socket接口，今天讲解下怎么用Python进行websocket接口测试。SocketSocket又称"套接字"，应用程序通常通过"套接字"向网络发出请求或者应答网络请求，使主机间或者一台计算机上的进程间可
Next.js服务器操作：优势、局限与审慎应用 exploration-earth javascript 服务器开发语言
类似于任何技术，它们亦非尽善尽美，故而保持警觉至关重要。通过亲身经历中的挫折汲取了教训，现将之与诸位共勉。一大诟病在于潜在的紧密绑定问题。若服务器端代码嵌入组件之中，则可能导致代码库模块化程度削弱，维护成本攀升。后端逻辑的任何变动或许都将迫使前端相应更新，反之亦然。对于追求关注点严格分离的大型项目或团队而言，这无疑构成了严峻挑战。唯有秉持严谨的纪律与条理，方能避免代码库陷入混乱。再者，便是学习曲线
机器学习02-发展历史补充坐吃山猪机器学习机器学习人工智能
机器学习02-发展历史补充文章目录机器学习02-发展历史补充1-机器学习个人理解1-初始阶段：统计学习和模式识别（20世纪50年代至80年代）2-第二阶段【集成时代】+【核方法】（20世纪90年代至2000年代初期）3-第三阶段【特征工程】+【模型优化】（2000年代中期至2010年代初期）4-大规模数据和分布式计算（2010年代中后期）5-自动化机器学习和特征选择（2010年代末至今）2-神经网
2024-12-01百度TTS语音坐吃山猪 AI训练 AI编程
百度TTS语音个人尝试代码仓库：https://gitee.com/enzoism/chrome_tampermonkey鸣谢：感谢每一位无私奉献的传道者，在此不一一具名！1-学习目标1）了解百度TTS语音2）使用百度TTS语音2-参考网址个人尝试代码仓库：https://gitee.com/enzoism/chrome_tampermonkey1-应用列表查看地址：https://console
使用 Python 实现 WebSocket 服务器与客户端通信又蓝 python websocket
简介WebSocket是一种基于TCP协议的通信协议，能够在客户端与服务器之间进行全双工（双向）通信。相比传统的HTTP协议，WebSocket可以实现实时数据的传输，尤其适合需要实时交互的应用场景，如在线游戏、实时聊天、金融交易等。我通过Python实现一个简单的WebSocket服务器，并使其与客户端进行通信。我们将创建两个Python文件：websocket.py和main.py，webso
基于Python实现读取嵌套压缩包下的文件袁袁袁袁满 Python实用技巧大全 python 嵌套压缩包下文件读取 Python实现嵌套压缩包压缩包 zipfile BytesIO
文章目录前言思路完整代码代码优化前言工作中遇到的问题，需要用Python实现嵌套压缩包下文件读取，这里记录下方法，希望能帮助到更多的人。思路打开外层zip压缩包并遍历文件：使用withzipfile.ZipFile(outer_zip_path,'r')asouter_zip语句以读取模式'r'打开用户输入的外层zip压缩包对应的文件，这样在代码块结束后会自动关闭该文件，避免资源泄露。通过oute
【如何利用Python抢演唱会门票】python利用selenium实现大麦网抢票 Python小炮车 python selenium 数据库
一、selenium原理介绍Selenium是一个用于Web[应用程序](https://link.juejin.cn/?target=https%3A%2F%2Fbaike.baidu.com%2Fitem%2F%25E5%25BA%2594%25E7%2594%25A8%25E7%25A8%258B%25E5%25BA%258F%2F5985445%3FfromModule%3Dlemma_i
OpenSPG docker 安装教程 @comefly NLP docker openspg 知识图谱 llm
文章目录前言自述一、OpenSPG1.介绍二、安装步骤1.安装服务端2.客户端部署前言自述我最近是想结合chatglm3-6b和知识图谱做一个垂直领域的技术规范的问答系统，过程中也遇到了很多困难，在模型微调上，在数据集收集整理上，在知识图谱的信息抽取上等等，咬咬牙，多学习就可以解决，本文主要写一下利用openspg做技术规范的信息抽取的部署安装过程。一、OpenSPG1.介绍OpenSPG是蚂蚁集
麒麟操作系统基础知识保姆级教程（十五）权限管理小屁不止是运维基础知识 linux 服务器网络运维学习 bash
如果你想拥有你从未拥有过的东西，那么你必须去做你从未做过的事情之前咱们了解过了麒麟操作系统的sudo提权，那么都有哪些关于咱们权限有哪些相关的知识呢？欢迎交流：在学习过程中如果你有任何疑问或想法，欢迎在评论区留言，我们可以共同探讨学习的内容。你的支持是我持续创作的动力！点赞、收藏与推荐：如果你觉得这篇文章对你有所帮助，请不要忘记点赞、收藏，并分享给更多的小伙伴！你们的鼓励是我不断进步的源泉！推广给
Python 实现七大排序算法 weixin_30527323 python shell 数据结构与算法
技术博客：github.com/yongxinz/te…本文用Python实现了插入排序、希尔排序、冒泡排序、快速排序、直接选择排序、堆排序、归并排序。先整体看一下各个算法之间的对比，然后再进行详细介绍：排序算法平均时间复杂度最好情况最坏情况空间复杂度排序方式稳定性插入排序O(n²)O(n)O(n²)O(1)In-place稳定冒泡排序O(n²)O(n)O(n²)O(1)In-place稳定选择排
ollama教程——使用LangChain调用Ollama接口实现ReAct walkskyer ollama入门教程 langchain react.js 前端
ollama入门系列教程简介与目录相关文章:Ollama教程——入门：开启本地大型语言模型开发之旅Ollama教程——模型：如何将模型高效导入到Ollama框架Ollama教程——兼容OpenAIAPI：高效利用兼容OpenAI的API进行AI项目开发Ollama教程——使用LangChain：Ollama与LangChain的强强联合Ollama教程——生成内容API：利用Ollama的原生AP
ChatGPT大模型极简应用开发-目录 uncle_ll #GPT chatgpt 人工智能 LLM 大模型 GPT
引言要理解ChatGPT，了解其背后的Transformer架构和GPT技术一路的演进则变得非常必要。ChatGPT背后的LLM技术使普通人能够通过自然语言完成过去只能由程序员通过编程语言实现的任务，这是一场巨大的变革。然而，人类通常容易高估技术的短期影响而低估长期影响。进一步学习关于LLM技术原理的论文、视频、图书等。在阅读这本书或者后续学习过程中，你有任何疑问都可以随时请教ChatGPT等工具
后端方向初阶入门——MySQL 小羊一定要努力变强 mysql 数据库
各位帅哥美女，编辑不易，动动发财小手，来个三连加关注，后续会有更加优秀的推文推出~Mysql：用的最多的数据库，项目都用此数据库(Oracle：大型数据库，用的不多，因为收费，大公司难免会遇到。目录1.MySQL简介2.MySQL安装与配置2.1下载与安装2.2配置与启动3.数据库基础操作3.1创建数据库3.2选择数据库3.3创建表3.4插入数据3.5查询数据3.6更新数据3.7删除数据3.8.添
Python数据分析高频面试题及答案闲人编程程序员面试 python 数据分析面试题核心
目录1.基础知识2.数据处理3.数据可视化4.机器学习模型5.进阶问题6.数据清洗与预处理7.数据转换与操作8.时间序列分析9.高级数据分析技术10.数据降维与特征选择11.模型评估与优化12.数据操作与转换13.数据筛选与分析14.数据可视化与报告15.数据统计与分析16.高级数据处理以下是一些Python数据分析的高频核心面试题及其答案，涵盖了基础知识、数据1.基础知识问1：Python中列表
《电子制作从零开始》第1章：电子制作入门请向我看齐电子电路电子电路
第1章：电子制作入门1.1走进电子制作的世界电子制作的魅力与应用领域创造力的体现：电子制作就像是一场科技与创意的结合。通过自己的双手，将各种电子元件巧妙地组合在一起，创造出具有各种功能的电子设备，从简单的闪烁灯到复杂的智能机器人，这个过程能够充分发挥个人的创造力。技术探索的乐趣：在制作过程中，可以深入了解电子技术的原理。例如，通过制作一个小型的音频放大器，能直观地理解信号放大的过程，以及电容、电阻
Thanos架构学习 qq_道可道监控 K8S与容器架构
Thanos架构学习简介Thanos有两种架构模式sidecar部署receiver部署组件概念及说明简介官网参考Thanos基于prometheus，在此基础上提供了全局指标查询，可将多个云/region的prometheus数据集中管理，并且将数据直接存储到廉价的对象存储，可以存放更久的数据（并对历史数据进行压缩与降采样），降低本地prometheus存储费用，同时可与现有的prometheu
Python数据分析常见面试题和答案01-10 飞翔还哈哈6 Python数据分析 python pandas 数据分析
以下是一些Python数据分析常见面试题和答案：1.Python中的list和tuple的区别是什么？答：List是可变的，而元组（tuple）是不可变的。因此，使用list来存储需要频繁修改的数据，而使用元组来存储不能更改的数据项。2.解释NumPy中的数组？为什么numpy在数据分析中很重要？答：NumPy是Python中提供高性能科学计算和数据分析的包。NumPy数组是一种类似于列表的数据结
【Python小技巧】使用prettytable格式化显示dataframe数据 IT里的交易员 Python经验池 python
文章目录前言一、安装prettytable二、函数打包三、应用示例总结前言经常我们使用print(df)输出dataframe数据，打印输出的数据没有格式，看起来屏幕一篇乱。有没有一种可以格式化输出的工具？还真有，那就是prettytable。一、安装prettytablePrettyTable是Python中的一个库，用于以美观的表格形式显示数据。要使用PrettyTable，首先需要安装它，可
Python中用ollama库实现连续对话 longnershot python 开发语言 AI编程
找来找去没找到一个简单示例，用4o和问心来回调整简单生成了一个，抛砖引玉了。importollamadefchat_with_ollama():#初始化一个列表来存储对话历史，每个元素是一个包含用户输入和模型回复的元组history=[]whileTrue:#获取用户输入，并转换为小写，方便后续判断退出条件user_input=input("\nUser:")#判断用户是否想要退出对话ifuser
Node.js的Express框架入门秋枫ઇଓ node.js express 学习 javascript
Node.js的Express框架入门什么是Node?Node（正式名称Node.js）是一个开源的、跨平台的运行时环境，有了它，开发人员可以使用JavaScript创建各种服务器端工具和应用程序。此运行时主要用于浏览器上下文之外（即可以直接运行于计算机或服务器操作系统上）。据此，该环境省略了一些浏览器专用的JavaScriptAPI，同时添加了对更传统的OSAPI（比如HTTP库和文件系统库）的
Python电子书教程汇总 iteye_3941 python
From:http://bathome.net/thread-15554-1-1.html[转载教程]Python电子书教程汇总（2012-02-16更新）简明Python教程(AByteofPython)_1.20_中文版pdfhttp://www.rayfile.com/zh-cn/files/6cdcc561-58b2-11e1-ad5e-0015c55db73d/Python语言从入门到精
深入理解观察者模式 —— Qt信号槽机制的实现拾工软件设计观察者模式 qt 开发语言
观察者模式是一种行为型设计模式，允许一个对象（被观察者）状态发生变化时通知一组依赖它的对象（观察者），从而实现对象之间的解耦。在这篇文章中，我们将探讨如何用C++和Python实现观察者模式，并在代码中清晰地体现这一设计模式的核心思想。其实Qt的信号槽机制，就是借住了这一设计模式，并对其进行了一些扩展。由于Qt广泛的被C++和Python用户使用，所以这里给出Python和C++两个版本的简单实现
Pytorch 三小时极限入门教程 power-辰南人工智能深度学习 pytorch 人工智能
一、引言在当今的人工智能领域，深度学习占据了举足轻重的地位。而Pytorch作为一款广受欢迎的深度学习框架，以其简洁、灵活的特性，吸引了大量开发者投身其中。无论是科研人员探索前沿的神经网络架构，还是工程师将深度学习技术落地到实际项目，Pytorch都提供了强大的支持。本教程将带你从零基础开始，一步步深入了解Pytorch的核心知识，助你顺利踏上深度学习的征程。二、Pytorch基础环境搭建安装An
Python网络编程之UDP套接字编程 Ssaty. udp 网络 python
第1关：UDP初体验任务描述本关任务：完成一个客户端程序，向服务器端发出请求，传输数据，并设置超时丢包，体验UDP的基本连接过程。相关知识为了完成本关任务，你需要掌握：创建socket对象；发送UDP数据；接收UDP数据；设置超时。创建socket对象创建socket对象是第一步，后续所有的操作都是通过socket对象完成的。创建对象使用socket()函数：s=socket(参数1,参数2)#s
使用Python访问和操作Llama的方法起风了~~~。 python llama 人工智能 Python
使用Python访问和操作Llama的方法Llama是一个流行的Python库，用于处理和操作数据集。它提供了丰富的功能和工具，使我们能够轻松地对数据进行处理、转换和分析。本文将介绍如何使用Python来访问和使用Llama库，并提供相应的示例代码。安装Llama库首先，我们需要安装Llama库。可以使用pip命令在Python环境中安装Llama。打开终端或命令提示符，并运行以下命令：pipin
Python机器学习之XGBoost从入门到实战(基本理论说明) 雪域枫蓝 Python Atificial Intelligence 机器学习 python 分布式
Xgboost从基础到实战XGBoost:eXtremeGradientBoosting*应用机器学习领域的一个强有力的工具*GradientBootingMachines(GBM)的优化表现，快速有效—深盟分布式机器学习开源平台(DistributedmachinelearningCommunity，DMLC)的分支—DMLC也开源流行的深度学习库mxnet*GBM：Machine：机器学习模型
手把手教你使用 Python 制作贪吃蛇游戏｜Python游戏程序员CC_ Python教程 python 学python pygame python 开发语言
贪吃蛇游戏是有史以来最受欢迎的街机游戏之一。在这个游戏中，玩家的主要目标是在不撞墙或不撞墙的情况下抓住最大数量的水果。在学习Python或Pygame时，可以将创建蛇游戏视为一项挑战。这是每个新手程序员都应该接受的最好的初学者友好项目之一。学习构建视频游戏是一种有趣而有趣的学习。我们将使用Pygame来创建这个蛇游戏。Pygame是一个开源库，专为制作视频游戏而设计。它具有内置的图形和声音库。它也
midjourney初学者必看（迅速入门）会飞the羊 midjourney
Midjourney初步学习：基本操作流程：-新建一个服务器-在输入框里添加MJROBOT:https://discord.com/oauth2/authorize?client_id=936929561302675456&permissions=2147601472&scope=applications.commands%20bot-输入/→选择imagine开始写prompt-prompt使用
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要

pytorch学习笔记——3.6~3.7Pytorch中定义网络的方式以及模型保存和加载方法

摘要：

一、导入模块以及数据准备

二、网络定义与训练方式1——继承Module方式

三、网络定义与训练方式2——使用Sequential方式

四、Pytorch模型保存和加载方法

1、保存整个模型：

2、保存模型的参数：

你可能感兴趣的:(pytorch入门,pytorch,学习,深度学习,机器学习,python)