m0_59998867

深度学习课程作业——手写数字识别（卷积神经网络）

本实验过程需要用到torchvision包，没有安装的小伙伴，windows用户可直接使用cmd命令，输入命令行pip install torchvision即可。【仍安装不了的，建议csdn直接查找安装教程】

一、加载数据集

1.1 导入实验可能用到的包、库等

#导入所需要的包
import torchvision.datasets as dsets
import torchvision.transforms as transforms
import torch 
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from torch.autograd import Variable

%matplotlib inline

1.2 加载数据集

使用pytorch自带的数据加载器，包括dataset(装载数据集)，sampler（采样数据集），以及dataloader（迭代循环数据集）

#定义超参数
image_size = 28   #图像的总尺寸28*28
num_classes =10    #标签的种类数
num_epochs = 20   #训练的总循环周期
batch_size = 64  #一个撮批次的的等待小，64张图片


#加载MNIST数据，如果没有下载过，就会在当前路径下新建、data目录，并把文件存放在其中
#MNIST数据是属于torchvision包自带的数据，可以直接调用

#下载训练数据集
train_dataset=dsets.MNIST(root='./data',   #文件存储路径
                         train=True,     #提取训练集
                         transform=transforms.ToTensor(),   #转为tensor类型，便于数据预处理
                          download=True)       #找不到文件时，自动下载

#加载测试数据集
test_dataset = dsets.MNIST(root='./data',train=False,
                          transform=transforms.ToTensor())


#训练数据集的加载器，DataLoader方法，可以自动将数据分（批）割成batch，顺序随机打乱
train_loader = torch.utils.data.DataLoader(dataset=train_dataset,
                                         batch_size = batch_size,
                                         shuffle=True)

'''我们希望将测试数据分成两部分，一部分作为验证（校验）数据，一部分作为测试数据。
验证数据用于检测模型是否过拟合，并调整参数，测试数据检验整个模型的工作'''

#首先，我们定义下标数组indices，它相对于所有test_dataset中数据的代码
indices = range(len(test_dataset))
indices_val = indices[:5000]     #取前5000份作为验证集数据的下标
indices_test = indices[5000:]      #取后5000份作为测试集的下标


#根据这些下标，构造两个数据集的SubsetRandomSampler采样器
#校验集采样器的作用是：从数据集中indices_val，从indices_test抽取数据，它们会对下标进行采样
sampler_val = torch.utils.data.sampler.SubsetRandomSampler(indices_val)
sampler_test = torch.utils.data.sampler.SubsetRandomSampler(indices_test)

#根据两个采样器来定义加载器，注意将sampler_val和sampler_test分别赋值给validation_load和test_loadad
#采样器和加载器连接到一起，就可以在加载数据的时候随机抽取
validation_loader = torch.utils.data.DataLoader(dataset =test_dataset,
                                                batch_size =batch_size,
                                               sampler = sampler_val)

test_loader = torch.utils.data.DataLoader(dataset =test_dataset,
                                                batch_size =batch_size,
                                               sampler = sampler_test)

这里提一个概念，在此作为笔记

下采样和上采样的区别：下采样就是缩小图像，在卷积神经网络中，池化层就是下采样，即对原图像进行减缩，使得原图像的某些信息被增强，丢弃多余的，冗余的信息

1.3 读取绘制手写数字图像

#随便从数据集中读入一张图片，并绘制出来
idx = 1001

#dataset支持下标索引，其中提取出来的每一个元素为features，target格式，即属性和标签
#因此train_dataset[idx][0] 表示取该元素中的features,即取第idx批次的features中第0个图像
muteimg = train_dataset[idx][0].numpy()

#由于一般的图像包含rgb三个通道，而MNIST数据集的图像都是灰度的，只有一个通道。
#用imshow画图，会将灰度矩阵自动展现为彩色，不同灰度对应不同颜色，从黄到紫

plt.imshow(muteimg[0,...])  #取muteimg中的28*28像素点画图
print('标签是：',train_dataset[idx][1])   #[idx][1]对应的是target
print(muteimg.shape)  #（1,28,28）

二、基本的卷积神经网络

2.1 构建网络

我们将要调用PyTorch强大的nn.Module这个类来构建卷积神经网络，我们分成如下几个步骤：
1.首先，我们构造ConvNet类，它是对类nn.Module的继承
2.接着，复写init，以及forward两个函数，第一个为构造函数，每当类ConvNet被具体化一个实例时，会被调用，forward则是在运行神经网络正向的时候被自动调用
3.自定义自己的方法
ConvNet其实也是一个大容器，它里面有Conv2d，MaxPool2d等组件

（按我自己理解就是，先构造定义卷积神经网络中的各种模块、函数，然后再拼接调用、实现真正的运算）

#定义卷积神经网络;4和8为人为指定的两个卷积层的厚度（feature map 的数量）
depth =[4,8]
class ConvNet(nn.Module):
    def __init__(self):
        #该函数在创建一个ConvNet对象的时候，即调用该语句：net=ConvNet()时，就会被调用
        #首先调用父类相应的构造函数
        super(ConvNet,self).__init__()
        
        #其次构造ConvNet需要用到的各个神经模块
        """注意，定义组件并没有真正搭建这些组件，只是把基本建筑砖块先找好"""
        self.conv1 = nn.Conv2d(1,4,5,padding=2)  #定义一个卷积层，输入通道为1，输出通道为4，窗口为5*5，填充为2
        self.pool = nn.MaxPool2d(2,2)  #定义一个Pooling层，一个窗口为2*2的pooling运算
        self.conv2 = nn.Conv2d(depth[0],depth[1],5,padding=2)  #第二层卷积，输入通道为depth[0]=4
        #输出通道为depth[1]=8,窗口为5*5，填充为2
        
        #一个线性连接层，输入尺寸为最后一层立方体
        self.fc1 = nn.Linear(image_size//4*image_size//4*depth[1], 512)
        
        #最后一层线性分类单元，输入为512，输出为要做分类的类别
        self.fc2 = nn.Linear(512,num_classes) 
    
    def forward(self,x):
        #该函数完成神经网络真正的前向运算，我们会在这里把各个组件进行实际的拼装
        #x的尺寸：（batch_size,num_filters,image_width,image_height）
        x = F.relu(self.conv1(x)) #第一层卷积，激活函数用Relu，为了防止过拟合
        #x的尺寸：（batch_size,num_filters,image_width,image_height）
        x = self.pool(x)
        
        #x的尺寸：（batch_size,depth[0],image_width,image_height)
        x = F.relu(self.conv2(x))  #第三层又是卷积，窗口为5，输入输出通道分别是depth[0]=4,depth[1]=8
        #x的尺寸：（batch_size,depth[1],image_width/2,image_height/2）
        x = self.pool(x)  #第四层poolings，将图片缩小到原大小的1/4
        
        
        #将立体的特征图Tensor压成一个一维向量
        #view用于tensor的指定重新排列
        #让x按照batch_size*(image_size//4)^2 * depth[1]的方式来排布向量
        x = x.view(-1,image_size//4*image_size//4*depth[1]) 
        #x尺寸：（batch_size,depth[1]*image_size//4*image_size//4）
        
        x = F.relu(self.fc1(x))  #第五层为全链接，Relu激活函数
        #x的尺寸：（batch_size,num_classes）
        
        x = F.dropout(x,training=self.training)  #以默认为0.5的概率为对这一层进行dropout操作
        x = self.fc2(x)  #全链接
        
        x = F.log_softmax(x,dim=1)  #输出层为log_softmax，即概率对数值log(p(x))
        return x
    
    def retrieve_features(self,x):
        #用于提取卷积神经网络的特征图，返回feature_map1,feature_map2为前两层卷积层的特征图
        feature_map1 = F.relu(self.conv1(x))  #完成第一层卷积
        x = self.pool(feature_map1)   #完成第一层pooling
        feature_map2 = F.relu(self.conv2(x))   #第二层卷积，两层特征图都存储到了feature_map1,feature_map2中
        return (feature_map1,feature_map2)
def rightness(predictions,labels):
    '''计算预测错误率的函数，其中predictions是模型给出的一组预测结果，batch_size、num_classes列的矩阵'''
    pred = torch.max(predictions.data,1)[1]  #对任意一行（一个样本）的输出值的第一个维度，求最大 
    rights = pred.eq(labels.data.view_as(pred)).sum() #将下标与labels中包含的类别进行比较，并累计得到总值
    return rights,len(labels)  #返回正确的数量和这一次一共比较了多少元素

（之前记混或看不懂的地方）解释说明：

1.激活函数需作用于第五层全连接层，即fc1，而fc2不需被激活函数作用。

2.经过两层的polling（池化），原图像变为原来的1/4，故有image_size//4

各函数作用：ConvNet定义卷积神经网络；forward完成前馈神经网络运算；retrieve_features存储特征图

2.2 运行模型

net=ConvNet()  #此时会调用__init__()函数
criterion=nn.CrossEntropyLoss()   #交叉熵损失函数
optimizer=optim.SGD(net.parameters(),lr=0.001,momentum=0.9)
record=[]   #记录准确率等数值
weights=[]   #每若干步就记录一次卷积核
for epoch in range(num_epochs):   #循环周期设定为20次
    train_rights=[]     #记录训练集准确率
    '''下面的enumerate是构造一个枚举器的作用。就是我们在对train_loader做循环迭代的时候，
    enumerate会这个数字就被记录在了batch_idx之中，它就等于0，1，2，……
    train_loader每迭代一次，就会吐出来一对数据data和target，分别对应着一个batch中的手写数字'''
    for batch_idx,(data,target) in enumerate(train_loader):
        #Tensor转化为Variable，data为一批图像，target为一批标签
        data,target=Variable(data),Variable(target)
        net.train()       #打开dropout，防止过拟合
        
        output = net(data)  #神经网络完成一次前馈的计算过程，得到预测输出output
        
        #将output与target比较，计算误差，如标签是数字7，而通过net预测输出的output却是5，7与5之间存在误差
        loss=criterion(output,target)  
        optimizer.zero_grad() #清空梯度，因为Variable中requires_grad=True会默认累加梯度
        loss.backward()   #反向传播
        optimizer.step()    #一步随机梯度下降算法
        right=rightness(output,target)
        train_rights.append(right)
        
        if batch_idx %100 == 0:
            net.eval()
            val_rights=[]
            '''开始在校验数据集上做循环，计算校验集上面的准确度'''

            for (data,target)in validation_loader:
                data,target=data.clone().requires_grad_(),target.clone().detach()
                output=net(data)
                right=rightness(output,target)
                val_rights.append(right)
            #train_r[0]/trai_r[1]是训练集的分类准确度，另一个是校验集的
            train_r=(sum([tup[0] for tup in train_rights]),sum([tup[1] for tup in train_rights]))
            val_r=(sum([tup[0] for tup in val_rights]),sum([tup[1] for tup in val_rights]))
            print(val_r)
            print('训练周期:{}[{}/{}({:.0f}%)]\tLoss:{:.6f}\t训练正确率:{:.2f}%\t校验正确率:{:.2f}%'.format(
                  epoch,batch_idx * batch_size,len(train_loader.dataset),
                  100.*batch_idx/len(t。rain_loader),
                  loss.data,
                  100.*train_r[0].numpy()/train_r[1],
                  100.*val_r[0].numpy()/val_r[1]))
            #将准确率和权重等数值加载到容器中，方便后续处理
            record.append((100-100.*train_r[0]/train_r[1],100-100.*val_r[0]/val_r[1]))
            #weight记录了训练周期中所有卷积核的演化过程，net.conv1.weight提出了第一层卷积和的权重
            #clone备份weight.data中得到数据，否则weight.data变化时，列表中的每一项数据也会联动
            #所以这里使用clone函数十分重要
            weights.append([net.conv1.weight.data.clone(),net.conv1.bias.data.clone(),
                            net.conv2.weight.data.clone(),net.conv2.bias.data.clone()])

以下是部分训练结果截图：

绘制训练过程中的误差曲线

#绘制训练过程的误差曲线，校验集和测试集上的错误率
plt.figure(figsize=(10,7))
plt.plot(record)   #record记录了每一个打印周期记录的训练和校验数据集上的准确度
plt.xlabel('Steps')
plt.ylabel('Error rate')

结果如图：

2.3 在测试集上进行分类

#在测试集上分批运行，并计算总的正确率
net.eval()   #关闭dropout，标志模型当前为运行阶段
vals = [] #记录准确率

#对测试数据集进行循环
for data,target in test_loader:
    data.target = data.clone().detach().requires_grad_(True),target.clone().detach()
    output =net(data)  #将特征数据喂入网络，得到分类的输出
    val = rightness(output,target)   #获得正确样本数以及总样本数
    vals.append(val)   #记录结果

#计算准确率
rights = (sum([tup[0] for tup in vals]),sum([tup[1] for tup in vals]))
right_rate = 100.*rights[0].numpy() / rights[1]
print(right_rate)

#随便从测试集中读取一张图片，检验模型的分类结果，并绘制出来
idx = 2000
muteimg = test_dataset[idx][0].numpy()  
plt.imshow(muteimg[0,...])   #test_dataset的每一个数据由data和target组成，其中data为像素点矩阵，target为该图像标签数字
print('标签是：',test_dataset[idx][1])
print(test_dataset[idx])

#提取第一层卷积层的卷积核
plt.figure(figsize=(10,7))
for i in range(4):
    plt.subplot(1,4,i+1)
    plt.axis('off')    #关闭坐标轴
    plt.imshow(net.conv1.weight.data.numpy()[i,0,...]) 
    #第0个的第一行的所有数据为一个特征图，第1个的第一行的所有数据为第二个特征图，以此类推


#上面的卷积核我们不能够很好地解读，因此将其对应的特征图输出，便于理解
#先定义读入的图片，其中unsqueeze作用是在最前面添加一维
#目的是让input_x的tensor为四维，才能输入给net，添加的维是batch那一维
input_x = test_dataset[idx][0].unsqueeze(0)
#features是有两个元素的列表，分别表示第一层和第二层的所有特征图
feature_maps = net.retrieve_features(Variable(input_x))
plt.figure(figsize=(10,7))
 
#打印出4个特征图
for i in range(4):
    plt.subplot(1,4,i+1)
    plt.imshow(feature_maps[0][0,i,...].data.numpy())

2.4 滤波器（卷积核）的演化过程

#将记录在容器中的卷积核权重历史演化数据打印出来
i = 0
#tup是tuple元组的意思
for tup in weights:
    if i % 10 ==0:
        layer1 = tup[0]
        fig = plt.figure(figsize=(10,7))
        for j in range(4):
            plt.subplot(1,4,j+1)
            plt.axis('off')
            plt.imshow(layer1.numpy()[j,0,...])
    i +=1

部分结果如图所示：

由上图，我们可以看到，卷积核的演化过程共有4列，即以第一行的四个特征图为首，
依次不断地往下演化，即每一列对应一个卷积核。

【绘制第二层卷积核】

#绘制第二次的卷积核，每一列对应一个卷积核，一共8个卷积核（人为设定的4,8两个层的卷积厚度）
plt.figure(figsize=(15,10))
for i in range(4):
    for j in range(8):
        plt.subplot(4,8,i*8+j+1)
        plt.axis('off')
        plt.imshow(net.conv2.weight.data.numpy()[j,i,...])

#绘制第二层的特征图，一共八个
plt.figure(figsize=(10,7))
for i in range(8):
    plt.subplot(2,4,i+1)
    plt.axis('off')
    plt.imshow(feature_maps[1][0,i,...].data.numpy())

结论：从上述图像看出，图像的抽象程度变得更高了。由于池化的作用，即对图像进行模糊处理，
一些多余的图像信息被丢弃了，这也证明了卷积网络的抽象提取能力

2.5 卷积神经网络的健壮性

所谓健壮性，就是模型消除局部相关性的能力。即数字在图像平移后，模型是否仍能很好地正确预测出该数字

#随机挑选一张图片，把它往左平移w个单位，然后考察分类结果是否有变化

#提取test_dataset中第idx个批次第0个图像第0个通道对应的图像，定义为c
#原图像即为28*28， 因为这个是单通道图像
'''test_data[idx][0]的维度是（1,28,28）,即1个28行28列的矩阵，当我们
   取第1个时，即test_dataset[idx][0][0],可得到28行28列的二维张量'''
c = test_dataset[idx][0][0]   #shape为28*28

d = torch.zeros(c.size())  #全0的28×28的矩阵
w = 3  #平移的长度为3个像素



#对于d中的任意像素i，j  ，等于c中的i，j+w位置的像素（即d为c向左平移后的位置）
for i in range(c.size()[0]):
    for j in range(0,c.size()[1]-w):
        d[i,j] = c[i,j+w]

feature_maps = net.retrieve_features(Variable(c.unsqueeze(0).unsqueeze(0)))  #
plt.figure(figsize=(10,7))
 
#打印出4个特征图
for i in range(4):
    plt.subplot(1,4,i+1)
    plt.imshow(feature_maps[0][0,i,...].data.numpy())


#将d输入神经网络，得到分类结果pred，并打印
prediction = net(d.unsqueeze(0).unsqueeze(0))

''' torch.max(input, dim, keepdim=False, out=None) -> (Tensor, LongTensor)
    按维度dim 返回最大值，并且返回索引'''
pred = torch.max(prediction.data,1)[1]  #[1]即返回最大值对应的索引
print(pred)

#提取d对应的features特征图结果
feature_maps = net.retrieve_features(Variable(d.unsqueeze(0).unsqueeze(0)))  

plt.figure(figsize=(10,7))
#打印出4个特征图
for i in range(4):
    plt.subplot(1,4,i+1)
    plt.imshow(feature_maps[0][0,i,...].data.numpy())
    
plt.figure(figsize=(10,7))
for i in range(8):
    plt.subplot(2,4,i+1)
    plt.imshow(feature_maps[1][0,i,...].data.numpy())

结论：平移数字输入后得到第二层特征图。首先，网络打印出来的结果是6，说明我们的模型训练得能正确得预测出输入的数字，并且对3个像素点的平移具有很好干抗干扰性，体现出卷积神经网络很强的健壮性。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
深度学习-13-小语言模型之SmolLM的使用皮皮冰燃深度学习深度学习
文章附录1SmolLM概述1.1SmolLM简介1.2下载模型2运行2.1在CPU/GPU/多GPU上运行模型2.2使用torch.bfloat162.3通过位和字节的量化版本3应用示例4问题及解决4.1attention_mask和pad_token_id报错4.2max_new_tokens=205参考附录1SmolLM概述1.1SmolLM简介SmolLM是一系列尖端小型语言模型，提供三种规
基于深度学习的农作物病害检测 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。1.农作物病害检测的挑战病害种类繁多：农作物病害的类型多样，不同病害在同一作物上的表现差异很大，同时同一种病害在不同生长阶段的症状也可能不同。环境影响：天气、光照、湿度等外部环境因素会影响农作物的表现，使得病害检
基于深度学习的文本引导的图像编辑 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的文本引导的图像编辑（Text-GuidedImageEditing）是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理（NLP）的最新进展，使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的对齐：如何将文本中的语义信息准确地映射到图像中的特定区域或元素是一个关键挑战。这涉及到多模态数据的对齐和理解。编
深度学习--对抗生成网络（GAN, Generative Adversarial Network） Ambition_LAO 深度学习生成对抗网络
对抗生成网络（GAN,GenerativeAdversarialNetwork）是一种深度学习模型，由IanGoodfellow等人在2014年提出。GAN主要用于生成数据，通过两个神经网络相互对抗，来生成以假乱真的新数据。以下是对GAN的详细阐述，包括其概念、作用、核心要点、实现过程、代码实现和适用场景。1.概念GAN由两个神经网络组成：生成器（Generator）和判别器（Discrimina
深度学习：怎么看pth文件的参数奥利给少年深度学习人工智能
.pth文件是PyTorch模型的权重文件，它通常包含了训练好的模型的参数。要查看或使用这个文件，你可以按照以下步骤操作：1.确保你有模型的定义你需要有创建这个.pth文件时所用的模型的代码。这意味着你需要有模型的类定义和架构。2.加载模型权重使用PyTorch的load_state_dict方法来加载权重。这里是如何操作的：importtorchimporttorch.nnasnn#定义模型结构
chatgpt赋能python：如何在Python中安装Keras库？ turensu ChatGpt python chatgpt keras 计算机
如何在Python中安装Keras库？Keras是一个简单易用的神经网络库，由FrançoisChollet编写。它在Python编程语言中实现了深度学习的功能，可以使您更轻松地构建和试验不同类型的神经网络。如果您是一名Python开发人员，肯定会想知道如何在您的Python项目中安装Keras库。在本文中，我们将向您展示如何安装和配置Keras库。步骤1：安装Python要使用Keras库，您需
如何理解深度学习的训练过程奋斗的草莓熊深度学习人工智能 python scikit-learn virtualenv numpy pandas
文章目录1.训练是干什么？2.预训练模型进行训练，主要更改的是预训练模型的什么东西？1.训练是干什么？以yolov5为例子，训练的目的是把一组输入猫狗图像放到神经网络中，得到一个输出模型，这个模型下次可以直接用来识别哪个是猫，哪个是狗2.预训练模型进行训练，主要更改的是预训练模型的什么东西？超参数（Hyperparameters）：这是模型结构中定义的参数，比如：卷积核大小（kernel_size
Keras深度学习框架入门及实战指南司莹嫣Maude
Keras深度学习框架入门及实战指南keraskeras-team/keras:是一个基于Python的深度学习库，它没有使用数据库。适合用于深度学习任务的开发和实现，特别是对于需要使用Python深度学习库的场景。特点是深度学习库、Python、无数据库。项目地址:https://gitcode.com/gh_mirrors/ke/keras一、项目介绍Keras简介Keras是一款高级神经网络
深度学习驱动的车牌识别：技术演进与未来挑战逼子歌深度学习车牌识别神经网络字符识别 YOLO 卷积神经网络
一、引言1.1研究背景在当今社会，智能交通系统的发展日益重要，而车牌识别作为其关键组成部分，发挥着至关重要的作用。车牌识别技术广泛应用于交通管理、停车场管理、安防监控等领域。在交通管理中，它可以用于车辆识别、交通违法监控和车流统计等，提高交通管理的效率和准确性。在停车场管理中，实现车辆的自动识别和收费，提升管理和服务水平。在安防监控领域，可用于追踪嫌疑人及犯罪行为。深度学习的出现为车牌识别带来了重
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
transformer架构(Transformer Architecture)原理与代码实战案例讲解 AI架构设计之禅大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
transformer架构(TransformerArchitecture)原理与代码实战案例讲解关键词：Transformer,自注意力机制,编码器-解码器,预训练,微调,NLP,机器翻译作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来自然语言处理（NLP）领域的发展经历了从规则驱动到统计驱动再到深度学习驱动的三个阶段。
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
【深度学习】【OnnxRuntime】【Python】模型转化、环境搭建以及模型部署的详细教程牙牙要健康深度学习 onnx onnxruntime 深度学习 python 人工智能
【深度学习】【OnnxRuntime】【Python】模型转化、环境搭建以及模型部署的详细教程提示:博主取舍了很多大佬的博文并亲测有效,分享笔记邀大家共同学习讨论文章目录【深度学习】【OnnxRuntime】【Python】模型转化、环境搭建以及模型部署的详细教程前言模型转换--pytorch转onnxWindows平台搭建依赖环境onnxruntime调用onnx模型ONNXRuntime推理核
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri

深度学习课程作业——手写数字识别（卷积神经网络）

一、加载数据集

二、基本的卷积神经网络

你可能感兴趣的:(卷积神经网络,深度学习)