captainMo_11

NNDL 实验六卷积神经网络（3）LeNet实现MNIST

5.3 基于LeNet实现手写体数字识别实验

5.3.1 数据

5.3.2 模型构建

5.3.3 模型训练

5.3.4 模型评价

5.3.5 模型预测

使用前馈神经网络实现MNIST识别，与LeNet效果对比。（选做）

可视化LeNet中的部分特征图和卷积核，谈谈自己的看法。（选做）

5.3 基于LeNet实现手写体数字识别实验

5.3.1 数据

手写体数字识别是计算机视觉中最常用的图像分类任务，让计算机识别出给定图片中的手写体数字（0-9共10个数字）。由于手写体风格差异很大，因此手写体数字识别是具有一定难度的任务。

我们采用常用的手写数字识别数据集：MNIST数据集。MNIST数据集是计算机视觉领域的经典入门数据集，包含了60,000个训练样本和10,000个测试样本。这些数字已经过尺寸标准化并位于图像中心，图像是固定大小(28×2828×28像素)。图5.12给出了部分样本的示例。

为了节省训练时间，本节选取MNIST数据集的一个子集进行后续实验，数据集的划分为：

训练集：1,000条样本
验证集：200条样本
测试集：200条样本

MNIST数据集分为train_set、dev_set和test_set三个数据集，每个数据集含两个列表分别存放了图片数据以及标签数据。比如train_set包含：

图片数据：[1 000, 784]的二维列表，包含1 000张图片。每张图片用一个长度为784的向量表示，内容是 28×2828×28 尺寸的像素灰度值（黑白图片）。
标签数据：[1 000, 1]的列表，表示这些图片对应的分类标签，即0~9之间的数字。

观察数据集分布情况，代码实现如下：

# 读取标签数据集
with open('./train-labels.idx1-ubyte', 'rb') as lbpath:
    labels_magic, labels_num = struct.unpack('>II', lbpath.read(8))
    labels = np.fromfile(lbpath, dtype=np.uint8)

# 读取图片数据集
with open('./train-images.idx3-ubyte', 'rb') as imgpath:
    images_magic, images_num, rows, cols = struct.unpack('>IIII', imgpath.read(16))
    images = np.fromfile(imgpath, dtype=np.uint8).reshape(images_num, rows * cols)

train_images, train_labels = images[:1000], labels[:1000]
dev_images, dev_labels = images[1000:1200], labels[1000:1200]
test_images, test_labels = images[1200:1400], labels[1200:1400]
train_set, dev_set,test_set= [train_images, train_labels], [dev_images, dev_labels],[test_images, test_labels]
print('Length of train/dev/test set:{}/{}/{}'.format(len(train_set[0]), len(dev_set[0]),len(test_set[0]) ))

Length of train/dev/test set:1000/200/200

from PIL import Image
import matplotlib.pyplot as plt
image, label = train_set[0][0], train_set[1][0]
image, label = np.array(image).astype('float32'), int(label)
# 原始图像数据为长度784的行向量，需要调整为[28,28]大小的图像
image = np.reshape(image, [28,28])
image = Image.fromarray(image.astype('uint8'), mode='L')
print("The number in the picture is {}".format(label))
plt.figure(figsize=(5, 5))
plt.imshow(image)
plt.savefig('conv-number5.pdf')

The number in the picture is 5

5.3.1.1 数据预处理

from torchvision.transforms import Compose, Resize, Normalize
# 数据预处理
transforms = Compose([Resize(32), Normalize(mean=[127.5], std=[127.5],)])
import random
import torch.utils.data as io

class MNIST_dataset(io.Dataset):
    def __init__(self, dataset, transforms, mode='train'):
        self.mode = mode
        self.transforms =transforms
        self.dataset = dataset

    def __getitem__(self, idx):
        # 获取图像和标签
        image, label = self.dataset[0][idx], self.dataset[1][idx]
        image, label = np.array(image).astype('float32'), int(label)
        image = np.reshape(image, [28,28])
        image = Image.fromarray(image.astype('uint8'), mode='L')
        image = self.transforms(image)

        return image, label

    def __len__(self):
        return len(self.dataset[0])

# 固定随机种子
random.seed(0)
# 加载 mnist 数据集
train_dataset = MNIST_dataset(dataset=train_set, transforms=transforms, mode='train')
test_dataset = MNIST_dataset(dataset=test_set, transforms=transforms, mode='test')
dev_dataset = MNIST_dataset(dataset=dev_set, transforms=transforms, mode='dev')

5.3.2 模型构建

这里的LeNet-5和原始版本有4点不同：

C3层没有使用连接表来减少卷积数量。
汇聚层使用了简单的平均汇聚，没有引入权重和偏置参数以及非线性激活函数。
卷积层的激活函数使用ReLU函数。
最后的输出层为一个全连接线性层。
网络共有7层，包含3个卷积层、2个汇聚层以及2个全连接层的简单卷积神经网络接，受输入图像大小为32×32=1024，输出对应10个类别的得分。

1.测试LeNet-5模型，构造一个形状为 [1,1,32,32]的输入数据送入网络，观察每一层特征图的形状变化。

class Model_LeNet(nn.Module):
    def __init__(self, in_channels, num_classes=10):
        super(Model_LeNet, self).__init__()
        # 卷积层：输出通道数为6，卷积核大小为5×5
        self.conv1 = Conv2D(in_channels=in_channels, out_channels=6, kernel_size=5,)
        # 汇聚层：汇聚窗口为2×2，步长为2
        self.pool2 = Pool2D(size=(2,2), mode='max', stride=2)
        # 卷积层：输入通道数为6，输出通道数为16，卷积核大小为5×5，步长为1
        self.conv3 = Conv2D(in_channels=6, out_channels=16, kernel_size=5, stride=1, )
        # 汇聚层：汇聚窗口为2×2，步长为2
        self.pool4 = Pool2D(size=(2,2), mode='avg', stride=2)
        # 卷积层：输入通道数为16，输出通道数为120，卷积核大小为5×5
        self.conv5 = Conv2D(in_channels=16, out_channels=120, kernel_size=5, stride=1,)
        # 全连接层：输入神经元为120，输出神经元为84
        self.linear6 = nn.Linear(120, 84)
        # 全连接层：输入神经元为84，输出神经元为类别数
        self.linear7 = nn.Linear(84, num_classes)

    def forward(self, x):
        # C1：卷积层+激活函数
        output = F.relu(self.conv1(x))
        # S2：汇聚层
        output = self.pool2(output)
        # C3：卷积层+激活函数
        output = F.relu(self.conv3(output))
        # S4：汇聚层
        output = self.pool4(output)
        # C5：卷积层+激活函数
        output = F.relu(self.conv5(output))
        # 输入层将数据拉平[B,C,H,W] -> [B,CxHxW]
        output = torch.squeeze(output, axis=[2,3])
        # F6：全连接层
        output = F.relu(self.linear6(output))
        # F7：全连接层
        output = self.linear7(output)
        return output



# 这里用np.random创建一个随机数组作为输入数据
inputs = np.random.randn(*[1,1,32,32])
inputs = inputs.astype('float32')

# 创建Model_LeNet类的实例，指定模型名称和分类的类别数目
model = Model_LeNet(in_channels=1, num_classes=10)
# 通过调用LeNet从基类继承的sublayers()函数，查看LeNet中所包含的子层
#print(model.state_dict().keys())
model_modules = [x for x in model.modules()]
print(model_modules[1:])
x = torch.tensor(inputs)
for item in model_modules[1:]:
    # item是LeNet类中的一个子层
    # 查看经过子层之后的输出数据形状
    #print(len(list(item.parameters())))
    try:
        x = item(x)
    except:
        # 如果是最后一个卷积层输出，需要展平后才可以送入全连接层
        x = torch.reshape(x, [x.shape[0], -1])
        x = item(x)
    if len(list(item.parameters()))==2:
        # 查看卷积和全连接层的数据和参数的形状，
        # 其中item.parameters()[0]是权重参数w，item.parameters()[1]是偏置参数b
        print(item, x.shape, list(item.parameters())[0].shape,
                list(item.parameters())[1].shape)
    else:
        # 汇聚层没有参数
        print(item, x.shape)

[Conv2D(), Pool2D(), Conv2D(), Pool2D(), Conv2D(), Linear(in_features=120, out_features=84, bias=True), Linear(in_features=84, out_features=10, bias=True)]
Conv2D() torch.Size([1, 6, 28, 28]) torch.Size([6, 1, 5, 5]) torch.Size([6, 1])
Pool2D() torch.Size([1, 6, 14, 14])
Conv2D() torch.Size([1, 16, 10, 10]) torch.Size([16, 6, 5, 5]) torch.Size([16, 1])
Pool2D() torch.Size([1, 16, 5, 5])
Conv2D() torch.Size([1, 120, 1, 1]) torch.Size([120, 16, 5, 5]) torch.Size([120, 1])
Linear(in_features=120, out_features=84, bias=True) torch.Size([1, 84]) torch.Size([84, 120]) torch.Size([84])
Linear(in_features=84, out_features=10, bias=True) torch.Size([1, 10]) torch.Size([10, 84]) torch.Size([10])

使用自定义算子，构建LeNet-5模型

自定义的Conv2D和Pool2D算子中包含多个for循环，所以运算速度比较慢。

使用pytorch中的相应算子，构建LeNet-5模型

torch.nn.Conv2d()；torch.nn.MaxPool2d()；torch.nn.avg_pool2d()

class Model_LeNet(nn.Module):
    def __init__(self, in_channels, num_classes=10):
        super(Model_LeNet, self).__init__()
        # 卷积层：输出通道数为6，卷积核大小为5×5
        self.conv1 = Conv2D(in_channels=in_channels, out_channels=6, kernel_size=5,)
        # 汇聚层：汇聚窗口为2×2，步长为2
        self.pool2 = Pool2D(size=(2,2), mode='max', stride=2)
        # 卷积层：输入通道数为6，输出通道数为16，卷积核大小为5×5，步长为1
        self.conv3 = Conv2D(in_channels=6, out_channels=16, kernel_size=5, stride=1, )
        # 汇聚层：汇聚窗口为2×2，步长为2
        self.pool4 = Pool2D(size=(2,2), mode='avg', stride=2)
        # 卷积层：输入通道数为16，输出通道数为120，卷积核大小为5×5
        self.conv5 = Conv2D(in_channels=16, out_channels=120, kernel_size=5, stride=1,)
        # 全连接层：输入神经元为120，输出神经元为84
        self.linear6 = nn.Linear(120, 84)
        # 全连接层：输入神经元为84，输出神经元为类别数
        self.linear7 = nn.Linear(84, num_classes)

    def forward(self, x):
        # C1：卷积层+激活函数
        output = F.relu(self.conv1(x))
        # S2：汇聚层
        output = self.pool2(output)
        # C3：卷积层+激活函数
        output = F.relu(self.conv3(output))
        # S4：汇聚层
        output = self.pool4(output)
        # C5：卷积层+激活函数
        output = F.relu(self.conv5(output))
        # 输入层将数据拉平[B,C,H,W] -> [B,CxHxW]
        output = torch.squeeze(output, axis=[2,3])
        # F6：全连接层
        output = F.relu(self.linear6(output))
        # F7：全连接层
        output = self.linear7(output)
        return output

class Paddle_LeNet(nn.Module):
    def __init__(self, in_channels, num_classes=10):
        super(Paddle_LeNet, self).__init__()
        # 卷积层：输出通道数为6，卷积核大小为5*5
        self.conv1 = nn.Conv2d(in_channels=in_channels, out_channels=6, kernel_size=5)
        # 汇聚层：汇聚窗口为2*2，步长为2
        self.pool2 = nn.MaxPool2d(kernel_size=2, stride=2)
        # 卷积层：输入通道数为6，输出通道数为16，卷积核大小为5*5
        self.conv3 = nn.Conv2d(in_channels=6, out_channels=16, kernel_size=5)
        # 汇聚层：汇聚窗口为2*2，步长为2
        self.pool4 = nn.AvgPool2d(kernel_size=2, stride=2)
        # 卷积层：输入通道数为16，输出通道数为120，卷积核大小为5*5
        self.conv5 = nn.Conv2d(in_channels=16, out_channels=120, kernel_size=5)
        # 全连接层：输入神经元为120，输出神经元为84
        self.linear6 = nn.Linear(in_features=120, out_features=84)
        # 全连接层：输入神经元为84，输出神经元为类别数
        self.linear7 = nn.Linear(in_features=84, out_features=num_classes)

    def forward(self, x):
        # C1：卷积层+激活函数
        output = F.relu(self.conv1(x))
        # S2：汇聚层
        output = self.pool2(output)
        # C3：卷积层+激活函数
        output = F.relu(self.conv3(output))
        # S4：汇聚层
        output = self.pool4(output)
        # C5：卷积层+激活函数
        output = F.relu(self.conv5(output))
        # 输入层将数据拉平[B,C,H,W] -> [B,CxHxW]
        output = torch.squeeze(output, 2)
        output = torch.squeeze(output, 2)
        # F6：全连接层
        output = F.relu(self.linear6(output))
        # F7：全连接层
        output = self.linear7(output)
        return output

3.测试两个网络的运算速度。

import time

# 这里用np.random创建一个随机数组作为测试数据
inputs = np.random.randn(*[1,1,32,32])
inputs = inputs.astype('float32')
x = torch.tensor(inputs)

# 创建Model_LeNet类的实例，指定模型名称和分类的类别数目
model = Model_LeNet(in_channels=1, num_classes=10)
# 创建Paddle_LeNet类的实例，指定模型名称和分类的类别数目
paddle_model = Paddle_LeNet(in_channels=1, num_classes=10)

# 计算Model_LeNet类的运算速度
model_time = 0
for i in range(60):
    strat_time = time.time()
    out = model(x)
    end_time = time.time()
    # 预热10次运算，不计入最终速度统计
    if i < 10:
        continue
    model_time += (end_time - strat_time)
avg_model_time = model_time / 50
print('Model_LeNet speed:', avg_model_time, 's')

# 计算Paddle_LeNet类的运算速度
paddle_model_time = 0
for i in range(60):
    strat_time = time.time()
    paddle_out = paddle_model(x)
    end_time = time.time()
    # 预热10次运算，不计入最终速度统计
    if i < 10:
        continue
    paddle_model_time += (end_time - strat_time)
avg_paddle_model_time = paddle_model_time / 50

print('Paddle_LeNet speed:', avg_paddle_model_time, 's')

Model_LeNet speed: 0.7908068466186523 s
Paddle_LeNet speed: 0.0005187749862670899 s

直接导入库要比自定义的算子快很多。

4.令两个网络加载同样的权重，测试一下两个网络的输出结果是否一致。

# 这里用np.random创建一个随机数组作为测试数据
inputs = np.random.randn(*[1,1,32,32])
inputs = inputs.astype('float32')
x = torch.tensor(inputs)

# 创建Model_LeNet类的实例，指定模型名称和分类的类别数目
model = Model_LeNet(in_channels=1, num_classes=10)
# 获取网络的权重
params = model.state_dict()
# 自定义Conv2D算子的bias参数形状为[out_channels, 1]
# paddle API中Conv2D算子的bias参数形状为[out_channels]
# 需要进行调整后才可以赋值
for key in params:
    if 'bias' in key:
        params[key] = params[key].squeeze()
# 创建Paddle_LeNet类的实例，指定模型名称和分类的类别数目
paddle_model = Paddle_LeNet(in_channels=1, num_classes=10)
# 将Model_LeNet的权重参数赋予给Paddle_LeNet模型，保持两者一致
paddle_model.load_state_dict(params)

# 打印结果保留小数点后6位
torch.set_printoptions(6)
# 计算Model_LeNet的结果
output = model(x)
print('Model_LeNet output: ', output)
# 计算Paddle_LeNet的结果
paddle_output = paddle_model(x)
print('Paddle_LeNet output: ', paddle_output)

Model_LeNet output:  tensor([[109042.375000,    826.511658,  19116.425781,   8992.041016,
          26914.462891,   4552.554199, -41347.921875, 128910.500000,
          19684.457031,  14371.383789]], grad_fn=)
Paddle_LeNet output:  tensor([[109042.328125,    826.501892,  19116.421875,   8992.035156,
          26914.462891,   4552.554199, -41347.914062, 128910.453125,
          19684.453125,  14371.379883]], grad_fn=)

结果近似相同。

5.统计LeNet-5模型的参数量和计算量。

在飞桨中，还可以使用paddle.flopsAPI自动统计计算量。pytorch可以么？

from torchsummary import summary

summary(paddle_model,input_size=(1,32,32))

5.3.3 模型训练

使用交叉熵损失函数，并用随机梯度下降法作为优化器来训练LeNet-5网络。
用RunnerV3在训练集上训练5个epoch，并保存准确率最高的模型作为最佳模型。

# 学习率大小
lr = 0.3
# 批次大小
batch_size = 64
# 加载数据
train_loader = io.DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
dev_loader = io.DataLoader(dev_dataset, batch_size=batch_size)
test_loader = io.DataLoader(test_dataset, batch_size=batch_size)
# 定义LeNet网络
# 自定义算子实现的LeNet-5
#model = Model_LeNet(in_channels=1, num_classes=10)
# 飞桨API实现的LeNet-5
model = Paddle_LeNet(in_channels=1, num_classes=10)
# 定义优化器
optimizer = opt.SGD(model.parameters(),lr, )
# 定义损失函数
loss_fn = F.cross_entropy
# 定义评价指标
metric = metric.Accuracy(is_logist=True)
# 实例化 RunnerV3 类，并传入训练配置。
runner = runnerV3.RunnerV3(model, optimizer, loss_fn, metric)
# 启动训练
log_steps = 15
eval_steps = 15

runner.train(train_loader, dev_loader, num_epochs=5, log_steps=log_steps,
                eval_steps=eval_steps, save_path="best_model.pdparams")
# 加载最优模型
runner.load_model('best_model.pdparams')

[Train] epoch: 0/5, step: 0/80, loss: 2.31379
[Train] epoch: 0/5, step: 15/80, loss: 2.25382
D:\pythonProject2\nndl\metric.py:55: UserWarning: To copy construct from a tensor, it is recommended to use sourceTensor.clone().detach() or sourceTensor.clone().detach().requires_grad_(True), rather than torch.tensor(sourceTensor).
  batch_correct = torch.sum(torch.tensor(preds==labels, dtype=torch.float32)).numpy()
[Evaluate]  dev score: 0.36000, dev loss: 2.23824
[Evaluate] best accuracy performence has been updated: 0.00000 --> 0.36000
[Train] epoch: 1/5, step: 30/80, loss: 2.41069
[Evaluate]  dev score: 0.26000, dev loss: 2.37212
[Train] epoch: 2/5, step: 45/80, loss: 1.55699
[Evaluate]  dev score: 0.51000, dev loss: 1.44048
[Evaluate] best accuracy performence has been updated: 0.36000 --> 0.51000
[Train] epoch: 3/5, step: 60/80, loss: 1.84617
[Evaluate]  dev score: 0.55000, dev loss: 1.66818
[Evaluate] best accuracy performence has been updated: 0.51000 --> 0.55000
[Train] epoch: 4/5, step: 75/80, loss: 0.92327
[Evaluate]  dev score: 0.62000, dev loss: 1.07769
[Evaluate] best accuracy performence has been updated: 0.55000 --> 0.62000
[Evaluate]  dev score: 0.69500, dev loss: 0.84913
[Evaluate] best accuracy performence has been updated: 0.62000 --> 0.69500
[Train] Training done!

5.3.4 模型评价

使用测试数据对在训练过程中保存的最佳模型进行评价，观察模型在测试集上的准确率以及损失变化情况。

# 加载最优模型
runner.load_model('best_model.pdparams')
# 模型评价
score, loss = runner.evaluate(test_loader)
print("[Test] accuracy/loss: {:.4f}/{:.4f}".format(score, loss))

[Test] accuracy/loss: 0.7100/0.8367

5.3.5 模型预测

同样地，我们也可以使用保存好的模型，对测试集中的某一个数据进行模型预测，观察模型效果。

# 获取测试集中第一条数
X, label = next(iter(test_loader))
logits = runner.predict(X)
# 多分类，使用softmax计算预测概率
pred = F.softmax(logits,dim=1)
print(pred.shape)
# 获取概率最大的类别
pred_class = torch.argmax(pred[2]).numpy()
print(pred_class)
label = label[2].numpy()
# 输出真实类别与预测类别
print("The true category is {} and the predicted category is {}".format(label, pred_class))
# 可视化图片
plt.figure(figsize=(2, 2))
image, label = test_set[0][2], test_set[1][2]
image= np.array(image).astype('float32')
image = np.reshape(image, [28,28])
image = Image.fromarray(image.astype('uint8'), mode='L')
plt.imshow(image)
plt.savefig('cnn-number2.pdf')

6
The true category is 6 and the predicted category is 6

使用前馈神经网络实现MNIST识别，与LeNet效果对比。（选做）

两种网络训练50轮：

前馈神经网络源代码：

import struct
import numpy as np
import torch.optim as opt
from nndl import runnerV3, metric
import random
import torch.utils.data as io
import torch.nn.functional as F
import torch.nn as nn
import torch
from PIL import Image
import matplotlib.pyplot as plt
from torchvision.transforms import Compose, Resize, Normalize
import torchvision.transforms as transforms
import torchmetrics
from nndl.dataset import load_data
class Accuracy(torchmetrics.Metric):
    def __init__(self,is_logist=True):
        """
        输入：
           - is_logist: outputs是logist还是激活后的值
        """
        # 用于统计正确的样本个数
        super().__init__()
        self.add_state("num_correct",torch.tensor(0))
        # 用于统计样本的总数
        self.add_state("num_count", torch.tensor(0))
        #self.add_state("is_logist", is_logist)
    def update(self, outputs, labels):
        """
        输入：
           - outputs: 预测值, shape=[N,class_num]
           - labels: 标签值, shape=[N,1]
        """

        # 判断是二分类任务还是多分类任务，shape[1]=1时为二分类任务，shape[1]>1时为多分类任务
        if outputs.shape[1] == 1: # 二分类
            outputs = torch.squeeze(outputs, -1)
            if self.is_logist:
                # logist判断是否大于0
                p = []
                for i in range(len(outputs)):
                    if outputs[i] > 0.:
                        p.append([1])
                    else:
                        p.append([0])
                preds = torch.tensor(p)
            else:
                # 如果不是logist，判断每个概率值是否大于0.5，当大于0.5时，类别为1，否则类别为0
                p = []
                for i in range(len(outputs)):
                    if outputs[i] > 0.5:
                        p.append([1])
                    else:
                        p.append([0])
                preds = torch.tensor(p)
        else:
            # 多分类时，使用'paddle.argmax'计算最大元素索引作为类别
            preds = torch.argmax(outputs, dim=1).int()

        # 获取本批数据中预测正确的样本个数
        labels = torch.squeeze(labels, -1)
        batch_correct = torch.sum(torch.eq(preds, labels).float()).numpy()
        batch_count = len(labels)

        # 更新num_correct 和 num_count
        self.num_correct += batch_correct
        self.num_count += batch_count

    def compute(self):
        # 使用累计的数据，计算总的指标
        if self.num_count == 0:
            return 0
        return self.num_correct / self.num_count

    def reset(self):
        # 重置正确的数目和总数
        self.num_correct = 0
        self.num_count = 0

    def name(self):
        return "Accuracy"
class Model_MLP_L2_V3(nn.Module):
    def __init__(self, input_size, output_size, hidden_size):
        super(Model_MLP_L2_V3, self).__init__()
        # 构建第一个全连接层
        self.fc1 = nn.Linear(
            input_size,
            hidden_size,
        )
        nn.init.normal_(self.fc1.weight, mean=0, std=0.01)
        nn.init.constant_(self.fc1.bias,1.0)
        # 构建第二全连接层
        self.fc2 = nn.Linear(
            hidden_size,
            output_size,
        )
        nn.init.normal_(self.fc2.weight, mean=0, std=0.01)
        nn.init.constant_(self.fc2.bias, 1.0)
        # 定义网络使用的激活函数
        self.act = nn.Sigmoid()

    def forward(self, inputs):
        outputs = self.fc1(inputs)
        outputs = self.act(outputs)
        outputs = self.fc2(outputs)
        return outputs
class RunnerV3(object):
    def __init__(self, model, optimizer, loss_fn, metric, **kwargs):
        self.model = model
        self.optimizer = optimizer
        self.loss_fn = loss_fn
        self.metric = metric  # 只用于计算评价指标

        # 记录训练过程中的评价指标变化情况
        self.dev_scores = []

        # 记录训练过程中的损失函数变化情况
        self.train_epoch_losses = []  # 一个epoch记录一次loss
        self.train_step_losses = []  # 一个step记录一次loss
        self.dev_losses = []

        # 记录全局最优指标
        self.best_score = 0

    def train(self, train_loader, dev_loader=None, **kwargs):
        # 将模型切换为训练模式
        self.model.train()

        # 传入训练轮数，如果没有传入值则默认为0
        num_epochs = kwargs.get("num_epochs", 0)
        # 传入log打印频率，如果没有传入值则默认为100
        log_steps = kwargs.get("log_steps", 100)
        # 评价频率
        eval_steps = kwargs.get("eval_steps", 0)

        # 传入模型保存路径，如果没有传入值则默认为"best_model.pdparams"
        save_path = kwargs.get("save_path", "best_model.pdparams")

        custom_print_log = kwargs.get("custom_print_log", None)

        # 训练总的步数
        num_training_steps = num_epochs * len(train_loader)

        if eval_steps:
            if self.metric is None:
                raise RuntimeError('Error: Metric can not be None!')
            if dev_loader is None:
                raise RuntimeError('Error: dev_loader can not be None!')

        # 运行的step数目
        global_step = 0

        # 进行num_epochs轮训练
        for epoch in range(num_epochs):
            # 用于统计训练集的损失
            total_loss = 0
            for step, data in enumerate(train_loader):
                X, y = data
                # 获取模型预测
                logits = self.model(X)
                loss = self.loss_fn(logits, y)  # 默认求mean
                total_loss += loss

                # 训练过程中，每个step的loss进行保存
                self.train_step_losses.append((global_step, loss.item()))

                if log_steps and global_step % log_steps == 0:
                    print(
                        f"[Train] epoch: {epoch}/{num_epochs}, step: {global_step}/{num_training_steps}, loss: {loss.item():.5f}")

                # 梯度反向传播，计算每个参数的梯度值
                loss.backward()

                if custom_print_log:
                    custom_print_log(self)

                # 小批量梯度下降进行参数更新
                self.optimizer.step()
                # 梯度归零
                optimizer.zero_grad()

                # 判断是否需要评价
                if eval_steps > 0 and global_step > 0 and \
                        (global_step % eval_steps == 0 or global_step == (num_training_steps - 1)):

                    dev_score, dev_loss = self.evaluate(dev_loader, global_step=global_step)
                    print(f"[Evaluate]  dev score: {dev_score:.5f}, dev loss: {dev_loss:.5f}")

                    # 将模型切换为训练模式
                    self.model.train()

                    # 如果当前指标为最优指标，保存该模型
                    if dev_score > self.best_score:
                        self.save_model(save_path)
                        print(
                            f"[Evaluate] best accuracy performence has been updated: {self.best_score:.5f} --> {dev_score:.5f}")
                        self.best_score = dev_score

                global_step += 1

            # 当前epoch 训练loss累计值
            trn_loss = (total_loss / len(train_loader)).item()
            # epoch粒度的训练loss保存
            self.train_epoch_losses.append(trn_loss)

        print("[Train] Training done!")

    # 模型评估阶段，使用'paddle.no_grad()'控制不计算和存储梯度
    @torch.no_grad()
    def evaluate(self, dev_loader, **kwargs):
        assert self.metric is not None

        # 将模型设置为评估模式
        self.model.eval()

        global_step = kwargs.get("global_step", -1)

        # 用于统计训练集的损失
        total_loss = 0

        # 重置评价
        self.metric.reset()

        # 遍历验证集每个批次
        for batch_id, data in enumerate(dev_loader):
            X, y = data

            # 计算模型输出
            logits = self.model(X)

            # 计算损失函数
            loss = self.loss_fn(logits, y).item()
            # 累积损失
            total_loss += loss

            # 累积评价
            self.metric.update(logits, y)

        dev_loss = (total_loss / len(dev_loader))
        dev_score = self.metric.compute()

        # 记录验证集loss
        if global_step != -1:
            self.dev_losses.append((global_step, dev_loss))
            self.dev_scores.append(dev_score)

        return dev_score, dev_loss

    # 模型评估阶段，使用'paddle.no_grad()'控制不计算和存储梯度
    @torch.no_grad()
    def predict(self, x, **kwargs):
        # 将模型设置为评估模式
        self.model.eval()
        # 运行模型前向计算，得到预测值
        logits = self.model(x)
        return logits

    def save_model(self, save_path):
        torch.save(self.model.state_dict(), save_path)

    def load_model(self, model_path):
        state_dict = torch.load(model_path)
        self.model.load_state_dict(state_dict)
        # 数据预处理
transforms = Compose([transforms.ToTensor(), Normalize(mean=[0.5], std=[0.5], )])
class IrisDataset(io.Dataset):
    def __init__(self, mode='train', num_train=120, num_dev=15):
        super(IrisDataset, self).__init__()
        # 调用第三章中的数据读取函数，其中不需要将标签转成one-hot类型
        X, y = load_data(shuffle=True)
        if mode == 'train':
            self.X, self.y = X[:num_train], y[:num_train]
        elif mode == 'dev':
            self.X, self.y = X[num_train:num_train + num_dev], y[num_train:num_train + num_dev]
        else:
            self.X, self.y = X[num_train + num_dev:], y[num_train + num_dev:]

    def __getitem__(self, idx):
        return self.X[idx], self.y[idx]

    def __len__(self):
        return len(self.y)
class MNIST_dataset(io.Dataset):
    def __init__(self, dataset, transforms, mode='train'):
        self.mode = mode
        self.transforms =transforms
        self.dataset = dataset

    def __getitem__(self, idx):
        # 获取图像和标签
        image, label = self.dataset[0][idx], self.dataset[1][idx]
        image, label = np.array(image).astype('float32'), int(label)
        image = Image.fromarray(image.astype('uint8'), mode='L')
        image = self.transforms(image)
        image = torch.squeeze(image, 0)
        image = torch.squeeze(image, 1)
        return image, label

    def __len__(self):
        return len(self.dataset[0])
# 读取标签数据集
with open('./train-labels.idx1-ubyte', 'rb') as lbpath:
    labels_magic, labels_num = struct.unpack('>II', lbpath.read(8))
    labels = np.fromfile(lbpath, dtype=np.uint8)
# 读取图片数据集
with open('./train-images.idx3-ubyte', 'rb') as imgpath:
    images_magic, images_num, rows, cols = struct.unpack('>IIII', imgpath.read(16))
    images = np.fromfile(imgpath, dtype=np.uint8).reshape(images_num, rows * cols)
train_images, train_labels = images[:1000], labels[:1000]
dev_images, dev_labels = images[1000:1200], labels[1000:1200]
test_images, test_labels = images[1200:1400], labels[1200:1400]
train_set, dev_set,test_set= [train_images, train_labels], [dev_images, dev_labels],[test_images, test_labels]
print("train_set[0].shape::",train_set[0].shape)
train_dataset = MNIST_dataset(dataset=train_set, transforms=transforms, mode='train')
test_dataset = MNIST_dataset(dataset=test_set, transforms=transforms, mode='test')
dev_dataset = MNIST_dataset(dataset=dev_set, transforms=transforms, mode='dev')
print("train_dataset:",next(iter(train_dataset))[0].shape)
batch_size = 64
train_loader = io.DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
dev_loader = io.DataLoader(dev_dataset, batch_size=batch_size)
test_loader = io.DataLoader(test_dataset, batch_size=batch_size)
print("test_loader:",next(iter(test_loader))[0].shape)
lr = 0.2
fnn_model = Model_MLP_L2_V3(input_size=784, output_size=10, hidden_size=6)
# 定义网络
model = fnn_model
# 定义优化器
optimizer = opt.SGD(model.parameters(),lr, )
# 定义损失函数。softmax+交叉熵
loss_fn = F.cross_entropy
metric = Accuracy(is_logist=True)
runner = RunnerV3(model, optimizer, loss_fn, metric)

# 启动训练
log_steps = 15
eval_steps = 15
runner.train(train_loader, dev_loader,
            num_epochs=50, log_steps=log_steps, eval_steps = eval_steps,
            save_path="best_model.pdparams")
# 加载最优模型
runner.load_model('best_model.pdparams')
# 模型评价
from nndl import Plot_training_loss_acc
Plot_training_loss_acc.plot_training_loss_acc(runner, 'cnn-loss1.pdf')
score, loss = runner.evaluate(test_loader)
print("[Test] accuracy/loss: {:.4f}/{:.4f}".format(score, loss))

结果如下：

[Train] Training done!
[Test] accuracy/loss: 0.7700/0.7905

卷积神经网络结果如下：

[Evaluate]  dev score: 0.91500, dev loss: 0.51545
[Train] Training done!

由结果可知，卷进神经网络准确率高达90%以上，而前馈神经网络只有80%左右，同时卷积神经网络的计算量要小于前馈神经网络。

所以卷积神经网络有明显的优势。

可视化LeNet中的部分特征图和卷积核，谈谈自己的看法。（选做）

原图：

第一层卷积的部分特征图：

第二层卷积的部分特征图

第一层部分卷积核

第二层卷积核：

第三次部分卷积核：

随着层数的加深，层所提取的特征变得越来越抽象，关于特定输入的信息越来越少，而关于目标的信息则越来越多，深度神经网络可以有效地作为信息整流管道(information distillation pipeline)，输入原始数据，反复对其进行变换，将无关信息过滤掉，并放大和细化有用的信息（比如与图像类别有关的信息）。

浅层特征更多的倾向于对图像边缘的检测，检测到的内容全面，同时也会有关键信息提取出来

随着层次的加深，特征图也越来抽象

越深的层次，空白区域越多，说明卷积核没有得到它们所需要的特征

你可能感兴趣的:(1024程序员节)

致每一位代码行间的梦想家发呆... 1024程序员节
每年的10月24日，程序员们迎来了一年一度的节日——1024程序员节。这一天的意义不仅在于它是数字世界中的一种象征（1024代表了计算机中的1KB），更在于它承载着每位程序员心中的梦想、汗水与激情。程序员节不仅仅属于那些穿着格子衬衫、喝着咖啡在屏幕前敲打代码的人们，更是每一个追求卓越、不断创新的奋斗者的节日。程序员的世界程序员的世界是安静而热闹的。静，是因为在敲代码的时候，更多的是与自己的对话，专
今天是我们的节日 1024 程序员节，码动未来，改变世界的神秘力量！程序员程序员节
今天是我们的节日1024程序员节，码动未来，改变世界的神秘力量！博主小程序体验|博主公众号分享在这个充满科技感的时代，有这样一群人，他们用一行行代码编织着未来的梦想，用智慧和创造力改变着世界的模样。今天，10月24日，程序员节，让我们一起走进这群神秘的“代码魔法师”的世界。程序员，他们是数字世界的建筑师。当我们在手机上轻松滑动，浏览各种信息；当我们在电脑前畅快地玩游戏、办公；当我们享受着各种便捷的
Java虚拟机：JVM介绍啊Q老师 #JVM篇 Java开发技术从零到壹 JVM概述 JVM架构
1024程序员节日快乐！愿您我的代码永远没有bug，人生永远没有bug！JVM概述JVM架构概述JVM（JavaVirtualMachine，Java虚拟机），是Java语言的运行环境，是运行所有Java程序的抽象计算机（一个虚构出来的计算机，通过在实际的计算机上仿真模拟各种计算机功能来实现）。JVM的主要功能是执行Java字节码，JVM是Java程序的中间表示形式，是Java程序从源代码到实际运
Python 打包成 EXE 的方法详解小黄编程快乐屋 1024程序员节
#1024程序员节｜征文#日常开发中，python由于其便捷性成为了很多人的首选语言，但是python的环境配置也是有点麻烦的，那么我们如何让其变得更加友好呢？没错，就是打包成exe可执行文件。一、PyInstaller简介PyInstaller是一个非常流行的Python工具，可以将Python脚本打包为独立的可执行文件。它支持Windows、macOS和Linux系统，特别适合需要跨平台打包的
1024 程序员节：探索计算机科学与技术的魅力与挑战 WD77 笔记 1024程序员节经验分享
在这个数字化飞速发展的时代，计算机科学与技术无疑是推动社会进步的核心力量之一。值此1024程序员节之际，让我们一同深入探索这个充满无限可能的专业领域。一、计算机科学与技术的魅力（一）创新的驱动力计算机科学与技术始终站在创新的前沿，不断催生新的技术和应用，改变着我们的生活方式。从智能手机的普及到人工智能的崛起，从电子商务的繁荣到区块链技术的应用，每一次的突破都离不开计算机科学与技术的支撑。它为我们提
「 2023-年度总结」2023关于三掌柜的每个值得记录的时刻
目录前言顺利转正被任命为项目经理印象深刻的实战经历：项目重大版本上线系统学习新技术的心得体会获得腾讯云开发者社区优秀作者奖想要安利给所有人的开发工具技术大会招募线下沙龙圆桌主持新书发布上市受邀直播探会接受采访组织1024程序员节活动获得1024超级个体受邀参加特训营分享NPCon大会主持人成为开源讲师参加鸿蒙生态学堂·创新实训营北京站的培训番外篇番外的番外篇我的最大收获与成长2024新年Flag彩
小学生python游戏开发pygame--初始及基础知识信息化未来助孩成长 python pygame 开发语言
#1024程序员节｜用代码，改变世界#小学生python游戏开发pygame1--基础知识前言知识点1、python知识点1.1RGB颜色表示1.2类2.3pygame.display.update()2.4加载图片2.5鼠标键盘2.6颜色2.7中文字体2.8音效总结源码获取前言Pygame是被设计用来写游戏的python模块集合，Pygame是在优秀的SDL库之上开发的功能性包。使用python
上海海事大学自动化专业C语言课程代码参考(第七周) xiao咲学习作业 1024程序员节自动化 c语言
想不到这么快就到了新的一周，写上周的作业仿佛就在两天前正好今天是1024程序员节，写C语言作业非常应景这周的作业主要是循环，话不多说，直接开始吧！目录上机实验4-1求1到100的和输入格式：输出格式：4-2求100以内偶数和输入格式：输出格式：4-3N分之一序列前N项和输入格式:输出格式:输入样例:输出样例:4-4求奇数分之一序列前N项和输入格式:输出格式:输入样例:输出样例:4-5求简单交错序列
提升自己才是王道 TigerChain
投资自己程序员节今天是1024程序员节日，在今天这个特殊的日子却蹦出一条，"缩招"新闻，也是继BATJ之后又一个事件，且不说这些事件的真伪「最后官方都出来辟谣」，通过这些事情我们能干什么，我们应该干什么才是值得我们去思考的企业难不得不承认，企业现在不好做，特别是今年，大的环境不怎么太好，小企业更是难上加难，更别提什么创业公司「成功的难可想而知，在夹缝中都不一定能生存」，现在刚刚过了招聘黄金阶段「俗
代码随想录-栈与队列|ACM模式（1024程序员节）希希雾里代码随想录感想 leetcode c++数据结构算法 1024程序员节
目录20.有效的括号题目描述：输入输出描述：思路和想法：1047.删除字符串中的所有相邻重复项题目描述：输入输出描述：思路和想法：150.逆波兰表达式求值题目描述：输入输出描述：思路和想法：239.滑动窗口最大值题目描述：输入输出描述：思路和想法：347.前K个高频元素题目描述：输入输出描述：思路和想法：20.有效的括号题目描述：给定一个只包括'('，')'，'{'，'}'，'['，']'的字符串
我的工作观 Bonnie714
看到鱼哥说今天的这篇文章，直接输入中秋节三个字就能跳过，我真的有些心动。好想就这样跳过休息一下，但是回过头一想，不可以，坚持任何一个好习惯都不是为了别人，而是自己。今天的话题是工作。提到工作，有时候我非常好奇。身边的许多人，包括我自己在内，我们总是会觉得别人的工作特别好，而是自己的工作哪都不行。刚好今天是1024程序员节日，在互联网公司上班，自然有很多程序员小哥哥，从一大早开始，总部HR就在带头给
1024程序员节｜FFmpeg 调整声道数、采样率、码率小曾同学.com 音视频 1024程序员节 FFmpeg调整采样率 FFmpeg更改声道数 FFmpeg命令大全
前言：作者简介：小曾同学.com,小伙伴们也可以叫我小曾，一个致力于测试开发的博主⛽️如果文章知识点有错误的地方，还请大家指正，让我们一起学习，一起进步。座右铭：不想当开发的测试，不是一个好测试✌️。如果感觉博主的文章还不错的话，还请点赞、收藏哦！之前给大家分享过流媒体资源归档，但是这些流媒体小编并没有对其进行再次划分，比如采样率或者声道数。因为最近有产品出现使用hev2编码方式的音视频，存在异常
大模型上下文扩展之YaRN解析：从直接外推ALiBi、位置插值、NTK-aware插值、YaRN v_JULY_v 论文代码应用大模型上下文扩展 RoPE ALiBi 位置插值 YaRN
前言下半年以来，我全力推动我司大模型项目团队的组建，我虽兼管整个项目团队，但为了并行多个项目，最终分成了三个项目组，每个项目都有一个项目负责人，分别为霍哥、阿荀、朝阳在今年Q4，我司第一项目组的第一个项目「AIGC模特生成平台」得到CSDN蒋总的大力支持，并亮相于CSDN举办的1024程序员节，一上来就吸引了很多市里领导、媒体、观众的关注，如今该平台的入口链接已在七月官网右上角而第二项目组的论文审
1024程序员节 | 美团技术团队做了这样一件小事美团技术团队
“老师，你看我跳的高不高！”“老师，我想和你玩老鹰抓小鸡”“老师，我知道，这是能送东西的无人机”……七嘴八舌的声音围绕着韩洋和仕禄两位程序员，这是他们当“幼儿园老师”的初体验。也是美团技术团队和孩子们的一个美好约定。打开方式一延续1024程序员节的专属爱心一年前的今天，美团技术团队通过捐赠技术博客稿费和讲师课酬，为美团乡村儿童操场公益计划捐赠了1,024个拼接地板，跟美团1409位爱心网友一起，帮
邮件归档与数据匹配：筛选出未按时提交邮件的员工名单邓大帅 ★工程实战 vlookup VLOOKUP函数邮件数据匹配 Excel
又是一年1024，近期由于诸多事务需要同步处理，博客更新不积极，感谢粉丝们的支持与守候，之后我将尽可能地将更多干货与心得呈现于大家，敬请期待。值此1024程序员节，想和大家探讨下日常工作中大批量数据匹配的问题。在日常工作中，对于收集邮件的任务，较为繁琐的一环就是邮件的归档和数据匹配，能否在短时间内快速筛选出未按时提交邮件的员工名单，直接影响着后续工作能否顺利开展。近期发现许多人并不知如何进行数据筛
1024程序员节，节日快乐朱光亮_19强化班
1024程序员节是广大程序员的共同节日。1024是2的十次方，二进制计数的基本计量单位之一。针对程序员经常周末加班与工作日熬夜的情况，部分互联网机构倡议每年的10月24日为1024程序员节，在这一天建议程序员拒绝加班。程序员就像是一个个1024，以最低调、踏实、核心的功能模块搭建起这个科技世界。1G=1024M，而1G与1级谐音，也有一级棒的意思。节日背景：程序员（英文Programmer）是从事
祝各位程序员节日快乐数据分析不是个事儿社畜生活生活
今天是1024程序员节，小编祝各位Windows开机蓝屏，Linux开机KernelPanic，macos开机五国，服务器iDRAC/iLO/IPMI/KVM全部失联，路由器全爆炸，路由表内存全溢出，交换机全环路，防火墙全阻断，无线信道全冲突，压接网线全短路，bgp全漏表，机柜全断电，raid全爆炸，nas数据全丢，光模块全炸，光纤全不通，光猫全烫手，电表全倒转，空开全烧穿。PHP全FatalEr
1024 Z_sam 杂
1024纪念一下1024程序员节是中国程序员的共同节日。1024是2的十次方，二进制计数的基本计量单位之一。程序员(英文Programmer)是从事程序开发、维护的专业人员。程序员就像是一个个1024，以最低调、踏实、核心的功能模块搭建起这个科技世界。1G=1024M，而1G与1级谐音，也有一级棒的意思。
1024程序员节竟然和他有关？我只会写Bug啊杂谈 1024程序员节
目录介绍节日背景节日由来介绍1024程序员节（1024Programmer’sDay）是广大程序员的共同节日。1024是2的十次方，二进制计数的基本计量单位之一。针对程序员经常周末加班与工作日熬夜的情况，部分互联网机构倡议每年的10月24日为1024程序员节，在这一天建议程序员拒绝加班。程序员就像是一个个1024，以最低调、踏实、核心的功能模块搭建起这个科技世界。1G=1024M，而1G与1级谐音
【趣味Javascript】前端开发中不为人知的LHS和RHS查询,你真的弄明白了吗? 《1024程序员节特别篇》极客小俊【趣味Javascript】1024程序员节前端开发 LHS和RHS查询 javascript 编程知识分享作用域链函数
个人主页极客小俊✍作者简介：web开发者、设计师、技术分享博主希望大家多多支持一下,我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注前言今天是1024先祝大家节日快乐，那么今天我就给大家讲一个js小知识,也就是LHS和RHS可能还有很多朋友不知道LHS和RHS是个啥玩意!那么在我们讲解LHS和RHS之前我们先来回忆一下最简单的赋值操作!vartest=100;console.log(t
1024程序员节日：庆祝创新与编码的盛宴爱笑的男孩。活动 1024程序员节
作者主页：爱笑的男孩。的博客_CSDN博客-深度学习,活动,python领域博主爱笑的男孩。擅长深度学习,活动,python,等方面的知识,爱笑的男孩。关注算法,python,计算机视觉,图像处理,深度学习,pytorch,神经网络,opencv领域.https://blog.csdn.net/Code_and516?type=blog个人简介：打工人。持续分享：机器学习、深度学习、python相
1024程序员节快乐李格式
今天是1024程序员节，致敬互联网时代最可爱的人。他们改变了我们出行、购物、支付等方式，他们改变了这个世界。对于一个屌丝来讲，什么职业能令人获得崇高的敬意？只有程序员吧。程序员是一群单纯的人，他们只管将精力用到技术上，精益求精就好。见过很多程序员，问他们为什么选择这个职业。他们说：“自己没什么背景，也不会搞什么关系，又不会销售，在家乡可能就是最底层的人，能吃饱饭就不错了。但做程序员就不一样了，只要
我的编程之旅：热爱代码，燃烧激情琴剑飘零西复东程序人生业界资讯学习方法创业创新改行学it
正好适逢1024程序员节，我想通过这篇博客文章，表达对编程的热爱，同时也鼓励更多的人踏上这条充满无限可能的道路。我还记得第一次接触编程的时刻，那是在大学的一堂计算机科学课上。当我第一次看到一个简单的“Hello,World！”程序在屏幕上显示出来时，我被深深吸引住了。那时的我对编程一无所知，但我立刻明白，这就是我要追求的事业。我的编程之旅并不是一帆风顺的。起初，我常常遇到困难，感觉陷入了无尽的Bu
基于敏捷开发的低代码平台建设万应低代码低代码万应低代码云畅科技低代码敏捷开发软件构建
10月24日，由湖南省工业和信息化厅、湖南湘江新区管委会指导，长沙市工业和信息化局、长沙信息产业园管委会、CSDN主办，湖南省软件行业协会、国家超级计算长沙中心承办的2023长沙·中国1024程序员节——湖南“智赋万企”软件产业高质量发展论坛在长沙举办。云畅科技CTO胡艳平受邀出席并发表以《基于敏捷开发的低代码平台建设》为主题的演讲，深入浅出地分享了如何通过敏捷开发和低代码平台的建设，实现软件产业
Vue3 开发实战分享——打印插件 Print.js 的使用（Vue3 + Nodejs + Print.js 实战）以及 el-table 与 el-pagination 的深入使用（下）黛琳ghz 前端 #Vue #Element javascript vue.js 前端 1024程序员节
文章目录关于CSDN1024前情回顾&前言关于el-table项目中延申使用1️⃣获取每行对应的内容数据2️⃣行内数据判断处理（过滤）3️⃣对表格内容的索引关于el-pagination项目中延申使用1️⃣显示总条数与分页展示2️⃣跳转页和页码样式3️⃣设置为中文最后关于CSDN1024在进入文章的正文之前，我们先一起了解一下关于CSDN今年的1024程序员节。与此同时这也是我在CSDN参与的第二
为什么说10.24是程序员的节日词不达意难知 1024程序员节
“10.24”被称为程序员的节日，是因为在中国的程序员社区中，这个日期被视为一个特殊的日子，用来庆祝和纪念程序员的工作和贡献。这个日期的由来可以追溯到中国的IT技术社区“1024程序员节”，该社区于2010年创立，旨在为程序员们提供一个交流和学习的平台。每年的10月24日，这个社区会组织一系列的线上和线下活动，包括技术分享、讲座、比赛等，以庆祝程序员的职业和技术成就。“10.24程序员节”的设立是
极狐GitLab 致敬中国 1000万程序员极小狐 1024程序员节
又到了一年的10月24日，这个只有特定人群才能懂的节日——1024程序员节。截止到目前，中国已经有1000万程序员，这个庞大的群体改变了中国数字化的进程。在这个特殊的节日里，极狐GitLab特地制作了一个视频，向中国1000万程序员致敬。极狐GitLab致敬中国1000万程序员关于极狐(GitLab)极狐(GitLab)以“核心开放”为原则，面向中国市场，提供开箱即用的开放式一体化安全DevOps
【OpenGL学习笔记⑦】——键盘控制镜头的平移【3D正方体透视投影观察矩阵对LookAt的理解】一支王同学 OpenGL学习笔记 opengl 3d渲染 1024程序员节
1024程序员节文章目录零、成果预览图一、透视矩阵（透视投影）二、观察矩阵（摄像机）1.1摄影机的位置1.2摄影机的朝向向量1.3摄影机的正视向量1.4摄影机世界的Z、X、Y轴向量1.5LookAt矩阵三、键盘互动（让摄影机随键盘移动）3.1前后左右上下移动的实现3.2在顶点着色器里的处理四、Camera类五、完整代码六、参考附录：移动的镜头上一篇文章链接:【OpenGL学习笔记⑥】——3D变换【
【人物志】美团首席科学家夏华夏：不断突破边界的程序人生美团技术团队人物夏华夏无人配送美团
“成长没有什么秘笈，就是坚持不断地一点点突破自己的边界就好。”这是美团首席科学家、无人配送部总经理夏华夏在刚刚过去的“1024程序员节”时送给技术同行的一句话。这也是夏华夏自己的人生写照：从没摸过计算机的山东高考状元到清华计算机系的学霸，从美国名校深造、Google修炼6年到选择回国，从加入当时还很小的美团到负责公司最大业务的总体架构，从架构师转为无人配送这个前沿业务部门的管理者，夏华夏就是在不断
亚马逊云科技发布完整端到端 AI 技术堆栈，力促生成式 AI 更加普惠 CSDN云计算 AI 云计算 AIGC 生成式AI AI 亚马逊云科技 CodeWhisperer
AI大模型已经深入各行业的场景应用，作为云技术巨头的亚马逊云科技在今年也发布了多个生成式AI相关的技术与服务。在今年7月亚马逊云科技中国峰会上，亚马逊云科技也表示正在与全球超过12万的合作伙伴一同转型、构建AIGC生态。2023年的10月24日，也是CSDN1024程序员节的当天，亚马逊云科技举办了生成式AI构建者大会，这次的技术大会聚焦于生成式AI领域，分享了其完整的端到端生成式AI技术堆栈，可
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交

NNDL 实验六 卷积神经网络（3）LeNet实现MNIST

5.3 基于LeNet实现手写体数字识别实验

5.3.1 数据

5.3.2 模型构建

5.3.3 模型训练

5.3.4 模型评价

5.3.5 模型预测

使用前馈神经网络实现MNIST识别，与LeNet效果对比。（选做）

可视化LeNet中的部分特征图和卷积核，谈谈自己的看法。（选做）

你可能感兴趣的:(1024程序员节)

NNDL 实验六卷积神经网络（3）LeNet实现MNIST