Red Ross

pytorch-MNIST手写数字识别与特征图可视化

1、MNIST数据集
2、代码
- 2.2 函数参数
- 2.3 数据加载与transform
- 2.4 训练
- 2.5 测试
3. 训练结果可视化
- 3.1 多模型准确率汇总
4. 特征图可视化
- 4.1 原图
- 4.2 卷积后的特征图
- 4.3 激活函数ReLu后的特征图
- 4.4 最大池化后的特征图
- 4.4 最后的特征图
- 4.5 输出

1、MNIST数据集

似乎所有程序员在学习一个新的程序语言时，都想要打印输出一个“hello world”，它代表了你入门了这门语言。那么，MNIST手写数字识别便是入门机器学习和深度学习的“hello world”。跑通MNIST程序便能大致了解机器学习的流程，包括数据的读取、转换（totensor）、归一化、神经网络模型设计、超参数设计、训练、前向传播、后向传播等等。在入门机器学习之前先自己跑通一遍MNIST识别程序具有非凡的意义。

MNIST（Mixed National Institute of Standards and Technologydatabase）是一个手写数字的大型数据库，拥有60,000个示例的训练集和10,000个示例的测试集。更详细的介绍可以查看 Yann LeCun的MNIST数据集官网。

2、代码

本程序来自pytorch官方提供的MNIST示例代码，链接：
https://github.com/pytorch/examples/blob/master/mnist/main.py
在经过修改并添加训练结果可视化和特征图可视化等功能，github链接在本文最下方。

下面讲解train.py中的代码：

from __future__ import print_function
import argparse
import os
import numpy as np

import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torchvision import datasets, transforms
from torch.optim.lr_scheduler import StepLR
from pathlib import Path
import time

# import network
from model.network.LeNet import LeNet
from model.network.MyNetV1 import MyNetV1
from model.network.MyNetV2 import MyNetV2
from model.network.DefaultNet import DefaultNet
from model.network.LeNet5 import LeNet5
from model.network.MyFullConvNet import MyFullConvNet
from model.network.MyVggNet import MyVggNet

导入训练网络需要的模块，其中值得注意的是：
• argparse模块，该模块允许你在运行.py文件时可以附带参数，如：python train.py --model lenet
• torch基本模块，即pytorch基本的库
• matplotlib模块，用于绘制loss曲线和acc曲线图，也用于显示模型中各层特征图即特征图可视化

2.2 函数参数

通过argparse模块，可以在运行文件时添加运行所需要的参数。这些参数可以用于设置网络模型的超参数，如学习率、batch-size、epochs、训练模型等等。下面贴出代码：

# Training settings
    parser = argparse.ArgumentParser(description="Pytorch MNIST Example")
    parser.add_argument("--batch-size", type=int, default=64, metavar="N",
                        help="input batch size for training (default : 64)")
    parser.add_argument("--test-batch-size", type=int, default=1000, metavar="N",
                        help="input batch size for testing (default : 1000)")
    parser.add_argument("--epochs", type=int, default=64, metavar="N",
                        help="number of epochs to train (default : 64)")
    parser.add_argument("--learning-rate", type=float, default=0.1, metavar="LR",
                        help="number of epochs to train (default : 14)")
    parser.add_argument("--gamma", type=float, default=0.5, metavar="M",
                        help="Learning rate step gamma (default : 0.5)")
    parser.add_argument("--no-cuda", action="store_true", default=True,
                        help="disables CUDA training")
    parser.add_argument("--dry-run", action="store_true", default=False,
                        help="quickly check a single pass")
    parser.add_argument("--seed", type=int, default=1, metavar="S",
                        help="random seed (default : 1)")
    parser.add_argument("--log-interval", type=int, default=10, metavar="N",
                        help="how many batches to wait before logging training status")
    parser.add_argument("--save-model", action = "store_true", default=True,
                        help="For saving the current Model")
    parser.add_argument("--load_state_dict", type=str, default="no",
                        help="load the trained model weights or not (default: no)")
    parser.add_argument("--model", type=str, default="LeNet",
                        help="choose the model to train (default: LeNet)")
    args = parser.parse_args()

值得注意的是：

batch-size：批训练大小，单次训练用的样本数。通常以2^n为大小。如果batch-size过小，就好像你每次数钱只数一张（而不是好几张一起数），训练数据效率就低下，且收敛困难；如果batch-size过大，虽然相对处理速度加快，但是所需要的内容容量增加，可能会出现 CPU/GPU 内存容量不足等情况，所以需要根据图片具体大小、模型复杂度和计算机性能之间权衡batch-size的大小
epochs：一个epoch表示所有的数据送入网络中完成一次前向传播和后向传播的过程
leaning-rate：学习率
load_state_dict：继续模型训练/重新开始训练。假设上次的训练效果不理想，你想在上次的基础上继续训练，就可以添加这个选项，训练前加载之前生成的权重文件
gamma：调整学习率中所用的参数，调整方法为StepLR

其他参数大概就是字面意思。要注意必须有args = parse.parse_args()这一句，意思是把爬取到的参数信息赋值到变量args上，后续便可以通过args得到参数值，比如args.model， args.learning_rate。

2.3 数据加载与transform

以下代码是程序加载数据和对数据进行转化（ToTensor）的代码：

 	train_kwargs = {
     "batch_size": args.batch_size}
    test_kwargs = {
     "batch_size": args.test_batch_size}
    if use_cuda:
        cuda_kwargs = {
     "num_workers": 1, "pin_memory": True, "shuffle": True}
        train_kwargs.update(cuda_kwargs)
        test_kwargs.update(cuda_kwargs)

    transform = transforms.Compose([
        transforms.ToTensor(),
        # normalize(mean, std, inplace=False) mean各通道的均值， std各通道的标准差， inplace是否原地操作
        # 这里说的均值是数据里的均值
        # output = (input - mean) / std
        # 归一化到-1 ~ 1，也不一定，但是属于标准化
        transforms.Normalize((0.1307, ), (0.3081, ))
    ])
    dataset1 = datasets.MNIST("./data", train=True, download=True,
                            transform=transform)
    dataset2 = datasets.MNIST("./data", train=False,
                            transform=transform)
    train_loader = torch.utils.data.DataLoader(dataset1, **train_kwargs)
    test_loader = torch.utils.data.DataLoader(dataset2, **test_kwargs)

num_workers是多进程的加载数，pin_memory是是否将数据保存在pin memory区，pin memory中的数据转到CPU会比较快。另外几个值得注意的点是：

加载数据集

train=True即加载训练集，false即加载训练集
download即是否下载数据集，如果数据集不存在，则代码会自动下载数据集到指定路径中；若存在，则略过
shuffle是打乱顺序

数据转换与归一化

数据原本是二进制文件，通过transform将其转换成可训练的tensor张量
因为数据集都是一通道的黑白图片，像素值为0-255，为了方便计算，需要将其归一化，这样做可以让收敛更快。其中mean是数据里的均值，std是各通道的标准差

2.4 训练

graph_loss = []
graph_acc = []

def train(args, model, device, train_loader, optimizer, epoch):
    # 这里的train和上面的train不是一个train
    model.train()
    start_time = time.time()
    tmp_time = start_time
    for batch_idx, (data, target) in enumerate(train_loader):
        data, target = data.to(device), target.to(device)
        optimizer.zero_grad()
        output = model(data)
        loss = F.nll_loss(output, target)
        loss.backward()
        optimizer.step()
        if batch_idx % args.log_interval == 0:
            print("Train Epoch: {} [{}/{} ({:.0f}%)]\t Loss: {:.6f}\t Cost time: {:.6f}s".format(
                epoch, batch_idx * len(data), len(train_loader.dataset),
                100. * batch_idx / len(train_loader), loss.item(), time.time() - tmp_time
            ))
            tmp_time = time.time()
            graph_loss.append(loss.item())
            if args.dry_run:
                break
    end_time = time.time()
    print("Epoch {} cost {} s".format(epoch, end_time - start_time))

定义全局变量graph_loss和 graph_acc分别记录训练过程中的准确率和损失，最后写入.txt文件中，方便后续查看和数据可视化。简单的说一下训练的流程：

从dataloader中获取数据集的数据和与之对应的标签，即data，target，并放到device中（CPU/GPU）
初始化optimizer的梯度为0
数据送入模型处理
根据输出和实际标签计算loss值。这里采用的损失函数是nll_loss，也是一种交叉熵损失函数。它和CrossEntropyLoss的区别是，nll_loss没有包含softmax这一步，所以它适合模型结尾带有softmax的网络
根据损失值进行后向传播
后向传播的工具是优化器，优化器开始后向传播
每隔一个log_interval输出当前的训练结果，比如损失值、当前epoch完成百分比和时间
仔细的理解训练过程的每一步，便知道机器学习的原理大概是怎么样的

2.5 测试

测试训练结果在代码在test_model.py里，测试内容是测试集的前1000张图片（这个数字可以在argparse里面修改）。输入：

python test_model.py --model lenet

便得到测试结果：

3. 训练结果可视化

在训练的过程中，我将训练的结果存放在graph_loss和graph_acc里，并且在训练结束之后，将两个列表中的数据存储到.txt文件当中。现在，便可以从.txt文件中读取训练结果并显示出来。用于画图的工具是matplotlib，而相关的代码文件是draw_graph.py，以下为代码：

import matplotlib
import os
import numpy as np
from matplotlib import pyplot as plt
import argparse
import sys

parser = argparse.ArgumentParser()
parser.add_argument("--model", type=str, default="lenet")
args = parser.parse_args()

#file_loss_path = "E:/WorkSpace/Pytorch/mnist/model/result/{}_loss.txt".format(args.model)
file_loss_path = sys.path[0] + "/model/result/{}_loss.txt".format(args.model)

lst_loss = list()
with open(file_loss_path) as file_object:
    for line in file_object:
        if "e" in line:
            lst_loss.append(eval(line))
        else:
            lst_loss.append(float(line[:-2]))
    file_object.close()

#file_acc_path = "E:/WorkSpace/Pytorch/mnist/model/result/{}_acc.txt".format(args.model)
file_acc_path = sys.path[0] +  "/model/result/{}_acc.txt".format(args.model)
lst_acc = list()
with open(file_acc_path) as file_object:
    for line in file_object:
        if "e" in line:
            lst_acc.append(eval(line))
        else:
            lst_acc.append(float(line[:-2]))
    file_object.close()
print(lst_acc)

plt.title("{} loss".format(args.model))
plt.plot(lst_loss)
plt.xlim(0 - len(lst_loss) / 20, len(lst_loss))
plt.ylim(0, 1.5)
plt.grid()
plt.savefig(file_loss_path[:-3] + "jpg")

plt.title("{} acc".format(args.model))
plt.plot(lst_acc)
plt.xlim(0 - len(lst_acc) / 20, len(lst_acc))
plt.ylim(min(lst_acc) - 1, max(max(lst_acc) + 1, 100))
plt.savefig(file_acc_path[:-3] + "jpg")

通过matplotlib，读取.txt文件中的数据，将其以图表的形式显示并且保存下来，以下为效果：
64个epcoh的训练准确率：

训练过程中的损失：

3.1 多模型准确率汇总

在学习本程序的过程中，我也在学习一些经典网络，比如LeNet, AlexNet, VggNet等，所以尝试着自己搭建网络并将经典网络中的优点融入其中，以下为不同网络准确率：

LeNet，最经典的网络，包含了基本的卷积神经网络结构。可见由于其网络结构过于简单，其准确率有较大的抖动，但是有不错的准确率
MyFullConvNet，运用了更多的卷积层，并且用卷积层代替第一个全连接层，效果比LeNet要好
MyNetV1，这也是我自己设计的网络结构，其中的设计思想是：① 尽可能的使用小卷积核，参数量更少； ② 使用stride = 2的卷积核来代替池化层，这样虽然参数量有所增加，但是弥补了池化层会过滤掉过多信息的缺点； ③ 使用dropout技术，使网络降低过拟合。
MyNetV2，本来是想用卷积层代替更多的其他层，于是用了输出通道数比输出通道数小的卷积层，但结果并不理想，甚至比LeNet准确率还要低
MyVggNet，参考了VggNet的特性修改的网络，用多个小卷积层的堆叠替代大卷积层，这样做的优势是感受野不变，但是增加了更多非线性的因素（因为每一层卷积后都跟一个relu激活函数）。事实证明，更深的网络的确能带来更好的效果，并且观察训练结果可以发现，更深的网络更加稳定，不易抖动。

4. 特征图可视化

光是看代码，是难以理解卷积神经网络是如何识别数字的。所以不如将卷积神经网络中每一层输出的特征图显示出来，便能知道在卷积神经网络这个黑盒子里，到底发生了什么。
实现特征图可视化的基本思想是：卷积神经网络处理的数据类型是tensor（张量），张量是无法用于显示图片的，所以需要将其转换成可以显示为图片的数据类型，比如numpy。再通过matplotlib，将其显示出来。

具体实现通过我定义的函数show_graph()实现，定义在了./model/network/LeNet.py中，你可以去掉相应的注释来显示特征图或者保存特征图。

具体代码请到我的github上查看，链接在本文的最下方。

4.1 原图

下图是测试集中一个手写数字“8”的图片：

通过观察图片和观察具体tensor的输出可以发现，MNIST数据集存放的是一通道的黑白图片，其中的像素值是0~255，其特征较为简单。

4.2 卷积后的特征图

下图是经过一次卷积之后的特征图：

为什么会有6张呢，因为第一层的卷积层输出通道数是6，所以会生成6张不同的特征图。虽然看着感觉六个特征图差别不大，那是因为数据集过于简单，如果是复杂一些的图片，便能看到其不同。图片经过卷积之后，图像像素从28 * 28变成了26 * 26。现在用肉眼还能勉强看出来是个数字8。

4.3 激活函数ReLu后的特征图

下面显示卷积->ReLu激活函数后的图像：

这一层的输出同样是6张，但是由于篇幅就不全部贴出来了。看了图像之后马上就能理解，ReLu激活函数干了什么。通俗的讲：将黑的地方变得更黑，白的地方保持不变。ReLu的表达式：
使小于0的数字等于0，大于0的数字则保持不变。（因为训练过程中，图像数据都是经过归一化处理的，使得像素值的范围为-1~1）。

4.4 最大池化后的特征图

下面显示卷积->ReLu激活函数->最大池化层的图像：

显而易见，图像经过最大池化层之后，像素缩小了一半，这也正是池化层（下采样）的作用：缩小图像尺寸。能减少网络的计算量，也能在一定程度上缓解过拟合的问题。但这只是一定程度上，并且池化层可能会过滤掉很多有用的特征。
值得注意的是，本程序用的池化层都是最大池化max_pooling，所以可以发现，相比较前一层的特征图，整体图片的亮度变得更亮了，因为最大池化是选择区域中值最大的值进行保留。

4.4 最后的特征图

下图显示的是多次卷积和激活函数和最大池化后的图片：

可以看到，经过多次卷积、激活函数和池化层之后，图像已经“面目全非”，肉眼已经完全分辨不出图片原本代表着什么数字。但是对于神经网络来说，图片永远只是一堆数字，这张图片也是神经网络计算出来的数字特征。在经过这一步之后，通过将图片展平即变为一维向量x = x.view(x.size(0), -1)。由于是最后一层是4 * 4 * 16的输出，所以展平后就得到了长度为4 * 4 * 16 = 256的一维向量。再通过全连接层，可将一维向量变为长度为10的输出（0-9共10类）。

4.5 输出

因为进入全连接层之后，tensor已经变为了一维向量，无法以图片的形式显示，所以只能输出看具体的数字。以下为LeNet全连接层的代码：

self.fc1 = nn.Linear(16 * 4 * 4, 120)
self.fc2 = nn.Linear(120, 84)
self.fc3 = nn.Linear(84, 10)

并且输出全连接层各个位置的张量大小以及最后一层的输出：

x = x.view(x.size(0), -1)
print(x[0].size())
x = self.fc1(x)
print(x[0].size())
x = F.relu(x)
x = self.fc2(x)
print(x[0].size())
x = F.relu(x)
x = self.fc3(x)
print(x[0])

输出结果如下：

可以看到，展平后的张量长度的确为256，经过一层全连接层之后长度变为120，然后是84，最后输出最后一层的张量。可以看到，张量每个元素的值代表着该类的概率，由于该图片识别为8，所以在index为8的地方值最大，最后得出该手写体为数字“8”的结论。softmax也是根据张量计算出最后的预测值。

完整程序放在了我的github上，觉得有帮助的话，点个star☆吧~
如果有大佬路过的话，请多多指教~~
链接：https://github.com/cssdcc1997/pytorch-mnist

Java 大视界 -- Java 大数据机器学习模型在金融市场情绪分析与投资策略制定中的应用青云交大数据新视界 Java 大视界 java 大数据机器学习情绪分析智能投资多源数据
Java大视界--Java大数据机器学习模型在金融市场情绪分析与投资策略制定中的应用）引言：正文：一、金融情绪数据的立体化采集与治理1.1多模态数据采集架构1.2数据治理与特征工程二、Java机器学习模型的工程化实践2.1情感分析模型的深度优化2.2强化学习驱动的动态投资策略三、顶级机构实战：Java系统的金融炼金术四、技术前沿：Java与金融科技的未来融合4.1量子机器学习集成4.2联邦学习在合
生成式人工智能实战 | 像素卷积神经网络（PixelCNN）盼小辉丶生成式人工智能实战150讲深度学习生成模型 aigc
生成式人工智能实战|像素卷积神经网络0.前言1.PixelCNN工作原理1.1掩码卷积层1.2残差块2.PixelCNN分析3.使用混合分布改进PixelCNN3.1模型构建3.2模型训练0.前言像素卷积神经网络(PixelConvolutionalNeuralNetwork,PixelCNN)是于2016年提出的一种图像生成模型，其根据前面的像素预测下一个像素的概率来逐像素地生成图像，模型可以通
Python爬虫【二十四章】分布式爬虫架构实战：Scrapy-Redis亿级数据抓取方案设计程序员_CLUB Python入门到进阶 python 爬虫分布式
目录一、背景：单机爬虫的五大瓶颈二、Scrapy-Redis架构深度解析1.架构拓扑图2.核心组件对比三、环境搭建与核心配置1.基础环境部署2.Scrapy项目配置四、分布式爬虫核心实现1.改造原生Spider2.布隆过滤器集成五、五大性能优化策略1.动态优先级调整2.智能限速策略3.连接池优化4.数据分片存储5.心跳监控系统六、实战：新闻聚合平台数据抓取1.集群架构2.性能指标七、总结1.核心收
Python 代码库之如何获取数据array最后一个元素（含demo源码） iCloudEnd
Python代码库之如何获取数据array最后一个元素（含demo源码）源码>>>some_list=[1,2,3]>>>some_list[-1]=3#Setthelastelement>>>some_list[-2]=2#Setthesecondtolastelement>>>some_list[1,2,3]更多精彩代码请关注我的专栏reportlab教程和源码大全python源码大全Sqli
Python,Rust开发关停大脑APP Geeker-2025 python rust
要关停名为“大脑”的APP，具体实现方式取决于APP的运行环境和架构。以下是针对不同场景的Python和Rust解决方案：---###**场景1：终止本地进程（适合桌面/服务端应用）**####Python方案（使用`psutil`库）```pythonimportpsutildefstop_brain_app():target_name="brain_app"#替换为实际进程名forprocin
Python,Java,C++开发磁悬浮原理与技术实操APP Geeker-2025 python java c++
#磁悬浮原理与技术实操APP技术方案基于Python、Java和C++开发的磁悬浮原理学习与应用APP，结合理论教学与实操模拟：##系统架构设计```mermaidgraphTDA[跨平台客户端-C++/Qt]-->|API调用|B[后端服务-Java/Spring]B-->C[磁悬浮模拟引擎-Python]B-->D[硬件控制接口]C-->E[物理模型计算]D-->F[磁悬浮套件]A-->G[3
Python,C++开发电学/动力学与发明创造APP
#电学/动力学与发明创造APP-Python与C++集成解决方案##系统架构设计```mermaidgraphTDA[用户界面-Qt/PyQt]-->B[应用逻辑层-Python]B-->C[核心引擎-C++]C-->D[硬件接口]C-->E[物理引擎]B-->F[3D可视化]F-->G[OpenGL/Vulkan]```##技术栈分工|组件|技术|功能||------|------|------
Python,Go开发光电效应与日常应用APP Geeker-2025 python golang
以下是一个基于Python与Go开发的光电效应科普与应用APP的完整技术方案，结合了物理原理模拟、实时数据处理及生活场景应用，参考了工业级开发实践（如光电实验数据处理和能源设备控制）：---###一、系统架构设计```mermaidgraphLRA[Go微服务层]-->B[Python科学计算层]A-->C[数据库/物联网]B-->D[硬件接口]D-->E[传感器/实验设备]subgraph前端A
Python,Go are applicated to develop the app “Star travel and your preparation”
为了开发“星际旅行准备”应用（**StarTravelandYourPreparation**），结合**Python**和**Go**的技术优势，可设计如下分层架构，融合深空导航、生命维持系统（LSS）优化与跨星域资源管理功能：---###**1.核心架构设计**####**(1)星际导航引擎（Go）**-**角色**：实时多维空间路径规划与异常规避-**实现**：-**曲速走廊计算**：基于A
Python SSTI漏洞原理与基础利用以及Fenjing的使用教程 cba尼里托圣 python 网络 web安全
文章目录一、Python类与对象模型基础二、魔术方法的作用与利用价值1.__class__魔术方法2.__bases__与__mro__魔术方法3.__subclasses__()魔术方法4.__init__魔术方法5.__globals__魔术方法三、魔术方法链的构建与利用1.漏洞验证2.获取类对象3.定位到object基类4.遍历object的子类5.定位危险类6.获取全局变量空间7.执行命令
分布式爬虫：设计一个分布式爬虫架构来抓取大规模数据 Python爬虫项目 2025年爬虫实战项目分布式爬虫架构开发语言 redis 测试工具 python
✨引言随着互联网信息的爆炸式增长，单机爬虫面对大规模网站数据抓取显得力不从心。特别是爬取新闻、商品、社交平台等网站时，经常遇到响应慢、IP被封等问题。为了解决这些问题，分布式爬虫系统应运而生。在本文中，我们将手把手带你打造一个基于Scrapy+Redis+Celery+FastAPI+Docker的现代分布式爬虫架构，实现任务调度、去重控制、分布式抓取与结果存储。本文代码均基于Python3.10
Python医疗大数据实战：基于Scrapy-Redis的医院评价数据分布式爬虫设计与实现 Python爬虫项目 python 开发语言爬虫 selenium scrapy
摘要本文将详细介绍如何使用Python构建一个高效的医院评价数据爬虫系统。我们将从爬虫基础讲起，逐步深入到分布式爬虫架构设计，使用Scrapy框架结合Redis实现分布式爬取，并采用最新的反反爬技术确保数据采集的稳定性。文章包含完整的代码实现、性能优化方案以及数据处理方法，帮助读者掌握医疗大数据采集的核心技术。关键词：Python爬虫、Scrapy-Redis、分布式爬虫、医疗大数据、反反爬技术1
Python,C++开发磁流体研究以及应用APP Geeker-2025 python c++
#Python与C++开发磁流体研究与应用APP方案以下是一个结合Python与C++的磁流体(MHD)研究与应用APP的完整技术方案，融合了高性能计算、实时仿真和工业应用场景：##系统架构设计```mermaidgraphTDA[用户界面层]-->B[Python应用层]B-->C[C++核心计算层]C-->D[硬件接口层]D-->E[实验设备/传感器]subgraph前端A1[桌面端-PyQt
【Python】socket 宅男很神经 python 开发语言
第一章：网络通信基石——深入理解OSI与TCP/IP模型在深入探究Pythonsocket模块之前，我们必须首先建立对网络通信底层原理的深刻理解。socket作为操作系统提供的低级网络接口，其行为和功能直接映射着网络协议栈的各个层次。因此，对OSI（开放系统互连）模型和TCP/IP模型的透彻分析，是理解socket操作精髓的先决条件。1.1网络通信的起源与核心概念网络通信的本质是数据在不同物理位置
安装python后如何安装numpy_如何简单安装NumPy与SciPy
2015-12-27回答numpy是一个定义了数值数组和矩阵类型和它们的基本运算的语言扩展。scipy是一种使用numpy来做高等数学、信号处理、优化、统计和许多其它科学任务的语言扩展。学习这两个工具的话，官方有很详细的文档和教程来帮助入门：我是传送门另外，还有一本书《numpyandscipy》，很薄，才67页：我是传送门如何安装numpy和scipy之所以写这篇文章主要是因为scipy官网貌似
【机器学习【9】】评估算法：数据集划分与算法泛化能力评估 roman_日积跬步-终至千里 #机器学习机器学习
文章目录一、数据集划分：训练集与评估集二、K折交叉验证：提升评估可靠性1.基本原理1.1.K折交叉验证基本原理1.2.逻辑回归算法与L22.基于K折交叉验证L2算法三、弃一交叉验证（Leave-One-Out）1、基本原理2、代码实现四、ShuffleSplit交叉验证1、基本原理2、为什么能降低方差3、代码测试五、选择建议在机器学习中，评估算法的核心目标是衡量模型在“未知数据”上的表现，而不是仅
Python 中 sys 库的全面解析与实战应用二向箔reverse 服务器 python
在Python的众多标准库中，sys库占据着举足轻重的地位。它与Python解释器紧密交互，为开发者提供了访问解释器内部信息和控制解释器行为的强大能力。无论是命令行参数处理、系统环境配置，还是程序退出控制，sys库都能大显身手。本文将带您深入探索sys库的常用功能，通过丰富的实例讲解，助您轻松掌握其使用技巧。sys库的基础认知sys库是Python的内置标准库，无需额外安装，只需通过imports
python环境安装jupyter 爱分享的胖头鱼 02.Python(基础知识)jupyter ide python python虚拟环境
安装完毕之后下一步可以参考：配置jupyter的启动路径-CSDN博客1前提条件：python环境系统：win10python：本地已经有python，可以查看本地的python版本：C:\Users\PC>python--versionPython3.8.102安装jupyter并启动安装jupyterC:\Users\PC>pipinstalljupyternotebookCollecting
python爬虫之获取渲染代码
获取渲染后的网页代码过get()方法获取浏览器中的网页资源后,浏览器将自动渲染网页源代码内容，并生成渲染后的的时使用page_source()方法即可获取渲染后的网页代码。示例代码:'''获取渲染后的网页代码'''fromseleniumimportwebdriverfromselenium.webdriver.chrome.optionsimportOptionschrome_options=O
学习笔记(66):Python入门教程-datetime模块时间运算顾子宇研发管理 python 编程语言 Python 小猿圈 Python入门教程
立即学习:https://edu.csdn.net/course/play/24459/296363?utm_source=blogtoedudatetime模块：datetime.date：表示日期的类，常用属性有year，month，daydatetime.time：表示时间的类，常用的属性有hour,minute,second,microseconddatetime.datetime：表示日
掌握reStructuredText：编写与格式化文档的技巧
本文还有配套的精品资源，点击获取简介：reStructuredText（rST）是一种轻量级文本标记语言，广泛用于Python社区的文档编写，特别是借助Sphinx文档生成器。本文介绍了rST的基础语法和高级特性，包括段落、标题、强调、代码、列表、引用、链接、图像、表格、章节组织、自定义角色和指令、包含和排除文件以及源代码高亮。同时，探讨了Sphinx与rST结合使用的高级功能，包括扩展、配置和构
[Python] -项目实战5- Python 实现简易学生成绩管理系统踏雪无痕老爷子 Python python 开发语言
一、为什么做这个项目？学习OOP和GUI基础：通过类与对象封装学生信息，熟悉Tkinter构建窗口、表格、按钮等。实用性强：可添加、查询、删除、修改学生记录，是常见管理系统的基本功能。扩展性好：后续可以接入数据库、图表展示、权限控制等功能。二、核心技术与工具tkinter：Python内置的桌面GUI库，用于构建窗口界面、表单和按钮。sqlite3：轻量级关系数据库，适合小型持久化存储，无需部署服
[Python] -项目实战类3- 用Python制作一个记事本应用踏雪无痕老爷子 Python 开发语言 python
一、为什么要自己写记事本？提升GUI编程能力：通过构建窗口、菜单、文本区等组件，理解基本控件的使用。实用工具：自定义功能、更轻量、更符合个人使用习惯。实验与扩展空间大：方便加入特色功能，如自动保存、代码高亮、插件等。二、准备工作✅安装Python（建议Python 3.7+）。无需安装第三方库，tkinter是Python标准库的一部分。用于构建UI界面。sudoaptinstallpython3
[Python] -项目实战4- 利用Python进行Excel批量处理踏雪无痕老爷子 Python python excel 开发语言
一、为什么要批量处理Excel文件？节省时间：人工对数十、数百个Excel文件重复操作不现实，Python批量处理一次搞定。保证一致性：统一格式、统一操作，避免手动误差。易于集成：可嵌入日常自动化流程，支持定时和触发执行。二、常用库及选型建议库作用优势局限pandas读取/清洗/分析Excel数据语法简
SpringBoot整合Swagger2快速指南 Cyanto SpringBoot spring boot 后端 java
Swagger简介Swagger是一款强大的API文档生成工具，它能够自动为RESTfulAPI生成可视化文档，支持在线测试接口，极大提高了前后端协作效率。本文将详细介绍如何在SpringBoot项目中整合Swagger2。环境准备版本要求重要提示：SpringBoot版本不能过高，推荐使用2.5.6版本：org.springframework.bootspring-boot-starter-pa
python中的keys方法 m0_58134286 python dict
d.keys()1.作用：获取字典d中的所有key值，返回值是一个对象2.例子：dict1=dict（one=1，two=2）print（dict1.keys（））//输出结果为：dict_keys（["one","two"])3.思考：若何将返回值转换成列表print（list(dict1.keys())//输出结果为：["one","two"]
bash方式启动模型训练 BILLY BILLY 深度学习基础开发必备工具自动驾驶
export\PATHPYTHONPATH=/workspace/mmlab/mmdetection/:/workspace/mmlab/mmsegmentation/:/workspace/mmlab/mmdeploy/:${env:PYTHONPATH}\CUDA_VISIBLE_DEVICES=0\DATA_ROOT_1=/mnt/data/…/\DATA_ROOT_2=/mnt/data/
Python基础(十四): 函数作用域伯wen
一、基本概念1、变量的作用域变量的作用范围:可操作范围Python是静态作用域,也就是说在Python中,变量的作用域源于它在代码中的位置,在不同的位置,可能有不同的命名空间2、命名空间命名空间是作用域的体现形式表示变量不同的具体的操作范围3、Python-LEGBL-Local:函数内的命名空间作用范围:当前整个函数体deftest():a=10print(a)test()#打印:10a的作用范
爬虫实战案例（两个） AI 嗯啦爬虫
该博客展示两个简单的爬虫实战案例，一个是从人民邮电出版社上爬取其中一个分类的全部图书信息，另一个是在苏宁易购上爬取某个商品的好评和差评，用两个简单的案例讲解爬虫在实际情况下的运作流程一、获取图书信息需求：统计人民邯电出版社官网中与关键词“python”有关的全部图书，包含图书名、价格、作者名等信息，并将获取的信息写入“Excel图书汇总，txt”文件中。流程：配置浏览器并打开目标网站搜索"Pyth
Python高效编程技术大全：从解释器到异步编程竹石文化传播有限公司
本文还有配套的精品资源，点击获取简介：《Python高性能编程技术》旨在指导开发者深入理解Python的性能优化方法。本书涵盖了从解释器机制、数据结构和内置函数的优化，到使用Numpy、Pandas、多线程和多进程进行数值计算和数据处理，再到并发编程和性能分析等全面技术，帮助开发者提升代码执行效率和处理各种性能挑战。1.Python解释器性能分析Python作为一门解释型语言，其性能受到解释器行为
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。

pytorch-MNIST手写数字识别与特征图可视化