三年级王垄翔

李沐pytorch学习-经典CNN的原理及代码实现

一、LeNet

1.1 模型结构

LeNet结构如图1所示，汇聚层即池化层，这里池化Stride（步幅）与池化层长宽一致，因此使得池化后大小减半。

图1. LeNet结构

1.2 代码实现

代码实现如下：

import torch
from torch import nn
from d2l import torch as d2l

net = nn.Sequential(
    nn.Conv2d(1, 6, kernel_size=5, padding=2), nn.Sigmoid(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Conv2d(6, 16, kernel_size=5), nn.Sigmoid(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Flatten(),
    nn.Linear(16 * 5 * 5, 120), nn.Sigmoid(),
    nn.Linear(120, 84), nn.Sigmoid(),
    nn.Linear(84, 10))

        nn.Sequential 即表示把括号里的层按序排起来，代码与每层的对应关系如图2所示。

图2. 代码与LeNet结构中每层的对应关系

        nn.Flatten() 作用是将16@5×5的汇聚层展平程1维向量，作为全连接层的输入，因此不对应图中的某层。

        nn.Conv2d(1, 6, kernel_size=5, padding=2) 为卷积层，表示输入的通道数为1，输出的通道数为6，直观表达是经过该层后数据变“厚”了，卷积核大小为5×5，上下左右均填充2行（填充0）。nn.Sigmoid()表示该层的激活函数为Sigmoid。

        nn.AvgPool2d(kernel_size=2, stride=2) 表示平均池化，池化层大小为2×2，步幅为2。

        nn.Conv2d(6, 16, kernel_size=5), nn.Sigmoid() 为卷积层，四周无填充，激活函数为Sigmoid。

        nn.AvgPool2d(kernel_size=2, stride=2) 为平均池化层。

        nn.Linear(16 * 5 * 5, 120), nn.Sigmoid() 为线性全连接层，输入层神经元数为16×5×5，输出层神经元数为120，无隐含层，激活函数为Sigmoid。

        nn.Linear(120, 84), nn.Sigmoid() 为线性全连接层，输入层神经元数为120，输出层神经元数为84，无隐含层，激活函数为Sigmoid。

        nn.Linear(84, 10) 为线性全连接层，输入层神经元数为84，输出层神经元数为10，无隐含层，无激活函数。

1.3 检查模型

查看输出层的名及Size。

import torch
from torch import nn
from d2l import torch as d2l

net = nn.Sequential(
    nn.Conv2d(1, 6, kernel_size=5, padding=2), nn.Sigmoid(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Conv2d(6, 16, kernel_size=5), nn.Sigmoid(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Flatten(),
    nn.Linear(16 * 5 * 5, 120), nn.Sigmoid(),
    nn.Linear(120, 84), nn.Sigmoid(),
    nn.Linear(84, 10))

X = torch.rand(size=(1, 1, 28, 28), dtype=torch.float32)
for layer in net:
    X = layer(X)
    print(layer.__class__.__name__,'output shape: \t',X.shape)

# 输出如下：
Conv2d output shape: torch.Size([1, 6, 28, 28])
Sigmoid output shape: torch.Size([1, 6, 28, 28])
AvgPool2d output shape: torch.Size([1, 6, 14, 14])
Conv2d output shape: torch.Size([1, 16, 10, 10])
Sigmoid output shape: torch.Size([1, 16, 10, 10])
AvgPool2d output shape: torch.Size([1, 16, 5, 5])
Flatten output shape: torch.Size([1, 400])

1.4 训练模型

import torch
from torch import nn
from d2l import torch as d2l

net = nn.Sequential(
    nn.Conv2d(1, 6, kernel_size=5, padding=2), nn.Sigmoid(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Conv2d(6, 16, kernel_size=5), nn.Sigmoid(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Flatten(),
    nn.Linear(16 * 5 * 5, 120), nn.Sigmoid(),
    nn.Linear(120, 84), nn.Sigmoid(),
    nn.Linear(84, 10))

batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size=batch_size)

def evaluate_accuracy_gpu(net, data_iter, device=None): #@save
    """使用GPU计算模型在数据集上的精度"""
    if isinstance(net, nn.Module):
        net.eval() # 设置为评估模式
        if not device:
            device = next(iter(net.parameters())).device
    # 正确预测的数量，总预测的数量
    metric = d2l.Accumulator(2)
    with torch.no_grad():
        for X, y in data_iter:
            if isinstance(X, list):
                # BERT微调所需的（之后将介绍）
                X = [x.to(device) for x in X]
            else:
                X = X.to(device)
            y = y.to(device)
            metric.add(d2l.accuracy(net(X), y), y.numel())
    return metric[0] / metric[1]

def train_ch6(net, train_iter, test_iter, num_epochs, lr, device):
    """用GPU训练模型(在第六章定义)"""
    def init_weights(m):
        if type(m) == nn.Linear or type(m) == nn.Conv2d:
            nn.init.xavier_uniform_(m.weight)
    net.apply(init_weights)
    print('training on', device)
    net.to(device)
    optimizer = torch.optim.SGD(net.parameters(), lr=lr)
    loss = nn.CrossEntropyLoss()
    animator = d2l.Animator(xlabel='epoch', xlim=[1, num_epochs],legend=['train loss', 'train acc', 'test acc'])
    timer, num_batches = d2l.Timer(), len(train_iter)
    for epoch in range(num_epochs):
    # 训练损失之和，训练准确率之和，样本数
    metric = d2l.Accumulator(3)
    net.train()
    for i, (X, y) in enumerate(train_iter):
        timer.start()
        optimizer.zero_grad()
        X, y = X.to(device), y.to(device)
        y_hat = net(X)
        l = loss(y_hat, y)
        l.backward()
        optimizer.step()
        with torch.no_grad():
            metric.add(l * X.shape[0], d2l.accuracy(y_hat, y), X.shape[0])
        timer.stop()
        train_l = metric[0] / metric[2]
        train_acc = metric[1] / metric[2]
        if (i + 1) % (num_batches // 5) == 0 or i == num_batches - 1:
            animator.add(epoch + (i + 1) / num_batches, (train_l, train_acc, None))
    test_acc = evaluate_accuracy_gpu(net, test_iter)
    animator.add(epoch + 1, (None, None, test_acc))
print(f'loss {train_l:.3f}, train acc {train_acc:.3f}, 'f'test acc {test_acc:.3f}')
print(f'{metric[2] * num_epochs / timer.sum():.1f} examples/sec 'f'on {str(device)}')

# 开始训练
lr, num_epochs = 0.9, 10
train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

二、AlexNet

2.1 模型简介

AlexNet赢了2012年ImageNet比赛

是个更深更大的LeNet

相对LeNet主要改进：

∷ ReLu作为激活函数，减缓梯度消失

∷ 使用MaxPooling

∷ 全连接层后加入了丢弃层（DropOut
）

∷ 进行了数据增强（Data argumentation，截取图片一部分作为新增数据、或者调色温）

DropOut： 随机使某个神经元失效，以免训练后网络输出过度依赖某个神经元导致过拟合【深度学习】丢弃法（dropout）_苦逼的虾的博客-CSDN博客，Dropout (nn.Dropout()) (为什么神经网络中的dropout可以作为正则化)(model.eval())(为什么Dropout可看作是一种集成学习)_hxxjxw的博客-CSDN博客

引起了计算机视觉方法论的改变，之前都是人工从图片提取特征，AlexNet使用CNN提取特征，如图3所示。

图3. 机器学习方法论的改变

模型结构如下：

图4. AlexNet结构

图中11×11卷积层（96）表示卷积核大小为11×11，输出通道数为96。

2.2 代码实现

AlexNet结构和LeNet类似，也使用nn.Sequential作为构造器。

import torch
from torch import nn
from d2l import torch as d2l

net = nn.Sequential(
    # 这里使用一个11*11的更大窗口来捕捉对象。
    # 同时，步幅为4，以减少输出的高度和宽度。
    # 另外，输出通道的数目远大于LeNet
    nn.Conv2d(1, 96, kernel_size=11, stride=4, padding=1), nn.ReLU(),
    nn.MaxPool2d(kernel_size=3, stride=2),
    # 减小卷积窗口，使用填充为2来使得输入与输出的高和宽一致，且增大输出通道数
    nn.Conv2d(96, 256, kernel_size=5, padding=2), nn.ReLU(),
    nn.MaxPool2d(kernel_size=3, stride=2),
    # 使用三个连续的卷积层和较小的卷积窗口。
    # 除了最后的卷积层，输出通道的数量进一步增加。
    # 在前两个卷积层之后，汇聚层不用于减少输入的高度和宽度
    nn.Conv2d(256, 384, kernel_size=3, padding=1), nn.ReLU(),
    nn.Conv2d(384, 384, kernel_size=3, padding=1), nn.ReLU(),
    nn.Conv2d(384, 256, kernel_size=3, padding=1), nn.ReLU(),
    nn.MaxPool2d(kernel_size=3, stride=2),
    nn.Flatten(),
    # 这里，全连接层的输出数量是LeNet中的好几倍。使用dropout层来减轻过拟合
    nn.Linear(6400, 4096), nn.ReLU(), nn.Dropout(p=0.5),
    nn.Linear(4096, 4096), nn.ReLU(), nn.Dropout(p=0.5),
    # 最后是输出层。由于这里使用Fashion-MNIST，所以用类别数为10，而非论文中的1000
    nn.Linear(4096, 10))

2.3 检查模型

检查模型即检查每层的名称及输出矩阵大小是否符合预期。

import torch
from torch import nn
from d2l import torch as d2l

net = nn.Sequential(
    # 这里使用一个11*11的更大窗口来捕捉对象。
    # 同时，步幅为4，以减少输出的高度和宽度。
    # 另外，输出通道的数目远大于LeNet
    nn.Conv2d(1, 96, kernel_size=11, stride=4, padding=1), nn.ReLU(),
    nn.MaxPool2d(kernel_size=3, stride=2),
    # 减小卷积窗口，使用填充为2来使得输入与输出的高和宽一致，且增大输出通道数
    nn.Conv2d(96, 256, kernel_size=5, padding=2), nn.ReLU(),
    nn.MaxPool2d(kernel_size=3, stride=2),
    # 使用三个连续的卷积层和较小的卷积窗口。
    # 除了最后的卷积层，输出通道的数量进一步增加。
    # 在前两个卷积层之后，汇聚层不用于减少输入的高度和宽度
    nn.Conv2d(256, 384, kernel_size=3, padding=1), nn.ReLU(),
    nn.Conv2d(384, 384, kernel_size=3, padding=1), nn.ReLU(),
    nn.Conv2d(384, 256, kernel_size=3, padding=1), nn.ReLU(),
    nn.MaxPool2d(kernel_size=3, stride=2),
    nn.Flatten(),
    # 这里，全连接层的输出数量是LeNet中的好几倍。使用dropout层来减轻过拟合
    nn.Linear(6400, 4096), nn.ReLU(), nn.Dropout(p=0.5),
    nn.Linear(4096, 4096), nn.ReLU(), nn.Dropout(p=0.5),
    # 最后是输出层。由于这里使用Fashion-MNIST，所以用类别数为10，而非论文中的1000
    nn.Linear(4096, 10))


X = torch.randn(1, 1, 224, 224)
for layer in net:
    X=layer(X)
    print(layer.__class__.__name__,'output shape:\t',X.shape)

# 输出如下：
Conv2d output shape: torch.Size([1, 96, 54, 54])
ReLU output shape: torch.Size([1, 96, 54, 54])
MaxPool2d output shape: torch.Size([1, 96, 26, 26])
Conv2d output shape: torch.Size([1, 256, 26, 26])
ReLU output shape: torch.Size([1, 256, 26, 26])
MaxPool2d output shape: torch.Size([1, 256, 12, 12])
Conv2d output shape: torch.Size([1, 384, 12, 12])
ReLU output shape: torch.Size([1, 384, 12, 12])
Conv2d output shape: torch.Size([1, 384, 12, 12])
ReLU output shape: torch.Size([1, 384, 12, 12])
Conv2d output shape: torch.Size([1, 256, 12, 12])
ReLU output shape: torch.Size([1, 256, 12, 12])
MaxPool2d output shape: torch.Size([1, 256, 5, 5])
Flatten output shape: torch.Size([1, 6400])
Linear output shape: torch.Size([1, 4096])
ReLU output shape: torch.Size([1, 4096])
Dropout output shape: torch.Size([1, 4096])
Linear output shape: torch.Size([1, 4096])
ReLU output shape: torch.Size([1, 4096])
Dropout output shape: torch.Size([1, 4096])
Linear output shape: torch.Size([1, 10])

2.4 训练模型

import torch
from torch import nn
from d2l import torch as d2l

net = nn.Sequential(
    # 这里使用一个11*11的更大窗口来捕捉对象。
    # 同时，步幅为4，以减少输出的高度和宽度。
    # 另外，输出通道的数目远大于LeNet
    nn.Conv2d(1, 96, kernel_size=11, stride=4, padding=1), nn.ReLU(),
    nn.MaxPool2d(kernel_size=3, stride=2),
    # 减小卷积窗口，使用填充为2来使得输入与输出的高和宽一致，且增大输出通道数
    nn.Conv2d(96, 256, kernel_size=5, padding=2), nn.ReLU(),
    nn.MaxPool2d(kernel_size=3, stride=2),
    # 使用三个连续的卷积层和较小的卷积窗口。
    # 除了最后的卷积层，输出通道的数量进一步增加。
    # 在前两个卷积层之后，汇聚层不用于减少输入的高度和宽度
    nn.Conv2d(256, 384, kernel_size=3, padding=1), nn.ReLU(),
    nn.Conv2d(384, 384, kernel_size=3, padding=1), nn.ReLU(),
    nn.Conv2d(384, 256, kernel_size=3, padding=1), nn.ReLU(),
    nn.MaxPool2d(kernel_size=3, stride=2),
    nn.Flatten(),
    # 这里，全连接层的输出数量是LeNet中的好几倍。使用dropout层来减轻过拟合
    nn.Linear(6400, 4096), nn.ReLU(), nn.Dropout(p=0.5),
    nn.Linear(4096, 4096), nn.ReLU(), nn.Dropout(p=0.5),
    # 最后是输出层。由于这里使用Fashion-MNIST，所以用类别数为10，而非论文中的1000
    nn.Linear(4096, 10))

batch_size = 128
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size, resize=224)
lr, num_epochs = 0.01, 10
d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

# 输出如下：
loss 0.327, train acc 0.879, test acc 0.866
3903.6 examples/sec on cuda:0

训练过程如图5所示。

图5. AlexNet训练过程

跟我一起学Python数据处理（117/127）：高级Python环境搭建指南 lilye66 python windows 开发语言
跟我一起学Python数据处理（117/127）：高级Python环境搭建指南在Python数据处理的学习和实践中，基础的Python环境可能无法满足日益复杂的项目需求。就像我们搭建房子，简单的毛坯房能满足基本居住，但想要更舒适、功能更齐全，就需要精心装修一番。今天，我就和大家分享一下高级Python环境搭建的相关知识，希望能和大家一起在技术的道路上共同进步，让我们处理数据时更加得心应手。一、为什
2025-03-01 学习记录--C/C++-PTA 7-35 有理数均值小呀小萝卜儿学习-C/C++学习 c语言
合抱之木，生于毫末；九层之台，起于累土；千里之行，始于足下。一、题目描述⭐️二、代码（C语言）⭐️#include//【关键】计算最大公约数（GCD）longlonggcd(longlonga,longlongb){while(b!=0){//当b不为0时循环longlongtemp=b;//临时变量存储b的值b=a%b;//计算a除以b的余数，赋值给ba=temp;//将之前存储的b的值赋值给a
费曼学习法11 - NumPy 的 “线性代数” 之力：矩阵运算与应用 (应用篇) 修昔底德 Python费曼学习法线性代数学习 numpy python 人工智能深度学习
第六篇：NumPy的“线性代数”之力：矩阵运算与应用(应用篇)开篇提问：考虑一个实际问题：图像的旋转。当你使用图像编辑软件旋转照片时，背后是什么在驱动图像像素的精确移动？答案是线性代数。图像可以表示为数值矩阵，而旋转、缩放、剪切等图像变换，都可以通过矩阵运算来实现。线性代数不仅是图像处理的基石，也在机器学习、物理模拟、工程计算等众多领域扮演着核心角色。它提供了一套强大的数学工具，用于描述和解决多维
人工智能之数学基础：矩阵的秩每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能矩阵机器学习深度学习线性代数秩
本文重点矩阵的秩，作为矩阵理论中的一个核心概念，是连接矩阵性质与应用的重要桥梁。本文我们将学习矩阵秩的概念，通过矩阵的秩可以判断矩阵是否可逆等等，所以矩阵的秩是非常重要的一个概念。矩阵秩的概念秩定义为矩阵A的线性独立的行（或列）的最大数目。也就是说，如果把矩阵看成由行向量或列向量组成，那么矩阵的秩就是这些向量中极大线性无关组所含向量的个数。矩阵的秩定义为矩阵线性无关的行向量或者列向量的最大数量，表
通往 AI 之路：Python 机器学习入门-线性代数一小路一从0开始学习机器学习机器学习人工智能 python 后端开发语言线性代数
2.1线性代数（机器学习的核心）线性代数是机器学习的基础之一，许多核心算法都依赖矩阵运算。本章将介绍线性代数中的基本概念，包括标量、向量、矩阵、矩阵运算、特征值与特征向量，以及奇异值分解（SVD）。2.1.1标量、向量、矩阵1.标量（Scalar）标量是一个单独的数，例如：a=5在Python中：a=5#标量2.向量（Vector）向量是由多个数值组成的一维数组，例如：v=[2,3,5]Pytho
清华出品DeepSeek六版手册，携全套AI资料，带你闯入AI的奇妙世界 2501_90771553 pdf
清华出品DeepSeek六版手册，携全套AI资料，带你闯入AI的奇妙世界在科技飞速发展的时代，人工智能（AI）已然成为引领变革的核心力量。无论是对AI充满好奇的初学者，还是在该领域深耕的专业人士，都在不断探寻着更优质、更全面的学习资源。现在，一份来自清华大学的厚礼——DeepSeek六版手册，带着全套AI资料震撼登场，将引领你走进AI的奇妙世界！DeepSeek系列手册，凭借清华大学深厚的学术底蕴
C语言学习笔记-进阶（1）深入理解指针3 John.Lewis c语言学习笔记
1.字符指针变量在指针的类型中我们知道有⼀种指针类型为字符指针char*;⼀般使用：intmain(){charch='w';char*pc=&ch;*pc='w';return0;}还有⼀种使用方式如下：intmain(){constchar*pstr="hellobit.";//这⾥是把⼀个字符串放到pstr指针变量⾥了吗？printf("%s\n",pstr);return0;}代码cons
(undone) MIT6.S081 2023 学习笔记 (Day9: LAB8 locks) shimly123456 MIT6.S081 学习笔记操作系统
url:https://pdos.csail.mit.edu/6.1810/2023/labs/lock.htmlInthislabyou’llgainexperienceinre-designingcodetoincreaseparallelism.Acommonsymptomofpoorparallelismonmulti-coremachinesishighlockcontention.Im
C语言文件操作学习笔记：从基础到实践共享家9527 c c语言数据结构算法
在C语言的知识体系中，文件操作是极为关键的一环，它赋予了程序存储和读取外部数据的能力，对于开发各类实用程序至关重要。近期，借助课程的学习，我对C语言文件操作进行了系统且深入的学习，下面将我的学习心得和收获进行分享。目录一、文件操作基础概念（一）文件类型（二）文件指针二、文件的打开与关闭三、文件的顺序读写（一）字符读写（二）文本行读写（三）格式化读写（四）二进制读写四、文件的随机读写（一）fseek
数据挖掘校招面经二 Y1nhl 搜广推面经数据挖掘人工智能机器学习深度学习算法 python
得物数据挖掘一、线性回归y=ax中参数a如何计算1.1.a是待学习参数在线性回归中，a是模型的权重（或斜率），需要通过数据来学习其最优值。学习的目标是找到a的值，使得模型的预测值y^=ax\hat{y}=axy^=ax尽可能接近真实值y。1.2.最小二乘法在线性回归中，通常使用最小二乘法来学习a。最小二乘法的目标是最小化误差平方和（即真实值y和预测值y^\hat{y}y^之间的差异）：误差平方和=
Python深度学习实践：神经网络在异常检测中的应用 AI天才研究院 AI大模型企业级应用开发实战 Python实战 DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
Python深度学习实践：神经网络在异常检测中的应用关键词：深度学习，神经网络，异常检测，Python，TensorFlow，PyTorch，模型优化，实战案例摘要：本文深入探讨了深度学习在异常检测领域的应用。通过Python实现的神经网络，本文介绍了深度学习的基本概念、核心算法、模型优化方法，并提供了详细的实战案例，包括数据预处理、模型训练和评估。读者将了解如何使用深度学习技术检测金融欺诈、网络
各主流厂商抓取modem log的方法终端小蛙 modem android modem
第一次来编辑CSDN，感觉各功能不太熟悉，先试试本文档主要基于自己近期的查看各厂商的MODEMlog时，积累的一些抓取modemofflinelog的经验，发出来一起学习VIVO如何抓log以下是基于VIVONEX35G版本，验证有效a.如何抓取Modemofflinelog:在拨号盘输入*#*#112#*#*->点击更多->点击Modemlog配置->选择所想要的log配置类型->退出然后，*#
Jetpack学习之 Hilt，android应用开发入门答案 m0_64604178 程序员面试移动开发 android
2.5Hilt的内置组件和作用域2.5.1@InstallIn注解2.5.2使注入对象单例2.5.3作用域的包含关系2.6Hilt预置的Qualifier3小结参考文章Git学习地址：传送门1.概述=======================================================================随着Android11的发布，Jetpack家族新添了Hil
Transformer 代码剖析15 - Transformer模型代码（pytorch实现） lczdyx Transformer代码剖析 transformer pytorch 深度学习 embedding 人工智能 python
一、模型架构全景解析1.1类定义与继承关系classTransformer(nn.Module):该实现继承PyTorch的nn.Module基类，采用面向对象设计模式。核心架构包含编码器-解码器双塔结构，通过参数配置实现NLP任务的通用处理能力。TransformerEncoderDecoderMulti-HeadAttentionFeedForwardMaskedMulti-HeadAtten
机器学习校招面经二 Y1nhl 搜广推面经机器学习人工智能算法推荐算法数据挖掘搜索算法 pytorch
快手机器学习算法一、AUC（AreaUndertheROCCurve）怎么计算？AUC接近1可能的原因是什么？见【搜广推校招面经四】AUC是评估分类模型性能的重要指标，用于衡量模型在不同阈值下区分正负样本的能力。它是ROC曲线（ReceiverOperatingCharacteristicCurve）下的面积。1.1.ROC曲线的坐标ROC曲线以真正例率（TruePositiveRate,TPR）
《深度学习实战》第12集：大模型的未来与行业应用带娃的IT创业者深度学习实战深度学习
深度学习实战|第12集：大模型的未来与行业应用随着深度学习技术的快速发展，大模型（如GPT、LLaMA、Bloom等）已经成为人工智能领域的核心驱动力。本篇博客将探讨大模型的发展趋势及其在医疗、金融、教育等行业的实际应用，并通过2个实战项目展示如何使用开源大模型构建问答系统。此外，我们还会分析大模型的前沿技术方向。图示：大模型发展历程与行业应用场景1.大模型发展历程图以下是大模型从早期到现在的关键
华为面试题及答案——机器学习(二) 麦当当MDD 题目挖掘机器学习人工智能数据库开发数据库大数据
21.如何评价分类模型的优劣?（1）模型性能指标准确率（Accuracy）：定义：正确分类的样本数与总样本数之比。适用：当各类样本的数量相对均衡时。精确率（Precision）：定义：预测为正类的样本中实际为正类的比例。适用：当关注假阳性错误的成本较高时（例如垃圾邮件检测）。召回率（Recall）：定义：实际为正类的样本中被正确预测为正类的比例。适用：当关注假阴性错误的成本较高时（例如疾病检测）。
深度学习突破：LLaMA-MoE模型的高效训练策略人工智能大模型讲师培训咨询叶梓深度学习 llama 人工智能 Llama-Moe 大模型语言模型
在人工智能领域，大模型（LLM）的崛起带来了前所未有的进步，但随之而来的是巨大的计算资源需求。为了解决这一问题，Mixture-of-Expert（MoE）模型架构应运而生，而LLaMA-MoE正是这一架构下的重要代表。LLaMA-MoE是一种基于LLaMA系列和SlimPajama的MoE模型，它通过将LLaMA的前馈网络（FFNs）划分为稀疏专家，并为每层专家插入top-K个门，从而显著减小模
【PCIe 总线及设备入门学习专栏 4.5 -- PCIe 中断 MSI 与 MSI-X 机制介绍】主公讲 ARM #【PCIe Bus 专栏】PCIe msi PCIe MSI-X PCIe 中断机制 MSI-X 中断机制 MSI 中断机制 PCI 中断
文章目录PCI设备中断机制PCIe设备中断机制PCIeMSI中断机制MSICapabilityMSI-X中断机制MSI-XcapabilityMSI-XTablePBAMSI-Xcapability解析MSI/MSI-X操作流程扫描设备配置设备MSI配置MSI-X配置中断触发与处理PCI设备中断机制以前的PCI设备是支持物理上的INTA/B/C/D中断信号，设备可以可以表明自己通过哪个引脚来发出中
顺丰科技-2024 机器学习算法面经程序员奇奇 offer分享+面试经验顺丰科技机器学习机器学习算法面经
专栏分享：计算机小伙伴秋招春招找工作的面试经验和面试的详情知识点专栏首页：软件测试开发类面经合集主要分享：测试开发类岗位在面试互联网公司时候一些真实的经验面试code学习参考请看：数据结构面试必刷100题一面：1.自我介绍2.线程和进程的区别，什么时候用多进程，什么时候用多线程（这个属于给自挖坑了）3.实习项目问题，项目目标是怎么定的，用的什么算法
基于 Python + Django 的学生成绩综合评价分析预测可视化系统源码空间站11 python django 开发语言课程设计机器学习成绩预测毕业设计
开发报告：一、项目概述本项目是一个基于Python和Django框架开发的学生成绩综合评价分析与预测可视化系统。系统的主要功能包括：学生成绩数据的管理与展示、成绩预测模型的建立与应用、以及预测结果的可视化展示。该系统利用机器学习算法（如线性回归）进行成绩预测，并通过DjangoWeb框架实现数据的展示和用户交互。二、系统功能概述学生信息管理：系统管理学生的基本信息，包括年龄、性别、爱好等，基于Dj
机器学习之学习笔记孤城laugh 机器学习学习笔记人工智能 python
机器学习-学习笔记1.简介2.算法3.特征工程3.1数据集3.2特征提取3.3特征预处理3.4特征降维4.分类算法4.1`sklearn`转换器和估计器4.2K-近邻算法（KNN）4.3模型选择与调优4.4朴素贝叶斯算法4.5决策树4.6集成学习方法之随机森林5.回归算法5.1线性回归5.2过拟合与欠拟合5.3岭回归5.4逻辑回归（实际上是分类算法，用于解决二分类问题）6.聚类算法1.无监督学习2
深度学习day1 孤城laugh 深度学习人工智能笔记学习机器学习
深度学习day11.深度学习与机器学习的区别1.1特征提取方面1.2数据量与计算性能要求1.3算法代表2.深度学习框架之TensorFlow2.1TensorFlow基础2.2TensorFlow基础知识1.**张量（Tensor）**：多维数组、多维列表2.**变量（Variable）**：用于表示程序处理的共享持久状态3.**图与函数**4.**可视化学习（TensorBoard）**：用来展
C# Serilog：日志界的超级英雄，带你玩转日志记录墨瑾轩一起学学C#【一】c#javascript 开发语言
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣想象一下，你的应用程序是个超级英雄，每当夜幕降临，它在代码的世界里惩恶扬善，而Serilog就是那个默默站在英雄背后，记录每一次战斗细节的智者。它不仅仅记录普通的日志，还能让你的日志变得超级有组织、可读性强，更重要的是，它赋予了你超能力——灵活配置和分析日志的
python-坦克大战游戏项目 tzzzzzztzzzz python pygame 游戏
'''尚学堂学习笔记，用于复习'''一.下载pygame，在cmd输入命令pipinstallpygame(也可以直接在pycharm中importpygame,提示你没有pygame,然后直接安装即可)二.分析项目需求:坦克大战游戏的基本需求：1).项目中需要定义的类2).每个类对应的方法1.坦克类显示坦克移动射击2.子弹显示子弹移动击中敌方坦克时产生的影响3.墙壁类显示墙壁（是否可以通过）4.
Java面试学习资源 web13595609705 面试学习路线阿里巴巴 java 面试学习
【网站】牛客网https://www.nowcoder.com/【网站】力扣https://leetcode.com/https://leetcode-cn.com/problemset/all/中文社区【网站】尚学堂总结的几百道面试题，以及面试需要注意什么https://www.bjsxt.com/javamianshiti.html【网站】java面试题网http://www.wityx.co
C#：LINQ学习笔记01：LINQ基础概念 gu20 C#数据库 c#开发语言 linq
一、LINQ架构体系1.LINQ的核心思想统一查询模型：对对象、XML、数据库等不同数据源使用一致的语法。强类型检查：编译时类型安全，减少运行时错误。2.核心组件技术数据源典型场景LINQtoObjects内存集合(IEnumerable)过滤/排序集合数据LINQtoXMLXML文档解析/查询XML节点LINQtoSQL关系数据库将查询翻译为SQL执行关键代码示例：//LINQtoObjects
LeetCode - #78 子集（Top 100）网罗开发 #LeetCode #Swift 集 leetcode swift ios 算法职场和发展
前言本题为LeetCode前100高频题我们社区陆续会将顾毅（Netflix增长黑客，《iOS面试之道》作者，ACE职业健身教练。）的Swift算法题题解整理为文字版以方便大家学习与阅读。LeetCode算法到目前我们已经更新了77期，我们会保持更新时间和进度（周一、周三、周五早上9:00发布），每期的内容不多，我们希望大家可以在上班路上阅读，长久积累会有很大提升。不积跬步，无以至千里；不积小流，
DeepSeek 全套资料pdf合集免费下载（持续更新） Java潘老师 pdf deepseek
有很多朋友都关注DeepSeek相关使用的教程资料，本站也一直持续分享DeepSeek学习相关的pdf资料，由于比较零散，这篇文章主要就是做一个汇总，并且持续更新，让大家可以及时获取下载最新的相关DeepSeek的资料。持续更新地址为：https://www.panziye.com/project/other/15300.html1、清华大学系列清华大学系列目前有以下几部：清华大学第1部《Deep
深度学习现状与未来发展趋势分析报告（深度学习还是主流吗？）与光同尘大道至简深度学习人工智能
此博客分析深度学习当前的主流应用领域、其受关注度的变化趋势、可能的技术替代或补充方案、产业界和学术界的不同发展方向，以及影响其受关注度变化的核心因素。报告将包括结构化分析（背景、现状、挑战、未来趋势）、数据驱动（市场趋势、论文发表量等数据支持）以及行业案例分析，以展示某些行业如何逐步减少对深度学习的依赖。背景深度学习的概念与发展历程：深度学习（DeepLearning）是机器学习中的一类方法，源于
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v hdfs@192.168.18.133 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l