孤独腹地

resnet18实现cifar10分类

实验步骤

搭建resnet18网络

数据集加载

模型训练和改进

分析评估

Kaggle提交

网络构建

实验初期拟采用torchvision中实现的resnet18作为网络结构，为了方便修改网络结构，于是重新实现了resnet18网络

resnet18由一个7x7的降采样卷积，一个max pooling层，8个basicblock，一个全局池化层，最后接一个全连接层组成，如下图

tensorboard网络结构可视化，左图为torchvision中的resnet实现，右图为自定义实现

代码如下

定义残差块

class IdentityBlock(nn.Module):
    def __init__(self, in_channels, out_channels, down_sampling=False):
        super().__init__()
        self.down_sampling = down_sampling
        self.in_channels = in_channels
        self.out_channels = out_channels
        self.conv1 = nn.Sequential(OrderedDict([
            ('conv1', nn.Conv2d(in_channels=in_channels, out_channels=out_channels, kernel_size=3,
                                stride=(1 if in_channels == out_channels else 2), padding=1,
                                bias=False)),
            ('bn1', nn.BatchNorm2d(out_channels)),
            ('relu1', nn.ReLU())
        ]))
        self.shortcut = nn.Sequential(OrderedDict([
            (
                'conv',
                nn.Conv2d(in_channels=in_channels, out_channels=out_channels, kernel_size=1, stride=2, bias=False)),
            ('bn', nn.BatchNorm2d(out_channels))
        ])) if in_channels != out_channels else nn.Sequential()
        self.conv2 = nn.Sequential(OrderedDict([
            ('conv2', nn.Conv2d(in_channels=out_channels, out_channels=out_channels, kernel_size=3, stride=1, padding=1,
                                bias=False)),
            ('bn2', nn.BatchNorm2d(out_channels))
        ]))
        self.relu2 = nn.ReLU()

    def forward(self, x):
        fx = self.conv1(x)
        fx = self.conv2(fx)
        x = self.shortcut(x)
        hx = fx + x
        hx = self.relu2(hx)
        return hx

定义模型网络

class Resnet18(nn.Module):
    def __init__(self, num_classes):
        super(Resnet18, self).__init__()
        self.conv1 = nn.Sequential(OrderedDict([
            ('conv', nn.Conv2d(in_channels=3, out_channels=64, kernel_size=7, stride=2, padding=3, bias=False)),
            ('bn', nn.BatchNorm2d(64)),
            ('relu', nn.ReLU()),
        ]))
        self.max_pool = nn.MaxPool2d(kernel_size=3, stride=2, padding=1)
        self.layer1 = self.make_layer(64, 64, down_sampling=False)
        self.layer2 = self.make_layer(64, 128)
        self.layer3 = self.make_layer(128, 256)
        self.layer4 = self.make_layer(256, 512)
        self.avg_pool = nn.AdaptiveAvgPool2d(output_size=(1, 1))
        self.fc = nn.Linear(in_features=512, out_features=num_classes)

    @staticmethod
    def make_layer(in_channels, out_channels, down_sampling=True):
        layer = nn.Sequential()
        layer.add_module('block1', IdentityBlock(in_channels, out_channels, down_sampling=down_sampling))
        layer.add_module('block2', IdentityBlock(out_channels, out_channels, down_sampling=False))
        return layer

    def forward(self, x):
        x = self.conv1(x)
        x = self.max_pool(x)
        x = self.layer1(x)
        x = self.layer2(x)
        x = self.layer3(x)
        x = self.layer4(x)
        x = self.avg_pool(x)
        x = x.view(x.size(0), -1)
        x = self.fc(x)
        return x

跟pytorch内置实现不同的是，在全局池化层后面pytorch采用了torch.flatten函数，而我是直接用了view方法。

数据集加载

数据集请前往kaggle官网下载 https://www.kaggle.com/c/cifar-10/data

下载完成后解压放置到dataset文件夹下，目录结构如下

当然读者亦可使用torchvision内置的cifar10数据集，运行时会先下载cifar10数据集，可能下载比较慢，可以先运行一次，找到链接后自行下载完成后放到dataset文件夹下，然后重新运行

import torch
import torchvision
import torchvision.transforms as transforms

trainset = torchvision.datasets.CIFAR10(root='./dataset/cifar', train=True,
                                        download=True,transform=None)

testset = torchvision.datasets.CIFAR10(root='./dataset/cifar', train=False,
                                       download=True, transform=None)

数据集加载主要通过继承pytorch内置的dataset类，重写其中的__getitem__和__len__以及构造函数

我们读取训练集中的图片并划分成训练集和验证集。

init

class CifarDataset(Data.Dataset):
    def __init__(self, img_dir='dataset/trainImages/', train=True, img_label=None, transform=None):
        self.img_path = list(Path(img_dir).glob('*.png'))
        self.img_path.sort(key=lambda x: int(x.name.split('.')[0]))
        self.img_label = self.get_label(img_label)
        num_train = int(0.8 * len(self.img_path))
        index_list = list(range(len(self.img_path)))
        random.seed(42)
        indexes = random.sample(index_list, num_train)
        if not train:
            indexes = [index_list.pop(index) for index in indexes]
        self.img_path = [self.img_path[index] for index in indexes]
        self.img_label = [self.img_label[index] for index in indexes]
        self.transform = transform

上面的代码中get_label函数传入trainLabels.csv的路径，返回标签索引列表。img_path需要调用sort函数保证图片按id排序，这样才能和标签一一对应。在构造函数中，通过传入train参数决定加载训练集还是验证集，为了保证训练集和验证集不重复，设定随机种子以保证在构造训练集和验证集的两次随机操作中得到相同的索引。

	@staticmethod
    def get_label(label_path):
        if label_path is not None:
            df = pd.read_csv(label_path)
            class_dict = {label: i for i, label in enumerate(classes)}
            df['label'] = df['label'].apply(lambda x: class_dict[x])
            return list(df['label'].values)
        else:
            return None

传入transform，在__getitem__方法中对图片做预处理，img_label为None的情况是为了加载测试集（没有标签）

getitem

    def __getitem__(self, index):
        if self.img_label is not None:
            img = Image.open(self.img_path[index]).convert('RGB')
            label = np.array(self.img_label[index], dtype=int)
            if self.transform is not None:
                img = self.transform(img)
            return img, torch.from_numpy(label)
        else:
            img = Image.open(self.img_path[index]).convert('RGB')
            if self.transform is not None:
                img = self.transform(img)
            return img, torch.from_numpy(np.array([]))

len

    def __len__(self):
        return len(self.img_path)

调用

if __name__ == '__main__':
    transform_train = transforms.Compose([
        # 先填充，然后随机裁剪成32x32大小的图片
        transforms.RandomCrop(32, padding=4),
        # 图像一半的概率翻转，一半的概率不翻转
        transforms.RandomHorizontalFlip(),  
        transforms.ToTensor(),
        # R,G,B每层的归一化用到的均值和方差
        transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)),
    ])

    transform_test = transforms.Compose([
        transforms.ToTensor(),
        transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)),
    ])

    train_dataset = CifarDataset(img_dir='dataset/trainImages/', img_label='dataset/trainLabels.csv', train=True, transform=transform_train)
    val_dataset = CifarDataset(img_dir='dataset/trainImages/', img_label='dataset/trainLabels.csv', train=False, transform=transform_test)

模型训练

初始设置

设定随机种子，保证训练结果可浮现

def setup_seed(seed):
    torch.manual_seed(seed)
    torch.cuda.manual_seed_all(seed)
    np.random.seed(seed)
    random.seed(seed)
    torch.backends.cudnn.deterministic = True
# 设置随机数种子
setup_seed(hyp['random_seed'])

损失函数

交叉熵损失函数

# 定义损失函数
loss = nn.CrossEntropyLoss()

优化器

# 定义优化器
optimizer = optim.SGD(net.parameters(), lr=args.lr, momentum=args.momentum, weight_decay=args.weight_decay)

加载模型

if args.pretrained:
    model = resnet18(pretrained=False, num_classes=10)
    state_dict = torch.load('weights/resnet18-f37072fd.pth')
    state_dict.pop('fc.weight')
    state_dict.pop('fc.bias')
    model.load_state_dict(state_dict, strict=False)
elif args.my_resnet or args.my_improved:
    model = Resnet18(num_classes=10, improved=args.my_improved)
else:
    model = resnet18(pretrained=False, num_classes=10)

这里通过配置pretrained决定是否加载预训练权重。另外，pytorch内置resnet18最后一个全连接层是1000个输出，而分类cifar10我们需要设定全连接层为10个输出，所以我们加载权重的时候不加载全连接层的权重。

训练

best_acc = 0
# 开始训练
for epoch in range(hyp['init_epoch'], n_epoch):
    net.train()
    for X, y in tqdm(train_iter):
        X = X.to(device)
        y = y.to(device)
        y_hat = net(X)
        error = loss(y_hat, y).sum()
        error.backward()
        optimizer.step()
        optimizer.zero_grad()
    if hyp['scheduler']:
        scheduler.step()
    # 评估
    # ...
    # ...

评估

定义Metric类

每训练一轮，模型在验证集上进行评估，可利用sklearn.metrics实现准确率和f1-score的计算

import numpy as np
from sklearn.metrics import accuracy_score
from sklearn.metrics import f1_score

class Metric(object):
    def __init__(self, output, label):
        self.output = output
        self.label = label

    def accuracy(self):
        y_pred = self.output
        y_true = self.label
        y_pred = y_pred.argmax(dim=1)
        accuracy = accuracy_score(y_true, y_pred)
        return accuracy
	
    def f1_score(self, _type='micro'):
        y_pred = self.output
        y_true = self.label
        return f1_score(np.argmax(y_pred, 1), y_true, average=_type)

对于多元分类，f1-score的值跟accuracy是一样的，所以任意选择一个作为评估指标即可。

然而，我在看到图之后才意识到这一点，所以f1-score白算了

训练过程中的评估

	# 训练
    # ...
    net.eval()
    val_loss, val_acc, n = .0, .0, 0
    batch_count = 0
    for X, y in val_iter:
        X = X.to(device)
        y = y.to(device)
        y_hat = net(X)
        error = loss(y_hat, y).sum()
        val_loss += error.item()
        metric = Metric(y_hat.detach().cpu(), y.detach().cpu())
        val_acc += metric.accuracy()
        batch_count += 1
        n += y.shape[0]

    writer.add_scalar('val/loss', val_loss / n, epoch)
    writer.add_scalar('val/acc', val_acc / batch_count, epoch)
    print(f"epoch:{epoch} loss:{val_loss / n} acc:{val_acc / batch_count}")

保存模型

保存最佳准确率模型

    if (val_acc / batch_count) > max(best_acc, 0.7):
        best_acc = val_acc / batch_count
        with open(exp_dir + "/result.txt", mode='w') as f:
            f.write("best accuracy:" + str(best_acc) + "\n")
            f.write("epoch:" + str(epoch))
        torch.save(net.state_dict(), exp_dir + "/weights/best.pth")

保存最后一轮的模型

torch.save(net.state_dict(), exp_dir + "/weights/last.pth")

模型改进

网络改进

考虑到cifar10的图片尺寸太小，resnet18开头的7x7降采样卷积和池化容易丢失一部分信息，所以考虑将7x7的降采样和最大池化去掉，换成一个3x3的same卷积

if improved:
    self.conv1 = nn.Sequential(OrderedDict([
        ('conv', nn.Conv2d(in_channels=3, out_channels=64, kernel_size=3, stride=1, padding=1, bias=False)),
        ('bn', nn.BatchNorm2d(64)),
        ('relu', nn.ReLU())
    ]))
    self.max_pool = nn.MaxPool2d(kernel_size=3, stride=2, padding=1)
else:
    self.conv1 = nn.Sequential(OrderedDict([
        ('conv', nn.Conv2d(in_channels=3, out_channels=64, kernel_size=7, stride=2, padding=3, bias=False)),
        ('bn', nn.BatchNorm2d(64)),
        ('relu', nn.ReLU()),
    ]))

调整参数

本次调参主要调的是学习率，学习率的调整分两块，固定学习率调整和不固定的学习率调整。后者指的是学习率衰减

固定学习率

以下为学习率为0.1，0.01，0.001时训练100个epoch的曲线图

学习率衰减

采用multistep的学习率衰减策略

初始学习率为0.01，milestones = [30,60,90]，红色表示固定学习率

初始学习率为0.1，milestones = [30,60,90]，蓝色表示固定学习率

初始学习率为0.001，milestones = [30,60,90]，红色表示固定学习率

上述三种学习率情况下，都可以看出学习率衰减是有效的。

分析评估

run	exp	exp2	exp3	exp4	exp5	exp6	exp7	exp8	exp9
内置网络	√								√
自定义网络		√
自定义改进网络			√	√	√	√	√	√
预训练									√
学习率	0.01	0.01	0.01	0.1	0.001	0.01	0.1	0.001	0.01
学习率衰减						√	√	√
准确率	0.827	0.846	0.919	0.903	0.897	0.923	0.922	0.893	0.857

网络对比(exp,exp2,exp3)

显然不管从图上还是表中都可以看出，自定义的resnet18略优于pytorch内置的resnet18，原因未知。而经过改进的网络更是显著由于前两者，首次将cifar10分类的准确率提升到了90以上。

学习率对比(exp3,exp4,exp5,exp6,exp7,exp8)

在前面模型改进-调参的地方已经提到没有应用学习率衰减的情况下，学习率为0.01比较合适。而且三个对比基本明学习率衰减有利于加速模型收敛，且设置合理的情况下可以增加准确率。

下图是学习率为0.01,0.1,0.001和三者是否使用学习率衰减的图

从图中可以看出。最优的是绿色曲线，即学习率为0.01且使用学习率衰减的情况。

预训练对比(exp,exp9)

因为要使用预训练权重，我自己实现的resnet18的网络因为与内置网络存在差异，因此采用内置网络和加载预训练权重的内置网络作对比

蓝色曲线表示加载预训练权重的网络。显然经过预训练的网络初始损失就较低且准确率较高，收敛速度和最终准确率都显著高于重头训练的网络。

预训练和网络结构的对比(exp3,exp9)

从上图可以看出，尽管经过预训练的网络初始准确率高，但是模型最终的表达能力仍然取决于网络结构。经过改进的网络即便没有经过预训练，最终的准确率较预训练的网络也提高了6.2个百分点，相较于没有经过预训练的内置网络提高了9.2个百分点

综上，当前最佳的模型为，自定义改进的网络在学习率为0.01时，经过[30,60,90]的multistep衰减，训练100轮的模型。

Kaggle提交

实验代码：https://github.com/li554/resnet18-cifar10-classification

第N11周：seq2seq翻译实战-Pytorch复现计算机真好丸 pytorch 人工智能 python
文章目录一、前期准备1.搭建语言类2.文本处理函数3.文件读取函数二、Seq2Seq模型1.编码器（encoder）2.解码器（decoder）三、训练1.数据预处理2.训练函数3.评估四、评估与训练1.Loss图2.可视化注意力五、总结本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、前期准备from__future__importunicode_literals,print_fu
第N5周：Pytorch文本分类入门计算机真好丸 pytorch 分类人工智能
文章目录一、前期准备1.环境安装2.加载数据3.构建词典4.生成数据批次和迭代器二、准备模型1.定义模型2.定义实例三、训练模型1.拆分数据集并运行模型2.使用测试数据集评估模型本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、前期准备1.环境安装确保安装了torchtext与portalocker库2.加载数据importtorch#强制使用CPUdevice=torch.devi
第TR5周：Transformer实战：文本分类计算机真好丸 transformer 分类深度学习
文章目录1.准备环境1.1环境安装1.2加载数据2.数据预处理2.1构建词典2.2生成数据批次和迭代器2.3构建数据集3.模型构建3.1定义位置编码函数3.2定义Transformer模型3.3初始化模型3.4定义训练函数3.5定义评估函数4.训练模型4.1模型训练5.总结：本文为365天深度学习训练营中的学习记录博客原作者：K同学啊1.准备环境1.1环境安装这是一个使用PyTorch通过Tran
2025年——【寒假】自学黑客计划（网络安全）网安CILLE web安全网络安全网络安全 linux
CSDN大礼包：基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包前言什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客
大数据知识图谱之深度学习——基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统_bert+lstm 2301_76348014 程序员深度学习大数据知识图谱
文章目录大数据知识图谱之深度学习——基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统一、项目概述二、系统实现基本流程三、项目工具所用的版本号四、所需要软件的安装和使用五、开发技术简介Django技术介绍Neo4j数据库Bootstrap4框架Echarts简介NavicatPremium15简介Layui简介Python语言介绍MySQL数据库深度学习六、核心理论贪心算法A
DeepSeek进阶开发与应用1：DeepSeek框架概述与基础应用 Evaporator Core #DeepSeek快速入门 DeepSeek进阶开发与应用 spring 自然语言处理
引言在当今的人工智能领域，深度学习技术已经成为了推动技术进步的核心动力之一。DeepSeek作为一个先进的深度学习框架，旨在为开发者和研究人员提供一个高效、灵活且易于扩展的平台，以便于他们能够快速地实现和部署各种深度学习模型。本文将深入探讨DeepSeek框架的核心架构、基础应用以及如何通过代码实现一个简单的深度学习模型。DeepSeek框架概述DeepSeek框架的设计理念是简洁而强大。它提供了
神经网络常见激活函数 12-Swish函数亲持红叶神经网络常见激活函数神经网络机器学习人工智能
Swish函数+导函数Swish函数Swish(x)=x⋅σ(βx)=x1+e−βx\begin{aligned}\rmSwish(x)&=x\cdot\sigma(\betax)\\&=\frac{x}{1+e^{-\betax}}\end{aligned}Swish(x)=x⋅σ(βx)=1+e−βxxSwish函数导数ddxSwish=(x⋅σ(βx))′=σ(βx)+x⋅(σ(βx))′∵
DeepSeek+WPS/Office手把手教你玩转智能办公 herosunly DeepSeek从入门到精通 deepseek 大模型人工智能 office wps 智能办公
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法Q大赛评委，编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。
使用Python实现深度学习模型：知识蒸馏与模型压缩 Echo_Wish Python 笔记从零开始学Python人工智能 Python算法 python 深度学习开发语言
在深度学习领域，模型的大小和计算复杂度常常是一个挑战。知识蒸馏（KnowledgeDistillation）和模型压缩（ModelCompression）是两种有效的技术，可以在保持模型性能的同时减少模型的大小和计算需求。本文将详细介绍如何使用Python实现这两种技术。目录引言知识蒸馏概述模型压缩概述实现步骤数据准备教师模型训练学生模型训练（知识蒸馏）模型压缩代码实现结论1.引言在实际应用中，深
深度学习框架探秘｜TensorFlow vs PyTorch：AI 框架的巅峰对决紫雾凌寒智启前沿：AI 洞察・创未来人工智能深度学习 tensorflow pytorch ai
在深度学习框架中，TensorFlow和PyTorch无疑是两大明星框架。前面两篇文章我们分别介绍了TensorFlow（点击查看）和PyTorch（点击查看）。它们引领着AI开发的潮流，吸引着无数开发者投身其中。但这两大框架究竟谁更胜一筹？是TensorFlow的全面与稳健，还是PyTorch的灵活与便捷？让我们一同深入剖析，探寻答案。在深度学习框架中，TensorFlow和PyTorch无疑是
来看看爬虫合不合法度假的小鱼 Python基础爬虫搜索引擎 python
活动地址：CSDN21天学习挑战赛文章目录一、爬虫合不合法二、什么是爬虫三、爬虫的分类四、为什么学网络爬虫一、爬虫合不合法随着Python在最近几年的流行，Python中的爬虫也逐渐进入到大家的视野中，但是很多小伙伴，还是在担心爬虫的合法性。今天就来和大家一起讨论一下爬虫的合法性。大家可能在网上看到很多有关程序员写爬虫被抓这样的新闻只因写了一段爬虫，公司200多人被抓！爬虫的本身是合法的，但是如何
Day47（补）【软考】2022年下半年软考软件设计师综合知识真题-计算机软件知识2 一个一定要撑住的学习者 #软件设计师算法
文章目录2022年下半年软考软件设计师综合知识真题第1章计算机系统基础知识(18/38)计算机软件知识2-6/6（其中一个做过）哲学概念及收敛思维：分母为0的故障哲学分类，考事务故障集合除数为零是否属于事务故障？哲学概念及收敛思维：Python3列表截取[max,min,-n]的哲学理解，输入-，考集合排列从大到小，range和list输入，考结束值min不在集合中哲学概念及收敛思维：**栈帧的核
nlp技术 tqs_12345 人工智能自然语言处理
自然语言处理（NaturalLanguageProcessing,NLP）技术是一种计算机科学与人工智能的交叉领域，涉及机器对人类语言进行处理和理解的能力。以下是一些常见的NLP技术的示例：1.机器翻译：NLP技术可以帮助机器将一种语言翻译成另一种语言。例如，谷歌翻译使用NLP技术实现自动翻译，用户可以输入一段文本，然后谷歌翻译会自动将其翻译成其他语言。2.文本分类：NLP技术可以将文本分类到不同
景联文科技数据处理平台：支持高质量图像标注服务景联文科技人工智能科技计算机视觉
图像标注是计算机视觉领域中不可或缺的一环，它通过为图像添加标签来帮助机器学习算法理解图像内容。这一过程对于创建高质量的训练数据集至关重要，使得AI模型能够准确地识别和分类现实世界中的物体。常见的图像标注类型：边界框标注：这是最常用的标注方式之一，通常用于物体检测任务。通过绘制矩形框来确定图像中目标物体的位置，可以是二维或三维形式。分割标注：包括语义分割（同一类别的所有实例被视为整体）和实例分割（每
【Stable Diffusion部署至GNU/Linux】安装流程星星点点洲 stable diffusion
以下是安装StableDiffusion的步骤，以Ubuntu22.04LTS为例子。显卡与计算架构介绍CUDA是NVIDIAGPU的专用并行计算架构技术层级说明CUDAToolkit提供GPU编译器(nvcc)、数学库(cuBLAS)等开发工具cuDNN深度神经网络加速库（需单独下载）GPU驱动包含CUDADriver（需与CUDAToolkit版本匹配）CUDA与NIDIA：硬件指令集绑定：N
《深入浅出多模态》（五）：多模态经典模型ALBEF GoAI 深入浅出多模态多模态大模型 LLM 深度学习人工智能
AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料，配有全面而有深度的专栏内容，包括不限于前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关（简历撰写技巧、面经资料与心得）多方面综合学习平台，强烈推荐AI小白及AI爱好者学习，性价比非常高！加入星球➡️点击链接✨专栏介绍：</
轻量级的注意力网络（LANMSFF）模型详解及代码复现清风AI 深度学习算法详解及代码复现深度学习人工智能神经网络 python 计算机视觉
定义与特点在深度学习领域，轻量化网络设计已成为一个重要的研究方向。LANMSFF模型作为一种新型的轻量级网络架构，在保持高性能的同时，显著降低了模型的复杂度。LANMSFF模型的核心特点可以概括为以下几个方面：轻量级设计：通过精心设计的网络结构和参数优化，在保持较高性能的同时，显著降低了模型的复杂度。注意力机制：引入了一种新的注意力机制，能够有效地捕捉图像中的关键特征，提高模型的表达能力。多尺度特
TPAMI 2024 | SSR-2D: 从2D图像进行语义3D场景重建小白学视觉论文解读 IEEE TPAMI 深度学习顶刊论文论文解读 TPAMI
论文信息题目：SSR-2D:Semantic3DSceneReconstructionFrom2DImagesSSR-2D:从2D图像进行语义3D场景重建作者：JunwenHuang,AlexeyArtemov,YujinChen,ShuaifengZhi,KaiXu,andMatthiasNießner论文创新点首次提出了一种基于深度学习的方法，能够在不使用任何3D标注的情况下，从不完整的RGB
spiking neural network概念学习 Zaгathustra 科研工作深度学习神经网络机器学习
我们认为，SNNs最大的优势在于其能够充分利用基于时空事件的信息。今天，我们有相当成熟的神经形态传感器，来记录环境实时的动态改变。这些动态感官数据可以与SNNs的时间处理能力相结合，以实现超低能耗的计算。在此类传感器中使用SNNs主要受限于缺乏适当的训练算法，从而可以有效地利用尖峰神经元的时间信息。实际上就精度而言，在大多数学习任务中SNNs的效果仍落后于第二代的深度学习。很明显，尖峰神经元可以实
第二章：13.1 机器学习的迭代发展望云山190 机器学习人工智能
目录机器学习模型开发流程构建电子邮件垃圾邮件分类器示例总结垃圾邮件分类示例构建垃圾邮件分类器机器学习模型开发流程确定系统架构：首先，需要决定机器学习系统的总体架构，这包括选择合适的模型、确定使用的数据集、可能还包括选择超参数等。实现和训练模型：根据上述决定，实现并训练一个模型。通常，第一次训练的模型不会立即达到预期的效果。诊断和调整：对模型进行诊断，查看算法的偏差、方差或进行错误分析。根据诊断结果
深度学习（1)-简单神经网络示例 yyc_audio 深度学习人工智能
我们来看一个神经网络的具体实例：使用Python的Keras库来学习手写数字分类。在这个例子中，我们要解决的问题是，将手写数字的灰度图像（28像素×28像素）划分到10个类别中（从0到9）。我们将使用MNIST数据集，图2-1给出了MNIST数据集的一些样本。在机器学习中，分类问题中的某个类别叫作类（class），数据点叫作样本（sample），与某个样本对应的类叫作标签（label）。你不需要现
Java 核心与应用：Java 输入输出流概述星核日记《Java 核心与应用》java 开发语言
目录Java核心与应用：Java输入输出流概述主题：Java核心与应用：引言学习目标1.Java输入输出流基础1.1输入输出流的概念1.1.1流的分类1.1.2常用输入输出流接口1.2输入输出流的接口继承图1.3常用输入输出流接口的方法1.3.1`InputStream`常用方法1.3.2`OutputStream`常用方法1.4装饰器模式在IO体系中的应用1.4.1装饰器模式示例1.4.2装饰器
理论一、大模型—概念伯牙碎琴大模型自然语言处理 ai
一、总述大模型通常指的是参数规模庞大、训练难度较高的人工智能模型。随着深度学习技术的发展，研究人员和企业越来越倾向于构建更大的模型，以提高模型的性能和泛化能力。这些大模型往往需要大量的数据和计算资源来训练，并且在实际应用中通常表现出色。大模型全称是大型语言模型（LLM，LargeLanguageModel），这个“大”主要指模型结构容量大，结构中的参数多，用于预训练大模型的数据量大。一个大模型可以
一、大模型微调的前沿技术与应用伯牙碎琴大模型微调人工智能大模型微调 Deepseek
大模型微调的前沿技术与应用随着大规模预训练模型（如GPT、BERT、T5等）的广泛应用，大模型微调（Fine-Tuning,FT）成为了提升模型在特定任务中性能的关键技术。通过微调，开发者可以根据实际需求调整预训练模型的参数，使其更好地适应特定应用场景。本文将介绍大模型微调技术的前沿发展，分析不同微调方法的特点、适用场景以及优缺点，并对它们进行系统分类。微调技术的重要性大模型微调能够帮助开发者根据
根据deepseek模型微调训练自动驾驶模型及数据集的思路 ywfwyht 自动驾驶深度学习人工智能自动驾驶人工智能机器学习
以下是使用DeepSeek模型微调训练自动驾驶模型的详细步骤和代码示例。本流程假设你已有自动驾驶领域的数据集（如驾驶指令、传感器数据等），并基于PyTorch框架实现。Step1:环境准备#安装依赖库pipinstalltorchtransformersdatasetsnumpypandasStep2:数据准备假设数据集格式为JSON，包含输入文本（传感器/场景描述）和输出控制指令：//data/
如何通过项目缺陷管理表提升项目质量？项目管理
在软件开发过程中，项目缺陷管理表是一个不可或缺的工具，它能够有效地追踪、记录和管理项目中出现的各种问题。通过系统化地使用项目缺陷管理表，我们可以显著提升项目质量，降低风险，并确保最终交付的产品满足客户期望。本文将深入探讨如何充分利用项目缺陷管理表来提升项目质量。项目缺陷管理表不仅仅是一个简单的问题清单，它是一个强大的质量管理工具。通过记录、分类和跟踪缺陷，项目团队可以全面了解项目的健康状况，识别潜
人工智能的本质解构：从二进制桎梏到造物主悖论 Somnolence.·.·.·. 人工智能人工智能 ai
一、数学牢笼中的困兽：人工智能的0-1本质人工智能的底层逻辑是数学暴力的具象化演绎。晶体管开关的物理震荡被抽象为布尔代数的0-1序列，冯·诺依曼架构将思维简化为存储器与运算器的机械对话。即使深度神经网络看似模拟人脑突触，其本质仍是矩阵乘法的迭代游戏——波士顿动力机器人的空翻动作不过是微分方程求解的物理引擎呈现，AlphaGo的围棋神话只是蒙特卡洛树搜索的概率统计。这种基于有限离散数学的架构，注定人
YOLOv11 火焰识别：智能时代的火灾预警新利器星际编程喵 Python探索之旅 YOLO python 目标检测机器学习人工智能开发语言
前言随着人工智能（AI）在各个领域如火如荼发展，图像识别技术也跟着飞速进步。从最初的传统算法到如今的深度学习模型，图像识别在准确性和效率上提升令人惊叹。而在这场技术革命中，YOLO（YouOnlyLookOnce）系列模型无疑扮演举足轻重的角色。今天，我们将目光聚焦在最新的版本——YOLOv11。别误会，YOLOv11可不是什么随便升级。它远不止数字上多了个“1”那么简单。YOLOv11集成许多先
【AI中的数学-人工智能的数学基石】AI的心脏：探索人工智能的算法与核心技术云博士的AI课堂 AI中的数学人工智能算法数学 AI数学大模型
第一章人工智能的数学基石第二节AI的心脏：探索人工智能的算法与核心技术人工智能（AI）的迅猛发展离不开其背后的复杂算法与核心技术。这些算法不仅决定了AI系统的性能和能力，也构成了AI应用的基础。从基础的机器学习算法到先进的深度学习模型，AI的算法生态系统丰富多样，涵盖了广泛的数学原理和计算方法。本节将深入探讨驱动AI进步的关键算法与技术，揭示其工作机制及在实际应用中的重要性。一、机器学习：智能的基
文本生成型人工智能：逻辑算法与文字组合的重构艺术 Somnolence.·.·.·. 人工智能人工智能算法重构人机交互 ai chatgpt
引言在数字化浪潮的推动下，文本生成型人工智能（如GPT系列、Claude、Deepseek等）正逐步从技术工具演化为人类社会的"数字镜像"。其本质并非简单的文字堆砌，而是基于算法逻辑对海量语言数据的学习与重组。这一过程既模仿了人类的思维模式，又受制于技术基础设施的物理边界。以下从三个维度解析其运行逻辑与技术哲学。一、数据训练：从概率统计到仿生逻辑的跨越文本生成型AI的核心在于通过神经网络模型对语言
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本

resnet18实现cifar10分类

实验步骤

搭建resnet18网络

数据集加载

模型训练和改进

分析评估

Kaggle提交

网络构建

定义残差块

定义模型网络

数据集加载

__init__

__getitem__

__len__

调用

模型训练

初始设置

损失函数

优化器

加载模型

训练

评估

定义Metric类

训练过程中的评估

保存模型

模型改进

网络改进

调整参数

固定学习率

学习率衰减

分析评估

网络对比(exp,exp2,exp3)

学习率对比(exp3,exp4,exp5,exp6,exp7,exp8)

预训练对比(exp,exp9)

预训练和网络结构的对比(exp3,exp9)

Kaggle提交

你可能感兴趣的:(深度学习,分类,深度学习,pytorch,神经网络,kaggle)

init

getitem

len