永不言弃h

【学习笔记】CNN构建卷积神经网络笔记

CNN构建卷积神经网络笔记

文章目录

- - CNN构建卷积神经网络笔记
  - - pytorch的类
    - - DataLoader
      - DataLoader简介
        
        DataLoader如何遍历
        
        Sequential
      - 构建卷积神经网络的类
      - 计算准确率
      - 训练过程
      - 利用GPU运行pytorch
      - 备注

pytorch的类

DataLoader

DataLoader简介

官网的解释：

CLASStorch.utils.data.DataLoader(dataset, batch_size=1, shuffle=None, sampler=None, batch_sampler=None, num_workers=0, collate_fn=None, pin_memory=False, drop_last=False, timeout=0, worker_init_fn=None, multiprocessing_context=None, generator=None, ***, prefetch_factor=None, persistent_workers=False, pin_memory_device=‘’)

DataLodaer

Parameters:

dataset (Dataset) – dataset from which to load the data.
batch_size (int, optional) – how many samples per batch to load (default: 1).
shuffle (bool, optional) – set to True to have the data reshuffled at every epoch (default: False).
sampler (Sampler or Iterable*,* optional) – defines the strategy to draw samples from the dataset. Can be any Iterable with __len__ implemented. If specified, shuffle must not be specified.
batch_sampler (Sampler or Iterable*,* optional) – like sampler, but returns a batch of indices at a time. Mutually exclusive with batch_size, shuffle, sampler, and drop_last.
num_workers (int, optional) – how many subprocesses to use for data loading. 0 means that the data will be loaded in the main process. (default: 0)
collate_fn (Callable*,* optional) – merges a list of samples to form a mini-batch of Tensor(s). Used when using batched loading from a map-style dataset.
pin_memory (bool, optional) – If True, the data loader will copy Tensors into device/CUDA pinned memory before returning them. If your data elements are a custom type, or your collate_fn returns a batch that is a custom type, see the example below.
drop_last (bool, optional) – set to True to drop the last incomplete batch, if the dataset size is not divisible by the batch size. If False and the size of dataset is not divisible by the batch size, then the last batch will be smaller. (default: False)
timeout (numeric*,* optional) – if positive, the timeout value for collecting a batch from workers. Should always be non-negative. (default: 0)
worker_init_fn (Callable*,* optional) – If not None, this will be called on each worker subprocess with the worker id (an int in [0, num_workers - 1]) as input, after seeding and before data loading. (default: None)
generator (torch.Generator, optional) – If not None, this RNG will be used by RandomSampler to generate random indexes and multiprocessing to generate base_seed for workers. (default: None)
prefetch_factor (int, optional*,* keyword-only arg) – Number of batches loaded in advance by each worker. 2 means there will be a total of 2 * num_workers batches prefetched across all workers. (default value depends on the set value for num_workers. If value of num_workers=0 default is None. Otherwise if value of num_workers>0 default is 2).
persistent_workers (bool, optional) – If True, the data loader will not shutdown the worker processes after a dataset has been consumed once. This allows to maintain the workers Dataset instances alive. (default: False)
pin_memory_device (str, optional) – the data loader will copy Tensors into device pinned memory before returning them if pin_memory is set to true.

dataset:从中加载数据集

batch_size:每次所取的数量，默认值为1

shuffle :如果shuffle=True则表明将数据打乱随机获取一个batch_size个数据，shuffle=False相反。

DataLoader如何遍历

这里将train_loader每次会随机获取一个batch的数据以及标签每一个data[index]都是一张图片，每一个tatget[index]是该图标的标签。

train_loader=torch.utils.data.DataLoader(dataset=train_dataset,
                                         batch_size=batch_size,
                                         shuffle=True)
                                         
for batch_idx,(data,tatget) in enumerate(train_loader):
    print(batch_idx,data.shape,tatget.shape)

输出：

1 torch.Size([64, 1, 28, 28]) torch.Size([64])
2 torch.Size([64, 1, 28, 28]) torch.Size([64])
3 torch.Size([64, 1, 28, 28]) torch.Size([64])
4 torch.Size([64, 1, 28, 28]) torch.Size([64])
'''
936 torch.Size([64, 1, 28, 28]) torch.Size([64])
937 torch.Size([32, 1, 28, 28]) torch.Size([32])

Sequential

构建一个序列化的container，可以把想要在神经网络中添加的操作都放进去，按顺序进行执行。

比如：

model = nn.Sequential(
          nn.Conv2d(1,20,5),
          nn.ReLU(),
          nn.Conv2d(20,64,5),
          nn.ReLU()
        )

看着里面的参数，非常的多，但其实很多都有默认值，下面我们来看下给出的参数解释：

in_channels (int) - 输入图像中的通道数

out_channels (int) – 卷积产生的通道数即输出图片的通道数

kernel_size (int or tuple) – 卷积核的大小(可以是个数，也可以是元组)

**stride (int or tuple, optional) **-- 卷积的步幅。默认值：1

**padding (int, tuple or str, optional) **– 填充添加到输入的所有四个边。默认值：0

padding_mode (string, optional) –填充的几个选择 ‘zeros’, ‘reflect’, ‘replicate’ 或 ‘circular’。默认值：“零”

dilation (int or tuple, optional) – 内核元素之间的间距。默认值：1

groups (int, optional) – 从输入通道到输出通道的阻塞连接数。默认值：1

bias (bool, optional) – 如果为真，则为输出添加可学习的偏差。默认值：真

构建卷积神经网络的类

卷积计算公式：
$N=\frac{W-F+2P}{S}+1$

W为输入大小，F为卷积核大小，P为填充大小(padding)，S为步长(stride)，N为输出大小。

输入一张1×28×28>>conv>>ReLu>>MaxPool2dconv>>ReLu>>MaxPool2d>>Linear

class CNN(nn.Module):
    def __init__(self):
        super(CNN,self).__init__()
        self.conv1=nn.Sequential(    # 输入大小（1,28,28）
            nn.Conv2d(
                in_channels=1,       # 输入的张量的维数 灰度图像
                out_channels=16,     # 输出的张量的维数 要得到几个特征图
                kernel_size=5,       # 卷积核大小 5*5
                stride=1,            # 步长
                padding=2
            ),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2)
        )
        self.conv2=nn.Sequential(
            nn.Conv2d(16,32,5,1,2), #输出（32,14,14）
            nn.ReLU(),
            nn.MaxPool2d(2), # 输出 32*7*7
        )
        self.out=nn.Linear(32*7*7,10)

    def forward(self,x):
        """前向传播"""
        x=self.conv1(x)
        x=self.conv2(x)
        x=x.view(x.size(0),-1) # flatten操作
        output=self.out(x)
        return output

计算准确率

torch.max(input,dim)：imput输入一个tensor,dim是索引的维度，0是每列的最大值，1是每行的最大值。

view_as:返回被视作与给定的tensor相同大小的原tensor。

代码：

def accuracy(predictions, lables):
    # 返还的是正确的个数和标签的个数
    pred = torch.max(predictions.data, 1)[1]
    rights = pred.eq(lables.data.view_as(pred)).sum()
    return rights, len(lables)

right = accuracy(output, tatget)

训练过程

for epoch in range(num_epochs):
    train_rights = []

    for batch_idx, (data, tatget) in enumerate(train_loader):
        net.train()
        output = net(data)
        # 计算损失函数
        loss = criterion(output, tatget)
        # 随机梯度下降
        optimizer.zero_grad()
        # 反向传播
        loss.backward()
        """
        optimizer.step()????
        跟新参数？？？
        反向传播后不更新参数  当然没法训练啊
        """
        optimizer.step()

        # 计算准确率
        right = accuracy(output, tatget)

        train_rights.append(right)

        if batch_idx % 100 == 0:
            net.eval()
            val_rights = []

            for (data, target) in test_loader:
                output = net(data)
                right = accuracy(output, target)
                val_rights.append(right)

            # 准确率计算
            train_r = (sum([tup[0] for tup in train_rights]), sum([tup[1] for tup in train_rights]))
            val_r = (sum([tup[0] for tup in val_rights]), sum([tup[1] for tup in val_rights]))

            print(
                '当前epoch: {} [{}/{} ({:.0f}%)]\t损失: {:.6f}\t训练集准确率: {:.2f}%\t测试集正确率: {:.2f}%'.format(
                    epoch, batch_idx * batch_size, len(train_loader.dataset),
                           100. * batch_idx / len(train_loader),
                    loss.data,
                           100. * train_r[0].numpy() / train_r[1],
                           100. * val_r[0].numpy() / val_r[1]))

利用GPU运行pytorch

在容器内部访问时，需要配置GPU。

这里采用在dockerhub中拉去一个anaconda，将服务器中的目录挂在到容器内使用。

执行以下命令从docker仓库拉取一个conda镜像，将所有GPU给容器使用。

docker run -i -t --gpus all -v /data2/home/liguochun/:/tmp --name liguochun_conda2 continuumio/anaconda3 /bin/bash

执行一下命令查看容器中是否可以运行GPU

nvidia-smi

备注

以下补充docker的使用。

拉去一个镜像

$ docker pull ubuntu

运行容器，以命令行模式进入终端

$ docker run -it ubuntu /bin/bash

OPTIONS说明：

-a stdin: 指定标准输入输出内容类型，可选 STDIN/STDOUT/STDERR 三项；
-d: 后台运行容器，并返回容器ID；
-i: 以交互模式运行容器，通常与 -t 同时使用；
-P: 随机端口映射，容器内部端口随机映射到主机的端口
-p: 指定端口映射，格式为：主机(宿主)端口:容器端口
-t: 为容器重新分配一个伪输入终端，通常与 -i 同时使用；
–name=“nginx-lb”: 为容器指定一个名称；
–dns 8.8.8.8: 指定容器使用的DNS服务器，默认和宿主一致；
–dns-search example.com: 指定容器DNS搜索域名，默认和宿主一致；
-h “mars”: 指定容器的hostname；
-e username=“ritchie”: 设置环境变量；
–env-file=[]: 从指定文件读入环境变量；
–cpuset=“0-2” or --cpuset=“0,1,2”: 绑定容器到指定CPU运行；
**-m:**设置容器使用内存最大值；
–net=“bridge”: 指定容器的网络连接类型，支持 bridge/host/none/container: 四种类型；
–link=[]: 添加链接到另一个容器；
–expose=[]: 开放一个端口或一组端口；
–volume , -v: 绑定一个卷
**–gpus all：**将宿主机上的GPU提供给容器使用

停止一个容器

$ docker stop ubuntu

启动停止的容器

$ docker start myrunoob

重启容器

$ docker restart myrunoob

进入容器

$ sudo docker exec -it 775c7c9ee1e1 /bin/bash

你可能感兴趣的:(pyTorch,学习,笔记,cnn)

Pytorch实现之利用特征分布的差异来指导GAN的训练这张生成的图像能检测吗优质GAN模型训练自己的数据集 GAN系列 pytorch 生成对抗网络人工智能神经网络深度学习计算机视觉机器学习
简介简介：FIDGAN通过将FID损失引入GAN的训练过程，显著提升了生成图像的质量。其核心思想是利用特征分布的差异来指导生成器的训练，同时通过使用轻量级的MobileNet-v3提高了计算效率。这种方法在图像生成任务中具有广泛的应用前景。论文题目：FIDGAN:AGenerativeAdversarialNetworkwithAnInceptionDistance（FIDGAN：具有初始距离的生
Pytorch实现论文之利用多生成器来预防模式崩溃这张生成的图像能检测吗 GAN系列优质GAN模型训练自己的数据集人工智能 python 生成对抗网络机器学习 pytorch 深度学习计算机视觉
简介简介：一般来说，生成器相比判别器要完成的任务更加困难，前者需要完成数据概率密度的拟合，而后者只需要判别真伪，影响GAN性能的一个问题就是模式奔溃。而采用多生成器可以缓解这个问题。论文中主要设计了多生成器的架构和一个对于鉴别器的新损失设计来缓解这个问题。模型结构采用DCGAN的框架，原始损失基于WGAN-GP的设计理念。论文题目：StudyofPreventionofModeCollapsein
江科大51单片机学习笔记（1）悠闲漫步者 51单片机 51单片机学习笔记
点亮一个LEDLED介绍中文名：发光二极管外文名：LightEmittingDiode简称：LED用途：照明、广告灯、指引灯、屏幕。如果想让LED发光，需要让发光二极管两端产生电位差。LED模块中串并联电阻是为了保护电路（限流）电阻的运算(上图电阻中所标注)：102(1010^2=1000=1K)473(4710^3=47000=47K)1001(100*10^1=1000=1K)VCC：电源正极
信息管理与信息系统专业总结&不存在计算机专业歧视 WhyteHighmore 感悟与总结
所有边缘交叉学科的人，这篇文章都适用就像我的专业信息管理与信息系统那样！多而不精，而我也同样继承了我专业的特点，但计算机除外。但我很庆幸选报这个专业，也很推荐这个专业。它能让你在高考报考的迷茫期后有更多的选择余地，你可以通过专业了解三大行业，并作出对某一个喜欢行业的努力，不至于学习的不是喜欢的。比如本次vivo组织的篮球赛，上面有说。初次之外我参加过手球赛、羽毛球赛、排球赛。学过网球、游泳、乒乓球
学习疯狂JAVA讲义——运算符与位运算符红鲤鱼与绿鲤鱼与哈士奇学习 java 开发语言
笔记备忘，方便以后忘了查询（如有错误，敬请指点）★变量：-变量的定义、赋值(简单值、表达式）-8个基本类型：byte、short、int、long、float、double、char、boolean★运算符▲算数运算符(7个)：+、-、*、/、%++：将单个变量的值加1放在变量之后：表示先用变量的值，再自加放在变量之前：表示先自加，再用变量的值--：将单个变量的值减1放在变量之后：表示先用变量的值
如何连接别人的redis服务器吗? 黑客KKKing 网络安全网络工程师计算机电脑 web安全网络安全
电脑怎么连接别的网络“笔记本电脑无法连接无线网络怎么办？”，说到这个问题，小编对这样类型的问题还真的回答了不少了，无非就那么几种情况，一一的排除，就找到问题的所在问题了，那么怎么排除或者解决呢？下面电脑知识吧的小编就简单分享一下吧：解决分析思路:手机可以可以连接到无线网络，说明无线信号没有问题，路由器应该也没问题，问题更大的可能是在电脑的设置、首先，驱动程序是否正常安装、检查这个，通常可以右键“我
深入浅出：CUDA是什么，如何利用它进行高效并行计算码上飞扬 CUDA
在当今这个数据驱动的时代，计算能力的需求日益增加，特别是在深度学习、科学计算和图像处理等领域。为了满足这些需求，NVIDIA推出了CUDA（ComputeUnifiedDeviceArchitecture），这是一种并行计算平台和编程模型。本文将带你全面了解CUDA的基本概念、工作原理及其应用场景。一、什么是CUDA？CUDA（ComputeUnifiedDeviceArchitecture）是由
咱们一起学C++ 第二百三十三篇之C++容器类与模板的探索一杯年华@编程空间咱们一起学习C++c++开发语言 spring boot struts
咱们一起学C++第二百三十三篇之C++容器类与模板的探索大家好！C++作为一门强大的编程语言，容器类和模板是其中非常重要的特性。今天咱们就一起来深入学习这两个知识点，希望能和大家一起进步，让我们在C++编程的道路上走得更远！一、容器类的重要性与实际应用场景在C++编程中，容器类扮演着至关重要的角色。我们在编写程序时，经常会遇到需要处理大量数据或者管理多个对象的情况。比如开发一个学生信息管理系统，需
【深度学习】学习率调度策略黑白交界深度学习学习深度学习
什么是学习率可以理解为模型在每一次迭代中的模型更新调整的幅度，“学习”新信息的速度。学习率定义了模型权重（参数）在梯度下降或其他优化算法中的更新步伐。较大的学习率意味着在每次参数更新时，模型会进行更大幅度的调整，而较小的学习率则意味着细致的、渐进的调整。适当的学习率可以帮助模型跳出局部最优解。当使用较大的学习率时，模型有可能跨越一些小的局部最优，从而找到全局最优解，但也有可能错过全局最优。因此，在
【深度学习pytorch-93】Transformer 相比 RNN 的优势华东算法王 DL-pytorch 深度学习 pytorch transformer
Transformer相比RNN的优势Transformer和RNN（循环神经网络）都是自然语言处理（NLP）领域的重要架构，但它们的工作原理和应用方式有很大不同。Transformer由于其独特的结构和机制，在多个方面优于RNN。以下是Transformer相比RNN的主要优势：1.并行计算能力RNN的局限性RNN是按顺序处理输入的，即每个时间步的输出都依赖于前一个时间步的输出。这意味着，在训练
深度学习模型中的知识蒸馏是如何工作的? c++服务器开发深度学习人工智能
深度学习模型在多个领域，特别是计算机视觉和自然语言处理中，已经取得了革命性的进展。然而，随着模型复杂性和资源需求的不断攀升，如何将这些庞大模型的知识浓缩为更紧凑、更高效的形式，成为了当前研究的热点。知识蒸馏，作为一种将知识从复杂模型转移到更简单模型的策略，已经成为实现这一目标的有效工具。在本文中，我们将深入探究深度学习模型中知识蒸馏的概念、原理及其在各领域的应用，以期为读者提供一个全面而严谨的视角
从一秒四笔数据中探寻期货市场的交易机会 2401_89140926 大数据金融数据库开发数据库
从一秒四笔数据中探寻期货市场的交易机会为了促进学习和研究，我们在此分享一部分匿名处理的Level2高频Tick数据。历史期货高频tick五档level2请注意，分享这些数据的目的是为了教育和研究，不构成任何投资建议。需要注意的是，虽然五档历史Level2行情数据具有很高的研究价值，但在实际应用中，我们还需结合其他市场信息和技术分析方法，以提高研究的准确性和有效性。此外，市场环境不断变化，投资者在运
【核心算法篇七】《DeepSeek异常检测：孤立森林与AutoEncoder对比》再见孙悟空_ 「2025 DeepSeek技术全景实战」算法分布式 docker 计算机视觉人工智能自然语言处理 DeepSeek
大家好，今天我们来深入探讨一下《DeepSeek异常检测：孤立森林与AutoEncoder对比》这篇技术博客。我们将从核心内容、原理、应用场景等多个方面进行详细解析，力求让大家对这两种异常检测方法有一个全面而深入的理解。一、引言在数据科学和机器学习领域，异常检测（AnomalyDetection）是一个非常重要的任务。它的目标是从数据集中识别出那些与大多数数据显著不同的异常点。这些异常点可能是由于
跟我一起学Python数据处理（七十四）：数据处理工具与网页抓取入门 lilye66 python jupyter 开发语言爬虫
跟我一起学Python数据处理（七十四）：数据处理工具与网页抓取入门大家好！一直以来，我都坚信在学习的道路上，相互交流和共同进步是非常重要的。在Python数据处理这片充满挑战与机遇的领域，我也在持续学习和探索，希望借由这一系列的博客，能和大家一起深入钻研，共同成长。在上一篇博客中，我们学习了Jupyternotebook的相关知识，今天咱们接着来了解Python数据处理中的其他关键内容，包括一些
Electron学习星空0107 electron javascript ecmascript
Electron的简介Electron基于chromium和Node.js，让我们可以使用Javascript,HTML,CSS构建跨平台的桌面应用程序，同时Electron兼容Mac,Window,和Linux,可以构建出三个平台的应用程序Electron的安装运行cmd,输入npminit，然后一直按enter换行即可输入cnpmielectron-S（如果电脑没有安装cnpm会报错，需要安装
electron学习笔记 weixin_46452138 electron 学习 javascript
electron个人学习笔记一、electron简单了解Electron是一个跨平台的、基于Web前端技术的桌面GUI应用程序开发框架。可以使用HTML、CSS来绘制界面和控制布局，使用JavaScript来控制用户行为和业务逻辑，使用Node.js来通信、处理音频视频等，几乎所有的Web前端技术和框架（jQuery、Vue、React、Angular等）都可以应用到桌面GUI开发中。二、开发前基
STL-vector,set,string,map,queue,priority_queue,stack,pair算法笔记 cloudless_sky STL c++stl
STL:standardtemplatelibrary标准模板库，封装了很多实用的容器。（一）vectorvector是一个容器。是个类。底层数据结构是数组。vector:向量，变长数组，即“长度根据需要而自动改变的数组”。使用前提：#includeusingnamespacestd;1、vector定义vectorname;以上是长度可以根据需要变化的一位数组，typename可以是任何基本类型
吐血整理！权重持久化方案优化，让你的模型性能飙升盼达思文体科创经验分享
吐血整理！权重持久化方案优化，让你的模型性能飙升引言你是否在做深度学习项目时，遭遇过模型训练结果无法有效保存，导致之前的努力付诸东流的痛苦？又或者在模型权重持久化时，发现保存和加载的速度极慢，严重影响项目进度？今天咱们就来好好聊聊权重持久化方案的优化，帮你解决这些让人头疼的问题！核心内容❗传统方案痛点：大多数人都踩过的坑在很多深度学习项目里，大家常用的权重持久化方案存在不少问题。比如说，使用普通的
吐血整理！模型热加载能力大比拼，谁才是真正王者？盼达思文体科创经验分享
吐血整理！模型热加载能力大比拼，谁才是真正王者？引言你是否在开发过程中，为了模型更新而频繁重启服务，浪费大量时间？又是否疑惑为什么有些模型加载速度快如闪电，而有些却慢得像蜗牛？今天就带你深入了解模型热加载能力的支持对比，让你不再为模型加载问题而烦恼！核心内容模型热加载概念科普场景化描述：想象一下，你正在运营一个基于机器学习模型的在线推荐系统。当你训练出了一个新的、性能更好的模型时，如果不能进行热加
数据分析利器：COMEX外盘期货主力连续合约与月份合约研究方法银河金融数据库外盘期货高频历史行情数据下载数据分析区块链数据挖掘金融
数据分析利器：COMEX外盘期货主力连续合约与月份合约研究方法为了促进学习和研究，我们在此分享一部分匿名处理的外盘期货高频历史行情数据集。外盘期货分钟高频历史行情数据链接:https://pan.baidu.com/s/19zhe1CCpDM56amDKO2nMwQ?pwd=4wpq提取码:4wpq请注意，分享这些数据的目的是为了教育和研究，不构成任何投资建议。关键词：量化;量化;贵金属;计算能力
electron 学习 jingxindeyi #学习 electron 入门
文章目录1.注意项1.1安装前最好设置一下代理官网tutorialhttps://www.electronjs.org/docs/latest/tutorial/tutorial-prerequisites1.注意项1.1安装前最好设置一下代理npmconfigsetregistryhttps://registry.npmmirror.com/
Python从0到100（四）：Python中的运算符介绍(补充) 是Dream呀 python java 数据库
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Python从0到100（三十五）：beautifulsoup的学习是Dream呀 Dream的茶话会 python beautifulsoup 学习
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Python学习笔记 - Python数据类型 yunfan188 #Python学习笔记 Python Python数据类型
前言在Python语言中，所有的数据类型都是类，每一个变量都是类的“实例”。没有基本数据类型的概念，所以整数、浮点数和字符串也都是类。Python有6种标准数据类型：数字、字符串、列表、元组、集合和字典，而列表、元组、集合和字典可以保存多项数据，它们每一个都是一种数据结构，因此可以称这四种为“数据结构”类型。本文我们主要介绍数字和字符串类型。一、数字类型Python数字类型有4种：整数类型、浮点数
《深入浅出AI》前言知识：深度学习基础总结 GoAI 深入浅出AI 人工智能深度学习机器学习 cnn rnn 生成对抗网络神经网络
个人主页:GoAI|公众号:GoAI的学习小屋|交流群:704932595|个人简介：掘金签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星计划计算机视觉方向导师等，专注大数据与人工智能知识分享。AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成
模型保存、训练与验证钰见梵星小土堆PyTorch深度学习深度学习人工智能
模型保存、训练与验证网络模型的保存与读取在PyTorch中，模型的保存与加载有两种主要方式：保存&加载完整模型（包括网络结构和参数）只保存&加载模型参数（推荐方式）可以直接跳过看最后几行。PyTorch提供torch.save()方法来保存模型，可以选择保存整个模型结构或只保存参数。保存整个模型importtorchfromtorchvisionimportmodels#加载VGG16模型（未使用
python中的深度学习框架TensorFlow 和 PyTorch 有什么区别？大懒猫软件 python 深度学习 tensorflow pytorch
TensorFlow和PyTorch是目前最流行的两个深度学习框架，它们在设计理念、使用方式和社区支持等方面存在一些显著的区别。以下是它们的主要区别：1.设计理念TensorFlow：静态计算图：TensorFlow使用静态计算图，即在运行模型之前需要先定义整个计算图。这使得TensorFlow在大规模分布式训练和部署时具有优势，但调试和动态修改模型时可能不够灵活。功能全面：TensorFlow提
美股分钟级数据在量化策略回测中的重要性分析 hightick 股票level2逐笔历史数据金融数据库
美股分钟级数据在量化策略回测中的重要性分析为了促进学习和研究，我们在此分享一部分匿名处理的历史美股分钟高频数据。历史美股分钟高频数据链接:https://pan.baidu.com/s/132FzyihmcRtKVgQohtLUBw?pwd=sigv提取码:sigv请注意，分享这些数据的目的是为了教育和研究，不构成任何投资建议。关键词：量化策略优化;量化模型分钟数据;市场情绪监测;历史分钟成交量;
c#基础入门懒羊羊我小弟 C#c#linq .net
c#入门一、简介C#是由AndersHejlsberg和他的团队在.Net框架开发期间开发的。C#是一个现代的、通用的、面向对象的编程语言，专为公共语言基础结构（CLI）设计的。CLI由可执行代码和运行时环境组成，允许在不同的计算机平台和体系结构上使用各种高级语言。C#的特点：现代的、通用的编程语言。面向对象。面向组件。容易学习。结构化语言。它产生高效率的程序。它可以在多种计算机平台上编译。.Ne
C# 零基础入门知识点汇总陈言必行ジ﹋★☆『C #...』《百识百例带你零基础入门C#》c#开发语言 java
C#零基础入门知识点汇总前言一，基础语法（1~10）二，流程控制（11~20）三，数组相关（21~30）四，函数介绍（31~40）五，类和对象（41~50）六，面向对象（51~60）七，结构体和枚举（61~70）八，委托和事件（71~80）九，泛型和系统类（81~90）十，其他知识点（91~100）后语前言本文属于C#零基础入门之百识百例系列知识点整理目录。此系列文章旨在为学习C#语言的童鞋提供一
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他