winycg

优化Pytorch框架的数据加载过程

参考链接：
https://sagivtech.com/2017/09/19/optimizing-pytorch-training-code/
https://discuss.pytorch.org/t/how-to-speed-up-the-data-loader/13740/11

硬件层面：

将数据放到/dev/shm文件夹，这个目录是linux下一个利用内存虚拟出来的一个目录，这个目录中的文件都是保存在内存中，而不是磁盘上。/dev/shm的容量默认最大为内存的一半大小，使用df -h命令可以看到。

winycg@ubuntu:~$ df -h
Filesystem      Size  Used Avail Use% Mounted on
udev             79G     0   79G   0% /dev
tmpfs            16G   11M   16G   1% /run
/dev/sda6       188G  6.9G  172G   4% /
tmpfs           150G  105G   46G  70% /dev/shm
tmpfs           5.0M  4.0K  5.0M   1% /run/lock
tmpfs            79G     0   79G   0% /sys/fs/cgroup
/dev/sda1       453M   57M  369M  14% /boot
/dev/sda7       1.6T  295G  1.2T  20% /home
tmpfs            16G   56K   16G   1% /run/user/1000

在训练大规模数据集时，可以将数据集拷贝到/dev/shm，意味着在运行时数据全部都在内存，所以数据加载非常高效。代价是需要较大的内存。默认的/dev/shm目录大小一般难以满足我们的需求，使用如下命令重新分配：

sudo mount -o size=5128M  -o remount /dev/shm

软件层面：

使用pillow-simd替换到pillow库加速数据预处理：
在Anaconda安装的前提下：

$ pip uninstall pillow
$ conda uninstall --force jpeg libtiff -y
$ conda install -c conda-forge libjpeg-turbo
$ CC="cc -mavx2" pip install --no-cache-dir -U --force-reinstall --no-binary :all: --compile pillow-simd

线程调度

背景：

在使用深度学习训练模型时，训练数据需要经历如下的过程：从磁盘读到内存，然后在内存中通过CPU对其进行预处理，包括数据增强等等，预处理后的数据再被传入GPU的CUDA内存，此时位于GPU的模型就可以进行数据的读取了。
Pytorch定义的数据加载器DataLoader，可以允许我们多线程来实现上述的操作，可是整个过程就是串行操作的。此外，在GPU训练batch期间，不会提前准备下一个batch，这会造成一定的空闲时间。

优化方法:

创建两个队列：

输入图像队列：用于存放多线程并行加载和预处理得到的图像。
CUDA图像队列：将输入图像从“输入图像队列”传输到GPU内存。

在给定的示例中，采用4个并行的线程(workers)来进行输入图像的加载和预处理，处理后的结果会push到共享的输入图像队列，此外还必须保证图像生成器的线程安全。采用1个线程来实现输入图像传输到GPU内存。由此可以看出，输入图像的加载和预处理，CUDA传输以及GPU训练都在同时进行，大大减少了空闲等待时间，提高了资源利用率。

代码实现

所需数据文件索引文件train.txt,内容示例如下：
其中0和1代表图像的label

/home/data/images/1.JPEG 0
/home/data/images/2.JPEG 0
/home/data/images/3.JPEG 1
/home/data/images/4.JPEG 1

在这里，以训练LeNet为例实现数据加载优化的主框架，总过程如下：

import threading
import random
import torch
import time
import argparse
from queue import Empty, Queue
import torch.nn as nn
import torch.nn.functional as F
import torchvision.transforms as transforms
import torch.optim as optim
from PIL import Image

parser = argparse.ArgumentParser(description='More quick data loading for Pytorch')
parser.add_argument('-b', '--batch-size', default=8, type=int)
parser.add_argument('-epochs', '--num-epoches', type=int, default=10,
                    help='number of epochs to train')
parser.add_argument('-pj', '--preprocess-workers', default=4, type=int,
                    help='number of works for preprocessing data')
parser.add_argument('-cj', '--cuda-workers', default=1, type=int,
                    help='number of works for transfering tensors from CPU memory to CUDA memory')
parser.add_argument('-tm', '--train-batches-queue-maxsize', default=12, type=int,
                    help='maxsize of train batches queue')
parser.add_argument('-cm', '--cuda-batches-queue-maxsize', default=1, type=int,
                    help='maxsize of cuda batches queue')

args = parser.parse_args()
print(args)

class threadsafe_iter(object):
    """Takes an iterator/generator and makes it thread-safe by
    serializing call to the `next` method of given iterator/generator.
    """

    def __init__(self, it):
        self.it = it
        self.lock = threading.Lock()

    def __iter__(self):
        return self

    def __next__(self):
        with self.lock:
            return self.it.__next__()


def get_path_i(paths_count):
    """Cyclic generator of paths indice
    """
    current_path_id = 0
    while True:
        yield current_path_id
        current_path_id = (current_path_id + 1) % paths_count



class InputGen:
    def __init__(self, paths, batch_size):
        self.paths = paths
        self.index = 0
        self.batch_size = batch_size
        self.init_count = 0
        self.lock = threading.Lock()  # mutex for input path
        self.yield_lock = threading.Lock()  # mutex for generator yielding of batch
        self.path_id_generator = threadsafe_iter(get_path_i(len(self.paths)))
        self.images = []
        self.labels = []

    def pre_process_input(self, im):
        """ Do your pre-processing here
                Need to be thread-safe function"""
        transformer = transforms.Compose([
            transforms.RandomCrop(32),
            transforms.ToTensor()])
        im = transformer(im)
        return im

    def __next__(self):
        return self.__iter__()

    def __iter__(self):
        while True:
            # In the start of each epoch we shuffle the data paths
            with self.lock:
                if self.init_count == 0:
                    random.shuffle(self.paths)
                    self.images, self.labels = [], []
                    self.init_count = 1
            # Iterates through the input paths in a thread-safe manner
            for path_id in self.path_id_generator:
                try:
                    img, label = self.paths[path_id].split(' ')
                except ValueError:
                    continue  # ['\n']错误
                img = Image.open(img, "r")
                img = self.pre_process_input(img)
                # Concurrent access by multiple threads to the lists below
                with self.yield_lock:
                    self.images.append(img)
                    self.labels.append(float(label))
                    if len(self.images) % self.batch_size == 0:
                        yield torch.stack(self.images, dim=0), torch.tensor(self.labels, dtype=torch.long)
                        self.images, self.labels = [], []
            # At the end of an epoch we re-init data-structures
            with self.lock:
                self.init_count = 0

    def __call__(self):
        return self.__iter__()

class thread_killer(object):
    """Boolean object for signaling a worker thread to terminate
    """

    def __init__(self):
        self.to_kill = False

    def __call__(self):
        return self.to_kill

    def set_tokill(self, tokill):
        self.to_kill = tokill


def threaded_batches_feeder(tokill, batches_queue, dataset_generator):
    """Threaded worker for pre-processing input data.
    tokill is a thread_killer object that indicates whether a thread should be terminated
    dataset_generator is the training/validation dataset generator
    batches_queue is a limited size thread-safe Queue instance.
    """
    while tokill() == False:
        for batch, (batch_images, batch_labels) in enumerate(dataset_generator):
            # We fill the queue with new fetched batch until we reach the max       size.
            batches_queue.put((batch, (batch_images, batch_labels)), block=True)
            if tokill() == True:
                return


def threaded_cuda_batches(tokill, cuda_batches_queue, batches_queue):
    """Thread worker for transferring pytorch tensors into
    GPU. batches_queue is the queue that fetches numpy cpu tensors.
    cuda_batches_queue receives numpy cpu tensors and transfers them to GPU space.
    """
    while tokill() == False:
        batch, (batch_images, batch_labels) = batches_queue.get(block=True)
        batch_images = batch_images.cuda()
        batch_labels = batch_labels.cuda()
        cuda_batches_queue.put((batch, (batch_images, batch_labels)), block=True)
        if tokill() == True:
            return


class LeNet(nn.Module):
    def __init__(self):
        super(LeNet, self).__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(400, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        out = F.relu(self.conv1(x))
        out = F.max_pool2d(out, 2)
        out = F.relu(self.conv2(out))
        out = F.max_pool2d(out, 2)
        out = out.view(out.size(0), -1)
        out = F.relu(self.fc1(out))
        out = F.relu(self.fc2(out))
        out = self.fc3(out)
        return out


if __name__ == '__main__':
    model = LeNet()
    model.cuda()
    model.train()
    # Training set list suppose to be a list of full-paths for all the training images
    with open('train.txt') as f:
        training_set_list = f.readlines()
    batches_per_epoch = len(training_set_list) // args.batch_size
    # Once the queue is filled the queue is locked.
    train_batches_queue = Queue(maxsize=args.train_batches_queue_maxsize)
    # Our torch tensor batches cuda transferer queue.
    # Once the queue is filled the queue is locked
    cuda_batches_queue = Queue(maxsize=args.cuda_batches_queue_maxsize)

    training_set_generator = InputGen(training_set_list, args.batch_size)
    train_thread_killer = thread_killer()
    train_thread_killer.set_tokill(False)

    # We launch 4 threads to do load && pre-process the input images
    for _ in range(args.preprocess_workers):
        t =threading.Thread(target=threaded_batches_feeder,
                            args=(train_thread_killer, train_batches_queue, training_set_generator))
        t.start()
    cuda_transfers_thread_killer = thread_killer()
    cuda_transfers_thread_killer.set_tokill(False)

    for _ in range(args.cuda_workers):
        cudathread = threading.Thread(target=threaded_cuda_batches,
                                      args=(cuda_transfers_thread_killer, cuda_batches_queue, train_batches_queue))
        cudathread.start()

    criterion = nn.CrossEntropyLoss()
    optimizer = optim.SGD(model.parameters(), lr=0.1, momentum=0.9, weight_decay=1e-4, nesterov=True)
    for epoch in range(args.num_epoches):
        print('epochs:', epoch)
        for batch in range(batches_per_epoch):
            # We fetch a GPU batch in 0's due to the queue mechanism
            _, (batch_images, batch_labels) = cuda_batches_queue.get(block=True)

            # train batch is the method for your training step.
            # no need to pin_memory due to diminished cuda transfers using queues.
            def train_batch(batch_images, batch_labels):
                optimizer.zero_grad()
                outputs = model(batch_images)
                loss = criterion(outputs, batch_labels)
                loss.backward()
                optimizer.step()
                return loss.item()
            loss = train_batch(batch_images, batch_labels)
            print('batch %d, loss: %.4f' % (batch, loss))


    train_thread_killer.set_tokill(True)
    cuda_transfers_thread_killer.set_tokill(True)
    for _ in range(args.preprocess_workers):
        try:
            # Enforcing thread shutdown
            train_batches_queue.get(block=True, timeout=1)
            cuda_batches_queue.get(block=True, timeout=1)
        except Empty:
            pass
    print('training done!')

附录

queue模块

参考链接：https://www.cnblogs.com/skiler/p/6977727.html
https://blog.csdn.net/qq_41185868/article/details/80502072
queue模块是python自带的模块。实现了多生产者，多消费者的队列。当要求信息必须在多线程间安全交换，这个模块在线程编程时非常有用。Queue模块实现了所有要求的锁机制。

queue模块有如下三种队列类：
maxsize可以限制队列的大小。如果队列的大小达到了队列的上限，就会加锁，加入就会阻塞，直到队列的内容被消费掉。maxsize的值小于等于0，那么队列的尺寸就是无限制的

class queue.Queue(maxsize) ：queue模块的FIFO队列先进先出。
class queue.LifoQueue(maxsize) ：类似于堆，即先进后出。
class queue.PriorityQueue(maxsize)：优先级队列，级别越低越先出来

两种异常：

queue.empty：非阻塞时，队列为空，取数据才会报异常
queue.Full：非阻塞时，队列满了，继续放数据才会出现异常

队列对象的方法：

Queue.qsize() ：返回queue的大小。注意：qsize>0 不保证(get)取元素不阻塞。qsize
Queue.empty():判断队列是否为空。和上面一样注意
Queue.full():判断队列是否满了。和上面一样注意
Queue.put(item, block=True, timeout=None): 往队列里放数据。如果满了的话，blocking =False 直接报 Full异常。如果blocking = True，则进行等待；timeout必须为 0或正数。None为一直等下去，0为不等，正数n为等待n秒，若时间过后还不能存入，报Full异常。
Queue.put_nowait(item):往队列里存放元素，不等待，相当于Queue.put(item, block=False）
Queue.get(block=True, timeout=None): 从队列里取数据。如果为空的话，blocking = False 直接报 empty异常。如果blocking = True，则进行等待；timeout必须为 0 或正数。None为一直等下去，0为不等，正数n为等待n秒，若时间过后还不能读取，报empty异常。
Queue.get_nowait(item):从队列里取元素，不等待。相当于Queue.get(block=False）
Queue.task_done() 在完成一项工作之后，向任务已经完成的队列发送一个信号
Queue.join() 实际上意味着等到队列为空，再执行别的操作

深度学习与Pytorch实战（二）预测房价--线性回归 volcanical pytorch 深度学习 pytorch 线性回归
PyTorch实例：线性回归我们将实现一个线性回归模型，并用梯度下降算法求解该模型，从而给出预测曲线。准备数据首先我们编造一组数据，假如我们每隔一个月获取一次房价数据，代表0，1，2，3，4……月份，那么我们可以用PyTorch的linespace来构建1~100之间的均匀数字作为时间变量。importtorchimportmatplotlib.pyplotasplt#0~99月x=torch.T
Pytorch深度学习入门（1）-如何使用Pytorch跑一个神经网络火花同学深度学习 pytorch 神经网络 python
目录0.Intro1.深度学习与Pytorch1.1深度学习1.2Pytorch2.预训练模型2.1运行环境2.2加载预训练模型2.3使用网络进行图片分类3.总结写在后面的话0.Intro本文是Pytorch入门系列的第一篇文章。本文主要通过使用Pytorch当中的预训练模型完成一个深度学习任务，让大家对Pytorch的基本使用与一个最基础的了解，通过这样一个相对顶层的方式作为开始，让大家对Pyt
深度学习与PyTorch笔记1 niuniu990 深度学习 python pytorch
深度学习与PyTorch笔记1动态图计算的进行和代码的运行是同时的。静态图先构建函数，之后便不能更改，只能喂数据。好处：一次成型，一旦建好之后使用起来非常方便，不需要自己中间修改。问题：比如TensorFlow自建了一套命名体系，中间的所有变量和时序的控制逻辑都是使用自己的，用Python写的时候就非常麻烦，所以TensorFlow2.0支持动态图优先。使用PyTorch的优势1.GPU加速（50
深度学习与Pytorch入门实战（九）卷积神经网络&Batch Norm qq_41978139 深度学习
深度学习与Pytorch入门实战（九）卷积神经网络&BatchNorm目录1.卷积层1.1torch.nn.Conv2d()类式接口1.2F.conv2d()函数式接口2.池化层Pooling（下采样）2.1torch.MaxPool2d()类式接口2.2F.avg_pool2d()函数式接口3.upsample（上采样）4.RELU激活函数4.1torch.nn.RELU()类式接口4.2F.r
PyTorch元模型：创建模型，导入数据并训练的基本构件 weixin_Saturn 深度学习 pytorch 人工智能
本篇目的在学习深度学习与PyTorch的过程中，大大小小的开源项目里的代码不尽相同，有的较为复杂，有的偏向简单；本文描述了构建一个深度学习项目的最基本组成部分，包括net.py，dataset.py，train.py三个模块。网络importtorchimporttorch.nnasnnclassDoubleConv(nn.Module):'''[conv,bn,relu]*2'''def__in
第一章深度学习与PyTorch库简介 Cary. pytorch 深度学习 python
本书第一章主要介绍了深度学习的背景和PyTorch的基本库。没有涉及很多代码，这里简要总结本章内容，并查看PyTorch版本以及配置。本章小结1.深度学习模型自动学习关联示例的输入和期望的输出。2.PyTorch库允许你高效地构建和训练神经网络模型。3.PyTorch在注重灵活性和速度的同时最大限度地减少了认知开销，它还默认为急切模式。4.TorchScript允许我们预编译模型，并且不仅可以在p
Pytorch-《Deep learning with pytorch》1.2.1训练imagenetmini 在楼梯口吃芒果的是我 pytorch学习深度学习 pytorch 人工智能
最近在学习《Deeplearningwithpytorch》，跟着b站的一个up主敲代码，本篇内容对应这个视频大佬带你啃透【深度学习与pytorch】官方权威书籍P4。因为我是轻薄本，所以选择在colab上进行的实验，如果你的电脑内存够，配置也ok是可以直接在自己电脑上运行的。一下进入正题：实验内容：使用Alexnet和resnet101对imageNet进行训练。（因为内存原因，我用的image
深度学习与Pytorch入门实战（五）分类器 Douzi1024
笔记摘抄1.分类问题1.1二分类\(f:x\rightarrowp(y=1|x)\)\(p(y=1|x)\)：解释成给定x，求y=1的概率，如果概率>0.5，预测为1；否则，预测为0\(p_{\theta}(y|x)\)：给定x，输出预测值的概率\(p_{r}(y|x)\)：给定x，真实分布1.2多分类\(f:x\rightarrowp(y|x)\)\([p(y=0|x),p(y=1|x),...
【PyTorch学习笔记】8.对抗生成网络贪钱算法还我头发 #Deep Learning AI 人工智能深度学习 python pytorch
文章目录52.GAN简介53.画家的成长历程54.纳什均衡54.1纳什均衡-D54.2纳什均衡-G55.JS散度的弊端56.EM距离57.WGAN与WGAN-GP58.实战58.1GAN58.2WGAN根据龙良曲Pytorch学习视频整理，视频链接：【计算机-AI】PyTorch学这个就够了！(好课推荐)深度学习与PyTorch入门实战——主讲人龙良曲52.GAN简介生成式对抗网络(Generat
深度学习与PyTorch笔记10 niuniu990 python pytorch
tensor的统计属性常见的统计属性：norm(范数)，mean(均值)，sum(求和)，prod(累乘)，max(最大值)，min(最小值)，argmin(最小值位置)，argmax(最大值位置)，kthvalue(求第k个小的值的位置)，topk(求前k个大的值)normnorm-p.norm(1)一范数，所有元素绝对值求和.norm(2)二范数，所有元素绝对值的平方和，再开根.norm(n,
【week1】深度学习与pytorch基础 Coco珂笔记深度学习 pytorch 人工智能
week01深度学习与pytorch基础练习深度学习笔记深度学习深度学习概述pytorch的基础练习螺旋数据分类构建线性模型分类构建两层神经网络分类深度学习笔记人工智能的三个层面：计算智能：能存能算计算机具有快速计算和记忆存储的能力感知智能、能听会说、能看会认是目前人工智能的层面，类似于人的视觉、听觉、触觉认知智能：逻辑推理、认识理解、决策思考、机器学习的定义：最常用定义：计算机系统能够利用经验提
干货！141页的《深度学习PyTorch》开源书籍 Python数据之道 python 人工智能编程语言深度学习 java
介绍一本发布在Pytorch官网上的深度学习开源书，《DeepLearningwithPyTorch》，上面共有五个章节，包括了深度学习与PyTorch库、张量、如何用张量表示真实世界的数据、学习机制、用神经网络拟合数据等方面的内容，据称核心是指导读者使用Python和PyTorch实现深度学习算法。资料获取方式：下方公众号回复：7745Python程序员内容简介介绍一本发布在Pytorch官网上
【PyTorch】学习笔记(02):开发环境准备 Drmon. 机器学习 Python3 深度学习 pycharm cuda pytorch
【PyTorch】深度学习与Pytorch实战笔记学习笔记02:开发环境准备【PyTorch】深度学习与Pytorch实战笔记1.环境2.检测环境3.配置Pycharm1.环境Python+AnacondaCUDAPycharm2.检测环境nvcc-V3.配置Pycharm
注意力机制神经网络_GNN|三种注意力机制在图神经网络中的应用和总结 weixin_39717865 注意力机制神经网络
作者|ArchWalker编辑|深度学习与PyTorch转载|https://archwalker.github.io/blog/2019/06/01/GNN-Triplets-GAT.html声明|文章经作者授权转载引言在前两篇推文(图神经网络GraphConvolutionalNetwork(GCN)：从问题到理论分析;论文详解|浅谈GraphSage之图学习中的Inductivelearni
PyTorch + OpenVINO 开发实战系列教程英特尔边缘计算社区 OpenVINO pytorch openvino 深度学习
概述大家好，本章是主要介绍一下深度学习框架Pytorch的的历史与发展，主要模块构成与基础操作代码演示。重点介绍Pytorch的各个组件、编程方式、环境搭建、基础操作代码演示。本章对有Pytorch开发经验的读者来说可以直接跳过；对初次接触Pytorch的读者来说，通过本章学习认识Pytorch框架，搭建好Pytorch的开发环境，通过一系列的基础代码练习与演示建立起对深度学习与Pytorch框架
【DL with Pytorch】第 1 章：深度学习与PyTorch简介 Sonhhxg_柒深度学习（DL）深度学习 pytorch 人工智能
大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流个人主页－Sonhhxg_柒的博客_CSDN博客欢迎各位→点赞+收藏⭐️+留言系列专栏-机器学习【ML】自然语言处理【NLP】深度学习【DL】foreword✔说明⇢本人讲解主要包括Python、机器学习（ML）、深度学习（DL）、自然语言处理（NLP）等内容。如果你对这个系列感兴趣的话，可以关注订阅哟文章目录
深度学习与PyTorch(一）飞天小福蝶 Python计算机视觉深度学习 pytorch
文章目录深度学习运算基本单元Tensor与ndarrayCPU与GPU运算实现K-means蒙特卡罗算法自动求导反向传播数据加载DatasetDataLoader深度学习深度学习原本是一种实现机器学习的手段，用于解决机器学习中的分类，回归等问题。运算基本单元Tensor与ndarray#coding=utf-8importtorchimportnumpyasnpa=np.ones((2,2))pr
【PyTorch学习笔记】7.自编码器贪钱算法还我头发 AI #Deep Learning 神经网络深度学习 python 自编码器 pytorch
文章目录47.Auto-Encoder介绍48.Auto-Encoder变种49.VariationalAuto-Encoder引入50.变分自编码器VAE51.实战51.1AE51.2VAE根据龙良曲Pytorch学习视频整理，视频链接：【计算机-AI】PyTorch学这个就够了！(好课推荐)深度学习与PyTorch入门实战——主讲人龙良曲47.Auto-Encoder介绍SupervisedL
全新深度学习与PyTorch入门实战教程 m0_59289129 深度学习 pytorch 机器学习
深度学习与PyTorch入门实战教程┣━━1.深度学习框架介绍┃┗━━1.lesson1-PyTorch介绍.mp4┣━━2.开发环境准备┃┗━━2.lesson2-开发环境准备.mp4┣━━3.初见深度学习┃┣━━3.lesson3-初探LinearRegression案例-1.mp4┃┣━━4.lesson3-初探LinearRegression案例-2.mp4┃┣━━5.lesson4-Py
深度学习 pytorch学习黑桃5200 Pytorch
背景准备用4周时间，根据深度学习与PyTorch入门实战视频教程，刷完配套的源代码。熟悉pytorch的使用。具体内容如下：每天抄写2-3个lesson的代码，完成任务之后微信群打卡。参考资料https://github.com/dragen1860/Deep-Learning-with-PyTorch-Tutorials后台回复「pytorch资源」，获取资源！后台回复「组队学习」，加入组队学习
第一周学习：深度学习与pytorch基础代码实战刘zekai 深度学习 pytorch 学习
目录part1：理论视频学习一.人工智能和深度学习概述1.人工智能定义及其三个层面2.机器学习2.1机器学习定义2.2机器学习过程2.2.1模型分类二.深度学习概述1.人工智能、机器学习、深度学习之间的关系2.深度学习的不能3.浅层神经网络3.1激活函数3.2万有逼近定理与神经网络3.3更宽or更深3.4反向传播误差3.5梯度消失part2：代码练习一.pytorch基础练习1.定义数据2.定义操
深度学习与PyTorch入门实战 Saber_e pytorch笔记 pytorch 深度学习 python
深度学习与PyTorch入门实战笔记1数据和初始化importtorcha=torch.randn(2,3)#随机初始化，正态分布print(a)#tensor([[-1.0912,-0.3995,-0.3796],#[0.5615,-0.2030,0.4820]])print(a.size())#类中的函数#torch.Size([2,3])print(list(a.size()))#可以转Li
【重磅干货】Python、机器学习、深度学习算法实战和应用必备书籍深度学习技术前沿神经网络人工智能编程语言深度学习机器学习
【导读】首先祝大家中秋佳节快乐，乘此良辰美景，今天就给大家发一波福利干货！本文给大家分享机器学习、深度学习算法实战和应用必备的4本“宝藏”书。具体书籍展示如下：（文末提供下载方式！）1.DeepLearningWithPyTorch（PyTorch官方指定教程）《DeepLearningwithPyTorch》，上面共有五个章节，包括了深度学习与PyTorch库、张量、如何用张量表示真实世界的数据
【PyTorch学习笔记】6.循环神经网络贪钱算法还我头发 AI #Deep Learning 人工智能深度学习 python pytorch
文章目录40.时间序列表示41.循环神经网络42.RNNLayer使用42.1nn.RNN42.2nn.RNNCell43.时间序列预测44.RNN训练难题45.LSTMLayer使用45.1nn.LSTM45.2nn.LSTMCell46.情感分类实战根据龙良曲Pytorch学习视频整理，视频链接：【计算机-AI】PyTorch学这个就够了！(好课推荐)深度学习与PyTorch入门实战——主讲人
卧槽！一大波深度学习“宝藏书”来啦！免费下载... 视学算法神经网络人工智能编程语言 python 深度学习
【导读】今天给大家推荐一下机器学习、深度学习算法实战和应用必备的4本“宝藏”书。具体书籍展示如下：（文末提供下载方式！）1.DeepLearningWithPyTorch（PyTorch官方指定教程）《DeepLearningwithPyTorch》，上面共有五个章节，包括了深度学习与PyTorch库、张量、如何用张量表示真实世界的数据、学习机制、用神经网络拟合数据等方面的内容，核心是指导读者使用
网易云课程：深度学习与PyTorch入门实战鱼与钰遇雨人工智能
网易云课程：深度学习与PyTorch入门实战01深度学习初见1.1深度学习框架简介1.2pytorch功能演示2开发环境安装3回归问题3.1简单的回归问题（梯度下降算法）3.3回归问题实战3.4分类问题引入3.6手写数字识别体验4Pytorch基础4.1张量数据类型4.2创建Tensor4.3索引与切片4.4维度变换5随机梯度下降5.1什么是梯度？5.2什么是梯度局部极小值鞍点影响搜索过程的其他因
【Pytorch学习笔记】5.卷积神经网络贪钱算法还我头发 AI #Deep Learning 神经网络深度学习 pytorch python 卷积神经网络
文章目录32.卷积神经网络33.池化层&上/下采样34.批量正则化35.经典卷积网络36.残差网络37.nn.Module38.数据增强39.实战根据龙良曲Pytorch学习视频整理，视频链接：【计算机-AI】PyTorch学这个就够了！(好课推荐)深度学习与PyTorch入门实战——主讲人龙良曲32.卷积神经网络基础知识还是得看ngimporttorchimporttorch.nnasnnimp
深度学习与Pytorch入门笔记星时雨星深度学习 pytorch 神经网络
一、基本操作pythonPytorch中文文档https://pytorch-cn.readthedocs.io/zh/latest/package_references/torch-optim/一、Anaconda基本操作1、用conda创建Python虚拟环境（在condaprompt环境下完成）condacreate-nenvironment_namepython=X.X2、激活虚拟环境（在
深度学习与Pytorch入门实战（六）定义MLP&GPU加速&测试【数字识别实例】 Douzi1024
笔记摘抄Pytorch定义网络结构识别手写数字，可以对网络中的参数w和b进行手动定义的(参考上一节)也可以直接用nn.Linear定义层的方式来定义更加方便的方式是直接继承nn.Module来定义自己的网络结构。1.nn.Linear方式importtorchimporttorch.nnasnnimporttorch.nn.functionalasF#模拟一张28*28的图片摊平x=torch.r
深度学习与PyTorch笔记21 niuniu990
Visdom可视化TensorboardX使用pipinstalltensorboardX命令来安装。tensorboardX在pytorch中怎么使用：它有一个SummaryWriter，新建一个SummaryWriter实例，把要监听的数据起一个名字，(‘data/scalar’（名字）,dummy_s1[0]（数据）,n_iter（x坐标，代表的是哪一个epoch）)。tensorboard
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比