像风一样Pro

PyTorch系列 - PyTorch数据读取 (二)

文章首发于：WangW Blog，转载请注明出处。
Pytorch系列：

PyTorch系列 - PyTorch使用总览 (一)
PyTorch系列 - PyTorch数据读取 (二)
PyTorch系列 - PyTorch网络构建 (三)
PyTorch系列 - PyTorch网络配置 (四)
PyTorch系列 - PyTorch其它配置 (五)

参考：

PyTorch documentation
PyTorch 码源

本文首先介绍了有关预处理包的源码，接着介绍了在数据处理中的具体应用；
其主要目录如下：

文章目录

1 PyTorch数据预处理以及源码分析 (torch.utils.data)
- 1.1 Dataset
- - Dataset
  - TensorDataset
  - ConcatDateset
  - Subset
  - random_split
- 1.2 DataLoader
- - DataLoader
  - DataLoaderIter
- 1.3 sampler
- - Sampler
  - SequentialSampler
  - RandomSampler
  - SubsetRandomSampler
  - BatchSampler
  - weightedRandomSampler
- 1.4 Distributed
- - DistributedSampler
- 1.5 其它链接
2 torchvision
3 应用
- - 3.1 init
  - 3.2 数据读取
  - - Dataset
    - DataLoader
  - 3.3 train_epoch

1 PyTorch数据预处理以及源码分析 (torch.utils.data)

torch.utils.data脚本码源

1.1 Dataset

Dataset

class torch.utils.data.Dataset

表示Dataset的抽象类。所有其他数据集都应该进行子类化。
所有子类应该override__len__和__getitem__，前者提供了数据集的大小，后者支持整数索引，范围从0到len(self)。

class Dataset(object):
	# 强制所有的子类override getitem和len两个函数，否则就抛出错误；
	# 输入数据索引，输出为索引指向的数据以及标签；
	def __getitem__(self, index):
		raise NotImplementedError
	
	# 输出数据的长度
	def __len__(self):
		raise NotImplementedError
		
	def __add__(self, other):
		return ConcatDataset([self, other])

TensorDataset

class torch.utils.data.TensorDataset(*tensors)

Dataset的子类。包装tensors数据集；输入输出都是元组；
通过沿着第一个维度索引一个张量来回复每个样本。
个人感觉比较适用于数字类型的数据集，比如线性回归等。

class TensorDataset(Dataset):
	def __init__(self, *tensor):
		assert all(tensors[0].size(0) == tensor.size(0) for tensor in tensors)
		self.tensors = tensors
		
	def __getitem__(self, index):
		return tuple(tensor[index] for tensor in tensors
		
	def __len__(self):
		return self.tensors[0].size(0)

ConcatDateset

class torch.utils.data.ConcatDateset(datasets)

连接多个数据集。
目的：组合不同的数据集，可能是大规模数据集，因为连续操作是随意连接的。
datasets的参数：要连接的数据集列表
datasets的样式：iterable

class ConcatDataset(Dataset):
	@staticmethod
	def cumsum(sequence):
		# sequence是一个列表，e.g. [[1,2,3], [a,b], [4,h]]
		# return 一个数据大小列表，[3, 5, 7], 明显看的出来包含数据多少，第一个代表第一个数据的大小，第二个代表第一个+第二数据的大小，最后代表所有的数据大学；
	...
	def __getitem__(self, idx):
		# 主要是这个函数，通过bisect的类实现了任意索引数据的输出；
		dataset_idx = bisect.bisect_right(self.cumulative_size, idx)
		if dataset_idx == 0:
			sample_idx == idx
		else:
			sample_idx = idx - self.cumulative_sizes[dataset_idx -1]
		return self.datasets[dataset_idx][sample_idx]
	...

Subset

class torch.utils.data.Subset(dataset, indices)

选取特殊索引下的数据子集；
dataset：数据集；
indices：想要选取的数据的索引；

random_split

class torch.utils.data.random_split(dataset, lengths):

随机不重复分割数据集；
dataset：要被分割的数据集
lengths：长度列表，e.g. [7, 3]， 保证7+3=len(dataset)

1.2 DataLoader

DataLoader

class torch.utils.data.DataLoader(dataset, batch_size=1, shuffle=False, sampler=None, batch_sampler=None, num_workers=0, collate_fn=<function default_collate>, pin_memory=False, drop_last=False, timeout=0, worker_init_fn=None)

数据加载器。
组合数据集和采样器，并在数据集上提供单进程或多进程迭代器。
参数：

dataset (Dataset) - 从中加载数据的数据集。
batch_size (int, optional) - 批训练的数据个数。
shuffle (bool, optional) - 是否打乱数据集（一般打乱较好）。
sampler (Sampler, optional) - 定义从数据集中提取样本的策略。如果指定，则忽略shuffle参数。
batch_sampler (Sample, optional) - 和sampler类似，返回批中的索引。
num_workers (int, optional) - 用于数据加载的子进程数。
collate_fn (callable, optional) - 合并样本列表以形成小批量。
pin_memory (bool, optional) - 如果为True，数据加载器在返回去将张量复制到CUDA固定内存中。
drop_last (bool, optional) - 如果数据集大小不能被batch_size整除，设置为True可以删除最后一个不完整的批处理。
timeout (numeric, optional) - 正数，收集数据的超时值。
worker_init_fn (callabel, optional) - If not None, this will be called on each worker subprocess with the worker id (an int in [0, num_workers - 1]) as input, after seeding and before data loading. (default: None)

特别重要：DataLoader中是不断调用DataLoaderIter

DataLoaderIter

class _DataLoaderIter(loader)

从DataLoader’s数据中迭代一次。其上面DataLoader功能都在这里；
插个眼，有空在分析这个

1.3 sampler

Sampler

class torch.utils.data.sampler.Sampler(data_source)

所有采样器的基础类；
每个采样器子类必须提供一个__iter__方法，提供一种迭代数据集元素的索引的方法，以及返回迭代器长度__len__方法。

class Sampler(object):
	def __init__(self, data_source):
		pass
		
	def __iter__(self):
		raise NotImplementedError
		
	def __len__(self):
		raise NotImplementedError

SequentialSampler

class torch.utils.data.SequentialSampler(data_source)

样本元素顺序排列，始终以相同的顺序。
参数：-data_source (Dataset) - 采样的数据

RandomSampler

class torch.utils.data.RandomSampler(data_source, replacement=False, num_samples=None)

样本随机排列，如果没有Replacement，将会从打乱的数据采样，否则，。。
参数：

data_source (Dataset) - 采样数据
num_samples (int) - 采样数据大小，默认是全部。
replacement (bool) - 是否放回

SubsetRandomSampler

class torch.utils.data.SubsetRandomSampler(indices)

从给出的索引中随机采样，without replacement。
参数：

indices (sequence) - 索引序列。

BatchSampler

class torch.utils.data.BatchSampler(sampler, batch_size, drop_last)

将采样封装到批处理索引。
参数：

sampler (sampler) - 基本采样
batch_size (int) - 批大小
drop_last (bool) - 是否删掉最后的批次

weightedRandomSampler

class torch.utils.data.WeightedRandomSampler(weights, num_samples, replacement=True)

样本元素来自[0,…,len(weights)-1]，给定概率（权重）。
参数：

weights (list) - 权重列表。不需要加起来为1
num_samplers (int) - 要采样数目
replacement (bool) -

1.4 Distributed

DistributedSampler

class torch.utils.data.distributed.DistributedSampler(dataset, num_replicas=None, rank=None)

???没读呢

1.5 其它链接

PyTorch源码解读之torch.utils.data.DataLoader

2 torchvision

计算机视觉用到的库，文档以及码源如下：

torchvision documentation
torchvision
其库主要包含一下内容：

torchvision.datasets
- MNIST
- Fashion-MNIST
- EMNIST
- COCO
- LSUN
- ImageFolder
- DatasetFolder
- Imagenet-12
- CIFAR
- STL10
- SVHN
- Photo Tour
- SBU
- Flickr
- VOC
torchvision.models
- Alexnet
- VGG
- ResNet
- SqueezeNet
- DenseNet
- Inception v3
torchvision.transforms
- Transforms on PIL Image
- Transfroms on torch.* Tensor
- Conversion Transforms
- Generic Transforms
- Functional Transforms
torchvision.utils

3 应用

3.1 init

具有一下图像数据如下表示：

train
- normal
  - 1.png
  - 2.png
  - …
  - 8000.png
- tumor
  - 1.png
  - 2.png
  - …
  - 8000.png
validation
- normal
  - 1.png
- tumor
  - 1.png

希望能够训练模型，使得能够识别tumor, normal两类，将tumor–>1, normal–>0。

3.2 数据读取

在PyTorch中数据的读取借口需要经过，Dataset和DatasetLoader (DatasetloaderIter)。下面就此分别介绍。

Dataset

首先导入必要的包。

import os

import numpy as np
from torch.utils.data import Dataset
from PIL import Image

np.random.seed(0)

其次定义MyDataset类，为了代码整洁精简，将不必要的操作全删，e.g. 图像剪切等。

class MyDataset(Dataset):
	
	def __init__(self, root, size=229, ):
		"""
		Initialize the data producer
		"""
		self._root = root
		self._size = size
		self._num_image = len(os.listdir(root))
		self._img_name = os.listdir(root)
	
	def __len__(self):
		return self._num_image
		
	def __getitem__(self, index):
		img = Image.open(os.path.join(self._root, self._img_name[index]))
		
		# PIF image: H × W × C
		# torch image: C × H × W
		img = np.array(img, dtype-np.float32).transpose((2, 0, 1))
		
		return img

DataLoader

将MyDataset封装到loader器中。

from torch.utils.data import DataLoader

# 实例化MyData
dataset_tumor_train = MyDataset(root=/img/train/tumor/)
dataset_normal_train = MyDataset(root=/img/train/normal/)
dataset_tumor_validation = MyDataset(root=/img/validation/tumor/)
dataset_normal_validation = MyDataset(root=/img/validation/normal/)

# 封装到loader
dataloader_tumor_train = DataLoader(dataset_tumor_train, batch_size=10)
dataloader_normal_train = DataLoader(dataset_normal_train, batch_size=10)
dataloader_tumor_validation = DataLoader(dataset_tumor_validation, batch_size=10)
dataloader_normal_validation = DataLoader(dataset_normal_validation, batch_size=10)

3.3 train_epoch

简单将数据流接口与训练连接起来


def train_epoch(model, loss_fn, optimizer, dataloader_tumor, dataloader_normal):
	model.train()
	
	# 由于tumor图像和normal图像一样多，所以将tumor，normal连接起来，steps=len(tumor_loader)=len(normal_loader)
	steps = len(dataloader_tumor)
	batch_size = dataloader_tumor.batch_size
	dataiter_tumor = iter(dataloader_tumor)
	dataiter_normal = iter(dataloader_normal)
	
	for step in range(steps):
		data_tumor = next(dataiter_tumor)
		target_tumor = [1, 1,..,1] # 和data_tumor长度相同的tensor
		data_tumor = Variable(data_tumor.cuda(async=True))
		target_tumor = Variable(target_tumor.cuda(async=True))
		 
		data_normal = next(dataiter_normal)
		target_normal = [0, 0,..,0] # 
		data_normal = Variable(data_normal.cuda(async=True))
		target_normal = Variable(target_normal.cuda(async=True))
		
		idx_rand = Variable(torch.randperm(batch_size*2).cuda(async=True))
		
		data = torch.cat([data_tumor, data_normal])[idx_rand]
		target = torch.cat([target_tumor, target_normal])[idx_rand]
		output = model(data)
		loss = loss_fn(output, target)
		
		optimizer.zero_grad()
		loss.backward()
		optimizer.step()
		
		probs = output.sigmoid()

你可能感兴趣的:(PyTorch系列 - PyTorch数据读取 (二))

一文讲清楚PostgreSQL分区表振华OPPO 数据库 postgresql 数据库
文章目录一、PostgreSQL详细介绍1.起源与发展2.核心特性3.社区与企业支持二、分区的详细介绍1.分区是什么2.为什么需要分区3.怎么分区（1）范围分区（RangePartitioning）（2）列表分区（ListPartitioning）（3）哈希分区（HashPartitioning）（自PG11版本提供）三、分区表的特征1.逻辑整体与物理独立2.查询性能优化3.数据管理简化4.灵活性
ambari-2.8源码编译 SmartManWind ambari hadoop 大数据
参考博客Ambari(二)----Ambari2.6.0源码编译安装及遇到的问题解决(超详细文档)_ambari2.6.0编译-CSDN博客注意
2025年第一个暴富机会，我连握住的机会都没有 2301_82086730 币蛇钞
中国人看重生肖文化。2025年是蛇年，蛇在民间被奉为聪慧、吉祥的“小龙”，加上去年龙币、龙钞强势破圈，使得2025年贺岁纪念币、纪念钞（以下简称蛇币、蛇钞）预约火爆，二手价格一度水涨船高。然而，随着蛇币、蛇钞各发行1亿枚（张）的消息传出，到了1月中旬，其价格连日下跌。中国人民银行表示，蛇币、蛇钞与现行流通人民币职能相同，与同面额人民币等值流通。不过，既然名为纪念币、纪念钞，人们倾向于将其定位于纪念
夜神模拟器 adb devices失败的可能的部分解决方式 yoojiang 测试工具 android
连接不上：adb可调用，夜神模拟器已安装到位的情况下，adbdevices失败的解决方案。在一系列操作后adblogcat可以调取日志的。经分析可能会有三个坑，具体不知道是那一个步骤发挥了作用，可以借鉴来做。第一坑：步骤。先打开模拟器再打开CMD。参照经验：adbconnect连接失败问题adbconnect127.0.0.1:62001unabletoconnectto:5555_Clever9
【Sql Server】随机查询一条表记录，并重重温回顾下存储过程的封装和使用 web13688565871 面试学习路线阿里巴巴数据库 oracle
大家好，我是，欢迎来到《小5讲堂》。这是《SqlServer》系列文章，每篇文章将以博主理解的角度展开讲解。温馨提示：博主能力有限，理解水平有限，若有不对之处望指正！目录前言随机查询语句存储过程基本概念基本结构基础例子存储过程封装文章推荐前言温故而知新，最近在写sql查询语句，需求是随机查询表的其中一条记录。基于这个查询，顺便把数据库自定义函数、存储过程这个两个知识点重温固定下。因此，本篇文章将在
编译dpdk19.08.2中example时一系列报错解决 monGyrate linux服务器相关 dpdk C语言 DPDK 数据平面开发套件 ubuntu
dpdk19.08编译过程全解dpdk介绍问题描述编译过程执行Step1报错一解决方式报错二解决方式继续执行Step248的时候报错49没有修改成功输入60退出使用过程执行make报错一解决方式继续make报错二解决方式继续make执行生成文件helloworld报错三解决方式执行make完成参考链接dpdk介绍数据平面开发套件(DPDK[1],DataPlaneDevelopmentKit)
React 的 12 个核心概念 chenNorth。前端 react.js 前端前端框架
文章目录一、JSX：逻辑与视图的桥梁二、组件：模块化构建的核心三、Props：单向数据流的基石四、State：动态交互的核心五、useEffect：副作用管理的利器六、Context：跨层级数据共享的利器七、React.memo：优化渲染的利器八、useReducer：复杂状态管理的利器九、Ref和forwardRef：DOM操作与组件间通信十、虚拟DOM：高效渲染的核心十一、React和性能优化
conda从本地安装包幽殇默 pytorch conda
第一步：先下载需要的包。常用的网址1：https://mirrors.tuna.tsinghua.edu.cn/清华大学开源软件镜像站官网常用的网址2：https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/win-64/?C=M&O=D清华大学开源软件镜像站pytorh下载网址常用的网址3：https://anaconda.org/
自动驾驶（Automated Driving）系统组成和主要技术--以思维导图形式介绍大连海事的亲外甥自动驾驶人工智能机器学习
一、自动驾驶概念介绍自动驾驶是指汽车依靠传感器、高精度地图和复杂的算法等，不需要驾驶员操作而自动完成驾驶的技术。二、自动驾驶系统组成和主要技术架构图思维导图形式绘制1、感知层传感器模块:包括摄像头、激光雷达、毫米波雷达和超声波雷达等，用于获取车辆周围环境的数据，如道路状况、其他车辆、行人和障碍物等。定位传感器模块:包括GNSS(全球导航卫星系统)、INS(惯性导航系统)和视觉SLAM等，用于确定车
代码随想录算法训练营52期 taoyong001 算法 c++leetcode
flag：岁末年初，万籁俱寂，孤帆起伏，肃杀清凉。不以物喜，不以已悲，投身算法，杀回青春日期天数链接2024-12-11第一天数组理论基础，704.二分查找，27.移除元素数组理论基础，977.有序数组平方结果再排序2024-12-12第二天数组理论基础，59.螺旋矩阵II数组理论基础，209.长度最小的子数组2024-12-13第三天链表理论基础，203.移除链表元素链表理论基础，707.设计链
YOLO 目标检测编程详解不知名靓仔 YOLO 目标检测人工智能
引言目标检测是计算机视觉中的一个重要任务，它旨在识别图像中的对象并定位这些对象的位置。YOLO（YouOnlyLookOnce）是一种流行的目标检测算法，因其速度快且准确度高而广受好评。本文将深入探讨YOLO的原理及其实现方法，并提供一个使用Python和PyTorch的示例代码。项目源码见最下方1.YOLO算法简介YOLO算法的核心思想是将目标检测视为回归问题，而不是传统的分类加定位的两阶段方法
Torchserve服务开发 qq_27844739 AI工程化运维人工智能 pytorch 服务器
Torchserve服务开发文章目录Torchserve服务开发0.Torchserve介绍0.1.背景0.2.API类型1.开发使用1.0.环境部署1.1.handler开发1.1.1.context参数1.1.2.data参数1.2.handler调试2.配置文件3.batch推理0.Torchserve介绍0.1.背景TorchServe是PyTorch中推荐的模型部署解决方案，通过它可以将
网络工程师（8）存储管理 IT 青年网络工程师网络工程师软考
一、页式存储基本原理（一）内存划分页式存储首先将内存物理空间划分成大小相等的存储块，这些块通常被称为“页帧”或“物理页”。每个页帧的大小是固定的，例如常见的页帧大小有4KB、8KB等，这个大小由操作系统决定。同时，操作系统会为每个页帧分配一个唯一的编号，即页帧号。（二）程序划分与内存物理空间的划分相对应，页式存储也将要运行的程序的逻辑地址空间划分成大小与页帧相同的“页”。这些页在逻辑上连续，但在物
【yolo目标检测】交通标志检测鱼弦【HOT】技术热谈 YOLO 目标检测人工智能
鱼弦：CSDN内容合伙人、CSDN新星导师、51CTO(Top红人+专家博主)、github开源爱好者（go-zero源码二次开发、游戏后端架构https://github.com/Peakchen）YOLO（YouOnlyLookOnce）是一种流行的实时目标检测算法，可用于交通标志检测。以下是关于YOLO目标检测的原理详细解释、使用场景解释以及相关文献材料的链接：原理详细解释：YOLO目标检测
我的笔记管理体系(Typora+PicGo+坚果云+阿里云oss) 黄暄笔记阿里云云计算编辑器
我的笔记管理体系(Typora+PicGo+坚果云+阿里云oss)前言现在是2024年7月28号，我快要上大二了，在上大学之前，我和几乎所有的高中生一样，有着各种各样的笔记本，三年下来也积累了不少的笔记。然而在上了大学以后，就很少就笔记了，原因大家都懂的哈哈，大一一次偶然的机会，我接触到了markdown语法，我才第一次认识到原来程序员都是那样记笔记的，我去，太tm帅啦，于是乎我便开始学习mark
宝塔上的琉璃塔等墨雨 python
任务描述本关任务：编写一个宝塔上的琉璃灯的小程序。相关知识宝塔上的琉璃灯问题描述：有一座八层宝塔，每一层都有一些琉璃灯，每一层的灯数都是上一层的二倍，已知共有765盏琉璃灯，计算并输出每层各有多少盏琉璃灯。编程要求编写一个宝塔上的琉璃灯的小程序，计算并输出每层各有多少盏琉璃灯。测试说明平台会对你编写的代码进行测试：输入格式本题没有输入。输出格式输出为8行，每行都是一个正整数，从上往下数字依次增大，
【二叉树】二叉树剪枝豪冷啊算法
0x00题目给你二叉树的根结点root此外树的每个结点的值要么是0，要么是1返回移除了所有不包含1的子树的原二叉树节点node的子树为node本身加上所有node的后代0x01思路叶子节点值为0时，去掉某个节点的如果要去掉则左子树的值全为0右子树的值是全为0再加上节点本身的值也是0反过来讲，也就是以某个节点为根的子树只要存在值为1的节点则这棵子树不用删除0x02解法语言：Swift树节点：Tree
软件测试工程师述职报告一、个人基本信息姓名：[您的姓名]职位：软件测试工程师入职时间：[具体入职日期]部门：[所在部门名称]二、工作职责概述作为软件测试工程师，我的主要职责是确保不一样的故事126 功能测试
软件测试工程师述职报告一、个人基本信息姓名：[您的姓名]职位：软件测试工程师入职时间：[具体入职日期]部门：[所在部门名称]二、工作职责概述作为软件测试工程师，我的主要职责是确保软件产品的质量和稳定性。这包括制定测试计划、设计测试用例、执行测试、记录测试结果、跟踪并报告缺陷，以及与开发团队紧密合作，共同推动软件产品的持续改进。三、工作业绩与亮点测试计划制定与执行：在过去的一年中，我参与了多个项目的
814. 二叉树剪枝（JavaScript）进击的桐人 leetcode 中等题 medium javascript LeetCode JavaScript Binary Tree Pruning
给定二叉树根结点root，此外树的每个结点的值要么是0，要么是1。返回移除了所有不包含1的子树的原二叉树。(节点X的子树为X本身，以及所有X的后代。)示例1:输入:[1,null,0,0,1]输出:[1,null,0,null,1]解释:只有红色节点满足条件“所有不包含1的子树”。右图为返回的答案。示例2:输入:[1,0,1,0,0,0,1]输出:[1,null,1,null,1]示例3:输入:[
java ffmpeg(Windows/Linux)截取视频做封面 Mr.菜园子 JAVA ffmpeg java ffmpeg java ffmpeg windows(Linux)
一、Windows版本1、下载前往FFmpeg官网http://ffmpeg.org/download.html下载Windows版本FFmpeg（我下载ffmpeg-4.0-win64-shared）2、解压下载后解压到本地（我的解压目录D:\wedive_file\ffmpeg）二、Linux版本1、下载前往FFmpeg官网http://ffmpeg.org/download.html下载Li
PyTorch 框架实现线性回归：从数据预处理到模型训练全流程大模型铲屎官 PyTorch pytorch 线性回归人工智能深度学习 python
系列文章目录Pytorch基础篇01-PyTorch新手必看：张量是什么？5分钟教你快速创建张量！02-张量运算真简单！PyTorch数值计算操作完全指南03-Numpy还是PyTorch？张量与Numpy的神奇转换技巧04-揭秘数据处理神器：PyTorch张量拼接与拆分实用技巧05-深度学习从索引开始：PyTorch张量索引与切片最全解析06-张量形状任意改！PyTorchreshape、tra
HTML表单深度解析：GET 和 POST 提交方法大模型铲屎官 html 前端 HTML GET POST javascript 编程
系列文章目录01-从零开始学HTML：构建网页的基本框架与技巧02-HTML常见文本标签解析：从基础到进阶的全面指南03-HTML从入门到精通：链接与图像标签全解析04-HTML列表标签全解析：无序与有序列表的深度应用05-HTML表格标签全面解析：从基础到高级优化技巧06-HTML表单深度解析：GET和POST提交方法文章目录系列文章目录前言一、HTML表单的基本概念与元素1.1表单概述1.1.
【LeetCode-SQL】196. 删除重复的电子邮箱白露塞纳 LeetCode-SQL leetcode sql 算法
目录一、题目二、解决1、关联去除2、分组删除3、开窗之row_number()三、参考一、题目表:Person+-------------+---------+|ColumnName|Type|+-------------+---------+|id|int||email|varchar|+-------------+---------+id是该表的主键列。该表的每一行包含一封电子邮件。电子邮件将
设计模式Python版建造者模式小王子1024 设计模式Python版设计模式 python 建造者模式
文章目录前言一、建造者模式二、建造者模式示例三、省略指挥者（建议）四、钩子方法的引入前言GOF设计模式分三大类：创建型模式：关注对象的创建过程，包括单例模式、简单工厂模式、工厂方法模式、抽象工厂模式、原型模式和建造者模式。结构型模式：关注类和对象之间的组合，包括适配器模式、桥接模式、组合模式、装饰模式、外观模式、享元模式和代理模式。行为型模式：关注对象之间的交互，包括职责链模式、命令模式、解释器模
设计模式Python版工厂方法模式小王子1024 设计模式Python版设计模式 python 工厂方法模式
文章目录前言一、工厂方法模式二、工厂方法模式示例三、工厂方法模式客户端改进四、工厂方法模式隐藏工厂方法（可选）前言GOF设计模式分三大类：创建型模式：关注对象的创建过程，包括单例模式、简单工厂模式、工厂方法模式、抽象工厂模式、原型模式和建造者模式。结构型模式：关注类和对象之间的组合，包括适配器模式、桥接模式、组合模式、装饰模式、外观模式、享元模式和代理模式。行为型模式：关注对象之间的交互，包括职责
代码随想录算法训练营day32：动态规划01 树懒爱沙发算法动态规划 leetcode 数据结构
动态规划理论基础动态规划刷题大纲适用范围：某一问题有很多重叠子问题，使用动态规划是最有效的。所以动态规划中每一个状态一定是由上一个状态推导出来的，这一点就区分于贪心，贪心没有状态推导，而是从局部直接选最优的。套路：dp数组，下标的含义——定义一维或者二维的状态转移数组递推公式：当前状态是怎么被上一个状态决定出来的dp数组如何初始化遍历顺序打印dp数组——来check算法是否正确509.斐波那契数力
Microsoft Dynamics 365软件二次开发：Dynamics365部署与版本控制策略 kkchenjj 工业软件二次开发全集 microsoft 架构工业软件 ERP 开发语言
MicrosoftDynamics365软件二次开发：Dynamics365部署与版本控制策略Dynamics365二次开发概述Dynamics365平台介绍MicrosoftDynamics365是一个由Microsoft开发的集成业务应用程序套件，旨在帮助组织优化其销售、客户服务、现场服务、财务、供应链、营销和运营流程。它结合了CRM（客户关系管理）和ERP（企业资源规划）功能，提供了一个统一
python中cv是什么_python里面cv是什么意思 weixin_39639568 python中cv是什么
OpenCV(OpenSourceComputerVisionLibrary)开放源代码计算机视觉库，主要算法涉及图像处理、计算机视觉和机器学习相关方法。OpenCV其实就是一堆C和C++语言的源代码文件，这些源代码文件中实现了许多常用的计算机视觉算法。OpenCV由一系列C函数和C++类构成，它有C，C++，Python和java接口，当前SDK(SoftwareDevelopmentKit软件
Python Socket编程指南：从入门到实战陈年小趴菜 python python 开发语言 socket 游戏
文章目录一、什么是socket二、mq和socket区别三、客户端代码示例四、服务端代码示例五、结果展示一、什么是socket在Python中使用客户端/服务端Socket可以用于在网络上建立通信连接，实现数据的传输和交换。客户端通过Socket连接向服务端发送请求，服务端接收并处理这些请求，然后返回响应给客户端。客户端/服务端Socket在网络编程中被广泛应用，适用面相当广泛。比如：网络通信：可
Window Mamba 环境安装【CUDA】红豆布丁 python mamba ssm cuda
WindowMamba环境安装1.安装PyTorch环境2.直接安装Mamba及其依赖3.手动编译Mamba及其依赖1.安装PyTorch环境condacreate-nmambapython=3.10condaactivatemambacondainstallcudatoolkit==11.8pipinstalltorch==2.1.1torchvision==0.16.1torchaudio==
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他