周先森爱吃素

Fastai-数据准备

Fastai数据准备

简介

数据是深度学习的立足之本，本文主要介绍Fastai框架如何进行数据加载与数据预处理。

模块划分

在之前的Fastai简介文章我提到过，Fastai最核心的API是按照应用领域（任务类型）进行划分的，打开官方文档也会看到Fastai最核心的思路：在一个DataBunch（Fastai的数据加载器）上训练一个Model对象，是非常简单的，只需要将数据和模型绑定到一个Learner对象即可。

在Fastai的设计中，主要有四大应用领域，对应的四个模块名为collab（协同过滤问题）、tabular（表格或者结构化数据问题）、text（自然语言处理问题）以及vision（计算机视觉问题）。**本系列所有文章围绕都是图像数据进行处理，也就是说主要使用vision模块。**本系列所有文章围绕都是图像数据进行处理，也就是说主要使用vision模块。

而在vision模块中，主要有如下几个模块：data（数据集构建）、models（预定义模型结构，依赖torchvision）、learner（学习器，将模型和数据关联起来，定义了大量回调函数）、transform（数据预处理，包括常见数据增广手段）等。

数据集构建

为了契合Fastai的API设计，这里并没有像之前Pytorch系列和Keras系列那样重构数据集为三个文件夹（对应训练集、验证集和测试集），这是考虑到Fastai的自动训练集划分的API的介绍，事实上划分数据集文件夹也是可以的，只不过多几个DataBunch对象而已。

关于数据集读取的API都在fastai.vision.data模块下，该模块定义了一个类ImageDataBunch用于处理大量的Image对象，这里的Image对象也是由fastai.vision.data模块下定义的一种Image类，它包含一个图片的矩阵表示、路径、维度、尺寸等属性，也包含图像显示、旋转、缩放、变换等。此外，Fastai依旧定义了不少具体视觉任务的类如用于图像分割的ImageSegment、用于检测的ImageBBox、用于关键点定位的ImagePoints等。

在Fastai中数据集的处理都是基于DataBunch类的，ImageDataBunch是其子类，封装了很多具体的适合计算机视觉使用的方法。而在Fastai中数据的导入一般通过data_block API实现，不过，对于常见的CV数据集格式，ImageDataBunch已经做了封装，无需进行繁琐的API编写。这些函数用于从固定格式的文件中获取图像数据，返回的也是ImageDataBunch对象，具体如下。

Folder（文件夹）

ImageDataBunch.from_folder(
  path:PathOrStr,   # 数据集根目录
  train:PathOrStr='train',   # 训练集子目录
  valid:PathOrStr='valid',   # 验证集子目录
  test:Union[Path, str, NoneType]=None,   # 测试集子目录
  valid_pct=None,   # 验证集划分比例
  seed:int=None,   # 验证集随机划分种子
  classes:Collection[T_co]=None,  # 加载哪些类 
  **kwargs:Any)

从Imagenet风格的数据集内加载图像，文件存储必须是如下格式，其中train、valid和test参数指定对应数据集的子文件夹名，如训练集为tra文件夹那么则需要指定train='tra'。

path\
  train\
    class1\
    class2\
    ...
  valid\
    class1\
    class2\
    ...
  test\

当然，如果数据集是本文案例的Caltech101的格式（下面所示），那么只需要简单指定valid_pct作为划分训练集和验证集时验证集占整个数据集的比例即可，seed参数指定随机划分种子，便于复现结果。

path\
  class1\
  class2\
  class3\

执行下面的代码。

from fastai import vision

data = vision.ImageDataBunch.from_folder("../data/101_ObjectCategories/", valid_pct=0.2, size=224)
print(data)
train_ds = data.train_ds  # 取出训练集
valid_ds = data.valid_ds  # 取出测试集

结果如下，生成了训练集和验证集（包括数据列表和类别列表）。

ImageDataBunch;

Train: LabelList (6942 items)
x: ImageList
Image (3, 224, 224),Image (3, 224, 224),Image (3, 224, 224),Image (3, 224, 224),Image (3, 224, 224)
y: CategoryList
accordion,accordion,accordion,accordion,accordion
Path: ..\data\101_ObjectCategories;

Valid: LabelList (1735 items)
x: ImageList
Image (3, 224, 224),Image (3, 224, 224),Image (3, 224, 224),Image (3, 224, 224),Image (3, 224, 224)
y: CategoryList
dollar_bill,umbrella,Motorbikes,pigeon,nautilus
Path: ..\data\101_ObjectCategories;

Test: None

上面的代码在参数中加入了size参数，该参数表示将图像的宽度和高度调整为指定尺寸，并且指定df_tfms可以自定义预处理方法。而且，通过属性获取的操作得到了具体的训练集和验证集，这会得到一个LabelList对象，对其索引可以得到图像和标签，如img, label = train_ds[0]，其中img就是一个Fastai的Image对象。

DataFrame（表格说明文件）

ImageDataBunch.from_folder(
  path:PathOrStr,  # 数据集根目录
  df:DataFrame,   # 包含文件路径和标签的DataFrame
  folder:PathOrStr=None,  # 相对于Path的数据存放的子目录
  label_delim:str=None,  # 标签分隔符
  valid_pct:float=0.2,   
  seed:int=None, 
  fn_col:IntsOrStrs=0,  # 文件名列的名称或者索引号
  label_col:IntsOrStrs=1,   # 标签列的名称或者索引号
  suffix:str='',  # 添加的文件名后缀
  **kwargs:Any)

通过DataFrame获取整个数据集信息，大多数参数同上一节（下文不再说明）。

其针对的数据格式一般如下

path\
  data\
  description.csv

CSV（表格说明文件）

ImageDataBunch.from_csv(
  path:PathOrStr, 
  folder:PathOrStr=None, 
  label_delim:str=None, 
  csv_labels:PathOrStr='labels.csv',   # 如果有单独的标签CSV文件可以这样指定
  valid_pct:float=0.2, 
  seed:int=None, 
  fn_col:int=0, label_col:int=1, 
  suffix:str='', 
  delimiter:str=None, 
  header:Union[int, str, NoneType]='infer', 
  **kwargs:Any)

直接从CSV文件中读取数据集，省去读取为DataFrame的步骤。

文件名

很多数据集存储方式是不同的，有些数据集的标签就存放在文件名中，下面定义的三个方法用于从文件名中提取出标签。

ImageDataBunch.from_name_re(
  path:PathOrStr,  # 文件所在路径
  fnames:FilePathList,  文件名列表
  pat:str,  # 匹配模式
  valid_pct:float=0.2,  # 同上 
  **kwargs)

从文件名中按照正则表达式提取标签。

ImageDataBunch.from_name_func(
  path:PathOrStr, 
  fnames:FilePathList, 
  label_func:Callable,  # 标签提取函数
  valid_pct:float=0.2, 
  seed:int=None, 
  **kwargs)

根据指定的标签提取函数（自行定义）来从文件名中提取标签。

ImageDataBunch.from_lists(
  path:PathOrStr, 
  fnames:FilePathList, 
  labels:StrList,  # 标签列表
  valid_pct:float=0.2, 
  seed:int=None, 
  item_cls:Callable=None, 
  **kwargs)

需要传入一个和fnames同等大小的列表，依次为每个文件指定标签。

数据增强

上一节介绍了构建Fastai中数据集导入部分最为核心的DataBunch的几种常见方法，它就是输入模型的数据了。但是，在输入模型数据之前我们往往会对图像数据进行各种变换，称为数据增强（Data Augmentation）。数据增强本质上其实就是一种正则化，不过发生在数据层面而已。

Transform类

Fastai定义了大量的图像变换函数，通过实例化这些函数对象可以直接对图像数据进行操作。但是这些基础的变换函数都是以_开头的函数如_brightness(x, change)表示改变图像的亮度函数，注意是个函数。但是实际进行数据增强的时候往往要增加一些随机性（如随机进行翻转），所以Fastai提供了一个对这些变换进行封装的类fastai.vision.image.Transform。该类提供共有的特性如变换函数优先级等，这些封装好的变换都在fastai.vision.transform模块下，是不以_开头的一系列对象（由Transform的子类实例化），注意是对象，同时，所有这类封装都相比于原函数多了一个参数p，表示以概率p进行变换，如果p是区间则从区间内随机选择作为概率。可以通过该对象的call方法对图像数据进行处理，如使用brightness(x, change)。

图像变换

下面描述具体的图像变换手段，主要介绍的都是图像变换对象，变换函数只是少了概率参数p而已。

brightness(x, change:uniform)

对图像进行亮度调整，按照change的数值进行，其值为1表示图像为白色，为0表示黑色，为0.5表示无变化，可在0与1之间调整。

contrast(x, scale:log_uniform)

对图像进行对比度调整，sacle表示调整量，当其值为0会将图片转为灰度图，其值为1不调整对比度，大于1会增大对比度。

crop(x, size, row_pct:uniform=0.5, col_pct:uniform=0.5)

对图像进行裁减，按照中心位置(row_pct, col_pct)把图像裁减一个大小为size的patch，这两个位置值以归一化格式表示。

crop_pad(x, size, padding_mode='reflection', row_pct:uniform=0.5, col_pct:uniform=0.5)

和crop类似，不过当裁减图像大于原始图像，会自动进行填充，填充方法为’zeros’, ‘border’或者’reflection’。

dihedral(x, k:partial(uniform_int, 0, 7))

进行图像翻转并伴有一个k*90度的旋转。

dihedral_affine(k:partial(uniform_int, 0, 7))

效果同上，返回的类型不同，当目标是ImageBBox或者ImagePoints时使用。

flip_lr(x)

水平镜像翻转图片。

flip_affine()

同上面的以_affine为结尾的含义。

jitter(c, magnitude:uniform)

邻域像素替换，邻域范围由magnitude参数指定。

pad(x, padding:int, mode='reflection')

图像填充，填充模式三种：zeros（0填充）、border（边角填充）以及默认的reflection（反射填充）。

perspective_warp(c, magnitude:partial(uniform, size=8)=0, invert=False)

透视变换，magnitude是8元组参数，表示四个角归一化坐标的变换幅度。

Image.resize(self, size:Union[int,TensorImageSize])

引用自Torch的图像缩放，size为整数（正方形）或者(3,H,W)格式。

rotate(degrees:uniform)

图像旋转，指定角度即可。

rgb_randomize(x, channel:int=None, thresh:float=0.3)

随机化RGB的某一通道，可以设置最大阈值。

skew(c, direction:uniform_int, magnitude:uniform=0, invert=False)

图像扭曲，可以指定方向和幅度。

squish(scale:uniform=1.0, row_pct:uniform=0.5, col_pct:uniform=0.5)

图像拉伸，scale<1为横向拉伸，scale>1为纵向拉伸。

symmetric_warp(c, magnitude:partial(uniform, size=4)=0, invert=False)

指定的透视变换。

tilt(c, direction:uniform_int, magnitude:uniform=0, invert=False)

倾斜。

zoom(scale:uniform=1.0, row_pct:uniform=0.5, col_pct:uniform=0.5)

等比例缩放。

cutout(x, n_holes:uniform_int=1, length:uniform_int=40)

孔洞产生。

get_transforms()

该函数封装在fastai.vision.transform模块下，返回两个变换列表（每个列表包含一系列变换），用于训练集和验证集。

get_transforms(do_flip:bool=True, flip_vert:bool=False, max_rotate:float=10.0, max_zoom:float=1.1, max_lighting:float=0.2, max_warp:float=0.2, p_affine:float=0.75, p_lighting:float=0.75, xtra_tfms:Optional[Collection[Transform]]=None)

该函数可以很方便地返回大量需要的变换用于数据集的载入，如使用下述代码构建用于随机翻转变换的数据集。

from fastai.vision import transform, open_image, data
tfms = transform.get_transforms(do_flip=True)
data = data.ImageDataBunch.from_folder("../data/101_ObjectCategories/", valid_pct=0.2, size=224, ds_tfms=tfms)
train_ds, valid_ds = data.train_ds, data.valid_ds

补充说明

本文依据最新的官方文档讲解了Fastai中数据读入以及数据增强（文档）的相关知识，具体代码开源于我的Github，欢迎star或者fork。

你可能感兴趣的:(Fastai)

扣子和DIfy调用deepseek对比分析 ISDF-CodeInkVotex 人工智能+科技前沿杂谈人工智能
近日，与网络高人学习，用Coze调用deepseek火山引擎版满血R1大模型，可以构建自己的业务级智能体，觉得还挺好玩的。又闻言，Dify、TensorFlow、PyTorch、Keras、Fastai、HuggingFace等工具可以微调诸如deepseek、chatgpt、doubao等大模型。下面重点讲Dify和Coze在调用deepseek上的区别做一个简要分析，供个人认知扫盲。1.调用方
开源人工智能模型框架：探索与实践 CodeJourney. 人工智能能源
摘要本文深入探讨了开源人工智能模型框架，旨在为研究人员、开发者及相关从业者提供全面的理解与参考。通过对多个主流开源框架，如TensorFlow、PyTorch、Keras、Detectron2、OpenCV、HuggingFaceTransformers、AllenNLP、MindSpore和Fastai的详细分析，阐述其特点、应用场景、优势与不足，并结合具体示例说明其使用方法，同时配以相关架构图
FastAI 之书（面向程序员的 FastAI）（六）绝不原创的飞龙人工智能人工智能深度学习
原文：www.bookstack.cn/read/th-fastai-book译者：飞龙协议：CCBY-NC-SA4.0第十三章：卷积神经网络原文：www.bookstack.cn/read/th-fastai-book/44d8848dfac0c1b0.md译者：飞龙协议：CCBY-NC-SA4.0在第四章中，我们学习了如何创建一个识别图像的神经网络。我们能够在区分3和7方面达到98%以上的准确
使用paperspace搭建fastai深度学习平台禾木清清
在Paperspace上可以快速搭建自己的深度学习平台，具体方法如下：1.注册账户并登陆。2.点击页面的newmachine按钮。3.选择机器所在地，当前有Westcoast,Eastcoast和Europe三个位置可以选择。4.选择操作系统类型，本博客选择Linuxubuntu16.04类型。有时候Linux类型可能需要申请。5.选择机器类型，选择GPU0.4/hr类型，如果加快速度可以选择p5
【tips-AI】提高模型训练的Pytorch技巧斜月三星0727 pytorch 人工智能 python
1.OneCycle学习率策略学习率lr很大程度上影响收敛速度和泛化性能。收敛速度很好理解，对泛化性能的影响却不是很直观。泛化性指模型经过训练后，应用到新数据并做出准确预测的能力。lr影响收敛，即模型训练不恰当(过拟合/欠拟合)，准确率P和召回率R有所下降，影响模型的输出，即模型泛化性能差。话回lr，相比于固定学习率，周期性学习率策略被证明是更有效的训练方式，如fastai中的onecycl
Python遥感影像深度学习指南(1)-使用卷积神经网络（CNN、U-Net）和 FastAI进行简单云层检测 gis收藏家 Python数据处理深度学习人工智能 python
【遥感影像深度学习】系列的第一章，Python遥感影像深度学习的入门课程，介绍如何使用卷积神经网络（CNN）从卫星图像中分割云层1、数据集在本项目中，我们将使用Kaggle提供的38-CloudSegmentationinSatelliteImages数据集。该数据集由裁剪成384x384（适用于深度学习）的卫星场景组成。总共有8400个用于训练和9201个用于测试的图块，分别位于红、绿、蓝和近红
【深度学习】参数优化和训练技巧 TwcatL_tree 深度学习人工智能机器学习深度学习人工智能
寻找合适的学习率(learningrate)学习率是一个非常非常重要的超参数，这个参数呢，面对不同规模、不同batch-size、不同优化方式、不同数据集，其最合适的值都是不确定的，我们无法光凭经验来准确地确定lr的值，我们唯一可以做的，就是在训练中不断寻找最合适当前状态的学习率。比如下图利用fastai中的lr_find()函数寻找合适的学习率，根据下方的学习率-损失曲线得到此时合适的学习率为1
NLP-fastai-lesson4-detailed note （1） kkjusdoit
我们今天将进一步深入研究NLP迁移学习。然后我们将看看表格数据和协同过滤，它们都是非常有用的应用程序。我们将采用该协作过滤示例并深入研究它，以便在数学上准确理解发生了什么-确切地说是计算机中发生了什么。我们将使用它再次以相反的顺序通过应用程序再次返回，以便准确了解所有这些应用程序的幕后发生了什么。自然语言处理（NLP）我想回过头来了解NLP，真正理解那里发生了什么。快速回顾首先，快速回顾一下。记住
ubuntu16.04配置fastai with python3.7 可恶小林子
推荐最简方法python3.7添加源并安装sudoaptupdatesudoaptinstallsoftware-properties-commonsudoadd-apt-repositoryppa:deadsnakes/ppa#安装python3.7sudoaptinstallpython3.7python3.7--version#虚拟环境，使用python3自带的,其余的也可以python3-
fastai 图像分类_使用Fastai进行深度学习图像分类 weixin_26752765 机器学习深度学习人工智能 python 计算机视觉
fastai图像分类TL;DR(TL;DR)Ifyouarebeginningtofeelburntoutonlearningasubjectitisoftenbeneficialtotakeastepoutoftheweeds.Iliketobuildsomethingfunandeasytoregainpositivemomentumonmylearningjourney.Thisisonep
关于cuda和pytorch不兼容问题小小白·yyl pytorch python 深度学习
关于cuda和pytorch不兼容问题问题描述之前是按照网上教程安装的Cuda和pytorch，使用了一段时间之后，在一项任务中安装fastai时，出现了两者版本不兼容问题，无法运行。找不到指定的程序。Errorloading"D:\ANACONDA3\lib\site-packages\torch\lib\torch_cuda_cpp.dll"oroneofitsdependencies.出现如
2023年人工智能开源项目前20名 ygtu2018 人工智能开源
推荐：使用NSDT场景编辑器快速搭建3D应用场景1.Tensorflow2.HuggingFaceTransformers3.Opencv4.Pytorch5.Keras6.StableDiffusion7.Deepfacelab8.Detectron29.ApacheMxnet10.Fastai11.OpenAssistant12.Mindsdb13.DallEMini14.Theano15.T
多模态之情感预测涉及 BERT， RoBERTa， XLNet， XLM， DistilBERT 架构便签棒糖 bert xlnet 人工智能自然语言处理深度学习
情感预测之Fastai结合HuggingFaceTransformers（一）NLP中的迁移学习1.NLP2.迁移学习（二）将tramsformers与fastai集成以实现多类分类1.库安装2.示例任务3.主要变压器类4.其他功能5.数据预处理5.1自定义分词器5.2自定义取数器5.3定制处理器6.设置数据组6.1定制模型7.自定义优化器/自定义指标8.判别性微调和渐进式解冻（可选）9.训练10
【深度学习-图像识别】使用fastai对Caltech101数据集进行图像多分类（50行以内的代码就可达到很高准确率） AiFool Python 深度学习分类人工智能
文章目录前言fastai介绍数据集介绍一、环境准备二、数据集处理1.数据目录结构2.导入依赖项2.读入数据3.模型构建3.1寻找合适的学习率3.2模型调优4.模型保存与应用总结人工智能-图像识别系列文章目录前言fastai介绍fastai是一个深度学习库，它为从业人员提供了高级组件，可以快速、轻松地在标准深度学习领域提供最先进的结果，并为研究人员提供了低级组件，可以混合和匹配以构建新的方法。以解耦
fastai课后习题（一) 世界待你如此好
1、在深度学习中，你需要这些吗？LotsofmathT/FLotsofdataT/FLotsofexpensivecomputersT/FAPhDT/F答：不是必须的，有当然更好2、说出深度学习在哪五个领域表现出色?答：计算机视频、语言处理、医学、机器人、协同过滤3、第一个基于人工神经元原理的设备名称叫什么?答：由FrankRosenblatt博士制造的MarkIperceptron的''实体''
fastai qiaoqiao123
data_inputinput2input2_data_transfrominput3showdataliketraintrain1input4input_data_likeinput4_train2train3train3train2train4predictpredict
nvidia英伟达GPU:nvidia driver is not loaded 一个不安分的程序员 AI 日志 fastai 深度学习神经网络机器学习 nvidia driver
最近在开fastai提供的AI教程,刚好自己的电脑上有nvidia独显(GPU),先前因为耗电温度高就切换到了内置显卡.是时候实现你的价值了nvidia,出来吧小宝贝.执行召唤咒语:nvidia-settings后傻眼了:ERROR:NVIDIAdriverisnotloadedERROR:Unabletoloadinfofromanyavailablesystem(nvidia-settings
Fastai Focal Loss 深度学习模型优化
这个是防止每次运行的时候结果都差别很大的情况，前提是你使用pytorch来实现你的想法。defseed_everything(seed=42):random.seed(seed)os.environ['PYTHONHASHSEED']=str(seed)np.random.seed(seed)torch.manual_seed(seed)torch.cuda.manual_seed(seed)to
kaggle竞赛报告：APTOS 2019 Blindness Detection 深度学习模型优化
记录比赛过程中的所思所想。1基线模型1.1model1地址为IntroAPTOSDiabeticRetinopathy(EDA&Starter)。这个代码主要使用的是fastai的框架。1.2model2地址为baseline-APTOS2019BlindnessDetection。1.3model3efficientnet-pytorch-ignite2基线模型的改进2.1数据存在严重的训练样本
fastai load learner 五长生
It'stootedioustouse"learn.load()"function.Weneedtopreparethedataforanothertime.SoIthinkifthereisawaywecanloadtheentirelearner.Thenwecanfindthe"learner_loader"functionindocs.image.png1、Wewillsavethelea
这些Python计算机视觉工具，帮你coding事半功倍 AbnerAI python 计算机视觉人工智能
作为开发人员喜爱的语言之一，Python以其丰富的社区可用工具和库而闻名。我们列出了开发人员可以用于计算机视觉10个流行流行的Python库或平台，以帮助开发人员自动化开发任务，其中包括检测和可视化。1|fastaifastai是一个深度学习库，它提供高级组件，可以在标准深度学习领域快速、轻松地提供最先进的结果。它还为研究人员提供了可以混合和匹配的低层次组件，以建立新的方法。fastai包括各种特
FastAI03-模型投入生成环境科技老丁哥
FastAI模型在训练完成之后，需要投入到生成环境中，用于新图片的预测。1.模型的保存和加载模型的导出可以使用：learn.export()这个会在目录中创建一个名为export.pkl的文件，它包含了部署模型所需要的所有内容（模型，权重以及一些元数据）等，但我本人不太愿意用这种方法，因为我无法准确指定保存的路径和名称，这时，可以用：learn.export('/home/ray/DataSet/
docker运行jupyter逐步操作笔记 dreadnaught
运行环境：在VMware中运行一台OS为centos8的宿主机，在上面运行docker目标：把fastai的镜像起起来，并且能够看到jupyter界面分解：看看人家的dockerfile写的啥dockerhistoryspellrun/fastai--no-trunc=true运行docker容器问题：dockerrun完就挂了，没有持续运行解决：没有使用交互式运行，应使用dockerrun-t-
lesson7 part4 feature_loss 不愿透露身份的美凌格
FeatureLoss上周，我们把fastai发展到这样一个阶段，让GAN变得像API一样，比任何其他的库更简洁，更灵活。我也有点失望，训练要花很长时间，结果也一般。下一步是我们可以完全舍弃GAN。第一步，我们真正想做的事情，是提出更好的损失函数。我们需要一个能很好辨认出高品质图片的损失函数，能克服GAN具有的问题，或者不只是高品质图片，就是应该长成某种样子的图片。真正好用的技巧在这里，几年前的这
fastAI学习 EdwardMa
背景2018版的课程有两部分Part1.PracticalDeepLearningForCoders,介绍如何建立SOTA模型，不需要研究生水平的数学知识，课程全部免费，遇到问题可以在forums.fast.ai里交流。课程有7周，一共包含20小时。Part2.CuttingEdgeDeepLearningForCoders学习DL最近的发展，如何阅读和实现最新的学术论文，解决具有挑战性的end-
日更77 深度学习模型优化
两个事情：在亲属关系识别中，使用facenet和vggnet的方法提取特征，进行fine-tune，目前成绩在15%左右。在眼球问题识别中，使用fastai做了几个操作。baseline0，fork了一个很爽的结果baseline1.自己用fastai搭了一个模型，但是图压缩到224了baseline2.自己用fastai搭了多个模型，集成之后看下结果如何。后期的改进方向，使用大尺寸图像。
2020年深度学习调参技巧合集人工智能与算法学习神经网络算法计算机视觉机器学习人工智能
文|山竹小果源|NewBeeNLP编|夕小瑶的卖萌屋重点说明：本文主要为整理总结，大部分参考文末资料，感谢分享。寻找合适的学习率学习率是一个非常非常重要的超参数，这个参数呢，面对不同规模、不同batch-size、不同优化方式、不同数据集，其最合适的值都是不确定的，我们无法光凭经验来准确地确定lr的值，我们唯一可以做的，就是在训练中不断寻找最合适当前状态的学习率。比如下图利用fastai中的lr_
[fasi.ai] unet实现CamVid数据集预测来碗拿铁️ fast.ai pytorch 深度学习自动驾驶
[fasi.ai]unet实现CamVid数据集预测fastai介绍unet介绍CamVid数据集介绍程序实现fastai介绍最近发现了一个究极棒的python包fastai，他们的官网说宗旨是makeneuralnetuncoolagain，我觉得也确实做到了这点。fastai相较于pytorch，就像keras相较于tensorflow，是一个高级封装。其封装程度之高，用5行就可以完成mnis
Linux机器学习环境搭建记录 ironyl linux python
Linux机器学习环境搭建记录1.NVIDIA显卡驱动安装2.Anaconda安装3.Pytorch与FastAI4.XGBoost，CatBoost和LightGBMNVIDIA显卡驱动安装下载.run安装包以后，在此目录下打开ctrl+alt+t打开终端，输入sudochmod777NVIDIA-Linux-xx.run输入密码，将安装包放到home下，打开终端关闭lightdm（由于ctrl
fastai课后习题（四）世界待你如此好
1、灰色图片是如何在计算机显示的？彩色的呢答：图像由数组表示，像素值表示图像的内容。对于灰度图像，使用二维数组，像素表示灰度值，范围为256个整数。值为0表示白色，值255表示黑色，中间有不同的灰度。对于彩色图像，通常使用三种颜色通道（红、绿、蓝），每个通道使用一个独立的256范围二维阵列。像素值0再次表示白色，255表示实心红色、绿色或蓝色。这三个二维数组形成一个最终的三维数组（秩3张量），表示
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam