thystar

caffe学习笔记4-- 手写数字mnist训练过程

通过mnist数据集的训练，来看一下caffe的运行过程

这是caffe官网：examples里的第二个例子，链接地址：http://caffe.berkeleyvision.org/gathered/examples/mnist.html

1. 准备数据

首先，我们需要从网上下载数据，在caffe根目录下运行一下命令

./data/mnist/get_mnist.sh
./examples/mnist/create_mnist.sh

运行完后，会出现如下两个文件：

mnist_train_lmdb, and mnist_test_lmdb

具体看一下这里面写了写啥：

get_mnist.sh 用于获取数据

#!/usr/bin/env sh
# This scripts downloads the mnist data and unzips it.

DIR="$( cd "$(dirname "$0")" ; pwd -P )"
cd $DIR

echo "Downloading..."　＃下载手写数据集，http后面是手写数据集的网址

wget --no-check-certificate http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz
wget --no-check-certificate http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz
wget --no-check-certificate http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz
wget --no-check-certificate http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz

echo "Unzipping..."　＃ 下载完成后解压

gunzip train-images-idx3-ubyte.gz
gunzip train-labels-idx1-ubyte.gz
gunzip t10k-images-idx3-ubyte.gz
gunzip t10k-labels-idx1-ubyte.gz

# Creation is split out because leveldb sometimes causes segfault
# and needs to be re-created.

echo "Done."

/examples/mnist/create_mnist.sh　＃生成数据，这个脚本的作用是将数据转换成lmdb格式或leveldb格式

具体如下：

#!/usr/bin/env sh
# This script converts the mnist data into lmdb/leveldb format,
# depending on the value assigned to $BACKEND.

EXAMPLE=examples/mnist
DATA=data/mnist
BUILD=build/examples/mnist

BACKEND="lmdb"

echo "Creating ${BACKEND}..."

rm -rf $EXAMPLE/mnist_train_${BACKEND}
rm -rf $EXAMPLE/mnist_test_${BACKEND}

$BUILD/convert_mnist_data.bin $DATA/train-images-idx3-ubyte \
  $DATA/train-labels-idx1-ubyte $EXAMPLE/mnist_train_${BACKEND} --backend=${BACKEND}　＃训练数据
$BUILD/convert_mnist_data.bin $DATA/t10k-images-idx3-ubyte \
  $DATA/t10k-labels-idx1-ubyte $EXAMPLE/mnist_test_${BACKEND} --backend=${BACKEND}　＃测试数据

echo "Done."

convert_mnist_data.bin是由convert_minst_data.cpp编译生成的可执行文件，这个编译过程就是在caffe安装的时候完成的，这个函数接受四个参数：

$DATA/train-images-idx3-ubyte: 手写数字源文件
$DATA/train-labels-idx1-ubyte: 手写数字标签文件
$EXAMPLE/mnist_train_${BACKEND} : 转换后数据的存储位置
--backend=${BACKEND} : 宏定义，转换数据的格式lmdb或leveldb

注：convert_mnist_data.cpp及用到的其他文件在下一篇中介绍

2. 网络模型

这个实验中使用的模型是LeNet,其模型结构如下：

这个网络包含两个卷积层，两个池化层，两个全连接层，最后一层用于分类

其结构定义在：$CAFFE_ROOT/examples/mnist/lenet_train_test.prototxt中,图示如下

对于这个文档的了解，需要查看caffe.proto相关的内容

首先，给出网络名称

name: "LeNet"

2.1. 数据层

接着，是数据层的写入

这里，我们从之前创建的lmdb文件夹中读入数据

layer {
  name: "mnist"    //层名称
  type: "Data"     // 层类型：数据层
  top: "data"       //该层产生两个blobs,: data blobs
  top: "label"      //label blobs
  include {
    phase: TRAIN　// 仅用于训练阶段
  }
  transform_param {
    scale: 0.00390625　//将图像的像素值归一化，＝1/256
  }
  data_param {
    source: "examples/mnist/mnist_train_lmdb"   //数据所在的文件路径
    batch_size: 64　//批尺寸，是每次迭代时输入样本的数量
    backend: LMDB　//输入数据的类型为lmdb
  }
}

文档中还有另一个数据层，用于测试阶段

2.2. 卷积层

layer {
  name: "conv1"
  type: "Convolution"      //层类型：　卷积层
  bottom: "data"     //该层的输入为data blobs, 由数据层产生
  top: "conv1"     //输出为卷积特征conv1
  param {
    lr_mult: 1　　//权重w的学习率倍数
  }
  param {
    lr_mult: 2       //权重b的学习率倍数，
  }
  convolution_param {  //卷积参数
    num_output: 20　　//输出为20个特征图，其规模为(data_size-kernel_size + stride)*(data_size -kernel_size + stride)
    kernel_size: 5    //卷积核为5x5
    stride: 1    //卷积核的移动间隔为１
    weight_filler {
      type: "xavier"  //权值初始化方法,这里用xavier......
    }
    bias_filler {
      type: "constant"  //偏置初始化为常量，默认为０
    }
  }
}

2.3 池化层

layer {
  name: "pool1"
  type: "Pooling"　//层类型：池化层
  bottom: "conv1"　// 该层的输入为conv1的输出结果
  top: "pool1"　//输出为pooling后的特征
  pooling_param {
    pool: MAX　//pooling方式：最大值
    kernel_size: 2  //pooling核为2x2
    stride: 2 //间隔为2
  }
}

2.4　全连接层

layer {
  name: "ip1"
  type: "InnerProduct"
  bottom: "pool2"　//该层输入为上个池化层的输出
  top: "ip1"    //输出
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  inner_product_param {
    num_output: 500　//500个输出
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}

2.5 非线性层

layer {
  name: "relu1"
  type: "ReLU"　//ReLU，限制线性单元，是一种激活函数，与sigmoid作用类似
  bottom: "ip1"　
  top: "ip1"
}

2.6 准确率层

layer {
  name: "accuracy"
  type: "Accuracy"
  bottom: "ip2"
  bottom: "label"
  top: "accuracy"
  include {
    phase: TEST  //仅用于测试数据，计算算法准确度
  }
}

2.7 损失估计层

layer {
  name: "loss"
  type: "SoftmaxWithLoss"　//多分类使用softMax回归计算损失
  bottom: "ip2"
  bottom: "label" //需要用到数据层产生的lable;
  top: "loss"
}

3.模型优化文件

这个文件在$CAFFE_ROOT/examples/mnist/lenet_solver.prototxt，配置一些参数信息等

文件内容如下：

# The train/test net protocol buffer definition
net: "examples/mnist/lenet_train_test.prototxt" #网络模型文件路径
# test_iter specifies how many forward passes the test should carry out.
# In the case of MNIST, we have test batch size 100 and 100 test iterations,
# covering the full 10,000 testing images.
test_iter: 100            #test的迭代次数，批处理大小为100，　100*100为测试集个数
# Carry out testing every 500 training iterations.
test_interval: 500         #训练时每迭代500次测试一次
# The base learning rate, momentum and the weight decay of the network.
base_lr: 0.01        #学习率
momentum: 0.9      #动量
weight_decay: 0.0005       #权重衰减
# The learning rate policy#学习率策略
lr_policy: "inv" 
gamma: 0.0001
power: 0.75
# Display every 100 iterations     #每迭代100次显示
display: 100
# The maximum number of iterations
max_iter: 10000　#最大迭代次数
# snapshot intermediate results#我感觉可能是每迭代5000次存储一次参数什么的。
snapshot: 5000
snapshot_prefix: "examples/mnist/lenet"   
# solver mode: CPU or GPU
solver_mode: GPU     #使用GPU 训练

4. 训练数据

在caffe根目录下输入：

./examples/mnist/train_lenet.sh

首先，程序读取lenet_solver.prototxt和lenet_train_test.prototxt这两个配置文件

sindyz@sindyz-desktop:~/caffe-master$ ./examples/mnist/train_lenet.sh
I0112 13:53:13.997781  3792 caffe.cpp:184] Using GPUs 0
I0112 13:53:14.093080  3792 solver.cpp:48] Initializing solver from parameters: 
test_iter: 100
test_interval: 500
base_lr: 0.01
display: 100
max_iter: 10000
lr_policy: "inv"
gamma: 0.0001
power: 0.75
momentum: 0.9
weight_decay: 0.0005
snapshot: 5000
snapshot_prefix: "examples/mnist/lenet"
solver_mode: GPU
device_id: 0
net: "examples/mnist/lenet_train_test.prototxt"
I0112 13:53:14.093252  3792 solver.cpp:91] Creating training net from net file: examples/mnist/lenet_train_test.prototxt
I0112 13:53:14.093545  3792 net.cpp:322] The NetState phase (0) differed from the phase (1) specified by a rule in layer mnist
I0112 13:53:14.093574  3792 net.cpp:322] The NetState phase (0) differed from the phase (1) specified by a rule in layer accuracy
I0112 13:53:14.093646  3792 net.cpp:49] Initializing net from parameters: 
name: "LeNet"
..........

之后，紧跟着创建每层网络，这里没有一一贴出。只给出了一部分

4.1 数据层

I0112 13:53:14.093978  3792 layer_factory.hpp:77] Creating layer mnist　//创建数据层，文件中这层命名为mnist
I0112 13:53:14.094444  3792 net.cpp:106] Creating Layer mnist
I0112 13:53:14.094468  3792 net.cpp:411] mnist -> data
I0112 13:53:14.094490  3792 net.cpp:411] mnist -> label
I0112 13:53:14.095192  3797 db_lmdb.cpp:38] Opened lmdb examples/mnist/mnist_train_lmdb
I0112 13:53:14.100249  3792 data_layer.cpp:41] output data size: 64,1,28,28   //输出data blobs（number, channel, width, height）
I0112 13:53:14.101164  3792 net.cpp:150] Setting up mnist
I0112 13:53:14.101198  3792 net.cpp:157] Top shape: 64 1 28 28 (50176)
I0112 13:53:14.101207  3792 net.cpp:157] Top shape: 64 (64)
I0112 13:53:14.101213  3792 net.cpp:165] Memory required for data: 200960

4.2 卷积层（conv1）

I0112 13:53:14.101223  3792 layer_factory.hpp:77] Creating layer conv1　
I0112 13:53:14.101245  3792 net.cpp:106] Creating Layer conv1
I0112 13:53:14.101253  3792 net.cpp:454] conv1 <- data
I0112 13:53:14.101269  3792 net.cpp:411] conv1 -> conv1
I0112 13:53:14.101812  3792 net.cpp:150] Setting up conv1
I0112 13:53:14.101837  3792 net.cpp:157] Top shape: 64 20 24 24 (737280)
I0112 13:53:14.101845  3792 net.cpp:165] Memory required for data: 3150080

4.3 池化层(pooling1)

I0112 13:53:14.101857  3792 layer_factory.hpp:77] Creating layer pool1
I0112 13:53:14.101872  3792 net.cpp:106] Creating Layer pool1
I0112 13:53:14.101878  3792 net.cpp:454] pool1 <- conv1
I0112 13:53:14.101886  3792 net.cpp:411] pool1 -> pool1
I0112 13:53:14.101948  3792 net.cpp:150] Setting up pool1
I0112 13:53:14.101958  3792 net.cpp:157] Top shape: 64 20 12 12 (184320)
I0112 13:53:14.101963  3792 net.cpp:165] Memory required for data: 3887360

4.4 全连接层(ip1)

I0112 13:53:14.102401  3792 layer_factory.hpp:77] Creating layer ip1
I0112 13:53:14.102416  3792 net.cpp:106] Creating Layer ip1
I0112 13:53:14.102421  3792 net.cpp:454] ip1 <- pool2
I0112 13:53:14.102428  3792 net.cpp:411] ip1 -> ip1
I0112 13:53:14.105073  3792 net.cpp:150] Setting up ip1
I0112 13:53:14.105095  3792 net.cpp:157] Top shape: 64 500 (32000)
I0112 13:53:14.105101  3792 net.cpp:165] Memory required for data: 5039360

4.5 非线性层

I0112 13:53:14.105113  3792 layer_factory.hpp:77] Creating layer relu1
I0112 13:53:14.105124  3792 net.cpp:106] Creating Layer relu1
I0112 13:53:14.105130  3792 net.cpp:454] relu1 <- ip1
I0112 13:53:14.105139  3792 net.cpp:397] relu1 -> ip1 (in-place)
I0112 13:53:14.105152  3792 net.cpp:150] Setting up relu1
I0112 13:53:14.105161  3792 net.cpp:157] Top shape: 64 500 (32000)
I0112 13:53:14.105166  3792 net.cpp:165] Memory required for data: 5167360

4.6 损失层

I0112 13:53:14.105664  3792 layer_factory.hpp:77] Creating layer loss
I0112 13:53:14.105677  3792 net.cpp:106] Creating Layer loss
I0112 13:53:14.105685  3792 net.cpp:454] loss <- ip2
I0112 13:53:14.105692  3792 net.cpp:454] loss <- label
I0112 13:53:14.105700  3792 net.cpp:411] loss -> loss

接下来，开始计算反馈网络，（内容不在一一贴出，运行是会看到）

之后，输出测试网络和创建过程

这一步完成后，开始优化参数

I0112 13:53:14.112908  3792 net.cpp:283] Network initialization done.
I0112 13:53:14.112957  3792 solver.cpp:60] Solver scaffolding done.
I0112 13:53:14.113140  3792 caffe.cpp:212] Starting Optimization
I0112 13:53:14.113149  3792 solver.cpp:288] Solving LeNet
I0112 13:53:14.113154  3792 solver.cpp:289] Learning Rate Policy: inv
I0112 13:53:14.113476  3792 solver.cpp:341] Iteration 0, Testing net (#0)
I0112 13:53:15.875176  3792 solver.cpp:409]     Test net output #0: accuracy = 0.0861
I0112 13:53:15.875221  3792 solver.cpp:409]     Test net output #1: loss = 2.34769 (* 1 = 2.34769 loss)
I0112 13:53:15.889724  3792 solver.cpp:237] Iteration 0, loss = 2.33398

当代码运行到这里时，进入迭代优化过程

待运行结束，输出结果：

I0112 13:59:25.476456  3792 solver.cpp:409]     Test net output #0: accuracy = 0.9908
I0112 13:59:25.476516  3792 solver.cpp:409]     Test net output #1: loss = 0.02798 (* 1 = 0.02798 loss)
I0112 13:59:25.476526  3792 solver.cpp:326] Optimization Done.
I0112 13:59:25.476531  3792 caffe.cpp:215] Optimization Done.

其中，#0:为准确度，　#1:为损失

下一篇，将介绍一下mnist中的cpp代码部分

参考资料：

http://caffe.berkeleyvision.org/gathered/examples/mnist.html

caffe初学，把边学的东西记下来，希望大家多多指导。

Caffe学习系列——工具篇：计算数据集的图像均值 Solomon1588 计算机视觉CV Caffe 深度学习深度学习 Caffe 数据预处理特征标准化
本系列文章介绍深度学习框架Caffe及其实践，本文主要介绍Caffe的实用工具——compute_image_mean计算图像均值.1.图像预处理——零均值化数据预处理在深度学习中非常重要，数据预处理中，标准的第一步是数据归一化。特征归一化常用的方法包含如下几种：简单缩放逐样本均值消减(也称为移除直流分量)特征标准化(使数据集中所有特征都具有零均值和单位方差)特征标准化指的是（独立地）使得数据的每
Caffe学习（五）：SSD源码解读ssd_pascal.py QZX-light Caffe学习系列 Caffe
参考博客：https://blog.csdn.net/xunan003/article/details/79089280from__future__importprint_functionimportcaffefromcaffe.model_libsimport*fromgoogle.protobufimporttext_formatimportmathimportosimportshutilim
caffe学习（1）------windows下基于GPU配置 lishanlu136 caffe caffe
最近准备用caffe做图片的分类，可配置caffe就让我折腾了大半个月，一直配置不成功，最后还是参考官网的tutorial才配置成功，于是决定把配置的过程写下来，如果后面有朋友配置caffe遇到什么问题，还可以参考参考。首先贴出官方的配置caffe的工程：https://github.com/BVLC/caffe/tree/windows，注意，这可是基于Windows系统的，因为我的电脑是win
caffemodel特征可视化_Caffe学习笔记4图像特征进行可视化 weixin_39824801 caffemodel特征可视化
Caffe学习笔记4图像特征进行可视化本文为原创作品，未经本人同意，禁止转载，禁止用于商业用途！本人对博客使用拥有最终解释权欢迎关注我的博客：http://blog.csdn.net/hit2015spring和http://www.cnblogs.com/xujianqing/可以算是对它的翻译的总结吧，它可以算是学习笔记2的一个发展，2是介绍怎么提取特征，这是介绍怎么可视化特征1、准备工作首先
Caffe学习：build/tools/convert_imageset jiarenyf caffe caffe
caffe/build/tools/convert_imageset用于将image图片转化为lmdb（leveldb）格式编写命令，实现图片格式转化：#!bin/sh#工具目录TOOLS_ROOT=caffe/build/tools#train_datas存放训练图片#label_train.txt保存图片标签#shuffle参数用于打乱图片读取顺序#train_db文件夹（不可手动新建）存放转
Caffe学习之——caffe.cpp源码解析 ciky奇 caffe caffe.cpp
本文主要解析caffe源码中/tools/caffe.cpp文件，此文件是caffe程序的入口main函数，包含了命令行参数代码实现，如tain,test，time等。caffe结构请参考：https://blog.csdn.net/c20081052/article/details/80585888caffe命令行参数请参考：https://blog.csdn.net/c20081052/art
caffe学习(1):多平台下安装配置caffe weixin_34238642 操作系统运维 git
如何在centos7.3上安装caffe深度学习工具有好多朋友在安装caffe时遇到不少问题。(看文章的朋友希望关心一下我的创业项目趣智思成)今天测试并整理一下安装过程。我是在阿里云上测试，选择centos7.3镜像。先安装epel源1yuminstallepel-release安装基本编译环境12yuminstallprotobuf-develleveldb-develsnappy-develo
Caffe学习笔记1-安装以及代码结构 baobei0112 CNN 卷积神经网络
Caffe学习笔记1-安装以及代码结构ByYuFeiGan2014-12-09更新日期:2014-12-09安装按照官网教程安装，我在OSX10.9和Ubuntu14.04上面都安装成功了。主要麻烦在于gloggflagsgtest这几个依赖项是google上面的需要。由于我用Mac没有CUDA，所以安装时需要设置CPU_ONLY:=1。如果不是干净的系统，安装还是有点麻烦的比如我在OSX10.9
caffe学习笔记--写一个运行caffe.cpp的makefile thystar caffe学习
之前因为有caffe的项目要放到服务器上面,但是其实不需要在服务器上面重新安装caffe，所以写了个makefile.这里改写了个简单的，比较容易读的，只运行caffe.cpp，如果由其他的，可以按照makefile的规则添加就好。首先，还是要说一下关于caffe的依赖，参考之前的两篇博客：http://blog.csdn.net/thystar/article/details/51179064和
caffe学习笔记10.1--Fine-tuning a Pretrained Network for Style Recognition(new) thystar caffe学习
在之前的文章里，写过一个关于微调的博客，但是今天上去发现这部分已经更新了http://nbviewer.jupyter.org/github/BVLC/caffe/blob/master/examples/02-fine-tuning.ipynb，因此补一篇最新的，关于微调，前面的文章由讲，参考http://blog.csdn.net/thystar/article/details/5067553
caffe学习笔记（11）：多任务学习之HDF5Data类型数据集生成 guyunee deep learning matlab object detection 数据标签 caffe 深度学习
最近开始研究多任务学习（multi-tasklearning，MTL），先分享给大家：本文主要讲述数据集的建立，HDF5Data类型用于处理多标签数据，在网络中定义为：layer{name:"data"type:"HDF5Data"top:"data"top:"label"include{phase:TRAIN}hdf5_data_param{source:"list_train.txt"batc
Caffe学习：Forward and Backward jiarenyf caffe caffe
原文forwardandbackwardpasses（前向迭代和反向迭代）是Net最基本的成分。下面以简单的logisticregressionclassifier（逻辑回归分类器）为例。ForwardPass（前向迭代）利用给定的输入，根据模型设定的函数，计算出输出。Thispassgoesfrombottomtotop（数据流向从bottom到top）。数据x通过一个innerproductl
Ubuntu14.04下配置Caffe+OpenCV2.4.10+CUDA7.5+cuDNN5.1.10 cuihaolong 3D Print 系统配置
1.CUDA配置与Tensorflow，Keras等深度学习框架一样的配置方法，一次配置可以重用，其他基础软件和依赖项亦可参考：Caffe学习笔记2--Ubuntu14.0464bit安装Caffe（GPU版本）Ubuntu14.04+Caffe+Cuda7.5+Opencv3.0安装教程Caffe+Ubuntu14.0464bit+CUDA6.5配置说明Caffe搭建：Ubuntu14.04+C
Caffe学习笔记（一）: 训练和测试自己的数据集 __Sunshine__ 笔记 Python caffe 训练数据集计算机视觉
1数据准备首先在caffe根目录下建立一个文件夹myfile，用于存放数据文件和后面的caffe模型相关文件。然后在myfile文件夹下建立build_lmdb和datatest两个文件夹，其中build_lmdb文件夹用于存放生成的lmdb文件，datatest文件夹存放图片数据。在datatest下主要有2个文件夹和2个.sh文件和2个.txt文件，其中train文件夹中存放待训练的图片，va
Caffe学习（三）Caffe模型的结构遍地流金 Caffe学习
一总体结构在caffe中，解决一个问题首先应该定义一个slover，反应到mnist例程中也就是lenet_solver.prototxt。该slover主要包括两部分，（1）为网络模型model，（2）为该模型参数的具体optimization方法及参数。model主要由各种layer组成，主要包括数据相关的DataLayer，图像滤波变换相关的VisionLayer，非线性激活函数Activa
caffe数据文件lmdb训练神器digits hi我是大嘴巴
denny的学习专栏徐其华博客园首页新随笔联系管理订阅随笔-145文章-0评论-1085Caffe学习系列(21)：caffe图形化操作工具digits的安装与运行经过前面一系列的学习，我们基本上学会了如何在linux下运行caffe程序，也学会了如何用python接口进行数据及参数的可视化。如果还没有学会的，请自行细细阅读：caffe学习系列：http://www.cnblogs.com/den
Caffe学习总结（一）——初识caffe 不系之舟913 深度学习 caffe 深度学习机器学习框架
深度学习在当前情况下可以用一个字来形容“火”，目前项目中使用到了常用的机器学习算法，在使用过程中发现图像的特征提取成为识别的瓶颈，无意中了解到caffe，可以很好的解决特征提取的问题。于是想尝试一下caffe的威力。初识caffe，就习惯性了想了解下作者，发现设计作者是贾杨清，终于发现一个牛逼的框架是我们中国人做的啦！于是很兴奋，很想深入的进行学习，希望能在工作中使用起来。1、caffe的由来到一
深度学习之----caffe Steven_ycs
本文主要讲解caffe的整个使用流程，适用于初级入门caffe，通过学习本篇博文，理清项目训练、测试流程。初级教程，高手请绕道。我们知道，在caffe编译完后，在caffe目录下会生成一个build目录，在build目录下有个tools，这个里面有个可执行文件caffe，如下图所示：有了这个可执行文件我们就可以进行模型的训练，只需要学会调用这个可执行文件就可以了，这便是最简单的caffe学习，不需
caffe学习系列二：源码深入解析-单步跟踪调试指南 singularpt
为了更好的学习caffe，我们利用上节安装好的环境，进行单步调试，以窥caffe全貌。准备工作：要在vs2013中单步跟踪调试caffe，需要配置caffe工程，打开【属性】-【调试】-【命令行参数】中加入输入参数。如下配置：image.png先贴一张caffe的整体处理流程：image.png一、函数入口众所周知，caffe由c++写的，而c++的入口函数为main，我们在caffe.cpp文件
Ubuntu 14.04下编译OpenPose crazyhank
OpenPose是CMU开发的一个开源人体姿态检测模型，github地址为：https://github.com/CMU-Perceptual-Computing-Lab/openpose，下面为在ubuntu14.04版本上编译的过程下载源码由于openpose依赖于第三方的caffe学习框架，所以在gitclone一定要加上"--recursive"选项,如下所示:#gitclone--rec
Caffe学习笔记6：过程小结 Zz鱼丸
之前写的学习笔记1用两种方法进行预测，今天发现有点不对。下面进行分析总结：先来看看Classifier的源代码#!/usr/bin/envpython"""ClassifierisanimageclassifierspecializationofNet."""importnumpyasnpimportcaffeclassClassifier(caffe.Net):"""Classifierexte
Caffe Cifar10模型测试及可视化不会积
本文主体来自[Caffe学习系列(17)：模型各层数据和参数可视化]，加了一点自己的注释(http://www.cnblogs.com/denny402/p/5105911.html)先用caffe对cifar10进行训练，将训练的结果模型进行保存，得到一个caffemodel，然后从测试图片中选出一张进行测试，并进行可视化。#加载必要的库importnumpyasnpimportmatplotl
Caffe学习系列(3)：视觉层（Vision Layers)及参数 weixin_33850890 matlab 人工智能
所有的层都具有的参数，如name,type,bottom,top和transform_param请参看我的前一篇文章：Caffe学习系列(2)：数据层及参数本文只讲解视觉层（VisionLayers)的参数，视觉层包括Convolution,Pooling,LocalResponseNormalization(LRN),im2col等层。1、Convolution层：就是卷积层，是卷积神经网络（C
Caffe学习之一：Caffe的配置和编译 sherry_gp 程序软件安装
最近，在学习deeplearning，使用的工具就是caffe，比较容易上手，不啰嗦了，先说环境的配置和编译。系统的平台为win10+matlab2014b+vs2013.在开始之前，要安装cuda的驱动，我使用的cuda7.5这个版本（为了和caffe里面使用的版本同步）。首先，在https://github.com/happynear/caffe-windows下载caffe和以及此页面上提供
【深度学习框架Caffe学习与应用】第四课 Caffe可视化工具 soldier123333 [caffe学习笔记]
1.首先准备pycaffe环境输入一下命令：2.网络可视化的工具2.1在caffe中，有一个专门用于画网络结构图的py文件：caffe/tools/draw_net.py2.2也可以通过在线可视化工具，网址如下：http://ethereon.github.io/netscope/#/editor2.caffemodel的可视化，需要先把代码看明白，这里不写了3.特征图的可视化4.loss和acc
【深度学习框架Caffe学习与应用】第十一课 soldier123333 [caffe学习笔记]
1.车辆检测实践：使用Caffe训练的深度学习模型做目标检测——以车辆检测为例有关文件都放在以下文件夹中：对vehicle_detetc.cpp进行编译：编译之前，需要修改一下代码中的文件路径：我刚开始先编译之后，才修改的源文件，所以运行的时候，出现下面错误：只要修改完路径之后，重新编译就好结果如下图所示：效果不好，有误检
【深度学习框架Caffe学习与应用】第五课自定义神经层和数据输入层 soldier123333 [caffe学习笔记]
一、自定义神经层1.创建新定义的头文件，目录在caffe/include/caffe/layers/my_neuron_layer.hpp我复制了conv_layer.hpp文件，然后在该文件的内容上进行更改如果只是需要CPU方法，可以注释掉forward_gpu和backward_gpu修改对照内容如下（左侧是conv_layer.hpp，右侧是my_neuron_layer.hpp)：2.创建
【深度学习框架Caffe学习与应用】第三课使用训练好的模型 soldier123333 [caffe学习笔记]
1.均值文件将所有训练样本的均值保存为文件。首先将计算均值文件的caffe工具compute_image_mean放到当前目录：caffe/test/mnist/下面，之后运行如下命令：这样，我们的均值文件就生成了2.改写deploy文件（以mnist为例）（略过）3.使用修改后的mnist的deploy文件，输入一张图片，输出分类结果首先我们写了一个test_mnist.cpp文件，先进行编译，
Caffe学习笔记11:Ubuntu 16.04 中 caffe 编译出现的错误——fatal error: hdf5.h: 没有那个文件或目录 weixin_41774576 Caffe
step1:cd/usr/lib/x86_64-linux-gnusudoln-slibhdf5_serial.so.8.0.2libhdf5.sosudoln-slibhdf5_serial_hl.so.8.0.2libhdf5_hl.sostep2：changeMakefile.config//打开Makefile.config将下面的INCLUDE_DIRS:=$(PYTHON_INCLUD
caffe学习-代码阅读DataLayer 华山汉灵编程-深度学习框架
以下摘录自《深度学习轻松学》冯超为了能够尽可能地提高训练速度，DataLayer采用了异步准备数据的形式，数据读人的工作和模型训练的工作在各自的线程中进行，相互独立并不依赖。当模型需要数据时，只需要将数据复制到指定的内存中即可。从lmdb数据库中，Cusror逐一获取数据，然后构成batch，经过transform变换后，是实际训练用的data.最上面的虚线框是DataReader类，负责从DB中
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方

caffe学习笔记4-- 手写数字mnist训练过程

你可能感兴趣的:(caffe学习)