在Mac下,深度学习CNN库Overfeat的配置及使用

Overfeat的主页:http://cilvr.nyu.edu/doku.php?id=software:overfeat:start

1. 下载Overfeat的代码包:

Download OverFeat-v04.tgz 

2. 下载已经学习好的网络权重数据,大小两个网络的数据都有,共1G左右,解压后放在程序能够访问的目录。

3. 安装依赖,并编译。

# Install compiler
sudo port install g++ imagemagick cmake
cd src
# Install torch :
sh install.sh
# Build overfeat
make all
4. 调用图片分类接口:
进入编译生成的bin目录,对某一个图片返回前五的分类结果置信度,默认使用小网络,-l参数使用大网络:
./overfeat -n 5 ../../samples/bee.jpg
./overfeat -n 5 -l ../../samples/bee.jpg
5.调用提取图片特征接口:
./overfeat -f ../../samples/bee.jpg
如果要提取4096x1的特征向量,用小网络图片要crop&resize到231x231的大小尺度;用大网络的话,图片要crop&resize到221x221大小尺度。
将提取的特征存成文本文件:./overfeat -f indir/bee.jpg > outdir/fea.txt
6. 利用python接口批量提取图片库特征的脚本:
 
  
import os
from glob import glob
import time

input_dir = ' '
output_dir = ' '
overfeat = '../overfeat'
overfeat_data_dir = '../data/default/'

files = glob(input_dir + '*.jpg')
files.sort()

start = time.clock()
for f in files:
    print f
    basename = os.path.basename(f)
    cmd = '{} -l -f -d {} {} > {}{}.txt'.format(overfeat, overfeat_data_dir, f, output_dir, basename)
    print cmd
    os.system(cmd)

end = time.clock()
print (end-start)

该批量提取特征的程序耗时还是比较多,因为对每一个图片提取特征的系统命令cmd,都要分别load及初始化训练好的网络参数。
7. 只load并初始化一次网络参数的C++程序,还在调试中。。。

你可能感兴趣的:(机器学习)