*******************************************************************
chrono --------C++ 时间统计demo
*******************************************************************
#include <chrono>
using namespace std; // chrono is defined under std namespace
chrono::time_point<chrono::system_clock> start_t, end_t;
chrono::duration<double> time_diff;
start_t = chrono::system_clock::now();
end_t = chrono::system_clock::now();
time_diff = end_t - fprop_t;
printf(" Time load %f s fprop %f s write %f s",
time_diff.count() );
*******************************************************************
TCLAP -------C++ lib 参数解析demo
*******************************************************************
#include <tclap/CmdLine.h>
try {
TCLAP::CmdLine cmd("ConvNet CPU-based Feature Extractor", ' ', "1.0");
TCLAP::MultiArg<string> layer_arg(
"l", "layer", "layer name", true, "string");
TCLAP::ValueArg<std::string> model_file_arg(
"m", "model", "Model file", true, "", "string");
TCLAP::ValueArg<std::string> param_arg(
"p", "parameters", "Parameter file", true, "", "string");
TCLAP::ValueArg<std::string> mean_file_arg(
"s", "mean", "Pixel mean file", true, "", "string");
TCLAP::ValueArg<std::string> output_arg(
"o", "output", "Output directory", true, "", "string");
cmd.add(layer_arg);
cmd.add(model_file_arg);
cmd.add(param_arg);
cmd.add(mean_file_arg);
cmd.add(output_arg);
cmd.parse(argc, argv);
const vector<string>& layer_names = layer_arg.getValue();
const string& model = model_file_arg.getValue();
const string& param = param_arg.getValue();
const string& mean_file = mean_file_arg.getValue();
const string& output_dir = output_arg.getValue();
//TODO:
} catch (TCLAP::ArgException &e) {
cerr << "error: " << e.error() << " for arg " << e.argId() << endl;
}
*******************************************************************************
CImg -------C++ lib 《参见CImg文档》
*******************************************************************************
CImg是一个跨平台的C++的图像处理库,提供了加载、处理、显示、保存等一系列功能,其中的图像处理功能尤其强大。
首先,建议先到这里欣赏一下使用CImg代码做的Demo,就是它使我这个没有图像处理经验的童鞋也心动得以致于研究了一星期^_^
主页地址:http://cimg.sourceforge.net/
下载地址:http://cimg.sourceforge.net/download.shtml
下载时注意应该下载源码包,里面附带的大量的例程。而实际上CImg库只是一个头文件CImg.h,这个头文件里包含了CImg库所有的代码。
另外不要错过下载列表中的一个部分完成的《CImg中文参考手册》。
这段代码是从《CImg参考手册》里抄的,可以大致了解一下CImg的框架。
以VC为例:新建控制台程序,输入下面的代码。项目属性的链接器附加依赖项加入kernel.lib user32.libgdi32.lib。最后,把CImg.h拷贝到项目路径下,即可成功编译运行
运行这段代码,显示结果:
在CImg体系中,图像有x,y,z,v四个轴,前三个当然是3维空间的三个方向(知道了吧?CImg可以处理3维图像),第四个v一般表示色彩通道数,比如RGB三色就是3。
上面的代码每行的注释已经写得很详细,从代码里可以看出CImg处于namespacecimg_library名空间之下;模板类CImg<>是主要的图像类,提供了大量的图像处理方法。
在CImg库里,还有一个重要的类是CImgDisplay,它提供了一个显示窗口,不仅可以显示CImg的内容,还可以接收键盘鼠标事件,我们可以暂时把它看成是一个CImg专用窗体类。
CImg类提供的方法非常多,为了便于查阅,我用Doxygen重新生成了一份CImg库的说明文档,并做成chm格式,可以本文后面找到下载地址。
CImg模板类提供了图像的载入、保存、处理功能,是整个库的核心组件。它的声明如下:
template<typename T> struct cimg_library::CImg;
模板参数T指明CImg中元素的类型。在自带的参考手册中称这些元素为像素(pixel),不过因为这里的像素和我们平时的像素概念稍微有点不同。因为前面说过CImg体系中有xyzv四个轴,CImg手册称它为4维图像,把4维图像里的单个元素称为像素。而事实上第四维的v通常就是我们的色彩通道,所以要在屏幕上显示出一个真正的像素往往要取同一xyz轴上所有v轴的点(所有色彩通道合成一个真正的彩色像素)。在本文中我决定把这个组成图像的最小单位称为元素,由所有色彩通道v组成一个像素。
CImg类中的6个成员变量:
CImg类里的成员变量都是public的,我们可以直接存取它们,不过为了防止破坏完整性,建议使用成员方法如dimx(),dimy(), dimz(), dimv() 和ptr()来操作。
CImg的构造函数,大部分构造函数都很直白,就不列出了,可以查看手册,下面列出的是一些特殊的构造函数。
这个构造函数的dimensions参数由一串数字或转义符组成,分别对应x,y,z,v的大小。比如:
参数为"20 20 1 3"时新CImg对象的x,y,z,v的大小分别是20 20 1 3。
转义符以%开头,后缀可以是:
x, dx, dimx, width 表示img.width y, dy, dimy, height 表示img.height z, dz, dimz, depth 表示img.depth v, dv, dimv, dim 表示img.dim
比如CImg(img, "%y %x 13");可以生成一个和img的宽高正好互换的CImg对象。
CImg库本身支持BMP,RAW,HDR,INR,PGM,PPM,PAN,DLM格式
安装了ImageMagick(Unix系)后可支持JPG,GIF,PNG,TIF等多种格式
CImg也能使用jpeg库,zlib/png库,tiff库等来支持多种图像格式,只需编译时加入这些库即可。可以到这里下载这些库文件。
CImg提供了丰富的成员方法,在这里全部列出是不可能的,这里只作一些简单介绍。更多方法请参考手册。
值得一提的是还有两种插值版本的at方法,分别是线性插值和三次插值。其中线性插值以linear_作为前缀,三次插值以cubic_作为前缀。参数和上面的类似,只是各轴位置的类型不是int而是float,这批方法会按插值法算出小数点位置上的数据。
到这里可以发现CImg类实际上提供了类似于vector容器的编程接口,这样我们的STL算法也能用于CImg的操作了,随后就可以看到库里有时也会把CImg类直接当作数据容器来使用。比如下面CImg中就有这个方法:
CImg类的画图方法
draw_point draw_line draw_polygon draw_spline draw_arrow draw_image draw_rectangle draw_triangle draw_ellipse draw_circle draw_text draw_quiver draw_graph draw_axis draw_grid draw_fill draw_plasma draw_mandelbrot draw_gaussian draw_object3d
CImg的画图方法真的是非常多,每种方法都有2D和3D的重载,具体可以参考手册。
CImg类的图像处理方法分两种版本:一种是直接在自己的数据上计算和保存;另一种是返回一个计算后的CImg对象,自己的数据不会改变,这个版本以get_作为前缀并且总是const方法。
相应的,有get_fill方法,返回填充后的新CImg对象。后面的方法同相也有get_方法,不再累述。
当然,也有fillY,fillZ,fillV。
参数border_conditions指定怎样处理边界外的值,0-边界以外以0值填充,1-重复边界点的值,2-重复图像
参数interpolation指定采用何种插值方法,0-不插值,1-线性插值,2-三次插值
改变图像到指定大小,当pdx,pdy,pdz或pdv<0时,使用百分比。interpolation_type指定插值方法,分别是:
-1 = 不插值 : 图像直接按大小剪切 0 = 不插值 : 多余空间依据border_condition决定。 1 = 临近点插值。 2 = 移动平均数插值。 3 = 线性插值。 4 = 删格插值。 5 = 双三次插值。
另外,还有几个优化的resize版本:
参数warp在这里只是一个容器(不要把它看成图像)的作用,其x,y,z点上的数据决定了当前图像x,y,z点上元素的新位置,这个新位置由warp的x,y,z点上的v轴数据给出。如果warp的v轴长度是1时,当前图像元素只会在x轴上移动。如果warp的v轴长度是2时,当前图像元素在x,y轴上移动...relative=ture时,表示wrap中的数据是相对位置。
crop方法还有其它的版本,分别是省略v轴,z轴和y轴的版本。
最后,下面的这些方法提供类似Photoshop的滤镜功能,强啊~~:
noise 噪声 deriche Canny-Deriche算法 blur 模糊 blur_anisotropic 各向异性模糊 blur_bilateral 对称模糊 blur_patch 面片模糊 blur_median 中值模糊 sharpen 尖锐 haar 小波分析 ...还有好多