Python图像处理札记——dlib环境搭建与Demo验证

人生苦短,我用python —— 29行代码实现人脸识别

0x00环境搭建

  1. VS 2017:提供C++编译环境(C++IDE可自行选择,非不必选安装)
    • 需要将cl.exe配置到环境变量中,
    • cmd中输入cl,若提示不可运行,证明没有将VS配置到环境变量中
    • eg:本地cl.exe路径添加到Path路径中
      • D:\Program Files (x86)\Microsoft Visual Studio\2017\Community\VC\Tools\MSVC\14.15.26726\bin\Hostx64\x64
        cl_02.PNG
    • 官方文档VS Command Prompt 工具打开方法
  2. cmake 官方下载地址
    • 功能介绍:Cmake是用来makefile的一个工具:读入所有源文件之后,自动生成makefile。
    • 图形界面下一步到最后,安装过程顺利暂时无坑可踩
    • 本地安装路径: D:\CMake
  3. boost:官网下载
    • 功能介绍:一个开源的C++库,丰富强大解压,运行批处理,生成bjam.exe,可执行文件

    • 下载,解压,编译,配置,运行

      • 解压后路径地址: D:\Program Files (x86)\boost_1_69_0
      • 为了支持跨平台性,一部分的功能库,需要根据用户操作系统编译完成才可以使用
    • 编译步骤

      • 首先运行批处理脚本,生成编译引擎bjam.exe。

        • 打开VS的Native Tools Command,进入boost目录运行批处理文件bootstrap回车
          cmd下也可以,在命令行中直接输入.bat文件的名称,回车即可
        • 文件夹内会生成b2.exe, bjam.exe, project-config.jam, 和bootstrap.log四个文件
        • 细节:
          • bjam.exe与b2.exe作用相同,bjam是旧版,b2是新版编译
          • bjam.exe必须与boost-build.jam在同级目录,其中jam文件为编译引擎的配置读取
          • PS : 通过命令行运行bootstrap.bat和直接双击效果相同,但是在命令行中运行你会看到如下提示比一闪而过要好得多:


            run_bat_result.PNG
      • 开始编译,运行bjam.exe(PS:还是推荐用命令方式启动运行,有完全编译和指定编译两种选择)

        • 完全编译在命令行运行bjam.exe或b2.exe可执行文件,缺省命令参数,根据已经安装的C++ IDE环境自行设置
          run_b2.PNG
          • 优点:适用今后开发场景,所有源码编译,方便查看源代码和排查问题

          • 缺点:需要较大的硬盘空间,编译时间长————看其他大神的安装教程里提到的

            • 自己用公司电脑测试,编译完占用5.59G,用时大约30分钟左右,感觉还好了,可以接受
          • 编译顺利完成,截图如下:


            run_b2_02.PNG

            指定设置参数编译:本次未涉及,待后续试验再补齐

      • 配置IDE路径和环境变量Path路径

        • 设置环境变量
          • BOOST_ROOT = D:\Program Files (x86)\boost_1_69_0
          • BOOST_LIBRARYDIR = D:\Program Files (x86)\boost_1_69_0\stage\lib
        • IDE设置 以VS2017为例
          • 新建一个C++项目用以测试boost环境


            test_03.PNG
            • 源文件--新建test01.cpp,代码如下。输入完成后,会看到有报错提示,证明此时VS未加载到boost类库
            •   #include 
                #include 
                int main()
                {
                    using boost::lexical_cast;
                    int a = lexical_cast("123");
                    double b = lexical_cast("123.12");
                    std::cout << a << std::endl;
                    std::cout << b << std::endl;
                    return 0;
                }
              
          • 设置VS中boost加载路径:菜单栏--项目--项目名属性(Boostest属性)-- 配置属性


            test_02.PNG
            • VC++目录中设置
              • 包含目录 中 添加 D:\Program Files (x86)\boost_1_69_0
              • 库目录 中 添加 D:\Program Files (x86)\boost_1_69_0\stage\lib
            • 链接器
              • 附件库目录 添加 D:\Program Files (x86)\boost_1_69_0\stage\lib
            • 疑问 为什么我直接仿照配置文件中语法$(BOOST_ROOT); $(BOOST_LIBRARYDIR); 不识别呢???
          • 编译

            • 配置完boost路径后,代码中红线消失,F5 开始编译代码,输出目录生成exe文件
            • 疑问 控制台中大量“无法查找或打开PDB文件”的解决方法”,原因缺少符号解析
              • 解决 菜单栏--调试--选项--调试--
                • 常规设置 右边勾选启用源服务器支持
                • 符号设置 右边勾选微软符号服务器


                  运行完成,不会再提示无法查找或打开PDB文件了

                  )

            • 在命令行打开如图


              测试正常
      • 运行实例验证结果

        • 官方示例
    • 文档资料

      • 官方文档列表
        • 当前版本文档
      • 中文文档
        • 这个文档是2010年的,近乎远古时代了,有更加新文档的请通知下,不胜感激
        • 再次感谢文档翻译人员,为开源做贡献
      • 参考资料
  4. dlib
    • 类库介绍
    • 下载安装
      • 直接使用pip安装,电脑安装了python2和python3两个版本,在python3下安装如下:
        • python3 -m pip install dlib
    • 使用文档
    • 验证测试
    • 参考资料
      • OpenCV与 python dlib 检测眨眼
      • 我爱计算机视觉
  5. OpenCV
    • 下载安装 pip install opencv_python

0x01人脸识别示例代码
import sys
import dlib
import cv2

# 人脸分类器
detector = dlib.get_frontal_face_detector()

for f in sys.argv[1:]:
    img = cv2.imread(f, cv2.IMREAD_COLOR)
    b, g, r = cv2.split(img)
    img2 = cv2.merge([r, g, b])
    dets = detector(img, 1)
    print("Number of faces detected: {}".format(len(dets)))  # 打印识别到的人脸个数

    for index, face in enumerate(dets):
        print('face {}; left {}; top {}; right {}; bottom {}'.format(index, face.left(), face.top(), face.right(),
                                                                     face.bottom()))

        left = face.left()
        top = face.top()
        right = face.right()
        bottom = face.bottom()
        cv2.rectangle(img, (left, top), (right, bottom), (0, 255, 0), 3)
        cv2.namedWindow(f, cv2.WINDOW_AUTOSIZE)
        cv2.imshow(f, img)
# 等待按键,随后退出,销毁窗口
k = cv2.waitKey(0)
cv2.destroyAllWindows() 
验证效果

你可能感兴趣的:(Python图像处理札记——dlib环境搭建与Demo验证)