#机器学习入门—Windows环境搭建
从农耕时代发展到现在的互联网时代,人类不仅在外形上经受住了自然选择,在文明上更是快速积累更迭,社会制度便是人类文明最直接的产物。而在人类漫长的进化期间,语言的产生和传播分别标志着人类脱离灵长类动物走向智人,进而成为统治这颗星球的绝对食物链顶级人科类动物。
机器学习学科的研究历史较其他自然学科,表现为起步晚,起点较高,且高度依赖工业的集计算机科学和人文哲学一体的交差型科学。它研究的主体就是机器机器语言,可以说机器是所有研究的所有前提就是机器。1949年,现代电子计算机出现以后,计算机在许多领域表现出人类无法达到的高度,计算机不断渗透到人类社会活动中各种场景。前沿的科学家们已经不满足于计算机只是作为简单的生产工具或者重复的科学计算,人们试图以人类获取知识的方式“传授”给计算机,使其具有类似人类这样的学习能力,同时还能够对外部环境参数做出判断的计算机系统。
人类依靠这声带振动和喉部气流吞吐,在空气介质中声波中较快的传播,扩散到被表达方,以此实现了信息传播。那么机器能否向人类一样能够“理解”语言,并作出回应,便成为机器智能研究的开端,从此便成立了—自然语言处理。
最早的机器智能设想是计算机科学之父—阿兰.图灵。1950年,图灵在《思想》杂志上发表了一篇“计算的机器和智能”论文,在论文中,他并没有提出任何关于机器智能的方法和意见,而是提出了一种验证机器是否有智能的方法。这种方法被后人称为:图灵测试。后来图灵奖也成为了人工智能行业最高贡献奖的象征。
对于人工智能的研究的起步的几十年里,大量科学家们走了许多弯路,人们似乎习惯性的将自然规则进行类比,依靠自身的直觉从而进行挖掘和发现,他们以为怀特兄弟是根据鸟儿仿生出飞机,而忽略了背后复杂的空气动力学,他们尝试以人类对句子”主谓宾“的规则复制给计算机,试图让计算机按照特定规则来理解,更有甚者,有人将人工智能类比为大量if-else的级联系统组成。而事实上,它们全都是依靠数学,更准确的说是依靠统计学。此外,如果有人说,研究统计学不都是做会计的吗,我觉得后面的话你也没必要再看下去了。
关于自然语言处理学科,大家如果感兴趣可以自己搜集下相关资料,目前国内主流大厂关于语义和语言识别已经相当成熟,但是并不意味着对语音识别的研究发展到了天花板,只能说,随着知识的积累,学科或者行业的门槛更高了而已,它依然是目前人类科学中的热门研究对象。
这个公众号已经一年多没有更新了,最近确实是忙得不成人样了,不过忙从来都是不作为得接口。正好今天把自己笔记本折腾了一遍,把机器学习—图像识别的C++开发环境这Windows上折腾了一遍,由于懒得装Ubuntu,所以关于Linux环境下的开发环境后面在更新吧。
最近在GitHub闲逛的时候发现了一个千星的车牌识别项目,看了下介绍,居然还是准企业级别代码,于是带着好奇,看下他和本实验室之前成果差距有多少,原项目传送门:LPR
项目部分描述如下:
Python 依赖
Keras (>2.0.0)
Theano(>0.9) or Tensorflow(>1.1.x)
Numpy (>1.10)
Scipy (0.19.1)
OpenCV(>3.0)
Scikit-image (0.13.0)
PIL
Opencv 3.3 以上版本
速度快 720p,单核 Intel 2.2G CPU (MaBook Pro 2015)平均识别时间低于100ms
基于端到端的车牌识别无需进行字符分割
识别率高,卡口场景准确率在95%-97%左右
轻量,总代码量不超1k行
上面描述,最吸引人地方无非是较高的识别率和跳过了车牌识别中最困难环节—字符分割,接下来我们开始验证下描述的可信性。
接下来讲一下今天进行的工作—开始安装环境。主要有caffe,opencv,visual studio,根据项目建议OPENCV版本需要在3.3及以上,主要为了支持DNN框架。为了兼容较新版本的OPENCV,本次安装建议使用VS2013以上版本的IDE。鉴于官网给出的资源下载太慢且易丢失,不多说直接上网盘。
VS及OPENCV链接:
https://pan.baidu.com/s/17AgZvbtt-HncL9vsDA7sKA
提取码:rlbb
caffe链接:
https://github.com/happynear/caffe-windows/tree/ms/windows
https://github.com/BVLC/caffe/tree/windows
百度云链接:
http://pan.baidu.com/s/1hs8ngpA 密码:ith0
http://pan.baidu.com/s/1bp1BFH1 密码:phf3
总有一个链接有效吧。
##一,VS平台的安装##
开发平台安装十分简单,选择好文件夹后,一键式下一步,但是下载和安装的时间都十分漫长,本文就不写这个耽误时间了,详细教程见以下链接 :VS2015安装教程
##二,caffe安装教程
Caffe,全称Convolutional Architecture for Fast Feature Embedding。是一种常用的深度学习框架,主要应用在视频、图像处理方面的应用上。作者是贾扬清在加州大学伯克利期间编写,目前在某云大厂处养老。
关于caffe的简介和学习,我贴两个链接。
维基:https://en.wikipedia.org/wiki/Caffe_(software)
博客:http://www.cnblogs.com/denny402/tag/caffe/
关于caffe安装,我自己的操作过程就不再截图一一描述了,直接放个比较靠谱的链接吧:
caffe安装:
https://blog.csdn.net/u013295579/article/details/78397317
三,Opencv3.3安装
OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows、Android和Mac OS操作系统上。由于其开源免费的特性,在相关方向研究上应用极为广泛,据说很多毕业生就靠它活。
关于OPENCV的安装,都已经被别人写烂了,我要是再描述一遍,走的也是那几个流程。主要注意细节有:
1,环境变量path路径中添加OPENCV的bin文件安装路径。
2,VS属性管理器中Debug64下设置包含目录,库文件目录,链接器依赖项设置。
3,配置完成后,最好cv::imshow("windows",img)看下库文件和依赖项设置成功了没。
现在已经是凌晨十二点多了,我该去洗洗睡觉去了,明天还得去加班呢,后面微信公众号更新源码的详细讲解吧。