最近这几天什么游戏最火?当然是“上街抓皮卡丘”的Pokémon GO游戏。
这款游戏的亮点,就是把游戏玩家所在的真实地理位置当做游戏中的坐标,而把现实中的世界当做游戏中的地图。因此,可爱的小精灵就会突然出现在你周围的现实世界。
玩家进入游戏,打开地图和定位之后,就能四处寻找身边隐藏的小精灵。
等等,皮卡丘游戏和机器学习有什么关系?
皮卡丘游戏属于虚拟现实的一种。而虚拟现实、无人机、3D打印和机器学习是号称来自未来的四大黑科技。
无人机技术相对较为成熟,经过市场整合,现在已进入低调的扩张期。3D打印面临着种种技术瓶颈,尚处于技术完善阶段。虚拟现实和机器学习则是目前被媒体热捧的对象。
1.什么是机器学习
无论你听没听说、或者愿不愿意,我们的生活已经开始被机器学习的技术所影响了。先看几个例子。
1.1 AlphaGo
它的中文名叫做阿尔法围棋,顾名思义是一款围棋人工智能程序,几个月前因在韩国成功大败世界围棋冠军、职业九段选手李世石而名声大噪。
它的工作原理是“深度学习”,即多层的人工神经网络和训练。每层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。
简单的说,就是AlphaGo先从十几万份人类6至9段职业棋手的对弈棋谱中,学习和模仿人类常见的落子方式;然后在比赛中对于每一步,预计对手的几种应对方式,估计落子后的形势和赢面,选择其中最有利的一种走法。
现在,碾压过人类的AlphaGo也没有闲着,正在紧密落鼓的进行三维迷宫游戏Labyrinth学习训练,试图实现下次对人类大脑的碾压。
1.2自动翻译
如果你觉得AlphaGo只是下围棋的,离自己的生活比较远,那么下面这个机器学习的例子,你一定用得上。
当出国旅游时,最头疼的问题就是语言问题了。
去英语国家还好,尚可以用蹩脚的英语向路人问问路、聊聊天。
如果是去非英语国家呢?恐怕连路牌都看不懂,更别说去餐馆点菜了。
四年前,3M君到法国巴黎旅游,兴致冲冲的冲到某著名牛排店想去吃法式大餐,然而菜单拿上来之后是这样的:
不懂法语的我内心是奔溃的,话说你们就不能配些图片在菜单上面吗?
不配图片也就算了,自傲的法国人总是认为法语是最美的语言,根本不屑于学英语。
沟通无效,3M君只好根据价格反推哪些条目可能是牛排,然后随机选中几条,一个字母一个字母的敲进手机去查。
幸好这些单词是拉丁语系,由26个字母组成。如果是日语菜单,谁能告诉我可以用什么输入法、还有怎么把日语敲到手机里?
只需要下载Google Translate的APP,然后把手机的摄像头对准某行外文,能在屏幕上实时显示翻译后的语言,像是下图这样。
亮点就是无需手动敲入单词,只需要用手机自带的照相机对准菜单即可,然后手机就能自动识别文字,并翻译成中文。
1.3指纹识别
当然,自动翻译的技术现在还没有完全成熟,大多数时候只能给一个大概的意思,并不能完全精确翻译。
第三个机器学习的例子则是目前已经正在成熟使用的,那就是指纹识别。
人类的手指指腹上都有凹凸的皮肤所形成的纹路,这些纹路有许多细节特征,例如起点、终点、结合点和分叉点。
每个人的指纹并不相同,指纹识别就是通过比较这些细节特征的区别来进行鉴别。
先用海量的指纹对机器进行训练,告诉它什么样的指纹是谁的。然后机器在成千上万次的学习过程中学会了如何提取了指纹的特征值及判断。
现已成功运用于门禁系统、考勤系统、笔记本电脑、银行交易等。
1.4机器学习与人工智能
看了上面这些例子,是否对机器学习有了一些基本的概念?
维基百科对机器学习的定义是:从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。
不少人可能会把机器学习和人工智能当做一个东西,但其实机器学习只是人工智能里面的一个子学科。
人工智能核心在逻辑推理,并不一定需要机器学习。比如,GPS导航想寻找两地之间最短的行车路线,如果已经知道路况、流量等参数,只需要搜索路径即可,无需学习。
但世界上许多事情不是简单的逻辑能够说清楚的,或者说理论推导对解决实际问题不适用,还不如直接的从数据中得到规律更有效。
机器学习的原理就在于:让计算机模拟人类的学习功能,从一个模型开始,通过实验和犯错来训练它,使其从大量的数据中发现规律,并在实践中不断地完善和增强自我,从而能对测试进行准确预测。
2.机器学习能干些什么
除了上面三个例子,机器学习还能干什么?下面详细列举机器学习的用途,都是一些耳熟能详的名词。
2.1数据挖掘
它是指从数据中提取出隐含的过去未知的有价值的潜在信息。
定义很抽象是不是?不如再来看例子。最经典的案例要数“啤酒与尿布”的故事。
上世纪90年代,美国沃尔玛的高管在分析销售数据时,发现了一个奇怪的现象:在某些时候,“啤酒”与“尿布”这两件看上去八杆子打不着的东东,经常会同时出现在购物篮中。这种现象引起了管理人员的注意,经过后续的调查和分析发现,这种现象主要出现在年轻的父亲身上。
在美国有小宝宝的家庭中,一般是母亲在家中照看婴儿,而父亲则前去超市,购买生活用品,当然包括尿布。年轻的父亲在购买尿布的同时,往往会顺便为自己买一些啤酒,这样就会出现啤酒与尿布这两件看上去不相干的商品,经常会出现在同一个购物篮的现象。
如果这个年轻的父亲在卖场只能买到两件商品之一,则他很有可能会直接放弃购物而到另一家商店,直到可以一次同时买到啤酒与尿布为止。沃尔玛发现了这一独特的现象,开始尝试将啤酒与尿布摆放在相同的地方,让年轻的父亲可以同时找到这两件商品,并很快地完成购物。
数据挖掘,就是要挖掘出数据之间隐藏着的不知道的关系和信息,以此了解数据中潜在的规律,然后用历史预测未来。
2.2自然语言处理
简单的说,自然语言处理就是把自然语言转化为计算机程序更易于处理的形式,或者把计算机数据转化为自然语言。热门的运用包括:
机器翻译 将某种语言自动翻译至另一种语言。比如将中文自动翻译成日语。
和机器人对话,例如Siri.
自动摘要
自然语言生成此外,还有语音合成、文本朗读、文字校对等。
2.3生物特征识别
通过使用数理统计方法对生物体(一般特指人)本身的生物特征进行分析,来区分生物体个体的计算机技术。包括:
人脸识别 指纹识别 掌纹识别
2.4语音和手写识别
对着电脑说话,电脑自动讲语音转化为文字。某些输入法目前已经可以做到。
将图像中的文本自动转换成是计算机可以使用的字符代码。
2.5医学诊断
目前的看病诊断模式,一般是由医生等专业人员根据病症、病史(包括家庭病史)、病历或医疗测试结果等资料作出判断。
未来,诊断过程可能会被机器代替。
(6)检测信用卡欺诈
首先用持卡人的大量正常交易数据来对机器进行训练。比如一个人通常每周去两次超市,每天中午去食堂吃饭等等。机器和算法学习到这是一个正常的交易序列。
然后,可以通过运行算法检测每次交易是否为异常交易的概率。如果判断为正常交易,则把这次交易也列为学习案例,从而达到实时状态更新;如果判断为异常交易,立即引发信用卡冻结。
此外,机器学习还被广泛运用于:搜索引擎、证券市场分析、DNA序列测序、
战略游戏和机器人等领域、计算机视觉等领域。
3.目前的瓶颈
由于媒体的热捧,加上过热的创业风,使得机器学习好像是马上要取代人类一样。
各行各业都表示要转行做机器学习,包括不少IT培训班也把机器学习作为必备培训项目。
事实上,新技术的发展有条Gartner曲线,先被炒得大热,再跌下来,又慢慢爬坡到稳定的状态。
目前的机器学习,还存在不少技术瓶颈:
(1)尽管在某些点有重大突破,但在更多的领域只能处于实验室研究阶段。比如,面部识别在实验室测试时,识别率可以达到98%以上。然而如果你把一台摄像机放到大街上,识别率能达到40%已经是非常不错。
(2) 需要海量的学习数据。两三岁的小孩,只要大人给他指过几次小狗,下次十有八九他都能认出来。然而不论是多强的机器学习模型,也不可能只看几张小狗的图片,就能准确地认识小狗。
(3) 想学习机器学习,需要技术人员学习大量的基础知识和算法。
4.跳坑之前需要做些什么?
看到这里,如果你还对机器感兴趣,而且看好它,可以试试从下面入手:
(1) 基本数学和计算机知识
数学:微积分、线性代数、概率论、数理统计
计算机:Matlab或者Python
(2) Coursera上Machine Learning课程
Andrew Ng是coursera的创始人之一,这是一门入门级课程,涵盖了机器学习的一些基本概念和方法。深入浅出,通俗易懂,逻辑清晰,学完之后可以对机器学习有一个比较全面清晰的认识。
(3) 统计学习方法和机器学习实战
《统计学习方法》比较详细地介绍了算法的原理,从理论层面来研究算法。算法的覆盖面很广,偏重于理论。
《机器学习实战》介绍了机器学习领域十大算法的原理及应用,但没有深入其背后的数学分析。提供了案例研究问题并用Python代码实例来解决,偏重于实践。
学到这里,就算正式进入机器学习的大坑了。接下来,还愿不愿意做这个,以及准备具体做什么,就要根据自己的需求制定相关的学习路线了。
(END)