谷歌开源机器学习,这个狂拽炫酷吊炸天的技术究竟是什么玩意?


谷歌之所以伟大,就在于其一直改变着我们的这个时代,在“不作恶”的前提下,不断改变着我们的生活方式,

  • 全球第一大互联网品牌(Google)
  • 全球第一的搜索引擎(谷歌搜索)
  • 全球市场份额第一的移动操作系统(安卓)
  • 全球第一的视频平台(Youtube)
  • 全球第一的邮件系统 (Gmail)
  • 全球第二的浏览器(Chrome)
  • 全球最好的地图(谷歌地图)
  • 无人驾驶汽车
  • 谷歌眼镜
  • 机器人
  • 无数开源项目

谷歌宣布开源机器学习,这无疑给业界注入一针强心剂,肯定会促进人工智能的发展,在谷歌强大技术的支撑下,我们完全有理由相信,智能行业将会为我们带来更大的改变和无尽的创业机会。

好了,崇拜一番,我们来好好聊聊机器学习。

下面是百科的专业解释:

机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

好了,举个在通俗不过的例子

大家都买过苹果吧,我说的是苹果不是iphone,有一种差距叫你买了苹果六代,而我去买了六袋苹果,六袋苹果这么多,我总得挑挑吧,很多无良的商贩,都是好坏混在一起卖,我画个圈圈诅咒你,挑的过程中,然后我们想呀,妈妈说过,苹果挑的时候色泽很重要,因为水分多呀,会甜一些,按照这个标准,我们挑了六袋颜色品相好的,结果买回家拿给老婆,老婆一吃,这也不甜呀,还带苦味,一阵狂风暴雨,我的这个月的零花钱从10块减到了5块,老婆这样对我,你以为我怕他吗,我的人生格言就是:人不犯我,我不犯人,人要犯我,我就生气。就是这么有骨气,怎么地吧。

不过也总结了一下,不能下次买再出现这种情况呀,发现老妈说的也不是金科玉律,也不一定对的,于是自己查阅资料,得到一个结论:大个的,红色的苹果一定甜,于是下次,我又跑去买,结果上次卖苹果的那家店倒闭了,就跑到另外一家店去买,按照自己总结的结论,挑了一大堆买回家,拿给老婆一尝,悲剧再次上演,我的零花钱从5块变成2块,谢谢伟大的老婆大人,我下班还能有钱坐车回家,这是怎么回事了,原来,另外一家店,他的进货渠道不一样,苹果是别的产地的,我的那套方法根本不适合,再次总结经验,小个的,脆的一定甜。

还没完,表妹跑家里来了,总的好好招待一下吧,结果她说他喜欢吃青苹果,酸酸的更好,不一定要甜,结果,你又得跑去买,总结出青苹果哪种好吃。

后来,你堂弟又来了,00后呀,比较新奇呀,说了,我要吃又酸又甜的苹果,结果你又得总结出,又酸又甜的苹果怎么挑选

再后来,你领导来了 ,然后,然后,然后就没有然后了.....

如果以上的麻烦交给机器学习,那就是分分钟的事了,纠结的人生,从此不再纠结

有了它,妈妈再也不用担心我被老婆虐了

那用机器学习怎么挑苹果呢?

你从市场上随机买一批苹果(训练数据),把每个苹果的物理属性列一个表格出来,比如颜色、大小、形状、产地、店家,等等(特征),对应苹果的甜度、汁水多少、成熟度,等等(输出变量)。

然后把这些数据丢给机器学习,机器学习会通过自己的算法(机器学习有一系列的算法,我们后面会提到),计算出苹果的相关属性与品质之间的相关性模型。

等你下次再去买的时候,你只要输入店里苹果的属性,机器学习算法就会根据上次计算出来的模型来预测这些苹果品质如何,当然那些算法都是些吊炸天的大牛们写出来的,极其复杂。因为机器学习需要进行不断的训练,这个和人是一样的,比如运动员,他们都是经过长年累月的高强度训练,才能够不断提高自身身体素质和竞技技能的,才能达到人生巅峰的,机器也一样,我们也需要训练,这就需要我们有大量的测试数据,也就是你买苹果,每次输入的那些属性(红色-->比较甜,大个-->脆嫩),通过这些大量的测试数据,算法会逐渐进化,不断的强化学习,不断的自我修正属性与品质之间的模型,随着大量数据的累计,直到最后,机器学习的预测会越来越准确,越来越接近人的真实想法。

但是,不止于此,最妙的来了,用同一个算法,你可以做好几个模型,你爷爷想吃香蕉,想吃葡萄,没问题,这个依然适用,不要说老婆有令,就是七大姑八大婶各有所好,也再不用发愁了。

 

机器学习只能买苹果吗?

不说话,我只想看着机器学习静静的装B,看栗子

  • 垃圾邮件检测:根据邮箱中的邮件,识别哪些是垃圾邮件,哪些不是。这样的模型,可以程序帮助归类垃圾邮件和非垃圾邮件。这个例子,我们应该都不陌生。
  • 信用卡欺诈检测:根据用户一个月内的信用卡交易,识别哪些交易是该用户操作的,哪些不是。这样的决策模型,可以帮助程序退还那些欺诈交易。
  • 数字识别:根据信封上手写的邮编,识别出每一个手写字符所代表的数字。这样的模型,可以帮助程序阅读和理解手写邮编,并根据地利位置分类信件。
  • 语音识别:从一个用户的话语,确定用户提出的具体要求。这样的模型,可以帮助程序能够并尝试自动填充用户需求。带有Siri系统的iPhone就有这种功能。
  • 人脸识别:根据相册中的众多数码照片,识别出那些包含某一个人的照片。这样的决策模型,可以帮助程序根据人脸管理照片。某些相机或软件,如iPhoto,就有这种功能。
  • 产品推荐:根据一个用户的购物记录和冗长的收藏清单,识别出这其中哪些是该用户真正感兴趣,并且愿意购买的产品。这样的决策模型,可以帮助程序为客户提供建议并鼓励产品消费。登录QQ或淘宝,它们就会推荐可能有关联的用户给你。
  • 医学分析:根据病人的症状和一个匿名的病人资料数据库,预测该病人可能患了什么病。这样的决策模型,可以程序为专业医疗人士提供支持。
  • 股票交易:根据一支股票现有的和以往的价格波动,判断这支股票是该建仓、持仓还是减仓。这样的决策模型,可以帮助程序为金融分析提供支持。
  • 客户细分:根据用户在试用期的的行为模式和所有用户过去的行为,识别出哪些用户会转变成该产品的付款用户,哪些不会。这样的决策模型,可以帮助程序进行用户干预,以说服用户早些付款使用或更好的参与产品试用。
  • 形状鉴定:根据用户在触摸屏幕上的手绘和一个已知的形状资料库,判断用户想描绘的形状。这样的决策模型,可以帮助程序显示该形状的理想版本,以绘制清晰的图像。iPhone应用Instaviz就能做到这样。

以上只是机器学习能做到的冰山一角,更多狂拽炫酷的例子,我们会一一为你呈现的。

下面是机器学习与人类思考的类比

人类在成长、生活过程中积累了很多的历史与经验。人类和机器的最主要的区别之一就是人类会思考,总结经验,人类定期地对这些经验进行“归纳”总结,获得了生活的“规律”。当人类遇到未知的问题或者需要对未来进行“推测”的时候,人类使用这些“规律”,对未知问题与未来进行“推测”,从而指导自己的生活和工作。

从上图可以看出,新的数据就相当于苹果的属性 ,历史数据就相当于测试数据,模型就是计算苹果品质的各种算法,机器学习中的“训练”与“预测”过程相当于人类的“归纳”和“推测”过程。有了这样的对应,我们会豁然开朗,我们可以发现,机器学习的思想并不复杂,其实就是对人 类在生活中学习成长的一个模拟过程。由于机器学习不是基于编程形成的结果,因此它的处理过程不是因果的逻辑,而是通过归纳思想得出的相关性结论。当然机器学习的这个模型涉及到及其复杂的算法,甚至运用到了方方面面的知识,概率学,统计学,高等数学,优化理论,数据挖掘,计算机视觉,语音识别,自然语言处理等等领域,这里面的任意一项对我们普通人来说,都需要花大量时间去钻研,去学习,由此可见,谷歌开源机器学习对我们绝大部分人是多么重要,尤其对那些准备投身这个行业的人们,谷歌的确为他们铺了一条康庄大道。绝对的活雷锋。

我们再来看下面这张图片,这是神经网络在图像识别领域的一个著名应用,运用到的就是机器学习

右下方的这个正方形中显示的是为计算机输入的图像,方形上方的红色字“answer”后面显示的是计算机的输出。左边的三条竖直的图像列显示的是神经网络中三个隐藏层的输出,可以看出,随着层次的不断深入,越深的层次处理的细节越低,你可以看到第三层已经是一些看不清的细节了,也就是我们输入的图片到这一层之后,已经被提取成为一些及其细微的微特征,然后通过机器学习的神经网络算法,能够完全正确的计算出输入图像的数字,但是前提也是需要大量的训练图像对其进行训练,然后不断总结进化,直到最后完全预测成功。

举了这么多例子,相信你对机器学习已经有了一定的了解,那机器学习所牵扯的一些相关范围的学科与研究领域有哪些呢?

 

  • 模式识别: 模式识别一开始主要是作为机器学习的代名词,二者可以等同,机器学习的目的是建模隐藏的数据结构,然后做识别、预测、分类等,机器学习是方法,模式识别是目的,模式识别是70年代和80年代非常流行的一个术语。它强调的是如何让一个计算机程序去做一些看起来很“智能”的事情
  • 统计学习: 统计学习近似等于机器学习,只是侧重点不同,统计学习是一门学科,偏向数学理论,而机器学习者更关注的是能够解决问题,偏实践,而且可以相互协作,解决问题
  • 数据挖掘: 数据挖掘就是机器学习和数据库的综合,数据库提供数据管理技术,机器学习和统计学提供数据分析技术。三者相辅相成,由于统计学界往往醉心于理论的优美而忽视实际的效用,因此,统计学界提供的很多技术通常都要在机器学习界进一步研究,变成有效的机器学习算法之后才能再进入数据挖掘领域。从这个意义上说,统计学主要是通过机器学习来对数据挖掘发挥影响,而机器学习和数据库则是数据挖掘的两大支撑技术。
  • 计算机视觉: 图像处理技术用于将图像处理为适合进入机器学习模型中的输入,机器学习则负责 从图像中识别出相关的模式。计算机视觉相关的应用非常的多,例如百度识图、手写字符识别、车牌识别等等应用。这个领域是应用前景非常火热的,同时也是研究 的热门方向。随着机器学习的新领域深度学习的发展,大大促进了计算机图像识别的效果,因此未来计算机视觉界的发展前景不可估量。你在百度识图上传一张照片,然后识图一下,系统就会帮你找到该张图片或者和该张图片高度相似的图片,就相当于计算机有双眼睛,可以识别图片一样。

  • 语音识别: 这个相信大家都不陌生,太长用了,苹果手机的语音助手siri,不光苹果,各种手机都已经配备这种功能,几乎成为标配,可想而知,这门技术的应用前景,语音识别一般都要和自然语言处理(也就是下面要讲的),机器学习相结合使用。比如你对着siri讲:我要找苍老师,siri 回复的便是:我找到以下网页

siri通过你说的话,首先会通过自然语言处理,处理成为机器可以听得懂的话,然后通过机器学习,进行更深层次的工作,理解你的意思,最后通过网页的形式将你所要表达的意思以网页的形式展示给你,当然里面更复杂的东西,有兴趣的可以多去了解一下

  • 自然语言处理: 自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。所以上面讲到的语音识别是必须用到这门技术的。

上面是自然语言处理(NLP)的技术体系和相关公式,看到这个,只想说心中一千只马崩腾而过,看懂的人,麻烦留言告诉小编一声,小编要膜拜一番,并献上我的膝盖

以上只是机器学习设计的学科和领域,那么他的实际应用场景有哪些了?一图胜千言

 

还是那句话,这只是实际运用的冰山一角,还有更多应用,就不一一列举了。

我们知道机器学习,最重要的核心还是算法,下一篇我们将为你讲解机器学习的10大经典算法,以及使用场景:机器学习的10大经典算法

本文属于图灵人原创文章,转载必须说明出处,并请附上(图灵人)及本页链接。原文链接:http://www.tulingr.com/?p=1199&preview=true

你可能感兴趣的:(谷歌开源机器学习,这个狂拽炫酷吊炸天的技术究竟是什么玩意?)