数据挖掘、机器学习和模式识别关系与区别

转自:http://www.cnblogs.com/growup/archive/2011/04/26/2029393.html    感谢分享。      

数据挖掘(Data Mining)与数据库(DB)、机器学习(ML)和统计学(Statistical Learning)的联系:

       数据挖掘和机器学习的区别和联系,周志华有一篇很好的论述《机器学习与数据挖掘》可以帮助大家理解。数据挖掘受到很多学科领域的影响,其中数据库、机器学习、统计学无疑影响最大。


       对数据挖掘而言,数据库提供数据管理技术,机器学习和统计学提供数据分析技术。由于统计学往往醉心于理论的优美而忽视实际的效用,因此,统计学界提供的很多技术通常都要在机器学习界进一步研究,变成有效的机器学习算法之后才能再进入数据挖掘领域。从这个意义上说,统计学主要是通过机器学习来对数据挖掘发挥影响,而机器学习和数据库则是数据挖掘的两大支撑技术。

       从数据分析的角度来看,绝大多数数据挖掘技术都来自机器学习领域,但机器学习研究往往并不把海量数据作为处理对象,因此,数据挖掘要对算法进行改造,使得算法性能和空间占用达到实用的地步。同时,数据挖掘还有自身独特的内容,即关联分析。

       数据挖掘主要流行于统计界(最早出现于统计文献中)、数据分析、数据库和管理信息系统界;而数据库知识发现(KDD)则主要流行于人工智能和机器学习界

模式识别(PR)和机器学习的关系是什么呢?

       传统的模式识别的方法一般分为两种:统计方法和句法方法。句法分析一般是不可学习的,而统计分析则是发展了不少机器学习的方法。也就是说,机器学习同样是给模式识别提供了数据分析技术

至于,数据挖掘和模式识别,那么从其概念上来区分吧,数据挖掘重在发现知识,模式识别重在认识事物(模式识别的实质就是:分类)。

      模式识别说白了就是分类,而分类可以认为是数据挖掘的一部分,数据挖掘主要工作有分类、聚类、关联分析、离群点检测等;机器学习的范围更广,算法更多!但三者都要求有坚实的统计学基础,学的越扎实越好!

机器学习的目的是建模隐藏的数据结构,然后做识别、预测、分类等。

因此,机器学习是方法,模式识别是目的。



然后:CV、AI 呢???有必要浏览学习一下各个方面……


你可能感兴趣的:(数据挖掘、机器学习和模式识别关系与区别)