数据挖掘该怎样的学习路线?

数据挖掘是一门综合类的学科,它综合了计算机、人工智能、统计学、数据库等领域的知识。建议你现从基本的数据挖掘算法开始学起,了解基础知识,数据预处理,基本的分类聚类算法还有关联规则的发现。以后要往哪个方向发展就看机会和兴趣了,比如中文信息处理,社区发现与规划,主题发现分类,自然语言理解等等。算法是最重要的!
个人建议如下:
第一阶段:掌握数据挖掘的基本概念和方法。先对数据挖掘有一个概念的认识,并掌握基本的算法,如分类算法、聚类算法、协同过滤算法等。 参考书:《数据挖掘概念和技术》(第三版)范明,孟小峰 译著。
第二阶段:掌握大数据时代下的数据挖掘和分布式处理算法。现在已经进入大数据时代,传统的数据挖掘算法已经不适用于
参考书:《大数据:互联网大规模数据挖掘和分布式处理》 王斌 译著。
第三阶段:使用Hadoop进行大数据挖掘。Hadoop里面有一个Mahout组件,几乎包括了所有的数据挖掘算法,包括分类、聚类、关联规则等。
参考书:Hadoop实战(第二版).陆嘉恒 著等。
另外,数据挖掘是数据库技术、人工智能技术、机器学习技术、统计学习理论、数据可视化等一系列技术的综合,所以,要想学好数据挖掘,这些技术也得懂的呀。 推荐入门时先看浙江大学王灿老师的数据挖掘课程,网上搜下。 期待与你一起学习数据挖掘,共同揭开数据之美。

相关视频:
浙大王灿老师的数据挖掘视频,比较基础,适合入门,教材是《数据挖掘-概念与技术(第二版)》;
中科院研究生院有两套视频,即数据挖掘引论和数据挖掘高级技术(39讲),后者可以作为数据挖掘的提高课程~
另外,模式识别、贝叶斯网络、高级人工智能、统计机器学习理论、数据库技术等视频都可以作为数据挖掘的拓展课程~

你可能感兴趣的:(data,mining)