关于数据挖掘的学习计划以及相关的准备

这几天一直在思考关于着手开始数据挖掘学习的计划。考虑时间成本的问题,期望可以在半年到一年的时间内,熟悉理论的基础的部分和掌握工程实现的相关工具。


1. 关于数学工具

     之前已经基本把《离散数学》《集合论》《数理逻辑》相关的基础知识过了一遍。对于计算机底层的数学逻辑基础有了一定的了解,但是由于时间限制,没有过分深入。希望未来有机会深入编译器的底层结构,如果可以写一个属于自己的编译器,那当然是最好不过了。

     现阶段,经过对数据挖掘相关背景知识的了解,准备以《概率论基础》《高等数学》《数学建模》为重心,讨论具体的模型算法的实际使用。


2. 关于工程工具

     之前没有接触过数据挖掘的具体工作,对相关的工具没有深入了解过。目前暂且以《R语言实战》《Mastering sql server 2014 data mining》《数据挖掘导论》《python学习手册》为参考,进行推进。至于具体的工程,希望在熟悉相关工具之后,能够完成一个小型的爬虫项目或者完成一个或者若干数据竞赛项目。


3. 关于开发语言和数据库

     因为数据挖掘目前涉及到的大部分都是海量的大数据,相关的工具和目前所用的有较大差异,因此决定将JAVA提升为目前最高优先级。同时也不排除接触其他相关的开源技术。数据库部分,因目前的项目完全没有涉及到那么多复杂的结构,因此重点了解没有机会应用的nosql数据库(如mongoDB,redis等),同时了解MySQL相关的开源数据库及其具体的应用。


4. 关于相关技术的英文资料和尝试翻译

    《Mastering sql server 2014 data mining》《Recommender Systems Hand Book》


5. 关于相关课程的拓展和丰富

     百度文库课程:机器学习Mechine Learning ------余凯&张潼

     coursa 课程:机器学习-------Andrew Ng

你可能感兴趣的:(数据挖掘,数学,人工智能)