《python数据挖掘》和《python数据挖掘入门与实践》两本书读后感

这些天花了很多时间来学习数据挖掘这门课程,有很多心得和感悟,所以写下这篇博客来表达自己读完这两本书的感受!
  首先推荐大家通过这两本书来入门数据挖掘这个领域,python数据挖掘这本书较容易,还花了很大的篇幅来讲python基础,而python数据挖掘入门与实践则直接从实例讲起,需要读者有一定的python基础。
  数据挖掘主要是通过python或者R语言来实现的,因为这两门语言有它们独特的优势,比如包含大量的函数式编程接口,高效的模块等等,这些都使它们非常适合用来进行数据挖掘和数据分析。所以都要求编程者要有这方面的知识体系。但是,说到底语言只是一个工具,真正要在一门领域取得建树,还是要靠编程者的思维能力和实践能力,比如算法水平和编码或者debug(项目)能力。不过,对python这个强大工具有很深入的了解,会对数据挖掘的学习有事半功倍的效果。
  推荐使用anaconda作为python的编译库,里面包括了大量的实用模块,比如numpy(科学计算,如矩阵,二维数组,与表格最为相似的数据结构),pandas(数据分析,如数据框(虚拟内存数据库),系列),Scipy(科学计算,向量化思想,包括符号计算和函数向量化),scikit-learn(用于机器学习,数据挖掘,数据分析,六大功能:分类,回归,聚类,降维,模型选择,预处理),Matplotlib,Bokeh(数据分析及可视化)等等。这些都有助于进行数据挖掘和数据分析。
  数据挖掘和数据分析等领域包含了大量的算法,比如K-Means,DBSCAN,Apriori,kNN,朴素贝叶斯,BP神经网络,CART,决策树等算法,这对编程者的算法能力和思维能力产生了极大的挑战。只有掌握了这些算法,才能更好地,更高效地,更快速地实现目标。如果有ACM经验的话,学起来应该会更加快速和适应。这些算法,我觉得结合实际例子来学习可能更加容易理解,比如用决策树来预测获胜球队,使用朴素贝叶斯进行社会媒体挖掘,用神经网络破解验证码,用深度学习方法为图像中的物体进行分类。结合实例的话,可以更好地去学习,理解和实践。
  最后给大家推荐后续的学习路线,可以去kaggle上参加数据挖掘比赛,或者参考学习别人的优秀项目。还可以去coursera上面学习数据挖掘的相关课程,进一步提高自己的能力和拓展自己的视野。

你可能感兴趣的:(python,python数据挖掘)