Python for data analysis

Python for data analysis_第1张图片
python for data analysis.jpg

看的是第二版英文版, pandas 作者写的,主要介绍用 pandas 进行数据处理。看了前 8 章后面的看不下去了,还是有一点收获的,pandas 也不是说看完这本书就能掌握的,要在使用中慢慢熟练。

工欲善其事必先利其器, IPython + jupyter notebook + pandas 确实很强大,能够很方便的进行数据处理与分析。所以熟练使用 NumPy Pandas Matplotlib 是必须的。

数据分析中数据的采集、清洗、转换要占去至少一大半的时间,真正分析、建模、跑机器学习算法只是其中的一个环节,所以数据处理的过程是非常重要的。对于初学者来说不要太关注机器学习等算法的细节,很多问题并不是一个算法就能解决的(除非是颠覆性的算法),实践证明好的数据 + 简单的算法要比一般的数据 + 复杂的算法效果好的多,我们应该花更多的精力在数据上,而不是去死磕一个算法的参数。

对于程序员来说把技术应用到产品中产生价值才是有意义的,不要把机器学习算法细节看的这么重(那是研究人员的活),大体了解原理,会用第三方库训练模型,运用到产品中产生价值才是有意义的。

你可能感兴趣的:(Python for data analysis)