用python进行数据分析的五个最常用库

http://www.360doc.com/content/15/0412/10/17132703_462592209.shtml

1、pandas

Pandas包含高级数据结构,以及和让数据分析变得快速、简单的工具。它建立在NumPy之上,使以NumPy为中心的应用变得简单。

Pandas是进行数据清洗/整理(data munging)的最好工具。

http://pandas.pydata.org/pandas-docs/stable/10min.html

2、numpy

对于科学计算,它是Python创建的所有更高层工具的基础,NumPy不提供高级数据分析功能,但有了对NumPy数组和面向数组的计算的理解,能帮助你更有效地使用像Pandas之类的工具。

参考视频教程  https://vimeo.com/77263537

3、scipy

Scipy库依赖于NumPy,它提供便捷和快速的N维向量数组操作。SciPy库的建立就是和NumPy数组一起工作,并提供许多对用户友好的和有效的数值例程,如:数值积分和优化。SciPy提供模块用于优化、线性代数、积分以及其它数据科学中的通用任务。

参考教程 https://docs.scipy.org/doc/scipy/reference/tutorial/

4、matplotlib

Matlplotlib是Python的一个可视化模块。它让你方便地制作线条图、饼图、柱状图以及其它专业图形。使用Matplotlib,你可以定制所做图表的任一方面。在IPython中使用时,Matplotlib有一些互动功能,如:缩放和平移。它支持所有的操作系统下不同的GUI后端(back ends),并且可以将图形输出为常见地矢量图和图形格式,如:PDF、SVG、JPG、PNG、BMP和GIF等。


5、Scikit-learn

Scikit-learn是一个用于机器学习的Python模块。它建立在Scipy之上,提供了一套常用机器学习算法,让使用者通过一个统一的接口来使用。Scikit-learn有助于你迅速地在你的数据集上实现流行的算法。

内置各算法教程   http://scikit-learn.org/stable/user_guide.html

这些教程都非常适合初学者。不过,在学习这些教程前,先要熟悉Python语言的基本编程知识。

你可能感兴趣的:(用python进行数据分析的五个最常用库)