python数据分析概述

python是一门胶水语言,python程序能够以多种方式轻易地与其他语言的组件“粘接”在一起。

1.python数据分析常用类库

①IPython

ipython是python科学计算标准工具集的组成部分,同时是一个增强的python shell,目的是提高编写、测试、调试python代码的速度。

②NumPy

NumPy是一个python科学计算的基础包,它主要提供:

(1)快速高效的多维数组对象ndarray

(2)对数组执行元素级计算以及直接对数组执行数学运算的函数

(3)线性代数运算等等

还可作为算法之间传递数据的容器

③SciPy

一组专门解决科学计算中各种标准问题域的模块的集合,可用于插值、积分、优化、处理图像和特殊函数等。

④pandas

是python的数据分析核心库,为时间序列分析提供了很好的支持。提供了一系列能够快速、便捷地处理结构化数据的数据结构和函数。

⑤Matplotlib

2D绘图库

⑥scikit-learn

是一个简单有效的数据挖掘和数据分析工具。基本模块有数据预处理、模型选择、分类、聚类、数据降维和回归6个。

⑦Spyder

强大的交互式Python语言开发环境,提供高级的代码编辑、交互测试和调试等特性。

你可能感兴趣的:(python数据分析概述)