2017.02.16:利用Python进行数据分析01

1.IPython:一种交互式的pythonshell。IPython提供了一个特殊的dreload函数,解决模块的“深度”(递归)重加载。

2.Numpy:NumericalPython

2.1.ndarray:具有矢量算数运算和复杂广播能力的快速且节省空间的多维数组。

2.2.用于对整组数据进行快速运算的标准数学函数(无需编写循环)。

2.3.用于读写的磁盘数据的工具以及用于操作内存映射文件的工具。

2.4.线性代数、随机数生成及傅里叶变换功能。

3.对于数据分析:

3.1.数据清理:集合构造和过滤,转换等快速的矢量化数组运算。

3.2.常用的数组算法运算,唯一化、集合运算

3.3.高效的描述统计和数据聚合/摘要运算。

3.4.用于异构数据集的合并/连接运算的数据对齐和关系型数据运算。

3.5.将田间逻辑表述为数组表达式,代替if-elif-else。

3.6.数据的分组运算。

4.ndarray:通用的同构数据多维容器,每个数组都只有一个shape,dtype。

4.1.dtype是一个特殊对象,它含有ndarray,将一块内存解释为待定数据类型所需的信息。

5.花式索引和切片不一样,将数据复制到新数组中。

6.Numpy数组使得将多种数据处理任务表述为简洁地数组表达式。一般来说,矢量量化数组运算要比等价的纯python方式快上一两个数量级。

你可能感兴趣的:(学习笔记,数据分析)