使用python进行数据分析

重要的python库

numpy

提供了以下功能:
1.多维数组对象ndarray
2.支持数组及其元素的数学运算函数
3.读取数据集的工具

pandas

用来快速处理结构化数据

matplotlib

用于绘制图表

scipy

解决科学计算问题的包集合

ipython

计算和开发环境

ipython基础

1.tab键自动完成。需要安装readline或者pyreadline库。
2.内省。变量前面或后面加上?就可以查看对象的通用信息
3.%run命令运行python脚本,并合并命名空间。
4.执行剪贴板中的代码,%paste执行剪贴板中的代码。
5.快捷键

  • ctrl+p 向后搜索历史记录中当前输入开头的命令
  • ctrl+n 向前搜索历史记录中当前输入开头的命令
  • ctrl+r 同linux
  • ctrl+a 光标移到行首
  • ctrl+e 光标移到行尾
  • ctrl+k 同linux
  • ctrl+u 同linux
  • ctrl+l 清屏

6.魔术命令。以%作为前缀的命令,比如:%time和%timeit
7.为终端提供内嵌图片等功能。ipython –pylab

numpy基础

ndarray

同构数据多维容器

数学和统计方法

  • sum
  • mean
  • std,var
  • min,max
  • argmin,argmax

你可能感兴趣的:(数据挖掘)