pandas简介

pandas: Python数据分析库

pandas是一个专门用于数据分析的开源python库,是使用python语言研究和分析数据集的基础工具。pandas是以numpy为基础进行设计的,因而使得pandas可以和其他大多数模块兼容,还能借助numpy模块在计算方面性能高的优势。

安装

  • 使用pypi安装
pip install pandas 
  • 在linux系统上安装
debian类系统:
sudo apt-get install python3-pandas
SUSE类系统:
sudo zypper install python3-pandas
  • 使用Anaconda安装
conda list pandas    --检查是否安装pandas
conda install pandas  -- 安装pandas
conda update pandas  -- 更新pandas
  • 使用源代码安装
git clone git://github.com/pydata/pandas.git   -- 链接可能失效,可以在GitHub中搜索
cd pandas 
python3 setup.py install

如果想获取安装最新的安装包或者避开依赖问题,可以在Christoph Gohlke 的Window系统python扩展包仓库下载相应的whl文件,安装方法如下:

pip install xxxxxxx.whl
  • 验证pandas是否安装成功
>>>import pandas

pandas一共有两大核心数据结构,所有的数据分析相关的事物都是围绕这两种数据结构进行的.这两种数据结构分别是:
Series(序列)
DataFrame(数据框)

Series这类数据结构用于存储一个序列这样的一维数据,DataFrame用于存储多维数据

  • Series对象和DataFrame对象内部都有一个Index对象,这种结构使得两种数据结构具有很强的可操作性.

你可能感兴趣的:(pandas简介)