Pandas系列学习教程(五)

Pandas系列教程(五)


  对于想要入门数据科学的朋友们来说,Python是一个很好的选择,除了因为简单的语法外,Python 生态中提供了很多在数值计算方面非常优秀的库,其中Pandas不可不提,Pandas是很强大是数据集处理工具,往往和numpy, matplotlib 等库搭配使用,我也是刚刚开始学习Pandas, 顺便翻译了一下官方的Pandas教程, 这里使用的是jupyter notebook, 因为博客不支持html直接编辑,所以只能转化为markdown 格式,如果想直接查看html版本可点击每一节下的链接。本文仅供学习和交流使用,欢迎大家交流和指正!


摘要

  • 字典式定义数据集
  • pandas中的index索引以及变换
  • df.T transpose转置操作

HTML版本点击此处

# 导入包
import pandas as pd
import sys

print('Python version:',sys.version)
print('pandas version:',pd.__version__)
Python version: 3.6.5 |Anaconda, Inc.| (default, Apr 29 2018, 16:14:56) 
[GCC 7.2.0]
pandas version: 0.23.0
# 数据集,注意这里创建的方式类似于字典
d = {'one':[1,1],'two':[2,2]}
i = ['a','b']

# 创建数据帧
df = pd.DataFrame(data=d,index=i)
df
one two
a 1 2
b 1 2
df.index
Index(['a', 'b'], dtype='object')
# 获得列的值
stack = df.stack()
stack
a  one    1
   two    2
b  one    1
   two    2
dtype: int64
# 获得stack的索引,多重索引
stack.index
MultiIndex(levels=[['a', 'b'], ['one', 'two']],
           labels=[[0, 0, 1, 1], [0, 1, 0, 1]])
# 逐个获取行的值
unstack = df.unstack()
unstack
one  a    1
     b    1
two  a    2
     b    2
dtype: int64
unstack.index
MultiIndex(levels=[['one', 'two'], ['a', 'b']],
           labels=[[0, 0, 1, 1], [0, 1, 0, 1]])
# 将数据帧进行转置
transpose = df.T
transpose
a b
one 1 1
two 2 2
transpose.index
Index(['one', 'two'], dtype='object')

你可能感兴趣的:(Pandas系列学习教程)