pandas是python中处理数据最实用的包
import pandas as pd
读取数据:
read_csv:读取泰坦尼克号数据为例
df = pd.read_csv('./data/titanic.csv')
.head()可以读取前几条数据,指定前几条都可以
默认读取5行
df.head(10)
.info返回当前的信息
每一列的基本信息描述
.describe()可以得到数据的基本统计特性
我们可以自己指定索引
索引默认为0-len(data),我们可以自己指定
df = df.set_index('Name')
df.head()
df.iloc[1] 取第一行数据
df.iloc[0:5] 取前5行数据
df.iloc[0:5,1:3] 取前5行,2-3列数据
df.loc[0:5,['Pclass','Fare']] 取前5行,'Pclass','Fare'列数据
bool类型的索引
df[df['Fare'] > 40][:5]
取Fare大于40 的前5行数据