Pandas基础操作简介1

pandas是python中处理数据最实用的包

import pandas as pd

读取数据:

read_csv:读取泰坦尼克号数据为例

df = pd.read_csv('./data/titanic.csv')

.head()可以读取前几条数据,指定前几条都可以

默认读取5行

df.head(10)

Pandas基础操作简介1_第1张图片

.info返回当前的信息

每一列的基本信息描述

Pandas基础操作简介1_第2张图片

.describe()可以得到数据的基本统计特性

Pandas基础操作简介1_第3张图片

我们可以自己指定索引

索引默认为0-len(data),我们可以自己指定

df = df.set_index('Name')
df.head()

Pandas基础操作简介1_第4张图片

 

  • loc 用label来去定位
  • iloc 用position来去定位

df.iloc[1]  取第一行数据

df.iloc[0:5]    取前5行数据

df.iloc[0:5,1:3]  取前5行,2-3列数据

df.loc[0:5,['Pclass','Fare']] 取前5行,'Pclass','Fare'列数据

 

bool类型的索引

df[df['Fare'] > 40][:5]

取Fare大于40 的前5行数据

你可能感兴趣的:(python基础操作)