pandas基本操作

'''
pandas基本操作
测试数据 泰坦里克号
'''

import pandas as pd
import numpy as np


p=pd.read_csv('titanic_train.csv')

print(p.shape) #获取数据维度
print(p.head())#默认获取前五行数据 head(n) 获取前n行数据
print(p.loc[0])#获取第一行数据
print(p['Age'])#按列名获取数据
print(p.loc[1,'Age'])#查看指定行数 指定属性值
print(p.columns.tolist())#获取所有列名
print(p['Age'].max())#求某一列的最大值
p.sort_values('Age',inplace=True,ascending=False)#ascending=True从小到大排序 否则降序
print(p['Age'])
age=p['Age'].loc[0:10]
age_isnull=pd.isnull(age)#判断缺失值
age_is_true=age[age_isnull]#取出缺失值
print(p['Age'].mean())#获取列平均值
print(p.pivot_table(index='Pclass',values='Age',aggfunc=np.mean))#index 分组标准  values 需要计算的数值  aggfunc 计算函数

 

你可能感兴趣的:(深度学习)