对pandas进行数据预处理的实例讲解

引入包和加载数据

1

2

3

4

5

import pandas as pd

import numpy as np

train_df =pd.read_csv('../datas/train.csv'# train set

test_df = pd.read_csv('../datas/test.csv'# test set

combine = [train_df, test_df]

清洗数据

查看数据维度以及类型

缺失值处理

查看object数据统计信息

数值属性离散化

计算特征与target属性之间关系

查看数据维度以及类型

1

2

3

4

5

6

#查看前五条数据

print train

你可能感兴趣的:(Python框架,pandas,python,数据分析)