python数据预处理或R语言处理

python下处理:

一:导入对应预处理包:通过import命令

1.numpy:跟矩阵计算相关的包;

2.pandas:预处理数据包

3.matplotlib.pyplot:可视化相关的包

二:引进数据包,准备好数据

1.datasets = pandas.read_csv('Data.csv')

2.遗失数据 a.取最大值,最小值,中间值,b.平均数 c.删除它

处理遗失数据需要导入包 from sklearn.preprocessing import Imputer

R语言下处理:

1.找到对应的文件数据路径

2.datasets = read_csv('Data.csv')

你可能感兴趣的:(python数据预处理或R语言处理)