使用python的pandas库把.data文件转化为csv文件

1.问题引入

在数据分析,机器学习,深度学习中,我们经常会处理各种各样格式的数据。今天,博主在做房价预测时(采用波士顿房价数据集),从网上下载的数据集格式为.data,并不是我们喜闻乐见的csv格式,所以想采用pandas库将其转为为csv格式的数据,方便后面的训练。

2.问题分析

data格式数据展示为:使用python的pandas库把.data文件转化为csv文件_第1张图片
从第1列到第14列数据属性为:使用python的pandas库把.data文件转化为csv文件_第2张图片

代码演示

import pandas as pd
#读取data文件,指定属性,sep='[\s]*'意义为匹配一个或多个空格,因为原始数据集中数据分割是两个或者多个空格
data=pd.read_table('housing.data',header=None,names=['CRIM','ZN','INDUS','CHAS','NOX','RM','AGE','DIS','RAD','TAX','PTRATIO','B-1000','LSTAT','MEDV'],sep='[\s]*')
#生成csv文件
data.to_csv('housing.csv',index=False)

实验结果

使用python的pandas库把.data文件转化为csv文件_第3张图片
谢谢大家。

你可能感兴趣的:(python,pandas,csv,data)