首先从文本文件和Excel文件中读入数据,形成dataframe,然后可以将dataframe导出到文本文件、Excel文件中存储起来。
使用如下的python语句:
import numpy as np
import pandas as pd
test=np.loadtxt('./data/test.txt')
testDF=pd.DataFrame(test)
## index=False 不存储行索引; header=False 不存储列索引
## header=['column1','column2',...] 自定义列索引
testDF.to_csv('./data/test.csv',index=False,header=['userid','musicid','score'])
有的时候csv数据量非常庞大,我们可能并不需要全部数据,而仅需要读取前几行,这时可以指定只读入前N行,并将数据另存为一个更小的文件。
import pandas as pd
data=pd.read_csv('train.csv',nrows=1000) #读入前1000行
data.to_csv('train2.csv',index=False,header=['userid','musicid','score'])