python文件处理_批量读取txt文件转换为dataframe并存入csv

批量做Text文本写入csv时,首先把text文件读入dataframe,然后添加左列text路径名为文件名,右列为文章内容。


# -*- coding:utf-8 -*-
import os
import os.path
import codecs
filePaths=[]
fileContents=[]
for root,dirs,files in os.walk('data/output_text'):
    for name in files:
        filePath=os.path.join(root,name)
        filePaths.append(filePath)
        f=codecs.open(filePath,'r','utf-8')
        f=codecs.open(filePath,'r')
        fileContent=f.read()
        f.close()
        fileContents.append(fileContent)

import pandas
df=pandas.DataFrame({
    'filePath':filePaths,
    'fileContent':fileContents
})
df['filePath'] = df['filePath'].str[17:21]   #添加左列text路径名为文件名


df.to_csv('data/df.csv',encoding = 'utf-8') #存入csv

你可能感兴趣的:(1_文件处理,自然语言处理,机器学习,大数据)