首先是读取文件,这里使用了pandas库
import pandas as pd
data_train = pd.read_csv("train_dataset.csv", encoding='utf-8',sep='|')
train_content = pd.DataFrame(data_train.content)
方式一:将数据框的数据存入txt文件 - - - 使用pandas库
sep='\t'表示用Tab键分隔不同字段,index=False表示不带有行号的输出
train_content.to_csv("train_content.txt",sep = "\t",index = False)
方式二:将字符串保存到txt文件 - - - .write()
# file = open("train_content.txt","w") # “w”表示写入 “w+”表示读取和写入
# file.write(train_content)
# file.close()
方式三:使用numpy库
import numpy as np
data = np.array([[1, 2, 3], [4, 5, 6]])
np.savetxt('data.txt', data, delimiter=',')