用python读取文本信息,进行处理,写到另一文件中

题目:把歌词转化成一句话一行的文本且不包含标点符号

思路:打开文件位置,读取文件中所有信息以列表形式展示,把列表转化成字符串,去除里面的所有空格回车符号。(是为了让信息以歌词形式展开,一句话一行)

用正则表达式去除掉里面所有的标点符号,放入列表中。

遍历列表中的信息,放到另一个文件中。


import re

file1=codecs.open(r'F:\test\info.txt','r','gbk')
list1=file1.readlines()
str1=''.join(list1)

str2=re.sub('\s','',str1)

re1=',|。|!|“”|?'
list2=re.split(re1,str2)

file2=codecs.open(r'F:\test\log.docx','a+','gbk')
for key in list2:
    if key:
        print (key+'\n')
        file2.write(key+'\n')
file2.readlines()

你可能感兴趣的:(用python读取文本信息,进行处理,写到另一文件中)