Python读取整个文本文件

读取整个文本:

f=open("index.html", encoding="utf-8", errors="ignore" )
读取到的文本 = f.read()
f.close()

筛选出中文:

import re


留下的中文= re.sub(re.compile(r'[^\u4e00-\u9fa5]'), '', 读取到的文本)
f2 = open("新的文本文件名字", "w", encoding="utf-8")
成功写入字符数量 = f2.write(留下的中文)
print(成功写入字符数量)
f2.close()

Python中使用中文字符当变量是毫无问题的.

你可能感兴趣的:(Python读取整个文本文件)