在编写python程序时,执行读取文件操作,代码如下:
import re
old_url = 'http://www.jikexueyuan.com/course/android/?pageNum=2'
total_page = 20
f = open('text.txt', 'r')
html = f.read()
f.close()
报错为:
UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xae in position 33: illegal multibyte sequence
此为读取的文件编译类型错误,
有人说要在代码文件头部#coding指定编码。 实测没有效果。
后来在读取文件时,加上编码方式就成功了。
修改后的代码为:
`import re
old_url = ‘http://www.jikexueyuan.com/course/android/?pageNum=2’
total_page = 20
f = open(‘text.txt’, ‘r’, encoding=’utf-8’)
html = f.read()
f.close()
`