UnicodeDecodeError: 'gbk' codec can't decode byte 0xe9 in position 7581: illegal multibyte sequence

  这个问题是在我在读取一段文本时出现的错误,当时的代码是这样的:
 

 def getMovieList(item):
    items = {}
    f = open(item,"r") #这句的问题
    movie_content = f.readlines()
    f.close()
    for movie in movie_content:
        movieLine = movie.split("|")
        items[int(movieLine[0])] = movieLine[1:]
    return items

这是Unicode编码不一致导致的,上面的

 f = open(item,"r")

换成

f = open(item,"r",encoding='ISO-8859-1')

就能正常运行了!

注意:
  当遇到类似的问题的时候,不一定一定都改为encoding=’ISO-8859-1’,我碰到的另外一个则是修改encoding=’utf-32’。因为unicode下面的编码方式有好几种,比如:utf-8、utf-16、utf-32、ISO-8859-1、gb2312等等好多种。但是这样的问题真的就是这么解决的。我们需要做的就是去把encoding后面的编码方式多换不同的试试,找到正确的就可以了。
下面是我找到的几种unicode编码方式:
  

gbk
gb2312
gb18030
utf-8
utf-16
utf-32
ISO-8859-1
   希望对大家有帮助哦~~~O(∩_∩)O~

你可能感兴趣的:(python)