UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xcf in position 14: invalid continuation byte

使用结巴分词时,报错:
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xcf in position 14: invalid continuation byte
如下图:
UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xcf in position 14: invalid continuation byte_第1张图片
原因是:另存为txt文件时,编码默认是ANSI。只要另存时选择UTF-8就可以了,如下图所示:
UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xcf in position 14: invalid continuation byte_第2张图片

你可能感兴趣的:(python)