Python或者R语言出现中文字体乱码的情况

在用Python和RStudio加载上文链接提供下载的编程代码时,出现提示“Not all characters in E:/a.txt could be decoded using CP936."

cp936 的意思是 Codepage 936, 是简体中文的编码。

此外,中文字符集编码还包括:Unicode ,GB2312 ,GBK,GB18030,UTF-8等。

UTF-8的一个特别的好处是它与ISO- 8859-1完全兼容,可以表示世界上所有的字符,汉字通常用3个字节来表示。GB2312的code page是CP20936。
GBK的code page是CP936 。
GB18030支持的字符数更多。
GB2312、GBK、GB18030均为双字节。
当打开代码文件出现乱码时的解决方案:
在Python shell 开头加上:# -*- coding: utf-8 -*-
在RStudio中点击菜单栏File——>Reopen with Encoding...——>选择utf-8即可正常显示中文。


你可能感兴趣的:(Python基础)