win10自带记事本的编码问题

记事本的原罪

      • 编码的原罪
      • 修改记事本的编码为UTF-8
      • 放弃记事本
      • 替换方案

为什么会说不要使用win10自带的记事本呢,接下来就说道说道记事本了~

编码的原罪

记事本的默认编码是ANSI,在简体中文Windows操作系统中,ANSI 编码代表 GBK 编码。

使用 1 至 4 个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。

然而,在日文Windows操作系统中,ANSI 编码代表 Shift_JIS 编码。 不同 ANSI 编码之间互不兼容。

试想一下,当你的文件上传到GitHub,外国友人使用记事本打开了你的文件,发现是乱码,又要谷歌查原因,其中耗费的成本是极大的。

修改记事本的编码为UTF-8

或许有人会说,记事本多简便啊,随用随关,已经习惯了,不想抛弃。

既然记事本的默认编码是ANSI,为了解决编码的问题,我每次创建文件都另存并修改编码为UTF-8,这总可以吧,这下外国友人可以随心所欲看我的文档了吧,确实,这是一个好方法,对于日常使用已经是可以的了。

那如何修改记事本的编码呢?只需要在另存文件,选择你想要的编码方式即可。

win10自带记事本的编码问题_第1张图片

放弃记事本

编码的问题解决了,外国友人也可以看了,那为什么我还是建议放弃使用记事本呢?

原因在于微软的程序员大佬们做的设计太过聪明,每次通过记事本创建UTF-8编码的文件,文件开头都会多出三个字节:1110 1111‬ 1011 1011 1011 1111,也就是0xefbbbf。

对于一般使用而言,几乎不会有影响,但大家都是写代码的,总会遇到读写文件的时候,比如用Java以字节流的形式读取文件,发现打印出来的字节总是在开头多了3个。当你不知道的时候,你就会极度纳闷,只好谷歌、百度才能找到原因,而多出来的3个字节正式记事本的锅。

这就是为什么我不推荐记事本的终极理由,在不知情的情况下,这三个字节足以给你带来很多不必要的烦恼。

替换方案

有什么可以替换记事本,又可以做到轻便而强大的特性呢?答案就是notepad++,一款极简、轻便且广受程序员群体欢迎的文本编辑器。

你可能感兴趣的:(想法)