黑马程序员:字符编码

UTF-8的标记头: EF BB BF
GB2312 国标码
Unicode码
 字符编码的一个奇怪现象:用记事本编写三个文件,分别输入“联通”,“联想”,“联”。
打开记事本 会出现异常,“联通”和“联” 无法正常显示。
 因为早期的UTF-8文件不要求必须有标记头,所以软件要通过整个文件的数据特征来猜测它的字符集编码。“联”和“通”的GB2312码 符合 UTF-8的编码规则,它就把这些数据作为UTF-8 编码来显示。

你可能感兴趣的:(联想)