文本和HTML乱码的解决方案

在平时,我们经常遇到文本文件乱码的现象(包括在浏览器中),这种现象的大多数原因都是因为解码时选择的字符编码方案与编码时选择的字符编码方案不同所致

各种字符编码方案请参考《字符集和字符编码》

一、文本文件显示乱码

因为:

  • 文本文件在保存时会以某种字符编码方案进行编码;
  • 文本文件在显示时也会以村种字符编码方案进行解码;
    所以:
    如果文本文件以不同于编码时的字符编码方案进行解码,则就会出现乱码的现象;

解决方案:
在打开文本文件的软件中更改 解码该文本文件的 字符编码方案 为 该文本文件在编码(保存)时选择的字符编码方案;

二、HTML在浏览器中显示乱码

由于:

  • 文本文件在保存时会以某种字符编码方案进行编码;
  • 浏览器需要根据 HTML 文档的 meta 标签指定的字符编码方案来显示 HTML 文档;
    所以:
    当 HTML 文件编码时的字符编码方案 与 meta 标签指定的字符编码方案 不一样时,就会出现浏览器显示乱码的现象;

解决方案:
在 HTML 文档中通过 meta 标签告诉浏览器 HTML 文件的正确的字符编码方案,如下:

  • 在 HTML 4.01 中用以下方式:

    
    
  • 在 HTML5 中 为 meta 标签 新增了 charset 属性,用来指定字符编码方案,所以在 HTML5 中有2种方式指定字符编码方案:

    
    

    或者

    
    

注意:

  • HTML 文档中 meta 标签中定义的编码方案是用来告诉浏览器的,而 HTML 文件本身是以何种编码方案编码的 取决于 保存该文档的编辑器的设定;

你可能感兴趣的:(文本和HTML乱码的解决方案)