计算机常用编码

计算机常用编码

ASCII编码

  • 最早的最重要的最基本的英美文字的字符集
  • 只使用最低7位表示字符,剩余的128位留作拓展
  • 采用顺序储存方式储存字符

ISO-8859-*

  • 使用ASCII剩余的码位进行拓展
  • ISO-8859-1专门对英语的拓展
  • Tomcat 默认采用ISO-88591>UTF-8

GBK[936]

  • 包括简繁字体
  • 包括GB2312字集、BIG5字集
  • GBK编码是GB2312编码的超集,向下完全兼容GB2312
  • GBK支持希腊字母、日文假名字母、俄语字母等字符,但不支持韩语中的表音字符(非汉字字符)。

UTF-8

  • 英文使用8位(一个字节),中文使用24位(3个字节)
  • UTF-8包含全世界所有国家需要用到的字符,是国际编码

ANSI

  • ANSI不是一种具体的编码
  • 由系统默认的编码决定,如果系统默认的编码gbk那ANSI就是gbk
  • 查看系统默认编码在DOS命令窗口输入 chcp

ASCII码表

常用09,AZ,az对应的ASCII码分别为4857,6590,97122

0 -- 48

A -- 65

a -- 97

乱码产生原因

  • 计算机中文件的存储是以二进制的形式保存,在保存到硬盘上时,计算机会将内存中的文件,按照特定的格式[编码方式]转换为二进制文件,保存到硬盘中。
  • 当文件再次打开时,计算机会把硬盘中的二进制文件加载到内存,按照特定的格式,重新编码成可读的普通文件;
  • 重新编码时,系统会搜索当前系统中,对于不同后缀名文件的默认打开方式[每种打开方式包含的编码不一定相同],如果默认的打开方式中包含的编码方式与原编码格式相同,则文件可以正常打开,没有乱码;
  • 如果默认打开方式中的编码不包含,或者没有全部包含,则会出现乱码

乱码的解决方式

  • 在保存文件时,确定编辑保存的编码方式
  • 在打开文件时,要根据不同的文件后缀名,选择对应的打开方式

你可能感兴趣的:(计算机常用编码)