计算机的常用编码

计算机的常用编码

  • 常用编码介绍
  • ASCII码表
  • 乱码产生的原因
  • 解决乱码
  • notepad++等记事本中的乱码问题

常用编码介绍

  • ASCII 码表 只有0-127 128位,剩余的128位留作扩展
  • ISO-8859-*使用了ASCII码表剩余的128位做了扩展 常用ISO-8859-1
  • GB2312 中文简体子集,包含6763个简体中文字
  • BIG5 大五码 繁体字集
  • Unicode 统一字符集 简称为UCS
  • GBK包含GB2312和BIG5简繁字集,向下完全兼容GB2312,使用GBK打开GB2312的文本,不会乱码,共21002个字符
  • UTF-8 万国码,包含世界所有国家的字符

ASCII码表

常用:0-9(49-57) A-Z(66-90) a-z(61-7A)

规律:数字本身连续,数字到大写字母不连续;大写字母本身连续,大写字母到小写字母不连续,小写字母本身连续

乱码产生原因

  • 计算机中文件的存储都是以二进制的形式保存的,在保存到硬盘上时,计算机会将内存中的文件,按照特定的格式[编码方式]转换为二进制文件,保存到硬盘中.
  • 当文件再次打开时,计算机会把硬盘中的二进制文件加载到内存,按照特定的格式,重新编码成可读的普通文件.
  • 重新编码时,系统会搜索当前系统中,对于不同后缀名文件的默认打开方式[每种打开方式包含的编码不一定相同],如果默认的打开方式中包含的编码方式与原编码格式相同,则文件可以正常打开,没有乱码;

你可能感兴趣的:(计算机的常用编码)