不同的编码与编码规则

推荐文章:
网页编码就是那点事
Unicode 和 UTF-8 有何区别?

编码

缩写 全称 含义
Ascii American Standard Code for Information Interchange 美国信息互换标准代码
DBCS Double Byte Charecter Set 双字节字符集
UCS Universal Multiple-Octet Coded Character Set 简称unicode
UTF UCS Transfer Format UTF-8是其一种实现
URL编码 URL encoding 也称为‘百分号编码’

个人理解:

  1. URL编码实际是将字符的ASCII表中的值转为16进制,如果遇到中文,默认根据GBK取该值的16进制。
    获取到16进制之后,再从右到左,取4位(不足4位直接处理),每2位做一位,前面加上%,编码成%XY格式。
    如中文字:“许”,对应的GBK16进制编码为:D0ED,如果通过urlencode编码转换的话就是:%D0%ED
    另外,urlencode遇到空格的话是转义成+

  2. base64urlencode都是一种编码规则,或者说是编码算法。而以上的unicode、ASCII、utf等都是对世界上现有的一些字符取了外号(一 一编码),就如同一本超大的计算机届的字典,一个字符对应一个外号(码、数值),这样不同国界的人,就可以通过这统一的规则进行无障碍交流了。

你可能感兴趣的:(不同的编码与编码规则)