UrlEncode以及Base-64编解码简介

UrlEncode Url编码

  • Url编码的原因
    • 移植性:为了在不同的因特网协议中完整的传输url
    • 阅读性:为了url能够供人类阅读
    • 完整性:为了url能够完整使用安全字母表以外的二进制数据和字符
  • Url编码机制

    • 编码核心:1、对不安全字符进行转义处理;2、将不安全字符转义为一个百分号(%),后面跟着两个表示字符ASCⅡ码的十六进制数。

    字符:~ ASCⅡ码:126(0x7E) URL编码:http://www.joes-hardware.com/%7Ejoe
    字符:% ASCⅡ码:37(0x25) URL编码:http://www.joes-hardware.com/100%25satisfy

  • Url字符限制
    • url保留字符(类似语法关键字),如:’/’(路径分隔符), ‘.’(路径组件中使用), ‘:’(方案、用户/口令等定界符)等;
    • 不在定义的ASCⅡ码可打印字符集中,如0x00~0x1F, >0x7F;
    • 可能与网关及协议产生混淆的字符,如’{}’, ‘\’, ‘[]’等;

Base-64 编码

  • Base-64编码的原因
    • Base-64编码是MIME标准的一部分
    • 可使MIME在smtp中传输任意数据
    • 将任意数据打包,将其作为HTTP首部字段的值发送出去,无须担心其中包含会破坏HTTP分析程序的冒号、换行符或二进制值
  • Base-64编码机制

    • 将原始8位字节拆分为6位的片段,序列末尾填充零位(最终二进制序列的长度成为24的倍数);
    • 任何完全填充(不包含原始数据中的位)的6位组都由”=”表示;
    • 由于Base-64编码用8位字符来表示信息中的6个位,所以Base-6编码字符串大约比原始值扩大了33%。

    8位字符 O W !

    8位值(16进制) 0x4F 0x77 0x21

    8位值(2进制)010011110111011100100001

    6位值(10进制) 19 55 28 33

    Base-64字符 T 3 c h

Base-64字母表包括A~Z、a~z、0~9、+、/,如果对这64个字符进行特定排序,就可以实现简单的数据加密

你可能感兴趣的:(Http)