base64 原理与开发总结

base64 原理与开发总结

在日常开发中, 在客户端和服务端传递图片视频等等二进制数据, 一般先进行base64编码成字符串, 然后在请求响应中传递base64encoded string, 这样能保证各端数据的统一.

注意base64只是一种编码方式

base64基础

base64是常见的一种基于8bit(单字节)数据的一种编码方式, 也就是针对二进制的编码方式!!!

基本思想: 每6个bit进行编码成一个char字符, 6bit正好使用64个字符可以完全编码!!!

基本处理过程:

  1. 如果原始是字符串, 将字符串转化成ASCII码, 然后转化成8bit二进制数
  2. 它将每3个字节(24bit)转换为4个字符(32bit)
  3. 3字节->4字节转化中, 每6bit数据切分以后前面补两个0bit, 构造成8bit, 刚刚好一个字节
  4. 将8bit字节转化成10进制数据, 根据index查下表, 找到编码以后8bit对应的字符
  5. 如果剩余数据没有3字节, 那么剩下的bit直接补0, 特殊处理(使用字符=)

base64使用的展示字符串字符表如下, 一共64个字符:

const unsigned char Base64EncoderBuf::OUT_ENCODING[64] =
{
    'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H',
    'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P',
    'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X',
    'Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f',
    'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n',
    'o', 'p', 'q', 'r', 's', 't', 'u', 'v',
    'w', 'x', 'y', 'z', '0', '1', '2', '3',
    '4', '5', '6', '7', '8', '9', '+', '/'
};

如果要编码的字节数不能被3整除, 最后会多出1个或者2个字节, 那么使用下面方法进行处理:
先使用0字节值补在末尾补足够, 使其能够被3整除, 然后base64编码. 在编码以后的base64文本后添加一个或者两个=, 代表补足的字节数.

也就是说, 当最后剩余一个8bit时, 最后一个6bit的base64字节块有4bit是0,最后附加上两个=; 如果最后剩余两个8bit字节(2byte)时, 最后一个6位的base64字节块有2bit是0, 最后附加一个=.

base64 原理与开发总结_第1张图片
2.png

base64编码实例

假设我们要编码一个字符串Man:

  1. 转化成ASCII码, M, a, n
  2. 转化成10进制 77, 97, 110
  3. 转化成二进制 0100110, 01100001, 01101110
  4. 切片补0, 转化成4个字节以后转成索引, 19, 22,5,46
base64 原理与开发总结_第2张图片
1.png

iOS/android/h5开发中的base64

在上面的base64编码结束以后可能还有其他额外的处理, 例如有些base64方法编码以后会每隔76个字符添加一个回车换行\r\n或者\n, 为了通用性, 建议在编码结束以后删除这个回车换行

在与H5通信或者作为文件名的时候, 使用-代替+, 使用_代替/,

参考

https://www.jianshu.com/p/bd4ac318d

你可能感兴趣的:(base64 原理与开发总结)