base64 原理与开发总结
在日常开发中, 在客户端和服务端传递图片视频等等二进制数据, 一般先进行base64编码成字符串, 然后在请求响应中传递base64encoded string
, 这样能保证各端数据的统一.
注意base64只是一种编码方式
base64基础
base64
是常见的一种基于8bit(单字节)数据的一种编码方式, 也就是针对二进制的编码方式!!!
基本思想: 每6个bit进行编码成一个char字符, 6bit正好使用64个字符可以完全编码!!!
基本处理过程:
- 如果原始是字符串, 将字符串转化成ASCII码, 然后转化成8bit二进制数
- 它将每3个字节(24bit)转换为4个字符(32bit)
- 在
3字节->4字节
转化中, 每6bit数据切分以后前面补两个0bit, 构造成8bit, 刚刚好一个字节 - 将8bit字节转化成10进制数据, 根据index查下表, 找到编码以后8bit对应的字符
- 如果剩余数据没有3字节, 那么剩下的bit直接补0, 特殊处理(使用字符
=
)
base64
使用的展示字符串字符表如下, 一共64个字符:
const unsigned char Base64EncoderBuf::OUT_ENCODING[64] =
{
'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H',
'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P',
'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X',
'Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f',
'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n',
'o', 'p', 'q', 'r', 's', 't', 'u', 'v',
'w', 'x', 'y', 'z', '0', '1', '2', '3',
'4', '5', '6', '7', '8', '9', '+', '/'
};
如果要编码的字节数不能被3整除, 最后会多出1个或者2个字节, 那么使用下面方法进行处理:
先使用0字节值补在末尾补足够, 使其能够被3整除, 然后base64编码. 在编码以后的base64文本后添加一个或者两个=
, 代表补足的字节数.
也就是说, 当最后剩余一个8bit时, 最后一个6bit的base64字节块有4bit是0,最后附加上两个=
; 如果最后剩余两个8bit字节(2byte)时, 最后一个6位的base64字节块有2bit是0, 最后附加一个=
.
base64编码实例
假设我们要编码一个字符串Man
:
- 转化成ASCII码,
M
,a
,n
- 转化成10进制
77
,97
,110
- 转化成二进制
0100110
,01100001
,01101110
- 切片补0, 转化成4个字节以后转成索引,
19
,22
,5
,46
iOS/android/h5开发中的base64
在上面的base64编码结束以后可能还有其他额外的处理, 例如有些base64方法编码以后会每隔76个字符添加一个回车换行\r\n
或者\n
, 为了通用性, 建议在编码结束以后删除这个回车换行
在与H5通信或者作为文件名的时候, 使用-
代替+
, 使用_
代替/
,
参考
https://www.jianshu.com/p/bd4ac318d