在上一篇文章MD5加密(1):MD5基础知识和计算过程中,我简单地介绍了MD5的实现原理。但理论的目的是实践,所以这一篇文章就来分析一下MD5的C语言代码实现。
MD5算法在PPP拨号中用于实现 CHAP(Challenge Handshake Authentication Protocol
)认证方式。在CHAP认证中,拨号服务器向拨号客户端发送一个随机的challenge
字符串,然后拨号客户端使用预先共享的密钥和这个挑战字符串进行MD5哈希运算。然后,将哈希结果发送给拨号服务器。拨号服务器使用相同的密钥和challenge
字符串进行MD5哈希运算,并将计算得到的哈希结果与客户端发送的结果进行比较。如果两者匹配,认证成功,连接双方被认为是合法的。
我们就来参考一下LwIP中MD5代码的实现,它位于/lwip/src/netif/ppp/polarssl/md5.c
。
由于在网络传输中大端传输更常见,而在单片机中小端的CPU更常见,所以需要做大小端字节序的转化。在代码中就定义了大小端转化的宏定义:
#define GET_ULONG_LE(n,b,i) \
{ \
(n) = ( (unsigned long) (b)[(i) ] ) \
| ( (unsigned long) (b)[(i) + 1] << 8 ) \
| ( (unsigned long) (b)[(i) + 2] << 16 ) \
| ( (unsigned long) (b)[(i) + 3] << 24 ); \
}
#define PUT_ULONG_LE(n,b,i) \
{ \
(b)[(i) ] = (unsigned char) ( (n) ); \
(b)[(i) + 1] = (unsigned char) ( (n) >> 8 ); \
(b)[(i) + 2] = (unsigned char) ( (n) >> 16 ); \
(b)[(i) + 3] = (unsigned char) ( (n) >> 24 ); \
}
其中GET_ULONG_LE
用于从一个字节数组b中提取四个字节,并将它们组合成一个32位的无符号长整型数n,采用小端字节序;PUT_ULONG_LE
用于将一个32位的无符号长整型数n分解成四个字节,并按小端字节序存储到一个字节数组b中。
在开始md5计算之前,需要初始化一些参数,相当于init操作,函数如下:
typedef struct
{
unsigned long total[2]; /*!< number of bytes processed */
unsigned long state[4]; /*!< intermediate digest state */
unsigned char buffer[64]; /*!< data block being processed */
}
md5_context;
void md5_starts( md5_context *ctx )
{
ctx->total[0] = 0;
ctx->total[1] = 0;
ctx->state[0] = 0x67452301;
ctx->state[1] = 0xEFCDAB89;
ctx->state[2] = 0x98BADCFE;
ctx->state[3] = 0x10325476;
}
(1)total
MD5是以block为单位进行处理的,一个block有512bit,即64字节。total
字段用来追踪整个MD5过程中已经处理的字节数,以便在数据处理过程中准确地计算数据的位数。
(2)state
这里的state
就是MD Buffer
,有4个32位的buffer,它们的值是固定的。
这是一个static的处理函数,用于每个block的计算,来看看代码:
static void md5_process( md5_context *ctx, const unsigned char data[64] )
{
unsigned long X[16], A, B, C, D;
/* 将输入的512bit字符串的每四个字节,都做一个大小端转换并保存到X[16]中 */
GET_ULONG_LE( X[ 0], data, 0 );
GET_ULONG_LE( X[ 1], data, 4 );
GET_ULONG_LE( X[ 2], data, 8 );
GET_ULONG_LE( X[ 3], data, 12 );
GET_ULONG_LE( X[ 4], data, 16 );
GET_ULONG_LE( X[ 5], data, 20 );
GET_ULONG_LE( X[ 6], data, 24 );
GET_ULONG_LE( X[ 7], data, 28 );
GET_ULONG_LE( X[ 8], data, 32 );
GET_ULONG_LE( X[ 9], data, 36 );
GET_ULONG_LE( X[10], data, 40 );
GET_ULONG_LE( X[11], data, 44 );
GET_ULONG_LE( X[12], data, 48 );
GET_ULONG_LE( X[13], data, 52 );
GET_ULONG_LE( X[14], data, 56 );
GET_ULONG_LE( X[15], data, 60 );
/* 用于在MD5四轮操作中的数据转换的宏定义 */
#define S(x,n) ((x << n) | ((x & 0xFFFFFFFF) >> (32 - n)))
#define P(a,b,c,d,k,s,t) \
{ \
a += F(b,c,d) + X[k] + t; a = S(a,s) + b; \
}
A = ctx->state[0];
B = ctx->state[1];
C = ctx->state[2];
D = ctx->state[3];
/* 执行MD5的四轮操作 */
#define F(x,y,z) (z ^ (x & (y ^ z)))
P( A, B, C, D, 0, 7, 0xD76AA478 );
P( D, A, B, C, 1, 12, 0xE8C7B756 );
P( C, D, A, B, 2, 17, 0x242070DB );
P( B, C, D, A, 3, 22, 0xC1BDCEEE );
P( A, B, C, D, 4, 7, 0xF57C0FAF );
P( D, A, B, C, 5, 12, 0x4787C62A );
P( C, D, A, B, 6, 17, 0xA8304613 );
P( B, C, D, A, 7, 22, 0xFD469501 );
P( A, B, C, D, 8, 7, 0x698098D8 );
P( D, A, B, C, 9, 12, 0x8B44F7AF );
P( C, D, A, B, 10, 17, 0xFFFF5BB1 );
P( B, C, D, A, 11, 22, 0x895CD7BE );
P( A, B, C, D, 12, 7, 0x6B901122 );
P( D, A, B, C, 13, 12, 0xFD987193 );
P( C, D, A, B, 14, 17, 0xA679438E );
P( B, C, D, A, 15, 22, 0x49B40821 );
#undef F
#define F(x,y,z) (y ^ (z & (x ^ y)))
P( A, B, C, D, 1, 5, 0xF61E2562 );
P( D, A, B, C, 6, 9, 0xC040B340 );
P( C, D, A, B, 11, 14, 0x265E5A51 );
P( B, C, D, A, 0, 20, 0xE9B6C7AA );
P( A, B, C, D, 5, 5, 0xD62F105D );
P( D, A, B, C, 10, 9, 0x02441453 );
P( C, D, A, B, 15, 14, 0xD8A1E681 );
P( B, C, D, A, 4, 20, 0xE7D3FBC8 );
P( A, B, C, D, 9, 5, 0x21E1CDE6 );
P( D, A, B, C, 14, 9, 0xC33707D6 );
P( C, D, A, B, 3, 14, 0xF4D50D87 );
P( B, C, D, A, 8, 20, 0x455A14ED );
P( A, B, C, D, 13, 5, 0xA9E3E905 );
P( D, A, B, C, 2, 9, 0xFCEFA3F8 );
P( C, D, A, B, 7, 14, 0x676F02D9 );
P( B, C, D, A, 12, 20, 0x8D2A4C8A );
#undef F
#define F(x,y,z) (x ^ y ^ z)
P( A, B, C, D, 5, 4, 0xFFFA3942 );
P( D, A, B, C, 8, 11, 0x8771F681 );
P( C, D, A, B, 11, 16, 0x6D9D6122 );
P( B, C, D, A, 14, 23, 0xFDE5380C );
P( A, B, C, D, 1, 4, 0xA4BEEA44 );
P( D, A, B, C, 4, 11, 0x4BDECFA9 );
P( C, D, A, B, 7, 16, 0xF6BB4B60 );
P( B, C, D, A, 10, 23, 0xBEBFBC70 );
P( A, B, C, D, 13, 4, 0x289B7EC6 );
P( D, A, B, C, 0, 11, 0xEAA127FA );
P( C, D, A, B, 3, 16, 0xD4EF3085 );
P( B, C, D, A, 6, 23, 0x04881D05 );
P( A, B, C, D, 9, 4, 0xD9D4D039 );
P( D, A, B, C, 12, 11, 0xE6DB99E5 );
P( C, D, A, B, 15, 16, 0x1FA27CF8 );
P( B, C, D, A, 2, 23, 0xC4AC5665 );
#undef F
#define F(x,y,z) (y ^ (x | ~z))
P( A, B, C, D, 0, 6, 0xF4292244 );
P( D, A, B, C, 7, 10, 0x432AFF97 );
P( C, D, A, B, 14, 15, 0xAB9423A7 );
P( B, C, D, A, 5, 21, 0xFC93A039 );
P( A, B, C, D, 12, 6, 0x655B59C3 );
P( D, A, B, C, 3, 10, 0x8F0CCC92 );
P( C, D, A, B, 10, 15, 0xFFEFF47D );
P( B, C, D, A, 1, 21, 0x85845DD1 );
P( A, B, C, D, 8, 6, 0x6FA87E4F );
P( D, A, B, C, 15, 10, 0xFE2CE6E0 );
P( C, D, A, B, 6, 15, 0xA3014314 );
P( B, C, D, A, 13, 21, 0x4E0811A1 );
P( A, B, C, D, 4, 6, 0xF7537E82 );
P( D, A, B, C, 11, 10, 0xBD3AF235 );
P( C, D, A, B, 2, 15, 0x2AD7D2BB );
P( B, C, D, A, 9, 21, 0xEB86D391 );
#undef F
ctx->state[0] += A;
ctx->state[1] += B;
ctx->state[2] += C;
ctx->state[3] += D;
}
首先,在上一篇文章中,我们知道MD5每个block需要经过四轮非线性的操作,公式如下:
这是标准的MD5的四轮非线性的操作公式,但是可以发现在上述的代码中,前两轮的的公式与定义并不相同。这可能是因为MD5算法存在一些变种和改进版本,它们可能使用不同的四轮函数来满足特定的需求或目标。
由于每一轮就是这个非线性的操作公式不同,我们就以第一轮计算为例进行分析,其它三轮的处理类似。来看一下:
#define S(x,n) ((x << n) | ((x & 0xFFFFFFFF) >> (32 - n)))
#define P(a,b,c,d,k,s,t) \
{ \
a += F(b,c,d) + X[k] + t; a = S(a,s) + b; \
}
来回顾以下上一节的MD5流程:
a += F(b,c,d)
a += X[k]
,每个子块占4字节,共16个子块a += t
,这个常量可以自行指定a += S(x,n)
a += b
这些步骤就对应了上面的宏定义P(a,b,c,d,k,s,t)
。这里主要来看一下这个移位操作的宏定义S(x,n)
。对于第一轮来说,移位的位数固定是7,12,17和22;第二轮是5,9,14和20;第三轮是4,11,16和23;第四轮是6,10,15,21。在md5的specification中有下面一句话:
The shift amounts in each round have been approximately optimized, to yield a faster “avalanche effect.” The shifts in different rounds are distinct.
也就是说,这些移位值是被测试过的,很容易引起“雪崩效应”,即字符串的一个很小的改动也能造成md5结果的很大的变化。另外,对于这个常量T来说,也是md5规范中规定的。具体为什么这么规定,涉及密码学的一些知识,这里不做深入的研究。
对于雪崩效应的测试,可以参考:Cryptanalysis of Hash Functions of the MD4-Family
对于MD5算法规范,可以参考:The MD5 Message-Digest Algorithm
接着这个函数就是定义四个不同的非线性计算过程,经过四轮计算后得到A、B、C和D,最后将结果保存在ctx->state[4]
中。
这个函数是给用户调用的,可以多次调用md5_update
一段一段地传入待求md5的字符串。但我们知道md5的计算是以512bit为单位的,不足512bit的话需要对字符串进行填充,所以这个函数会做一些填充操作,最后调用md5_process
处理。如果数据长度不够就先保存在这,等待下一次md5_update
或后面的md5_finish
的调用。下面来看一下这个函数的实现:
void md5_update( md5_context *ctx, const unsigned char *input, int ilen )
{
int fill;
unsigned long left;
if( ilen <= 0 )
return;
/* md5_process一次处理64字节,计算一下还需要多少字节能做一次处理 */
left = ctx->total[0] & 0x3F; //之前调用函数未处理完的字节数
fill = 64 - left; //还需填充的字节数
/* 更新已处理的字节数 */
ctx->total[0] += ilen;
/* 确保总字节数不超过32位 */
ctx->total[0] &= 0xFFFFFFFF;
/* 如果低32位溢出,则增加高32位的值,实际上就是在32位机上操作一个64位的值 */
if( ctx->total[0] < (unsigned long) ilen )
ctx->total[1]++;
/* 如果上次有剩字节没处理完且加上本次的数据后长度达到64字节,就处理这个块 */
if( left && ilen >= fill )
{
/* 将需要的组成一个block字节数的输入复制到buffer中 */
MEMCPY( (void *) (ctx->buffer + left),
input, fill );
/* 计算MD5 */
md5_process( ctx, ctx->buffer );
/* 移动input的指针 */
input += fill;
/* 将长度减去此次已经计算的字节数 */
ilen -= fill;
/* 没有剩余的字节数 */
left = 0;
}
/* 如果此时输入的字节数还大于64,则继续进行md5计算,直到字节数小于64 */
while( ilen >= 64 )
{
md5_process( ctx, input );
input += 64;
ilen -= 64;
}
/* 将不足64的字节保存起来,待后续字节输入满了64字节后再计算 */
if( ilen > 0 )
{
MEMCPY( (void *) (ctx->buffer + left),
input, ilen );
}
}
函数的具体流程都写在注释中了,实际上就是每64字节组成一个block后,就计算一次MD5。
当用户所有的字符都输入后,调用此函数即可得到md5的结果。我们有提到一定要满64字节才能进行一次计算,那要是整个字符串的长度不是64的倍数呢?这就需要我们手动补齐了。在上一节中也有提到,在输入字符串的末尾添加一个"1",然后再用"0"填充剩余的位数,最后还要预留64位,用来指示MD5输入字符串的长度。
static const unsigned char md5_padding[64] =
{
0x80, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
};
void md5_finish( md5_context *ctx, unsigned char output[16] )
{
unsigned long last, padn;
unsigned long high, low;
unsigned char msglen[8];
/* 最后8字节用于保存此次MD5的位数 */
high = ( ctx->total[0] >> 29 )
| ( ctx->total[1] << 3 );
low = ( ctx->total[0] << 3 );
/* 需要小端保存 */
PUT_ULONG_LE( low, msglen, 0 );
PUT_ULONG_LE( high, msglen, 4 );
/* 看一下还剩多少字节没有计算MD5,做最后的填充 */
last = ctx->total[0] & 0x3F;
padn = ( last < 56 ) ? ( 56 - last ) : ( 120 - last );
/* 计算剩余的没计算的位、padding的1/0和length的MD5 */
md5_update( ctx, md5_padding, padn );
md5_update( ctx, msglen, 8 );
/* 结果保存在ctx->state中,也是小端保存 */
PUT_ULONG_LE( ctx->state[0], output, 0 );
PUT_ULONG_LE( ctx->state[1], output, 4 );
PUT_ULONG_LE( ctx->state[2], output, 8 );
PUT_ULONG_LE( ctx->state[3], output, 12 );
}
上面的代码有两个地方详细说明一下:
(1)最后8字节长度的移位操作?
high = ( ctx->total[0] >> 29 ) | ( ctx->total[1] << 3 );
low = ( ctx->total[0] << 3 );
这两行代码可以理解为对将64位的数左移三位,也就是乘以8。这是因为这个长度是以bit为单位的,而我们前面计算的长度total
是以字节为单位的。也就是说实际上MD5最多支持长度为 2 61 2^{61} 261字节的数据,当然这个数已经非常大了。
(2)剩余字节的填充?
last = ctx->total[0] & 0x3F;
padn = ( last < 56 ) ? ( 56 - last ) : ( 120 - last );
如果小于56,则填充md5_padding
到56字节,因为最后还有8字节的md5 length要添加组成一个block。如果大于等于56,则要多加一个block,将length写在下一个block中,填充的长度为(64-last+64-8) = (120-last)
,其中last>=56
,所以填充的长度不会超过64,故md5_padding
数组的长度为64。
MD5是一种哈希算法,用于将任意长度的数据转换为固定长度的哈希值。通过将数据映射到唯一的哈希值,MD5可以用于验证数据的完整性、生成数字签名、加密密码等应用。虽然MD5是一个经典的哈希函数,但由于其已经被证明存在安全弱点,现代安全需求更倾向于使用更强大的哈希算法,如SHA-256、AES。因此,在实际应用中,如果安全性是关键考量因素,我们不应该直接使用MD5,而是选择更安全的哈希算法。
特别是AES,我写的每一个BootLoader程序中都有使用到AES加解密,对于一些高端的单片机,如NXP的I.MX RT1176,它还在硬件上实现了一个OTFAD,用来实时进行AES解密运行程序。所以后续我打算写文章深入了解一下AES算法,来看看它里面是怎么实现的。