MD5算法的C++实现

1. Introduction
MD5算法是一种消息摘要算法( Message Digest Algorithm ),此算法以任意长度的信息(message)作为输入进行计算,产生一个128-bit(16-byte)的指纹或报文摘要( fingerprint or message digest )。两个不同的message产生相同message digest的几率相当小,从一个给定的message digest逆向产生原始message更是困难(不过据说我国的某个教授很善于从message digest构造message),因此MD5算法适合用在数字签名应用中。MD5实现简单,在32位的机器上运行速度也相当快,当然实际应用也不仅仅局限于数字签名。

2. MD5 Algorithm Description
假设输入信息(input message)的长度为b(bit),我们想要产生它的报文摘要,在此处b为任意的非负整数:b也可能为0,也不一定为8的整数倍,且可能是任意大的长度。设该信息的比特流表示如下:

M[0] M[1] M[2] ... M[b-1]

计算此信息的报文摘要需要如下5步:
2.1 Append Padding Bits
信息计算前先要进行位补位,设补位后信息的长度为LEN(bit),则LEN%512 = 448(bit),即数据扩展至
K*512+448(bit)。即K*64+56(byte),K为整数。补位操作始终要执行,即使补位前信息的长度对512求余的结果是448。具体补位操作:补一个1,然后补0至满足上述要求。总共最少要补1bit,最多补512bit。

2.2 Append Length
将输入信息的原始长度b(bit)表示成一个64-bit的数字,把它添加到上一步的结果后面(在32位的机器上,这64位将用2个字来表示并且低位在前)。当遇到b大于2^64这种极少的情况时,b的高位被截去,仅使用b的低64位。经过上面两步,数据就被填补成长度为512(bit)的倍数。也就是说,此时的数据长度是16个字(32byte)的整数倍。此时的数据表示为:

M[0 ... N-1]

其中的N是16的倍数。

2.3 Initialize MD Buffer
用一个四个字的缓冲器(A,B,C,D)来计算报文摘要,A,B,C,D分别是32位的寄存器,初始化使用的是十六进制表示的数字,注意低字节在前:

word A: 01 23 45 67
word B: 89 ab cd ef
word C: fe dc ba 98
word D: 76 54 32 10


2.4 Process Message in 16-Word Blocks
首先定义4个辅助函数,每个函数的输入是三个32位的字,输出是一个32位的字:

F(X,Y,Z) = XY v not(X) Z
G(X,Y,Z) = XZ v Y not(Z)
H(X,Y,Z) = X xor Y xor Z
I(X,Y,Z) = Y xor (X v not(Z))

NOTE: not(X)代表X的按位补运算,X v Y 表示X和Y的按位或运算,X xor Y代表X和Y的按位异或运算,XY代表X和Y的按位与运算。

具体过程如下:
1/*Processeach16-wordblock.*/
2Fori=0toN/16-1do
3
4/*CopyblockiintoX.*/
5Forj=0to15do
6SetX[j]toM[i*16+ j].
7end/*oflooponj*/

8
9/*SaveAasAA,BasBB,CasCC,andDasDD.*/
10AA= A
11BB=
B
12CC=
C
13DD=
D
14

15/*Round1.*/
16/* Let[abcdksi]denotetheoperation
17a=b+((a+F(b,c,d)+X[k]+T[i])<<<s).*/

18/*Dothefollowing16operations.*/
19[ABCD071][DABC1122][CDAB2173][BCDA3224 ]
20[ABCD475][DABC5126][CDAB6177][BCDA7228
]
21[ABCD879][DABC91210][CDAB101711][BCDA112212
]
22[ABCD12713][DABC131214][CDAB141715][BCDA152216
]
23

24/*Round2.*/
25/* Let[abcdksi]denotetheoperation
26a=b+((a+G(b,c,d)+X[k]+T[i])<<<s).*/

27/*Dothefollowing16operations.*/
28[ABCD1517][DABC6918][CDAB111419][BCDA02020 ]
29[ABCD5521][DABC10922][CDAB151423][BCDA42024
]
30[ABCD9525][DABC14926][CDAB31427][BCDA82028
]
31[ABCD13529][DABC2930][CDAB71431][BCDA122032
]
32

33/*Round3.*/
34/* Let[abcdkst]denotetheoperation
35a=b+((a+H(b,c,d)+X[k]+T[i])<<<s).*/

36/*Dothefollowing16operations.*/
37[ABCD5433][DABC81134][CDAB111635][BCDA142336 ]
38[ABCD1437][DABC41138][CDAB71639][BCDA102340
]
39[ABCD13441][DABC01142][CDAB31643][BCDA62344
]
40[ABCD9445][DABC121146][CDAB151647][BCDA22348
]
41

42/*Round4.*/
43/* Let[abcdkst]denotetheoperation
44a=b+((a+I(b,c,d)+X[k]+T[i])<<<s).*/

45/*Dothefollowing16operations.*/
46[ABCD0649][DABC71050][CDAB141551][BCDA52152 ]
47[ABCD12653][DABC31054][CDAB101555][BCDA12156
]
48[ABCD8657][DABC151058][CDAB61559][BCDA132160
]
49[ABCD4661][DABC111062][CDAB21563][BCDA92164
]
50

51/* Thenperformthefollowingadditions.(Thatisincrementeach
52
ofthefourregistersbythevalueithadbeforethisblock
53wasstarted.)*/

54A=A+ AA
55B=B+
BB
56C=C+
CC
57D=D+
DD
58

59end/*oflooponi*/

2.5 Output
报文摘要的产生后的形式为:A,B,C,D。也就是低位字节A开始,高位字节D结束。

3. C++ Implementation
有了上面5个步骤的算法描述,用C++实现起来就很直接了。需要注意的是在具体实现的时候上述5个步骤的顺序会有所变动,因为在大多数情况下我们都无法或很难提前计算出输入信息的长度b(如输入信息来自文件或网络)。因此在具体实现时 Append Padding Bits Append Length 这两步会放在最后面。

4. Test Suite
由于实现代码比较长,在这里就不贴出来了,在本文后面会提供下载。MD5类的public接口如下:
md5.h
1class MD5{
2public
:
3
MD5();
4MD5(constvoid*
input,size_tlength);
5MD5(conststring&
str);
6MD5(ifstream&
in);
7voidupdate(constvoid*
input,size_tlength);
8voidupdate(conststring&
str);
9voidupdate(ifstream&
in);
10constbyte*
digest();
11
stringtoString();
12void
reset();
13
...
14};

下面简单介绍一下具体用法:
1.计算字符串的MD5值
下面的代码计算字符串"abc"的MD5值并用cout输出:
1 MD5md5;
2md5.update("abc"
);
3cout<<md5.toString()<<
endl;
4//或者更简单点

5cout<<MD5("abc").toString()<<endl;

2.计算文件的MD5值
下面的代码计算文本文件"D:\test.txt"的MD5值并用cout输出,如果是二进制文件打开的时候记得要指定ios::binary模式。另外需要注意的是用来计算的文件必须存在,所以最好在计算前先判断下ifstream的状态。
(本来判断ifstream是否有效不该是客户的责任,原本想在ifstream无效时用文件名做参数抛出FileNotFoundException之类的异常,后来却发现从ifstream中居然无法得到文件名...)
1 MD5md5;
2md5.update(ifstream("D:\\test.txt"
));
3cout<<md5.toString()<<
endl;
4//或者更简单点

5cout<<MD5(ifstream("D:\\test.txt")).toString()<<endl;

3.最基本的用法
上面的用来计算字符串和文件MD5值的接口都是为了方便才提供的,其实最基本的接口是:
void update(const void *input, size_t length);
update的另外两个重载都是基于它来实现的,下面的代码用上述接口来实现FileDigest函数,该函数用来计算文件的MD5值:
1stringFileDigest(conststring& file){
2

3 ifstreamin(file.c_str(),ios::binary);
4if(!
in)
5return""
;
6

7 MD5md5;
8
std::streamsizelength;
9charbuffer[1024
];
10while(!
in.eof()){
11in.read(buffer,1024
);
12length=
in.gcount();
13if(length>0
)
14
md5.update(buffer,length);
15
}
16
in.close();
17return
md5.toString();
18}

下面看看测试代码:
test.cpp
1#include"md5.h"
2#include<iostream>
3
4 usingnamespacestd;
5

6voidPrintMD5(conststring&str,MD5& md5){
7cout<<"MD5(\""<<str<<"\")="<<md5.toString()<<
endl;
8
}
9

10int main(){
11

12 MD5md5;
13md5.update(""
);
14PrintMD5(""
,md5);
15

16md5.update("a" );
17PrintMD5("a"
,md5);
18

19md5.update("bc" );
20PrintMD5("abc"
,md5);
21

22md5.update("defghijklmnopqrstuvwxyz" );
23PrintMD5("abcdefghijklmnopqrstuvwxyz"
,md5);
24

25 md5.reset();
26md5.update("messagedigest"
);
27PrintMD5("messagedigest"
,md5);
28

29 md5.reset();
30md5.update(ifstream("D:\\test.txt"
));
31PrintMD5("D:\\test.txt"
,md5);
32

33return0 ;
34}

测试结果:
MD5("") = d41d8cd98f00b204e9800998ecf8427e
MD5("a") = 0cc175b9c0f1b6a831c399e269772661
MD5("abc") = 900150983cd24fb0d6963f7d28e17f72
MD5("abcdefghijklmnopqrstuvwxyz") = c3fcd3d76192e4007dfb496cca67e13b
MD5("message digest") = f96b697d7cb7938d525a2f31aaf161d0
MD5("D:\test.txt") = 7ac66c0f148de9519b8bd264312c4d64

你可能感兴趣的:(C++)