as3corelib 的 MD5.digest.endian 应该是 LITTLE_ENDIAN

赖勇浩( http://laiyonghao.com

MD5.digest 简介

MD5 算法( http://en.wikipedia.org/wiki/MD5)已经是使用最为广泛的信息摘要算法之一,常用以错误检查,比如命令 md5sum。
当我们通过网络传输 protobuf-2.4.1.tar.gz 后,可以在另一端通过比对它的 md5sum 结果是否相同来进行校验。
如上我们可以看到 md5sum 的结果是 32 个字符的字符串,每个字符是一个 16 进制数,一般称之为 hexdigest。除了这种形式,md5 值还可以使用 16 字节的二进制序列来表示,称之为 digest。显然后者在空间上更有优势,所以有时候存储、网络传输 md5 值的时候,我们会选择使用 digest。
根据 MD5 算法的 RFC( http://tools.ietf.org/html/rfc1321),我们可以知道其实 digest 就是 4 个连续存储的 4 字节的整型。我们也知道不同的平台上,有不同的字节序( http://zh.wikipedia.org/wiki/%E5%AD%97%E8%8A%82%E5%BA%8F),所以 RFC1321 在它的“APPENDIX A - Reference Implementation”里编写了 Encode/Decode 函数,指明 md5.digest 应该使用 LITTLE_ENDIAN。
而上文提到的 md5 wikipedia 页面也有一行代码注释提到应为小端序:

as3corelib 的问题

在 as3corelib 中,MD5.digest 是一个 ByteArray 实例,见 https://github.com/mikechambers/as3corelib/blob/master/src/com/adobe/crypto/MD5.as#L42 。ByteArray 实现了 IDataInput 和 IDataOutput 接口,自然也像其它实现了这两个接口的 FileStream, Socket 类一样继承了 endian 属性,其默认值是 BIG_ENDIAN。在 as3corelib 的当前实现中,digest 使用的是默认的 BIG_ENDIAN,见 https://github.com/mikechambers/as3corelib/blob/master/src/com/adobe/crypto/MD5.as#L182,或如下代码:
当传输 digest 到另一个进程进行比对时,就会发现 md5 检验和不匹配的情况了。

解决方案

最根本的方案应该是给 as3corelib 打个 patch,修正这个 bug,使之实现符合 RFC,附 patch 如下:
我已经向 as3corelib 的维护者反映这个问题,估计不日就可以由官方修复。但在官方发布新版本之前,我们也可以选择两个变通方案,一是使用 hexdigest,二是编写一个自己的转换函数 toLittleEndianMd5Digest,把 MD5.digest 转为 LITTLE_ENDIAN,实现如下:
这个 toLittleEndianMd5Digest 函数能够在 as3corelib 修正这个 bug 以后保持兼容,所以不用担心后遗症,可以放心大胆地使用。

你可能感兴趣的:(core)