Java利用MessageDigest获取字符串或文件MD5详解

  MD5是常用的加密算法,也经常用于校验信息完整,如文件的完整性。用术语讲,MD5是一种 消息摘要算法(Message Digest Algorithm)。另外还有一种常用的消息摘要算法SHA1。如果想了解这些的话,可以去百度百科:MD5、SHA1、消息摘要算法。

 

         Java已经实现了MD5、SHA1算法。利用java.security.MessageDigest类就可以获取字符串和文件的MD5以及SHA1结果。

 

1.字符串的MD5(下面的代码有详细注释)

[java] view plain copy
  1. public static String stringMD5(String input) {  
  2.   
  3.    try {  
  4.   
  5.       // 拿到一个MD5转换器(如果想要SHA1参数换成”SHA1”)  
  6.   
  7.       MessageDigest messageDigest =MessageDigest.getInstance("MD5");  
  8.   
  9.   
  10.       // 输入的字符串转换成字节数组  
  11.   
  12.       byte[] inputByteArray = input.getBytes();  
  13.   
  14.   
  15.   
  16.       // inputByteArray是输入字符串转换得到的字节数组  
  17.   
  18.       messageDigest.update(inputByteArray);  
  19.   
  20.   
  21.   
  22.       // 转换并返回结果,也是字节数组,包含16个元素  
  23.   
  24.       byte[] resultByteArray = messageDigest.digest();  
  25.   
  26.   
  27.   
  28.       // 字符数组转换成字符串返回  
  29.   
  30.       return byteArrayToHex(resultByteArray);  
  31.   
  32.        
  33.   
  34.    } catch (NoSuchAlgorithmException e) {  
  35.   
  36.       return null;  
  37.   
  38.    }  
  39.   
  40. }  


  

   //下面这个函数用于将字节数组换成成16进制的字符串

[java] view plain copy
  1. public static String byteArrayToHex(byte[] byteArray) {  
  2.   
  3.    // 首先初始化一个字符数组,用来存放每个16进制字符  
  4.   
  5.    char[] hexDigits = {'0','1','2','3','4','5','6','7','8','9''A','B','C','D','E','F' };  
  6.   
  7.   
  8.   
  9.    // new一个字符数组,这个就是用来组成结果字符串的(解释一下:一个byte是八位二进制,也就是2位十六进制字符(2的8次方等于16的2次方))  
  10.   
  11.    char[] resultCharArray =new char[byteArray.length * 2];  
  12.   
  13.   
  14.   
  15.    // 遍历字节数组,通过位运算(位运算效率高),转换成字符放到字符数组中去  
  16.   
  17.    int index = 0;  
  18.   
  19.    for (byte b : byteArray) {  
  20.   
  21.       resultCharArray[index++] = hexDigits[b>>> 4 & 0xf];  
  22.   
  23.       resultCharArray[index++] = hexDigits[b& 0xf];  
  24.   
  25.    }  
  26.   
  27.   
  28.   
  29.    // 字符数组组合成字符串返回  
  30.   
  31.    return new String(resultCharArray);  


 

 

从上面代码可以看出,使用MessageDigest对字符串进行MD5算法的步骤是,先将字符串转换成字节数组,在进行MD5算法,最后返回的也是一个字节数组,要我们自己转成32位的字符串。

 

2.文件MD5

 

对文件进行MD5也可以像字符串MD5一样的,首先要把文件转成字节数组,后面和字符串MD5完全一样。

但是如果是一个特别大的文件,一下子把一个文件的数组全部读到内存中,那么估计内存也吃不消。

对于大文件,可以使用DigestInputStream。

 

[java] view plain copy
  1. public static String fileMD5(String inputFile) throws IOException {  
  2.   
  3.    
  4.   
  5.       // 缓冲区大小(这个可以抽出一个参数)  
  6.   
  7.       int bufferSize = 256 * 1024;  
  8.   
  9.       FileInputStream fileInputStream = null;  
  10.   
  11.       DigestInputStream digestInputStream = null;  
  12.   
  13.    
  14.   
  15.       try {  
  16.   
  17.          // 拿到一个MD5转换器(同样,这里可以换成SHA1)  
  18.   
  19.          MessageDigest messageDigest =MessageDigest.getInstance("MD5");  
  20.   
  21.    
  22.   
  23.          // 使用DigestInputStream  
  24.   
  25.          fileInputStream = new FileInputStream(inputFile);  
  26.   
  27.          digestInputStream = new DigestInputStream(fileInputStream,messageDigest);  
  28.   
  29.    
  30.   
  31.          // read的过程中进行MD5处理,直到读完文件  
  32.   
  33.          byte[] buffer =new byte[bufferSize];  
  34.   
  35.          while (digestInputStream.read(buffer) > 0);  
  36.   
  37.    
  38.   
  39.          // 获取最终的MessageDigest  
  40.   
  41.          messageDigest= digestInputStream.getMessageDigest();  
  42.   
  43.    
  44.   
  45.          // 拿到结果,也是字节数组,包含16个元素  
  46.   
  47.          byte[] resultByteArray = messageDigest.digest();  
  48.   
  49.    
  50.   
  51.          // 同样,把字节数组转换成字符串  
  52.   
  53.          return byteArrayToHex(resultByteArray);  
  54.   
  55.    
  56.   
  57.       } catch (NoSuchAlgorithmException e) {  
  58.   
  59.          return null;  
  60.   
  61.       } finally {  
  62.   
  63.          try {  
  64.   
  65.             digestInputStream.close();  
  66.   
  67.          } catch (Exception e) {  
  68.   
  69.          }  
  70.   
  71.          try {  
  72.   
  73.             fileInputStream.close();  
  74.   
  75.          } catch (Exception e) {  
  76.   
  77.          }  
  78.   
  79.       }  
  80.   
  81.    }  


 

   上面的方法本人亲测过大小约4G的文件,得出的MD5值和网上下载的一个MD5小工具得到的MD5值一样,说明上面的方式没有什么问题。不过取大文件的MD5很慢,4G的文件跑一下要一分钟(I5处理器 6G内存 64位XP系统 本本)。

 

附1:我在网上还看到一种给文件MD5的方式

[java] view plain copy
  1. public static String getFileMD5String(File file) throws IOException{  
  2.  FileInputStream in = new FileInputStream(file);  
  3.  FileChannel ch =in.getChannel();  
  4.  MappedByteBuffer byteBuffer =ch.map(FileChannel.MapMode.READ_ONLY, 0,file.length());  
  5.  messagedigest.update(byteBuffer);  
  6.  return byteArrayToHex (messagedigest.digest());  
  7. }  

我也尝试过这样的方式,但是如果文件大于2G,那么这种方式会出现异常。所以不推荐。


附2:测试文件MD5的main方法

[java] view plain copy
  1. public static void main(String[] args) {  
  2.   
  3.   long startTime = System.currentTimeMillis();  
  4.   
  5.   try {  
  6.     System.out.println(fileMD5("E:/软件/VS2008ProEdition90DayTrialCHSX1435983.iso"));  
  7.   } catch (IOException e) {  
  8.     e.printStackTrace();  
  9.   }  
  10.   
  11.   long endTime = System.currentTimeMillis();  
  12.   
  13.   System.out.println((endTime - startTime)/1000);  
  14. }  



转自:http://blog.csdn.net/xiao__gui/article/details/8148203

你可能感兴趣的:(java)