微博短链接的生成算法(Java版本)

 

最近看到微博的短链接真是很火啊,新浪、腾讯、搜狐等微博网站都加入了短链接的功能。之所以要是使用短链接,主要是因为微博只允许发140 字,如果链接地址太长的话,那么发送的字数将大大减少。短链接的主要职责就是把原始链接很长的地址压缩成只有6 个字母的短链接地址,当我们点击这6 个字母的链接后,我们又可以跳转到原始链接地址。

开始以为短链接是按照某种算法把原始链接压缩为短链接,再根据算法从短链接反算成原始链接的。后来尝试了下压缩算法(gzip 压缩算法),发现对于url 这种字符串越是压缩,长度就越长。通过对压缩算法的一些了解,发现靠压缩算法来实现这个功能不太靠谱。

后来在网上找到一个生成算法,该算法主要使用MD5 算法对原始链接进行加密(这里使用的MD5 加密后的字符串长度为32 位),然后对加密后的字符串进行处理以得到短链接的地址。原始的算法是C# 版本的,这里我把该算法修改成Java 版本的. 算法的具体代码如下,代码中有注释:

一、  代码

package com.csdn.shorturl;

public class ShortUrlGenerator {


    /**

      * @param args

      */

    public static void main(String[] args) {

 

       String sLongUrl = "http://474515923.qzone.qq.com" ; //长链接

       String[] aResult = shortUrl (sLongUrl);

       // 打印出结果

       for ( int i = 0; i < aResult. length ; i++) {

           System. out .println( "[" + i + "]:::" + aResult[i]);

       }

    }

 

    public static String[] shortUrl(String url) {

       // 可以自定义生成 MD5 加密字符传前的混合 KEY

       String key = "mengdelong" ;

       // 要使用生成 URL 的字符

       String[] chars = new String[] { "a" , "b" , "c" , "d" , "e" , "f" , "g" , "h" ,

              "i" , "j" , "k" , "l" , "m" , "n" , "o" , "p" , "q" , "r" , "s" , "t" ,

              "u" , "v" , "w" , "x" , "y" , "z" , "0" , "1" , "2" , "3" , "4" , "5" ,

              "6" , "7" , "8" , "9" , "A" , "B" , "C" , "D" , "E" , "F" , "G" , "H" ,

              "I" , "J" , "K" , "L" , "M" , "N" , "O" , "P" , "Q" , "R" , "S" , "T" ,

              "U" , "V" , "W" , "X" , "Y" , "Z"

 

       };

       // 对传入网址进行 MD5 加密

       String sMD5EncryptResult = ( new CMyEncrypt()).md5(key + url);

       String hex = sMD5EncryptResult;

 

       String[] resUrl = new String[4];

       for ( int i = 0; i < 4; i++) {

 

           // 把加密字符按照 8 位一组 16 进制与 0x3FFFFFFF 进行位与运算

           String sTempSubString = hex.substring(i * 8, i * 8 + 8);

 

           // 这里需要使用 long 型来转换,因为 Inteper .parseInt() 只能处理 31 位 , 首位为符号位 , 如果不用 long ,则会越界

           long lHexLong = 0x3FFFFFFF & Long.parseLong (sTempSubString, 16);

           String outChars = "" ;

           for ( int j = 0; j < 6; j++) {

              // 把得到的值与 0x0000003D 进行位与运算,取得字符数组 chars 索引

              long index = 0x0000003D & lHexLong;

              // 把取得的字符相加

              outChars += chars[( int ) index];

              // 每次循环按位右移 5 位

              lHexLong = lHexLong >> 5;

           }

           // 把字符串存入对应索引的输出数组

           resUrl[i] = outChars;

       }

       return resUrl;

    }

}

 

 

 

 

CMyEncrypt.java类 
public class CMyEncrypt { 
//十六进制下数字到字符的映射数组 
private final static String[] hexDigits = {"0","1","2","3","4","5","6","7","8","9","A","B","C","D","E","F"}; 
/**把inputString加密*/ 
    public static String md5(String inputStr){ 
        return encodeByMD5(inputStr); 
    } 
    /** 
     * 验证输入的密码是否正确 
     * @param password 真正的密码(加密后的真密码) 
     * @param inputString 输入的字符串 
     * @return 验证结果,boolean类型 
     */ 
     public static boolean authenticatePassword(String password,String inputString){ 
         if(password.equals(encodeByMD5(inputString))){ 
             return true; 
         }else{ 
             return false; 
         } 
     } 
     /**对字符串进行MD5编码*/ 
     private static String encodeByMD5(String originString){ 
         if (originString!=null) { 
             try { 
                 //创建具有指定算法名称的信息摘要 
                 MessageDigest md5 = MessageDigest.getInstance("MD5"); 
                 //使用指定的字节数组对摘要进行最后更新,然后完成摘要计算 
                 byte[] results = md5.digest(originString.getBytes()); 
                 //将得到的字节数组变成字符串返回  
                 String result = byteArrayToHexString(results); 
                 return result; 
             } catch (Exception e) { 
                 e.printStackTrace(); 
             } 
         } 
         return null; 
     } 
     /** 
      * 轮换字节数组为十六进制字符串 
      * @param b 字节数组 
      * @return 十六进制字符串 
      */ 
      private static String byteArrayToHexString(byte[] b){ 
          StringBuffer resultSb = new StringBuffer(); 
          for(int i=0;i<b.length;i++){ 
              resultSb.append(byteToHexString(b[i])); 
          } 
          return resultSb.toString(); 
      } 
      //将一个字节转化成十六进制形式的字符串 
      private static String byteToHexString(byte b){ 
          int n = b; 
          if(n<0) 
          n=256+n; 
          int d1 = n/16; 
          int d2 = n%16; 
          return hexDigits[d1] + hexDigits[d2]; 
      } 
      public static void main(String[] args) { 
CMyEncrypt.md5("http://tech.sina.com.cn/i/2011-03-23/11285321288.shtml"); 

二、  输出结果

执行上面代码的结果如下,会产生4 组6 位字符串,任意一组都可以作为当前字符串的短链接地址。

[0]:::NJzyAz

[1]:::fANjqy

[2]:::qmYNBf

[3]:::jqM7Nn

 

 

三、  跳转原理

当我们生成短链接之后,只需要在表中(数据库或者NoSql )存储原始链接与短链接的映射关系即可。当我们访问短链接时,只需要从映射关系中找到原始链接,即可跳转到原始链接。

你可能感兴趣的:(java,MD5,短链接)