短链的基本工作原理描述与实现方案

短链是什么

短链就是普通的长链(普通URL网址)经过一定的处理得到的一个简短且唯一的网址字符串。

 

短链跳转的基本原理

客户端访问短链网址服务器,短链网址服务器返回对应长链地址和302响应码,客户端收到响应后重定向访问长链地址服务器。以腾讯云的短链为例,访问短链:https://url.cn/5y3z8VK

短链的基本工作原理描述与实现方案_第1张图片

短链的基本工作原理描述与实现方案_第2张图片

可以很清晰的看到整个短链跳转的过程。

这里说一下301响应码和302响应码:

301代表永久重定向,也就是第一次重定向以后就会从浏览器缓存中获取重定向地址,下次直接访问;

302代表临时重定向,客户端每次都会重新请求后端获取重定向地址。

 

短链实现的步骤

了解短链跳转的基本原理以后,实现短链就很简单了。

  1. 部署一个短链域名解析服务(也可以是系统中的一个模块)用来生成短链并存储短链和长链的映射关系
  2. 客户端请求短链域名解析服务,服务拿到短链后取出对应的长链返回给客户端即可
  3. 客户端拿到长链后进行重定向访问

 

使用哈希算法生成短链

        短链格式:固定短链域名+哈希值(在https://url.cn/5y3z8VK中,url.cn就是短链域名,5y3z8VK就是哈希值)

        固定短链域名就是我们部署的短链域名解析服务的请求地址,哈希值就是请求参数,也就是长链经过某种hash运算之后算出来的一个唯一的hash字符串,短链域名解析服务拿到这个哈希值找到对应的长链返回。

        我们在对长链做hash运算的时候,因为它仅仅只一个网址而已,所以不用关心反向解密的难度,不需要使用MD5等加密算法,关注点应该放在哈希的运算速率和哈希冲突概率(两个不同的链接算出的hash值如果一样就需要一些其他额外的处理手段),这里哈希算法的的选择可以自己调研一下然后进行选择。

        拿Google的MurmurHash算法举例,MurmurHash算法的说明:http://en.wikipedia.nym.tw/wiki/MurmurHash#cite_note-4

        MurmurHash算法当前的最新版本是MurmurHash3,提供了32bit和128bit两种长度的hash值。MurmurHash运算出来hash值是无符号的十进制数,为了进一步缩短哈希值的长度,可以将MurmurHash运算出来的结果转为62进制(数字 + 小写字母 + 大写字母)。

         解决哈希冲突:如果使用MySQL存储长链和短链的映射关系,可以给短链加上唯一索引,将长链和由长链生成的短链插入到数据库中时,如果失败,就说明短链已经存在,hash冲突了,此时可以在长链地址末尾加上一个预先定义好的字符串,再次算出短链,如果还是冲突就继续拼接再次运算直到不冲突为止,取出长链的时候再把末尾拼接的字符串去掉即可。

 

其他方法生成短链

  • 使用snowflake算法,然后再转为62进制
  • 使用MySQL全局数据库自增主键,然后再转为62进制(存在单机瓶颈问题)
  • 使用MySQL相同步长自增主键方案
  • 使用UUID
  • 使用redis做全局自增(redis宕机自增数据丢失)
  • 其他自定义算法

 

为什么要使用短链

  • 短链更短,在一些对内容长度有限制的平台上发文的时候,可编辑的文字就多了
  • 链接太长在某些平台上会出现识别不完整或者无法识别为超链接的问题
  • 短信中的长链接可能会导致短信被拆分发送,用短链可以降低成本
  • 短链生成的二维码相对松散,更加容易识别

 

 

你可能感兴趣的:(设计,java)