概述
本人也有个几年IM开发经验,对一些IM软件的一些特性有一些总结,跟过业务查看 IM软件业务知识
市面IM软件都有一个基础功能就是长在线(TCP长连接),即只要有网络就保持登录,然而,网络状态是无法预测的,所以IM软件经常会有”离线“状态,,尤其是手机客户端。保持IM处于长在线,则依赖断线重连来完成。
通常来说,网络不稳定是造成不能长时间在线的主要原因,另外还有:服务器强制注销客户端、次客户端被主客户端踢。目前的qq和飞信都有断线重连机制。有时候IM软件自动完成登录,有时候需要用户手动登录。所以,断线重连是一个广泛的概念。可以这么理解:除了从APP登录界面进去的登录,其他都可以称之为断线重连(甚至,把APP杀死,重新启动也是断线重连的一种)
断线重连的定义
使得IM软件能够长在线,或者短时间内掉线,最好可以做到用户无感知。
广义断线重连:用户已经成功登录IM客户端,用户将程序放到后台、或者手机重启,IM软件再次进入前台,软件可帮助用户实现自动登录。
狭义的断线重:客户端的网络状况是不可预知的,可能从2G切换到3G或者WiFi,或者又切换到2G,甚至“飞行模式”(iOS设备)。客户端要及时对网络的变化做出反应,即尝试进行登录。
【总之】断线重连,一般是网络原因引起的,目的是让IM软件维持在线的状态。
实现方法
IM客户端始终尽可能的保持连接跟服务器的连接,客户端维护已登录状态,以便断线重连。从逻辑层次上来说,断线重连的逻辑是基于登录的逻辑的,首次登录成功后,都有可能有断线重连(以iOS平台为例)
断线重连,实质上分为两步:一、使客户端断线;二、让客户端重连服务器。一般来说这两步是一个有前后顺序,完整的过程。
一、使客户端断线,即让客户端处于“未连接”状态。以下情况将触发这个事件:
1.网络切换,如从WiFi切换到4G,网络事件。
2.网络连接失败、网络不可用。
3.心跳失败、心跳超时,失败统称心跳失败。
4.IM软件后台运行即将结束。
二、让客户端重连服务器,客户端根据以下几种情况实现重连服务器。
1.iOS系统“网络可用”的通知
2.IM软件切换到前台,用户触发事件。
3.网络切换,如从WiFi切换到4G,网络事件。
4.心跳失败的事件。
5.客户端重新启动事件。
断线重连的场景可以总结为下面几个:
1.
重新启动(自动登录)
属于广义的断线重连,需要提前加载用户缓存,保证用户到达主界面后能看到历史信息。
2.
网络错误,网络切换
网络连接失败有很多种,不同的场景,客户端要使用不同的逻辑处理。
3.
心跳失败
心跳超时,失败统称心跳失败。这个案例说明当前客户端——服务器连接已经损坏,或者当前用户身份有变化。心跳失败后首先将客户端离线,然后进行断线重连操作,避免心跳失败和网络错误事件一并发生,造成两次登录。
4.
网络可达或者切换到前台
为了避免重复登录,当IM软件处于“登录成功”、“连接中”或者“已注销”的几个状态的时候,客户端忽略“网络可达或者切换到前台”的事件。
客户端心跳
IM基本的底层逻辑中有“心跳”概念,即客户端定时向Server发一个信令包,表示客户端还“活”着。注意,是客户端发起的。心跳是一个拟人的比喻,跟人的心跳相似。那么心跳终止了会发生什么事情呢?分为两种情况:Server主动断开socket,客户端主动断开socket。
1. Server主动断开socket
Server只是接收客户端发起的心跳。假如,Server长时间没有收到客户端的心跳,
Server认为客户端已经“死了”,主动断开这个连接。此时客户端可能就是假在线(点击打开原文)了。
2. 客户端断开socket
客户端对待心跳,要比Server麻烦一些。客户端要关注两个值:
● 心跳间隔值,即客户端多长时间发一次心跳?
● 心跳的超时时间。客户端发送一次心跳,
如果长时间得不到Server应答,代表网络糟糕。客户端需要断开socket,主动离线。
很明显,第二点就是客户端主动断开的情况,一般情况下,超时时间为60秒。
网上也有争论:到底是否需要心跳,微信是没有心跳的,qq和飞信有心跳。
也有专家说心跳包已经影响到移动网络,因为心跳是定时频繁发送。
心跳失败也会引起断线重连
下面是“心跳失败”引起的断线重连的流程图