浅谈IM软件客户端的断线重连、心跳和长在线

----------------------------------------------------欢迎查看IM软件业务知识《专栏》-------------------------------------------------------------------
使用状态机来保持在线状态 【点击】                      拼图算法,将零碎小图,整理到一张大图上【点击】
登录导航 【点击】                                                   会话session的概念【点击】       
“假在线’ 【点击】                                                    非对称加密,RSA算法【点击】
如何建立安全socket连接、登录 【点击】               浅谈断线重连、心跳和长在线 【点击】
iOS 客户端创建网络连接,常见错误汇总 【点击】 protocolBuf 在iOS上的使用入门、讲解、指南 【点击】
实现富文本解析【点击】                                          UITableview Deceleration 加速滑动(惯性滑动)、弹性回归原理【点击】
--------------------------------------------------------------------------------------------------------------------------------------------------------------------

概述

    本人也有个几年IM开发经验,对一些IM软件的一些特性有一些总结,跟过业务查看 IM软件业务知识 

    市面IM软件都有一个基础功能就是长在线(TCP长连接),即只要有网络就保持登录,然而,网络状态是无法预测的,所以IM软件经常会有”离线“状态,,尤其是手机客户端。保持IM处于长在线,则依赖断线重连来完成。

    通常来说,网络不稳定是造成不能长时间在线的主要原因,另外还有:服务器强制注销客户端、次客户端被主客户端踢。目前的qq和飞信都有断线重连机制。有时候IM软件自动完成登录,有时候需要用户手动登录。所以,断线重连是一个广泛的概念。可以这么理解:除了从APP登录界面进去的登录,其他都可以称之为断线重连(甚至,把APP杀死,重新启动也是断线重连的一种)

断线重连的定义

    使得IM软件能够长在线,或者短时间内掉线,最好可以做到用户无感知。

广义断线重连:用户已经成功登录IM客户端,用户将程序放到后台、或者手机重启,IM软件再次进入前台,软件可帮助用户实现自动登录。

狭义的断线重:客户端的网络状况是不可预知的,可能从2G切换到3G或者WiFi,或者又切换到2G,甚至“飞行模式”(iOS设备)。客户端要及时对网络的变化做出反应,即尝试进行登录。

【总之】断线重连,一般是网络原因引起的,目的是让IM软件维持在线的状态。

实现方法

        IM客户端始终尽可能的保持连接跟服务器的连接,客户端维护已登录状态,以便断线重连。从逻辑层次上来说,断线重连的逻辑是基于登录的逻辑的,首次登录成功后,都有可能有断线重连(以iOS平台为例)
断线重连,实质上分为两步:一、使客户端断线;二、让客户端重连服务器。一般来说这两步是一个有前后顺序,完整的过程。
一、使客户端断线,即让客户端处于“未连接”状态。以下情况将触发这个事件:
    1.网络切换,如从WiFi切换到4G,网络事件。
    2.网络连接失败、网络不可用。
    3.心跳失败、心跳超时,失败统称心跳失败。

    4.IM软件后台运行即将结束。

二、让客户端重连服务器,客户端根据以下几种情况实现重连服务器。
    1.iOS系统“网络可用”的通知
    2.IM软件切换到前台,用户触发事件。
    3.网络切换,如从WiFi切换到4G,网络事件。
    4.心跳失败的事件。
    5.客户端重新启动事件。

断线重连的场景可以总结为下面几个:

    1. 重新启动(自动登录)
属于广义的断线重连,需要提前加载用户缓存,保证用户到达主界面后能看到历史信息。
    2. 网络错误,网络切换
网络连接失败有很多种,不同的场景,客户端要使用不同的逻辑处理。
    3. 心跳失败
心跳超时,失败统称心跳失败。这个案例说明当前客户端——服务器连接已经损坏,或者当前用户身份有变化。心跳失败后首先将客户端离线,然后进行断线重连操作,避免心跳失败和网络错误事件一并发生,造成两次登录。
    4. 网络可达或者切换到前台

为了避免重复登录,当IM软件处于“登录成功”、“连接中”或者“已注销”的几个状态的时候,客户端忽略“网络可达或者切换到前台”的事件。

客户端心跳

        IM基本的底层逻辑中有“心跳”概念,即客户端定时向Server发一个信令包,表示客户端还“活”着。注意,是客户端发起的。心跳是一个拟人的比喻,跟人的心跳相似。那么心跳终止了会发生什么事情呢?分为两种情况:Server主动断开socket,客户端主动断开socket。
1. Server主动断开socket
Server只是接收客户端发起的心跳。假如,Server长时间没有收到客户端的心跳, Server认为客户端已经“死了”,主动断开这个连接。此时客户端可能就是假在线(点击打开原文)了。
2. 客户端断开socket
客户端对待心跳,要比Server麻烦一些。客户端要关注两个值:
● 心跳间隔值,即客户端多长时间发一次心跳?
● 心跳的超时时间。客户端发送一次心跳, 如果长时间得不到Server应答,代表网络糟糕。客户端需要断开socket,主动离线。
很明显,第二点就是客户端主动断开的情况,一般情况下,超时时间为60秒。


网上也有争论:到底是否需要心跳,微信是没有心跳的,qq和飞信有心跳。
也有专家说心跳包已经影响到移动网络,因为心跳是定时频繁发送。

心跳失败也会引起断线重连

下面是“心跳失败”引起的断线重连的流程图


浅谈IM软件客户端的断线重连、心跳和长在线_第1张图片

你可能感兴趣的:(IM业务知识,IM软件业务知识)