(IM)即时通讯

WebSocket

WebSocket一种在单个TCP连接上进行全双工通讯的协议。

传统的网上为了实现推送技术,所用的技术都是轮询。轮询是在特定的时间间隔(如每1秒)由客户端对服务器发出HTTP请求,然后由服务器返回最新的数据给客户端。这种传统的模式带来很明显的缺点,即客户端需要不断的向服务器发出请求,然而HTTP请求可能包含较长的头部,其中真正有效的数据可能只是很小的一部分,显然这样会浪费很多的带宽等资源。

新技术Comet虽然可以实现双向通信,但依然需要反复发出请求。而且在Comet中,普遍采用的长链接,也会消耗服务器资源。

于是HTML5定义了WebSocket协议,能更好的节省服务器资源和带宽,并且能够更实时地进行通讯。

Websocket使用和 HTTP 相同的 TCP 端口,可以绕过大多数防火墙的限制。默认情况下,Websocket协议使用80端口;运行在TLS之上时,默认使用443端口。

WebSocket的出现,替代了HTTP的轮询,使得客户端和服务器的数据交互变得更加简单。允许服务端主动向客户端推送数据。在 WebSocket API 中,浏览器和服务器只需要完成一次握手,两者之间就直接可以创建持久性的连接,并进行双向数据传输。

WebSocket建立连接、传输数据与及关闭连接的模型如下:

WebSocket连接模型图

Websocket是应用层第七层上的一个应用层协议,它必须依赖 HTTP 协议进行一次握手 ,握手成功后,数据就直接从 TCP 通道传输,与 HTTP 无关了。
Websocket的数据传输是以 frame (帧) 形式传输的,比如会将一条消息分为几个 frame,按照先后顺序传输出去。这样做会有几个好处:

  • 1、大数据的传输可以分片传输,不用考虑到数据大小导致的长度标志位不足够的情况。
  • 2、和 HTTP 的chunk一样,可以边生成数据边传递消息,即提高传输效率。

Socket

Socket并不是一个协议,而是为了方便使用TCP或UDP而抽象出来的一层,是位于应用层和传输控制层之间的一组接口。

网络上的两个程序通过一个双向的通信连接实现数据的交换,这个连接的一端称为一个socket。

建立网络通信连接至少要一对端口号(socket)。socket本质是编程接口(API),对TCP/IP的封装,

Socket是应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口。

经典的TCP的三次握手流程如下:


TCP三次握手

在设计模式中,Socket其实就是一个门面模式,它把复杂的TCP/IP协议族隐藏在Socket接口后面,对用户来说,一组简单的接口就是全部,让Socket去组织数据,以符合指定的协议。

当两台主机通信时,必须通过Socket连接,Socket则利用TCP/IP协议建立TCP连接。
TCP连接则更依靠于底层的IP协议,IP协议的连接则依赖于链路层等更低层次。

使用socket进行TCP通信的流程如下:


TCP通信过程

WebSocket则是一个典型的应用层协议。

WebSocket 和 HTTP 都是基于TCP的应用层协议,都是可靠性传输协议。

WebSocket与HTTP的不同:

    1. 本来就是两种完全不同的协议。
    1. WebSocket 是全双工协议,可以双向发送或接受信息,连接建立之后,通信双方都可以在任何时刻向另一方发送数据。HTTP请求需要等待客户端发起请求服务端才能响应。
    1. 与 HTTP 不同的是,Websocket 需要先创建连接,这就使得其成为一种有状态的协议,之后通信时可以省略部分状态信息。而HTTP请求可能需要在每个请求都携带状态信息(如身份认证等)
    1. Websocket定义了二进制帧,相对HTTP,可以更轻松地处理二进制内容。
    1. HTTP 协议要不断的建立,关闭Request,由于HTTP是无状态协议,每一次发送都是一次新的开始,所以每次都要重新传输identity info (鉴别信息),来告诉服务端你是谁。Websocket 只需要一次HTTP握手,所以说整个通讯过程是建立在一次连接状态中,也就避免了HTTP的非状态性,服务端会一直知道你的信息,直到你关闭请求,这样就可以避免反复解析HTTP协议,还要查看identity info(鉴别信息)。

短连接:是指通讯双方有数据交互时,就建立一个TCP连接,数据发送完成后,则断开此连接,即每次连接只完成一项业务的发送。

长连接:指在一个TCP连接上可以连续发送多个数据包,在连接保持期间,如果没有数据包发送,需要TCP keep alive。

TCP keep alive 的两种方式:

  • 应用层面的心跳机制
    自定义心跳消息头 : 一般客户端主动发送, 服务器接收后进行回应(也可以不回应).
  • TCP协议自带的 keep alive:打开keep-alive功能即可. 具体属性也可以通过API设定.

TCP KeepAlive 是用于检测TCP连接的状态,而心跳机制有两个作用:一是检测TCP的状态,二是检测通讯双方的状体。


WebSocket的应用场景

  1. 社交聊天(如微信QQ,这一类社交聊天的App。)
  2. 弹幕
  3. 多玩家游戏
  4. 协同编辑
  5. 股票基金实时报价
  6. 体育实况更新
  7. 视屏会议/聊天
  8. 基于位置的应用
  9. 在线教育
  10. 智能家居

我们的即时通讯实现方案

我们项目的即时通讯功能,是使用的CocoaAsynSocket这个第三方开源框架实现的。这里有一篇介绍具体用法的文章。

我们定义的文件类型:

typedef enum
{
    WChatText      = 0x01,  //文本
    WChatVoice     = 0x02,  //语音, 没有文件id
    WChatVideo     = 0x03,  //视频
    WChatImage     = 0x04,  //图片
    WChatFile      = 0x05,  //文件
    WChatOperation = 0x07,
    WChatLocation  = 0x08,
    WChatProperty  = 0x09,  // to be deleted
    WChatHtml      = 0x10,
    WChatMixed     = 0x11,
    WChatAudio     = 0x12,  //音频文件消息 有文件id
    WChatSip       = 0x13,  //voip 单人电话
    WChatConference= 0x14,  //接受电话会议邀请
    WChatUnknown   = 0x0,   //未知操作
} WChatFileType;

文件类型就是一个文件标识,根据需求和服务端制定即可,此处仅供参考。

我们接收文本消息的方法定义如下:

/**
 *  @brief 接收文本消息回调
 *
 *  @param messageId  消息id
 *  @param fromUid    发消息人Uid
 *  @param toUid      收消息人Uid
 *  @param type       消息类型
 *  @param timevalue  消息时间
 *  @param content    消息内容
 *  @param extContent 消息扩展内容
 */
- (void)onRecvMessageId:(NSString *)messageId fromUid:(NSString *)fromUid toUid:(NSString *)toUid filetype:(WChatFileType)type time:(NSInteger)timevalue content:(NSData *)content extBody:(NSData *)extContent;

对于聊天室,我们实现了如下方法:

//进入聊天室
- (void)enterChatRoom;

//离开聊天室
- (void)exitChatRoom;

//获取聊天室聊天历史
- (void)getChatRoomHistory;

//发送普通群组消息
- (BOOL)sendGroupText:(NSString *)text messageType:(BKChatMessageType )type isAnonymous:(BOOL)anonymous;

//发送@消息
- (BOOL)sendMixedText:(NSString *)text atUserList:(NSArray  *)atUserList;

//禁言某成员 游云的uid
- (void)forbidUserWithUserId:(NSString *)uid;

//发送语音
- (BOOL)sendVoiceWithAMRFilePath:(NSString *)filePath voiceDuration:(NSNumber *)voiceDuration;

//删除用户消息
- (void)deleteUserMessageWithMessage:(BKChatMessage *)message;

//发言黑名单
- (void)disableUserSendMessageWithUid:(NSString *)uid;

聊天室的功能仅供参考,根据具体的业务需求而对应的添加和减少。

普通消息的发送只要根据对应的消息格式封包,进行NSUTF8StringEncoding编码发出即可。而对于语音这种大文件数据,则要进行分片传输,传完以后对数据还要进行格式转换(AMR->WAV),编码才可发出,相应的对于接收到的数据,我们也要进行对应的解码才可以播放。

数据传输的时候,我们使用protobuf对数据进行序列化。传到后台以后,后台同样使用protobuf处理。

protobuf 即 google protocol buffer 是一种数据封装格式协议;
比起其他经常用的xml,json等格式;protobuf的优势是效率高,同样的一份数据使用protobuf存储的时候更小,更加方便。

总结一下就是:体积小、跨平台、省流量
关于protobuf的安装使用,网上有很多资料,这里提供一个参考链接。

即时通讯的其他实现方式:XMPP,环信,融云
环信融云是第三方SDK。
XMPP基于XML的点对点的即时通讯协议,通过CoreData管理数据XMPP(XML,Messages,Presence,Protocol)是基于可扩展标记语言(XML)的协议。

参考:有关(IM)即时通讯的基本概念
TCP通信流程图来源

你可能感兴趣的:((IM)即时通讯)