TCP的Socket编程,要做到质量稳定可靠效率高,对市场上90%的开发人员来说,是一项难度极高的工作。笔者有多年的socket开发经验,今天主要介绍socket编程中常见问题及注意事项:
(1) 对于可变包长,必须定义包头,并在包头中定义包的总长度
由于socket是字节流,就像流水一样,对于传输多个包的socket数据流来说,从中间无法得知一个包的起始位置,从中间位置观察数据包的特征也是一个不靠谱的做法。因此,只能从包的第一个字节起,一个一个计算每一个包的位置。
通常的做法是,对每一个传输的数据包,定义一个包头和包体。包头为固定长度,通常在其中定义版本号、包体的长度(或总包的长度)、以及包类型字段。包体通常是可变长度的内容。收到包的一方,解析socket数据流时,先解析固定长度的包头,从包头中得到整个包的长度,然后取得包体内容,紧接着取下一个包的包头和包体,如此循环下去,就能顺序收到每一个包。
(2) socket接收调用一次不保证收到一个完整数据包
调用socket的接收函数时,调用一次,可能会收到一个完整的对方发来的数据包,也可能只收到1/2个数据包,也可能1.5个数据包,也可能收到任何长度的包,或收到0个字节,这些情况都可能发生,这是正常情况,不是错误。当然,由于socket是全双工的字节流,你只可能收到一个一个字节,不可能收到半个字节,或2.5个字节。原因还是在于TCP是一个字节流,无头无尾,你只能根据socket收到的字节,自己来拼装成一个一个顺序的应用层的数据包。socket无法给你一个完整的数据包,只能给你一个一个收到的字节。
接收分为阻塞和非阻塞,默认是阻塞模式。在调用接收函数时,如果是阻塞模式,将造成程序阻塞在该函数中,长时间不响应,程序不能处理其他工作,造成用户体验差;如果是非阻塞模式,一次调用无论成功或是失败,函数立即返回,如果长时间无数据可接收,又会导致CPU为100%的问题。所以,这里一般都需要使用多线程处理,小心地处理各种正常和异常情况。
此外,网上一般都只有讨论阻塞的情况,对非阻塞的情况下的各种返回值,哪种是正常,哪种是阻塞,哪种是已经断开,资料非常少,需要自己的测试和验证去保证质量。
(3) 同理,socket发送调用一次也不保证整个包都发送出去
调用socket的发送函数时,调用一次,也不保证整个包发送完成。通常对于阻塞而已,只有发送完成或失败才返回;对于非阻塞类型,发送一部分就可能返回,因此,需要检查返回值,如果只发送了一部分,需要再次调用send函数,以便把剩下的数据包全部发送出去,才能发送下一个数据包。
与接收函数的调用类似,在调用发送函数时,如果是阻塞模式,将造成程序阻塞在该函数中,长时间不响应,程序不能处理其他工作,造成用户体验差;如果是非阻塞模式,一次调用无论成功或是失败,函数立即返回,如果长时间发送不出去,又会导致CPU为100%的问题。所以,这里一般也是需要使用多线程处理,小心地处理各种正常和异常的情况。
此外,网上一般都只有讨论阻塞的情况,对非阻塞的情况下的各种返回值,哪种是正常,哪种是阻塞,哪种是已经断开,资料非常少,需要自己的测试和验证去保证质量。
(4) socket收发可以同时进行
由于socket是全双工的字节流,全双工意味着接收的时候也可以同时发送,发送的时候也可以同时接收。因此,如果软件要求高性能,一般采用多线程处理,才能达到收和发同时进行的效果。
但是,需要注意,对于SSL而言,并不是全双工的,而是单工的,意味着SSL在发送的时候不能接收,接收的时候也不能发送。因此,SSL的效率,即使不考虑加密的影响,理论效率也只是普通socket的一半,如果考虑加密等因素,效率下降的就会更明显了。
(5) 大小字节序转换
世界上的电脑CPU分为大端法和小端法两种。通常网络传输时都采用大端对齐法。对于AIX等系统,是大端对齐;而Windows、Linux等系统则是小端对齐。对于超过一个字节的short、int、int64及相应的unsigned数据类型,都需要进行大小字节序的转换。操作系统本身提供了ntohs和ntohl对16位和32位字节的整形进行转换,但并没有提供64位的字节序转换函数,此外,也没有提供float和double类型的数据类型进行转换的函数,怎么办呢?可以参考我写的另外一篇文章《socket编程必备函数:字节序转换C++模板函数,一劳永逸地代替ntoh或hton等函数》,这篇文章中,使用一个C++模板函数对所有的数据类型的转换进行了统一,使用简单方便,一劳永逸。
总之,socket编程的难度还是非常高的,必须有相当多的积累才可能编出质量过硬的软件。如果大家觉得难度过大,或者时间精力不足以从头开始编码,建议使用第三方的socket封装库来实现,专业的事情留给专业的人来做,质量更有保证,比如waisock就是一个非常优秀的socket封装库,官网是http://waisock.szxunxun.com/ ,大家不妨试试。