对于基于TCP开发的通讯程序,有个很重要的问题需要解决,就是封包和拆包.
一.为什么基于TCP的通讯程序需要进行封包和拆包.
TCP是个"流"协议,所谓流,就是没有界限的一串数据.大家可以想想河里的流水,是连成一片的,其间是没有分界线的.但一般通讯程序开发是需要定义一个个相互独立的数据包的,比如用于登陆的数据包,用于注销的数据包.由于TCP"流"的特性以及网络状况,在进行数据传输时会出现以下几种情况.
假设我们连续调用两次send分别发送两段数据data1和data2,在接收端有以下几种接收情况(当然不止这几种情况,这里只列出了有代表性的情况).
A.先接收到data1,然后接收到data2.
B.先接收到data1的部分数据,然后接收到data1余下的部分以及data2的全部.
C.先接收到了data1的全部数据和data2的部分数据,然后接收到了data2的余下的数据.
D.一次性接收到了data1和data2的全部数据.
对于A这种情况正是我们需要的,不再做讨论.对于B,C,D的情况就是大家经常说的"粘包",就需要我们把接收到的数据进行拆包,拆成一个个独立的数据包.为了拆包就必须在发送端进行封包.
另:对于UDP来说就不存在拆包的问题,因为UDP是个"数据包"协议,也就是两段数据间是有界限的,在接收端要么接收不到数据要么就是接收一个完整的一段数据,不会少接收也不会多接收.
二.为什么会出现B.C.D的情况.
"粘包"可发生在发送端也可发生在接收端.
1.由Nagle算法造成的发送端的粘包:Nagle算法是一种改善网络传输效率的算法.简单的说,当我们提交一段数据给TCP发送时,TCP并不立刻发送此段数据,而是等待一小段时间,看看在等待期间是否还有要发送的数据,若有则会一次把这两段数据发送出去.这是对Nagle算法一个简单的解释,详细的请看相关书籍.象C和D的情况就有可能是Nagle算法造成的.
2.接收端接收不及时造成的接收端粘包:TCP会把接收到的数据存在自己的缓冲区中,然后通知应用层取数据.当应用层由于某些原因不能及时的把TCP的数据取出来,就会造成TCP缓冲区中存放了几段数据.
三.怎样封包和拆包.
封包:
封包就是给一段数据加上包头,这样一来数据包就分为包头和包体两部分内容了(以后讲过滤非法包时封包会加入"包尾"内容).包头其实上是个大小固定的结构体,其中有个结构体成员变量表示包体的长度,这是个很重要的变量,其他的结构体成员可根据需要自己定义.根据包头长度固定以及包头中含有包体长度的变量就能正确的拆分出一个完整的数据包.
相当于:对逻辑业务包进行两次接收,首先接收自己定义的一个逻辑包头,般知道本次需要处理的逻辑业务包有多长了,接着便接收包体。对于非阻塞接收,要是一次接收没有完成,可以将接收的数据保存在一个缓冲区内,等待下一次接包,当接收完成整个逻辑业务包后就进行处理。注意:TCP是采用的流式数据发送,所以一个业务包和另外一个业务包是依次到达(按照你发包的顺序),不会出现第一个业务包内嵌套另外一个业务包的内容(除非你在发送方故意发送),所以请放心接包。
动态缓冲区暂存拆包方式:
之所以说缓冲区是动态的是因为当需要缓冲的数据长度超出缓冲区的长度时会增大缓冲区长度.
大概过程描述如下:
A,为每一个连接动态分配一个缓冲区,同时把此缓冲区和SOCKET关联,常用的是通过结构体关联.
B,当接收到数据时首先把此段数据存放在缓冲区中.
C,判断缓存区中的数据长度是否够一个包头的长度,如不够,则不进行拆包操作.
D,根据包头数据解析出里面代表包体长度的变量.
E,判断缓存区中除包头外的数据长度是否够一个包体的长度,如不够,则不进行拆包操作.
F,取出整个数据包.这里的"取"的意思是不光从缓冲区中拷贝出数据包,而且要把此数据包从缓存区中删除掉.删除的办法就是把此包后面的数据移动到缓冲区的起始地址.
这种方法有两个缺点.1.为每个连接动态分配一个缓冲区增大了内存的使用.2.有三个地方需要拷贝数据,一个地方是把数据存放在缓冲区,一个地方是把完整的数据包从缓冲区取出来,一个地方是把数据包从缓冲区中删除.这种拆包的改进方法会解决和完善部分缺点.
下面给出相关代码.
先看包头结构定义
- #pragma pack(push,1) //开始定义数据包, 采用字节对齐方式
-
- typedef struct tagPACKAGEHEAD
- {
- BYTE Version;
- WORD Command;
- WORD nDataLen;
- }PACKAGE_HEAD;
- #pragma pack(pop) //结束定义数据包, 恢复原来对齐方式
然后看存放数据和"取"数据函数.
-
-
-
-
-
-
- BOOL CDataBufferPool::AddBuff( char *pBuff, int nLen )
- {
- m_cs.Lock();
- if ( nLen < 0 )
- {
- m_cs.Unlock();
- return FALSE;
- }
- if ( nLen <= GetFreeSize() )
- {
- memcpy(m_pBuff + m_nOffset, pBuff, nLen);
- m_nOffset += nLen;
- }
- else
- {
- char *p = m_pBuff;
- m_nSize += nLen*2;
- m_pBuff = new char[m_nSize];
- memcpy(m_pBuff,p,m_nOffset);
- delete []p;
- memcpy(m_pBuff + m_nOffset, pBuff, nLen);
- m_nOffset += nLen;
- m_cs.Unlock();
- return FALSE;
- }
- m_cs.Unlock();
- return TRUE;
- }
- /*****************************************************************************
-
-
-
-
-
- int CDataBufferPool::GetFullPacket( char *Buf, int& nLen )
- {
- m_cs.Lock();
- if ( m_nOffset < m_PacketHeadLen )
- {
- m_cs.Unlock();
- return 1;
- }
- PACKAGE_HEAD *p = (PACKAGE_HEAD *)m_pBuff;
- if( (m_nOffset-m_PacketHeadLen) < (int)p->nDataLen )
- {
- m_cs.Unlock();
- return 2;
- }
-
-
-
-
-
-
-
-
- nLen = m_PacketHeadLen+p->nDataLen;
- memcpy( Buf, m_pBuff, nLen );
- m_nOffset -= nLen;
- memcpy( m_pBuff, m_pBuff+nLen, m_nOffset );
- m_cs.Unlock();
- return 0;
- }
前面提到过这种方法的缺点.下面给出一个改进办法, 即采用环形缓冲.但是这种改进方法还是不能解决第一个缺点以及第一个数据拷贝,只能解决第三个地方的数据拷贝(这个地方是拷贝数据最多的地方).第2种拆包方式会解决这两个问题.
环形缓冲实现方案是定义两个指针,分别指向有效数据的头和尾.在存放数据和删除数据时只是进行头尾指针的移动.
用代码来说明.注:下面的代码是采用一个开源的游戏服务器的代码,我对此代码有所修改.
- int CCircularBufferPool::PutData(TCHAR *pData, int len)
- {
- if( len <= 0 )
- return 1;
- EnterCriticalSection(&m_cs);
- while (IsOverFlowCondition(len))
- {
- BufferResize(len);
- }
- if (IsIndexOverFlow(len))
- {
- int FirstCopyLen = m_iBufSize-m_iTailPos;
- int SecondCopyLen = len - FirstCopyLen;
- CopyMemory(m_pBuffer+m_iTailPos, pData, FirstCopyLen);
- if (SecondCopyLen)
- {
- CopyMemory(m_pBuffer, pData+FirstCopyLen, SecondCopyLen);
- m_iTailPos = SecondCopyLen;
- }
- else
- m_iTailPos = 0;
- }
- else
- {
- CopyMemory(m_pBuffer+m_iTailPos, pData, len);
- m_iTailPos += len;
- }
- LeaveCriticalSection(&m_cs);
- return 0;
- }
- void CCircularBufferPool::GetData(TCHAR *pData, int len, bool Delete)
- {
- if (len < m_iBufSize-m_iHeadPos)
- {
- CopyMemory(pData, m_pBuffer+m_iHeadPos, len);
- if(Delete==true)
- m_iHeadPos += len;
- }
- else
- {
- int fc, sc;
- fc = m_iBufSize-m_iHeadPos;
- sc = len - fc;
- CopyMemory(pData, m_pBuffer+m_iHeadPos, fc);
- if (sc) CopyMemory(pData+fc, m_pBuffer, sc);
- if(Delete==true)
- m_iHeadPos = sc;
- if(m_iHeadPos >= m_iBufSize)
- m_iHeadPos = 0;
- }
- }
-
-
-
- int CCircularBufferPool::GetFullPacket( TCHAR *Buf, int &nLen )
- {
- EnterCriticalSection(&m_cs);
- if( GetValidCount() < m_PacketHeadLen )
- {
- LeaveCriticalSection(&m_cs);
- return 1;
- }
- GetData(Buf,m_PacketHeadLen,false);
- PACKAGE_HEAD *p = (PACKAGE_HEAD *)Buf;
- if( (GetValidCount()-m_PacketHeadLen) < (int)p->nDataLen )
- 区不够一个包体的数据
- {
- LeaveCriticalSection(&m_cs);
- return 2;
- }
-
- int IsIntegrallity = ValidatePackIntegrality(p);
- if( IsIntegrallity != 0 )
- {
- LeaveCriticalSection(&m_cs);
- return IsIntegrallity;
- }
- GetData(Buf,m_PacketHeadLen+p->nDataLen,true);
- nLen = m_PacketHeadLen+p->nDataLen;
- LeaveCriticalSection(&m_cs);
- return 0;
- }