最近接触了IOCP服务器的编写,对IOCP有了自己的一些认识,希望能对希望正在使用IOCP 的有些建议。我对IOCP了解不多,只是用到了,所以看了一下,还没怎么熟悉。
IOCP的一大优势是高并发率,同时连接1万个用户,CPU的使用率也不会很高,只是内存稍微增大一些了。而且对CPU的利用率很好,线程的量被固定了,所以线程可以更好的处理事情。
- CompletionPort = CreateIoCompletionPort(INVALID_HANDLE_VALUE, NULL, 0, 0);
- for(i=0;i
- CreateThread(NULL, 0, WorkerThread, CompletionPort, 0, &dwThreadId);
- }
- sListen = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);
- sClient = accept(sListen, (struct sockaddr *)&client, &iaddrSize);
-
- CreateIoCompletionPort((HANDLE)sClient, CompletionPort, (DWORD)sClient, 0);
-
- lpPerIOData = (LPPER_IO_OPERATION_DATA)HeapAlloc(GetProcessHeap(),HEAP_ZERO_MEMORY,sizeof(PER_IO_OPERATION_DATA));
- lpPerIOData->Buffer.len = MAX_PACKBUFFER_SIZE;
- lpPerIOData->Buffer.buf = lpPerIOData->szMessage;
- lpPerIOData->OperationType = RECV_POSTED;
- WSARecv(sClient,&lpPerIOData->Buffer,1,&lpPerIOData->NumberOfBytesRecvd,&lpPerIOData->Flags, &lpPerIOData->overlap,NULL);
//接收数据
- static DWORD WINAPI server::WorkerThread(LPVOID CompletionPortID)
- {
- HANDLE CompletionPort=(HANDLE)CompletionPortID;
- DWORD dwBytesTransferred;
- SOCKET sClient;
- LPPER_IO_OPERATION_DATA lpPerIOData = NULL;
- while (TRUE)
- {
-
- GetQueuedCompletionStatus(CompletionPort,&dwBytesTransferred,(PULONG_PTR)&sClient,(LPOVERLAPPED *)&lpPerIOData,INFINITE);
- if (dwBytesTransferred == 0xFFFFFFFF)
- {
- return 0;
- }
-
- if (lpPerIOData->OperationType == RECV_POSTED)
- {
-
-
- if (dwBytesTransferred == 0)
- {
-
-
- }
- else
- {
-
-
- LPNET_PACK pack;
- pack=(LPNET_PACK)lpPerIOData->szMessage;
-
-
-
- memset(lpPerIOData, 0, sizeof(PER_IO_OPERATION_DATA));
- lpPerIOData->Buffer.len = MAX_PACKBUFFER_SIZE;
- lpPerIOData->Buffer.buf = lpPerIOData->szMessage;
- lpPerIOData->OperationType = RECV_POSTED;
-
- WSARecv(sClient,&lpPerIOData->Buffer,1,&lpPerIOData->NumberOfBytesRecvd,&lpPerIOData->Flags,&lpPerIOData->overlap,NULL);
- }
- }
- }
- return 0;
- }
1、静态函数问题,这一块是我个人的认识。因为线程的创建,线程函数是静态的,这样导致所有你处理的数据必须都是静态的,因为静态函数是在编译的时候就初始化了,所以无法处理一些类的非静态函数。这里可以综合考虑多种方式进行处理,动态链表,动态指针,动态存储区,这些需要new,动态申请空间的语句。还可以通过map,list这类可以动态增长的类型。
2、数据包的顺序问题。这个很重要,算是IOCP的一个缺点吧。因为多个线程从完成端口中取数据处理,难免有些线程处理过慢,过快,然后导致包的顺序处理错位,这对于服务器负责转发的时候是一个致命的问题。比如我的服务器负责客户端之间的转发数据,比如聊天数据,这时候,如果包的转发顺序错乱,则会使数据接收有问题。转发文件更称问题。我的解决方案是,服务器设置一个缓冲区,接收整个文件,接收完成后,将数据进行发出去。还有一种方法,不过会降低效率,控制数据发送的速度,比如100毫秒发送一个包,这样可以强制服务器顺序接收,不过服务器的性能如果很不好的话,这个方法还是不行。所以还是缓冲区好一些。
3、粘包的问题。所谓的粘包,我个人理解是,不同的系统在做相关的TCP发送操作的时候,会根据Nagle算法将数据包进行合并操作,所以那个时候自己做的相关操作包就会被封装在一起,这往往是我们不想看到的。这个解决方法很简单,将socket的类型进行设置一下就可以,将socket的类型设置为禁用nagle算法,即设置TCP_NODELAY这个。这个也可以解决2的问题,不需要100毫秒进行发送了。具体解释在http://blog.csdn.net/wangqing008/article/details/17403353
4、继续IOCP中的粘包和断包处理。对于第三点,其实我当时理解不多,或者说理解不够深入。其实禁用掉Nagle算法会有些改观,但是因为禁用掉Nagle算法后,程序运行比之前好很多,我以为已经解决了问题。但是还是自己考虑不周全。如果在公网上测试,特别是一些3G的网络测试,便会发现,粘包断包的问题很严重,具体原因在
http://blog.csdn.net/wangqing008/article/details/17403353后半部分。
我这里贴上解决办法,我这里的解决办法,是我自己想到的,但是我觉得并不是特别好,希望有更好的解决方案的朋友指点一下啊,因为搜了一些这种文章,最后没给自己的应用有多大帮助,最后还是按自己的想法做了。
我自己的想法是这样的,定义一个包头,包头 = 标示符+校验位+包长度,最关键的就这几个信息。在对数据进行粘包处理的时候比较简单,直接按包的结构取数据就好了。有一个比较棘手的是断包(因为TCP是流式协议),所以,最重要的是还如何处理断包,以发送“&&&&abcdefg”为一个包为例,其中“&&&&”为包头。
出现的几种情况这里简单说一下
(1)、断包分为两部分,一部分包括包头,另一部分包括数据部分。比如“&&&&abc”+“defg”,这种是最常见的,比较好解决,首先对包头进行检测,发现该断包的时候,将该断包存储到缓冲区内,作为备份。然后遇到下一个非完整数据(这里可以认为是包尾)与缓冲区内的数据进行拼包,然后对拼起来的包进行CRC校验,因为之前包头内有校验位,所以这里很好解决。这里就可以判断出一个包是否可以拼接起来。
(2)、断包分为两部分,一部分包括包头的一部分,另一部分包括“包头另一份+数据部分”,比如,“&&”+“&&abcdefg”,这种情况下,则直接将包丢弃了,因为无法对包头进行解析,将收到“&&”时直接将该断头包丢弃,然后接下来收到&&abcdefg的时候,与缓冲区内的数据进行拼包,发现拼接不了,这个时候,则是对接受到的缓冲区根据标示符查找下一个包数据,其实这里的意思则是把&&abcdefg丢弃掉。
(3)、断包分为三部分(或者四部分等等),分为三部分的这种情况对我来说,目前都是无法解决的。因为不论怎样,中间都会存在一个断头断尾包,这个是最令人讨厌的,无法完成拼包。按照2的逻辑需要丢弃。
其实我这里和TCP的处理方式差不多,不过TCP做的更好,因为TCP至少保证了不会出现丢包(这个是一个假设,当然他是可能丢包的,那个时候估计TCP的连接也会断开),但是TCP可以保证流的顺序到达,所以他的数据是顺序的。对于服务器来说,为什么要处理断包是因为,服务器是一个多线程的。对IOCP尤其如此,因为每个线程都去取数据,虽然数据到达顺序一定,但是线程处理速度不一定,导致TCP堆栈内的数据进入应用层的时间不一样。这个可以去了解IOCP的流程,我记得有一个讲的非常通俗易懂,有时间转载过来。
还有一种处理方式,我大致说一下解决方案,另外一个是对包的定义变化,额外定义了一个包尾,也就是数据包 = “包头”+“数据”+“包尾”,然后这种方式的话,有一点好处就是拼包的时候会更快,包头和包尾有相关联的信息,比如sequence是一致的,则可以直接去匹配,而不用我上面的说的方式去计算校验值。但是这种方法最终也是要计算校验值的。我个人觉得第一张方案比较好,因为有了包尾的限制,其实对数据的处理往往复杂多变,包尾的标识符,可能也会因为数据中存在相同的数据存在而被误认为是包尾。
这两种方案目前自己都实现了,因为第二种是导师提出的,但是我个人还是倾向第一种,最终还是用了第二种,原因惟“导师”2字。
下面贴出来大致流程,我把代码简化了,可能用不了了。存储断头包的时候,我用的map和list来实现的。对于第二种有包尾的方案,我用的是双层map来实现的。
-
- LPNET_PACK pack;
- pack=(LPNET_PACK)lpPerIOData->szMessage;
-
- int nlen=0;
-
- if(pack->m_nSeque == PACK_SEQUE){
- if(!pack->VerifyCRC()){
-
-
-
- if(dwBytesTransferred>=pack->m_nSize){
-
- goto pinbao;
- }
- else{
-
- }
- }
-
-
- }
- else{
- ao:
-
-
- list slist;
- map>::iterator listiter;
- listiter=socketlist.find(sClient);
- if(listiter!=socketlist.end()){
- slist = listiter->second;
- }else{
-
- }
- list::iterator iter;
- iter=slist.begin();
-
- char * buffer =NULL;
- for(int newi=0;newi<5;newi++){
- try{
- buffer = new char[MAX_PACKBUFFER_SIZE];
- if(buffer != NULL){
- break;
- }
- }
- catch(...){
- buffer = NULL;
- printf("申请内存失败\n");
- }
- Sleep(20*(newi+1));
- }
-
- while(buffer!=NULL&&iter!=slist.end()){
-
- OFFPACK offpack;
- offpack = *(iter);
-
- pack = (LPNET_PACK)offpack.buff;
-
- int bufferlength = pack->m_nSize;
-
- int packlength = (int)pack->m_nSize-offpack.length;
- if(packlength-1<0
- ||packlength>MAX_PACKBUFFER_SIZE){
- iter++;
- continue;
- }
-
-
- memset(buffer,0,MAX_PACKBUFFER_SIZE);
-
- memcpy(buffer,pack,packlength);
- memcpy(buffer+packlength,lpPerIOData->szMessage,offpack.length);
- pack=(LPNET_PACK)buffer;
-
- if(pack->VerifyCRC()){
-
- DealRecvPack();
-
- delete offpack.buff;
-
- nlen=offpack.length;
-
- slist.erase(iter);
-
- break;
- }else{
-
- cout<<"出现问题"<
- }
- iter++;
- }
-
- if(buffer != NULL){
- delete buffer;
- }
-
-
- while(nlen
- pack = (LPNET_PACK)(lpPerIOData->szMessage+nlen);
- if(pack->m_nSeque == PACK_SEQUE){
- if(pack->VerifyCRC()){
-
- break;
- }
- else if(pack->m_nSize>(int)dwBytesTransferred-nlen){
-
- break;
- }
- else{
-
- cout<<"出现忽略的包"<
- }
-
- }
- nlen++;
- cout<<"忽略包"<
- }
- }
-
- while(nlen<(int)dwBytesTransferred){
-
- pack=(LPNET_PACK)(lpPerIOData->szMessage+nlen);
-
- if(!pack->VerifyCRC()){
- if((int)dwBytesTransferred-nlen>=8){
- nlen += pack->m_nSize;
-
- char * buffer = NULL;
- for(int newi=0;newi<5;newi++){
- try{
- buffer = new char[pack->m_nSize];
- if(buffer != NULL){
- break;
- }
- }
- catch(...){
- buffer = NULL;
- printf("申请内存失败\n");
- }
- Sleep(20*(newi+1));
- }
- if(buffer == NULL){
- break;
- }
- memcpy(buffer,pack,pack->m_nSize-(nlen-(int)dwBytesTransferred));
-
-
- list slist;
-
-
- OFFPACK offpack;
- offpack.buff=buffer;
- offpack.length=nlen-(int)dwBytesTransferred;
- slist.push_back(offpack);
-
- map>::iterator listiter;
- listiter=socketlist.find(sClient);
- if(listiter!=socketlist.end()){
- listiter->second = slist;
-
- Sleep(10);
- }else{
-
- }
- break;
- }
- else{
-
- break;
- }
- }
- else{
- DealRecvPack(pack,pDbconn,sClient);
- nlen += pack->m_nSize;
- }
-
- }
这段代码需要放在上一段的31-32行之间。需要的时候进行补充。感觉还是需要根据自己的项目进行自我定制。