HTTP协议之chunk编码

       有些服务器生成HTTP回应是无法确定消息大小的,这时用Content-Length就无法事先写入长度,而需要实时生成消息长度,这时服务器一般采用Chunked编码。

在进行Chunked编码传输时,在回复消息的头部有Transfer-Encoding:chunked,表示将用Chunked编码传输内容,如:

chunked编码的HTTP头:

HTTP/1.1 200 OK..Date: Mon, 16 Jul 2012 17:57:52 GMT..Server: Apache..Keep-Alive: timeout=15, max=100..Connection: Keep-Alive..Transfer-Encoding: chunked..

Content-Type: text/xml....4fe9..<?xml version='1.0' e......

普通的HTTP头:

HTTP/1.1 200 OK..Date: Mon, 16 Jul 2012 06:57:57 GMT..Server: Apache/2.2.3 (CentOS)..X-Powered-By: PHP/5.1.6..Content-Length: 6415..Connection: close..Conte
nt-Type: text/xml;charset=gbk....<?xml version='1.0'encoding='GBK'?>

    编码使用若干个Chunk组成,由一个标明长度为0的chunk结束,每个Chunk有两部分组成,第一部分是该Chunk的长度和长度单位(一般不写),第二部分就是指定长度的内容每个部分用CRLF(即:\r\n回车换行)隔开。在最后一个长度为0的Chunk中的内容是称为footer的内容,是一些没有写的头部内容。


解析chunked编码的http消息内容,代码如下:

//过滤掉每个chunk的长度信息
bool HttpDownload::Format(string &szData)
{
    string szRet;
    int nPos1 = 0;
    while (1)
    {
        size_t nPos2 = szData.find("\r\n", nPos1);
        if (nPos2 <= nPos1)
        {
            return false;
        }
         DWORD dwLen = 0;    //用4个字节表示chunked内容的长度,16进制
        sscanf_s(szData.substr(nPos1, nPos2 - nPos1).c_str(), "%x", &dwLen);
        if (0 == dwLen)
        {
            //结束标记符,标示数据接收完整
            szData = szRet;
            return true;
        }
        if (szData.length() - nPos2 < (size_t)(dwLen + 4))
        {
            return true;
        }
        szRet.append(szData.begin() + nPos2 + 2, szData.begin() + nPos2 + 2 + dwLen);  //2个字节表示\r\n的长度。
        nPos1 = nPos2 + dwLen + 4;
    }
    return false;
}

你可能感兴趣的:(centos,String,服务器,encoding)