c++实现简单的web服务器搭建

c++简单的web服务器搭建

web 服务器与 Http 协议

Web 浏览器(Web Browser)是一个用于文档检索和显示的客户应用程序,并通过超文本传输协议

Http(Hyper Text Transfer Protocol)与 Web 服务器相连。

通用的、低成本的浏览器节省了两层结构的 C/S 模式客户端软件的开发和维护费用。

HTTP 协议工作流程

  1. 首先客户机与服务器需要建立连接。只要单击某个超级链接,HTTP 的工作就开始了。

  2. 建立连接后,客户机发送一个请求给服务器,请求方式的格式为:统一资源标识符(URL)、 协议版本号,后边是 MIME 信息:包括请求修饰符、客户机信息和可能的内容。

  3. 服务器接到请求后,给予相应的响应信息,其格式为一个状态行,包括信息的协议版本号、 一个成功或错误的代码,后边是 MIME 信息包括服务器信息、实体信息和可能的内容。

  4. 客户端接收服务器所返回的信息通过浏览器显示在用户的显示屏上,然后客户机与服务器断开连接。

客户端请求方法

方法 描述
get 请求读一个万维网页
head 请求读一个万维网页的頭部
put 请求存储一个万维网页
post 附加一个命名的资源
delete 删除万维网页
link 连接两个已有资源
unlink 切断两个已有资源间的连接

服务器的搭建

服务器搭建需要对winsock版本以及套接字进行初始化,接着将本机的信息包括IP地址,端口进行绑定。

这样不仅本机,在局域网内的机器也是可以对服务器进行请求数据。

客户端请求的解析(请求方式以及请求资源的解析)

客户端请求的解析需要通过获取客户端的请求头来进行解析,如下图所示,Request URL是客户端请求的地址,Request Method 为 请求的方式,因此只需要拿到客户端的请求头解析出请求内容以及请求方式即可。

c++实现简单的web服务器搭建_第1张图片

HTTP 消息结构

HTTP是基于客户端/服务端(C/S)的架构模型,通过一个可靠的链接来交换信息,是一个无状态的请求/响应协议。

一个HTTP"客户端"是一个应用程序(Web浏览器或其他任何客户端),通过连接到服务器达到向服务器发送一个或多个HTTP的请求的目的。

一个HTTP"服务器"同样也是一个应用程序(通常是一个Web服务,如Apache Web服务器或IIS服务器等),通过接收客户端的请求并向客户端发送HTTP响应数据。

HTTP使用统一资源标识符(Uniform Resource Identifiers, URI)来传输数据和建立连接。

一旦建立连接后,数据消息就通过类似Internet邮件所使用的格式[RFC5322]和多用途Internet邮件扩展(MIME)[RFC2045]来传送。

客户端请求消息

客户端发送一个HTTP请求到服务器的请求消息包括以下格式:请求行(request line)、请求头部(header)、空行和请求数据四个部分组成,下图给出了请求报文的一般格式。

c++实现简单的web服务器搭建_第2张图片

服务器响应消息

HTTP响应也由四个部分组成,分别是:状态行、消息报头、空行和响应正文。

c++实现简单的web服务器搭建_第3张图片

HTTP 响应头信息

HTTP请求头提供了关于请求,响应或者其他的发送实体的信息。

  1. Content-Encoding
    文档的编码(Encode)方法。只有在解码之后才可以得到Content-Type头指定的内容类型。利用gzip压缩文档能够显著地减少HTML文档的下载时间。Java的GZIPOutputStream可以很方便地进行gzip压缩,但只有Unix上的Netscape和Windows上的IE 4、IE 5才支持它。因此,Servlet应该通过查看Accept-Encoding头(即request.getHeader(“Accept-Encoding”))检查浏览器是否支持gzip,为支持gzip的浏览器返回经gzip压缩的HTML页面,为其他浏览器返回普通页面。

  2. Content-Length
    表示内容长度。只有当浏览器使用持久HTTP连接时才需要这个数据。如果你想要利用持久连接的优势,可以把输出文档写入 ByteArrayOutputStream,完成后查看其大小,然后把该值放入Content-Length头,最后通过byteArrayStream.writeTo(response.getOutputStream()发送内容。

  3. Content-Type
    表示后面的文档属于什么MIME类型。Servlet默认为text/plain,但通常需要显式地指定为text/html。由于经常要设置Content-Type,因此HttpServletResponse提供了一个专用的方法setContentType。

  4. Date
    当前的GMT时间。你可以用setDateHeader来设置这个头以避免转换时间格式的麻烦。

  5. Expires
    应该在什么时候认为文档已经过期,从而不再缓存它?

  6. Last-Modified
    文档的最后改动时间。客户可以通过If-Modified-Since请求头提供一个日期,该请求将被视为一个条件GET,只有改动时间迟于指定时间的文档才会返回,否则返回一个304(Not Modified)状态。Last-Modified也可用setDateHeader方法来设置。

  7. Location
    表示客户应当到哪里去提取文档。Location通常不是直接设置的,而是通过HttpServletResponse的sendRedirect方法,该方法同时设置状态代码为302。

  8. Refresh
    表示浏览器应该在多少时间之后刷新文档,以秒计。除了刷新当前文档之外,你还可以通过setHeader(“Refresh”, “5; URL=http://host/path”)让浏览器读取指定的页面。
    注意这种功能通常是通过设置HTML页面HEAD区的<META HTTP-EQUIV=“Refresh” CONTENT="5;URL=http://host/path">实现,这是因为,自动刷新或重定向对于那些不能使用CGI或Servlet的HTML编写者十分重要。但是,对于Servlet来说,直接设置Refresh头更加方便。

    注意Refresh的意义是"N秒之后刷新本页面或访问指定页面",而不是"每隔N秒刷新本页面或访问指定页面"。因此,连续刷新要求每次都发送一个Refresh头,而发送204状态代码则可以阻止浏览器继续刷新,不管是使用Refresh头还是<META HTTP-EQUIV=“Refresh” …>。

    注意Refresh头不属于HTTP 1.1正式规范的一部分,而是一个扩展,但Netscape和IE都支持它。

  9. Server
    服务器名字。Servlet一般不设置这个值,而是由Web服务器自己设置。

  10. Set-Cookie
    设置和页面关联的Cookie。Servlet不应使用response.setHeader(“Set-Cookie”, …),而是应使用HttpServletResponse提供的专用方法addCookie。参见下文有关Cookie设置的讨论。

HTTP 状态码

HTTP 响应头信息HTTP content-type
HTTP 状态码
当浏览者访问一个网页时,浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前,此网页所在的服务器会返回一个包含 HTTP 状态码的信息头(server header)用以响应浏览器的请求。

HTTP 状态码的英文为 HTTP Status Code。
常见的 HTTP 状态码:
200 - 请求成功
301 - 资源(网页等)被永久转移到其它URL
404 - 请求的资源(网页等)不存在
500 - 内部服务器错误

详细设计

对客户端的请求头进行解析

recv(client_fd,buff,99,0)  

服务器的建立(包括初始化winsock版本,初始化套接字)

    char recbuf[2048];
    WSADATA wsaData;
    int iResult = WSAStartup(MAKEWORD(2,2), &wsaData);
    SOCKADDR_IN svr_addr, cli_addr;
    int sin_len = sizeof(cli_addr);

    int sock = socket(AF_INET, SOCK_STREAM, 0);
    if (sock < 0)
    {
        cout<< "无法开启socket";
        exit(0);
    }

    int port = 81;
    svr_addr.sin_family = AF_INET;
    svr_addr.sin_addr.s_addr = INADDR_ANY;
    svr_addr.sin_port = htons(port);

    if (bind(sock, ( SOCKADDR *) &svr_addr, sizeof(svr_addr)) == -1)
    {
        closesocket(sock);
        cout<<"无法绑定\n";
    }

    listen(sock, 5);

获得客户端的请求头

        if((numbytes = recv(client_fd,buff,99,0)) == -1)
        {
            perror("recv");
            exit(1);
        }

对请求头进行解析(分析出其中的请求方式)

    char data[1000];
    char cd[500];
    char args[500];
    strcpy(args,"./");
    if(sscanf(buff, "%s%s", cd, args+2)!=2)
    {
        return;
    }
 //  cout<<" 111 "<

对请求的资源进行分析

char response[] = "HTTP/1.1 200 OK\r\n"
                  "Content-Type: text/html; charset=UTF-8\r\n\r\n"
                  ""
                  ""
                  ""
                  ""
                  "Hello World"
                  ""
                  ""
                  ""
                  "

This is a simple webserver

" "

And this html does not support ZH-CN

" "\r\n"; string s; char str[100]; cout<

完整代码(这里只是对GET请求进行处理)

#include 
#include 
#include 
#include
#include 
#include
#include
#include
#include
#include
#include
#include

using namespace std;
int client_fd;
int numbytes;
char buff[100];
char response[] = "HTTP/1.1 200 OK\r\n"
                  "Content-Type: text/html; charset=UTF-8\r\n\r\n"
                  ""
                  ""
                  ""
                  ""
                  "Hello World"
                  ""
                  ""
                  ""
                  "

This is a simple webserver

" "

And this html does not support ZH-CN

" "\r\n"; char r[] = "HTTP/1.1 200 OK\r\n""Content-Type: text/html; charset=UTF-8\r\n\r\n""<

yyy

111

"; void solve() { char data[1000]; char cd[500]; char args[500]; strcpy(args,"./"); if(sscanf(buff, "%s%s", cd, args+2)!=2) { return; } // cout<<" 111 "<

运行截图

c++实现简单的web服务器搭建_第4张图片
c++实现简单的web服务器搭建_第5张图片

你可能感兴趣的:(c++,计算机网络,http,c++,web,socket)