其实这篇文章一直想写,苦于没有时间,想一气呵成写完,在离回家前一天晚上,在上海的小宾馆里面异常兴奋,写一下如何用C++搭建一个简易的http服务器。
我相信大部分人都希望渴望一个自己的网站(哪怕在破在破也是自己做的),我当初是就是这么渴望的,记得那是2020年的8月,我查阅的各种资料终于学会了socket,于是迫不及待的写了一个聊天程序,一直在研究如何端口映射。那时候还很傻很天真,来了一个连接就开一根线程,离开就销毁这根线程,那会也知道线程创建和销毁的开销很大,但是一直没有想到其他的好办法呀。现在回头看这个问题会显得很蠢,咋就没想到用线程池技术呢?学习就是一步一步进化的过程,不去羡慕谁、不去跟任何人比,只跟自己比!
本篇文章不会涉及到很多复杂的概念,也没有写很难读懂的模板函数,代码简单可读,本篇文章送给每一个想自己用C++写一个http服务器的小伙伴!高手们、大佬们当然可以不用看的啦,因为我目前还是个菜鸟~我会把我再学习http遇到的问题、想法都写在本章中。
怎么写一个简单的http服务器阿?很简单,只需要返回最基本的3个东西即可。
状态码如200(找到请求文件)、404(未找到请求文件),我实现的也比较简单,就实现了这两个状态码。
文件长度比如客户请求的是index.html页面,浏览器如何知道收到的这个文件什么时候结束呢?就靠是文件的长度
文件类型 html的类型是html格式,css的是css格式,图片有图片的格式,zip有zip格式文件格式对应的文件类型表
返回给客户端三个这种东西加上请求的文件即可(存在请求文件的情况下)可以了
还想再复杂的话,可以看这篇介绍http各个参数的文章文章链接
在这个部分大概介绍一下大概的http的工作流程。客户端通过网址访问到你的网站(一定要记住客户端是主动请求连接的,服务端是被动连接的),实则就是通过ip+port访问的,只不过http的默认端口号是80。比如你还没有域名、云服务器这些东西,那如何在本地测试呢?就是在浏览框输入ip:port,例如127.0.0.1:9996,按下回车就可以在本地访问自己的http服务器了。当然了http要给客户(请求者)一个首页,当客户没有指定网页,单纯的打出域名或者127.0.0.1:9996,就给他一个默认的首页,这也是我们要实现的事情。客户写了请求文件,我们来判断是否存在,存在就返回状态码200和请求文件的内容。不存在就直接返回404。那我们如何判断啊,拿最简单的GET为例子吧,其他也大同小异,有兴趣的同学可以自行研究其他的。我们利用正则表达式来解析客户发来的请求是GET还是POST还是其他请求,在解析出来要请求文件。再利用状态机思想来文件是否存在,若存在在判断文件的类型。大概的流程就是这些。
#pragma once
#include
#include
#include
#include
#include
class TcpClient;
class Http{
// 文件的根目录
const std::string path_ = "./www/dxgzg_src";
std::string filePath_;// 具体文件的绝对路径
std::string fileType_;// 请求文件的类型
std::string header_; // http头response
int fileSize_;
int fileFd_;
struct stat fileStat_;
// POST请求的话将留言保存到本地文件中
bool isPostMode_ = false;
public:
Http() = default;
void addHeader(const std::string& head);
void Header(bool flag);
// 把一些头文件的信息都加进来,只有成功的时候调用这个函数,
// 并返回文件中的数据
void processHead();
// 把请求文件的路径加上
void addFilePath(const std::string& requestFile);
// 获取文件的类型
void analyseFileType(const std::string& requestFile);
bool analyseFile(const std::string& request);
void SendFile(int clientFd,bool isRequestOk);
bool fileIsExist();
// 用户自定义的回调函数要正确的处理异常和自己负责关闭套接字
void ReadCallback(TcpClient* t);
};
#include "Http.h"
#include "TcpClient.h"
#include "Logger.h"
#include
#include
#include
#include
#include
// 用于test
#include
using namespace std;
void Http::addHeader(const string& head)
{
if (!head.empty())
{
header_ += head;
header_ += "\r\n";
// Console.WriteLine("我在这里 head!= null" + header_);
}
// 自动加个结尾
else
{
header_ += "\r\n";
// Console.WriteLine("我在这里 head == null" + header_);
}
}
void Http::Header(bool flag)
{
// 判断要发送的头部 true 表示200 false 表示404
if(flag == true)
{
header_ = "HTTP/1.1 200 OK\r\n";
}
else
{
header_ = "HTTP/1.1 404 NOTFOUND\r\nContent-Length:0\r\n\r\n";
}
}
void Http::processHead()
{
string ContentType = "Content-Type:";
if (fileType_ == "html")
{
ContentType += "text/html";
}
else if(fileType_ == "js")
{
ContentType += "application/x-javascript";
}
else if(fileType_ == "css")
{
ContentType += "text/css";
}
else if(fileType_=="jpg" || fileType_== "png")
{
ContentType += "image/" + fileType_;
}
else if (fileType_== "zip" || fileType_ == "tar")
{
ContentType += "application/" + fileType_;
}
addHeader(ContentType);
// 代完善,要打开文件 filePath_是请求文件的路径
fileSize_= fileStat_.st_size;
string ContentLength = "Content-Length:" + to_string(fileSize_);
addHeader(ContentLength);
// 最后加了一个结尾
addHeader("");
// Console.WriteLine("process fileContent_:" + );
}
void Http::addFilePath(const string& requestFile)
{
filePath_ += requestFile;
}
void Http::analyseFileType(const string& requestFile)
{
for (int i = 0; i < requestFile.size(); ++i)
{
if (requestFile[i] == '.')
{
// 获取请求文件以什么结尾的
fileType_ = requestFile.substr(i + 1);
}
}
}
bool Http::fileIsExist(){
fileFd_ = ::open(filePath_.c_str(),O_CLOEXEC | O_RDWR);
if (fileFd_ < 0)
{ // 说明为找到请求的文件
return false;
}
return true;
}
bool Http::analyseFile(const string& request)
{
// 调用header的
// 在[]的^是以什么什么开头,放在[]里面的是非的意思
string pattern = "^([A-Z]+) ([A-Za-z./1-9-]*)";
regex reg(pattern);
smatch mas;
regex_search(request,mas,reg);
// 因为下标0是代表匹配的整体
if(mas.size() < 3){
LOG_INFO("不是正常请求");
// 啥都不是直接返回false
return false;
}
string requestMode = mas[1];
if(requestMode == "POST"){
isPostMode_ = true;
cout << "POST请求!!!!!" << endl;
}
// 请求的具体文件
string requestFile = mas[2];
// 先获取请求的文件
bool flag;
if (requestFile == "/")
{ // 如果是/的话就给默认值
filePath_.clear(); // 先清个零
filePath_ = path_;
filePath_ += "/run.html";
// 文件的类型也要给人家加上
fileType_ = "html";
}
else
{
filePath_.clear(); // 先清个零
filePath_ = path_;
addFilePath(requestFile);
// 利用open函数
}
flag = fileIsExist();
// 未找到文件的话
if(!flag){
LOG_INFO("未找到客户要的文件");
cout << filePath_ << endl;
return false;
}
::fstat(fileFd_,&fileStat_);
// 如果文件不存在的话也就不需要解析类型
analyseFileType(requestFile);
return true;
}
void Http::SendFile(int clientFd,bool isRequestOk)
{
long len = 0;
// 头部一定是有的。
while(len < header_.size()){
len += ::send(clientFd,header_.c_str(),header_.size(),0);
cout << "len header" << header_ <<endl;
}
// 发完了头,在发请求文件的信息。如果是404这里是没有的
if (isRequestOk == true)
{
len = 0;
int num = 0;
int tmpLen = 0;// 连续好几次没变的话就加一个num
while (len < fileSize_)
{
// 发送的文件个数已经写入在len当中了
::sendfile(clientFd,fileFd_,(off_t*)&len,fileStat_.st_size- len);
cout << "len sendfile" <<"len:" << len << "fileSize" << fileSize_ <<endl;
if(len <= 0 ){
break;
}
if(tmpLen == len){
++num;
if(num > 10){
break;
}
}
tmpLen = len;
}
}
}
void Http::ReadCallback(TcpClient* t){
cout << "ReadCallback" << endl;
int sockFd = t->getFd();
char buff[1024];
int r = ::recv(sockFd,buff,sizeof(buff),0);
if (r == 0)
{
t->CloseCallback();
return;
}
buff[r] = '\0';
string str = buff;
cout << str << endl;
// 未找到文件直接回应404.
bool flag = analyseFile(str);
Header(flag);
if(!flag){
SendFile(sockFd,false);
// t->CloseCallback();
return ;
}
// 这个修改头文件的,先调用这个
processHead();
//这是文件找到了发送的
SendFile(sockFd,true);
if(isPostMode_){
int fd = ::open("./postLog/message.txt",O_RDWR);
if(fd < 0){
LOG_ERROR("未找到文件");
}
else{
// 文件偏移到末尾
::lseek(fd,0,SEEK_END);
::write(fd,str.c_str(),str.size());
close(fd);
}
isPostMode_ = true;
}
// 关闭文件套接字
close(fileFd_);
// 发完就关闭连接,主要是为了多去几个线程还能跑的快一些
//t->CloseCallback();
}
不考虑高并发的情况,设计一个同步阻塞的epoll即可,看完http必备的三要素已经能够写出一个服务器了,我的底层socket采用的是自己封装的网络库,Reactor模型,one loop per thread的代码文件比较多,所以就没有放上来,但只要把状态码、文件类型(那一大段if)、文件的长度这三个实现了就可以搭建一个简易的http服务器了。可以利用sendfile零拷贝来发送文件
在补充一点就是,http协议是\r\n结尾。最后还有一个\r\n,就比如404,HTTP/1.1 404 NOTFOUND\r\nContent-Length:0\r\n\r\n,最后面再跟一个\r\n,结束一段跟一个\r\n
个人网站
2021.10.25更,最近终于有空把自己的代码重构了一下,感觉写的还可以,附上链接github链接有兴趣可以点个星哈哈哈哈,可以去github上看一看
2022.5.18更新,根据\r\n解析每一行,这算一个能跑的伪码,在服务端的话还会设置一下状态码来标识当前解析的状态,所以想了解具体的话可以去github下载源码来看。
有一条请求是GET /add?name=hello world&age=19,之前的做法是不支持这样的解析,现在已经支持这样的解析。
#include
#include
#include
#include
#include
using namespace std;
map<string,string> queryKV;
// pos:偏移量注意是个引用,endIndex:参数结尾的下标.addPos:校正偏移量
pair<string,string> spilt(const string& s,string sep,size_t& pos,size_t endIndex,size_t addPos){
size_t startIndex = s.find(sep,pos);
if(startIndex == string::npos)return pair<string,string>();
string key = s.substr(pos,startIndex - pos);
string value ="";
if(endIndex == string::npos){ // 比如 name=dxgzg,后面没有&就需要走第一个了。
value = s.substr(startIndex + 1);
pos = s.size(); // endIndex + 1就等于0了,正数溢出
} else{
value = s.substr(startIndex + 1, endIndex - startIndex - 1);
pos = endIndex + addPos;// ex: \r\n偏移量加2,&偏移量加1
}
pair<string,string> ans(key,value);
return ans;
}
// query url
void example(){
string s = "POST /addMsg HTTP/1.1\r\nHost: 192.168.0.106 : 9996\r\nConnection : keep - alive\r\n\r\n{\"content\":\"test\"}";
// 第一行数据
size_t oneIndex = s.find("\r\n");
string oneData = s.substr(0, oneIndex);
size_t index1 = oneData.find(" ");
size_t index2 = oneData.find(" ",index1 + 1);
string method = oneData.substr(0,index1);
string path = oneData.substr(index1 + 1,index2 - index1 - 1);
size_t flagSpilt = path.find("?"); // 找到"?"
string query = "";
if(flagSpilt != string::npos){
query = path.substr(flagSpilt + 1);
size_t pos = 0;
while(1){
size_t endIndex = query.find("&",pos);
cout << endIndex << endl;
auto p = spilt(query,"=",pos,endIndex,1);
if(p.first == "" && p.second == "")break;
cout << p.first << " " << p.second << endl;
// cout << pos << endl;
queryKV[p.first] = p.second;
}
}
string httpVersion = oneData.substr(index2 + 1,oneIndex - index2 - 1);
cout << "method:" << method << endl;
cout << "path:" << path <<endl;
cout << "query:" << query << endl;
cout << "httpVersion:" << httpVersion << endl;
for(auto p: queryKV){
cout << "key:" << p.first;
cout << " value:" << p.second << endl;
}
}
void example2(){
string s = "POST /addMsg?name=dxgzg&age=19 HTTP/1.1\r\nHost: 192.168.0.106 : 9996\r\nConnection : keep - alive\r\n\r\n{\"content\":\"test\"}";
// 第一行数据
size_t oneIndex = s.find("\r\n");
string oneData = s.substr(0, oneIndex);
example();
size_t lastlineIndex = 0;
lastlineIndex = s.find("\r\n\r\n");
size_t index = oneIndex + 2; // 偏移量,第一行的后面
size_t endIndex = 0;
map<string,string> m;
while( index < lastlineIndex && ((endIndex = s.find("\r\n",index)) != string::npos)){
auto p = spilt(s,":",index,endIndex,2);
m[p.first] = p.second;
}
for(auto& p : m){
cout << "key:" << p.first;
cout << " value:" << p.second << endl;
}
size_t dataIndex = lastlineIndex + 4;
string data = s.substr(dataIndex);
cout << data.size() << endl;
cout << data << endl;
}
int main() {
// 解析url的
example();
// 解析http header
example2();
return 0;
}