开篇:每当我们将开发好的ASP.NET网站部署到IIS服务器中,在浏览器正常浏览页面时,可曾想过Web服务器是怎么工作的,其原理是什么?“纸上得来终觉浅,绝知此事要躬行”,于是我们自己模拟一个简单的Web服务器来体会一下。
每一个HTTP请求都会经历三个步凑: 请求-处理-响应 :每当我们在浏览器中输入一个URL时都会被封装为一个HTTP请求报文发送到Web服务器,而Web服务器则接收并解析HTTP请求报文,然后针对请求进行处理(返回指定的HTML页面、CSS样式表、JS脚本文件亦或是加载动态页面生成HTML并返回)。最后将要返回的内容转为输出流并封装为HTTP响应报文发送回浏览器。
当然,浏览器接收到响应报文后会加载HTML、CSS与JS并显示在页面中,最后成为我们看到的最终效果。
Web服务器本质上来说就是一个 Socket服务端 ,在不停地接受着客户端的请求,然后针对每一个客户端的请求进行处理,处理完毕就 即时关闭 连接。而我们的浏览器则是一个 Socket客户端 ,通过 TCP协议 向服务端发送 HTTP请求报文 。
About:Socket非常类似于电话插座,以一个电话网为例:电话的通话双方相当于相互通信的2个程序,电话号码就是IP地址。任何用户在通话之前,首先要占有一部电话机,相当于申请一个Socket;同时要知道对方的号码,相当于对方有一个固定的Socket。然后向对方拨号呼叫,相当于发出连接请求。对方假如在场并空闲,拿起电话话筒,双方就可以正式通话,相当于连接成功。双方通话的过程,是一方向电话机发出信号和对方从电话机接收信号的过程,相当于向Socket发送数据和从Socket接收数据。通话结束后,一方挂起电话机相当于关闭socket,撤消连接。
Internet的基本协议是 TCP/IP协议 (传输控制协议和网际协议),目前广泛使用的 FTP、HTTP(超文本传输协议)、Archie Gopher都是建立在TCP/IP上面的应用层协议,不同的协议对应不同的应用。而 HTTP协议是Web应用所使用的主要协议 。
HTTP协议是 基于请求响应模式 的。客户端向服务器发送一个请求,请求头包含请求的方法、 URI、协议版本、以及包含请求修饰符、客户端信息和内容的类似MIME的消息结果。服务器则以一个状态行作为响应,相应的内容包括消息协议的版本、成功或者错误编码加上包含服务器信息、实体元信息以及可能的实体内容。
HTTP是 无状态协议 ,依赖于瞬间或者近乎瞬间的请求处理。请求信息被立即发送,理想的情况是 没有延时的进行处理,不过,延时还是客观存在的。HTTP有一种内置的机制,在消息的传递时间上由一定的灵活性:超时机制。一个超时就是客户机等待请求 消息的返回信息的最长时间。
TIP:关于HTTP协议的详细介绍,可以浏览一下小坦克大神的这篇:HTTP协议详解
(1)处理用户的静态文件请求:主要是指html/css/js文件的请求;
(2)处理用户的动态文件请求:这里只处理ASP.NET请求,即ashx与aspx文件的请求;
根据我们对ASP.NET请求处理机制的分析,我们知道在HttpRuntime的ProcessRequest方法中构造了一个 HttpContext 对象。在 HttpContext 的构造函数中,根据 HttpWorkerRequest 对象创建了 HttpContext 对象,这是一个重要的Http上下文对象,两个重要类型的字段也随之被初始化: HttpRequest 对象和 HttpResponse 对象。因此,我们在设计时也可以设计一个 HttpContext 类将 HttpRequest 和 HttpResponse 两个实例进行封装。
TIP:有关ASP.NET请求处理机制的分析,可以浏览我的另外一篇文章: ASP.NET请求处理机制探索之二-核心
针对每个Http请求都有一个抽象的HttpApplication对象来进行处理,而为了考虑扩展性(可以是ashx,也可以是aspx),封装了一个IHttpHandler接口,让不同的处理对象实现这个接口即可。IHttpHandler接口很简单,就声明了一个ProcessRequest方法,每个实现的类只需要实现这个方法即可。
private void btnStart_Click(object sender, EventArgs e)
{
// 创建Socket->绑定IP与端口->设置监听队列的长度->开启监听连接
socketWatch = new Socket(AddressFamily.InterNetwork, SocketType.Stream, ProtocolType.Tcp);
socketWatch.Bind(new IPEndPoint(IPAddress.Parse(txtIPAddress.Text), int.Parse(txtPort.Text)));
socketWatch.Listen(10);
// 创建Thread->后台执行
threadWatch = new Thread(ListenClientConnect);
threadWatch.IsBackground = true;
threadWatch.Start(socketWatch);
isEndService = false;
txtIPAddress.ReadOnly = true;
txtPort.ReadOnly = true;
btnStart.Enabled = false;
ShowMessage("~_~消息:【您已成功启动Web服务!】");
}
private void ListenClientConnect(object obj)
{
Socket socketListen = obj as Socket;
while (!isEndService)
{
Socket proxSocket = socketListen.Accept();
byte[] data = new byte[1024 * 1024 * 2];
int length = proxSocket.Receive(data, 0, data.Length, SocketFlags.None);
// Step1:接收HTTP请求
string requestText = Encoding.Default.GetString(data, 0, length);
HttpContext context = new HttpContext(requestText);
// Step2:处理HTTP请求
HttpApplication application = new HttpApplication();
application.ProcessRequest(context);
ShowMessage(string.Format("{0} {1} from {2}", context.Request.HttpMethod, context.Request.Url, proxSocket.RemoteEndPoint.ToString()));
// Step3:响应HTTP请求
proxSocket.Send(context.Response.GetResponseHeader());
proxSocket.Send(context.Response.Body);
// Step4:即时关闭Socket连接
proxSocket.Shutdown(SocketShutdown.Both);
proxSocket.Close();
}
}
在监听线程中,通过HttpApplication类对象调用其ProcessRequest方法进行具体的处理。最重要的,处理完毕后立即通过Socket发送响应信息,并及时关闭Socket连接。
(1)HttpContext
public class HttpContext
{
public HttpRequest Request { get; set; }
public HttpResponse Response { get; set; }
public HttpContext(string requestText)
{
Request = new HttpRequest(requestText);
Response = new HttpResponse();
}
}
(2)HttpRequest
public class HttpRequest
{
public HttpRequest(string requestText)
{
string[] lines = requestText.Replace("\r\n", "\r").Split('\r');
string[] requestLines = lines[0].Split(' ');
// 获取HTTP请求方式、请求的URL地址、HTTP协议版本
HttpMethod = requestLines[0];
Url = requestLines[1];
HttpVersion = requestLines[2];
}
// 请求方式:GET or POST?
public string HttpMethod { get; set; }
// 请求URL
public string Url { get; set; }
// Http协议版本
public string HttpVersion { get; set; }
// 请求头
public Dictionary<string, string> HeaderDictionary { get; set; }
// 请求体
public Dictionary<string, string> BodyDictionary { get; set; }
}
(3)HttpResponse
public class HttpResponse
{
// 响应状态码
public string StateCode { get; set; }
// 响应状态描述
public string StateDescription { get; set; }
// 响应内容类型
public string ContentType { get; set; }
//响应报文的正文内容
public byte[] Body { get; set; }
// 生成响应头信息
public byte[] GetResponseHeader()
{
string strRequestHeader = string.Format(@"HTTP/1.1 {0} {1}
Content-Type: {2}
Accept-Ranges: bytes
Server: Microsoft-IIS/7.5
X-Powered-By: ASP.NET
Date: {3}
Content-Length: {4}
", StateCode, StateDescription, ContentType, string.Format("{0:R}", DateTime.Now), Body.Length);
return Encoding.UTF8.GetBytes(strRequestHeader);
}
}
这里需要注意的是在HttpResponse类中,为了生成响应头信息,需要格式化一个固定格式的信息,并且在最后保留两个 CRLF(即换行符) 作为头部结束标志,可以看看下面的格式说明:
public interface IHttpHandler
{
void ProcessRequest(HttpContext context);
}
仿照ASP.NET内部实现,我们也设计一个IHttpHandler接口,只定义了一个方法:ProcessRequest;
public class HttpApplication : IHttpHandler
{
// 对请求上下文进行处理
public void ProcessRequest(HttpContext context)
{
// 1.获取网站根路径
string bastPath = AppDomain.CurrentDomain.BaseDirectory;
string fileName = Path.Combine(bastPath+"\\MyWebSite", context.Request.Url.TrimStart('/'));
string fileExtension = Path.GetExtension(context.Request.Url);
// 2.处理动态文件请求
if(fileExtension.Equals(".aspx") || fileExtension.Equals(".ashx"))
{
string className = Path.GetFileNameWithoutExtension(context.Request.Url);
IHttpHandler handler = Assembly.Load("MyWebServer").CreateInstance("MyWebServer.Page." + className) as IHttpHandler;
handler.ProcessRequest(context);
return;
}
// 3.处理静态文件请求
if (!File.Exists(fileName))
{
context.Response.StateCode = "404";
context.Response.StateDescription = "Not Found";
context.Response.ContentType = "text/html";
string notExistHtml = Path.Combine(bastPath, @"MyWebSite\notfound.html");
context.Response.Body = File.ReadAllBytes(notExistHtml);
}
else
{
context.Response.StateCode = "200";
context.Response.StateDescription = "OK";
context.Response.ContentType = GetContenType(Path.GetExtension(context.Request.Url));
context.Response.Body = File.ReadAllBytes(fileName);
}
}
// 根据文件扩展名获取内容类型
public string GetContenType(string fileExtension)
{
string type = "text/html; charset=UTF-8";
switch (fileExtension)
{
case ".aspx":
case ".html":
case ".htm":
type = "text/html; charset=UTF-8";
break;
case ".png":
type = "image/png";
break;
case ".gif":
type = "image/gif";
break;
case ".jpg":
case ".jpeg":
type = "image/jpeg";
break;
case ".css":
type = "text/css";
break;
case ".js":
type = "application/x-javascript";
break;
default:
type = "text/plain; charset=gbk";
break;
}
return type;
}
}
这里,我们封装一个抽象的HttpApplication类,它实现了IHttpHandler接口,对一般的请求做一个通用的处理操作。如果是静态文件请求,则直接读取文件并生成响应流,如果是动态文件请求,则通过反射方式生成对应的Page对象实例,将HttpContext对象传入其ProcessRequest方法中进行处理,最后的响应内容都封装到了HttpConext中的HttpResponse对象的Body属性中。
public class DemoPage : IHttpHandler
{
public void ProcessRequest(HttpContext context)
{
StringBuilder sbText = new StringBuilder();
sbText.Append("");
sbText.Append("DemoPage ");
sbText.Append("");
sbText.Append("用户信息列表
");
sbText.Append("ID 用户名 ");
sbText.Append("");
sbText.Append(GetDataList());
sbText.Append("
");
sbText.Append(string.Format("更新时间:{0}
", DateTime.Now.ToString()));
sbText.Append("");
sbText.Append("");
context.Response.Body = Encoding.UTF8.GetBytes(sbText.ToString());
context.Response.StateCode = "200";
context.Response.ContentType = "text/html";
context.Response.StateDescription = "OK";
}
private string GetDataList()
{
StringBuilder sbData = new StringBuilder();
string strConn = System.Configuration.ConfigurationManager.ConnectionStrings["MyConn"].ToString();
using (SqlConnection conn = new SqlConnection(strConn))
{
conn.Open();
using (SqlCommand cmd = conn.CreateCommand())
{
cmd.CommandText = "SELECT * FROM UserInfo";
using(SqlDataAdapter adapter = new SqlDataAdapter(cmd))
{
DataTable dt = new DataTable();
adapter.Fill(dt);
if(dt != null)
{
foreach (DataRow row in dt.Rows)
{
sbData.Append("");
sbData.Append(string.Format("{0} ",row["ID"].ToString()));
sbData.Append(string.Format("{0} ", row["UserName"].ToString()));
sbData.Append(" ");
}
}
}
}
}
return sbData.ToString();
}
}
这里我们模拟一个Page页面类,它也实现了IHttpHandler接口,在ProcessRequest方法通过ADO.NET访问了数据库并读取数据作为输出内容。这里,我们主要是通过分析ASP.NET WebForm中的aspx对象,它虽然直接继承的类是Page类,但是Page类却是实现了IHttpHandler接口的。在具体的处理方法中,都是通过调用这个接口的ProcessRequest方法进行处理的。
(1)开启监听服务
(2)请求静态页面
(3)请求动态页面
本次模拟的一个超级简单的Web服务器软件,实现了静态文件和动态文件(通过模拟aspx页面对象)的处理和响应。但是,还有很多的功能并未实现,因为一个真正的Web服务器需要考虑的东西很多很多,例如:多线程的处理优化、高效的IO模型等。不过,对于一个最基本的Web服务器所需要了解的最基本的原理:Socket的监听和连接、基于TCP协议的HTTP协议、动态文件类的反射与调用等,模拟开发本次的DEMO的过程是可以达到的。
MyWebServer v1.0: http://pan.baidu.com/s/1mgtC1HA