一个web页面的访问的过程

Browers是如何在浩瀚的互联网上找到我们需要的资源呢？

以下将记录这个过程，这个过程是web编程需要需要熟知的。

用户打开浏览器输入目标地址（比如http://www.sina.com），那么接下来发生什么事情呢？

1，浏览器首先会查询本机的系统，获取主机名对应的IP地址。

2，若本机查询不到相应的IP地址，则会发起DNS请求，获取主机名对应的IP地址。

3，使用查询到的IP地址，直接访问目标服务器。

首先说说访问目标地址的两种方式：

第一，使用目标IP地址访问。比如你可以直接在浏览器中输入新浪的IP地址：218.30.13.36而直接访问它的主机。

第二，由于IP地址都是一堆数字不方便人记忆，于是有了域名这种字符型标识。DNS服务器则完成域名解析的工作，它将你访问的目标域名转换成相应的IP地址。

因此若你的电脑上不了网未必就一定是目标主机的问题了哦！还有可能是DNS服务器的故障。所以这种情况下，你能熟知几个常用的IP地址，那么在命令行使用ping一下就能知道问题是否是出现在DNS服务器上了。比较常用的IP有：百度180.76.76.76 谷歌8.8.8.8或8.8.4.4阿里云223.5.5.5或223.6.6。

为什么我们不能自己建立一个www.sina.com或者www.google.com这样的网站而让全世界的人都访问我这个网站呢（显然sina和google肯定不会让你这么干）？由以上几步可以看出，因为域名系统的存在，使得我们可以访问目标域名（www.sina.com）的时候，DNS服务器总是解析对应的IP地址（218.30.13.36）。所以若要别人都访问你的“新浪”，则需要将DNS的服务器路径指向你本机所在的IP地址，这显然得新浪愿意才行。

那么，假如我为了学习一定要这样做呢？恩！确实也可以，可是此“新浪”非彼“新浪”。

由步骤1可知道，浏览器在发送DNS请求的之前，需要访问本机的系统查看一下是否存在对应的主机IP。那么我们是否可以修改这个配置文件呢？答案是肯定的。

windows下打开文件：c:windows\system32\drivers\etc\hosts

linux下打开文件：/etc/hosts

加入你需要修改的IP地址，使目标的IP指向你本机的IP，则它就能实现访问你本机上的资源了。

如加入：127.0.1.1 （假如这是我本机的IP） www.sina.com

127.0.1.1　　　　　　　　　　　 www.google.com

这样你和你的朋友都可以访问你主机上这个sina了，显然由以上的讨论可知，你朋友只能通过你的IP地址访问该sina。

4，浏览器发送HTTP请求。

HTTP请求由三部分组成，分别是：请求行、消息报头、请求正文

有兴趣的朋友可以在这里查看相关的资料。

5，从请求信息中获得客户机想访问的主机名。

6，从请求信息中获取客户机想要访问的web应用。（web应用程序指提供浏览器访问的程序，简称web应用）

7，从请求信息中获取客户机要访问的web资源。（web资源，即各种文件，图片，视频，文本等）

8，读取相应的主机下的web应用，web资源。

9，用读取到的web资源数据，创建一个HTTP响应。

10，服务器回送HTTP响应。

HTTP响应也是由三个部分组成，分别是：状态行、消息报头、响应正文

有兴趣的朋友可以在这里查看相关的资料。

11，客户浏览器解析回送的资源，并显示结果。

TCP/UDP协议

TCP (Transmission Control Protocol)：TCP提供IP环境下的数据可靠传输，它提供的服务包括数据流传送、可靠性、有效流控、全双工操作和多路复用。通过面向连接、端到端和可靠的数据包发送。通俗说，它是事先为所发送的数据开辟出连接好的通道，然后再进行数据发送；

TCP支持的应用协议主要有：Telnet（远程终端协议）、FTP（File Transfer Protocol文件传输协议）、SMTP（Simple Mail Transfer Protocol简单邮件传输协议）等；

UDP(User Datagram Protocol)：UDP则不为IP提供可靠性、流控或差错恢复功能。一般来说，TCP对应的是可靠性要求高的应用，而UDP对应的则是可靠性要求低、传输经济的应用。

UDP支持的应用层协议主要有：NFS（网络文件系统）、SNMP（简单网络管理协议）、DNS（主域名称系统）、TFTP（通用文件传输协议）等。

TCP和UDP协议属于传输层协议。

常见互联网TCP/UDP协议其端口号：

FTP 控制：　　21端口　　说明：ftp服务器所开放的端口，用于上传下载。最常见的攻击者用于寻找打开anonymous的ftp服务器方法。这些服务器带有可读写的目录。

SSH 服务：　　22端口　　说明：pcAnywhere建立的tcp和这一端口的连接可能是为了寻找ssh。这一服务有许多弱电，如果配置成特定的模式，许多使用　RSAREF库的版本就会有不少漏洞存在。

Telnet 服务：　 23端口　说明：远程登陆，入侵者在搜索远程登陆UNIX的服务。大多数情况下扫描这一端口是为了找到机器运行的操作系统。还有使用其他技术，入侵者会找到密码。

SMTP 服务：　25端口　　说明：SMTP服务器所开放的端口，用于发送邮件。入侵者寻找SMTP服务器是为了传递他们的SPAM。入侵者的账号被关闭，他们需要连接到高带宽的EMAIL服务器上，将简单的信息传递到不同的地址。

DNS 服务：　 53端口　说明：为DNS(Domain Name Server，域名服务器)服务器所开放，主要用于域名解析，DNS服务在NT系统中使用的最为广泛。入侵者可能是试图进行区域传递（TCP），欺骗DNS（udp）或隐藏其它的通信。因此防火墙常常过滤或记录此端口。

HTTP 服务： 80端口　说明：用于网页浏览。木马Executor开放此端口

POP3服务：110端口　　说明：邮件协议3的服务开放端口，POP2、POP3都是主要用于接收邮件的。它用于接收邮件，客户端访问服务器的邮件服务。　pop3服务有许多公认的弱点。关于用户名和密码交换缓存溢出的溢出弱点至少有20个，这意味者入侵者可以在真正登陆前进入系统。成功登陆后还有其它缓冲区溢出错误。

IMAP服务：　 143端口　　说明：是用于“Internet Message Access Protocol”v2(Internet消息访问协议，简称IMAP)，和pop3问题一样多。许多IMAP服务器存在有缓冲区溢出漏洞。一种LINUX蠕虫admvorm会通过这个端口繁殖，因此许多这个端口的扫描来自不知情的已经被感染的用户。

HTTPS 服务： 443端口说明：网页浏览端口，能提供加密和通过安全端口传输的另一种HTTP

终端服务：　3389端口　　说明：windows2000开放此端口。

详细请参考：TCP/UDP常用端口列表。

一个web页面的访问的过程

你可能感兴趣的:(一个web页面的访问的过程)