计算机网络-应用层-万维网WWW

这次的主要内容是:
(1)域名系统DNS
(2)万维网和HTTP协议以及万维网的两种不同的搜索引擎
(3)电子邮件的传送过程
(4)动态主机配置协议DHCP的特点
(5)网络管理的三个组成部分
(6)系统调用和应用编程接口的基本概念
(7)P2P文件系统
**

万维网WWW

**
从以下4个问题来回答万维网是用来做什么的?
(1)怎样标志分布在整个互联网的万维网文档
(2)用什么协议来实现万维网上的各种链接?
(3)怎样使不同作者创作的不同风格的万维网文档,在互联网的各种主机显示出来,同时是用户知道在什么地方存在链接?
(4)怎样使用户很方便查找到所需要的信息?
基于以上4个问题,分别介绍URL,HTTP,HTML,搜索引擎。
万维网是什么?
是浏览器,是网页,还是个数据库?
万维网是一个大规模的、联机式的信息储藏所。万维网使用链接的方法从一个站点访问另一个站点,从而主动获取丰富的信息。
以前所谓的“网上冲浪”就是基于万维网实现的。
1.统一资源定位符URL
URL格式
<协议>://<主机>:<端口>:<路径>
https://www.csdn.net/nav/ops?spm=1000.2115.3001.4125
URL实际上就是互联网上资源的地址。
2.超文本传送协议HTTP
HTTP协议定义了浏览器怎样向万维网服务器请求万维网文档,以及服务器怎样把文档传送给浏览器。
HTTP协议本身是无连接的(通信的双方在交换HTTP报文之前不需要建立HTTP连接)
HTTP协议本身是无状态的(Cookie用来存放用户的信息)
计算机网络-应用层-万维网WWW_第1张图片HTTP1.1就是解决2倍RTT开销。
HTTP报文结构
HTTP主要有两种报文,请求报文和响应报文。
请求报文的开始行:
方法(空格)+URL(空格)+CRLF(回车换行)
方法主要有以下8种:

方法 意义
option 请求一些选项的信息
get 请求读取由URL所标志的信息
head 请求读取由URL所标志的信息的首部
post 给服务器添加信息
put 在指明的URL下存储一个文档
delete 删除由URL指明的资源
trace 用来进行环回测试的请求报文
connnect 用于代理服务器

HTTP响应报文的状态行:
版本+状态码+短语(解释状态码)
主要有以下5类

项目 Value
1xx 表示通知信息
2xx 表示成功
3xx 表示重定向
4xx 表示客户的差错
5xx 表示服务器的差错

常见的404:NOT FOUND
3.万维网的文档
1.超文本标记语言HTML
2.动态万维网文档
主要优点:具有报告当前最新信息的能力。
如:股市行情,天气预报等
CGI:定义动态文档如何创建,输入数据应如何提供给应用程序,以及输出结果应如何使用。
3.活动万维网文档
实现持续性更新。通过服务器持续推送,或者通过活动文档。
4.万维网的信息检索系统
主要有两大类:
1.全文检索搜索引擎
纯技术型的检索工具,工作原理是通过搜索软件(例如一种叫做”蜘蛛“或”网络机器人“的Spider程序)到互联网上的各网站收集信息,找到一个网站后可以从这个网站再链接到另一各网站,像蜘蛛爬行一样,然后按照一定的规则建立一个很大的在线索引数据库供用户查询。
2.分类目录搜索引擎
分类目录搜索引擎并不采集任何网站的信息,而是利用各网站像搜索引擎提交网站信息时所填写的关键词和网站描述等信息,经过人工审核编辑后,如果符合网站登录的条件,则输入到分类目录的数据库中,供用户查询。

你可能感兴趣的:(计算机网络-应用层-万维网WWW)