HTTP协议

HTTP协议

访问浏览器的过程

  1. 浏览器的职责
  2. DNS解析
  3. TCP连接
  4. http请求
  5. 浏览器渲染原理

http概念

HTTP是处于应用层的协议,使用TCP传输层协议进行可靠的传送

HTTP(HyperText Transfer Protocol,超文本传输协议)是一种用于分布式、协作式和超媒体信息系统的应用层协议。HTTP是万维网的数据通信的基础设计HTTP最初的目的是为了提供一种远距离共享知识的方式,借助多文档进行关联实现超文本,连成相互参阅的WWW(world wide web,万维网)

http相关技术

web开发语言

HTML

超文本标记语言,编程语言,主要负责实现页面的结构

css

Cascading Style Sheet 层叠样式表, 定义了如何显示(装扮) HTML 元素

javascript

javascript,实现网页的动画效果,但实属于静态资源

MIME

MIME是一种互联网标准,是一种用于标识文件类型的方法。

文件位置
/etc/mime.types
MIME格式:type/subtype   主要类型/次要类型

text/html  HTML网页
text/plain 纯文本文件
image/png  PNG图像
audio/mpeg MP3音频
video/mp4  MP4视频

URI 和 URL

URI: Uniform Resource Identifier 统一资源标识,分为URL 和 URN

URN:Uniform Resource Naming,统一资源命名

URL:Uniform Resorce Locator,统一资源定位符,用于描述某服务器某特定资源位置

URN和URL的区别

URN如同一个人的名称,而URL代表一个人的住址。换言之,URN定义某事物的身份,而URL提供查找该事物的方法。URN仅用于命名,而不指定地URL组成

URL格式
<scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#
scheme:方案,访问服务器以获取资源时要使用哪种协议
user:用户,某些方案访问资源时需要的用户名
password:密码,用户对应的密码,中间用:分隔
Host:主机,资源宿主服务器的主机名或IP地址
port:端口,资源宿主服务器正在监听的端口号,很多方案有默认端口号
path:路径,服务器资源的本地名,由一个/将其与前面的URL组件分隔
params:参数,指定输入的参数,参数为名/值对,多个参数,用;分隔
query:查询,传递参数给程序,如数据库,用?分隔,多个查询用&分隔
frag:片段,一小片或一部分资源的名字,此组件在客户端使用,用#分隔
示例
ftp://mage:[email protected]/pub/linux.ppt
http://apache.org/index.html#projects-list

http工作机制

资源类型

  • 静态文件:无需服务器CPU做出额外处理,服务器端和客户端的文件内容相同
  • 动态文件:服务器CPU执行程序,返回执行的结果,服务器端和客户端的文件内容不相同

连接类型

  • 并行连接:通过多条TCP连接发起并发的HTTP请求
  • 持久连接:keep-alive,重用TCP连接,以消除连接和关闭的时延,以事务个数和时间来决定是否关闭连接
  • 管道化连接:通过共享TCP连接,发起并发的HTTP请求
  • 复用的连接:交替传送请求和响应报文(实验阶段)

协议版本

http/0.9 只有get下载功能,没有上传功能

http/1.0 有上传和下载功能

http/01.1 在原有的基础上支持长连接

长连接:一次三次握手,多次下载资源

https:

  • HTTP和HTTPS使用的是不同的连接方式,端口不同,前者是80,后者是443
  • HTTPS可以有效的防止运营商劫持,解决了防劫持的一个大问题
  • HTTPS 实现过程降低用户访问速度,但经过合理优化和部署,HTTPS 对速度的影响还是可以接受的

http访问过程

1、请求建立连接

接收或拒绝连接请求

2、接收请求

接收客户端请求报文中对某资源的一次请求的过程

3、处理请求

服务器对请求报文进行解析,并获取请求的资源及请求方法等相关信息,根据方法,资源,首部和可选的主体部分对请求进行处理

4、访问资源

服务器获取请求报文中请求的资源web服务器,即存放了web资源的服务器,负责向请求者提供对方请求的静态资源,或动态运行后生成的资源

5、构建响应报文

一旦Web服务器识别除了资源,就执行请求方法中描述的动作,并返回响应报文。响应报文中 包含有响应状态码、响应首部,如果生成了响应主体的话,还包括响应主体

6、发送响应报文

服务器可能有很多条到各个客户端的连接,有些是空闲的,有些在向服务器发送数据,还有一些在向客户端回送响应数据。

7、记录日志

最后,当事务结束时,Web服务器会在日志文件中添加一个条目,来描述已执行的事务

Web访问响应模型

  • 单进程I/O模型:启动一个进程处理用户请求,而且一次只处理一个,多个请求被串行响应
  • 多进程I/O模型:并行启动多个进程,每个进程响应一个连接请求
  • 复用I/O结构:启动一个进程,同时响应N个连接请求
  • 复用的多进程I/O模型:启动M个进程,每个进程响应N个连接请求,同时接收M*N个请求

http状态码

1xx:100-101 信息提示
2xx:200-206 成功
3xx:300-307 重定向
4xx:400-415 错误类信息,客户端错误
5xx:500-505 错误类信息,服务器端错误

200: 成功,请求数据通过响应报文的entity-body部分发送;OK
301: 请求的URL指向的资源已经被删除;但在响应报文中通过首部Location指明了资源现在所处的新位置;Moved Permanently
302: 响应报文Location指明资源临时新位置 Moved Temporarily
304: 客户端发出了条件式请求,但服务器上的资源未曾发生改变,则通过响应此响应状态码通知客户端;Not Modified
307:  浏览器内部重定向
401: 需要输入账号和密码认证方能访问资源;Unauthorized
403: 请求被禁止;Forbidden
404: 服务器无法找到客户端请求的资源;Not Found
500: 服务器内部错误;Internal Server Error,比如:cgi程序没有执行权限
502: 代理服务器从后端服务器收到了一条伪响应,如无法连接到网关;Bad Gateway
503: 服务不可用,临时服务器维护或过载,服务器无法处理请求,比如:php服务停止,无法处理php程序
504: 网关超时

常见http服务器程序

  • httpd apache,存在C10K(10K connections)问题
  • nginx 解决C10K问题lighttpd
  • IIS .asp 应用程序服务器
  • tomcat .jsp 应用程序服务器
  • jetty 开源的servlet容器,基于Java的web容器
  • Resin CAUCHO公司,支持servlets和jsp的引擎
  • webshpere:IBM公司
  • weblogic:BEA,Oracle
  • jboss:RedHat,IBM
  • oc4j:Oracle

Apache

Apache 是一种功能强大、通用性广泛、可靠稳定的 Web 服务器软件,被广泛应用于互联网和企业内部网络。

它由 Apache 软件基金会开发和维护,是互联网上最流行的 Web 服务器之一。Apache 服务器可以运行在多种操作系统上,包括 Windows、Linux、macOS 等。

apache 功能:

  • 提供http协议服务
  • 多个虚拟主机:IP、Port、FQDN
  • CGI:Common Gateway Interface,通用网关接口,支持动态程序
  • 反向代理
  • 负载均衡
  • 路径别名
  • 丰富的用户认证机制:basic,digest
  • 支持第三方模块

apache特性:

  • 高度模块化:core + modules
  • DSO:Dynamic Shared Object 动态加载/卸载
  • MPM:multi-processing module 多路处理模块

工作模式

prefork

多进程I/O模型,每个进程响应一个请求,CentOS 7 httpd默认模型

一个主进程:生成和回收n个子进程,创建套接字,不响应请求多个子进程:工作 work进程,每个子进程处理一个请求;系统初始时,预先生成多个空闲进程,等待请求

worker

复用的多进程I/O模型,多进程多线程,IIS使用此模型

一个主进程:生成m个子进程,每个子进程负责生个n个线程,每个线程响应一个请求,并发响应请求:m*n

event

事件驱动模型(worker模型的变种),CentOS8 默认模型

一个主进程:生成m个子进程,每个子进程负责生个n个线程,每个线程响应一个请求,并发响应请求:m*n,有专门的监控线程来管理这些keep-alive类型的线程,当有真实请求时,将请求传递给服务线程,执行完毕后,又允许释放。这样增强了高并发场景下的请求处理能力

http相关文件

版本说明:

CentOS 7 以上,默认系统是httpd 2.4,CentOS 6 版默认为httpd 2.2

Ubuntu 18.04 默认 Apache/2.4.29

配置文件
/etc/httpd/conf/httpd.conf 主配置文件
/etc/httpd/conf.d/*.conf 子配置文件
/etc/httpd/conf.d/conf.modules.d/ 模块加载的配置文件

服务单元文件:/usr/lib/systemd/system/httpd.service
配置文件:/etc/sysconfig/httpd

默认主页配置文件:/var/www/html

模块文件路径:
/etc/httpd/modules
/usr/lib64/httpd/modules

主服务器程序文件:/usr/sbin/httpd

HTTP协议_第1张图片

httpd相关配置

yum -y install httpd #安装
检查配置语法:httpd -t 或 apache2 -t 
可以创建子配置文件,避免在主配置文件中修改产生错误
/etc/httpd/conf.d/*.conf 子配置文件

HTTP协议_第2张图片

修改默认主页位置

[root@localhost ~]vim /etc/httpd/conf/httpd.conf
[root@localhost ~]mkdir -p /data/html 
[root@localhost data]httpd -t
AH00558: httpd: Could not reliably determine the server's fully qualified domai            n name, using localhost.localdomain. Set the 'ServerName' directive globally to             suppress this message
Syntax OK
[root@localhost data]systemctl start httpd

HTTP协议_第3张图片

指定服务器名

[root@localhost ~]vim /etc/httpd/conf/httpd.conf
ServerName www.example.com:80
[root@localhost data]httpd -t
Syntax OK

HTTP协议_第4张图片

监听地址

省略IP表示为本机所有IP

Listen指令至少一个,可重复出现多次

vim /etc/httpd/conf.d/test.conf
Listen 8080

隐藏服务器版本信息

相关指令
ServerTokens Prod[uctOnly] :Server: Apache
ServerTokens Major: Server: Apache/2
ServerTokens Minor: Server: Apache/2.0
ServerTokens Min[imal]: Server: Apache/2.0.41
ServerTokens OS: Server: Apache/2.0.41 (Unix)
ServerTokens Full (or not specified): Server: Apache/2.0.41 (Unix) PHP/4.2.2 MyMod/1.2 此为默认值

vim /etc/httpd/conf.d/test.conf
ServerTokens Prod
systemctl restart httpd

HTTP协议_第5张图片

持久连接开启和关闭

KeepAlive On|Off
KeepAliveTimeout 15      #连接持续15s,可以以ms为单位,默认值为5s
MaxKeepAliveRequests 500  #持久连接最大接收的请求数,默认值100

虚拟主机

httpd虚拟主机的作用是通过一个物理服务器来托管多个域名或网站,实现资源共享、个性化配置和多域名指向不同网站的功能,提高服务器资源利用率和降低成本。

基于ip地址

每个虚拟主机分配一个唯一的IP地址,并通过服务器软件来指定每个虚拟主机使用的IP地址。

客户机访问服务器时,服务器会根据客户机的IP地址,在配置文件中寻找对应关系,根据对应关系跳转。

systemctl stop firewalld
setenforce 0

rpm -q httpd #没安装就装一下

systemctl start httpd

cd /var/www/html/   #进入httpd站点文件目录
vim  index.html  #设定默认主页,默认主页名字必须为index.html

systemctl restart httpd  //重启httpd服务
cd /var/www/html/
mkdir ipv1  #创建虚拟机 所需目录

vim ./ipv1/index.html  #测试页面主页
vim /etc/httpd/conf.d/ipv.conf #新建配置文件 除了IP地址不同
systemctl restart httpd #重启服务
打开客户机的浏览器
输入 192.168.2.102:80
#192.168.2.102为服务端的地址
#服务端收到目标地址的请求,会跳转到目标域名

HTTP协议_第6张图片

基于域名

服务器软件根据请求头中的主机名(域名)来区分虚拟主机。

这种方法不需要分配额外的IP地址或端口,可以在同一个IP地址上承载多个虚拟主机。

cd /etc/httpd/conf.d
cp ipv.conf dns.conf
vim dns.conf #修改配置文件 除了域名不同
mkdir ipv2 #创建所需目录
vim /var/www/html/ipv2/index.html #编辑主页
#编辑本地hosts文件,添加地址映射
vim /etc/hosts
#切换到目标地址为192.168.2.103的虚拟机
#具体操作不再演示

cd /var/www/html 

mkdir ipv1 
mkdir ipv2

vim ./ipv1/index.html
vim ./ipv2/index.html

echo "

www.ipv1.com

"
/var/www/html/ipv1/index.html echo "

www.ipv2.com

"
/var/www/html/ipv2/index.html systemctl start httpd 打开虚拟机的内置浏览器,输入www.ipv1.com 和 www.ipv2.com,观察结果

HTTP协议_第7张图片

基于端口地址

每个虚拟主机使用同一个IP地址,但使用不同的端口号来区分。

cd /etc/httpd/conf.d
cp ipv.conf port.conf

vim port.conf #修改配置文件 除了端口不同
#测试是否成功
curl 192.168.2.102:8080
curl 192.168.2.102:80

HTTP协议_第8张图片

Cookie和session

Cookie

Cookie是服务器在用户的浏览器中存储的小型文本文件。当用户访问一个网站时,服务器可以通过HTTP响应的Set-Cookie标头将一个或多个Cookie发送给浏览器。浏览器会将这些Cookie存储在用户的计算机上,并在以后的请求中将它们发送回服务器。

每个Cookie都包括一个名称、一个值和一些可选的属性,如过期时间、域名、路径等。服务器可以使用Cookie来存储用户的偏好设置、会话标识符、购物车数据等。浏览器会在每次请求中自动发送与特定域名相关联的Cookie,使得服务器能够识别用户。

Cookie主要用于以下三个方面:

  • 会话状态管理(如用户登录状态、购物车、游戏分数或其它需要记录的信息)
  • 个性化设置(如用户自定义设置、主题等)
  • 浏览器行为跟踪(如跟踪分析用户行为等)

缺点:

1、使用cookie来传递信息,随着cookie个数的增多和访问量的增加,它占用的网络带宽也很大,试想假如cookie占用200字节,如果一天的PV有几个亿,那么它要占用多少带宽?

2、cookie并不安全,因为cookie是存放在客户端的,所以这些cookie可以被访问到,设置可以通过插件添加、修改cookie

Session

Session是在服务器端存储用户状态的一种机制。当用户首次访问一个网站时,服务器会为该用户创建一个唯一的会话标识符(Session ID)。这个标识符通常被存储在Cookie中,但也可以通过其他方式(如URL参数)进行传递。

服务器使用Session来存储用户信息和其他相关数据。在每个请求中,浏览器会将Session ID作为Cookie发送给服务器,使得服务器能够识别并恢复与该用户相关联的会话数据。Session数据通常存储在服务器的内存或持久化存储中。

session 缺点:

1、不容易在多台服务器之间共享,可以使用session绑定,session复制,session共享解决

2、session存放在服务器中,所以session如果太多会非常消耗服务器的性能cookie和session各有优缺点,在大型互联网系统中,单独使用cookie和session都是不可行的

cookie和session的相同和不同

  • cookie通常是在服务器生成,但也可以在客户端生成,session是在服务器端生成的
  • session 将数据信息保存在服务器端,可以是内存,文件,数据库等多种形式,cookie 将数据保存在客户端的内存或文件中
  • 单个cookie保存的数据不能超过4K,每个站点cookie个数有限制,比如IE8为50个、Firefox为50个、Opera为30个;session存储在服务器,没有容量限制
  • cookie存放在用户本地,可以被轻松访问和修改,安全性不高;session存储于服务器,比较安全
  • cookie有会话****cookie持久****cookie,生命周期为浏览器会话期的会话cookie保存在缓存,关闭浏览器窗口就消失,持久cookie被保存在硬盘,知道超过设定的过期时间;随着服务端session存储压力增大,会根据需要定期清理session数据
  • session中有众多数据,只将sessionID这一项可以通过cookie发送至客户端进行保留,客户端下次访问时,在请求报文中的cookie会自动携带sessionID,从而和服务器上的的session进行关联

ookie个数有限制,比如IE8为50个、Firefox为50个、Opera为30个;session存储在服务器,没有容量限制

  • cookie存放在用户本地,可以被轻松访问和修改,安全性不高;session存储于服务器,比较安全
  • cookie有会话****cookie持久****cookie,生命周期为浏览器会话期的会话cookie保存在缓存,关闭浏览器窗口就消失,持久cookie被保存在硬盘,知道超过设定的过期时间;随着服务端session存储压力增大,会根据需要定期清理session数据
  • session中有众多数据,只将sessionID这一项可以通过cookie发送至客户端进行保留,客户端下次访问时,在请求报文中的cookie会自动携带sessionID,从而和服务器上的的session进行关联

你可能感兴趣的:(http,网络协议,网络)