超文本传输协议。HTTP是万维网的数据通信基础。HTTP是一个客户端终端(用户)和服务器端(网站)请求和应答的标准(TCP)。
客户端发起一个HTTP请求到服务器上指定端口(默认端口为80)。我们称这个客户端为用户代理程序(user agent)。应答的服务器上存储着一些资源。我们称这个应答服务器为源服务器(origin server)。在用户代理和源服务器中间可能存在多个“中间层”,比如代理服务器、网关或者隧道(tunnel)。
通常,由HTTP客户端发起一个请求,创建一个到服务器指定端口(默认是80端口)的TCP连接。HTTP服务器则在那个端口监听客户端的请求。一旦收到请求,服务器会向客户端返回一个状态,比如"HTTP/1.1 200 OK",以及返回的内容,如请求的文件、错误消息、或者其它信息。
HTTP协议采用了请求/响应模型。客户端向服务器发送一个请求报文,请求报文包含请求的方法、URL、协议版本、请求头部和请求数据。服务器以一个状态行作为响应,响应的内容包括协议的版本、成功或者错误代码、服务器信息、响应头部和响应数据。
客户端连接到Web服务器
发送HTTP请求
服务器接受请求并返回HTTP响应
释放连接TCP连接
客户端浏览器解析HTML内容
超文本传输协议(HTTP)的统一资源定位符将从因特网获取信息的五个基本元素包括在一个简单的地址中:
(1)传送协议。
(2)层级URL标记符号(为[//],固定不变)
(3)访问资源需要的凭证信息(可省略)
(4)服务器。(通常为域名,有时为IP地址)
(5)端口号。(以数字方式表示,若为HTTP的默认值“:80”可省略)
(6)路径。(以“/”字符区别路径中的每一个目录名称)
(7)查询。(GET模式的请求参数,以“?”字符为起点,每个参数以“&”隔开,再以“=”分开参数名称与数据,通常以UTF8的URL编码,避开字符冲突的问题)
请求方式:GET和POST方式
GET请求:地址栏访问、超链接访问都是get请求方式,get请求方式不安全,地址栏大小有限。
POST请求:内容在请求体中,数据安全,理论上内容可以无限。
请求格式:请求首行,请求头,情况空行,请求体。
请求首行:请求方式,请求地址,请求协议;
请求头:
1、Accept: text/html,application/xhtml+xml,application/xml;q=0.9,/;q=0.8
表示客户端可以接受的内容类型, 多个值使用;分号隔开 q=0.9 表示权重优先级,*/*表示可以接受任意类型内容;
2、Accept-Language: zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3
表示客户端可以接受的语言
3、User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Win64; x64;
浏览器信息,例如使用的是网井的内核, windows64位系统;
4、Accept-Encoding: gzip, deflate–>>支持的压缩格式
5、Host: localhost:8888====>访问地址
6、Connection: keep-alive —>>保持连接 和HTTP1.1版本有关,默认保持3s
7、Content-Type: application/x-www-form-urlencoded
表单提交时才有可能出现,表示表单的数据类型,使用url编码,url编码 % 16位数
8、Content-Length: 7 —>post请求 请求体长度
9、Upgrade-Insecure-Requests: 1–>>告诉服务器,浏览器可以处理https协议、
请求空行:就是一个分隔符,用来区分请求头和请求体的;
请求体:只有POST请求才有请求体,因此 POST请求的请求体中存放的是表单提交的键值对。
响应格式:响应首行,响应头,响应空行,响应正文。
响应首行:包含 协议–>>HTTP/1.1, 响应码(状态码)—>>200 , 状态码描述—>>OK
状态码:
1xx消息——请求已被服务器接收,继续处理
2xx成功——请求已成功被服务器接收、理解、并接受
3xx重定向——需要后续操作才能完成这一请求
4xx请求错误——请求含有词法错误或者无法被执行
5xx服务器错误——服务器在处理某个正确请求时发生错误
响应头:
1、server: Apache-Coyote/1.1—>> 服务器版本号
2、Content-Type: text/html;charset=ISO-8859-1响应字符集,告诉浏览器以什么样的字符集解码;
3、Content-Length: 265 响应体长度
4、Date: Fri, 23 Jun 2017 13:45:01 GMT 发送日期 少8个小时;
5、Expires: -1、Cache-control:no-cache、Pragma:no-cache 三个响应头一起使用, 表示禁止浏览器缓存当前页面. 每个浏览器厂商对认识的禁止头不同因此三 个一起使用。
web指的是网络,web应用开发指的是基于网络的应用程序开发。
Web应用开发分为web前端开发和web后端开发。
Web前端开发:我们可以简单的理解为开发一些网页。
Web后端开发:写一些逻辑判断程序。
两个程序之间通讯的应用大致可以分为两种:应用类程序,web类程序。
C/S:client与server,客户端与服务端架构。
B/S:browser和server,浏览器端和服务器端架构。
框架是来完成一些基础的工作,程序员在此基础上开发实现自己业务功能的代码,把程序员从繁琐的重复性的代码中解脱出来,提交开发效率。
socket 服务端 与浏览器的通讯。
所有的Web应用框架本质上就是一个socket服务端,而用户的浏览器就是一个socket客户端。 一些常用框架(Django、Tornado、Flash)是对socket服务端进行的封装,使得基础功能更加完善。
socket服务端功能可以划分为3部分:
1,负责与浏览器收发消息(socket),在python中有专门的框架。
2,根据用户访问不同的路径执行不同的函数。
3,从HTML中读取出内容,并且完成字符串的替换。
Tornado ——》框架自带上述(1,2,3)功能
Django ——》框架自带上述(2,3)功能,使用第三方的 (1)功能
Flask ——》框架自带上述(2)功能,使用第三方的(1,3)功能
Django,Tornado ——》大而全(做一个网站需要用到的技术都用)
Flask ——》轻量级只封装核心功能。
web框架。总体可以分为两部分功能,一部分是负责接受客户端信息的server socket代码,我们叫他服务器程序 ,一部分是进行逻辑判断代码我们叫做应用程序。
Web应用框架和服务器程序进行配合使用就需要遵循一定的规范。而这个规范就是WSGI。
它定义了使用Python编写的web应用程序与web服务器程序之间的接口格式,实现web应用程序与web服务器程序间的配合。
服务器和应用框架都遵循了WSGI协议后,就可以任意组合了更加灵活。Python标准库提供的独立WSGI服务器叫wsgiref,Django开发环境用的就是这个模块来做服务器。
1,命令行安装及创建Django项目,下载命令 pip install Django==2.1.2(版本号)
2,检查是否能正常运行:Django-admin
3,添加环境变量(如果不能正常运行):需配置\python35\Scripts\ 以及\python35\两个环境变量
#框架的本质
import socket
server=socket.socket(socket.AF_INET,socket.SOCK_STREAM) # 基于互联网,基于tcp协议
server.bind(('127.0.0.1',9999))
server.listen(128) #接受量
while True:
print('等待客户端的连接:')
client,addr=server.accept()
content=client.recv(1024) #默认二进制内容,接受的内容是请求报文
content=content.decode('utf-8')
print(content)
#给浏览器发送内容
client.send('HTTP/1.1 200 OK\r\n'.encode('utf-8'))#设置响应首行
client.send('Content-Type:text/html;charset=utf-8\r\n'.encode('utf-8'))#设置响应头
#返回的是文本类型的html,并且以utf-8编码进行解码
client.send('\r\n'.encode('utf-8')) #设置响应空行
client.send('呵呵的hihi'.encode('utf-8')) #设置响应体内容
client.close()
#函数版
import socket
server=socket.socket(socket.AF_INET,socket.SOCK_STREAM) # 网络,基于tcp协议
server.bind(('127.0.0.1',9999))
server.listen(128) #接受量
def home(path):
msg = '这是{}页面'.format(path).encode('utf-8')
return msg
def index(path):
msg = 'this is a {} page'.format(path).encode('utf-8')
return msg
def error(path):
msg = 'sorry {} 404 not found...'.format(path).encode('utf-8')
return msg
path_lis=[
('/home',home),
('/index',index),
]
while True:
print('等待客户端的连接:')
client,addr=server.accept()
content=client.recv(1024)
content=content.decode('utf-8')
print(content)
data=content.split('\r\n')[0] #按\r\n 切片 获得请求首行
path=data.split(' ')[1] #按照空格切片 得到请求路径
print('path',path)
func=None
for path_tup in path_lis:
if path_tup[0]==path:
func=path_tup[1]
break
if func:
msg =home(path)
else:
msg = error(path)
#向页面返回内容
client.send('HTTP/1.1 200 OK\r\n'.encode('utf-8'))
client.send('Content-Type:text/html;charset=utf-8\r\n'.encode('utf-8'))
client.send('\r\n'.encode('utf-8'))
client.send(msg)
client.close()