关于网络的一些基本原理

    URL,即统一资源定位符,这是我们很熟悉的一个概念,简单点理解我们可以把我们平时在搜索地址栏输入的网址看作URL,但是在实际上,URL只是URI(统一资源标志符)的一个子集,也就是说每个URL都是URI,但不是每个URI都是URL,事实上URI还包括一个子类叫作URN,即统一资源名称,它就像书本的ISBN,可以唯一标识这本书,却无法指定其位置,目前URN用得是很少的。

    HTTPHTTPS这两大协议是我们经常看到的,实际上HTTPS就是HTTP的安全版,它在HTTP的下层加入了SSL层,通过它传输的内容都是经过SSL加密的,它的主要作用可以分为两种:一是建立一个信息安全通道来保证数据传输的安全,二是确认网站的真实性,凡是使用了HTTPS的网站,都可以通过点击浏览器地址栏的锁头标志来查看网站认证之后的真实信息,也可以通过CA机构颁发的安全签章来查询,目前越来越多的网站都要求使用HTTPS。如Chrome浏览器就会对未进行HTTPS加密的网址链接亮出风险提示。

    事实上在我们访问网页的时候,可以打开开发者工具看到输入URL后到底发生了什么,总的来说分成了两部分,请求和响应。

    请求中最重要的大概是请求头和请求体了,请求头包含着Cookie,Host等用来说明服务器要使用的附加信息,而请求体则是承载着POST请求中的表单数据,对于GET请求,请求体为空。

    响应则大致分为了响应状态码,响应头,响应体,状态码表示服务器的响应状态,这里举一些比较常见的:200表示服务器正常响应,404代表页面未找到,500代表服务器内部发生错误,403代表服务器拒绝请求等等。响应头则包含了服务器对请求的应答信息,大多是一些信息说明,当然其中最重要的还是响应体,它包含着我们的想要的HTML代码,或者图片等等资源。

    这里再简单说说代理的概念,代理实际上指的就是代理服务器,它的功能是代理网络用户去取得网络信息。形象地说,它是网络信息的中转站。在我们正常请求一个网站时,是发送了请求给Web服务器,Web服务器把响应传回给我们。如果设置了代理服务器,实际上就是在本机和服务器之间搭建了一个桥,此时本机不是直接向Web服务器发起请求,而是向代理服务器发出请求,请求会发送给代理服务器,然后由代理服务器再发送给Web服务器,接着由代理服务器再把Web服务器返回的响应转发给本机。这样我们同样可以正常访问网页,但这个过程中Web服务器识别出的真实IP就不再是我们本机的IP了,就成功实现了IP伪装,这就是代理的基本原理。

 

你可能感兴趣的:(关于网络的一些基本原理)