一起学习Django框架(十)Django中间件;浅谈CSRF_TOKEN

目录

  • Django中间件(MiddleWare)
    • 一、什么是中间件
    • 二、中间件的作用
    • 三、自定义中间件
      • 3.1 process_request与process_response方法
      • 3.2 process_view方法
      • 3.3 process_exception
      • 3.4 process_template_response(不常用)
  • CSRF_TOKEN
    • 一、CSRF是什么
    • 二、CSRF攻击原理
    • 三、CSRF攻击防范
    • 四、Django处理CSRF攻击
      • 4.1 CSRF处理流程
      • 4.2 局部禁用CSRF
      • 4.3 局部启用CSRF


Django中间件(MiddleWare)

中间件本身是一个很大的范围,比如:数据库中间件、服务器中间件、消息队列中间件等等…

我们这里了解到的是Django的中间件。


一、什么是中间件

Django中间件:介于request请求与response响应中间的一道处理过程,相对比较轻量级,并且在全局上改变Django的输入与输出。因为改变的是全局,所以需要谨慎实用,用不好会影响到性能

Django官方对中间件的定义:

Middleware is a framework of hooks into Django’s request/response processing.
中间件是Django请求/响应处理的一个钩子框架。
It’s a light, low-level “plugin” system for globally altering Django’s input or output.
它是一个轻量级的、低级的“插件”系统,用于全局改变Django的输入或输出。


二、中间件的作用

如果你想修改请求,例如被传送到view中的HttpRequest对象。 或者你想修改view返回的HttpResponse对象,这些都可以通过中间件来实现。

能你还想在view执行之前做一些操作,这种情况就可以用middleware来实现。

Django默认的中间件:在django项目的settings.py文件,有一个 MIDDLEWARE_CLASSES 变量,其中每一个元素就是一个中间件,如下

MIDDLEWARE = [
    'django.middleware.security.SecurityMiddleware',
    'django.contrib.sessions.middleware.SessionMiddleware',
    'django.middleware.common.CommonMiddleware',
    'django.middleware.csrf.CsrfViewMiddleware',
    'django.contrib.auth.middleware.AuthenticationMiddleware',
    'django.contrib.messages.middleware.MessageMiddleware',
    'django.middleware.clickjacking.XFrameOptionsMiddleware',
]

中间件的执行顺序:

一起学习Django框架(十)Django中间件;浅谈CSRF_TOKEN_第1张图片
每一个中间件在请求来的时候或者响应的时候都具有一定的作用。


三、自定义中间件

中间件里面主要有以下方法:

process_request(self,request)

process_view(self, request, callback, callback_args, callback_kwargs)

process_template_response(self,request,response)

process_exception(self, request, exception)

process_response(self, request, response)

3.1 process_request与process_response方法

当用户发起请求的时候会依次经过所有的的中间件,这个时候的请求首先进过process_request,最后到达views的函数中,views函数处理后,在依次穿过中间件,这个时候是process_response,最后返回给请求者。

我们要自己定义中间件的话,需要写一个类,并且继承MiddlewareMixin

from django.utils.deprecation import MiddlewareMixin

第一步:需要建立一个py文件来编写我们的中间件,建议在app应用下面创建。

MyMiddleWare.py

from django.utils.deprecation import MiddlewareMixin

class Md1(MiddlewareMixin):
    def process_request(self,request):
        print('请求到达了Md1中间件')

    def process_response(self,request,response):
        print('Md1中间件响应了请求')
        return response

class Md2(MiddlewareMixin):
    def process_request(self,request):
        print('请求到达了Md2中间件')

    def process_response(self,request,response):
        print('Md2中间件响应了请求')
        print(response.content)
        return response

第二步:在settings.py文件里面加入我们自定义的中间件

MIDDLEWARE = [
    'django.middleware.security.SecurityMiddleware',
    'django.contrib.sessions.middleware.SessionMiddleware',
    'django.middleware.common.CommonMiddleware',
    'django.middleware.csrf.CsrfViewMiddleware',
    'django.contrib.auth.middleware.AuthenticationMiddleware',
    'django.contrib.messages.middleware.MessageMiddleware',
    'django.middleware.clickjacking.XFrameOptionsMiddleware',
    'app01.MyMiddleWare.Md1',
    'app01.MyMiddleWare.Md2',
]

第三步:定义视图函数

def index(request):
    return HttpResponse('Hello World!')

当我们浏览器朝服务端发送请求,必定会经过我们刚才定义的中间件
一起学习Django框架(十)Django中间件;浅谈CSRF_TOKEN_第2张图片
process_response方法的reuqest则是请求,response则是视图函数返回的内容到了中间件里面,然后由中间件return出去。所以我们是可以在process_response里面不return视图函数返回的内容,自己定义内容返回。

从下图看,正常的情况下按照绿色的路线进行执行,假设中间件1有返回值,则按照红色的路线走,直接执行该类下的 process_response 方法返回,后面的其他中间件就不会执行。

一起学习Django框架(十)Django中间件;浅谈CSRF_TOKEN_第3张图片
也就是说中间件的process_request方法使用了return,那么其后面的中间件将不再执行,直接执行该中间件和其上面中间件的process_response方法,最终将某个process_request里面的return值返回给请求者。

由此总结:

  • 中间件的process_request方法是在执行视图函数之前执行的。
  • 当配置多个中间件时,会按照MIDDLEWARE中的注册顺序,也就是列表的索引值,从前到后依次执行的。
  • 不同中间件之间传递的request都是同一个对象

多个中间件中的process_response方法是按照MIDDLEWARE中的注册顺序倒序执行的,也就是说第一个中间件的process_request方法首先执行,而它的process_response方法最后执行,最后一个中间件的process_request方法最后一个执行,它的process_response方法是最先执行。



3.2 process_view方法

该方法格式:process_view(request, view_func, view_args, view_kwargs)

process_view方法的四个参数:

  • request:HTTPRequest对象
  • view_func:Django即将调用的视图函数
  • view_args:将传递给视图的位置参数的元组
  • view_kwargs 是将传递给视图的关键字参数的字典

view_args 和 view_kwargs 都不包含第一个视图参数(request)

process_view 方法是在视图函数之前,process_request 方法之后执行的。

它应该返回None或一个HttpResponse对象。 如果返回None,Django将继续处理这个请求,执行任何其他中间件的process_view方法,然后在执行相应的视图。 如果它返回一个HttpResponse对象,Django不会调用适当的视图函数。 它将执行中间件的process_response方法并将应用到该HttpResponse并返回结果。

自定义中间件

class Md2(MiddlewareMixin):
    def process_request(self,request):
        print('请求到达了Md2中间件')

    def process_view(self,request,view_func,view_args,view_kwargs):
        print('process_view方法在视图函数之前执行!!')

    def process_response(self,request,response):
        print('Md2中间件响应了请求')
        print(response.content)
        return response

打印执行顺序:

请求到达了Md1中间件
请求到达了Md2中间件
Md1 process_view方法
Md2 process_view方法
index视图函数执行了
Md2中间件响应了请求
b'Hello World!'
Md1中间件响应了请求

下图分析上面代码的执行过程:
一起学习Django框架(十)Django中间件;浅谈CSRF_TOKEN_第4张图片
当最后一个中间的process_request到达路由关系映射之后,返回到中间件1的process_view,然后依次往下,到达views函数,最后通过process_response依次返回到达用户。

注意:process_view如果有返回值,会越过其他的process_view以及视图函数,但是所有的process_response都还会执行。



3.3 process_exception

process_exception(self, request, exception)

该方法两个参数:

  • 一个HttpRequest对象

  • 一个exception是视图函数异常产生的Exception对象。

这个方法只有在视图函数中出现异常了才执行,它返回的值可以是一个None也可以是一个HttpResponse对象。如果是HttpResponse对象,Django将调用模板和中间件中的process_response方法,并返回给浏览器,否则将默认处理异常。如果返回一个None,则交给下一个中间件的process_exception方法来处理异常。它的执行顺序也是按照中间件注册顺序的倒序执行。

视图函数制造错误

def index(request):
    print('index视图函数执行了')
    lis = [1,2,3]
    lis[4]

中间件

class Md1(MiddlewareMixin):
    def process_request(self,request):
        print("Md1请求")
        
    def process_response(self,request,response):
        print("Md1返回")
        return response

    def process_view(self, request, callback, callback_args, callback_kwargs):

        print("md1 process_view...")

    def process_exception(self,request,exception):
        print("md1 process_exception...")


class Md2(MiddlewareMixin):
    def process_request(self,request):
        print("Md2请求")

    def process_response(self,request,response):
        print("Md2返回")
        print(response.content)
        return response

    def process_view(self, request, view_func, view_args, view_kwargs):
        print("md2 process_view...")

    def process_exception(self, request, exception):
        print("md2 process_exception...")
        return HttpResponse(exception)

当process_exception进行return HttpResponse后,process_response方法就会拿到其返回的数据。

打印结果:

Md1请求
Md2请求
md1 process_view...
md2 process_view...
index视图函数执行了
md2 process_exception...
Md2返回
b'list index out of range'
Md1返回

流程图如下:

当views出现错误时:
一起学习Django框架(十)Django中间件;浅谈CSRF_TOKEN_第5张图片



3.4 process_template_response(不常用)

该方法对视图函数返回值有要求,必须是一个含有render方法类的对象,才会执行此方法。

process_template_response 函数是在视图函数执行完后立即执行的

视图

def index(request):
    print("这里是 index 页面")
    repsponse = HttpResponse("这里是主页面 index")

    def render():
        print("这里是 index 函数里的 render 方法")
        return HttpResponse("index")

    repsponse.render = render
    return repsponse

中间件

class Md2(MiddlewareMixin):
    def process_request(self,request):
        print("Md2请求")

    def process_response(self,request,response):
        print("Md2返回")
        return response

    def process_view(self, request, view_func, view_args, view_kwargs):
        print(view_func)
        print("md2 process_view...")

    def process_template_response(self, request, response):
        print("视图函数执行完毕,且返回了render")
        return response

打印效果:

Md2请求
md2 process_view...
这里是 index 页面
视图函数执行完毕,且返回了render
这里是 index 函数里的 render 方法
Md2返回


CSRF_TOKEN

一、CSRF是什么

CSRF(Cross-site request forgery)跨站请求伪造,也被称为“One Click Attack”或者Session Riding,通常缩写为CSRF或者XSRF,是一种对网站的恶意利用。尽管听起来像跨站脚本(XSS),但它与XSS非常不同,XSS利用站点内的信任用户,而CSRF则通过伪装来自受信任用户的请求来利用受信任的网站。与XSS攻击相比,CSRF攻击往往不大流行(因此对其进行防范的资源也相当稀少)和难以防范,所以被认为比XSS更具危险性

可以这样来理解:

攻击者盗用了你的身份,以你的名义发送恶意请求,对服务器来说这个请求是完全合法的,但是却完成了攻击者所期望的一个操作,比如以你的名义发送邮件、发消息,盗取你的账号,添加系统管理员,甚至于购买商品、虚拟货币转账等。 如下:其中Web A为存在CSRF漏洞的网站,Web B为攻击者构建的恶意网站,User C为Web A网站的合法用户


二、CSRF攻击原理

如下图:

一起学习Django框架(十)Django中间件;浅谈CSRF_TOKEN_第6张图片

从上图可以看出,要完成一次CSRF攻击,受害者必须依次完成两个步骤:

  1. 登录受信任网站A,并在本地生成Cookie。

  2. 在不登出A的情况下,访问危险网站B。

看到这里,你也许会说:“如果我不满足以上两个条件中的一个,我就不会受到CSRF的攻击”。是的,确实如此,但你不能保证以下情况不会发生:

  1. 你不能保证你登录了一个网站后,不再打开一个tab页面并访问另外的网站。

  2. 你不能保证你关闭浏览器了后,你本地的Cookie立刻过期,你上次的会话已经结束。(事实上,关闭浏览器不能结束一个会话,但大多数人都会错误的认为关闭浏览器就等于退出登录/结束会话了…)

  3. 上图中所谓的攻击网站,可能是一个存在其他漏洞的可信任的经常被人访问的网站。



三、CSRF攻击防范

目前防御 CSRF 攻击主要有三种策略:验证 HTTP Referer 字段;在请求地址中添加 token 并验证;在 HTTP 头中自定义属性并验证

(1)验证 HTTP Referer 字段

根据 HTTP 协议,在 HTTP 头中有一个字段叫 Referer,它记录了该 HTTP 请求的来源地址。在通常情况下,访问一个安全受限页面的请求来自于同一个网站,比如需要访问 http://bank.example/withdraw?account=bob&amount=1000000&for=Mallory,用户必须先登陆 bank.example,然后通过点击页面上的按钮来触发转账事件。这时,该转帐请求的 Referer 值就会是转账按钮所在的页面的 URL,通常是以 bank.example 域名开头的地址。而如果黑客要对银行网站实施 CSRF 攻击,他只能在他自己的网站构造请求,当用户通过黑客的网站发送请求到银行时,该请求的 Referer 是指向黑客自己的网站。因此,要防御 CSRF 攻击,银行网站只需要对于每一个转账请求验证其 Referer 值,如果是以 bank.example 开头的域名,则说明该请求是来自银行网站自己的请求,是合法的。如果 Referer 是其他网站的话,则有可能是黑客的 CSRF 攻击,拒绝该请求。

这种方法的显而易见的好处就是简单易行,网站的普通开发人员不需要操心 CSRF 的漏洞,只需要在最后给所有安全敏感的请求统一增加一个拦截器来检查 Referer 的值就可以。特别是对于当前现有的系统,不需要改变当前系统的任何已有代码和逻辑,没有风险,非常便捷。

然而,这种方法并非万无一失。Referer 的值是由浏览器提供的,虽然 HTTP 协议上有明确的要求,但是每个浏览器对于 Referer 的具体实现可能有差别,并不能保证浏览器自身没有安全漏洞。使用验证 Referer 值的方法,就是把安全性都依赖于第三方(即浏览器)来保障,从理论上来讲,这样并不安全。事实上,对于某些浏览器,比如 IE6 或 FF2,目前已经有一些方法可以篡改 Referer 值。如果 bank.example 网站支持 IE6 浏览器,黑客完全可以把用户浏览器的 Referer 值设为以 bank.example 域名开头的地址,这样就可以通过验证,从而进行 CSRF 攻击。

即便是使用最新的浏览器,黑客无法篡改 Referer 值,这种方法仍然有问题。因为 Referer 值会记录下用户的访问来源,有些用户认为这样会侵犯到他们自己的隐私权,特别是有些组织担心 Referer 值会把组织内网中的某些信息泄露到外网中。因此,用户自己可以设置浏览器使其在发送请求时不再提供 Referer。当他们正常访问银行网站时,网站会因为请求没有 Referer 值而认为是 CSRF 攻击,拒绝合法用户的访问。

(2)在请求地址中添加 token 并验证

CSRF 攻击之所以能够成功,是因为黑客可以完全伪造用户的请求,该请求中所有的用户验证信息都是存在于 cookie 中,因此黑客可以在不知道这些验证信息的情况下直接利用用户自己的 cookie 来通过安全验证。要抵御 CSRF,关键在于在请求中放入黑客所不能伪造的信息,并且该信息不存在于 cookie 之中。可以在 HTTP 请求中以参数的形式加入一个随机产生的 token,并在服务器端建立一个拦截器来验证这个 token,如果请求中没有 token 或者 token 内容不正确,则认为可能是 CSRF 攻击而拒绝该请求。

这种方法要比检查 Referer 要安全一些,token 可以在用户登陆后产生并放于 session 之中,然后在每次请求时把 token 从 session 中拿出,与请求中的 token 进行比对,但这种方法的难点在于如何把 token 以参数的形式加入请求。对于 GET 请求,token 将附在请求地址之后,这样 URL 就变成 http://url?csrftoken=tokenvalue。 而对于 POST 请求来说,要在 form 的最后加上 ,这样就把 token 以参数的形式加入请求了。但是,在一个网站中,可以接受请求的地方非常多,要对于每一个请求都加上 token 是很麻烦的,并且很容易漏掉,通常使用的方法就是在每次页面加载时,使用 javascript 遍历整个 dom 树,对于 dom 中所有的 a 和 form 标签后加入 token。这样可以解决大部分的请求,但是对于在页面加载之后动态生成的 html 代码,这种方法就没有作用,还需要程序员在编码时手动添加 token。

该方法还有一个缺点是难以保证 token 本身的安全。特别是在一些论坛之类支持用户自己发表内容的网站,黑客可以在上面发布自己个人网站的地址。由于系统也会在这个地址后面加上 token,黑客可以在自己的网站上得到这个 token,并马上就可以发动 CSRF 攻击。为了避免这一点,系统可以在添加 token 的时候增加一个判断,如果这个链接是链到自己本站的,就在后面添加 token,如果是通向外网则不加。不过,即使这个 csrftoken 不以参数的形式附加在请求之中,黑客的网站也同样可以通过 Referer 来得到这个 token 值以发动 CSRF 攻击。这也是一些用户喜欢手动关闭浏览器 Referer 功能的原因。

(3)在 HTTP 头中自定义属性并验证

这种方法也是使用 token 并进行验证,和上一种方法不同的是,这里并不是把 token 以参数的形式置于 HTTP 请求之中,而是把它放到 HTTP 头中自定义的属性里。通过 XMLHttpRequest 这个类,可以一次性给所有该类请求加上 csrftoken 这个 HTTP 头属性,并把 token 值放入其中。这样解决了上种方法在请求中加入 token 的不便,同时,通过 XMLHttpRequest 请求的地址不会被记录到浏览器的地址栏,也不用担心 token 会透过 Referer 泄露到其他网站中去。



四、Django处理CSRF攻击

4.1 CSRF处理流程

在之前的章节我们的web每次发送post请求给后端都会被Django给阻拦下来,那是因为Django为了不让我们的站点遭受CSRF攻击,所以在MiddleWare中间件内进行了一个csrf校验。

'django.middleware.csrf.CsrfViewMiddleware',

Django的CSRF中间件说明:

Require a present and correct csrfmiddlewaretoken for POST requests that
have a CSRF cookie, and set an outgoing CSRF cookie.

This middleware should be used in conjunction with the {% csrf_token %}
template tag.

要求提供正确的csrfmiddlewaretoken,以便发布
拥有一个CSRF cookie,并设置一个传出的CSRF cookie。
此中间件应与{% csrf_token %}一起使用
模板标记。

Django 第一次响应来自某个客户端的请求时,会在服务器端随机生成一个 token,把这个 token 放在 cookie 里。然后每次 POST 请求都会带上这个 token。

在所有的 POST 表单时,必须包含一个name='csrfmiddlewaretoken'属性,只需要在模板里加一个 tag, Django 就会自动帮你生成,见下面:

form表单设置


<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>registertitle>
    <script src="https://cdn.bootcdn.net/ajax/libs/jquery/3.4.1/jquery.min.js">script>
    <script src="https://cdn.bootcdn.net/ajax/libs/twitter-bootstrap/3.4.1/js/bootstrap.min.js">script>
    <link href="https://cdn.bootcdn.net/ajax/libs/twitter-bootstrap/3.4.1/css/bootstrap.min.css" rel="stylesheet">
head>
<body>
<div class="container">
    <div class="row">
        <h1 class="text-center">登录页面h1>
        <form action="" method="post">
            {% csrf_token %} 
            <p>用户名:<input type="text" name="username" class="form-control">p>
            <p>密码:<input type="password" name="password" class="form-control">p>
            <p><input type="submit" value="登录" class="form-control btn-warning">p>
        form>
    div>
div>
body>
html>

视图

def auth_login(request):
    if request.method == 'POST':
        username = request.POST.get('username')
        password = request.POST.get('password')

        if username == 'root' and password == 'root':
            return HttpResponse('登录成功!!!')
        
        return HttpResponse('账号或者密码错误')
    return render(request, 'login.html')

此时我们打开页面就可以发现:
一起学习Django框架(十)Django中间件;浅谈CSRF_TOKEN_第7张图片
Django在模板内添加了一个input标签,name属性值为csrfmiddlewaretoken,value值就是Django设置token

一起学习Django框架(十)Django中间件;浅谈CSRF_TOKEN_第8张图片
整体流程如下:

  • 用户访问某个表单页面
  • 服务端生成一个Token,放在用户的Session中,或者浏览器的Cookie中
  • 在页面表单附带上Token参数。
  • 用户提交请求后,服务端验证表单中的Token是否与用户Session(或Cookies)中的Token一致,一致为合法请求,不是则非法请求。

每次刷新页面form表单里面的name属性为csrfmiddlewaretoken的input标签value值都会不一样,但是多次页面刷新可以发现,请求头 与 响应头里面的csrftoken值相同,CSRF中间件内获取了我们form提交的token值,然后进行处理,再与之前响应给我们的token对比,相同的话则是合法用户

CSRF中间件:process_view函数的部分源码
一起学习Django框架(十)Django中间件;浅谈CSRF_TOKEN_第9张图片
虽说form表单里面的token值在不断变化(不要忘了,它是我们Django设置的),但是CSRF中间内有方式可以将它进行解密,最终与请求头里面的token值相同。

if not _compare_salted_tokens(request_csrf_token, csrf_token)会将form表单内的token值与请求头里面的token值对比。

没配对成功返回错误信息至客户端,也就是我们平常所看到的Forbidden (403) CSRF verification failed. Request aborted.
一起学习Django框架(十)Django中间件;浅谈CSRF_TOKEN_第10张图片
如果form表单提交的token值是手动输入的或者不是当前页面服务端生成的token值,那么肯定是无法与请求头里面的token值相同,那么就会POST提交失败。


4.2 局部禁用CSRF

在MIDDLEWARE中间件里面的CSRF中间件代表全局启用,只要接收处理POST请求必须校验请求里面的CSRF,但是我们也可以局部禁用掉CSRF的处理(也就是某个视图函数处理POST请求不需要校验CSRF)

from django.views.decorators.csrf import csrf_exempt

@csrf_exempt
def test(request):
    return HttpResponse('ok')

此时就算开启了CSRF校验中间件,那么我们这个视图函数还是可以避免CSRF校验,不携带相关的token值也是可以访问的。


4.3 局部启用CSRF

当我们在MIDDLEWARE中间件注释掉了CSRF相关的中间件,那么就代表全局禁用了CSRF,但是Django依旧提供给了我们针对某块区域启用CSRF校验的方法。

from django.views.decorators.csrf import csrf_protect

@csrf_protect
def test(request):
    return HttpResponse('ok')

此时就算不开始CSRF校验中间件,我们这个视图函数还是需要提交POST请求时携带csrf相关的token且必须是由当前服务端生成响应的才合法。


如果本文对您有帮助,别忘一键3连,您的支持就是笔者最大的鼓励,感谢阅读!

下一章传送门:Auth组件


技术小白记录学习过程,有错误或不解的地方请指出,如果这篇文章对你有所帮助请点赞 收藏+关注 子夜期待您的关注,谢谢支持!

你可能感兴趣的:(Django,python,中间件,csrf,Django)