gunicorn的简单总结

您好,我是码农飞哥,感谢您阅读本文!本文主要将对gunicorn进行一个简单的总结。

文章目录

    • gunicorn是什么
    • gunicorn的安装
      • 安装
      • 查看gunicorn的版本
    • 运行gunicorn
    • 工作模式
    • 性能实践
    • 参考

gunicorn是什么

Gunicorn 是一个 Python 的 WSGI HTTP 服务器。它所在的位置通常是在反向代理(如 Nginx)或者 负载均衡(如 AWS ELB)和一个 web 应用(比如 Django 或者 Flask)之间。它是一个移植自Ruby的Unicorn项目的pre-fork worker模型,即支持eventlet,也支持greenlet。

gunicorn的安装

目前Gunicorn只能运行在Linux环境中,不支持windows平台

安装

# 安装最新版本的gunicorn
$ pip install gunicorn
#安装指定版本的gunicorn
pip install gunicorn==19.9.0
#异步模式
pip install gevent==1.4.0

查看gunicorn的版本

$ pip show gunicorn

运行gunicorn

$ gunicorn [OPTIONS] $(MODULE_NAME):$(VARIABLE_NAME)

其中MODULE_NAME对应的是python文件,VARIABLE_NAME对应web应用实例。 [OPTIONS]的参数类型如下:

  1. -c CONFIG, --config=CONFIG 指定项目路径下的配置文件,如gunicorn -c gunicorn.py manage:app。gunicorn.py文件中设置了workers等参数。
  2. -b BIND, --bind=BIND 指定一个服务器的地址和端口,格式是 ( H O S T ) : (HOST): (HOST):(PORT)。例如:gunicorn -b 0.0.0.0:18005 manage:app
  3. -w WORKERS, --workers=WORKERS 是指定工作进程的数量,单核机器上这个数量一般在2-4个之间。例如:gunicorn -w 4 manage:app
  4. -n APP_NAME, --name=APP_NAME 指定APP的名称
  5. -k WORKERCLASS, --worker-class=WORKERCLASS 指定工作模式。工作进程运行的模式,一共有 sync, eventlet, gevent, tornado, gthread 五种模式,默认是sys模式
  6. 加入- -reload,则代码变更后,gunicorn会自动重启,这样就可以进行开发调试。

工作模式

  1. 同步工作模式(Sync Workers(sync))
    这是最基本的工作模式,也是默认的工作模式,线程为native类型。即请求先来后到,排队模式。
  2. 异步工作模式(Async Workers(gevent,eventlet))
    gevent和eventlet都是基于Greentlet库,利用python协程实现的。安装方式:
    gevent是pip install gunicorn[gevent]
    eventlet是pip install gunicorn[eventlet]
    Gunicorn允许通过设置对应的worker类来使用这些异步Python库。这里的设置适用于我们想要在单核机器上运行的gevent:
gunicorn --worker-class=gevent --worker-connections=1000 --workers=3 main:app

worker-connections 是对于 gevent worker 类的特殊设置。(2*CPU)+1 仍然是建议的workers 数量。因为我们仅有一核,我们将会使用 3 个worker。在这种情况下,最大的并发请求数量是3000。(3个worker*1000个连接/worker
当worker指定为gevent或者evenlet类型时,线程变成基于Greentlet的task(伪线程),这时候线程数量threads参数是无效的。
使用gevent模式会出现一些兼容性问题。
使用gevent时,系统会使用monkey patch。系统的部分函数会被修改,
有些库会兼容gevent的类型,
例如,任务调度的库apscheduler,web socket需要socketio的库等,需要专门选择gevent的函数。
而有些库则直接无法使用,例如多进程multiprocess。
例如,在一个api请求中,如果需要使用多核cpu资源,采用multiprocess进行多进程计算。则会出现卡死的问题。gevent中,不能使用multiprocess库

  1. Tornado Workers (tornado)
    tornado利用python Tornado框架来实现。安装方式是:pip install gunicorn[tornado]
  2. AsyncIO Workers (tornado)
    gthread采用的是线程工作模式,利用线程池管理连接,安装方式是:pip install gunicorn[gthread]
    Gunicorn允许每个worker拥有多个线程。在这种场景下,Python应用程序每个worker都会加载一次,同一个worker生成的每个线程共享相同的内存空间。为了在 Gunicorn 中使用多线程。我们使用了 threads 模式。每一次我们使用 threads 模式,worker 的类就会是 gthread:
gunicorn --workers=5 --threads=2 main:app

该命令等同于:

gunicorn --workers=5 --threads=2 --worker-class=gthread main:app

该例中里面的最大并发请求数是 worker*线程,也就是10。

性能实践

  1. 如果这个应用是I/O受限,通常可以通过使用**“伪线程”(gevent或asyncio)的工作模式**来得到最佳性能。正如我们了解到的,Gunicorn通过设置合适的worker类并将workers数量调整到(2*CPU)+1来支持这种编程范式。
  2. 如果这个应用是CPU受限,那么应用程序处理多少并发请求就并不重要,唯一重要的是并行请求的数量。因为Python’s GIL,线程和’伪线程’并不能以并行模式执行,可以将worker的数量改成CPU的核数,理解到最大的并行请求数量其实就是核心数。这时候适合的工作模式是sync工作模式。
  3. 如果不确定应用程序的内存占用,使用多线程以及相应的gthread worker类会产生更好的性能,因为应用程序会在每个worker上都加载一次,并且在同一个worker上运行的每个线程都会共享一些内存,但这需要一些额外的CPU消耗。
  4. 如果你不知道你自己应该选择什么就从最简单的配置开始,就只是 workers 数量设置为 (2*CPU)+1 并且不用考虑 多线程。从这个点开始,就是所有测试和错误的基准环境。如果瓶颈在内存上,就开始引入多线程。如果瓶颈在 I/O 上,就考虑使用不同的 Python 编程范式。如果瓶颈在 CPU 上,就考虑添加更多内核并且调整 workers 数量。

参考

Gunicorn介绍
[译] 通过优化 Gunicorn 配置提高性能

你可能感兴趣的:(Python笔记,gunicorn,python)