jetty 透明代理的实现

背景

一提到proxy,大家首先想到就是squid、varnish、apache、lighttpd之类,接下来我们看看jetty8中的ProxyServlet是如何实现这个功能的

ProxyServlet主要用到了continuation和http client两个技术点,如果了解了我的前几篇博文

  • jetty io:http://blog.csdn.net/pwlazy/article/details/7162992
  • jetty continuation:http://blog.csdn.net/pwlazy/article/details/7299719
  • jetty http client:http://blog.csdn.net/pwlazy/article/details/7389204

理解ProxyServlet就很容易了


配置

ProxyServlet官方配置如下:

<servlet>
    <servlet-name>TransparentProxy</servlet-name>
    <servlet-class>org.eclipse.jetty.servlets.ProxyServlet$Transparent</servlet-class>
    <async-support>true</async-support>
    <init-param>
      <param-name>Prefix</param-name><param-value>/javadoc-proxy</param-value>
    </init-param>
    <init-param>
      <param-name>ProxyTo</param-name><param-value>http://download.eclipse.org/jetty/stable-8/apidocs</param-value>
    </init-param>
    <init-param>
      <param-name>HostHeader</param-name><param-value>download.eclipse.org</param-value>
    </init-param>
    <load-on-startup>1</load-on-startup>
  </servlet>
  <servlet-mapping>
    <servlet-name>TransparentProxy</servlet-name>
    <url-pattern>/javadoc-proxy/*</url-pattern>
  </servlet-mapping>

servlet的初始化
  • host的黑名单/白名单
  • httpclient,比如最大线程、某个服务的最大连接数、请求超时时间、连接空闲时间等等

servlet的运行

  • 根据请求和配置确定目标url
  • 定义httpexchange,包括各种callback
  • 拷贝原始请求中的header到httpexchange,需要排除一些不需要的header比如connection、keep-alive(详见ProxyServlet中定义的_DontProxyHeaders)
  • 设置proxy的专有头部,比如X-Forwarded-For、X-Forwarded-Proto、X-Forwarded-Host、X-Forwarded-Server
  • 注册continuation
  • 调用httpclient发送httpexchange

内部运行原理

  • ProxyServlet使用了两个线程池来完成工作,一个jetty server使用,一个jetty http client使用​
  • server中的work线程将请求任务扔给http clientt中的worker线程,就会回收到server线程池中(这是第一次异步)
  • httpclient中的worker线程请求后台server的内容(这是第二次异步,因为请求过程一旦不能立即返回,worker线程就会把请求注册到select线程然后返回,这个我在博文http://blog.csdn.net/pwlazy/article/details/7389204详细描述了)
  • 一旦backend后端返回,就会调用exchange中定义的callback(这是第一次callback【时髦的说法应该是事件驱动】,也是http client级别的callback)
  • callback接下来也会调用continuation的complete方法通知jetty server,后台操作完成(这是第二次callback,是server级别的callback,通过continuation完成,这个过程我在博文http://blog.csdn.net/pwlazy/article/details/7299719也详述了)
  • 此时jetty server又会使用一个worker线程完成最后的输出到浏览器

小结

  • ProxyServlet综合使用了​continuation和httpclient​
  • ​ProxyServlet类似场景还是大量存在的,比如我们的web应用经常会调用后端的服务,比如cache、db、其他服务等​
  • 如果调用后端的服务能够做到象http client这样事件驱动,那么就可以很完美的实现整个web 应用完全无阻塞
  • 否则想仅仅使用一个应用级别线程池+continuation实现完全无阻塞简直就是白搭,因为那个压力完全会在应用线程池这边
  • 可见web 应用完全无阻塞是前提条件是所有的io点都必须无阻塞,这个条件看起来是有些高了,恐怕很多服务驱动程序都需要重写,鸭梨山大


你可能感兴趣的:(jetty)