本文仅为自己学习tomcat7源码过程中理解的一些笔记,并不是详细分析,仅供参考
读源码时首先要大致理解各个核心模块之间的关系,核心架构如下图,一图胜千言
下面是tomcat的运行流程的概括,需要编译tomcat源码后debug一步步配合源码来看。
org.apache.catalina.startup.Bootstrap是tomcat的启动类,里面的main方法是整个项目的入口,main方法主要做了三件事:
1.初始化:bootstrap.init()。其中,setCatalinaHome()和setCatalinaBase()分别设置catalina.home和catalina.base的系统属性,然后initClassLoaders()初始化三个classLoader:commonLoader用于加载common/lib目录下的jar包和class文件;catalinaLoader用于加载server/lib目录下的jar包和class文件;sharedLoader用于加载shared/lib目录下的jar包和class文件。commonLoader是catalinaLoader和sharedLoader的parent classloader,Tomcat6以后,查看catalina.properties文件可以看见server.loader和shared.loader都是为空的。接下来创建org.apache.catalina.startup.Catalina这个类的实例并赋给catalinaDaemon。
2.装配容器:daemon.load(args)。利用反射调用org.apache.catalina.startup.Catalina的load方法来实现。load方法首先initDirs()初始化目录和命名规则,为digester解析XML做准备。createStartDigester()创建一个digester对象,设置xml的解析规则,具体见Digester解析xml文件。然后将server.xml转化成org.xml.sax.InputSource后调用digester.parse(inputSource)进行解析。server.xml文件解析完后,会生成org.apache.catalina.core包中的各种StandardXXX类的实例,比如StandardServer、StandardService、StandardEngine等等。最后getServer().init()实际上调用了StandardServer类的initInternal方法,对StandardServer对象进行初始化,这个方法先是注册了MBean,让JMX管理tomcat容器,再遍历Server中所有的Service调用services[i].init()初始化Service,Service的初始化也是在StandardService类的initInternal方法中完成的,其中先初始化了容器container.init(),这里的容器指的是StandardEngine,即会调用StandardEngine的initInternal方法,再初始化Executor,最后初始化两个连接器[Connector[HTTP/1.1-8080], Connector[AJP/1.3-8009]]。
3.启动容器:daemon.start()。利用反射调用org.apache.catalina.startup.Catalina的start方法来实现。start方法直接条用getServer().start()方法,按照装配容器的初始化顺序,依次调用StandardServer、StandardService、StandardEngine、StandardHost、StandardContext、StandardWrapper的start或者startInternal方法来完成启动过程,最后会循环等待,在关闭命令到来之前一直运行。
注:1、tomcat中大量引入了模板方法模式,org.apache.catalina.util.LifecycleBase被所有容器继承,其中initInternal和startInternal方法是抽象方法,在初始化和启动时被每个容器会调用其init和start方法,这两个方法会去调用对应抽象方法***Internal,这些抽象方法都是在子类中实现的。2、tomcat中大量使用了类的反射,基本上都是通过配置文件获取类名,然后利用反射得到class对象,再通过newInstance获取对象。以下是模块间的关系图:
下面说明以下最上图中的pipeline和valve对象。四大容器类StandardEngine,StandardHost,StandardContext及StandardWrapper都有各自缺省的标准valve实现。容器类生成对象时,都会生成一个pipeline对象,同时,生成一个缺省的valve实现,并将这个标准的valve对象绑定在其pipeline对象上。Pipeline就像是每个容器的逻辑总线。在pipeline上按照配置的顺序,加载各个valve。通过pipeline完成各个valve之间的调用,各个valve实现具体的应用逻辑。从StandardPipeline 的addValve方法中可以看到,每添加一个valve,就将其添加到Valve链表中,并且每个容器的标准valve在链表的尾端。下图是四大容器的标准valve的调用逻辑图,此图只是在缺省配置下的状态,也就是说每个pipeline只包含一个标准valve的情况:
容器Valve的调用方式如:host.getPipeline().getFirst().invoke(request, response),从StandardEngineValve开始,一直到StandardWrapperValve,完成整个消息处理过程。注意每一个上层的valve都是在调用下一层的valve返回后再返回的,这样每个上层valve不仅具有request对象,同时还能拿到response对象。
最后要理一理的是Connector,连接器主要是接收、解析http请求,然后封装请求传递给容器处理。整个connector实现了从接收socket到调用servlet的全部过程。先来看一下connector的功能逻辑:1.接收socket。2.从socket获取数据包,并解析成HttpServletRequest对象。3.从engine容器开始走调用流程,经过各层valve,最后调用servlet完成业务逻辑。4.返回response,关闭socket。
可以看出,整个connector组件是tomcat运行主干,之前介绍的各个模块都是tomcat启动时,静态创建好的,通过connector将这些模块串了起来。 通常在实际运行中,特别是对于一些互联网应用而言,网络吞吐一直是整个服务的瓶颈所在,因此,connector的运行效率在一定程度上影响了tomcat的整体性能。相对来说,tomcat在处理静态页面方面一直有一些瓶颈,因此通常的服务架构都是前端类似nginx的web服务器,后端挂上tomcat作为应用服务器(当然还有些其他原因,例如负载均衡等)。Tomcat在connector的优化上做了一些特殊的处理,这些都是可选的,通过部署,配置方便完成,例如APR(Apache Portable Runtime),BIO,NIO等。 目前connector支持的协议是HTTP和AJP。AJP是Apache与其他服务器之间的通信协议。通常在集群环境中,例如前端web服务器和后端应用服务器或servlet容器,使用AJP会比HTTP有更好的性能。
下面主要介绍缺省状态(BIO)下HTTP connector的架构及其消息流,看下图:
可见connector分为三大模块:Http11Protocol、Mapper、CoyoteAdapter。
Http11Protocol类全路径为org.apache.coyote.http11.Http11Protocol,这是支持http的BIO实现。 Http11Protocol包含了JIoEndpoint对象及Http11ConnectionHandler对象。 Http11ConnectionHandler对象维护了一个Http11Processor对象池,Http11Processor对象会调用CoyoteAdapter完成http request的解析和分派。 JIoEndpoint维护了两个线程池,Acceptor及Worker。Acceptor是接收socket,然后从Worker线程池中找出空闲的线程处理socket,如果worker线程池没有空闲线程,则Acceptor将阻塞。Worker是典型的线程池实现。Worker线程拿到socket后,就从Http11Processor对象池中获取Http11Processor对象,进一步处理。
CoyoteAdapter全路径org.apache.catalina.connector.CoyoteAdapter,此对象负责将http request解析成HttpServletRequest对象,之后绑定相应的容器,然后从engine开始逐层调用valve直至该servlet。
Mapper类全路径org.apache.tomcat.util.http.mapper.Mapper,此对象维护了一个从Host到Wrapper的各级容器的快照。它主要是为了,当http request被解析后,能够将http request绑定到相应的servlet进行业务处理。在加载各层容器时,会将它们注册到JMX中。所以当connector组件启动的时候,会从JMX中查询出各层容器,然后再创建这个Mapper对象中的快照。Mapper对象在tomcat中存在于两个地方:1、每个context容器对象中,它只记录了此context内部的访问资源与相对应的wrapper子容器的映射;2、connector模块中,这是tomcat全局的变量,它记录了一个完整的映射对应关系,即根据访问的完整URL如何定位到哪个host下的哪个context的哪个wrapper容器。Servlet中forward跳转会用到第一种mapper,也就是说forward是服务器内部的重定向,其他对servlet的访问都用第二种mapper。如下图:
在前面Digester解析xml文件的时候,即构造Connector实例时就会调用Connector的构造方法,这个构造方法首先设置protocol,然后实例化protocolhandler(org.apache.coyote.http11.Http11Protocol)。到后面连接器的初始化则是调用Connector的initInternal方法,该方法首先为protocolHandler设置一个adapter,然后初始化protocolHandler,最后初始化mapperListener,mapperListener在初始化的时候会调用mapper对象的addXXX方法。由于Tomcat的生命周期控制,连接器的启动过程和初始化过程几乎一样,也是由Catalina的start方法开始,Server启动,Service启动,Container启动,Connector启动。Connector启动调用了它的startInternal方法,这个方法只做了两件事:启动protocolHandler和mapperListener。protocolHandler的初始化是在其父类AbstractProtocol的start方法中完成的,其中调用了endpoint.start(),由于默认使用的是Http11Protocol,因此调用的是JioEndpoint的startInternal方法,该方法启动Acceptor及Worker线程池。mapperListener也继承了LifecycleMBeanBase类,也是受生命周期控制的,所以它的启动是在startInternal方法中完成的。mapperListener会从Engine开始,为各层容器添加监听器,以及为各层容器建立映射关系。
参考:http://gearever.iteye.com/blog/1545250、http://blog.csdn.net/aesop_wubo/article/category/1156753