How tomcat started

作为我们最常用的Java服务器软件之一,tomcat已经经过了十多年的迭代,成为我们服务器上非常重要的一部分。那么tomcat是如何启动的呢?

tomcat logo

想要了解tomcat是如何启动,那么就需要先明白tomcat的设计。

理解tomcat的设计

如果要理解tomcat的设计,我觉得就需要从server.xml说起了,在tomcat中,最常见的配置就是server.xml了,以下是一份简化过的server.xml


  
  
  
  ……

  

    
    
    

    

      
        
      

      

        

      
    
  

在以上配置中可以看出有以下这个结构的标签:

.
└── server
    ├── listener
    └── service
        ├── connector
        ├── engine
        │   ├── host
        │   │   └── value
        │   └── realm
        └── executor

实际上,这里面的每一个标签代表了tomcat架构中的一个接口类(interface),他们的对应关系:

server --> org.apache.catalina.Server
service --> org.apache.catalina.Service
connector --> org.apache.catalina.connector.Connector
engine --> org.apache.catalina.Engine
host --> org.apache.catalina.Host
realm --> org.apache.catalina.Realm
executor --> org.apache.catalina.Executor
Server

首先我们来分析下server,这个类代表了一个tomcat服务器(servlet容器)。他可以包含多个service服务。

Service

service则包含了一个或多个Connector和一个Container

在tomcat的容器设计中,将网络请求跟具体具体请求处理分别由ConnectorContainer来处理:

  • Connector:负责Socket网络连接的处理。
  • Container:负责处理具体的servlet请求。
Container

实际上Container包含了一类接口,包括:

标签 描述
Engine 表示Servlet引擎,作为最高级的容器,Engine是获取目标容器的入口
Host Servlet引擎中的虚拟机,多域名也是基于host实现的
Context 在Servlet规范中,一个Context,表示一个独立的Web应用
Wrapper 表示web应用中定义的Servlet

也就是engine和它包含的所有的标签代表的类,Container可以添加或者包含子容器,所以service类中仅持有了engine

每一个Container对象都会有一个对应的StandardValve, Pipeline接口会维护一条Value职责链,将请求依次传递到每一级的容器中处理。

How tomcat started_第1张图片
Tomcat Pipeline 示意图(图片来自google)
Connector

之前的文字中已经提到,Connector是负责处理Socket端口信息的组件。

作为一个网络服务器,tomcat支持了多种协议(HTTP,AJP,WEBSOCKET等),多种通信方式(BIO,NIO,APR等)。在Connector中这些部分的处理,都被封装到了ProtocolHandler这个类的属性里面,它表示一个协议处理器,针对不同的协议I/O方式,会有不同的实现。

Coyotetomcat默认的连接器(Connector)实现框架,作为独立的模块它只负责具体协议的处理和I/O处理,与servlet没有直接的联系,所以理论上,我们是可以更换成我们自己所希望的实现方式的。

Executor

每一个service都会维护一个共享的线程池,tomcat监听socket端口,当接收到客户端请求后,会创建请求处理对象,并交由线程池处理,由此并发处理客户端请求。

Listener

server标签下,还有一个标签listener,它的表示监听器,它会捕获存在节点的事件(比如在上面的配置中就配置在server标签,则表示这个listener存在server节点上),并根据具体实现执行相对应的操作。

了解了每个标签的意义之后,我们就大概了解tomcat启动之后,各个部分是如何运作的了。

tomcat的启动过程

我们使用tomcat的时候,一般在Linux服务器上都是使用catalina.sh脚本来启动服务器的。一般启动的命令:

./catalina.sh start

这句脚本在执行什么呢?打开脚本,定位到start子命令的位置,最关键的启动命令如下:

shift
touch "$CATALINA_OUT"
if [ "$1" = "-security" ] ; then
  if [ $have_tty -eq 1 ]; then
    echo "Using Security Manager"
  fi
  shift
  eval $_NOHUP "\"$_RUNJAVA\"" "\"$LOGGING_CONFIG\"" $LOGGING_MANAGER $JAVA_OPTS $CATALINA_OPTS \
    -Djava.endorsed.dirs="\"$JAVA_ENDORSED_DIRS\"" -classpath "\"$CLASSPATH\"" \
    -Djava.security.manager \
    -Djava.security.policy=="\"$CATALINA_BASE/conf/catalina.policy\"" \
    -Dcatalina.base="\"$CATALINA_BASE\"" \
    -Dcatalina.home="\"$CATALINA_HOME\"" \
    -Djava.io.tmpdir="\"$CATALINA_TMPDIR\"" \
    org.apache.catalina.startup.Bootstrap "$@" start \
    >> "$CATALINA_OUT" 2>&1 "&"

else
  eval $_NOHUP "\"$_RUNJAVA\"" "\"$LOGGING_CONFIG\"" $LOGGING_MANAGER $JAVA_OPTS $CATALINA_OPTS \
    -Djava.endorsed.dirs="\"$JAVA_ENDORSED_DIRS\"" -classpath "\"$CLASSPATH\"" \
    -Dcatalina.base="\"$CATALINA_BASE\"" \
    -Dcatalina.home="\"$CATALINA_HOME\"" \
    -Djava.io.tmpdir="\"$CATALINA_TMPDIR\"" \
    org.apache.catalina.startup.Bootstrap "$@" start \
    >> "$CATALINA_OUT" 2>&1 "&"

fi

if [ ! -z "$CATALINA_PID" ]; then
  echo $! > "$CATALINA_PID"
fi

echo "Tomcat started."

从中可以看出catalina.sh启动tomcat是执行了org.apache.catalina.startup.Bootstrapstart()方法,start()方法启动了Catalina类的线程。

/**
  * Start the Catalina daemon.
  * @throws Exception Fatal start error
  */
public void start()
    throws Exception {

    if( catalinaDaemon==null ) init();

    Method method = catalinaDaemon.getClass().getMethod("start", (Class [] )null);
    method.invoke(catalinaDaemon, (Object [])null);

}

tomcat提供了Bootstrap类作为服务器的命令处理器,由它创建Catalina实例并根据外部传递的命令控制Catalina启动关闭Bootstrap本身是一个单独的JAR包被放到$CATALINA_HOME/bin目录下面。而从上面的源码中会看到,Bootstrap总是通过Java的反射操作Catalina,因为启动服务器这个过程对运行时没有多大的影响,这种方式实现了程序启动和服务核心代码的解耦

而这种解耦带来的另外一个优势是tomcat在这一步,可以灵活地定制自己的类加载器,根据servlet规范每一个Web应用都有独立的类加载器实例

再回到Catalina,它通过Digester框架(XML解析框架)定义转换规则,将server.xml中的配置标签都转换成对应的类实例,一个tomcat程序这样就启动完毕了。

总结

tomcat的开发严格遵守了面向接口开发的设计规范,其软件的架构设计启动的方式配置文件的读取方式都非常值得我们借鉴到我们自己的系统平台中,我觉得能把握好微观的设计,才能做出更好的平台系统,正像 @左耳朵耗子 陈皓老师在博客中说的: "如果你要做好架构,首先你得把计算机体系结构以及很多老古董的基础技术吃透了。"

你可能感兴趣的:(How tomcat started)