概念
Java Web,是基于Java语言实现web服务的技术总和。介于现在Java在web客户端应用的比较少,我把学习重点放在了JavaWeb服务端应用。虽然用Springboot就可以很快地搭建一个web项目了,但是如果想要深入了解JavaWeb的实现原理,就不得不先学习Servlet和Servlet容器的相关知识。
首先什么是Servlet?
Servlet从广义上讲是Sun公司提供的一门用于开发动态Web资源的技术,而狭义上指的是实现了javax.servlet.Servlet接口的类的统称。Servlet接口很简单,只有init、getServletConfig、service、getServletInfo和destroy这5个方法,它们构成了实现Servlet功能的规范。像Spring的DispatcherServlet,都是一种具体的Servlet。
当然了,光有Servlet这一个类可没什么用,它没有main方法,不能独立运行,就像光有子弹没有枪,子弹的价值就发挥不出来。要想实现Servlet的功能,就必须有一个Servlet容器。
Servlet容器,也叫做Servlet引擎,是web服务器的一部分,用于接收网络请求,把请求转发给对应的Servlet,并把Servlet处理的结果返回给网络。
它是web服务器和Servlet之间的媒介。
它建立服务端socket、监听端口、创建流。
它管理着Servlet的生命周期,如加载部署Servlet,实例化初始化Servlet,调用Servlet方法(处理业务),以及销毁Servlet。
Tomcat就是一个独立运行的Servlet容器。
Tomcat组织结构
下面就以Tomcat8为例,看看一个具体的Servlet容器是如何实现上述功能的。
先来一张Tomcat的结构图:
Server:Tomcat顶层容器,代表着整个服务器。包含一个或多个Service组件;
Service:存活在Server内部的中间组件,包含Connector和Container这两个核心组件,负责将一个或多个Connector组件绑定到一个Container上;
Connector:监听端口,处理与客户端基于某种协议的通信,提供Socket与request和response的转换;
Container:封装和管理Servlet,负责对请求进行处理,并生成响应。
(先介绍这几个大的组件,小组件在后面会细讲)
这样展示可能比较抽象,我们可以打开我们安装的Tomcat目录下的conf/server.xml,看下Tomcat是如何配置这些组件的:
...
先看Connector,可以看到一个Service里是可以配置多个Connector的,这里我们主要关心HTTP协议的Connector。 Connector使用持有的ProtocolHandler类型对象来处理请求,它包含的三个部件: Endpoint:绑定端口、监听请求; Processor:将Endpoint接收到的Socket封装成Request; Adapter:将Request交给Container进行具体的处理。 再看Container,它内部包含了4个子容器 Engine:Servlet引擎,Container最上层,每个Service只能包含一个,表示一个特定的Service的请求处理流水线,从Connector接收处理所有的请求并返回响应; Host:虚拟主机,一个引擎可以包含多个Host;一个Host可以包含多个Context; Context:一个Context表示了一个Web应用程序(Web工程)。Context直接管理Servlet在容器中的包装类; Wrapper:每一个Servlet在容器中的包装类。 我们可以通过Tomcat文件夹里的文件结构来帮助理解,上面提到的conf/server.xml里配置Host时有个appBase的属性是webapps,是不是很眼熟?我们在Tomcat安装目录下总是有一个webapp文件夹,整个webapps就是一个Host站点,里面放着的每个文件夹目录就对应一个Context,其中ROOT目录中存放着主应用,其他目录存放着子应用。 先看Tomcat是如何加载类的。 Tomcat启动时创建的类加载器有 BootstrapClassLoader:加载JVM提供的基本运行类,和$JAVA_HOME/jre/lib/ext里的jar包; SystemClassLoader:加载tomcat启动的类,即Catalina.bat中指定位置的类; CommonClassLoader:加载tomcat以及应用通用的类,位于CATALINA_HOME/lib下。父加载器是AppClassLoader; WebAppClassLoader:每个应用在部署后都创建一个唯一的类加载器,加载位于WEB-INF/lib中的jar包和WEB-INF/classes下的class文件。父加载器是CommonClassLoader。 Tomcat默认类加载逻辑: 1、先在本地缓存中查找,如果已经加载即返回,否则继续下一步 2、尝试Bootstrap加载,如果加载到即返回,否则 3、WebApp自行加载,先/WEB-INF/classes,再/WEB-INF/lib/*.jar,如果加载到即返回,否则 4、委托WebApp父类加载器(Common ClassLoader)去加载。。。 注意:第3、4两步违反了双亲委托机制,但也只是Tomcat自定义的ClassLoader加载顺序违反了,顶层还是相同的。 Tomcat的这种加载逻辑保证了每个应用程序的同名类库是独立的,同时可以共享共有类库。 每一个JSP文件对应一个Jsp类加载器,当一个jsp文件修改了,就直接卸载这个jsp类加载器,重新创建类加载器,重新加载jsp文件。 下面开始分析Tomcat大致启动流程,建议配合源码食用。 Tomcat传统的启动入口通过startup.bat和catalina.bat脚本调用org.apache.catalina.startup.Bootstrap.main(),分为两部分: 一、init():初始化main线程的daemon(一个Bootstrap对象)。初始化Tomcat类加载器,通过反射来实例化Catalina对象; 二、daemon执行三个方法setAwait(true)、load(args)和start(): 1、setAwait:通过反射调用catalina的setAwait方法设置await属性,后面会用到; 2、load(args):通过反射调用catalina的load方法,创建xml解析器,解析conf/server.xml创建出了StandardServer对象并init,继而调用内部包含的service的int,以此逐层初始化所有组件; 3、start():通过反射调用catalina的start()方法,和init方法一样逐层start所有组件;最后利用前面设置的await属性调用await方法,继而调用server的await方法,保证主线程运行并持续监听8005端口的SHUTDOWN指令,接收到后调用stop方法关闭Tomcat。 上面各个组件的init和start都是一笔带过,那么他们实际完成了什么样的工作呢? Server.init():调用包含的Service的init; Service.init():初始化Engine,初始化Executor(所有Connector共享的线程池),初始化mapperListener(用来保存容器映射),调用Connector.init; Connector.init():初始化ProtocolHandler、Adapter,Endpoint创建ServerSocket并绑定监听端口 Server.start():调用包含的Services的start; Service.start():与初始化对应,调用Engine.start,启动Executor,启动mapperListener(作为监听者加到容器和它们的子容器中),调用Connector.start Connector.start():Endpoint创建acceptor线程来接收客户端的连接以及poller线程来处理连接中的读写请求 Engine.start():逐一启动Host、Context、Wrapper Context.start():步骤很多,这里列举几个重要的: *)创建读取资源文件的对象 *)创建ClassLoader对象,就是上面提到过的每个应用唯一的WebAppClassLoader *)设置应用的工作目录 *)启动相关辅助对象,如Logger、realm、resources等 *)通知监听者ContextConfig读取和解析Web应用web.xml和注解 *)启动web.xml解析到的子容器(解析时将Servlet包装成StandardWrapper) *)启动Pipeline(一种责任链设计模式后面会讲) *)获取或创建ServletContext,并设置必要的参数 *)创建Context中配置的Listener; *)创建和初始化配置的Filter; *)创建和初始化loadOnStartup大于等于0的Servlet 现在我们知道Tomcat是如何启动的,那么启动之后Tomcat如何处理一次请求的呢? 下面以一次Http请求为例来说明,请求URL=http://hostname:port/contextpath/servletpath。 在Connector组件树中: 前面启动的过程中提到过Connector的Endpoint的acceptor线程负责接收Socket连接,acceptor接收请求之后调用processSocket方法,把socket包装成SocketWrapper,创建一个SocketProcessor任务,从线程池中获取一个线程处理该任务。run方法中调用AbstractEndpoint.Handler.process方法,根据请求的协议类型(con/server.xml中connector元素的protocol属性值)创建相应的类型处理类Processor,对SocketWrapper的输入流和输出流进行包装,根据SocketWrapper创建轻量级的coyote.Request和coyote.Response,解析http请求的请求头和请求行,最后Adapter.service(Request, Response),将coyote.Request和coyote.Response转化成Connector.Request和Connector.Response,调用connector.getService().getMapper().map(),根据hostname、contextpath和servletpath找到对应的host、context和Wapper(前面利用mapperListener保存的容器完整关系),设置到Request中去;再调用connector.getService().getContainer().getPipeline().getFirst().invoke(request, response)将请求传递给与Connector关联的Container逐级传递下去(Engine->Host->Context->Wapper)。 在Container组件树中: Container容器按照责任链的设计模式,使用管道Pipeline和Value的方式来传递请求。 第一层是Engine,先通过conf/server.xml中配置的value,最后总会流到StandardEngineValue,调用host.getPipeline().getFirst().invoke(request, response)将请求传递给request中保存的Host; 第二层是Host,同样先通过配置的value,最后流到StandardHostValue,再传递给request中保存的Context; 第三层是Context,流到StandardContextValue传递给request中保存的Wapper; 最后是Wapper,流到StandardWapperValue,获取Servlet单例(双检查锁机制),获取FilterChain执行Filter链,也是一种责任链模式,执行完所有配置的Filter后执行Servlet.service,即我们希望其完成的业务逻辑。 (在进入Filter的时候,传入的是Connector.Request的门面类RequestFacade,和Request一样都是HttpServletRequest和HttpServletResponse的实现类) 返回过程略。 第一次写文章,条理排版不是很清晰,以后慢慢改进。Tomcat类加载
Tomcat启动流程
Tomcat处理请求过程