最近在公司更新一个老项目的时候,发现部署项目后tomcat报错,错误如下:
1 Caused by: java.lang.IllegalStateException: 2 Unable to complete the scan for annotations for web application [/test] 3 due to a StackOverflowError. Possible root causes include a too low setting 4 for -Xss and illegal cyclic inheritance dependencies. 5 The class hierarchy being processed was 6 [org.jaxen.util.AncestorAxisIterator-> 7 org.jaxen.util.AncestorOrSelfAxisIterator-> 8 org.jaxen.util.AncestorAxisIterator] 9 at org.apache.catalina.startup.ContextConfig.checkHandlesTypes(ContextConfig.java:2112) 10 at org.apache.catalina.startup.ContextConfig.processAnnotationsStream(ContextConfig.java:2059) 11 at org.apache.catalina.startup.ContextConfig.processAnnotationsJar(ContextConfig.java:1934) 12 at org.apache.catalina.startup.ContextConfig.processAnnotationsUrl(ContextConfig.java:1900) 13 at org.apache.catalina.startup.ContextConfig.processAnnotations(ContextConfig.java:1885) 14 at org.apache.catalina.startup.ContextConfig.webConfig(ContextConfig.java:1317) 15 at org.apache.catalina.startup.ContextConfig.configureStart(ContextConfig.java:876) 16 at org.apache.catalina.startup.ContextConfig.lifecycleEvent(ContextConfig.java:374) 17 at org.apache.catalina.util.LifecycleSupport.fireLifecycleEvent(LifecycleSupport.java:117) 18 at org.apache.catalina.util.LifecycleBase.fireLifecycleEvent(LifecycleBase.java:90) 19 at org.apache.catalina.core.StandardContext.startInternal(StandardContext.java:5355) 20 at org.apache.catalina.util.LifecycleBase.start(LifecycleBase.java:150)
这是在tomcat解析servlet3注释时进行类扫描的过程,发现了两个类的继承关系存在循环继承的情况而导致了栈溢出。
排查了一下,是因为应用所依赖的 dom4j-1.1.jar 里存在 AncestorAxisIterator 和子类 AncestorOrSelfAxisIterato。
1 % javap org.jaxen.util.AncestorAxisIterator 2 Compiled from "AncestorAxisIterator.java" 3 public class org.jaxen.util.AncestorAxisIterator extends org.jaxen.util.StackedIterator { 4 protected org.jaxen.util.AncestorAxisIterator(); 5 public org.jaxen.util.AncestorAxisIterator(java.lang.Object, org.jaxen.Navigator); 6 protected java.util.Iterator createIterator(java.lang.Object); 7 } 8 % javap org.jaxen.util.AncestorOrSelfAxisIterator 9 Compiled from "AncestorOrSelfAxisIterator.java" 10 public class org.jaxen.util.AncestorOrSelfAxisIterator extends org.jaxen.util.AncestorAxisIterator { 11 public org.jaxen.util.AncestorOrSelfAxisIterator(java.lang.Object, org.jaxen.Navigator); 12 protected java.util.Iterator createIterator(java.lang.Object); 13 }
同时应用所依赖的 sourceforge.jaxen-1.1.jar 里面也存在这两个同名类,但继承关系正好相反:
1 % javap org.jaxen.util.AncestorAxisIterator 2 Compiled from "AncestorAxisIterator.java" 3 public class org.jaxen.util.AncestorAxisIterator extends org.jaxen.util.AncestorOrSelfAxisIterator { 4 public org.jaxen.util.AncestorAxisIterator(java.lang.Object, org.jaxen.Navigator); 5 } 6 % javap org.jaxen.util.AncestorOrSelfAxisIterator 7 Compiled from "AncestorOrSelfAxisIterator.java" 8 public class org.jaxen.util.AncestorOrSelfAxisIterator implements java.util.Iterator { 9 public org.jaxen.util.AncestorOrSelfAxisIterator(java.lang.Object, org.jaxen.Navigator); 10 public boolean hasNext(); 11 public java.lang.Object next(); 12 public void remove(); 13 }
简单的说,在第1个jar里存在B继承自A,在第2个jar里存在同名的A和B,但却是A继承自B。其实也能运行的,只是可能出现类加载时可能加载的不一定是你想要的那个,但tomcat做类型检查的时候把这个当成了一个环。
在ContextConfig.processAnnotationsStream方法里,每次解析之后要对类型做一次检测,然后才获取注释信息:
1 ClassParser parser = new ClassParser(is, null); 2 JavaClass clazz = parser.parse(); 3 checkHandlesTypes(clazz); 4 ... 5 AnnotationEntry[] annotationsEntries = clazz.getAnnotationEntries(); 6 ...
再看这个用来检测类型的checkHandlesTypes方法里面:
populateJavaClassCache(className, javaClass); JavaClassCacheEntry entry = javaClassCache.get(className); if (entry.getSciSet() == null) { try { populateSCIsForCacheEntry(entry); // 这里 } catch (StackOverflowError soe) { throw new IllegalStateException(sm.getString( "contextConfig.annotationsStackOverflow",context.getName(), classHierarchyToString(className, entry))); } }
每次新解析出来的类(tomcat里定义了JavaClass来描述),会被populateJavaClassCache放入cache,这个cache内部是个Map,所以对于key相同的会存在把以前的值覆盖了的情况,这个“环形继承”的现象就比较好解释了。
Map里的key是String类型即类名,value是JavaClassCacheEntry类型封装了JavaClass及其父类和接口信息。我们假设第一个jar里B继承自A,它们被放入cache的时候键值对是这样的:
"A" -> [JavaClass-A, 父类Object,父接口]" "B" -> [JavaClass-B, 父类A,父接口]
然后当解析到第2个jar里的A的时候,覆盖了之前A的键值对,变成了:
"A" -> [JavaClass-A, 父类B,父接口] "B" -> [JavaClass-B, 父类A,父接口]
这2个的继承关系在这个cache里被描述成了环状,然后在接下来的populateSCIsForCacheEntry方法里找父类的时候就绕不出来了,最终导致了栈溢出。
这个算是cache设计不太合理,没有考虑到不同jar下面有相同的类的情况。问题确认之后,让应用方去修正自己的依赖就可以了,但应用方说之前在7026的时候,是可以正常启动的。这就有意思了,接着一番排查之后,发现在7026版本里,ContextConfig.webConfig的时候先判断了一下web.xml里的版本信息,如果版本>=3才会去扫描类里的servlet3注释信息。
1 // Parse context level web.xml 2 InputSource contextWebXml = getContextWebXmlSource(); 3 parseWebXml(contextWebXml, webXml, false); 4 if (webXml.getMajorVersion() >= 3) { 5 // 扫描jar里的web-fragment.xml 和 servlet3注释信息 6 ... 7 }
而在7054版本里是没有这个判断的。搜了一下,发现是在7029这个版本里去掉的这个判断。在7029的changelog里:
1 As per section 1.6.2 of the Servlet 3.0 specification and clarification from the Servlet Expert Group, the servlet specification version declared in web.xml no longer controls if Tomcat scans for annotations. Annotation scanning is now always performed – regardless of the version declared in web.xml – unless metadata complete is set to true.
之前对servlet3规范理解不够清晰;之所以改,是因为在web.xml里定义的servlet版本,不再控制tomcat是否去扫描每个类里的注释信息。也就是说不管web.xml里声明的servlet版本是什么,都会进行注释扫描,除非metadata-complete属性设置为true(默认是false)。所以在7029版本之后改为了判断 webXml.isMetadataComplete() 是否需要进行扫描注释信息。