本文将介绍两种开发实践,用于提高 Java 单元测试中的代码覆盖率。代码覆盖率 = (被测代码 / 代码总数)* 100%。提高被测代码数量或降低代码总数,均可达到提高代码覆盖率的效果。在本文中,您将看到如何通过使用反射机制,在外部直接对目标类中的不可访问成员进行测试,以提高被测代码数量;以及通过修改 Cobertura 源码,使其支持通过正则表达式来过滤不需要进行单元测试的代码,以降低代码总数。代码覆盖率的提高,减少了单元测试过程中未被覆盖的代码数量,降低了开发人员编写或修改单元测试用例的时间成本,从而提高了整个单元测试的效率。
3 评论:
2013 年 10 月 17 日
单元测试是软件开发过程中重要的质量保证环节。单元测试可以减少代码中潜在的错误,使缺陷更早地被发现,从而降低了软件的维护成本。软件代码的质量由单元测试来保证,而单元测试自身的质量与效率问题也不容忽视。提高单元测试的质量与效率,不仅能够使软件代码更加有保证,而且能够节省开发人员编写或者修改单元测试代码的时间。衡量单元测试质量与效率的指标多种多样,代码覆盖率是其中一个极为重要的指标。一般而言,代码覆盖率越高,单元测试覆盖的范围就越大,代码中潜在错误的数量就越少,软件质量就越高。本文首先介绍代码覆盖率的统计指标类型及常用统计工具,然后重点选取具有代表性的行覆盖率进行分析,介绍两种方法用于提高代码的行覆盖率。
回页首
代码覆盖率指的是一种衡量代码覆盖程度的方式,通常会对以下几种方式进行统计分析:
在这三种覆盖指标中,行覆盖简单,适用性广,但可能会被认为是“最弱的覆盖”,其实不然。行覆盖相对于条件或路径覆盖,可以使开发人员通过尽可能少的测试数据和用例,覆盖尽可能多的代码。通常情况下,是先通过工具检测一遍整个工程单元测试的行覆盖情况,然后针对没有被覆盖到的代码,分析其没有被覆盖到的原因。如果是由于该代码所在分支由于不满足进入该分支的条件而没有被覆盖,那么开发人员才会进一步修改或增加测试代码,完成该部分的条件或路径覆盖。
可见,高效高质量的行覆盖是有效进行条件覆盖与路径覆盖的前提。行覆盖率越高,说明没有被覆盖到的代码越少,这样开发人员便会集中精力修改测试用例,覆盖这些数量不多的代码。相反,如果行覆盖率低,开发人员需要逐个检查没有被覆盖到的代码,精力被分散,因此很难提高剩余代码单元测试的质量。
代码覆盖率 = 被测代码行数 / 参测代码总行数 * 100%。 从代码覆盖率的计算方式中可以看出,要提高代码覆盖率,可通过提高被测代码行数,或减少参测代码总行数的方式进行。以下将会从这两个角度分别入手,分析如何提高被测代码行数及减少参测代码总行数。
回页首
Cobertura 是一款优秀的开源测试覆盖率统计工具,它与单元测试代码结合,标记并分析在测试包运行时执行了哪些代码和没有执行哪些代码以及所经过的条件分支,来测量测试覆盖率。除了找出未测试到的代码并发现 bug 外,Cobertura 还可以通过标记无用的、执行不到的代码来优化代码,最终生成一份美观详尽的 HTML 覆盖率检测报告。
Cobertura 基本工具包里有四个基本过程及对应的工具:cobertura-check, cobertura-instrument, cobertura-merge, cobertura-report; 这个脚本独立使用较为繁琐,不方便也不利于自动化。不过, Cobertura 在 Maven 编译平台上有相应的 cobertura-maven-plugin 插件,使代码编译、检测、集成等各个周期可以流水线式自动化完成。
Cobertura-maven-plugin 官方版有五个主要目标指令 (goal),如表 1:
目标指令 | 作用解释 |
---|---|
Cobertura:check | 检查最后一次标注(instrumentation) 正确与否 |
Cobertura:clean | 清理插件生产的中间及最终报告文件 |
Cobertura:dump-datafile | Cobertura 数据文件 dump 指令 , 不常用 |
Cobertura:instrument | 标注编译好的 javaclass 文件 |
Cobertura:cobertura | 标注、运行测试并产生 Cobertura 覆盖率报告 |
Cobertura 通常会与 Maven 一起使用。因此工程目录结构如果遵循 Maven 推荐的标准的话,一个集成 Cobertura 的基本 POM 文件如清单 1 所示:
<project> <reporting> <plugins> <plugin> <!-- 此处用于将 Cobertura 插件集成到 Maven 中 --> <groupId>org.codehaus.mojo</groupId> <artifactId>cobertura-maven-plugin</artifactId> <version>2.5.2</version> </plugin> </plugins> </reporting> </project>
如果工程目录结构没有采用 Maven 推荐标准,则需要进行如下额外设置:
<build> <!-- Java 源代码的路径配置 --> <sourceDirectory>src/main/java</sourceDirectory> <scriptSourceDirectory>src/main/scripts</scriptSourceDirectory> <!-- 测试代码的路径配置 --> <testSourceDirectory>src/test/java</testSourceDirectory> <!-- 源码编译后的 class 文件的路径配置 --> <outputDirectory>target/classes</outputDirectory> <!-- 测试源码编译后的 class 文件的路径配置 --> <testOutputDirectory>target/test-classes</testOutputDirectory> <plugin> .... </plugin> </build>
单元测试代码编写完成,所有设置配制好后,在工程根目录运行“mvn cobertura:cobertura”Maven 就会对代码进行编译。编译完成之后,就会在项目中运行测试代码并输出测试报告结果到目录 project_base$\target\site\cobertura\index.html,效果如图 1 所示。
从以上报告中可见,
针对上述两种改进措施,都可以使用 Cobertura 进行实现。第一种改进措施 Cobertura 可以支持,而第二改进措施则需要对 Cobertura 源码进行修改,重编译后方可支持。下面将详细介绍如何使用 Cobertura 对上述问题进行优化。
针对项目中不需进行单元测试的包和类,我们可以利用 POM 文件中 Cobertura 的标注 (instrument) 设置,对相应的包和类进行剔除 (exclude) 或筛选 (include),使之不体现在覆盖率报告中,去除它们对整个覆盖率的影响,从而使报告更具针对性。其基本 POM 标签设置及解析如清单 3 中所示。
<configuration> <instrumentation> <excludes> <!--此处用于指定哪些类会从单元测试的统计范围中被剔除 --> <exclude>exs/res/process/egencia/Mock*.class</exclude> <exclude>exs/res/process/test/**/*Test.class</exclude> </excludes> </instrumentation> </configuration> <executions> <execution> <goals> <goal>clean</goal> </goals> </execution> </executions>
通过在配置文件中使用 Include 与 Exclude,可以显式地指定哪些包和类被列入单元测试的统计范围,哪些包和类被剔除在此范围之外。正则表达式支持丰富的匹配条件,可以满足大多数项目对单元测试范围的要求。以上代码将 exs.res.process.egencia 下面所有的名称 Mock 开头的类,以及 exs.res.process.egencia.test 包下面以 Test 结尾的类都剔除在测试范围以外。在使用这种配置之后,代码整体的范围被缩小,因此在被覆盖到的代码数量不变的基础上,整个代码覆盖率会较以前提高。输出结果如图 2 所示。
最新版本中的 Cobertura 只能支持到类级别的过滤,而对于类中方法的过滤是不支持的。因此我们需要通过修改 Cobertura 源码,使 Cobertura 支持对类中方法的过滤。
对 Cobertura 及其插件改动所依据的主要原理是 : 修改 Cobertura-maven-plugin 项目中的 InstrumentationTask 类,增加 Ignoretrival,IgnoreMethod 等新增 POM 参数。配制正则表达式,修改 Cobertura 核心,在标注(instrumentation) 阶段遍历函数名时,检测函数名是否匹配传入的正则表达式,过滤函数体代码,从而把这些函数代码排除在代码覆盖统计之外,节省开发人员对这类代码的测试精力。
清单 4 至清单 6 是对 Cobertura 的几处核心改动,仅供读者参考。
private void checkForTrivialSignature() { Type[] args = Type.getArgumentTypes(myDescriptor); Type ret = Type.getReturnType(myDescriptor); if (myName.equals("<init>")) { isInit = true; mightBeTrivial = true; return; } if (myName.startsWith("set") && args.length == 1 && ret.equals(Type.VOID_TYPE)) { isSetter = true; mightBeTrivial = true; return; } if ((myName.startsWith("get") || myName.startsWith("is") || myName.startsWith("has")) && args.length == 0 && !ret.equals(Type.VOID_TYPE)) { isGetter = true; mightBeTrivial = true; return; } }
private String ignoreMethodAnnotation; private String ignoreTrivial; /** * 创建一个新的对象,用于进行配置。 */ public ConfigInstrumentation() /** * * 该方法用于设置annotation的名字以用于过滤类内部的方法 * @param ignoreMethodAnnotation */ public void setIgnoreMethodAnnotation(String ignoreMethodAnnotation) { this.ignoreMethodAnnotation = ignoreMethodAnnotation; } public String getIgnoreTrivial() { return ignoreTrivial; } /** * 该方法用于标识测试类中的方法是否无关紧要不需要测试。 * @param ignoreTrivial */ public void setIgnoreTrivial(String ignoreTrivial) { this.ignoreTrivial = ignoreTrivial; }
<reporting> <plugins> <plugin> <groupId>org.codehaus.mojo</groupId> <artifactId>cobertura-maven-plugin</artifactId> <version>2.5.2</version> <configuration> <ignores> <!--经过修改的 cobertura, 支持方法级别的过滤 --> <ignore>*main*</ignore> <!--以上修改指的是过滤项目中所有类中的方法名中含有 main 的方法 --> </ignores> <IgnoreTrival>true</IgnoreTrival> </configuration> </plugin> </plugins> </reporting>
以上修改都完成之后, 就可以运行“mvn:site”命令得到报告。图 4 是使用没有被修改的 Cobertura 产生的结果报告,无函数过滤效果。图 5 是使用被修改后的 Cobertura 产生的结果报告,可以从中看出,几个 set 与 get 方法已被排除在统计范围之外。
回页首
不同的人对反射有不同的理解,大部分人认同的一种观点是:反射使得程序可以检查自身结构以及软件环境,并且根据程序检测到的实际情况改变行为。
为了实现自检,一段程序需要有些信息来表示自身,这些信息就称为元数据(metadata)。Java 运行过程中对这些元数据的自检称为内省(introspection)。内省过程之后往往进行行为改变。总的来说,反射 API 利用以下三种技术来实现行为改变:
Java 语言反射机制提供一组丰富的 API 函数来操作元数据,且提供了少部分重要的 API 来实现 Intercession 能力。
实际项目中,为了保证软件代码的整体质量,单元测试不仅要覆盖类的公有成员,还要覆盖重要的私有成员。而有些私有成员的调用,会被放入到极为复杂的条件分支中。而构造进入这个私有方法的相关条件,可能需要开发人员编写大量测试代码及测试数据。这无疑增加了单元测试的成本。有时为了节省成本,该类私有方法便跳过不测,从而在无形中降低了代码的行覆盖率,影响了软件的整体质量。
而利用反射的一系列特性,我们可以在不改变源代码的情况下,直接对复杂的私有方法进行单元测试,无需增加行覆盖检查中被覆盖的代码行数,从而可以在不增加单元测试成本的前提下,提高代码的行覆盖率与单元测试的整体质量。
清单 7 给出了一段简单的目标测试代码示例。
package exs.res.util; public class Customer{ private String message; public String greet; private String sayHello() { return "Hello"; } public String pHello() { return "pHello"; } }
为了测试私有函数 sayHello(),利用反射元数据操作 API 的测试代码为:
@Test public void privateMethodTest() { final Method methods[] = Customer.class.getDeclaredMethods(); for (int i = 0; i < methods.length; ++i) { if ("sayHello".equals(methods[i].getName())) { //这里会将 sayHello 方法由 private 变为 public,从而可以直接被外部对象访问 methods[i].setAccessible(true); try{ String anotherString =(String)methods[i].invoke(new Customer(), new Object[0]); assertTrue("Hello".equalsIgnoreCase(anotherString)); }catch(Exception e){ e.printStackTrace(); } break; } } } @Test public void privateFieldTest() throws NoSuchFieldException, SecurityException{ try{ Field message = Customer.class.getDeclaredField("message"); Customer testCustomer = new Customer(); //这里会将 message 属性由 private 变为 public,从而可以直接被外部对象访问 message.setAccessible(true); message.set(testCustomer, "newMessage"); assertTrue("newMessage".equalsIgnoreCase((String)message.get(testCustomer))); }catch(Exception e){ e.printStackTrace(); } }
运行以上单元测试用例来分别对 Customer 的私有方法 sayHello 以及私有属性 message 进行直接访问,结果如图 6 所示。
从图中我们可以看到 Customer 成员的私有方法 sayHello 被测试代码覆盖到。所以,当一些代码函数复杂度过高,到通过构造测试数据或测试用例的方法很难使非公有成员得到运行时,我们就可以利用 Java 反射机制,直接在测试类中调用和测试目标类的非公有成员,从而提高覆盖率。
回页首
本文使用两种方法,从两个不同的角度对单元测试中的代码覆盖率进行了增强。改进 Cobertura 来提高单元测试代码覆盖率,主要从缩小参与测试的代码总范围的角度入手,适用于代码总数庞大而被测代码数量不多的情况。而使用 Java 反射机制提高单元测试代码覆盖率,主要从提高被测代码数量的角度入手,适用于被测代码私有成员多且触发条件苛刻的情况。针对项目中对单元测试的不同需求,选取合适的技术来增强单元测试,才能真正提高代码以至项目的总体质量。
http://www.ibm.com/developerworks/cn/java/j-lo-cobertura/index.html