IBM技术论坛:使用 Cobertura 和反射机制提高单元测试中的代码覆盖率

引言

单元测试是软件开发过程中重要的质量保证环节。单元测试可以减少代码中潜在的错误,使缺陷更早地被发现,从而降低了软件的维护成本。软件代码的质量由单元测试来保证,而单元测试自身的质量与效率问题也不容忽视。提高单元测试的质量与效率,不仅能够使软件代码更加有保证,而且能够节省开发人员编写或者修改单元测试代码的时间。衡量单元测试质量与效率的指标多种多样,代码覆盖率是其中一个极为重要的指标。一般而言,代码覆盖率越高,单元测试覆盖的范围就越大,代码中潜在错误的数量就越少,软件质量就越高。本文首先介绍代码覆盖率的统计指标类型及常用统计工具,然后重点选取具有代表性的行覆盖率进行分析,介绍两种方法用于提高代码的行覆盖率。

代码覆盖率的统计指标

代码覆盖率指的是一种衡量代码覆盖程度的方式,通常会对以下几种方式进行统计分析:

  • 行覆盖。它又被称作语句覆盖或基本块覆盖。这是一种较为常用且具有代表性的指标,度量的是被测代码中每个可执行语句是否被执行到。
  • 条件覆盖。它度量的是当代码中存在分支时,是否能覆盖进入分支和不进入分支这两种情况。这要求开发人员编写多个测试用例以分别满足进入分支与不进入分支这两种情况。
  • 路径覆盖。它度量的是当代码中存在多个分支时,是否覆盖到分支之间不同组合方式所产生的全部路径。这是一种力度最强的覆盖检测,相对而言,条件覆盖只是路径覆盖中的一部分。

在这三种覆盖指标中,行覆盖简单,适用性广,但可能会被认为是“最弱的覆盖”,其实不然。行覆盖相对于条件或路径覆盖,可以使开发人员通过尽可能少的测试数据和用例,覆盖尽可能多的代码。通常情况下,是先通过工具检测一遍整个工程单元测试的行覆盖情况,然后针对没有被覆盖到的代码,分析其没有被覆盖到的原因。如果是由于该代码所在分支由于不满足进入该分支的条件而没有被覆盖,那么开发人员才会进一步修改或增加测试代码,完成该部分的条件或路径覆盖。

可见,高效高质量的行覆盖是有效进行条件覆盖与路径覆盖的前提。行覆盖率越高,说明没有被覆盖到的代码越少,这样开发人员便会集中精力修改测试用例,覆盖这些数量不多的代码。相反,如果行覆盖率低,开发人员需要逐个检查没有被覆盖到的代码,精力被分散,因此很难提高剩余代码单元测试的质量。

代码覆盖率 = 被测代码行数 / 参测代码总行数 * 100%。 从代码覆盖率的计算方式中可以看出,要提高代码覆盖率,可通过提高被测代码行数,或减少参测代码总行数的方式进行。以下将会从这两个角度分别入手,分析如何提高被测代码行数及减少参测代码总行数。

使用 Cobertura 统计并提高代码的行覆盖率

Cobertura 是一款优秀的开源测试覆盖率统计工具,它与单元测试代码结合,标记并分析在测试包运行时执行了哪些代码和没有执行哪些代码以及所经过的条件分支,来测量测试覆盖率。除了找出未测试到的代码并发现 bug 外,Cobertura 还可以通过标记无用的、执行不到的代码来优化代码,最终生成一份美观详尽的 HTML 覆盖率检测报告。

Cobertura 基本工具包里有四个基本过程及对应的工具:cobertura-check, cobertura-instrument, cobertura-merge, cobertura-report; 这个脚本独立使用较为繁琐,不方便也不利于自动化。不过, Cobertura 在 Maven 编译平台上有相应的 cobertura-maven-plugin 插件,使代码编译、检测、集成等各个周期可以流水线式自动化完成。

Cobertura-maven-plugin 官方版有五个主要目标指令 (goal),如表 1:

表 1. Cobertura 目标指令及作用解释

目标指令 作用解释
Cobertura:check 检查最后一次标注(instrumentation) 正确与否
Cobertura:clean 清理插件生产的中间及最终报告文件
Cobertura:dump-datafile Cobertura 数据文件 dump 指令 , 不常用
Cobertura:instrument 标注编译好的 javaclass 文件
Cobertura:cobertura 标注、运行测试并产生 Cobertura 覆盖率报告

Cobertura 通常会与 Maven 一起使用。因此工程目录结构如果遵循 Maven 推荐的标准的话,一个集成 Cobertura 的基本 POM 文件如清单 1 所示:

清单 1. POM 文件的基本结构
 
   
      
        
           
          org.codehaus.mojo
                cobertura-maven-plugin
                2.5.2 
          
      
    

如果工程目录结构没有采用 Maven 推荐标准,则需要进行如下额外设置:

清单 2. 适合 Maven 的工程目录结构配置
 
     
     src/main/java
     src/main/scripts 
     
     src/test/java 
      
     target/classes
     
     target/test-classes
      ....  
 

单元测试代码编写完成,所有设置配制好后,在工程根目录运行“mvn cobertura:cobertura”Maven 就会对代码进行编译。编译完成之后,就会在项目中运行测试代码并输出测试报告结果到目录 project_base$\target\site\cobertura\index.html,效果如图 1 所示。

图 1. Cobertura 覆盖分析报告
IBM技术论坛:使用 Cobertura 和反射机制提高单元测试中的代码覆盖率_第1张图片

从以上报告中可见,

  • 代码整体的行覆盖率并不高,有些包或类覆盖率很低,甚至为 0。考虑到这些包或类的特殊性(例如它们已被其他类取代),无需对它们进行单元测试,因此需要从整个测试范围中剔除。
  • 部分类的行覆盖率虽然已接近 100%,但仍存在一些方法(如 set 和 get 方法)由于没有测试的必要却被列入了统计范围,这些方法需要被过滤掉。

针对上述两种改进措施,都可以使用 Cobertura 进行实现。第一种改进措施 Cobertura 可以支持,而第二改进措施则需要对 Cobertura 源码进行修改,重编译后方可支持。下面将详细介绍如何使用 Cobertura 对上述问题进行优化。

过滤不需进行单元测试的包和类

针对项目中不需进行单元测试的包和类,我们可以利用 POM 文件中 Cobertura 的标注 (instrument) 设置,对相应的包和类进行剔除 (exclude) 或筛选 (include),使之不体现在覆盖率报告中,去除它们对整个覆盖率的影响,从而使报告更具针对性。其基本 POM 标签设置及解析如清单 3 中所示。

清单 3. POM 中剔除包和类的设置示例
 
     
     
    
                exs/res/process/egencia/Mock*.class
                exs/res/process/test/**/*Test.class 
     
     
     
          
                 
                     clean 
                 
           
   

通过在配置文件中使用 Include 与 Exclude,可以显式地指定哪些包和类被列入单元测试的统计范围,哪些包和类被剔除在此范围之外。正则表达式支持丰富的匹配条件,可以满足大多数项目对单元测试范围的要求。以上代码将 exs.res.process.egencia 下面所有的名称 Mock 开头的类,以及 exs.res.process.egencia.test 包下面以 Test 结尾的类都剔除在测试范围以外。在使用这种配置之后,代码整体的范围被缩小,因此在被覆盖到的代码数量不变的基础上,整个代码覆盖率会较以前提高。输出结果如图 2 所示。

图 2. 包、类过滤效果
IBM技术论坛:使用 Cobertura 和反射机制提高单元测试中的代码覆盖率_第2张图片

过滤类中的函数

最新版本中的 Cobertura 只能支持到类级别的过滤,而对于类中方法的过滤是不支持的。因此我们需要通过修改 Cobertura 源码,使 Cobertura 支持对类中方法的过滤。

对 Cobertura 及其插件改动所依据的主要原理是 : 修改 Cobertura-maven-plugin 项目中的 InstrumentationTask 类,增加 Ignoretrival,IgnoreMethod 等新增 POM 参数。配制正则表达式,修改 Cobertura 核心,在标注(instrumentation) 阶段遍历函数名时,检测函数名是否匹配传入的正则表达式,过滤函数体代码,从而把这些函数代码排除在代码覆盖统计之外,节省开发人员对这类代码的测试精力。

清单 4 至清单 6 是对 Cobertura 的几处核心改动,仅供读者参考。

清单 4. 对 Cobertura 核心代码的改动之一
 private void checkForTrivialSignature() { 
     Type[] args = Type.getArgumentTypes(myDescriptor); 
     Type ret = Type.getReturnType(myDescriptor); 
     if (myName.equals("")) { 
         isInit = true; mightBeTrivial = true; return; 
     } 
     if (myName.startsWith("set") && args.length == 1 && ret.equals(Type.VOID_TYPE)) { 
          isSetter = true; 
          mightBeTrivial = true; 
          return; 
     } 
     if ((myName.startsWith("get") || myName.startsWith("is") || myName.startsWith("has")) 
     && args.length == 0 && !ret.equals(Type.VOID_TYPE)) { 
          isGetter = true;
          mightBeTrivial = true;
          return; 
     } 
 }
清单 5. 对 Cobertura Maven plugin 的改动
private String ignoreMethodAnnotation;
private String ignoreTrivial;
/**
  * 创建一个新的对象,用于进行配置。
  */
 public ConfigInstrumentation()
 /**
 * * 该方法用于设置annotation的名字以用于过滤类内部的方法
 * @param ignoreMethodAnnotation
 */
public void setIgnoreMethodAnnotation(String ignoreMethodAnnotation) {
	this.ignoreMethodAnnotation = ignoreMethodAnnotation;
}
public String getIgnoreTrivial() {
	return ignoreTrivial;
}
/**
 * 该方法用于标识测试类中的方法是否无关紧要不需要测试。
 * @param ignoreTrivial
 */
public void setIgnoreTrivial(String ignoreTrivial) {
	this.ignoreTrivial = ignoreTrivial;
}
清单 6. POM 文件中使用修改后的 Cobertura 过滤类中的方法
 
 
 
      org.codehaus.mojo
      cobertura-maven-plugin
      2.5.2 
       
             
             
            *main* 
             
            
            true 
       
   
 

以上修改都完成之后, 就可以运行“mvn:site”命令得到报告。图 4 是使用没有被修改的 Cobertura 产生的结果报告,无函数过滤效果。图 5 是使用被修改后的 Cobertura 产生的结果报告,可以从中看出,几个 set 与 get 方法已被排除在统计范围之外。

图 4. 无函数名过滤效果
IBM技术论坛:使用 Cobertura 和反射机制提高单元测试中的代码覆盖率_第3张图片
图 5. 增加函数过滤效果
IBM技术论坛:使用 Cobertura 和反射机制提高单元测试中的代码覆盖率_第4张图片

利用 Java 反射(Reflection) 机制提高代码的行覆盖率

不同的人对反射有不同的理解,大部分人认同的一种观点是:反射使得程序可以检查自身结构以及软件环境,并且根据程序检测到的实际情况改变行为。

为了实现自检,一段程序需要有些信息来表示自身,这些信息就称为元数据(metadata)。Java 运行过程中对这些元数据的自检称为内省(introspection)。内省过程之后往往进行行为改变。总的来说,反射 API 利用以下三种技术来实现行为改变:

  • 直接修改元数据。
  • 利用元数据进行操作。
  • 调解(Intercession), 代码被允许在程序各种运行期进行调整。

Java 语言反射机制提供一组丰富的 API 函数来操作元数据,且提供了少部分重要的 API 来实现 Intercession 能力。

实际项目中,为了保证软件代码的整体质量,单元测试不仅要覆盖类的公有成员,还要覆盖重要的私有成员。而有些私有成员的调用,会被放入到极为复杂的条件分支中。而构造进入这个私有方法的相关条件,可能需要开发人员编写大量测试代码及测试数据。这无疑增加了单元测试的成本。有时为了节省成本,该类私有方法便跳过不测,从而在无形中降低了代码的行覆盖率,影响了软件的整体质量。

而利用反射的一系列特性,我们可以在不改变源代码的情况下,直接对复杂的私有方法进行单元测试,无需增加行覆盖检查中被覆盖的代码行数,从而可以在不增加单元测试成本的前提下,提高代码的行覆盖率与单元测试的整体质量。

清单 7 给出了一段简单的目标测试代码示例。

清单 7. 目标测试代码示例
package exs.res.util;
public class Customer{    
    private String message;    
    public String greet;    
    private String sayHello()
    {
        return "Hello";
    }    
    public String pHello()
    {
        return "pHello";
    }
}

为了测试私有函数 sayHello(),利用反射元数据操作 API 的测试代码为:

清单 8. 利用反射元数据操作 API 的测试代码
                   @Test
public void privateMethodTest() {
  final Method methods[] = Customer.class.getDeclaredMethods();
    for (int i = 0; i < methods.length; ++i) {
        if ("sayHello".equals(methods[i].getName())) {
            //这里会将 sayHello 方法由 private 变为 public,从而可以直接被外部对象访问
            methods[i].setAccessible(true);
            try{
                String anotherString =(String)methods[i].invoke(new Customer(), new Object[0]);
                assertTrue("Hello".equalsIgnoreCase(anotherString));
            }catch(Exception e){
                e.printStackTrace();
            }
            break;
         }
     }
 }
    @Test
    public void privateFieldTest() 
                     throws NoSuchFieldException, SecurityException{
        try{
        Field message = Customer.class.getDeclaredField("message");
        Customer testCustomer = new Customer();
         //这里会将 message 属性由 private 变为 public,从而可以直接被外部对象访问
        message.setAccessible(true);
        message.set(testCustomer, "newMessage");    
        assertTrue("newMessage".equalsIgnoreCase((String)message.get(testCustomer)));
        }catch(Exception e){
            e.printStackTrace();
        }        
}

运行以上单元测试用例来分别对 Customer 的私有方法 sayHello 以及私有属性 message 进行直接访问,结果如图 6 所示。

图 6. 非公有函数测试效果
IBM技术论坛:使用 Cobertura 和反射机制提高单元测试中的代码覆盖率_第5张图片

从图中我们可以看到 Customer 成员的私有方法 sayHello 被测试代码覆盖到。所以,当一些代码函数复杂度过高,到通过构造测试数据或测试用例的方法很难使非公有成员得到运行时,我们就可以利用 Java 反射机制,直接在测试类中调用和测试目标类的非公有成员,从而提高覆盖率。

结语

本文使用两种方法,从两个不同的角度对单元测试中的代码覆盖率进行了增强。改进 Cobertura 来提高单元测试代码覆盖率,主要从缩小参与测试的代码总范围的角度入手,适用于代码总数庞大而被测代码数量不多的情况。而使用 Java 反射机制提高单元测试代码覆盖率,主要从提高被测代码数量的角度入手,适用于被测代码私有成员多且触发条件苛刻的情况。针对项目中对单元测试的不同需求,选取合适的技术来增强单元测试,才能真正提高代码以至项目的总体质量。

参考资料

学习

  • 参考 Maven 官方基础教程。查看对初学者很有帮助的示例以及相关资源的链接。
  • 从 SourceForge 下载 Cobertura。
  • 从 Cobertura Maven Plugin 官方网站下载源码及教程,了解更多此工具插件的基本原理。
  • 查看 Codehaus 中的相关文章,了解更多相关插件的基本使用方法,以及主要配制项的参数设置示例。
  • 查看文章“用 Cobertura 测量测试覆盖率”,了解使用 Cobertura 进行代码代码测试覆盖率统计的基本方法和经验。
  • 查看文章“怎样使用 JUnit Framework 进行单元测试的编写”,了解使用 JUnit 框架编写单元测试的基本过程和方法。
  • developerWorks Java 技术专区:这里有数百篇关于 Java 编程各个方面的文章。

讨论

  • 加入 developerWorks 中文社区。查看开发人员推动的博客、论坛、组和维基,并与其他 developerWorks 用户交流。

你可能感兴趣的:(IBM技术论坛:使用 Cobertura 和反射机制提高单元测试中的代码覆盖率)