[突变测试] 一种新的测试方法论

突变操作

突变测试通过灵活可配置的突变操作集来从你的代码中编译产生新的代码。

例如CONDITIONALS_BOUNDARY_MUTATOR 改变条件边界突变会从源代码中生成下面的语句。

if ( i >= 0 ) {
    return "foo";
} else {
    return "bar";
}

与其对应的语句是

if ( i > 0 ) {
    return "foo";
} else {
    return "bar";
}

PIT定义了各式各样从源代码中突变的方法,包括移除方法调用、反置逻辑条件、更改返回值等等。

PIT的运行需要编译器在字节码中提供以下调试信息:

  • 代码行号
  • 源代码文件名

绝大部分构建系统,如 maven 默认就提供了这些信息。

突变

PIT通过应用突变操作符将生成许多(可能是非常大的数量)突变体。每一个突变Java类包含一个突变(或错误),使它们的行为不同于未突变的类。

PIT将这些突变后的类执行你的单元测试,如果突变可以被杀死(突变后不满足测试用例),则证明本次测试是有效的。

等价突变

通过改变代码条件来改变执行逻辑并非那么简单,某些情况下的突变完全等价于未突变之前的逻辑。

等价突变产生的原因有两点:

突变的结果恰好与突变前的行为完全一致。

例如,下面两份代码是逻辑完全等价的:

int i = 2;
if ( i >= 1 ) {
    return "foo";
}

//...
int i = 2;
if ( i > 1 ) {
    return "foo";
}

突变前后虽然有了不同的行为,但是测试用例并没有覆盖到突变产生的非正常结果。

另一个比较常见的等价突变的示例是DEBUG或者日志,PIT排除了common logging等日志组件的突变生成,也可以通过配置来过滤日志组件。

测试执行

PIT会根据修改后的代码自动运行单元测试。在运行测试之前,PIT对测试执行传统的行覆盖率分析,然后使用这些数据和测试的时间来选择一组测试用例,这些测试用例的目标是修改后的代码。然后使用这些及测试之后的数据来选择测试用例执行一组突变代码。

这种执行机制也是PIT的执行速度远快于其它类似的突变测试系统的原因(如Jester 、 Jumble),这也是PIT能够将测试提升到全部代码,而不是仅仅测试单个类的技术实现。

突变测试报告的输出结果集解释如下:

  • Killed : 突变被杀死,代表突变的代码不满足测试用例
  • Lived : 突变存活,意味着等价突变或者突变改变的逻辑,但是仍符合测试用例,此时的代码可能是有问题的!
  • No coverage 代码没有被覆盖到,和存活一样,这个测试可能也是有问题的。
  • Non viable : 不可行的突变是JVM无法加载的,因为字节码在某种程度上是无效的。PIT试图将它所产生的不可存活突变的数量降到最低。
  • Timed Out : 如果突变导致无限循环,例如从for循环中的计数器中删除增量,则可能超时。
  • Memory error : 内存错误可能由于增加系统使用的内存数量的突变而发生,也可能是在出现突变时重复运行测试所需的额外内存开销的结果。如果您看到大量内存错误,请考虑为测试配置更多的堆和permgen空间。
  • Run error : 运行错误意味着在尝试测试突变时出错了。某些类型的不可存活突变目前可能导致运行错误。如果您看到大量的运行错误,这可能是出错的迹象。

在正常情况下,您应该不会看到任何不可行的突变或运行错误。

你可能感兴趣的:([突变测试] 一种新的测试方法论)