文章目录
- 1. 软件测试基础
- 1.1. 软件测试的目的和准则
- 1.2. 软件测试方法和步骤
- 1.3. 测试内容
- 1.4. 测试阶段的信息流
- 2. 单元测试
- 3. 集成测试
- 3.1. 集成测试概述
- 3.2. 自顶向下集成
- 3.3. 自底向上集成
- 3.4. 不同集成测试策略的比较与回归测试
- 4. 确认测试
- 4.1. 确认测试概述
- 4.2. 确认测试的范围和软件配置复查
- 4.3. Alpha和Beta测试
- 5. 白盒测试技术
- 5.1. 白盒测试技术概述
- 5.2. 逻辑覆盖
- 5.3. 控制结构测试
- 6. 黑盒测试技术
- 6.1. 黑盒测试概述
- 6.2. 等价划分
- 6.3. 边界值分析
- 6.4. 错误推测
- 7. 调试
- 8. 软件可靠性
- 8.1. 软件可靠性相关的几个概念
- 8.2. 估算平均无故障时间的方法
1. 软件测试基础
1.1. 软件测试的目的和准则
测试是为了发现程序中的错误而执行程序的过程,好的测试方案是极可能发现迄今为止尚未发现的错误的测试方案,成功的测试是发现了至今为止尚未发现的错误的测试。
一般来说,软件测试有以下几条准则:
- 所有测试都应该能追溯到用户需求;
- 应该远在测试开始之前就制定出测试计划;
- 把Pareto原理应用到软件测试中;
- 应该从“小规模”测试开始,并逐步进行“大规模”测试;
- 穷举测试是不可能的;
- 为了达到最佳的测试效果,应该由独立的第三方从事测试工作。
1.2. 软件测试方法和步骤
软件测试方法主要分为黑盒测试和白盒测试:
- 黑盒测试(功能测试)
把程序看作一个黑盒子,完全不考虑程序的内部结构和处理过程,而是在程序接口进行的测试;
- 白盒测试(结构测试)
把程序看成装在一个透明的盒子里,测试者完全知道程序的结构和处理算法,按照程序内部的逻辑测试程序,检测程序中的主要执行通路是否都能按预定要求正确工作。
|
黑盒测试 |
白盒测试 |
优点 |
适用于各阶段测试 从产品功能角度测试 容易入手生成测试数据 |
可构成测试数据使特定程序部分得到测试 有一定的充分性度量手段 可获较多工具支持 |
缺点 |
某些代码得不到测试 如果规格说明有误,则无法发现 不易进行充分性测试 |
通常不易生成测试数据 无法对未实现规格说明的部分进行测试 工作量大,通常只用于单元测试,有应用局限 |
性质 |
一种确认技术,回答"我们在构造一个正确的系统吗?" |
一种验证技术,回答"我们在正确地构造一个系统吗?" |
一般来说,测试的按照以下步骤进行:
- 模块测试(单元测试)
模块测试主要发现的往往是编码和详细设计的错误,目的是保证每个模块作为一个单元能正确运行;
- 子系统测试
子系统测试把经过单元测试的模块放在一起形成一个子系统来测试,着重测试模块的接口。
- 系统测试
把经过测试的子系统装配成一个完整的系统来测试,发现的往往是软件设计中的错误,也可能发现需求说明中的错误。不论是子系统测试还是系统测试,都兼有检测和组装两重含义,通常也称为集成测试。
- 验收测试(确认测试)
验收测试是在用户积极参与下进行的,而且可能主要使用实际数据(系统将来要处理的信息)把软件系统作为单一的实体进行测试进行测试,它发现的往往是系统需求说明书中的错误
- 平行运行
同时运行新开发出来的系统和将被它取代的旧系统,然后比较新旧两个系统的处理结果。平行运行可以在准生产环境中运行新系统而又不冒风险,同时用户能有一段熟悉新系统的时间,用户可以趁这段时间验证用户指南和使用手册之类的文档。以准生产模式对新系统进行全负荷测试,可以用测试结果验证性能指标。
详细步骤说明如下表所示:
测试阶段 |
主要依据 |
测试人员 |
测试方法 |
测试内容 |
单元测试 |
系统设计文档 |
开发小组 |
白盒测试 |
接口测试 路径测试 |
子系统测试 |
系统设计文档 需求文档 |
独立测试小组 |
白盒测试 黑盒测试 |
接口测试 路径测试 功能测试 性能测试 |
系统测试 |
需求文档 |
独立测试小组 |
黑盒测试 |
功能测试、健壮性测试 性能测试、用户界面测试 安全性测试、压力测试 可靠性测试、安装/反安装测试 |
验收测试 |
需求文档 |
用户 |
黑盒测试 |
功能测试、健壮性测试 性能测试、用户界面测试 安全性测试、压力测试 可靠性测试、安装/反安装测试 |
1.3. 测试内容
- 接口测试
每个接口可能有多个输入参数,每个参数有 “典型值”、“边界值”、“异常值”之分,根据接口的定义,可以推断某种输入应当产生什么样的输出。输出包括函数的返回值和输出参数。 同时要观察是否有程序语句从来没有被执行过,特别留意函数体内的错误处理程序块。
- 路径测试
路径测试就是测试程序的流程路径,想遍历全部路径几乎是不可能的,不测试或者胡乱找几条路径测试却又不行,输入与对应的输出之间的路径是唯一的。由于接口测试时的输入要有代表性的,因此相应的路径也具有代表性,制定的路径测试检查表应该包括:数据类型、变量值、逻辑判断、循环、内存管理、文件I/O、错误处理。
- 功能测试
功能测试的基本方法是构造一些合理输入(在需求范围之内),检查输出是否与期望相同。有两种比较好的测试方法:等价划分法和边界值分析法,等价划分是指把输入空间划分为几个“等价区间”,在每个“等价区间”中只需要测试一个典型值就可以了;边界值测试法是对等价划分法的补充。除了典型值外还要用边界值作为测试用例。
- 健壮性测试
健壮性是指在异常情况下,软件能正常运行的能力。它有两层含义:(1)容错能力,容错性测试通常构造一些不合理的输入来引诱软件出错;(2)恢复能力,恢复测试重点考察系统能否重新运行、有无重要的数据丢失、是否毁坏了其它相关的软件硬件。
- 性能测试
性能测试即测试软件处理事务的速度,一是为了检验性能是否符合需求,二是为了得到某些性能数据供人们参考,有时人们关心测试的“绝对值” ,有时关心测试的“相对值” 。
- 用户界面测试
绝大多数软件拥有图形用户界面,图形用户界面的测试重点是正确性、易用性和视觉效果,在评价易用性和视觉效果时,主观性非常强,应当考虑多个人的观点。
- 信息安全测试
信息安全性是指防止系统被非法入侵的能力,既属于技术问题又属于管理问题。主要有如下步骤:(1)为非法入侵设立目标、(2)邀请一些人扮演黑客,让他们想尽办法入侵系统,实现“目标”、(3)如果有人成功了,请他详述入侵的过程。
- 压力测试
压力测试也叫负荷测试,即获取系统能正常运行的极限状态。 主要任务是:构造正确的输入,使劲折腾系统却让它刚好不瘫痪。 压力测试的一个变种是敏感测试,敏感测试目的是发现什么样的输入可能会引发不稳定现象。
- 可靠性测试
可靠性是指在一定的环境下、给定的时间内、系统不发生故障的概率。软件可靠性测试可能会花费很长时间。 比较实用的办法是,让用户使用该系统,记录每一次发生故障的时刻。计算出相邻故障的时间间隔,注意要去掉非工作时间。然后统计出不发生故障的“最小时间间隔”、“最大时间间隔”和“平均时间间隔”。
- 安装/反安装测试
目前市面上有非常流行的、专门制作安装/反安装程序的一些工具,如Install Shelled。主要的测试工作是:(1)至少在标准配置和最低配置两种环境下测试;(2)如果有安装界面,应当尝试各种选项,如选择“全部”、“部分”、“升级”等。
1.4. 测试阶段的信息流
测试阶段输入的信息有两类: 软件配置和测试配置,其中软件配置包括需求说明书、设计说明书和源程序清单等,测试配置包括测试计划和测试方案。
2. 单元测试
单元测试和编码属于软件过程的同一个阶段,它应用人工测试和计算机测试这样两种不同类型的测试方法对模块进行集中检测。单元测试主要使用白盒测试技术,对多个模块的测试可以并行地进行。
人工测试的方法由审查小组进行,其主要使用白盒测试技术进行代码审查,审查的重点是模块接口、局部数据结构、重要的执行通路、出错处理通路和边界条件,一般来说可以查出30%~70%的逻辑设计错误和编码错误,这可以减少系统验证的总工作量。
审查小组一般由一名审查组长,带领程序的设计人员、编码人员和测试人员共同进行。
计算机测试的方法必须为每个单元测试开发驱动程序和(或)存根程序,驱动程序是一个“主程序”,它接收测试数据,传送给被测试的模块,并且输出有关的结果。
存根程序代替被测试的模块所调用的模块。它使用被它代替的模块的接口,可能做最少量的数据操作,输出对入口的检验或操作结果,并且把控制归还给调用它的模块。
3. 集成测试
3.1. 集成测试概述
集成测试是测试和组装软件的系统化技术,主要目标是发现与接口有关的问题。
由模块组装成程序时有两种方法:
- 非渐增式测试方法
先分别测试每个模块,再把所有模块按设计要求放在一起结合成所要的程序。非渐增式测试一下子把所有模块放在一起,并把庞大的程序作为一个整体来测试,测试者面对的情况十分复杂,在庞大的程序中想要诊断定位一个错误是非常困难的,改正错误更是极端困难,而且一旦改正一个错误之后,马上又会遇到新的错误。
- 渐增式测试方法
把下一个要测试的模块同已经测试好的那些模块结合起来进行测试,测试完以后再把下一个应该测试的模块结合进来测试,每次增加一个模块,实际上同时完成单元测试和集成测试。把程序划分成小段来构造和测试,在这个过程中比较容易定位和改正错误;
而渐增方式也有两种集成策略:自顶向下集成和自底向上集成,下面分别对它们进行介绍
3.2. 自顶向下集成
从主控制模块开始,沿着程序的控制层次向下移动,逐渐把各个模块结合起来,就是自顶向下的集成。
在把附属于主控制模块的那些模块组装到程序结构中去时,可以使用深度优先的策略或者使用宽度优先的策略。
所谓深度优先,就是先组装在软件结构的一条主控制通路上的所有模块;宽度优先就是沿软件结构水平地移动,把处于同一个控制层次上的所有模块组装起来。
然后按照下述4个步骤完成把模块结合进软件结构的过程:
- 对主控制模块进行测试,测试时用存根程序代替所有直接附属于主控制模块的模块;
- 根据选定的结合策略(深度优先或宽度优先),每次用一个实际模块代换一个存根程序(新结合进来的模块往往又需要新的存根程序);
- 在结合进一个模块的同时进行测试;
- 为了保证加入模块没有引进新的错误,可能需要进行回归测试(即,全部或部分地重复以前做过的测试);
- 不断地重复2~4步,直到构造起完整的软件结构为止。
自顶向下的测试能够在测试的早期对主要的控制或关键的抉择进行检验,如果选择深度优先的结合方法,可以在早期实现软件的一个完整的功能并且验证这个功能。但是由于存根程序代替了低层次的模块,在软件结构中没有重要的数据自下往上流。
3.3. 自底向上集成
用下述步骤可以实现自底向上的结合策略:
- 把低层模块组合成实现某个特定的软件子功能的族;
- 写一个驱动程序(用于测试的控制程序),协调测试数据的输入和输出;
- 对由模块组成的子功能族进行测试;
- 去掉驱动程序,沿软件结构自下向上移动,把子功能族组合起来形成更大的子功能族。
- 不断重复2~4步,直到构造起完整的软件结构为止。
3.4. 不同集成测试策略的比较与回归测试
集成测试策略 |
优点 |
缺点 |
非渐增式 |
无 |
没有错误隔离手段 主要设计错误发现迟 潜在可重用代码测试不充分 需要驱动程序和存根程序 |
自顶向下 |
具有错误隔离手段 主要设计错误发现早 不需要驱动程序 |
潜在可重用代码测试不充分 需要存根程序 |
自底向上 |
具有错误隔离手段 潜在可重用代码能充分测试 不需要存根程序 |
主要设计错误发现迟 需要驱动程序 |
混合 |
具有错误隔离手段 主要设计错误发现早 潜在可重用代码能充分测试 |
较少 |
所谓混合集成测试策略,主要有两种:
- 改进的自顶向下测试方法
基本上使用自顶向下的测试方法,但是在早期使用自底向上的方法测试软件中的少数关键模块。该策略能在测试的早期发现关键模块中的错误;测试关键模块时需要驱动程序。
- 混合法
对软件结构中较上层使用的自顶向下方法与对软件结构中较下层使用的自底向上方法相结合,该策略兼有两种方法的优缺点,当被测试的软件中关键模块比较多时,这种混合法可能是最好的折衷方法。
每一轮集成测试后都要尽可能的进行回归测试,用于保证由于调试或其他原因引起的变化,不会导致非预期的软件行为或额外错误的测试活动,可以通过重新执行全部测试用例的一个子集人工地进行,也可以使用自动化的捕获回放工具自动进行。
4. 确认测试
4.1. 确认测试概述
确认测试也称为验收测试,它的目标是验证软件的有效性(即软件的功能和性能是否符合用户预期)。
需求分析阶段产生的软件需求规格说明书,准确地描述了用户对软件的合理预期,因此是软件有效性的标准,也是进行确认测试的基础。
4.2. 确认测试的范围和软件配置复查
确认测试必须有用户积极参与,或者以用户为主进行,使用用户界面输入测试数据并且分析评价测试的输出结果,在验收之前通常要由开发单位对用户进行培训。
确认测试的一个重要内容是复查软件配置。复查的目的是保证软件配置的所有成分都齐全,质量符合要求,文档与程序完全一致,具有完成软件维护所必须的细节。
4.3. Alpha和Beta测试
Alpha测试就是由开发者“指导”用户在开发环境下进行的测试。Alpha测试是在受控的环境中进行的。
Beta测试就是由软件的最终用户们在一个或多个实际生产环境下进行的测试。开发者通常不在Beta测试的现场,因此,Beta测试是软件在开发者不能控制的环境中的“真实”应用。
5. 白盒测试技术
5.1. 白盒测试技术概述
白盒测试应包含完整的测试方案,所谓测试方案包括具体的测试目的(例如,预定要测试的具体功能),应该输入的测试数据和预期的结果。通常又把测试数据和预期的输出结果称为测试用例。
5.2. 逻辑覆盖
有选择地执行程序中某些最有代表性的通路是对穷尽测试的惟一可行的替代办法。从覆盖源程序语句的详尽程度分析,大致有以下一些不同的覆盖标准:
- 语句覆盖
选择足够多的测试数据,使被测程序中每个语句至少执行一次。语句覆盖对程序的逻辑覆盖很少。语句覆盖只关心判定表达式的值,而没有分别测试判定表达式中每个条件取不同值时的情况。语句覆盖是很弱的逻辑覆盖标准。
- 判定覆盖
不仅每个语句必须至少执行一次,而且每个判定的每种可能的结果都应该至少执行一次。
- 条件覆盖
不仅每个语句至少执行一次,而且使判定表达式中的每个条件都取到各种可能的结果。条件覆盖通常比判定覆盖强,因为它使每个条件都取到了两个不同的结果,判定覆盖却只关心整个判定表达式的值。但也有反例,如第二组测试用例。判定覆盖不一定包含条件覆盖,条件覆盖也不一定包含判定覆盖。
- 判定/条件覆盖
使得判定表达式中的每个条件都取到各种可能的值,每个判定表达式也都取到各种可能的结果。
- 条件组合覆盖
要求选取足够多的测试数据,使得每个判定表达式中条件的各种可能组合都至少出现一次。条件组合覆盖是前述几种覆盖标准中最强的。满足条件组合覆盖标准的测试数据,也一定满足判定覆盖、条件覆盖和判定/条件覆盖标准。但是,条件组合覆盖标准的测试数据并不一定能使程序中的每条路径都执行到,是从对程序路径的覆盖程度分析的逻辑覆盖标准。
- 点覆盖
选取足够多的测试数据,使得程序执行路径至少经过流图的每个结点一次。由于流图的每个结点与一条或多条语句相对应,因此点覆盖标准和语句覆盖标准是相同的。
- 边覆盖
选取足够多测试数据,使得程序执行路径至少经过流图中每条边一次。通常边覆盖和判定覆盖是一致的。
- 路径覆盖
选取足够多测试数据,使程序的每条可能路径都至少执行一次(如果程序图中有环,则要求每个环至少经过一次。
5.3. 控制结构测试
控制结果测试分为基本路径测试和循环测试,具体如下
- 基本路径测试
基本路径测试是Tom McCabe提出的一种白盒测试技术。首先计算程序的环形复杂度,以该复杂度为指南定义执行路径的基本集合,从该基本集合导出的测试用例可保证程序中的每条语句至少执行一次,而且每个条件在执行时都将分别取真、假两种值。
- 循环测试
循环测试是一种白盒测试技术,它专注于测试循环结构的有效性。在结构化的程序中通常只有3种循环,即简单循环、串接循环和嵌套循环。
(1)简单循环
应该使用下列测试集来测试简单循环,其中n是允许通过循环的最大次数。
跳过循环、只通过循环一次、通过循环两次、通过循环m次,其中m (2)嵌套循环
从最内层循环开始测试,其他循环都设置为最小值。对最内层循环使用简单循环测试方法,而使外层循环的迭代参数取最小值,并为越界值或非法值增加一些额外的测试。由内向外,对下一个循环进行测试,但保持所有其他外层循环为最小值,其他嵌套循环为“典型”值。然后继续进行下去,直到测试完所有循环。
(3)串接循环
如果串接循环的各个循环都彼此独立,则可以使用测试简单循环的方法来测试串接循环。如果两个循环串接,而且第一个循环的循环计数器值是第二个循环的初始值,则这两个循环并不是独立的。当循环不独立时,建议使用测试嵌套循环的方法来测试串接循环。
6. 黑盒测试技术
6.1. 黑盒测试概述
黑盒测试着重测试软件功能,主要的错误类型为: 功能不正确或遗漏了功能、界面错误、数据结构错误或外部数据库访问错误、性能错误、初始化和终止错误
黑盒测试的公认标准主要有两个:(1)测试用例尽可能少;(2)一个测试用例能指出一类错误。
6.2. 等价划分
使用等价划分法设计测试方案首先需要划分输入数据的等价类,等价划分是一种黑盒测试技术,把程序的输入域划分成若干个数据类,据此导出测试用例。设计测试方案时尽量设计出能发现若干类错误的测试用例,从而减少测试用例的数目,每类中的一个典型值在测试中的作用要与这一类中所有其他值的作用相同。此外常常还需要分析输出数据的等价类,以便根据输出数据的等价类导出对应的输入数据等价类。
等价类划分的启发式规则:
- 如果规定了输入值的范围,则可划分出一个有效的等价类(输入值在此范围内),两个无效的等价类(输入值小于最小值或大于最大值);
- 如果规定了输入数据的个数,则类似地也可划分出一个有效的等价类和两个无效的等价类;
- 如果规定了输入数据的一组值,而且程序对不同输入值做不同处理,则每个允许的输入值是一个有效的等价类,此外还有一个无效的等价类(任一个不允许的输入值);
- 如果规定了输入数据必须遵循的规则,则可以划分出一个有效的等价类(符合规则)和若干个无效的等价类(从各种不同角度违反规则);
- 如果规定了输入数据为整型,则可以划分出正整数、零和负整数等3个有效类;
- 如果程序的处理对象是表格,则应该使用空表,以及含一项或多项的表。
使用等价划分法设计黑盒测试的方案时可以按照如下两个步骤进行:
- 设计一个新的测试方案以尽可能多地覆盖尚未被覆盖的有效等价类,重复这一步骤直到所有有效等价类都被覆盖为止;
- 设计一个新的测试方案,使它覆盖一个而且只覆盖一个尚未被覆盖的无效等价类,重复这一步骤直到所有无效等价类都被覆盖为止。
6.3. 边界值分析
经验表明,处理边界情况时程序最容易发生错误。例如,许多程序错误出现在下标、纯量、数据结构和循环等等的边界附近。使用边界值分析方法设计测试方案首先应该确定边界情况。选取的测试数据应该刚好等于、刚刚小于和刚刚大于边界值。
通常设计测试方案时总是联合使用等价划分和边界值分析两种技术。
6.4. 错误推测
不同类型不同特点的程序通常又有一些特殊的容易出错的情况。因此必须依靠测试人员的经验和直觉,从各种可能的测试方案中选出一些最可能引起程序出错的方案。它的基本想法是列举出程序中可能有的错误和容易发生错误的特殊情况,并且根据它们选择测试方案。
7. 调试
7.1. 调试概述
调试是在测试发现错误之后排除错误的过程,软件错误的外部表现和它的内在原因之间可能并没有明显的联系,调试就是把症状和原因联系起来的尚未被人深入认识的智力过程。
7.2. 调试过程和途径
调试发生在测试之后,调试过程从执行一个测试用例开始,评估测试结果,如果发现实际结果与预期结果不一致,则这种不一致就是一个症状,它表明在软件中存在着隐藏的问题。
调试过程试图找出产生症状的原因,以便改正错误。
调试可以通过下列途径进行:
- 蛮干法
蛮干法可能是寻找软件错误原因的最低效的方法。其他方法都失败时才使用这种方法,这种方法印出内存的内容,激活对运行过程的跟踪,在程序中到处都写上WRITE(输出)语句。更多情况下这种方法只会浪费时间和精力。必须首先进行周密的思考,有明确的目的,尽量减少无关信息的数量。
- 回溯法
回溯是一种相当常用的调试方法,当调试小程序时这种方法是有效的。具体做法是,从发现症状的地方开始,人工沿程序的控制流往回追踪分析源程序代码,直到找出错误原因为止。但是随着程序规模扩大,应该回溯的路径数目也变得越来越大,以至彻底回溯大程序变成完全不可能了。
- 原因排除法
(1)对分查找法
如果已经知道每个变量在程序内若干个关键点的正确值,则可以用赋值语句或输入语句在程序中点附近“注入”这些变量的正确值,然后运行程序并检查所得到的输出,如果输出结果是正确的,则错误原因在程序前半部分;反之,错误原因在程序后半部分,对错误原因所在的那部分重复使用这个方法,直到把出错范围缩小到容易诊断的程度为止。
(2)归纳法
归纳法是从个别现象推断出一般性结论的思维方法。首先把和错误有关的数据组织起来进行分析,以便发现可能的错误原因,然后导出对错误原因的一个或多个假设,并利用已有的数据来证明或排除这些假设。
(3)演绎法
演绎法从一般原理或前提出发,经过排除和精化的过程推导出结论。首先设想出所有可能的出错原因,然后试图用测试来排除每一个假设的原因。
8. 软件可靠性
8.1. 软件可靠性相关的几个概念
软件可靠性:程序在给定的时间间隔内,按照规格说明书的规定成功地运行的概率。
软件的可用性:程序在给定的时间点,按照规格说明书的规定,成功地运行的概率。
稳态可用性(Ass):如果在一段时间内,软件系统故障停机时间分别为 t d o w n 1 t_{down1} tdown1, t d o w n 2 t_{down2} tdown2,…,正常运行时间分别为 t u p 1 t_{up1} tup1, t u p 2 t_{up2} tup2,…,则系统的稳态可用性为:
A s s = T u p T u p + T d o w n Ass=\frac{T_{up}}{T_{up}+T_{down}} Ass=Tup+TdownTup
其中 T u p = ∑ t u p i T_up=\sum t_{upi} Tup=∑tupi, T d o w n = ∑ t d o w n i T_down=\sum t_{downi} Tdown=∑tdowni
平均维修时间(MTTR):是修复一个故障平均需要用的时间,它取决于维护人员的技术水平和对系统的熟悉程度,也和系统的可维护性有重要关系。
平均无故障时间(MTTF):是系统按规格说明书规定成功地运行的平均时间,它主要取决于系统中潜伏的错误的数目,因此和测试的关系十分密切。稳态可用性也可以表示为:
A s s = M T T F M T T F + M T T R Ass=\frac{MTTF}{MTTF+MTTR} Ass=MTTF+MTTRMTTF
8.2. 估算平均无故障时间的方法
1、相关量的符号
E T ET ET——测试之前程序中错误总数;
I T IT IT——程序长度(机器指令总数);
τ \tau τ——测试(包括调试)时间;
E d ( τ ) E_d(\tau) Ed(τ)——在 0 0 0至 τ \tau τ期间发现的错误数;
E c ( τ ) E_c(\tau) Ec(τ)——在 0 0 0至 τ \tau τ期间改正的错误数。
2、基本假定
在类似的程序中,单位长度里的错误数 E T I T \frac{ET}{IT} ITET近似为常数。通常: 0.5 × 1 0 − 2 ⩽ E T I T ⩽ 2 × 1 0 − 2 0.5×10^{-2} \leqslant \frac{ET}{IT} \leqslant 2×10^{-2} 0.5×10−2⩽ITET⩽2×10−2
失效率正比于软件中剩余的错误数,而平均无故障时间MTTF与剩余的错误数成反比。
假设发现的每一个错误都立即正确地改正了,则 E d ( τ ) = E c ( τ ) E_d(\tau)=E_c(\tau) Ed(τ)=Ec(τ),剩余的错误数为 E r ( τ ) = E T - E c ( τ ) E_r(\tau)=ET-E_c(\tau) Er(τ)=ET-Ec(τ),单位长度程序中剩余的错误数为: e r ( τ ) = E T I T - E c ( τ ) I T er(\tau)=\frac{ET}{IT}-\frac{E_c(\tau)}{IT} er(τ)=ITET-ITEc(τ)
3、估算平均无故障时间
经验表明,平均无故障时间与单位长度程序中剩余的错误数成反比,即: M T T F = 1 K ( E T I T − E c ( τ ) I T ) MTTF=\frac{1}{K(\frac{ET}{IT}-\frac{E_c(\tau)}{IT})} MTTF=K(ITET−ITEc(τ))1其中K为常数,典型值是200。
估算平均无故障时间的公式,可以评价软件测试的进展情况,其公式为 E c = E T - I T K × M T T F Ec=ET-\frac{IT}{K×MTTF} Ec=ET-K×MTTFIT
因此,也可以根据对软件平均无故障时间的要求,估计需要改正多少个错误之后,测试工作才能结束。
4、估计错误总数的方法
程序中的错误总数 E T ET ET与程序规模、类型、开发环境、开发方法论、开发人员的技术水平和管理水平等都有密切关系。
估计ET的两个方法:
- 植入错误法
在测试之前由专人在程序中随机地植入一些错误。测试之后,根据测试小组发现的错误中原有的和植入的两种错误的比例,来估计程序中原有错误的总数 E T ET ET。
假设人为地植入的错误数为 N s N_s Ns,经过一段时间的测试之后发现 n s n_s ns个植入的错误,此外还发现了 n n n个原有的错误。如果可以认为测试方案发现植入错误和发现原有错误的能力相同,则能够估计出程序中原有错误的总数为: N = n / n s × N s N=n/n_s×N_s N=n/ns×Ns。
- 分别测试法
植入错误法的基本假定是所用的测试方案发现植入错误和发现原有错误的概率相同,这个基本假定可能有时和事实不完全一致。如果有办法随机地把程序中一部分原有的错误加上标记,然后根据测试过程中发现的有标记错误和无标记错误的比例,估计程序中的错误总数,那就可以做分别测试。
分别测试法使用两个测试员(小组),彼此独立地测试同一个程序的两个副本,把其中一个测试员发现的错误作为有标记的错误。
τ \tau τ表示测试时间,设:
τ = 0 \tau=0 τ=0 时错误总数为 B 0 B_0 B0;
τ = τ 1 \tau=\tau 1 τ=τ1时测试员甲发现的错误数为 B 1 B_1 B1,测试员乙发现的错误数为 B 2 B_2 B2,两个测试员发现的相同错误数为 b c bc bc;
如果认为测试员甲发现的错误是有标记的,即程序中有标记的错误总数为 B 1 B_1 B1,则测试员乙发现的 B 2 B_2 B2个错误中有 b c bc bc个是有标记的。假定测试员乙发现有标记错误和发现无标记错误的概率相同,则错误总数为 B 0 = B 2 b c × B 1 B_0=\frac{B_2}{bc}×B_1 B0=bcB2×B1