Mitch Kapor曾经就软件设计发表过宣言:“什么是设计?设计是你站在两个世界——技术世界和人类的目标世界,而你尝试将这两个世界结合在一起……”。
软件设计阶段从不同的角度有不同的划分方法,下面举三个典型的设计阶段划分的例子:
结构化分析和设计是最常用的软件需求分析和软件设计方法,他们的关系可以用下面的一张图表示:
对于总体设计来说,它的设计过程按照如下的步骤进行:首先寻找实现目标系统的各种不同的方案;然后分析员从这些供选择的方案中选取若干个合理的方案,从中选出一个最佳方案向用户和使用部门负责人推荐;分析员应该进一步为这个最佳方案设计软件结构,进行必要的数据库设计,确定测试要求并且制定测试计划。
总体设计可以站在全局高度上,花较少成本,从较抽象的层次上分析对比多种可能的系统实现方案和软件结构,从中选出最佳方案和最合理的软件结构,从而用较低成本开发出较高质量的软件系统。
典型的总体设计过程由两个主要阶段组成:
1、系统设计阶段,确定系统的具体实现方案
2、结构设计阶段,确定软件结构
模块是由边界元素限定的相邻程序元素的序列,有一个总体标识符代表它。
所谓模块化,就是把程序划分成独立命名且可独立访问的模块,每个模块完成一个子功能,把这些模块集成起来构成一个整体,可以完成指定的功能满足用户的需求。
之所以提倡模块化,是因为它可以使一个复杂的大型程序,能被人的智力所管理;相反,如果一个大型程序仅由一个模块组成,它将很难被人所理解。总的来说,模块化有以下四个作用:
以上四个作用都有助于减少软件开发的工作量,进而降低软件开发成本
设问题 P P P的复杂程度为 C ( P ) C(P) C(P),解决问题 P P P所需的工作量为 E ( P ) E(P) E(P) ,如果有 C ( P 1 ) > C ( P 2 ) C(P_1)>C(P_2) C(P1)>C(P2),则显然有 E ( P 1 ) > E ( P 2 ) E(P_1)>E(P_2) E(P1)>E(P2)
根据人类解决一般问题的经验: C ( P 1 + P 2 ) > C ( P 1 ) + C ( P 2 ) C(P_1+P_2)>C(P_1)+C(P_2) C(P1+P2)>C(P1)+C(P2)可得: E ( P 1 + P 2 ) > E ( P 1 ) + E ( P 2 ) E(P_1+P_2)>E(P_1)+E(P_2) E(P1+P2)>E(P1)+E(P2)这个公式说明了模块化对于减少工作量有着积极的作用。
在长期实践的过程中,开发者们总结出了模块化和软件成本之间的关系,如下图所示:
从图中可以看出,每个程序都相应地有一个最适当的模块数目 M M M,使得系统的开发成本处于最小成本区间。
对于一个设计方法来说,可以从以下五个方面评价它的定义模块能力:
Grady Boach:“抽象是人类处理复杂问题的基本方法之一。”
现实世界中一定事物、状态或过程之间总存在着某些相似的方面(共性)。把这些相似的方面集中和概括起来,暂时忽略它们之间的差异,这就是抽象。
简而言之,抽象就是抽出事物本质特性而暂时不考虑细节。
处理复杂系统的惟一有效的方法是用层次的方式构造和分析它。一个复杂的动态系统首先可以用一些高级的抽象概念构造和理解,这些高级概念又可以用一些较低级的概念构造和理解,如此进行下去,直至最低层次的具体元素,例如过程抽象和数据抽象的过程。
将上面的抽象过程应用到软件工程中,可以看到,软件工程抽象过程的每一步都是对软件解法的抽象层次的一次精化。在可行性研究阶段,软件作为系统的一个完整部件;在需求分析期间,软件解法是使用在问题环境内熟悉的方式描述的;当由总体设计向详细设计过渡时,抽象的程度也就随之减少了;最后,当源程序写出来以后,也就达到了抽象的最低层。
一个人在任何时候都只能把注意力集中在(7±2)个知识块上。——Miller法则
为了能集中精力解决主要问题而尽量推迟对问题细节的考虑。逐步求精是人类解决复杂问题时采用的基本方法,也是许多软件工程技术的基础。
逐步求精能帮助软件工程师把精力集中在与当前开发阶段最相关的那些方面上,而忽略那些对整体解决方案来说虽然是必要的,然而目前还不需要考虑的细节。
逐步求精方法确保每个问题都将被解决,而且每个问题都将在适当的时候被解决,但是,在任何时候一个人都不需要同时处理7个以上知识块。
其实逐步求精在软件工程中很好理解也很常见,例如先写伪代码再实现为真实代码,先写设计框架再逐步完善等等。
展开来说就是,对一个复杂的问题不应该立刻用计算机指令、数字和逻辑符号来表示,而应该用较自然的抽象语句来表示,从而得出抽象程序。
抽象程序对抽象的数据进行某些特定的运算并用某些合适的记号(可能是自然语言)来表示。对抽象程序做进一步的分解,并进入下一个抽象层次,这样的精细化过程一直进行下去,直到程序能被计算机接受为止。这时的程序可能是用某种高级语言或机器指令书写的。
信息隐藏可以使一个模块内包含的信息(过程和数据)对于不需要这些信息的模块来说,是不能访问的。
局部化的概念和信息隐藏概念是密切相关的。所谓局部化是指把一些关系密切的软件元素物理地放得彼此靠近。显然,局部化有助于实现信息隐藏。
信息隐藏和局部化意味着有效的模块化可以通过定义一组独立的模块而实现,这些独立的模块彼此间仅仅交换那些为了完成系统功能而必须交换的信息。使用信息隐藏原理作为模块化系统设计的标准就会带来极大好处。因为绝大多数数据和过程对于软件的其他部分而言是隐藏的,在修改期间由于疏忽而引入的错误就很少可能传播到软件的其他部分。
模块独立的概念是模块化、抽象、信息隐藏和局部化概念的直接结果。希望这样设计软件结构,使得每个模块完成一个相对独立的特定子功能,并且和其他模块之间的关系很简单。
有效模块化(即具有独立的模块)的软件比较容易开发出来。这是由于能够分割功能而且接口可以简化,当许多人分工合作开发同一个软件时,这个优点尤其重要。相对说来,独立的模块比较容易测试和维护,单个模块修改设计和程序需要的工作量比较小,错误传播范围小,需要扩充功能时能够“插入”模块。
模块独立程度有两个定性标准度量:
耦合是对一个软件结构内不同模块之间互连程度的度量。在软件设计中应该追求尽可能松散耦合的系统。
模块间的耦合程度强烈影响系统的可理解性、可测试性、可靠性和可维护性。 模块间联系简单,发生在一处的错误传播到整个系统的可能性就很小,联系简单可以方便研究、测试或维护任何一个模块,而不需要对系统的其他模块有很多了解;
耦合程度分为以下几个度量等级:
耦合是影响软件复杂程度的一个重要因素,在实际设计中,应该采取下述设计原则:(1)尽量使用数据耦合;(2)少用控制耦合和特征耦合;(3)限制公共环境耦合的范围;(4)完全不用内容耦合。
内聚标志一个模块内各个元素彼此结合的紧密程度,它是信息隐藏和局部化概念的自然扩展。简单地说,理想内聚的模块只做一件事情。设计时应该力求做到高内聚,通常中等程度的内聚也是可以采用的,而且效果和高内聚相差不多;但是,低内聚不要使用。
内聚和耦合是密切相关的,模块内的高内聚往往意味着模块间的松耦合。实践表明内聚更重要,应该把更多注意力集中到提高模块的内聚程度上。
内聚程度分为以下几个度量等级:
偶然内聚(coincidental cohesion)
如果一个模块完成一组任务,这些任务彼此间即使有关系,关系也是很松散的,就叫做偶然内聚。
在偶然内聚这个等级,模块内各元素之间没有实质性联系,很可能在一种应用场合需要修改这个模块,在另一种应用场合又不允许这种修改,从而陷入困境。这导致程序的可理解性差,可维护性产生退化,模块也是不可重用的。
逻辑内聚(logical cohesion)
如果一个模块完成的任务在逻辑上属于相同或相似的一类,则称为逻辑内聚。但逻辑内聚完成多个操作的代码互相纠缠在一起,即使局部功能的修改有时也会影响全局,导致严重的维护问题,难以重用。同时导致接口难以理解,造成整体上不易理解。
要解决代码纠缠的问题,可以进行模块分解。
时间内聚(temporal cohesion)
如果一个模块包含的任务必须在同一段时间内执行,就叫时间内聚。
时间关系在一定程度上反映了程序某些实质,所以时间内聚比逻辑内聚好一些;模块内操作之间的关系很弱,与其他模块的操作却有很强的关联,并且时间内聚的模块不太可能重用。
过程内聚(procedural cohesion)
如果一个模块内的处理元素是相关的,而且必须以特定次序执行,则称为过程内聚。使用程序流程图作为工具设计软件时,常常通过研究流程图确定模块的划分,这样得到的往往是过程内聚的模块。过程内聚比时间内聚要好一些,至少操作之间是过程关联的,仍是弱连接,不太可能重用模块。
通信内聚(communicational cohesion)
如果模块中所有元素都使用同一个输入数据和(或)产生同一个输出数据,则称为通信内聚。即在同一个数据结构上操作。模块中各操作紧密相连,比过程内聚更好,但是它会导致模块不能重用。
顺序内聚(sequential cohesion)
如果一个模块内的处理元素和同一个功能密切相关,而且这些处理必须顺序执行,则称为顺序内聚。根据数据流图划分模块时,通常得到顺序内聚的模块,这种模块彼此间的连接往往比较简单。
功能内聚(functional cohesion)
如果模块内所有处理元素属于一个整体,完成一个单一的功能,则称为功能内聚。功能内聚是最高程度的内聚。功能内聚可隔离错误,使得维护更容易,也更易扩展。
所有的内聚类型可以分为:高内聚、中内聚和低内聚三种类型
设计时力争做到高内聚,并且能够辨认出低内聚的模块。
2. 模块规模应该适中
经验表明,一个模块的规模不应过大,最好能写在一页纸内。通常规定50~100行语句,最多不超过500行。数字只能作为参考,根本问题是要保证模块的独立性。
过大的模块往往是由于分解不充分,但是进一步分解必须符合问题结构,一般说来,分解后不应该降低模块独立性。过小的模块开销大于有效操作,而且模块数目过多将使系统接口复杂。
3. 深度、宽度、扇出和扇入都应适当
深度:软件结构中控制的层数,它往往能粗略地标志一个系统的大小和复杂程度;
宽度:软件结构内同一个层次上的模块总数的最大值;
扇出:一个模块直接控制(调用)的模块数目;
扇入:有多少个上级模块直接调用它。
QUAD_ROOT(TBL,X);
,其中数组TBL传送方程的系数、数组X送回求得的根,这样是不够合理的,应该写成:QUAD_ROOT(A,B,C,ROOT1,ROOT2);
层次图(H图)
层次图用来描绘软件的层次结构。很适于在自顶向下设计软件的过程中使用。
层次图和层次方框图的区别:
层次图 | 层次方框图 | |
---|---|---|
作用 | 描绘软件结构 | 描绘数据结构 |
矩形框 | 模块 | 数据元素 |
连线 | 调用关系 | 组成关系 |
例如下面是一个"正文加工系统的层次图"
HIPO图
HIPO图是美国IBM公司发明的“层次图+输入/处理/输出图”的英文缩写。为了能使HIPO图具有可追踪性,在H图(层次图)里除了最顶层的方框之外,每个方框都加了编号。
例如下面是一个"正文加工系统的HIPO图"
和H图中每个方框相对应,应该有一张IPO图描绘这个方框代表的模块的处理过程。模块在H图中的编号便于追踪了解这个模块在软件结构中的位置。
Yourdon提出的结构图是进行软件结构设计的另一个有力工具。结构图和层次图类似,也是描绘软件结构的图形工具。
基本符号:
层次图和结构图并不严格表示模块的调用次序,多数人习惯按调用次序从左到右画模块;也不指明何时调用下层模块,只表明一个模块调用那些模块,没有表示模块内还有没有其他成分;通常用层次图作为描绘软件结构的文档;由层次图导出结构图的过程,可以作为检查设计正确性和评价模块独立性的好方法。
面向数据流的设计方法定义了一些不同的“映射”,利用这些映射可以把数据流图变换成软件结构。
因为任何软件系统都可以用数据流图表示,所以面向数据流的设计方法理论上可以设计任何软件的结构。通常所说的结构化设计方法(简称SD方法),也就是基于数据流的设计方法。
信息流有两种类型:
变换分析是一系列设计步骤的总称,经过这些步骤把具有变换流特点的数据流图按预先确定的模式映射成软件结构。
变换分析步骤如下:
虽然在任何情况下都可以使用变换分析方法设计软件结构,但是在数据流具有明显的事务特点时,也就是有一个明显的事务中心时,还是以采用事务分析方法为宜。
事务分析的设计步骤和变换分析的设计步骤大部分相同或类似,主要差别仅在于由数据流图到软件结构的映射方法不同:
举个例子,设计一个产品,它将一个文件名作为输入,并返回文件中的字数。
数据流图:
软件结构:
一般说来,如果数据流不具有显著的事务特点,最好使用变换分析;反之,如果具有明显的事务中心,则应该采用事务分析技术。
机械地遵循变换分析或事务分析的映射规则,可能会得到一些不必要的控制模块,如果它们确实用处不大,那么可以而且应该把它们合并。
如果一个控制模块功能过分复杂,则应该分解为两个或多个控制模块,或者增加中间层次的控制模块。
设计优化应该力求做到在有效的模块化的前提下使用最少量的模块,以及在能够满足信息要求的前提下使用最简单的数据结构。
软件开发人员应该认识到,程序中相对说比较小的核心部分(10%~20%),通常占用全部处理时间的大部分(50%~80%)。
对于时间是决定性因素的应用场合,可能有必要在详细设计阶段,也可能在编写程序的过程中进行优化。
对时间起决定性作用的软件进行优化应该遵循如下规则: