华为C/C++编程规范
1 排版
1-1:程序块要采用缩进风格编写,缩进的空格数为4个。
说明:对于由开发工具自动生成的代码可以有不一致。
1-2:相对独立的程序块之间、变量说明之后必须加空行。如下例子不符合规范:
if (!valid_ni(ni))
{
… // program code
}
repssn_ind = ssn_data[index].repssn_index;
repssn_ni = ssn_data[index].ni;
应如下书写:
if (!valid_ni(ni))
{
… // program code
}
repssn_ind = ssn_data[index].repssn_index;
repssn_ni = ssn_data[index].ni;
1-3:较长的语句(>80字符)要分成多行书写,长表达式要在低优先级操作符处划分新行,操作符放在新行之首,划分出的新行要进行适当的缩进,使排版整齐,语句可读。示例:
perm_count_msg.head.len = NO7_TO_STAT_PERM_COUNT_LEN+STAT_SIZE_PER_FRAM * sizeof( _UL );
act_task_table[frame_id * STAT_TASK_CHECK_NUMBER +index].occupied= stat_poi[index].occupied;
act_task_table[taskno].duration_true_or_false=SYS_get_sccp_statistic_state( stat_item );
report_or_not_flag = ((taskno
2-8:数据结构声明(包括数组、结构、类、枚举等),如果其命名不是充分自注释的,必须加以注释。对数据结构的注释应放在其上方相邻位置,不可放在下面;对结构中的每个域的注释放在此域的右方。
示例:可按如下形式说明枚举/数据/联合结构。
/* sccpinterface with sccp user primitive message name */
enumSCCP_USER_PRIMITIVE
{
N_UNITDATA_IND, /* sccp notify sccp user unit data come*/
N_NOTICE_IND, /* sccp notify user the No.7 network cannot */
/* transmission this message */
N_UNITDATA_REQ, /* sccp user’s unit data transmissionrequest*/
};
2-9:全局变量要有较详细的注释,包括对其功能、取值范围、哪些函数或过程存取它以及存取时注意事项等的说明。示例:
/* TheErrorCode when SCCP translate */
/* GlobalTitle failure, as follows */ // 变量作用、含义
/* 0 - SUCCESS 1 - GT Table error */
/* 2 - GT error Others - no use */ // 变量取值范围
/* onlyfunction SCCPTranslate() in */
/* thismodual can modify it, and other */
/* modulecan visit it through call */
/* thefunction GetGTTransErrorCode() */ // 使用方法
BYTEg_GTTranErrorCode;
2-10:注释与所描述内容进行同样的缩排。
说明:可使程序排版整齐,并方便注释的阅读与理解。
示例:如下例子,排版不整齐,阅读稍感不方便。
voidexample_fun( void )
{
/* code one comments */
CodeBlock One
/* code two comments */
CodeBlock Two
}
应改为如下布局:
voidexample_fun( void )
{
/* code one comments */
CodeBlock One
/* code two comments */
CodeBlock Two
}
2-11:避免在一行代码或表达式的中间插入注释。
说明:除非必要,不应在代码或表达中间插入注释,否则容易使代码可理解性变差。
2-12:通过对函数或过程、变量、结构等正确的命名以及合理地组织代码的结构,使代码成为自注释的。
说明:清晰准确的函数、变量等的命名,可增加代码可读性,并减少不必要的注释。
2-13:在代码的功能、意图层次上进行注释,提供有用、额外的信息。
说明:注释的目的是解释代码的目的、功能和采用的方法,提供代码以外的信息,帮助读者理解代码,防止没必要的重复注释信息。
示例:如下注释意义不大。
/* ifreceive_flag is TRUE */
if(receive_flag)
而如下的注释则给出了额外有用的信息。
/* if mtpreceive a message from links */
if(receive_flag)
2-14:在程序块的结束行右方加注释标记,以表明某程序块的结束。
说明:当代码段较长,特别是多重嵌套时,这样做可以使代码更清晰,更便于阅读。示例:参见如下例子。
if (…)
{
// programcode
while (index< MAX_INDEX)
{
// programcode
} /* end ofwhile (index < MAX_INDEX) */ // 指明该条while 语句结束
} /* end ofif (…)*/ // 指明是哪条if 语句结束
2-15:注释格式尽量统一,建议使用“/* …… */”。
2-16:注释应考虑程序易读及外观排版的因素,使用的语言若是中、英兼有的,建议多使用中文,除非能用非常流利准确的英文表达。
说明:注释语言不统一,影响程序易读性和外观排版,出于对维护人员的考虑,建议使用中文。
3 标识符命名
3-1:标识符的命名要清晰、明了,有明确含义,同时使用完整的单词或大家基本可以理解的缩写,避免使人产生误解。
说明:较短的单词可通过去掉“元音”形成缩写;较长的单词可取单词的头几个字母形成缩写;一些单词有大家公认的缩写。示例:如下单词的缩写能够被大家基本认可。
temp 可缩写为 tmp ;
flag 可缩写为 flg ;
statistic 可缩写为 stat ;
increment 可缩写为 inc ;
message 可缩写为 msg ;
3-2:命名中若使用特殊约定或缩写,则要有注释说明。
说明:应该在源文件的开始之处,对文件中所使用的缩写或约定,特别是特殊的缩写,进行必要的注释说明。
3-3:自己特有的命名风格,要自始至终保持一致,不可来回变化。
说明:个人的命名风格,在符合所在项目组或产品组的命名规则的前提下,才可使用。(即命名规则中没有规定到的地方才可有个人命名风格)。
3-4:对于变量命名,禁止取单个字符(如i、j、k…),建议除了要有具体含义外,还能表明其变量类型、数据类型等,但i、j、k 作局部循环变量是允许的。
说明:变量,尤其是局部变量,如果用单个字符表示,很容易敲错(如i 写成j),而编译时又检查不出来,有可能为了这个小小的错误而花费大量的查错时间。
示例:下面所示的局部变量名的定义方法可以借鉴。
intliv_Width
其变量名解释如下:
l 局部变量(Local)(其它:g 全局变量(Global)…)
i 数据类型(Interger)
v 变量(Variable)(其它:c 常量(Const)…)
Width 变量含义
这样可以防止局部变量与全局变量重名。
3-5:命名规范必须与所使用的系统风格保持一致,并在同一项目中统一,比如采用UNIX的全小写加下划线的风格或大小写混排的方式,不要使用大小写与下划线混排的方式,用作特殊标识如标识成员变量或全局变量的m_和g_,其后加上大小写混排的方式是允许的。
示例: Add_User 不允许,add_user、AddUser、m_AddUser 允许。
3-6:除非必要,不要用数字或较奇怪的字符来定义标识符。
示例:如下命名,使人产生疑惑。
voidset_sls00( BYTE sls );
应改为有意义的单词命名
voidset_udt_msg_sls( BYTE sls );
3-7:在同一软件产品内,应规划好接口部分标识符(变量、结构、函数及常量)的命名,防止编译、链接时产生冲突。
说明:对接口部分的标识符应该有更严格限制,防止冲突。如可规定接口部分的变量与常量之前加上“模块”标识等。
3-8:用正确的反义词组命名具有互斥意义的变量或相反动作的函数等。
说明:下面是一些在软件中常用的反义词组。
add / removebegin / end create / destroy
insert /delete first / last get / release
increment /decrement put / get
add / deletelock / unlock open / close
min / maxold / new start / stop
next /previous source / target show / hide
send /receive source / destination
cut / pasteup / down
示例:
int min_sum;
int max_sum;
intadd_user( BYTE *user_name );
intdelete_user( BYTE *user_name );
3-9:除了编译开关/头文件等特殊应用,应避免使用EXAMPLE_TEST之类以下划线开始和结尾的定义。
4 可读性
4-1:注意运算符的优先级,并用括号明确表达式的操作顺序,避免使用默认优先级。
说明:防止阅读程序时产生误解,防止因默认的优先级与设计思想不符而导致程序出错。
示例:下列语句中的表达式
word = (high<< 8) | low (1)
if ((a | b)&& (a & c)) (2)
if ((a | b)< (c & d)) (3)
如果书写为:
high<< 8 | low
a | b&& a & c
a | b < c& d
由于:
high<< 8 | low = ( high << 8) | low,
a | b&& a & c = (a | b) && (a & c),
(1)(2)不会出错,但语句不易理解;a | b < c & d = a | (b < c) & d,(3)造成了判断条件出错。
4-2:避免使用不易理解的数字,用有意义的标识来替代。
涉及物理状态或者含有物理意义的常量,不应直接使用数字,必须用有意义的枚举或宏来代替。示例:如下的程序可读性差。
if(Trunk[index].trunk_state == 0)
{
Trunk[index].trunk_state= 1;
… //program code
}
应改为如下形式:
if(Trunk[index].trunk_state == TRUNK_IDLE)
{
Trunk[index].trunk_state= TRUNK_BUSY;
//program code
}
4-3:源程序中关系较为紧密的代码应尽可能相邻。
说明:便于程序阅读和查找。
示例:以下代码布局不太合理。
rect.length= 10;
char_poi =str;
rect.width =5;
若按如下形式书写,可能更清晰一些。
rect.length= 10;
rect.width =5; // 矩形的长与宽关系较密切,放在一起。
char_poi =str;
4-4:不要使用难懂的技巧性很高的语句,除非很有必要时。
说明:高技巧语句不等于高效率的程序,实际上程序的效率关键在于算法。
示例:如下表达式,考虑不周就可能出问题,也较难理解。
stat_poi++ += 1;
++stat_poi += 1;
应分别改为如下。
*stat_poi +=1;
stat_poi++;// 此二语句功能相当于“ * stat_poi ++ += 1; ”
++ stat_poi;
stat_poi +=1; // 此二语句功能相当于“ ++ stat_poi += 1; ”
5 变量、结构
5-1:去掉没必要的公共变量。
说明:公共变量是增大模块间耦合的原因之一,故应减少没必要的公共变量以降低模块间的耦合度。
5-2:仔细定义并明确公共变量的含义、作用、取值范围及公共变量间的关系。
说明:在对变量声明的同时,应对其含义、作用及取值范围进行注释说明,同时若有必要还应说明与其它变量的关系。
5-3:明确公共变量与操作此公共变量的函数或过程的关系,如访问、修改及创建等。
说明:明确过程操作变量的关系后,将有利于程序的进一步优化、单元测试、系统联调以及代码维护等。这种关系的说明可在注释或文档中描述。
示例:在源文件中,可按如下注释形式说明。
RELATIONSystem_Init Input_Rec Print_Rec Stat_Score Student Create Modify Access AccessScore Create Modify Access Access, Modify
注:RELATION 为操作关系;System_Init、Input_Rec、Print_Rec、Stat_Score 为四个不同的函数;Student、Score 为两个全局变量;Create 表示创建,Modify 表示修改,Access 表示访问。其中,函数Input_Rec、Stat_Score 都可修改变量Score,故此变量将引起函数间较大的耦合,并可能增加代码测试、维护的难度。
5-4:当向公共变量传递数据时,要十分小心,防止赋与不合理的值或越界等现象发生。
说明:对公共变量赋值时,若有必要应进行合法性检查,以提高代码的可靠性、稳定性。
5-5:防止局部变量与公共变量同名。
说明:若使用了较好的命名规则,那么此问题可自动消除。
5-6:严禁使用未经初始化的变量作为右值。
说明:特别是在C/C++中引用未经赋值的指针,经常会引起系统崩溃。
5-7:结构的功能要单一,是针对一种事务的抽象。
说明:设计结构时应力争使结构代表一种现实事务的抽象,而不是同时代表多种。结构中的各元素应代表同一事务的不同侧面,而不应把描述没有关系或关系很弱的不同事务的元素放到同一结构中。
示例:如下结构不太清晰、合理。
typedefstruct STUDENT_STRU
{
unsignedchar name[8]; /* student’s name */
unsignedchar age; /* student’s age */
unsignedchar sex; /* student’s sex, as follows */
/* 0 -FEMALE; 1 - MALE */
unsignedchar
teacher_name[8];/* the student teacher’s name */
unisgnedchar
teacher_sex;/* his teacher sex */
} STUDENT;
若改为如下,可能更合理些:
typedefstruct TEACHER_STRU
{
unsignedchar name[8]; /* teacher name */
unisgnedchar sex; /* teacher sex, as follows */
/* 0 -FEMALE; 1 - MALE */
} TEACHER;
typedefstruct STUDENT_STRU
{
unsignedchar name[8]; /* student’s name */
unsignedchar age; /* student’s age */
unsignedchar sex; /* student’s sex, as follows */
/* 0 -FEMALE; 1 - MALE */
unsigned intteacher_ind; /* his teacher index */
} STUDENT;
5-8:不要设计面面俱到、非常灵活的数据结构。
说明:面面俱到、灵活的数据结构反而容易引起误解和操作困难。
5-9:不同结构间的关系不要过于复杂。
说明:若两个结构间关系较复杂、密切,那么应合为一个结构。
示例:如下两个结构的构造不合理。
typedefstruct PERSON_ONE_STRU
{
unsignedchar name[8];
unsignedchar addr[40];
unsignedchar sex;
unsignedchar city[15];
}PERSON_ONE;
typedefstruct PERSON_TWO_STRU
{
unsignedchar name[8];
unsignedchar age;
unsignedchar tel;
}PERSON_TWO;
由于两个结构都是描述同一事物的,那么不如合成一个结构。
typedefstruct PERSON_STRU
{
unsignedchar name[8];
unsignedchar age;
unsignedchar sex;
unsignedchar addr[40];
unsignedchar city[15];
unsignedchar tel;
} PERSON;
5-10:结构中元素的个数应适中。若结构中元素个数过多可考虑依据某种原则把元素组成不同的子结构,以减少原结构中元素的个数。
说明:增加结构的可理解性、可操作性和可维护性。
示例:假如认为如上的_PERSON 结构元素过多,那么可如下对之划分。
typedefstruct PERSON_BASE_INFO_STRU
{
unsignedchar name[8];
unsignedchar age;
unsignedchar sex;
}PERSON_BASE_INFO;
typedefstruct PERSON_ADDRESS_STRU
{
unsignedchar addr[40];
unsignedchar city[15];
unsignedchar tel;
}PERSON_ADDRESS;
typedefstruct PERSON_STRU
{
PERSON_BASE_INFOperson_base;
PERSON_ADDRESSperson_addr;
} PERSON;
5-11:仔细设计结构中元素的布局与排列顺序,使结构容易理解、节省占用空间,并减少引起误用现象。
说明:合理排列结构中元素顺序,可节省空间并增加可理解性。
示例:如下结构中的位域排列,将占较大空间,可读性也稍差。
typedefstruct EXAMPLE_STRU
{
unsigned intvalid: 1;
PERSONperson;
unsigned intset_flg: 1;
} EXAMPLE;
若改成如下形式,不仅可节省1字节空间,可读性也变好了。
typedefstruct EXAMPLE_STRU
{
unsigned intvalid: 1;
unsigned intset_flg: 1;
PERSONperson ;
} EXAMPLE;
5-12:编程时,要注意数据类型的强制转换。
说明:当进行数据类型强制转换时,其数据的意义、转换后的取值等都有可能发生变化,而这些细节若考虑不周,就很有可能留下隐患。
5-13:对编译系统默认的数据类型转换,也要有充分的认识。
示例:如下赋值,多数编译器不产生告警,但值的含义还是稍有变化。
char chr;
unsignedshort int exam;
chr = -1;
exam = chr;// 编译器不产生告警,此时exam 为0xFFFF。
5-14:尽量减少没有必要的数据类型默认转换与强制转换。
5-15:合理地设计数据并使用自定义数据类型,避免数据间进行不必要的类型转换。
5-16:对自定义数据类型进行恰当命名,使它成为自描述性的,以提高代码可读性。注意其命名方式在同一产品中的统一。
说明:使用自定义类型,可以弥补编程语言提供类型少、信息量不足的缺点,并能使程序清晰、简洁。
示例:可参考如下方式声明自定义数据类型。下面的声明可使数据类型的使用简洁、明了。
typedefunsigned char BYTE;
typedefunsigned short WORD;
typedefunsigned int DWORD;
下面的声明可使数据类型具有更丰富的含义。
typedeffloat DISTANCE;
typedeffloat SCORE;
6 函数、过程
6-1:对所调用函数的错误返回码要仔细、全面地处理。
6-2:明确函数功能,精确(而不是近似)地实现函数设计。
6-3:编写可重入函数时,应注意局部变量的使用(如编写C/C++语言的可重入函数时,应使用auto 即缺省态局部变量或寄存器变量)。
说明:编写C/C++语言的可重入函数时,不应使用static 局部变量,否则必须经过特殊处理,才能使函数具有可重入性。
6-4:编写可重入函数时,若使用全局变量,则应通过关中断、信号量(即P、V 操作)等手段对其加以保护。
说明:若对所使用的全局变量不加以保护,则此函数就不具有可重入性,即当多个进程调用此函数时,很有可能使有关全局变量变为不可知状态。
示例:假设Exam 是int 型全局变量,函数Squre_Exam 返回Exam 平方值。那么如下函数不具有可重入性。
unsigned intexample( int para )
{
unsigned inttemp;
Exam = para;// (**)
temp =Square_Exam( );
return temp;
}
此函数若被多个进程调用的话,其结果可能是未知的,因为当(**)语句刚执行完后,另外一个使用本函数的进程可能正好被激活,那么当新激活的进程执行到此函数时,将使Exam赋与另一个不同的para 值,所以当控制重新回到“temp = Square_Exam( )”后,计算出的temp很可能不是预想中的结果。此函数应如下改进。
unsigned intexample( int para )
{
unsigned inttemp;
[申请信号量操作] // 若申请不到“信号量”,说明另外的进程正处于Exam = para; // 给Exam 赋值并计算其平方过程中(即正在使用此temp = Square_Exam( ); // 信号),本进程必须等待其释放信号后,才可继[释放信号量操作]
// 续执行。若申请到信号,则可继续执行,但其它进程必须等待本进程释放信号量后,才能再使用本信号。
return temp;
}
6-5:在同一项目组应明确规定对接口函数参数的合法性检查应由函数的调用者负责还是由接口函数本身负责,缺省是由函数调用者负责。
说明:对于模块间接口函数的参数的合法性检查这一问题,往往有两个极端现象,即:要么是调用者和被调用者对参数均不作合法性检查,结果就遗漏了合法性检查这一必要的处理过程,造成问题隐患;要么就是调用者和被调用者均对参数进行合法性检查,这种情况虽不会造成问题,但产生了冗余代码,降低了效率。
6-6:函数的规模尽量限制在200行以内。
说明:不包括注释和空格行。
6-7:一个函数仅完成一件功能,不要设计多用途面面俱到的函数。
说明:多功能集于一身的函数,很可能使函数的理解、测试、维护等变得困难。
6-8:函数的功能应该是可以预测的,也就是只要输入数据相同就应产生同样的输出。
说明:带有内部“存储器”的函数的功能可能是不可预测的,因为它的输出可能取决于内部存储器(如某标记)的状态。这样的函数既不易于理解又不利于测试和维护。在C/C++语言中,函数的static 局部变量是函数的内部存储器,有可能使函数的功能不可预测,然而,当某函数的返回值为指针类型时,则必须是STATIC的局部变量的地址作为返回值,若为AUTO类,则返回为错针。
示例:如下函数,其返回值(即功能)是不可预测的。
unsigned intinteger_sum( unsigned int base )
{
unsigned intindex;
staticunsigned int sum = 0; // 注意,是static 类型的。
// 若改为auto 类型,则函数即变为可预测。
for (index =1; index <= base; index++)
{
sum +=index;
}
return sum;
}
6-9:尽量不要编写依赖于其他函数内部实现的函数。
说明:此条为函数独立性的基本要求。由于目前大部分高级语言都是结构化的,所以通过具体语言的语法要求与编译器功能,基本就可以防止这种情况发生。但在汇编语言中,由于其灵活性,很可能使函数出现这种情况。
示例:如下是在DOS下TASM的汇编程序例子。过程Print_Msg的实现依赖于Input_Msg的具体实现,这种程序是非结构化的,难以维护、修改。
… // 程序代码
procPrint_Msg // 过程(函数)Print_Msg
… // 程序代码
jmp LABEL
… // 程序代码
endp
procInput_Msg // 过程(函数)Input_Msg
… // 程序代码
LABEL:
… // 程序代码
endp
6-10:检查函数所有参数输入的有效性。
6-11:检查函数所有非参数输入的有效性,如数据文件、公共变量等。
说明:函数的输入主要有两种:一种是参数输入;另一种是全局变量、数据文件的输入,即非参数输入。函数在使用输入之前,应进行必要的检查。
6-12:函数名应准确描述函数的功能。
6-13:使用动宾词组为执行某操作的函数命名。如果是OOP方法,可以只有动词(名词是对象本身)。
示例:参照如下方式命名函数。
voidprint_record( unsigned int rec_ind ) ;
intinput_record( void ) ;
unsignedchar get_current_color( void ) ;
6-14:避免使用无意义或含义不清的动词为函数命名。
说明:避免用含义不清的动词如process、handle 等为函数命名,因为这些动词并没有说明要具体做什么。
6-15:函数的返回值要清楚、明了,让使用者不容易忽视错误情况。
说明:函数的每种出错返回值的意义要清晰、明了、准确,防止使用者误用、理解错误或忽视错误返回码。
6-16:除非必要,最好不要把与函数返回值类型不同的变量,以编译系统默认的转换方式或强制的转换方式作为返回值返回。
6-17:让函数在调用点显得易懂、容易理解。
6-18:在调用函数填写参数时,应尽量减少没有必要的默认数据类型转换或强制数据类型转换。
说明:因为数据类型转换或多或少存在危险。
6-19:避免函数中不必要语句,防止程序中的垃圾代码。
说明:程序中的垃圾代码不仅占用额外的空间,而且还常常影响程序的功能与性能,很可能给程序的测试、维护等造成不必要的麻烦。
6-20:防止把没有关联的语句放到一个函数中。
说明:防止函数或过程内出现随机内聚。随机内聚是指将没有关联或关联很弱的语句放到同一个函数或过程中。随机内聚给函数或过程的维护、测试及以后的升级等造成了不便,同时也使函数或过程的功能不明确。使用随机内聚函数,常常容易出现在一种应用场合需要改进此函数,而另一种应用场合又不允许这种改进,从而陷入困境。在编程时,经常遇到在不同函数中使用相同的代码,许多开发人员都愿把这些代码提出来,并构成一个新函数。若这些代码关联较大并且是完成一个功能的,那么这种构造是合理的,否则这种构造将产生随机内聚的函数。
示例:如下函数就是一种随机内聚。
voidInit_Var( void )
{
Rect.length = 0;
Rect.width = 0; /* 初始化矩形的长与宽 */
Point.x = 10;
Point.y = 10; /* 初始化“点”的坐标 */
}
矩形的长、宽与点的坐标基本没有任何关系,故以上函数是随机内聚。
应如下分为两个函数:
voidInit_Rect( void )
{
Rect.length = 0;
Rect.width = 0; /* 初始化矩形的长与宽 */
}
voidInit_Point( void )
{
Point.x = 10;
Point.y = 10; /* 初始化“点”的坐标 */
}
6-21:如果多段代码重复做同一件事情,那么在函数的划分上可能存在问题。
说明:若此段代码各语句之间有实质性关联并且是完成同一件功能的,那么可考虑把此段代码构造成一个新的函数。
6-22:功能不明确较小的函数,特别是仅有一个上级函数调用它时,应考虑把它合并到上级函数中,而不必单独存在。
说明:模块中函数划分的过多,一般会使函数间的接口变得复杂。所以过小的函数,特别是扇入很低的或功能不明确的函数,不值得单独存在。
6-23:设计高扇入、合理扇出(小于7)的函数。
说明:扇出是指一个函数直接调用(控制)其它函数的数目,而扇入是指有多少上级函数调用它。扇出过大,表明函数过分复杂,需要控制和协调过多的下级函数;而扇出过小,如总是1,表明函数的调用层次可能过多,这样不利程序阅读和函数结构的分析,并且程序运行时会对系统资源如堆栈空间等造成压力。函数较合理的扇出(调度函数除外)通常是3-5。扇出太大,一般是由于缺乏中间层次,可适当增加中间层次的函数。扇出太小,可把下级函数进一步分解多个函数,或合并到上级函数中。当然分解或合并函数时,不能改变要实现的功能,也不能违背函数间的独立性。
扇入越大,表明使用此函数的上级函数越多,这样的函数使用效率高,但不能违背函数间的独立性而单纯地追求高扇入。公共模块中的函数及底层函数应该有较高的扇入。较良好的软件结构通常是顶层函数的扇出较高,中层函数的扇出较少,而底层函数则扇入到公共模块中。
6-24:减少函数本身或函数间的递归调用。
说明:递归调用特别是函数间的递归调用(如A->B->C->A),影响程序的可理解性;递归调用一般都占用较多的系统资源(如栈空间);递归调用对程序的测试有一定影响。故除非为某些算法或功能的实现方便,应减少没必要的递归调用。
6-26:改进模块中函数的结构,降低函数间的耦合度,并提高函数的独立性以及代码可读性、效率和可维护性。优化函数结构时,要遵守以下原则:
(1)不能影响模块功能的实现。
(2)仔细考查模块或函数出错处理及模块的性能要求并进行完善。
(3)通过分解或合并函数来改进软件结构。
(4)考查函数的规模,过大的要进行分解。
(5)降低函数间接口的复杂度。
(6)不同层次的函数调用要有较合理的扇入、扇出。
(7)函数功能应可预测。
(8)提高函数内聚。(单一功能的函数内聚最高)
说明:对初步划分后的函数结构应进行改进、优化,使之更为合理。
6-27:在多任务操作系统的环境下编程,要注意函数可重入性的构造。
说明:可重入性是指函数可以被多个任务进程调用。在多任务操作系统中,函数是否具有可重入性是非常重要的,因为这是多个进程可以共用此函数的必要条件。另外,编译器是否提供可重入函数库,与它所服务的操作系统有关,只有操作系统是多任务时,编译器才有可能提供可重入函数库。如DOS 下BC 和MSC 等就不具备可重入函数库,因为DOS 是单用户单任务操作系统。
6-28:避免使用BOOL参数。
说明:原因有二,其一是BOOL参数值无意义,TURE/FALSE的含义是非常模糊的,在调用时很难知道该参数到底传达的是什么意思;其二是BOOL参数值不利于扩充。还有NULL也是一个无意义的单词。
6-29:对于提供了返回值的函数,在引用时最好使用其返回值。
6-30:当一个过程(函数)中对较长变量(一般是结构的成员)有较多引用时,可以用一个意义相当的宏代替。
说明:这样可以增加编程效率和程序的可读性。
示例:在某过程中较多引用TheReceiveBuffer[FirstSocket].byDataPtr,则可以通过以下宏定义来代替:
7 程序效率
7-1:编程时要经常注意代码的效率。
说明:代码效率分为全局效率、局部效率、时间效率及空间效率。全局效率是站在整个系统的角度上的系统效率;局部效率是站在模块或函数角度上的效率;时间效率是程序处理输入任务所需的时间长短;空间效率是程序所需内存空间,如机器代码空间大小、数据空间大小、栈空间大小等。
7-2:在保证软件系统的正确性、稳定性、可读性及可测性的前提下,提高代码效率。
说明:不能一味地追求代码效率,而对软件的正确性、稳定性、可读性及可测性造成影响。
7-3:局部效率应为全局效率服务,不能因为提高局部效率而对全局效率造成影响。
7-4:通过对系统数据结构的划分与组织的改进,以及对程序算法的优化来提高空间效率。
说明:这种方式是解决软件空间效率的根本办法。
示例:如下记录学生学习成绩的结构不合理。
typedefunsigned char BYTE;
typedefunsigned short WORD;
typedefstruct STUDENT_SCORE_STRU
BYTEname[8];
BYTE age;
BYTE sex;
BYTE class;
BYTEsubject;
float score;
}STUDENT_SCORE;
因为每位学生都有多科学习成绩,故如上结构将占用较大空间。应如下改进(分为两个结构),总的存贮空间将变小,操作也变得更方便。
typedefstruct STUDENT_STRU
{
BYTEname[8];
BYTE age;
BYTE sex;
BYTE class;
} STUDENT;
typedefstruct STUDENT_SCORE_STRU
{
WORDstudent_index;
BYTEsubject;
float score;
}STUDENT_SCORE;
7-5:循环体内工作量最小化。
说明:应仔细考虑循环体内的语句是否可以放在循环体之外,使循环体内工作量最小,从而提高程序的时间效率。
示例:如下代码效率不高。
for (ind =0; ind < MAX_ADD_NUMBER; ind++)
{
sum += ind;
back_sum = sum; /* backup sum */
}
语句“back_sum = sum;”完全可以放在for 语句之后,如下。
for (ind =0; ind < MAX_ADD_NUMBER; ind++)
{
sum+= ind;
}
back_sum =sum; /* backup sum */
7-6:仔细分析有关算法,并进行优化。仔细考查、分析系统及模块处理输入(如事务、消息等)的方式,并加以改进。
7-7:对模块中函数的划分及组织方式进行分析、优化,改进模块中函数的组织结构,提高程序效率。
说明:软件系统的效率主要与算法、处理任务方式、系统功能及函数结构有很大关系,仅在代码上下功夫一般不能解决根本问题。
7-8:编程时,要随时留心代码效率;优化代码时,要考虑周全。
7-9:不应花过多的时间拼命地提高调用不很频繁的函数代码效率。
说明:对代码优化可提高效率,但若考虑不周很有可能引起严重后果。
7-10:要仔细地构造或直接用汇编编写调用频繁或性能要求极高的函数。
说明:只有对编译系统产生机器码的方式以及硬件系统较为熟悉时,才可使用汇编嵌入方式。嵌入汇编可提高时间及空间效率,但也存在一定风险。
7-11:在保证程序质量的前提下,通过压缩代码量、去掉不必要代码以及减少不必要的局部和全局变量,来提高空间效率。
说明:这种方式对提高空间效率可起到一定作用,但往往不能解决根本问题。
7-12:在多重循环中,应将最忙的循环放在最内层。
说明:减少CPU切入循环层的次数。
示例:如下代码效率不高。
for (row =0; row < 100; row++)
{
for (col = 0; col < 5; col++)
{
sum += a[row][col];
}
}
可以改为如下方式,以提高效率。
for (col =0; col < 5; col++)
{
for (row = 0; row < 100; row++)
{
sum += a[row][col];
}
}
7-13:尽量减少循环嵌套层次。
7-14:避免循环体内含判断语句,应将循环语句置于判断语句的代码块之中。
说明:目的是减少判断次数。循环体中的判断语句是否可以移到循环体外,要视程序的具体情况而言,一般情况,与循环变量无关的判断语句可以移到循环体外,而有关的则不可以。
示例:如下代码效率稍低。
for (ind =0; ind < MAX_RECT_NUMBER; ind++)
{
if (data_type == RECT_AREA)
{
area_sum += rect_area[ind];
}
}
else
{
rect_length_sum += rect[ind].length;
rect_width_sum += rect[ind].width;
}
因为判断语句与循环变量无关,故可如下改进,以减少判断次数。
if(data_type == RECT_AREA)
{
for (ind = 0; ind < MAX_RECT_NUMBER; ind++)
{
area_sum += rect_area[ind];
}
}
else
{
for (ind = 0; ind < MAX_RECT_NUMBER; ind++)
{
rect_length_sum += rect[ind].length;
rect_width_sum += rect[ind].width;
}
}
7-15:尽量用乘法或其它方法代替除法,特别是浮点运算中的除法。
说明:浮点运算除法要占用较多CPU资源。
示例:如下表达式运算可能要占较多CPU 资源。
radius =circle_length / (2 * PAI);
应如下把浮点除法改为浮点乘法。
radius =circle_length * PAI_RECIPROCAL / 2;
7-16:不要一味追求紧凑的代码。
说明:因为紧凑的代码并不代表高效的机器码。
8 质量保证
8-1:在软件设计过程中构筑软件质量。
8-2:代码质量保证优先原则
(1)正确性,指程序要实现设计要求的功能。
(2)稳定性、安全性,指程序稳定、可靠、安全。
(3)可测试性,指程序要具有良好的可测试性。
(4)规范/可读性,指程序书写风格、命名规则等要符合规范。
(5)全局效率,指软件系统的整体效率。
(6)局部效率,指某个模块/子模块/函数的本身效率。
(7)个人表达方式/个人方便性,指个人编程习惯。
8-3:只引用属于自己的存贮空间。
说明:若模块封装的较好,那么一般不会发生非法引用他人的空间。
8-4:防止引用已经释放的内存空间。
说明:在实际编程过程中,稍不留心就会出现在一个模块中释放了某个内存块(如C语言指针),而另一模块在随后的某个时刻又使用了它。要防止这种情况发生。
8-5:过程/函数中分配的内存,在过程/函数退出之前要释放。
8-6:过程/函数中申请的(为打开文件而使用的)文件句柄,在过程/函数退出之前要关闭。
说明:分配的内存不释放以及文件句柄不关闭,是较常见的错误,而且稍不注意就有可能发生。这类错误往往会引起很严重后果,且难以定位。
示例:下函数在退出之前,没有把分配的内存释放。
typedefunsigned char BYTE;
intexample_fun( BYTE gt_len, BYTE *gt_code )
{
BYTE *gt_buf;
gt_buf = (BYTE *) malloc (MAX_GT_LENGTH);
… //program code, include check gt_buf if or not NULL.
/* global title length error */
if (gt_len > MAX_GT_LENGTH)
{
return GT_LENGTH_ERROR; // 忘了释放gt_buf
}
… // other program code
}
应改为如下。
intexample_fun( BYTE gt_len, BYTE *gt_code )
{
BYTE *gt_buf;
gt_buf = (BYTE * ) malloc ( MAX_GT_LENGTH );
… // program code, include check gt_buf if or not NULL.
/* global title length error */
if (gt_len > MAX_GT_LENGTH)
{
free( gt_buf ); // 退出之前释放gt_buf
return GT_LENGTH_ERROR;
}
… // other program code
}
8-7:防止内存操作越界。
说明:内存操作主要是指对数组、指针、内存地址等的操作。内存操作越界是软件系统主要错误之一,后果往往非常严重,所以当我们进行这些操作时一定要仔细小心。
示例:假设某软件系统最多可由10个用户同时使用,用户号为1-10,那么如下程序存在问题。
unsignedchar usr_login_flg[MAX_USR_NUM]= “”;
voidset_usr_login_flg( unsigned char usr_no )
{
if (!usr_login_flg[usr_no])
{
usr_login_flg[usr_no]= TRUE;
}
}
当usr_no 为10 时,将使用usr_login_flg 越界。可采用如下方式解决。
voidset_usr_login_flg( unsigned char usr_no )
{
if (!usr_login_flg[usr_no - 1])
{
usr_login_flg[usr_no - 1]= TRUE;
}
}
8-8:认真处理程序所能遇到的各种出错情况。
8-9:系统运行之初,要初始化有关变量及运行环境,防止未经初始化的变量被引用。
8-10:系统运行之初,要对加载到系统中的数据进行一致性检查。
说明:使用不一致的数据,容易使系统进入混乱状态和不可知状态。
8-11:严禁随意更改其它模块或系统的有关设置和配置。
说明:编程时,不能随心所欲地更改不属于自己模块的有关设置如常量、数组的大小等。
8-12:不能随意改变与其它模块的接口。
8-13:充分了解系统的接口之后,再使用系统提供的功能。
示例:在B型机的各模块与操作系统的接口函数中,有一个要由各模块负责编写的初始化过程,此过程在软件系统加载完成后,由操作系统发送的初始化消息来调度。因此就涉及到初始化消息的类型与消息发送的顺序问题,特别是消息顺序,若没搞清楚就开始编程,很容易引起严重后果。以下示例引自B 型曾出现过的实际代码,其中使用了FID_FETCH_DATA与FID_INITIAL 初始化消息类型,注意B 型机的系统是在FID_FETCH_DATA 之前发送FID_INITIAL 的。
MIDalarm_module_list[MAX_ALARM_MID];
int FARSYS_ALARM_proc( FID function_id, int handle )
{
_UI i, j;
switch ( function_id )
{
… // program code
case FID_INITAIL:
for (i = 0; i < MAX_ALARM_MID; i++)
{
if (alarm_module_list[i]== BAM_MODULE // **)
|| (alarm_module_list[i]== LOCAL_MODULE)
{
for (j = 0; j < ALARM_CLASS_SUM; j++)
{
FAR_MALLOC( … );
}
}
}
… // program code
break;
case FID_FETCH_DATA:
… // program code
Get_Alarm_Module( ); // 初始化alarm_module_list
break;
… // program code
}
}
由于FID_INITIAL 是在FID_FETCH_DATA 之前执行的,而初始化alarm_module_list 是在FID_FETCH_DATA 中进行的,故在FID_INITIAL 中()处引用alarm_module_list 变量时,它还没有被初始化。这是个严重错误。应如下改正:要么把Get_Alarm_Module 函数放在FID_INITIAL 中()之前;要么就必须考虑(**)处的判断语句是否可以用(不使用alarm_module_list 变量的)其它方式替代,或者是否可以取消此判断语句。
8-14:编程时,要防止差1错误。
说明:此类错误一般是由于把“<=”误写成“<”或“>=”误写成“>”等造成的,由此引起的后果,很多情况下是很严重的,所以编程时,一定要在这些地方小心。当编完程序后,应对这些操作符进行彻底检查。
8-15:要时刻注意易混淆的操作符。当编完程序后,应从头至尾检查一遍这些操作符,以防止拼写错误。
说明:形式相近的操作符最容易引起误用,如C/C++中的“=”与“==”、“|”与“||”、“&”与“&&”等,若拼写错了,编译器不一定能够检查出来。
示例:如把“&”写成“&&”,或反之。
ret_flg =(pmsg->ret_flg & RETURN_MASK);
被写为:
ret_flg =(pmsg->ret_flg && RETURN_MASK);
rpt_flg =(VALID_TASK_NO( taskno ) && DATA_NOT_ZERO( stat_data ));
被写为:
rpt_flg =(VALID_TASK_NO( taskno ) & DATA_NOT_ZERO( stat_data ));
8-16:有可能的话,if语句尽量加上else分支,对没有else分支的语句要小心对待;switch语句必须有default分支。
8-17:Unix下,多线程的中的子线程退出必需采用主动退出方式,即子线程应return出口。
8-18:不要滥用goto语句。
说明:goto语句会破坏程序的结构性,所以除非确实需要,最好不使用goto语句。
8-19:精心地构造、划分子模块,并按“接口”部分及“内核”部分合理地组织子模块,以提高“内核”部分的可移植性和可重用性。
说明:对不同产品中的某个功能相同的模块,若能做到其内核部分完全或基本一致,那么无论对产品的测试、维护,还是对以后产品的升级都会有很大帮助。
8-20:精心构造算法,并对其性能、效率进行测试。
8-21:对较关键的算法最好使用其它算法来确认。
8-22:时刻注意表达式是否会上溢、下溢。
示例:如下程序将造成变量下溢。
unsignedchar size ;
while(size– >= 0) // 将出现下溢
{
…// program code
}
当size 等于0时,再减1不会小于0,而是0xFF,故程序是一个死循环。应如下修改。
char size;// 从unsigned char 改为char
while(size– >= 0)
{
…// program code
}
8-23:使用变量时要注意其边界值的情况。
示例:如C 语言中字符型变量,有效值范围为-128到127。故以下表达式的计算存在一定风险。
char chr =127;
int sum =200;
chr += 1; //127 为chr 的边界值,再加1 将使chr 上溢到-128,而不是128。
sum += chr;// 故sum 的结果不是328,而是72。
若chr 与sum 为同一种类型,或表达式按如下方式书写,可能会好些。
sum = sum +chr + 1;
8-24:留心程序机器码大小(如指令空间大小、数据空间大小、堆栈空间大小等)是否超出系统有关限制。
8-25:为用户提供良好的接口界面,使用户能较充分地了解系统内部运行状态及有关系统出错情况。
8-26:系统应具有一定的容错能力,对一些错误事件(如用户误操作等)能进行自动补救。
8-27:对一些具有危险性的操作代码(如写硬盘、删数据等)要仔细考虑,防止对数据、硬件等的安全构成危害,以提高系统的安全性。
8-28:使用第三方提供的软件开发工具包或控件时,要注意以下几点:
(1)充分了解应用接口、使用环境及使用时注意事项。
(2)不能过分相信其正确性。
(3)除非必要,不要使用不熟悉的第三方工具包与控件。
说明:使用工具包与控件,可加快程序开发速度,节省时间,但使用之前一定对它有较充分的了解,同时第三方工具包与控件也有可能存在问题。
8-29:资源文件(多语言版本支持),如果资源是对语言敏感的,应让该资源与源代码文件脱离,具体方法有下面几种:使用单独的资源文件、DLL 文件或其它单独的描述文件(如数据库格式)
9 代码编辑、编译、审查
9-1:打开编译器的所有告警开关对程序进行编译。
9-2:在产品软件(项目组)中,要统一编译开关选项。
9-3:通过代码走读及审查方式对代码进行检查。
说明:代码走读主要是对程序的编程风格如注释、命名等以及编程时易出错的内容进行检查,可由开发人员自己或开发人员交叉的方式进行;代码审查主要是对程序实现的功能及程序的稳定性、安全性、可靠性等进行检查及评审,可通过自审、交叉审核或指定部门抽查等方式进行。
9-4:测试部测试产品之前,应对代码进行抽查及评审。
9-5:编写代码时要注意随时保存,并定期备份,防止由于断电、硬盘损坏等原因造成代码丢失。
9-6:同产品软件(项目组)内,最好使用相同的编辑器,并使用相同的设置选项。
说明:同一项目组最好采用相同的智能语言编辑器,如Muiti Editor,Visual Editor 等,并设计、使用一套缩进宏及注释宏等,将缩进等问题交由编辑器处理。
9-7:合理地设计软件系统目录,方便开发人员使用。
说明:方便、合理的软件系统目录,可提高工作效率。目录构造的原则是方便有关源程序的存储、查询、编译、链接等工作,同时目录中还应具有工作目录—-所有的编译、链接等工作应在此目录中进行,工具目录—-有关文件编辑器、文件查找等工具可存放在此目录中。
9-8:某些语句经编译后产生告警,但如果你认为它是正确的,那么应通过某种手段去掉告警信息。
说明:在Borland C/C++中,可用“#pragma warn”来关掉或打开某些告警。
示例:
int examples_fun(void )
{
//程序,但无return 语句。
}
编译函数examples_fun 时本应产生“函数应有返回值”告警,但由于关掉了此告警信息显示,所以编译时将不会产生此告警提示。
9-9:使用代码检查工具(如C 语言用PC-Lint)对源程序检查。
10 代码测试、维护
10-1:单元测试要求至少达到语句覆盖。
10-2:单元测试开始要跟踪每一条语句,并观察数据流及变量的变化。
10-3:清理、整理或优化后的代码要经过审查及测试。
10-4:代码版本升级要经过严格测试。
10-5:使用工具软件对代码版本进行维护。
10-6:正式版本上软件的任何修改都应有详细的文档记录。
10-7:发现错误立即修改,并且要记录下来。
10-8:关键的代码在汇编级跟踪。
10-9:仔细设计并分析测试用例,使测试用例覆盖尽可能多的情况,以提高测试用例的效率。
10-11:尽可能模拟出程序的各种出错情况,对出错处理代码进行充分的测试。
10-12:仔细测试代码处理数据、变量的边界情况。
10-13:保留测试信息,以便分析、总结经验及进行更充分的测试。
10-14:不应通过“试”来解决问题,应寻找问题的根本原因。
10-15:对自动消失的错误进行分析,搞清楚错误是如何消失的。
10-16:修改错误不仅要治表,更要治本。
10-17:测试时应设法使很少发生的事件经常发生。
10-18:明确模块或函数处理哪些事件,并使它们经常发生。
10-19:坚持在编码阶段就对代码进行彻底的单元测试,不要等以后的测试工作来发现问题。
10-20:去除代码运行的随机性(如去掉无用的数据、代码及尽可能防止并注意函数中的“内部寄存器”等),让函数运行的结果可预测,并使出现的错误可再现。
11 宏
11-1:用宏定义表达式时,要使用完备的括号。
示例:如下定义的宏都存在一定的风险。
正确的定义应为:
11-2:将宏所定义的多条表达式放在大括号中。
示例:下面的语句只有宏的第一条表达式被执行。为了说明问题,for语句的书写稍不符规范。
a = 0;\
b = 0;
for (index =0; index < RECT_TOTAL_NUM; index++)
INTI_RECT_VALUE(rect.a, rect.b );
正确的用法应为:
{\
a = 0;\
b = 0;\
}
for (index =0; index < RECT_TOTAL_NUM; index++)
{
INTI_RECT_VALUE(rect[index].a, rect[index].b );
}
11-3:使用宏时,不允许参数发生变化。
示例:如下用法可能导致错误。
int a = 5;
int b;
b = SQUARE(a++ ); // 结果:a = 7,即执行了两次增1。
正确的用法是:
b = SQUARE(a );
a++; // 结果:a = 6,即只执行了一次增1。
华为Java编程规范
1.【避免在程序中使用魔鬼数字,必须用有意义的常量来标识。】
说明:是否是魔鬼数字要基于容易阅读和便于全局替换的原则。0、1作为某种专业领域物理量枚举数值时必须定义常量,严禁出现类似NUMBER_ZERO的“魔鬼常量”。
2.【明确方法的功能,一个方法仅完成一个功能。】
说明:方法功能太多,会增加方法的复杂度和依赖关系,不利于程序阅读和将来的持续维护,无论是方法还是类设计都应符合单一职责原则。
3.【方法参数不能超过5个】
说明:参数太多影响代码阅读和使用,为减少参数,首先要考虑这些参数的合理性,保持方法功能单一、优化方法设计,如果参数确实无法减少,可以将多个参数封装成一个类(对象),同时考虑在新的类(对象)中增加相应的行为,以期更符合OOP。
4.【方法调用尽量不要返回null,取而代之以抛出异常,或是返回特例对象(SPECIAL CASE object,SPECIAL CASE PATTERN);对于以集合或数组类型作为返回值的方法,取而代之以空集合或0长度数组。】
说明:返回null会增加不必要的空指针判断,遗漏判断也会导致严重的NullPointerException错误。
5.【在进行数据库操作或IO操作时,必须确保资源在使用完毕后得到释放,并且必须确保释放操作在finally中进行。】
说明:数据库操作、IO操作等需要关闭对象必须在try -catch-finally 的finally中close(),如果有多个IO对象需要关闭,需要分别对每个对象的close()方法进行try-catch,防止一个IO对象关闭失败其他IO对象都未关闭。推荐做法如下:
Connection jdbcConnection = null;
Statement stmt = null;
try
{
........
}
catch (SQLException e)
{
........
}
finally
{
if (stmt != null)
{
try
{
stmt.close();
}
catch (SQLException e)
{
logger.log(Level.WARNING, "异常说明", e);
}
}
if (jdbcConnection != null)
{
try
{
jdbcConnection.close();
}
catch (SQLException e)
{
logger.log(Level.WARNING, "异常说明", e);
}
}
}
6.【异常捕获不要直接 catch(Exception ex) ,应该把异常细分处理。】
说明:catch (Exception ex)的结果会把RuntimeException异常捕获,RuntimeException是运行期异常,是程序本身考虑不周而抛出的异常,是程序的BUG,如无效参数、数组越界、被零除等,程序必须确保不能抛出RuntimeException异常,不允许显示捕获RuntimeException异常就是为了方便测试中容易发现程序问题。
7.【对于if „ else if „(后续可能有多个elseif …)这种类型的条件判断,最后必须包含一个else分支,避免出现分支遗漏造成错误;每个switch-case语句都必须保证有default,避免出现分支遗漏,造成错误。】
8.【覆写对象的equals()方法时必须同时覆写hashCode()方法。】
说明:equals和hashCode方法是对象在hash容器内高效工作的基础,正确的覆写这两个方法才能保证在hash容器内查找对象的正确性,同时一个好的hashCode方法能大幅提升hash容器效率。
9.【禁止循环中创建新线程,尽量使用线程池。】
10.【在进行精确计算时(例如:货币计算)避免使用float和double,浮点数计算都是不精确的,必须使用BigDecimal或将浮点数运算转换为整型运算。】
说明:浮点运算在一个范围很广的值域上提供了很好的近似,但是它不能产生精确的结果。二进制浮点对于精度计算是非常不适合的,因为它不可能将0.1——或者10的其它任何次负幂精确表示为一个长度有限的二进制小数