代码优化总结

在日常code review环节中,除了review业务逻辑,架构设计,算法应用几个部分。有时候也需要对代码进行优化。笔者总结了一些常用的代码优化思路:

A,初始化类成员变量时:
(1) 严格按照成员变量在类中的声明顺序进行,而在其在初始化类表中的出现顺序无关;
(2) 当有些成员变量或父类对象没有在初始化列表中出现时,这些对象仍然被执行构造函数.

可以通过将类的构造函数和析构函数定义为内联函数,来提高对象的构造和销毁的速度.

B,全局对象与静态对象在性能上的区别就是
(1) 全局对象是进程启动时创建,函数内的静态对象是在第一次运行时创建.
(2) 在代码中使用全局对象时,可以直接使用全局对象.在代码中使用函数内的静态对象时,需要先判断该静态对象是否被创建.

C,编译器会为静态对象为配内存来指示该对象是否被创建.(判断是否第一次进入).

(1) Inline函数 
在C++中,关键字Inline可以被加入到任何函数的声明中。这个关键字请求编译器用函数内部的代码替换所有对于指 出的函数的调用。 这样做在两个方面快于函数调用。这样做在两个方面快于函数调用:第一,省去了调用指令需要的执行时间;第二,省去了传递变元和传递过程需要的时间。但是使 用这种方法在优化程序速度的同时,程序长度变大了,因此需要更多的ROM。使用这种优化在Inline函数频繁调用并且只包含几行代码的时候是最有效的。 
(2)用指针代替数组 
在许多种情况下,可以用指针运算代替数组索引,这样做常常能产生又快又短的代码。与数组索引相比,指针一般能使代码速度更快,占用空间更少。使用多维数组时差异更明显。下面的代码作用是相同的,但是效率不一样。 
数组索引 指针运算 
For(;;){ p=array 
A=array[t++]; 
for(;;){ 
a=*(p++); 
...... ...... 
} }

指针方法的优点是,array的地址每次装入地址p后,在每次循环中只需对p增量操作。在数组索引方法中,每次循环中都必须进行基于t值求数组下标的复杂运算。 
(3)不定义不使用的返回值 
function函数定义并不知道函数返回值是否被使用,假如返回值从来不会被用到,应该使用void来明确声明函数不返回任何值。 
(4)手动编写汇编 
在嵌入式软件开发中,一些软件模块最好用汇编语言来写,这可以使程序更加有效。虽然C/C++编译器对代码进行了优化,但是适当的使用内联汇编指令可以有效的提高整个系统运行的效率。 
(5)使用寄存器变量 
在声明局部变量的时候可以使用register关键字。这就使得编译器把变量放入一个多用途的寄存器中,而不是在堆栈中,合理使用这种方法可以提高执行速度。函数调用越是频繁,越是可能提高代码的速度。 
(6)使用增量和减量操作符 
在使用到加一和减一操作时尽量使用增量和减量操作符,因为增量符语句比赋值语句更快,原因在于对大多数CPU来说,对内存字的增、 减量操作不必明显地使用取内存和写内存的指令,比如下面这条语句: 
x=x+1; 
模仿大多数微机汇编语言为例,产生的代码类似于: 
move A,x ;把x从内存取出存入累加器A 
add A,1 ;累加器A加1 
store x ;把新值存回x 
如果使用增量操作符,生成的代码如下: 
incr x ;x加1 
显然,不用取指令和存指令,增、减量操作执行的速度加快,同时长度也缩短了。

D、使用尽量小的数据类型
能 够使用字符型(char)定义的变量,就不要使用整型(int)变量来定义;能够使用整型变量定义的变量就不要用长整型(long int),特别是能不用浮点型(float)变量就不要使用浮点型变量,使用浮点型变量会使程序代码增加很大。当然,在定义变量后不能超过变量的作用范 围,如果超过变量的范围赋值,C编译器并不报错,但程序运行结果却错了,而且这样的错误很难发现。
在keil中,应说明指针所指向的对象类型,少用通用型指针。
在ICCAVR 中,可以在Options中设定使用printf参数,尽量使用基本型参数(%c、%d、%x、%X、%u和%s格式说明符),少用长整型参数(%ld、 %lu、%lx和%lX格式说明符),至于浮点型的参数(%f)则尽量不要使用,其它C编译器也一样。在其它条件不变的情况下,使用%f参数,会使生成的 代码的数量增加很多,执行速度降低。

E,减少运算的强度
可以使用运算量小但功能相同的表达式替换原来复杂的的表达式。如下:
(1)、求余运算。
a=a%8;
可以改为:
a=a&7;
说明:位操作只需一个指令周期即可完成,而大部分的C编译器的“%”运算均是调用子程序来完成,代码长、执行速度慢。通常,只要求是求2n方的余数,均可使用位操作的方法来代替。
(2)、平方运算
a=pow(a,2.0);
可以改为:
a=a*a;
说 明:在有内置硬件乘法器的单片机中(如51系列),乘法运算比求平方运算快得多,因为浮点数的求平方是通过调用子程序来实现的,在自带硬件乘法器的AVR 单片机中,如ATMega163中,乘法运算只需2个时钟周期就可以完成。就算是在没有内置硬件乘法器的AVR单片机中,乘法运算的子程序比平方运算的子 程序代码短,执行速度快。
如果是求3次方,如:
a=pow(a,3.0);
更改为:
a=a*a*a;
则效率的改善更明显。
(3)、用移位实现乘除法运算
a=a*4;
b=b/4;
可以改为:
a=a<<2;
b=b>>2;
说明:通常如果需要乘以或除以2n,都可以用移位的方法代替。在ICCAVR中,如果乘以2n,都不是调用子程序而是直接生成左移n位的代码,但乘以非2n的整数或除以任何整数,均调用乘除法子程序运算。
用移位的方法得到代码比调用乘除法子程序生成的代码效率高得多。实际上,只要是乘以或除以一个整数,均可以用移位的方法得到结果,如:
a=a*9
可以改为:
a=(a<<3)+a
(4)、少用浮点运算
int a=200;
float b;
b=a*89.65
在上例中,如果能够不使用浮点运算,而改为长整型,如下:
int a=200;
long int b;
b=a*8965/100;
数值大小不变,但是生成的代码却少了非常多。在很多情况下,如果忽略小数点部分对整个数值的影响不大,就忽略小数点部分,改为整型或长整型。如果在中间变量为浮点型且不能忽略小数点,也可以将其乘以10n方后转换为长整型数,但在最后运算时应记着除去10n。
F、循环
(1)、循环语句
对于一些不需要循环变量参加运算的任务可以把它们放到循环外面,这里的任务包括表达式、函数的调用、指针运算、数组访问等。应该将没有必要执行多次的操作全部集合在一起,放到一个init的初始化程序中进行。
(2)、延时函数:
通常使用的延时函数均采用自加的形式:
void delay (void)
{
unsigned int i;
for (i=0;i<1000;i++)
;
}
将其改为自减延时函数:
void delay (void)
{
unsigned int i;
for (i=1000;i>0;i--)
;
}
两个函数的延时效果相似,但几乎所有的C编译对后一种函数生成的代码均比前一种代码少1~3个字节,因为几乎所有的MCU均有为0转移的指令,采用后一种方式能够生成这类指令。
在使用while循环时也一样,使用自减指令控制循环会比使用自加指令控制循环生成的代码更少1~3个字母。
但是在循环中有通过循环变量“i”读写数组的指令时,使用预减循环时有可能使数组超界,要引起注意。
(3)while循环和do...while循环
用while循环时有以下两种循环形式:
unsigned int i;
i=0;
while (i<1000)
{
i++;
//用户程序
}
或:
unsigned int i;
i=1000;
do
i--;
//用户程序
while (i>0);
在这两种循环中,使用do...while循环编译后生成的代码的长度短于while循环。
G、查表
在 程序中一般不进行非常复杂的运算,如浮点数的乘除及开方,以及一些复杂的数学模型的插补运算,对这些即消耗时间又消耗资源的运算,应尽量使用查表的方式, 并且将数据表置于程序存储区。如果直接生成所需的表比较困难,也尽量在启动时先计算,然后在数据存储器中生成所需的表,后以在程序运行直接查表就可以了, 减少了程序执行过程中重复计算的工作量。

查表是一个常用的思路,结合平时的快速查询场景,比如秒杀,变化慢的数据查询,用户之间的好友关系,内容列表等等,我们经常会用Redis达到快速响应用户请求的效果。

你可能感兴趣的:(架构设计,c++,java,算法)