这个世界上有为少写一条if语句纠结过的人吗?
还真有,不过不是本人,是最牛叉的web server的作者。
首先充点电:
一个最简单的if判断大约生成几条汇编指令,如if (a >= 3) ?
int a = 1; // (1) if (a >= 3) { // (2) printf("33333"); // (3) } gcc 大约生成如下的汇编: movl $1, -4(%rbp) #类似int a = 1 cmpl $2, -4(%rbp) #实现 if(a >= 3) 效果的汇编 jle .L2
充电的结果是,知道一个判断语句至少产生两条汇编指令,比较指令,如cmpl 和 跳转指令,如jle 。
一个由两条表达组成的if判断大约产生几条汇编指令,如if (a >= '0' && a <= '9') ?
int a = 1; if (a >= '0' && a <= '9') { printf("=======\n"); } gcc 大约生成如下的汇编: movl $1, -4(%rbp) #类似 int a = 1 cmpl $47, -4(%rbp) #实现 if (a >= '0') 效果的汇编 jle .L2 cmpl $57, -4(%rbp) #实现 if (a <= '9') 效果的汇编 jg .L2
对比上面可以发现多加一个表达式,多生成两条汇编指令。
如何把大写字母转小写字母:
int ch, c; ch = 'A' c = ch | 0x20;
如何把一个16进制的字符转成10进制:
int value; char c; if (c >=' 0' && c <= '9') value = value * 16 + c - '0'; else if(c >= 'a' && c <= 'f') value = value * 16 + c - 'a' + 10; else if(c >= 'A' && c <= 'F') value = value * 16 + c - 'A' + 10;
好,现在进入主题,编写函数hextoi,把有16进制数字组成的字符串(包含可选的前缀0x或0X)转为与之相等的整形值。
字符串中允许包含的数字包括:0~9、a-f、A-F。
实现1:
int hextoi(char *s) { char c; int val; if (*s == '0') { s++; if (*s == 'x' || *s == 'X') s++; } for (val = 0; *s; s++) { c = *s; if (c >= '0' && c <= '9') val = val * 16 + c - '0'; else if (c >= 'a' && c <= 'f') val = val * 16 + c - 'a' + 10; else if (c >= 'A' && c <= 'F') val = val * 16 + c - 'A' + 10; else return val; } return val; }
实现2:
int hextoi(char *s) { char c, ch; int val; if (*s == '0') { s++; if (*s == 'x' || *s == 'X') s++; } for (val = 0; *s; s++) { ch = *s; if (ch >= '0' && ch <= '9') { val = val * 16 + ch - '0'; continue; } c = ch | 0x20; if (c >= 'a' && c <= 'f') { val = val * 16 + c - 'a' + 10; continue; } return val; } return val; }
实现1与实现2的区别是?
区别1 --想法。
实现1是大多数人可以想到。
实现2实现比较怪异,一开始不知道为什么要这么做。
区别2 --代码特征。
实现1用if else 判断 a-f和A-F的字符
实现2先把A-F的字符转成a-f的,
省去
else if (c >= 'A' && c <= 'F') val = val * 16 + c - 'A' + 10;
多了
c = ch | 0x20;
区别3--效率(实现2效率更高)。
可以用gcc -S 生成汇编,数下两个函数生成的汇编。
实现1 需要110行汇编,实现2 只要100行汇编。
为什么会这样,原来实现2中省去的if 判断会生成如下的汇编:
- cmpb $64, -1(%rbp) - jle .L8 - cmpb $70, -1(%rbp) - jg .L8 - movl -8(%rbp), %eax - movl %eax, %edx - sall $4, %edx - movsbl -1(%rbp), %eax - addl %edx, %eax - subl $55, %eax - movl %eax, -8(%rbp) - jmp .L6 -.L8:
而实现2中多出来的部分,生成的汇编代码比较少,如下:
+ movzbl -2(%rbp), %eax + orl $32, %eax + movb %al, -1(%rbp)
13 - 3 正好是10行,这就是为什么上面实现1,汇编代码是110行,而实现2只有100行。
题外话:
实现2,参考了ngx_hextoi。开头提到的为了少写一条if 的人是谁,大家都懂的。。