从一个简单但易错的函数递归例子,显示递归的技巧。
2010-10-31 wcdj
本文接:Dissection C Chapter 5
http://blog.csdn.net/delphiwcdj/archive/2010/10/26/5967086.aspx
【问题1】下面输出什么结果?
#include <cstdio> void fun(int i) { if (i) { fun(i/2); } printf("%d ",i); } int main() { fun(10); return 0; }
应该输出:0 1 2 5 10。只要知道怎么展开递归函数,这个问题就解决了。
【问题2】除了参数str,不再使用任何全局和局部变量编写strlen函数。
strlen的原型为: size_t strlen(const char *str);
strlen返回str中字符的个数,不包括最后的空字符,其中str为一个以'/0'结尾的字符串(a null-terminated string)。
以往通常可以这样实现:
#include <cstdio> size_t strlen(const char* str) { size_t len=0; while (*str++) ++len; return len; } int main() { char *s="wcdj"; int len=strlen(s); return 0; }
VS2008中CRT里的源代码:
/*** *strlen.c - contains strlen() routine * * Copyright (c) Microsoft Corporation. All rights reserved. * *Purpose: * strlen returns the length of a null-terminated string, * not including the null byte itself. * *******************************************************************************/ #include <cruntime.h> #include <string.h> #ifdef _MSC_VER #pragma function(strlen) #endif /* _MSC_VER */ /*** *strlen - return the length of a null-terminated string * *Purpose: * Finds the length in bytes of the given string, not including * the final null character. * *Entry: * const char * str - string whose length is to be computed * *Exit: * length of the string "str", exclusive of the final null byte * *Exceptions: * *******************************************************************************/ size_t __cdecl strlen ( const char * str ) { const char *eos = str; while( *eos++ ) ; return( eos - str - 1 ); }
在本题的约束条件下,可以使用如下方法:
(1) 使用递归函数
这个题目用递归写出来的代码其实效率还是不错的,好一点的编译器能够自动将这个尾递归优化成循环。
#include <cstdio> #include <cassert> size_t strlen(const char* str) { assert(NULL!=str); if ('/0'==*str) { return 0; } else { return (1+strlen(++str)); } } int main() { char *s="wcdj"; int len=strlen(s); return 0; }
简洁的代码(使用条件表达式):
size_t strlen(const char* str) { assert(NULL!=str); return *str ? (1+strlen(str+1)) : 0; }
(2) 使用函数调用
将需要使用变量的地方换成函数调用。
#include <cstdio> unsigned long first_add(const char * str) { return reinterpret_cast<unsigned long>(str); } unsigned long last_add(const char * str) { while( *str != '/0') { str++; } return reinterpret_cast<unsigned long>(str); } size_t strlen(const char * str) { return (last_add(str) - first_add(str))/sizeof(char); } int main() { char *s="wcdj"; int len=strlen(s); return 0; }
(3) 直接修改数据栈中的数据
在Intel的平台上栈是向下增长的,用未使用的栈空间来模拟局部变量的作法,这种方法和平台有关移植性不好,下面代码在VS2008上测试通过。
使用“向上”栈数据:
#include <cstdio> int strlen(char *dest) { for(;*dest;++dest) { (*((int *)(((char **)&dest)+1)))+=1;// &dest+2 is ok } return (*((int *)(((char **)&dest)+1))); } int main() { char *s="wcdj"; int len=strlen(s); return 0; }
简化点儿:
int strlen(char *dest) { for(;*dest;++dest) { (*((unsigned long *)(&dest+1)))+=1; } return (*((unsigned long *)(&dest+1))); }
也可以使用“向下”栈数据,但要注意长度:
int strlen(char *strDest) { *(char **)(&strDest-100) = strDest; while (*strDest++); return ( strDest - 1 - *(char **)(&strDest-100) ); }
(4) 使用嵌套汇编语言
不用局部变量和全局变量,可以直接用寄存器。
把[esp + 4] 直接改成strDest, 这样不会太出错, 并且函数使用__fastcall , 提升呼叫速度。
VS2008测试通过:
#include <cstdio> int __fastcall strlen(char *strDest) { __asm { xor eax, eax mov ecx, strDest ; mov ecx [esp+4] count: cmp DWORD PTR [ecx], 0 je return inc ecx jmp count return: mov eax, ecx mov ecx, strDest sub eax, ecx } } int main() { char *s="123456789012345678901234567890123456789012345678901234567890"; int len=strlen(s); return 0; }
gcc 3.3.1 调试通过:
int strlen(const char *s) { __asm__ __volatile__("movl %%esi,%%eax;0:testb $0xFF,(%%eax);" "jz 1f;inc %%eax;jmp 0b;" "1:subl %%esi,%%eax;"::"S"(s)); }
参考:
[1] 关于问题2(strlen)的一个讨论比较火热的帖子。
[2] strlen源码剖析。