今天看到了PHP实现的标准扩展函数这一段,第一个挑了string相关的函数来看,毕竟这个是用的最多的。
看到了strtoupper函数的实现。如下:
char *php_strtoupper(char *s, size_t len) { unsigned char *c, *e; c = (unsigned char *)s; e = (unsigned char *)c+len; while (c < e) { *c = toupper(*c); c++; } return s; }
第一感觉就是返回值和传入值是一个东西,而且经过该函数的处理,实参也会被修改,也就是说传入的字符串也会被upper。
但这个和平时使用的感觉不对,立马来试下:
运行结果是:
HELLOWORLD
helloworld
和直觉上是一样的,但和上面的C代码中的逻辑不符啊。咋回事呢?
********************************************************
问题出在这里:
其实上述C代码中的参数并不是直接来自于strtoupper($s)中的$s.
PHP内部获取$s之后的处理过程为:
PHP_FUNCTION(strtoupper) { char *arg; int arglen; if (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "s", &arg, &arglen) == FAILURE) { return; } arg = estrndup(arg, arglen); php_strtoupper(arg, arglen); RETURN_STRINGL(arg, arglen, 0); }
不难发现,即使通过zend_parse_parameters获取的arg是指向$s字符串的。后面在调用php_strtoupper函数之前还需要:
arg=estrndup(arg,arglen);
那这个函数是干什么的呢?
顺疼莫瓜,找到了这个东西:
#define estrndup(s, length) _estrndup((s), (length) ZEND_FILE_LINE_CC ZEND_FILE_LINE_EMPTY_CC)
和这个东西:
ZEND_API char *_estrndup(const char *s, uint length ZEND_FILE_LINE_DC ZEND_FILE_LINE_ORIG_DC) { char *p; p = (char *) _emalloc(length+1 ZEND_FILE_LINE_RELAY_CC ZEND_FILE_LINE_ORIG_RELAY_CC); if (UNEXPECTED(p == NULL)) { return p; } memcpy(p, s, length); p[length] = 0; return p; }
注意哲理的_emalloc函数,这个重新分配了一段内存空间。然后memcpy(p,s,lenth)。
经过这个过程PHP中的$s已经在内部被“偷梁换柱”成这个“p”了。
到这里就不难理解,php_strtoupper函数中的参数其实不是$s,而是这个*p。这个p指向的字符串的每个字符都会被upper。然后在php_strtoupper中直接返回这个p也就正常了。
结合上面的例子,$s始终都是"helloworld",PHP内部创建的p一开是也是"helloworld",然后会变为"HELLOWORLD"。
最后strtoupper($s)这个也就是PHP在内部创建的这个p了。也就是"HELLOWORLD"。
到这里就明白了。^_^