关于PHP的strtoupper函数

阅读更多

今天看到了PHP实现的标准扩展函数这一段,第一个挑了string相关的函数来看,毕竟这个是用的最多的。

看到了strtoupper函数的实现。如下:

char *php_strtoupper(char *s, size_t len)
{
    unsigned char *c, *e;
    
    c = (unsigned char *)s; 
    e = (unsigned char *)c+len;

    while (c < e) { 
        *c = toupper(*c);
        c++; 
    }    
    return s;
}

 第一感觉就是返回值和传入值是一个东西,而且经过该函数的处理,实参也会被修改,也就是说传入的字符串也会被upper。

但这个和平时使用的感觉不对,立马来试下:

 

 

 

运行结果是:

HELLOWORLD

helloworld

和直觉上是一样的,但和上面的C代码中的逻辑不符啊。咋回事呢?

 

********************************************************

问题出在这里:

其实上述C代码中的参数并不是直接来自于strtoupper($s)中的$s.

PHP内部获取$s之后的处理过程为:

 

PHP_FUNCTION(strtoupper)
{
    char *arg;
    int arglen;
    
    if (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "s", &arg, &arglen) == FAILURE) {
        return;
    }

    arg = estrndup(arg, arglen);
    php_strtoupper(arg, arglen);
    RETURN_STRINGL(arg, arglen, 0);
}

 

 

 

 

不难发现,即使通过zend_parse_parameters获取的arg是指向$s字符串的。后面在调用php_strtoupper函数之前还需要:

arg=estrndup(arg,arglen);

 那这个函数是干什么的呢?

 

顺疼莫瓜,找到了这个东西:

 

#define estrndup(s, length)                 _estrndup((s), (length) ZEND_FILE_LINE_CC ZEND_FILE_LINE_EMPTY_CC)

 和这个东西:

 

ZEND_API char *_estrndup(const char *s, uint length ZEND_FILE_LINE_DC ZEND_FILE_LINE_ORIG_DC)
{
    char *p;

    p = (char *) _emalloc(length+1 ZEND_FILE_LINE_RELAY_CC ZEND_FILE_LINE_ORIG_RELAY_CC);
    if (UNEXPECTED(p == NULL)) {
        return p;
    }    
    memcpy(p, s, length);
    p[length] = 0; 
    return p;
}

注意哲理的_emalloc函数,这个重新分配了一段内存空间。然后memcpy(p,s,lenth)。

经过这个过程PHP中的$s已经在内部被“偷梁换柱”成这个“p”了。

 

到这里就不难理解,php_strtoupper函数中的参数其实不是$s,而是这个*p。这个p指向的字符串的每个字符都会被upper。然后在php_strtoupper中直接返回这个p也就正常了。

 

 

结合上面的例子,$s始终都是"helloworld",PHP内部创建的p一开是也是"helloworld",然后会变为"HELLOWORLD"。

最后strtoupper($s)这个也就是PHP在内部创建的这个p了。也就是"HELLOWORLD"。

 

到这里就明白了。^_^

你可能感兴趣的:(PHP,Zend,C,C++,C#)