PHP 源代码分析

PHP 源代码分析

转自:http://www.ccvita.com/37.html

 

欢迎转载,转载请注明PHPCHINA.COM及作者.

 

假如您看完本文后有什么看法,请点击这里到论坛发表.

 

 

PHP源代码分析
1. 目录结构
2. PHP使用Lex和Yacc对语法进行解析。
3. PHP如何使用Mysql?
4. 安全模式?
5. 那些是 PHP 的标准函数,那些是扩展函数?
6. PHP 源代码中的PHP_FUNCTION(xx) 宏。
7. 那些函数集是标准的?
8. 一些函数的实现过程
9. PHP 函数集注册过程
10. 有趣的Zend LOGO图片
11. PHP的语法树?
12. 从 CVS 获取 PHP 源代码

 

1. 目录结构
1. build 和编译有关的目录。
2. ext 扩展库代码,例如 Mysql、zlib、iconv 等我们熟悉的扩展库。
3. main 主目录。
4. sapi 和各种服务器的接口调用,例如apache、IIS等,也包含一般的fastcgi、cgi等。
5. win32 和 Windows 下编译 PHP 有关的脚本。用了 WSH。
6. Zend 文件夹核心的引擎。
7. scripts Linux 下的脚本目录。
8. tests 测试脚本目录
9. sapi 各类 Web 服务器的接口。

2. PHP使用Lex和Yacc对语法进行解析。
在 Zend 目录下有两个文件 zend_language_parser.y 与 zend_language_scanner.l 他们是Lex和Yacc的脚本文件,通过这两个脚本文件生成对应的.c和.h文件,实际上这在 linux 下非常普遍,gcc 也使用它们产生语树。

3. PHP如何使用Mysql?
ext 目录下有一个 mysql 子目录,这个目录中的php_mysql.c 和 php_mysql.h 负责 PHP 与 Mysql 操作。使用了 Mysql 手册中的 C 语言 API。

4. 安全模式?
main 文件夹下的safe_mode.h 和 safe_mode.c 文件负责PHP的安全模式。
5. 那些是 PHP 的标准函数,那些是扩展函数?
ext 目录下英文意思是扩展,而在 ext 下还是有一个 standard 文件夹,存放着 PHP 中的标准函数,例如 explode 这个函数是在./ext/standard/string.c 下定义的。
6. PHP 源代码中的PHP_FUNCTION(xx) 宏。
这个宏用来检验一个函数名称是否合法。合法的函数名称应该由小写字母及下划线组成。
7. 那些函数集是标准的?
通过 ./ext/standard/ 目录我们可以看到以下常用函数集是标准的。字符串函数集、数组函数集、文件及目录操作函数集、md5算法等。
8. 一些函数的实现过程
1. fsockopen, pfsockopen 的实现
这两个函数的实现离不开 ./ext/standard/fsock.c 文件中的 php_fsockopen_stream 函数。具体的socket都在./main/network.c 中实

现。
9. PHP 函数集注册过程
在./main/internal_functions.c 中有一个数组 php_builtin_extensions 默认下有以下成员:

1. phpext_bcmath_ptr
2. phpext_calendar_ptr
3. phpext_com_dotnet_ptr
4. phpext_ctype_ptr
5. phpext_date_ptr
6. phpext_ftp_ptr
7. phpext_hash_ptr
8. phpext_odbc_ptr
9. phpext_pcre_ptr
10. phpext_reflection_ptr
11. phpext_session_ptr
12. phpext_spl_ptr
13. phpext_standard_ptr
14. phpext_tokenizer_ptr
15. phpext_zlib_ptr

接着 php_register_extensions(php_builtin_extensions, EXTCOUNT TSRMLS_CC) 进行注册

10. 有趣的Zend LOGO图片
./main/logos.h 文件中,用 zend_logo 与 php_logo 数组保存了 PHP 标志和 Zend 标志。所以你根本在发行包里找不到zend.gif。
11. PHP的语法树?

1. Lex与Yacc
市面上有这本书。大家可以买来看看,包括GCC都是用它们兄弟生成的语法树。如果对编译器感兴趣。可以翻阅市面上关于这方面的书,并不多就几本。

2. y语法树文件
./Zend/zend_language_scanner.l与./Zend/zend_language_parser.y 规定了PHP的语法。从字面意义上scanner表示语法初步扫描, parser表示语法解析。根据这两个文件lex与yacc可以生成对应的c代码。所以相对来说生成语法是很方便的。

3. 如何定义一个符号
例如 if($language=’php’) 这一句中的if 就是一个token 语法中我们用T_IF表示。具体在.l文件中如下定义了:

<?php
<
st_in_scripting > " if "   {
              
return   T_IF ;
      
} </ st_in_scripting >

这样.php文件中的if就会被翻译成内置符号T_IF。’(单引号)被如下定义:

<?php
<
st_single_quote > [ ' ] {
            BEGIN(ST_IN_SCRIPTING);
            return 
' / '' ;
      }
      </
st_single_quote >
?>

4. 复合符号例如最常见的变量命名$discuz_user, $submit 等。

<?php
<
st_in_scripting  , ST_DOUBLE_QUOTES , ST_HEREDOC , ST_BACKQUOTE > " $ " { LABEL }   {
            
zend_copy_value ( zendlval ( yytext + 1 ) ( yyleng - 1 )) ;
            
zendlval -> type  =  IS_STRING ;
            
return   T_VARIABLE ;
      
}
   </
st_in_scripting >

5. 一个有效的if语句过程
这个定义在zend_language_parser.y 189行:

T_IF   ' ( '   expr   ' ) '   {
            
zend_do_if_cond ( &$ 3 , &$ 4   TSRMLS_CC ) ;
      
}   statement   {
            
zend_do_if_after_statement ( &$ 4 1   TSRMLS_CC ) ;
      
}   elseif_list   else_single   {
            
zend_do_if_end ( TSRMLS_C ) ;
      
}
      | 
T_IF   ' ( '   expr   ' ) '   ' : '   {
            
zend_do_if_cond ( &$ 3 , &$ 4   TSRMLS_CC ) ;
      
}   inner_statement_list   {
            
zend_do_if_after_statement ( &$ 4 1   TSRMLS_CC ) ;
      
}   new_elseif_list   new_else_single   T_ENDIF   ' ; '   {
            
zend_do_if_end ( TSRMLS_C ) ;
      
}

if 后面必须存在(),圆括弧里面是表达式 expr 表达式在734行被定义:
expr:

r_variable   {  $$ = $ 1 }
            | 
expr_without_variable   {  $$ = $ 1 }
      ;

if 后面可以跟 elseif 语句及 else 语句。
从语法树里面我们看出 if () 后面是可以跟 : 的,这一般很少被使用吧。

6. 优先级和左右结合性
一般情况下.y文件中最先定义的操作符优先级相对低,并且可以使用%left、%right 进行描述左右结合性,例如:

<?php
%
left   ' + '   ' - '   ' . '
      %
left   ' * '   ' / '   ' % '
      %
right   ' ! '

这说明’!'在 PHP 语法中是右结合的, ‘*’ ‘/’ ‘%’ ‘+’ ‘-’ ‘.’ 是左结合的,并且’!'的优先级更高
例如语法 !$a + $b 要先计算 !$a 在进行加法操作%left ‘,’ 被放在最上面定义,说明他的优先级最低,因为我们知道’,'可以等同一个语句。

7. php.ini的解析

1. 如果规定数值正负?

<?php
<
initial > [   ] * ( " true " | " on " | " yes " )[   ] {
              
ini_lval -> value . str . val  =  zend_strndup ( " 1 " 1 ) ;
              
ini_lval -> value . str . len  =  1 ;
              
ini_lval -> type  =  IS_STRING ;
              
return   CFG_TRUE ;
      
}
 
      </
initial >< initial > [   ] * ( " false " | " off " | " no " | " none " )[   ] {
              
ini_lval -> value . str . val  =  zend_strndup ( "" 0 ) ;
              
ini_lval -> value . str . len  =  0 ;
              
ini_lval -> type  =  IS_STRING ;
              
return   CFG_FALSE ;
      
} </ initial >

12. 从 CVS 获取 PHP 源代码
1. 安装 CVS 版本工具,例如 TortoiseCVS。
2. cvs -d :pserver:cvsread@cvs.php.net:/repository checkout php-src 具体的CVS使用办法请参考 CVS 手册及其它著作。

PHP.ini 文件的默认配置,定义在 ./main/main.c 342行

<?php
-- ./
main / main . c  --  342 :
 
/* {{{ PHP_INI
 */

PHP_INI_BEGIN ()
 
PHP_INI_ENTRY_EX ( " define_syslog_variables " " 0 " ,     PHP_INI_ALL NULL ,   
 
php_ini_boolean_displayer_cb )
 
PHP_INI_ENTRY_EX ( " highlight.bg " ,    HL_BG_COLOR ,   PHP_INI_ALL NULL ,   
 
php_ini_color_displayer_cb )
 
PHP_INI_ENTRY_EX ( " highlight.comment " ,   HL_COMMENT_COLOR PHP_INI_ALL , NULL ,   
 
php_ini_color_displayer_cb )
 
PHP_INI_ENTRY_EX ( " highlight.default " ,   HL_DEFAULT_COLOR PHP_INI_ALL , NULL ,   
 
php_ini_color_displayer_cb )
 
PHP_INI_ENTRY_EX ( " highlight.html " ,    HL_HTML_COLOR ,   PHP_INI_ALL NULL ,   
 
php_ini_color_displayer_cb )
 
PHP_INI_ENTRY_EX ( " highlight.keyword " ,   HL_KEYWORD_COLOR PHP_INI_ALL , NULL ,   
 
php_ini_color_displayer_cb )
 
PHP_INI_ENTRY_EX ( " highlight.string " ,   HL_STRING_COLOR PHP_INI_ALL , NULL ,   
 
php_ini_color_displayer_cb )
 
more   lines  ... ...
 
PHP_INI_END ()
/* }}} */
 
-- ./
main / main . c  --

在最新版本的PHP中 memory_limit 由原来的 8M 修改成了 16M

你可能感兴趣的:(PHP 源代码分析)