程序并不都是顺序执行的,选择结构用于判断给定的条件,根据判断的结果来控制程序的流程。PHP中通过if、elseif、else和switch语句实现条件控制。这一节我们就分析下PHP中两种条件语句的具体实现。
If语句用法:
if(Condition1){ Statement1; }elseif(Condition2){ Statement2; }else{ Statement3; }
IF语句有两部分组成:condition(条件)、statement(声明),每个条件分支对应一组这样的组合,其中最后的else比较特殊,它没有条件,编译时也是按照这个逻辑编译为一组组的condition和statement,其具体的语法规则如下:
if_stmt: if_stmt_without_else %prec T_NOELSE { $$ = $1; } | if_stmt_without_else T_ELSE statement { $$ = zend_ast_list_add($1, zend_ast_create(ZEND_AST_IF_ELEM, NULL, $3)); } ; if_stmt_without_else: T_IF '(' expr ')' statement { $$ = zend_ast_create_list(1, ZEND_AST_IF, zend_ast_create(ZEND_AST_IF_ELEM, $3, $5)); } | if_stmt_without_else T_ELSEIF '(' expr ')' statement { $$ = zend_ast_list_add($1, zend_ast_create(ZEND_AST_IF_ELEM, $4, $6)); } ;
从上面的语法规则可以看出,编译if语句时首先会创建一个ZEND_AST_IF的节点,这个节点是一个list,用于保存各个分支的condition、statement,编译每个分支时将创建一个ZEND_AST_IF_ELEM的节点,它有两个子节点,分别用来记录:condition、statement,然后把这个节点插入到ZEND_AST_IF下,最终生成的AST:
编译opcode时顺序编译每个分支的condition、statement即可,编译过程大致如下:
具体的编译过程在zend_compile_if()中,过程比较清晰:
void zend_compile_if(zend_ast *ast) { zend_ast_list *list = zend_ast_get_list(ast); uint32_t i; uint32_t *jmp_opnums = NULL; //用来保存每个分支在步骤(4)中的ZEND_JMP opcode if (list->children > 1) { jmp_opnums = safe_emalloc(sizeof(uint32_t), list->children - 1, 0); } //依次编译各个分支 for (i = 0; i < list->children; ++i) { zend_ast *elem_ast = list->child[i]; zend_ast *cond_ast = elem_ast->child[0]; //条件 zend_ast *stmt_ast = elem_ast->child[1]; //声明 znode cond_node; uint32_t opnum_jmpz; if (cond_ast) { //编译condition zend_compile_expr(&cond_node, cond_ast); //编译condition跳转opcode:ZEND_JMPZ opnum_jmpz = zend_emit_cond_jump(ZEND_JMPZ, &cond_node, 0); } //编译statement zend_compile_stmt(stmt_ast); //编译statement执行完后跳出if的opcode:ZEND_JMP(最后一个分支无需这条opcode) if (i != list->children - 1) { jmp_opnums[i] = zend_emit_jump(0); } if (cond_ast) { //设置ZEND_JMPZ跳过opcode数 zend_update_jump_target_to_next(opnum_jmpz); } } if (list->children > 1) { //设置前面各分支statement执行完后应跳转的位置 for (i = 0; i < list->children - 1; ++i) { zend_update_jump_target_to_next(jmp_opnums[i]); //设置每组stmt最后一条jmp跳转为if外 } efree(jmp_opnums); } }
最终if语句编译后基本是这样的结构:
执行时依次判断各分支条件是否成立,成立则执行当前分支statement,执行完后跳到if外语句;不成立则调到下一分支继续判断是否成立,以此类推。不管各分支条件有几个,其最终都会归并为一个结果,也就是每个分支只需要判断最终的条件值是否为true即可,而多个条件计算得到最终值的过程就是普通的逻辑运算。
Note: 注意elseif与else if,上面介绍的是elseif的编译,而else if则实际相当于嵌套了一个if,也就是说一个if的分支中包含了另外一个if,在编译、执行的过程中这两个是有差别的。
switch语句与if类似,都是条件语句,很多时候需要将一个变量或者表达式与不同的值进行比较,根据不同的值执行不同的代码,这种场景下用if、switch都可以实现,但switch相对更加直观。
switch语法:
switch(expression){ case value1: statement1; case value2: statement2; ... default: statementn; }
这里并没有将break加入到switch的语法中,因为严格意义上break并不是switch的一部分,break属于另外一类单独的语法:中断语法,PHP中如果没有在switch中加break则执行时会从命中的那个case开始一直执行到结束,这与很多其它的语言不同(比如:golang)。
从switch的语法可以看出,switch主要包含两部分:expression、case list,case list包含多个case,每个case包含value、statement两部分。expression是一个表达式,但它将在case对比前执行,所以switch最终执行时就是拿expression的值逐个与case的value比较,如果相等则从命中case的statement开始向下执行。
下面看下switch的语法规则:
statement: ... | T_SWITCH '(' expr ')' switch_case_list { $$ = zend_ast_create(ZEND_AST_SWITCH, $3, $5); } ... ; switch_case_list: '{' case_list '}' { $$ = $2; } | '{' ';' case_list '}' { $$ = $3; } | ':' case_list T_ENDSWITCH ';' { $$ = $2; } | ':' ';' case_list T_ENDSWITCH ';' { $$ = $3; } ; case_list: /* empty */ { $$ = zend_ast_create_list(0, ZEND_AST_SWITCH_LIST); } | case_list T_CASE expr case_separator inner_statement_list { $$ = zend_ast_list_add($1, zend_ast_create(ZEND_AST_SWITCH_CASE, $3, $5)); } | case_list T_DEFAULT case_separator inner_statement_list { $$ = zend_ast_list_add($1, zend_ast_create(ZEND_AST_SWITCH_CASE, NULL, $4)); } ; case_separator: ':' | ';' ;
从语法解析规则可以看出,switch最终被解析为一个ZEND_AST_SWITCH节点,这个节点主要包含两个子节点:expression、case list,其中expression节点比较简单,case list节点对应一个ZEND_AST_SWITCH_LIST节点,这个节点是一个list,有多个case子节点,每个case节点对应一个ZEND_AST_SWITCH_CASE节点,包括value(或expr)、statement两个子节点,生成的AST如下:
与if不同,switch不会像if那样依次把每个分支编译为一组组的condition、statement,而是会先编译全部case的value表达式,再编译全部case的statement,编译过程大致如下:
具体编译过程在zend_compile_switch()中,这里不再展开,编译后的基本结构如下:
执行时首先如果switch的是一个表达式则会首先执行表达式的语句,然后再拿最终的结果逐个与case的值比较,如果case也是一个表达式则也先执行表达式,执行完再与switch的值比较,比较结果如果为true则跳到当前case的statement位置开始顺序执行,如果结果为false则继续向下执行,与下一个case比较,以此类推。
Note:
(1) case不管是表达式还是固定的值其最终比较时是一样的,如果是表达式则将其执行完以后再作比较,也就是说switch并不支持case多个值的用法,比如:case value1 || value2 : statement,这么写首先是会执行(value1 || value2),然后把结果与switch的值比较,并不是指switch的值等于value1或value2,这个地方一定要注意,如果想命中多个value只能写到不同case下
(2) switch的value与case的value比较用的是"==",而不是"==="