这篇博文记录php中解析xml的一种方法:使用expat解析xml,下面是待解析的xml文件的内容:
<?xml version="1.0" encoding="utf-8"?> <person id="1"> <name>zhangsan</name> <age>21</age> <job>teacher</job> <sex>male</sex> <company>IBM</company> </person>然后是编写php代码,解析上面的xml文档,下面是index.php的源码:
<?php //创建一个解析器 $parser = xml_parser_create(); //开始一个标签时被调用 function start($parser, $name, $attr){ switch($name){ case "PERSON": echo "----------start person----------<br/>"; echo "id = " . $attr["ID"] . "<br/>"; break; case "NAME": echo "name = "; break; case "AGE": echo "age = "; break; case "SEX": echo "sex = "; break; case "JOB": echo "job = "; break; case "COMPANY": echo "company = "; break; } } //结束一个标签时被调用 function stop($parser, $name){ if($name == "PERSON"){ echo "----------stop person----------"; } echo "<br/>"; } //遇到标签中的内容时被调用 function char($parser, $data){ echo $data; } xml_set_element_handler($parser, "start", "stop"); xml_set_character_data_handler($parser, "char"); $file = fopen("data.txt", "r") or die("open file error"); while(!feof($file)){ $line = fgets($file); xml_parse($parser, $line) or die(sprintf("parse xml error : %d on line %d", xml_error_string(xml_get_error_code($parser)), xml_get_current_line_number($parser))); } xml_parser_free($parser); ?>上面的解析过程主要分为如下几个步骤:
1、创建解析器,使用Expat解析xml时,创建解析器使用xml_parser_create()函数
2、编写开始标签、结束标签、遇到标签中的字符这三种情况对应的处理函数,下面分别说明:
①开始标签的处理函数,对应到上面代码中的start()函数,该函数有三个参数,说明如下:
start_element_handler ( resource $parser , string $name , array $attribs )
parser
第一个参数 parser 为指向要调用处理器的 XML 解析器的指针。
name
第二个参数 name 为该处理器为之被调用的元素名。如果大小写折叠(case-folding)对该解析器有效,元素名将用大写字母表示。
attribs
第三个参数 attribs 为一个包含有对应元素的属性的数组(如果该元素有属性)。数组元素的下标为属性名,元素的值即为属性的值。属性名将以和元素名同样的标准进行大小写折叠(case-folded),其值不进行大小写折叠。 属性的原始顺序将会被参数保留,用 each() 函数遍历 attribs 时,该数组下表的顺序和属性的顺序相同。
②结束标签的处理函数,对应到上面代码中的stop()函数,该函数有两个参数,说明如下:
end_element_handler ( resource $parser , string $name )
parser
第一个参数 parser 为指向要调用处理器的 XML 解析器的指针。
name
第二个参数 name 为该处理器为之被调用的元素名。如果大小写折叠(case-folding)对该解析器有效,元素名将用大写字母表示。
③遇到标签中的字符的处理函数,对应到上面代码中的char()函数,该函数有两个参数,说明如下:
bool xml_set_character_data_handler ( resource $parser , callback $handler )
为 parser 变量指向的 XML 解析器指定字符数据处理函数。handler 为表示一个函数名称的字符串,该函数必须在为 parser 指定的解析器调用 xml_parse() 函数时已存在。
由 handler 参数命名的函数名必须接受两个参数:
handler ( resource $parser , string $data )
parser
第一个参数 parser 为指向要调用处理器的 XML 解析器的指针。
data
第二个参数 data 为包含有字符数据的字符串。
上面的代码在浏览器中执行结果如下图: