http://blog.csdn.net/guoguo1980/archive/2008/05/12/2436299.aspx
http://www.codesky.net/article/doc/201004/20100417011697.htm
以上是有关 Php Xml解析DOMDocument的详细介绍,包括相关的API 和 使用方法,下面就是我相关工作了用到方法和处理思想:
工作需求:根据不同的微博ID采集名人的微博信息
解决方法:根据微博的接口,获取XML,然后用php的DOMDocument解析,获取相关信息并处理之后入库,分页输出
项目总结:第一次接触使用php xml,DOMDocument只是其中一种方法,我知道还有很多方法,所以还有很多地方待改进
//php实例化xml $xml = new DOMDocument(); //加载xml文件,$val在此表示目标新浪微博用户ID $xml->load("http://api.t.sina.com.cn/statuses/user_timeline.xml?source=472780885&user_id={$val}"); //获取xml的所有status标签,这里表示每条微博相关信息 $statusDOM = $xml->getElementsByTagName('status'); //获取status标签下的子类,即相关信息分别用数组存起来 foreach($statusDOM as $status) { $created_at[]= $status->getElementsByTagName("created_at")->item(0)->nodeValue ; $retweeted_status = $status->getElementsByTagName("retweeted_status")->item(0); if($retweeted_status) { $r_text[] = trim($status->getElementsByTagName("text")->item(1)->nodeValue) ; } } //获取子类后的应用 $total = count($created_at); for($i=0;$i<$total;$i++) { $sql_val .= '("'.strtotime ($created_at[$i]).'","'.str_replace ('"','\"',$text[$i]).'","'.$source[$i].'","'.$original[$i].'","'.$bmiddle_pic[$i].'","'.$thumbnail_pic[$i].'","'.$screen_name[$i].'","'.$name[$i].'","'.$location[$i].'","'.$description[$i].'","'.$r_created_at[$i].'","'.str_replace('"','\"',$r_text[$i]).'","'.$r_source[$i].'","'.$r_original[$i].'","'.$r_bmiddle_pic[$i].'","'.$r_thumbnail_pic[$i].'", "'.$profile_image_url[$i].'" , "'.$r_screen_name[$i].'" , "'.$r_name[$i].'" , "'.$u_id[$i].'" , "'.$r_u_id[$i].'" , "'.time().'") ,'; } $sql_val = substr($sql_val,0,-1); $sql = ' insert into `table` ( `created_at` , `text` , `source` , `original` , `bmiddle_pic` , `thumbnail_pic` , `screen_name` , `name` , `location` , `description` , `r_created_at` , `r_text` , `r_source` , `r_original` , `r_bmiddle_pic` , `r_thumbnail_pic` , `profile_image_url` , `r_screen_name` , `r_name` , `u_id` , `r_u_id` , `time`) values '.$sql_val; $rs=mysql_query($sql);