php爬虫工具源码

[代码] php

view source
print ?
01 偷别的站也是一个道理.关键是方法.小偷就是用ASP,PHP或者其他语言在程序中打开并且处理这些HTML
02 拿PHP讲
03   
04 error_reporting(E_ALL&~E_NOTICE);
05   
06 $url = http://www.baoluowanxiang.com/Index/xxx/id/100; //从此站抓取数据
07   
08 $fp = @fopen($url"r"or die("超时"); //打开指定的网页
09   
10 $fcontents file_get_contents($fp); //获取网页html源码
11   
12 $str_html "/<img src=\"images\/t_01.gif\" width=\"500\" height=\"150\" border=\"0\" ><\/td>(.*)<td width=\"21\" valign=\"top\"><\/td>/ "//正则表达式
13 preg_match($str_html$fcontents$regs); //检索需要的数据
14   
15 $regs[1] = str_replace("src=\"..\/images\/","src=\"http://www.xxxcom\/images\/"$regs[1]);
16   
17 echo $regs[1];
18  
19  
20 原文链接:http://www.baoluowanxiang.com/a/wangzhanjianshe/php/20111111/110.html

你可能感兴趣的:(php爬虫工具源码)