通过curl抓取其他网站信息

第一步:通过curl抓取网页

$url = url;
$ch = curl_init();
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);    // https请求 不验证证书和hosts
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, FALSE);
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);    // 要求结果为字符串且输出到屏幕上
curl_setopt($ch, CURLOPT_HEADER, 0); // 不要http header 加快效率
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (compatible; MSIE 5.01; Windows NT 5.0)');
curl_setopt($ch, CURLOPT_TIMEOUT, 15);
$output = curl_exec($ch);
curl_close($ch);

第二步:抓取想要的信息

$preg = //此处为正则表达式;
preg_match_all($preg,$html,$out);

//例如
$preg = '/(.*?)<\/div>/';
preg_match_all($preg,$output,$out);

//得出的的$out 就是想要的信息

注意:想要准确抓取,需先了解正则表达式。

你可能感兴趣的:(php)