一个很粗糙的XXXX

 

改dnsrecon的代码改来改去都获取不到想要的结果,也不知道是不是py中的正则和PHP的有神马不一样的地方,但是用RegexBuddy测的时候是正确的,想不通啊想不通。果断不改了,自己动手PHP写了一个很粗糙的XX,用的X度来获取子域名,也没再改进了,能用就OK了,话说PHP真慢~~

 

<?php

$curl=curl_init();



$page=0;

$output="";



while($page<101)  //这里获取前十页结果,爬的企鹅的子域名

{

	$query="/s?wd=site%3A(qq.com)&pn=".$page."&oq=site%3A(qq.com)&tn=baiduadv&ie=utf-8&";

	$query=$query."rsv_pq=8b9b2ba40000b588&rsv_t=57ebHv8aFiGUGXVP%2ByZ4ek82WFVf1u0C6Vqhy9Pcs9fvkB7pkuKeDI7JllsBPK8&rsv_page=1";

	$page+=10;  //默认每页10条结果,所以翻页加10

	$url="http://www.baidu.com".$query;

	curl_setopt($curl, CURLOPT_URL, $url);

	curl_setopt($curl,CURLOPT_RETURNTRANSFER,true);

	$output.=curl_exec($curl);

}

$regexp="/<span class=\"g\">[a-z.0-9]*\.qq\.com\/ <\/span>/i";

$result=array();

preg_match_all($regexp, $output, $result,PREG_PATTERN_ORDER);

print_r($result);

 

你可能感兴趣的:(一个很粗糙的XXXX)