113资讯网-WordPress免插件:实时搜索引擎蜘蛛爬行记录

113资讯网-WordPress免插件:实时搜索引擎蜘蛛爬行记录_第1张图片
当一个新的网站建立的时候,我们特别喜欢有百度蜘蛛爬行我们的网站。
因为一旦爬行就能有页面收录,虽然不能百分之百收录,最起码总比没有蜘蛛爬行强。

在新站或网站收录有问题时,就会可能需求连续的百度引擎蜘蛛的抓取环境。
对于自己的网站的内容是否可以实时的收录,一般我们站长都是会用站长工具去查,毕竟站长工具查询有限,
所以就想着是不是有款插件能无限许讨的百度蜘蛛的欢心,这样就能实时收录本身的网页,自己的网页早一天收录,
这样自己就能得到流量的就会更多一点,那样的话,自己的站就会越早盈利!

老规矩,站长秉持:“能不用插件就不用插件,这样可以让自己的站速度更快!”
在线实时观察蜘蛛爬行记载。为此,function.php添加如下代码来完成这个功效:

// 记录百度蜘蛛爬行
 
function get_naps_bot(){
 
$useragent = strtolower($_SERVER['HTTP_USER_AGENT']);
 
if (strpos($useragent,'googlebot') !== false){
 
return 'Googlebot';
 
}
 
if (strpos($useragent,'bingbot') !== false){
 
return 'Bingbot';
 
}
 
if (strpos($useragent,'slurp') !== false){
 
return 'Yahoobot';
 
}
 
if (strpos($useragent,'baiduspider') !== false){
 
return 'Baiduspider';
 
}
 
if (strpos($useragent,'sogou web spider') !== false){
 
return 'Sogouspider';
 
}
 
if (strpos($useragent,'haosouspider') !== false){
 
return 'HaosouSpider';
 
}
 
if (strpos($useragent,'yodaobot') !== false){
 
return 'YodaoBot';
 
}
 
return false;
 
}
 
function nowtime(){
 
date_default_timezone_set('Asia/Shanghai');
 
$date=date("Y-m-d G:i:s");
 
return $date;
 
}
 
$searchbot = get_naps_bot();
 
if ($searchbot) {
 
$tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);
 
$url=$_SERVER['HTTP_REFERER'];
 
$addr=$_SERVER['REMOTE_ADDR'];
 
$file="robotslogs.txt"; //根目录下记录蜘蛛爬行文件
 
$time=nowtime();
 
$data=fopen($file,"a");
 
$PR="$_SERVER[REQUEST_URI]";
 
fwrite($data,"[$time] - $addr - $PR - $searchbot $tlc_thispage rn");
 
fclose($data);
 
}

接着在网站根目下创建一个名为 robotslogs.txt 的文件。
需要把文件: robotslogs.txt 设置可写权限,最好是:777权限或者:755权限。
某些Windows系统的主机配置以上代码可能无法进行蜘蛛爬行。
一般在24小时时间内,文件:“robotslogs.txt”就会有蜘蛛爬行的记录。
文章原文地址:https://www.113p.cn/414.html

你可能感兴趣的:(文章,wordpress)