通过蜘蛛协议(robot.txt)禁止搜索引擎收录

1.什么是robots.txt文件? 
        搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息。 
        可以网站中创建一个纯文本文件robots.txt,在这个文件中声明该网站中不想被robot访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。

2.robots.txt文件放在哪里? 
        robots.txt文件应该放在网站根目录下。举例来说,当robots访问一个网站(比如http://www.abc.com)时,首先会检查该网站中是否存在http://www.abc.com/robots.txt这个文件,如果机器人找到这个文件,它就会根据这个文件的内容,来确定它访问权限的范围。

通过蜘蛛协议(robot.txt)禁止搜索引擎收录_第1张图片

通过蜘蛛协议(robot.txt)禁止搜索引擎收录_第2张图片

3.robots.txt文件用法举例

通过蜘蛛协议(robot.txt)禁止搜索引擎收录_第3张图片

 

你可能感兴趣的:(计算机网络)