记一次百度抓取的测试流程

鼎峰_小配针对百度抓取的测试在学习和研究探索的过程中的一点点心得,从刚接触时的一脸懵逼,到后来慢慢的了解了,废话不多说,直接上干货。需要香港服务器的,详情可联系鼎峰新滙运维技术支持——小配(Q2880501305)

测试分为两个部分,一是搭建环境,一是抓取测试。

一、搭建环境

1.自己的一台闲置独立服务器作为测试机,安装好系统(windows、linux都可以,这里以centos7.0系统为例)。

2.系统安装完成之后,开始搭建环境(以宝塔为例),安装好宝塔,登录宝塔面板,会自动弹出一键部署环境的界面,那咱们就一键部署,这里默认选择,然后一键安装,如下图所示:


3.环境搭建完成之后,开始一键部署网站,进入软件商店,找到一键部署,随便找一个网站模块,然后搭建,这里以“Dbshop商城系统”为例,如下图所示:


4.当网站部署好后,测试一下能否访问,如能打开网站,那么环境这一块就搭建完成了。


二、抓取测试

1.打开https://ziyuan.baidu.com/crawltools/index 百度抓取诊断链接,按步骤注册一个账号,然后登陆。

2.找到用户中心,点击站点管理,然后添加网站,如下图所示:



3.验证网站(关键性的一步操作)

选择文件验证,然后下载验证文件到本地,文件下载完成后,返回到宝塔面板,进入文件里,找到所测试的网站文件夹,然后进入,点击上传,将刚刚下载的那个验证文件上传至文件夹里,回到百度抓取的网站,点击验证文件,确认无误后,完成验证,如下图所示:





4.测试抓取

找到搜索服务,进入抓取诊断,按需求选择测试节点,然后点击抓取,每个账号每周有200次的抓取,所以悠着点用,如下图所示:




至此就完成了百度抓取的测试流程,如有不当之处,还望各位简友及大神们见谅并请告知不当之处,毕竟本人能力有限哈。嘿嘿,需要香港服务器的,详情可联系鼎峰新滙运维技术支持——小配(Q2880501305)

你可能感兴趣的:(记一次百度抓取的测试流程)