用 Python 写爬虫一定会要分析浏览器的各种行为,我使用的工具是火狐浏览器的插件 httpfox,下面介绍一下这个插件的安装及使用方法。
二、点击左侧的扩展,在右侧搜索 httpfox
搜索到后点击安装即可,安装好后重启火狐浏览器。
三、打开 httpfox
点击右上角菜单,点击定制,将 httpfox 拖进来即可。单击 httpfox,选择 Open In Own Window,即可打开 httpfox。
httpfox默认是运行的,会一直对浏览器与 Web 服务器之间传输的 HTTP 流量进行监视和分析。点击左上角的 Clear 可以清楚已捕捉到的数据,点击 Stop 停止运行,点击 Start 继续运行,至于捕捉到的各种数据在之后结合具体代码再说吧。