Spring Boot + Java爬虫 + 部署到Linux (三、Java爬虫使用代理,模拟登录,保存cookie)
很多网站对资源都有一定的限制。如果不登录,不是网站的登录用户(会员)访问的话,一些资源会访问不到。这对我们爬虫是十分不利的。而绝大多数网站都是通过登录之后,向浏览器设置cookie,达到验证的功能。由于目标网站很多有时候可能会被q,而无法一般的访问。所以我们要使用代理解决障碍。这里呢,我推荐ss,既好用又便宜。手机、电脑均有客户端可以使用。方法原理也比较简单,首先需要租一台便宜的国外服务器,然后远