【无标题】爬虫基础入门

对于爬虫而言,主要是为了批量的获取特定的数据!!!
为此我们先对爬虫有一个基础的了解

第一步需要了解的就是什么是url,一个网站的url就是我们通常说的网址。比如说百度的url就是https://www.baidu.com/
第二步需要了解的就是什么是网页源码,我们知道这个网页源码属于前端开发,就是说可以完成页面的一个可视化和功能的实现,那么怎么取看这个网页的源代码呢?
我们以百度为例,进入到百度的搜索页面,鼠标右键,点击查看页面源代码。这里就是整个页面的源代码,我们所需要的所有页面信息也都是来自于这里。
第三步就是需要安装一个python,要3版本以上,然后安装pycharm,然后安装anaconda,将anaconda的库导入到pycharm中,这样的话就完成了前期的准备工作。对于python和pycharm以及anaconda的安装和库的配置工作,在CSDN中都可以查找并按照步骤进行安装。
第四步就是使用谷歌软件,谷歌有可能被墙,那么就将默认浏览器设置为百度浏览器。
全部设置完成了我们就开始准备开始我们的爬虫之旅了!!

你可能感兴趣的:(爬虫,python,pycharm)