我从两年前开始接触Python, 期间用Python做过各种有趣的事情, 比如用django搭建网站, 用python识别图片验证码, 和本篇中要讲到的爬虫.
爬虫篇主要记述了我从零开始的爬虫学习之路, 这是第一次写这种博客, 由于本人学历尚浅, 文章中有任何不足和错误希望读者可以指出, 谢谢.
谈到爬虫,初次接触可能会被这名字吓住, 说实话, 我最初学编程时候一听说爬虫, 就在想 爬虫是什么, 听起来很牛逼的样子.
爬虫简单的说就是一个①下载, ②筛选内容, ③加以保存的程序.(这里不够专业,请看到的大佬见谅). 爬虫的第一步就是下载网页, 最重要的一步是筛选内容, 而保存, 根据不同的情景有不同的要求.
在接下来的篇章中,我也会按照三个过程分别讲述一个爬虫的产生过程, 在文中所有的程序段都是python编写的, 这里假定看到本文的读者已经安装了python2.7, 或者python3, 并且学习过python语法基础, 没有学习过python的读者请自行百度搜索相关文章学习.
文章结构:
一、初级篇-三步走:
篇(一) 爬虫第一步: 利用python 下载网页
篇(二) 爬虫第二步: 利用python 筛选需要的内容
篇(三) 爬虫第三步: 利用python 保存数据
注: 转载请注明出处