Python爬取CSDN博客专家系列——移动开发

注明:小编亲测,只要把第一部分里面的url修改,即可抓取博客专家里边所有的专家的博客内容和标题,后续小编还会对此代码改进,敬请期待

文章分为两部分:Python爬虫爬取移动开发专家的姓名和博客首页地址,爬取每个专家的所有博客存放在已该专家名字命名的txt文件中
说明:本爬虫主要是采用BeautifulSoup和少量的正则匹配,在第一部分抓取完毕后需要将文件格式改为ANSI,代码如下:
第一部分:

第二部分:
结果如下图:
Python爬取CSDN博客专家系列——移动开发_第1张图片
Python爬取CSDN博客专家系列——移动开发_第2张图片

你可能感兴趣的:(爬虫,移动开发,python,正则)