Python爬虫实战最新版药监局爬虫及数据

国家药品监督管理局的数据是动态数据,点击下一页链接也不会边变,而且需要依次获取点击页面才能获取数据。

所以要先访问首页:http://www.nmpa.gov.cn/

然后点击:药品查询进入,药品等栏目
Python爬虫实战最新版药监局爬虫及数据_第1张图片
目标是爬取国产药品,截至今天 2021-09-15 共 15W 条数据

请求分析

点击国产药品进入药品列表页面

Python爬虫实战最新版药监局爬虫及数据_第2张图片
列表页主要是 **cookie ** 加密,这个好处理,找到加密位置,然后扣取相应代码

详细页

详细页面爬虫如下

Python爬虫实战最新版药监局爬虫及数据_第3张图片

最后爬取了整个数据。

结果如下:
Python爬虫实战最新版药监局爬虫及数据_第4张图片

Python爬虫实战最新版药监局爬虫及数据_第5张图片
全部数据以及维度都采集下来!!

获取数据,关注以下,谢谢~~
Python爬虫实战最新版药监局爬虫及数据_第6张图片

你可能感兴趣的:(爬虫,python,python,爬虫)