python学习第四天

爬虫

1.提取本地html中的数据 用Lxml

(1).新建html文件

(2).读取

(3).使用Lxml中的xpath语法进行提取


python学习第四天_第1张图片


2.提取远程html中的数据 用requests


python学习第四天_第2张图片


写入本地


python学习第四天_第3张图片


3、爬虫(当当网搜索)


python学习第四天_第4张图片
python学习第四天_第5张图片


4.实例2 抓取豆瓣网即将上映电影的相关信息

请求远程端站点


python学习第四天_第6张图片


5.关于xpath的用法

https://www.cnblogs.com/lei0213/p/7506130.html

你可能感兴趣的:(python学习第四天)