目录
一、了解网页结构
1、网页源代码
1、查看网页源代码以百度为例
2、解读网页源代码
二、requests模块使用方法
1、获取静态网页源代码
2、获取动态加载的数据
1、以豆瓣排行榜为例
2、爬取排行榜数据
一、了解网页结构
1、网页源代码
1、查看网页源代码以百度为例

按快捷键f12
然后点击

然后点击网页上任意位置
即可弹出网页源代码

2、解读网页源代码

1、 用来告知 Web 浏览器页面使用了哪种 HTML 版本。
2、定义一个 HTML 文档。
3、
定义关于文档的信息。
4、定义关于 HTML 文档的元信息。
5、定义文档与外部资源的关系。
6、
元素描述了文档的标题
7、