python网络爬虫指南一:网页基础(html/css/JavaScript)、网络请求(urllib/requests)、数据解析(XPath/BeautifulSoup)
文章目录一、爬虫开发基础1.1浏览器工作原理1.2HTTP概述1.2.1HTTP简介1.2.2五层网络模型1.2.3HTTP组件系统1.2.4HTTP报文1.3爬虫工作原理1.4HTML基础1.4.1HTML简介1.4.2HTML文档结构1.4.3CSS层叠样式表1.4.3.1CSS的作用1.4.3.2CSS选择器1.4.3.3CSS文本和字体样式1.4.4HTML元素和标签1.5JavaScri