课程作业-爬虫入门02-网页基础与结构分析-WilliamZeng-20170706

课堂作业

  • 选择解密大数据专题里面爬虫入门01提交的作业文档地址作为分析页面
  • 分析并提交该页面的网页结构分析与元素标签位置信息
作业文档页面第一层结构
课程作业-爬虫入门02-网页基础与结构分析-WilliamZeng-20170706_第1张图片
作业文档第一层结构分析.png
  1. 全局顶部导航栏
  2. 文章,作者及阅读互动信息,比如赞赏,喜欢,分享,评论。这个区域的子元素中,一个是文章本身post类,另一个是一个侧边工具栏类
  3. 文章底部区域,收入专题和相关推荐文章
作业文档页面主要的元素标签,层级结构及部分标签说明
课程作业-爬虫入门02-网页基础与结构分析-WilliamZeng-20170706_第2张图片
主要元素及其标签信息.png

标签比较多,这次作业时间紧张。我只列出了第一层结构和第一层下面的一些主要结构。元素并未全部列出,主要是列出曾老师在布置作业提到的一些元素。

曾老师布置作业的问题里提到的链接跳转大部分是靠a标签里href属性里的相对URL实现的。有一小部分是靠java script代码,像微信,微博,更多分享都是靠相应元素上href属性里的java script代码来实现的。另外有一部分a标签很可能是通过现在我还未查看的CSS代码来控制,不排除里面也有链接跳转的行为。

你可能感兴趣的:(课程作业-爬虫入门02-网页基础与结构分析-WilliamZeng-20170706)