Python爬虫小分队二期学习进展:第一天

HTML语法学习

参考资料:HTML 基础教程

学习的内容

  1. 了解html文档的基本结构
  • 标签的写法,常用标签

HTML 元素以开始标签起始
HTML 元素以结束标签终止

  • 标签嵌套

    
  

This is my first paragraph.

  1. 了解常用的标签
  • a
This is a link
  • p

This is my first paragraph.

  • div

This is a header

This is a paragraph.

  • img

<img src="//www.baidu.com/img/bd_logo1.png" />

  • h1~h6

This is heading 1

This is heading 2

This is heading 3

This is heading 4

This is heading 5
This is heading 6
  1. html标签属性
    HTML 链接由 标签定义,链接的地址在 href 属性中指定
This is a link
  1. html段落
    段落是通过

    标签定义的。

This is a paragraph

This is another paragraph

  1. html url

语法:scheme://host.domain:port/path/filename

  • scheme - 定义因特网服务的类型。最常见的类型是 http,https,ftp,file
  • host - 定义域主机(http 的默认主机是 www)
  • domain - 定义因特网域名,比如 w3school.com.cn
  • :port - 定义主机上的端口号(http 的默认端口号是 80)
  • path - 定义服务器上的路径(如果省略,则文档必须位于网站的根目录中)。
  • filename - 定义文档/资源的名称

以百度首页为例:https://www.baidu.com:443/index.html

  • scheme - 因特网服务的类型为https
  • host - 域主机是 www
  • domain - 因特网域名baidu.com
  • :port - 主机上的端口号443
  • path - 省略,表示服务器上的路径为网站的根目录中。
  • filename - 文档名称为index.html

你可能感兴趣的:(Python爬虫小分队二期学习进展:第一天)