HTML基础--学习笔记

HTML作为最流行的文本标记语言,爬虫学习过程中要大量的解析HTML文档,系统的学习一下相关语法非常有必要,以下是整理的学习笔记。以下内容主要来源www.w3school.com

什么是 HTML?

  • HTML 是用来描述网页的一种语言。

  • HTML 指的是超文本标记语言 (Hyper Text Markup Language)

  • HTML 不是一种编程语言,而是一种标记语言 (markup language)

  • 标记语言是一套标记标签 (markup tag)

  • HTML 使用标记标签来描述网页

HTML 文档 = 网页

  • HTML 文档描述网页

  • HTML 文档包含 HTML 标签和纯文本

  • HTML 文档也被称为网页

Web 浏览器的作用是读取 HTML 文档,并以网页的形式显示出它们。浏览器不会显示 HTML 标签,而是使用标签来解释页面的内容:



我的第一个标题


我的第一个段落。



HTML 标签

  • HTML 标记标签通常被称为 HTML 标签 (HTML tag)。

  • HTML 标签是由尖括号包围的关键词,比如

  • HTML 标签通常是成对出现的,比如

  • 标签对中的第一个标签是开始标签,第二个标签是结束标签

  • 开始和结束标签也被称为开放标签和闭合标签

标签 描述

元素定义了 HTML 文档中的一个段落
元素定义了 HTML 文档的主体
元素定义了整个 HTML 文档

就是没有关闭标签的空元素
定义 HTML 表格

标签在 HTML 页面中创建水平线
定义注释
定义文本方向。
定义项目或缩略词的定义。
定义短的行内引用。
元素定义键盘输入
定义预格式化文本