Web前端基础1-结构

2.1 W3C标准

网页主要有三部分组成:结构,表现和行为。对应标准:结构化标准语言(HTML.XML),表现标准语言(CSS),行为标准(W3C DOM,ECMScript)

2.1.1 HTML

一种网页信息的符号标记语言,HTML语言的特点:
Web前端基础1-结构_第1张图片
1.HTML的基本结构
< html>…
< head>…
< title>…
< body>…
< meta>元信息
2.文档设置标记
< br>:换行
< p>:段落标记
< center>:居中对齐
< pre>:预格式化标记
< li>:列表项目标记
< ul>:无序列表
< ol>:有序列表
< dl>< dt>< dd>:定义型列表
< hr>:水平分割
< div>:分区
文本标记:
< hn>:标题
< font>:字体设置
< b>:粗体
< i>;斜体
< sub>:文字下标
< sup>:文字上标
< tt>:打印机字体
< cite>:引用字体
< em>:表强调
< strong>:表强调
< small>:小型字体
< big>:大型字体
< u>:下划线
3.图像标记
< img src="…“width=”…“height=”…“border=”…“alt=”…">
src:路径,名称及格式
width:宽度
height:高度
border:边框宽度
alt:鼠标移动到图片可以显示文字;图片下载失败使用文字显示;通过属性的文字来抓取图片
4.超链接的使用
< a href="链接地址"target="打开方式"name=“页面锚点名称”>链接文字或图片
5.表格
< table 属性1="属性值1"属性值2=“属性值2”…>表格内容
常见属性:
width:表格宽度
height:表格高度
border:表格外边框宽度
align:表格显示位置
cellspacing:单元格之间间距
cellpadding:单元格内容与边框的显示距离
frame:控制边框有无
rules:是否显示单元格之间的分割线
< caption>:表格标题
< tr>:定义表格的行
< td>< th>:单元格标记

你可能感兴趣的:(爬虫)