1.简介:
.HTML概念:(Hypertext Markup Language)超文本标注语言,是一个标准,是一个标记
.静态网页的扩展名:.html和.htm
.动态网页的扩展名: .asp .jsp .aspx .php(含有代码和MySQL代码)等
.浏览器不能识别PHP和MySQL代码,只能有服务器端的服务器软件Apache来解析成HTML代码返回
2.字符实体
.有些字符在 HTML5 中是保留字,如大于,小于标记或者尖括号,因为浏览器可能会误认为它们是标记
.常用字符实体:空格: >:> <:< &:& 人民币¥:¥
版权©:© 乘号:× 除号:÷ 商标®:®
3.页面乱码
字符集设置要与编辑环境的字符集一致
计算机只处理二进制的数据,0-9、a-z、A-Z,这些字符,A用110表示,B用111表示等
常用的编码 GB2312(简体)、GBK(简体)、BIG5(繁体)、UTF-8(多国语言编码)
a. ASCII码:美国发布的,用1个字节(8位二进制)来表示一个字符,共可以表示2^8=256个字符
因为美国的国 家语言是英语,只能表示0-9、a-z、A-Z、特殊符号。
b. ANSI编码:每个国家为了显示本国的语言,都对ASCII码进行了扩展。
用2个字节(16位二进制)来表示一个汉字,共可以表示2^16=65536个汉字
c. 中国的ANSI编码是GB2312编码(常用汉字的编码)或gbk 对6763汉字进行编码,600多特殊字符。
日本的ANSI编码是JIS编码;
台湾的ANSI编码是BIG5编码;
d. GBK:对GB2312进行了扩展,用来显示罕见的、古汉语的汉字。现在已经收录了2.1万左右。
并提供了 1890个汉字码位。 K的含义就是“扩展”
e. Unicode编码(统一编码):用4个字节(32位二进制)来表示一个字符,想法不错,但效率太低。
例如:A用ASCII表示的话一个字节就够,可用Unicode编码的话,得用4个字节表示,造成了空间的极大浪费
UTF-8(Unicode Transfor0000 0000 0000m Format):根据字符的不同,选择期编码的长度。比如:字符A用 1个字节要以,一个汉字用3个字节表示。
网页中常见编码对应总结:
文件编码utf-8 —— meta声明编码utf-8
文件编码ANSI —— meta声明编码gb2312
文件编码ANSI —— meta声明编码gbk
4.浏览器内核
- Trident:ie、猎豹安全浏览器、360极速浏览器、百度浏览器...
- Gecko:Firefox
- Webkit:Safari
- Blink:Chrome,Opera
内核(Rendering Engine):可译为"渲染引擎",习惯称为"浏览器内核",负责对网页语法的解释并渲染网页
内核的分类:不同的内核在渲染同一内容的时候会有差别
5.URL
URL(Uniform Resource Locator,统一资源定位器)
url的组成:协议://服务器的ip地址:/端口号/请求的页面
例如:http://php.itcast.cn/about/20140706/230.html
URL(网址)由四个部分构成:
第一部分:协议,比如:http:// ftp://
如何判断是什么服务器?主要看安装了什么样的服务器软件?Apache是WWW服务器
如果安装了FTP的软件的服务器,FTP服务器,如果安装了邮箱服务器的软件,那就是“邮件服务器”, 如果安装了MySQL软件的服务 器,那就是“数据库服务器”
第二个部分:主机名,如:php.itcast.cn是一个主机的二级域名(一级域名是以WWW开头的)。
第三部分: 端口号
第四部分: 文件名,比如:230.html
================================================================================
DTD文档类型定义
DTD(Document Type Definition)文档类型定义,是一套标记的规则,理解为一种“验证机制”
DTD有三种类型:
第一种:Strict严格型:在这种XHTML中,结构中不能出现格式或表现的内容
格式标记:、、color属性、background属性
这种类型下,在中只有结构标记,不能出现任何的表现。
第二种:Transitional过渡型:在这种XHTML中,结构中可以出现格式标记或表现(CSS)的内容。(用的最多)
第三种:Frameset框架型:在这种XHTML中,可以使用框架技术,实现多个网页在一个浏览器窗口中呈现