html实体符号编码解析 < > &;&#;&编码;&#编号;是什么意思什么编码

转自:http://mingkr.com/html-entity

html实体符号编码解析

在浏览器中有很多字符,都是属于保留字符,例如(<),对SGML,HTML,XML来说是有特殊意义的,如果某些Unicode字符在文档的当前编码方式(如ISO-8859-1)中不能直接表示,那么就可以通过字符值引用,这里也称之为实体编号或者字符实体引用,这里也称之为实体符号两种转义序列来表示这些不能直接编码的字符。

实体编号的组成

  1. 和号(&)
  2. 井号(#)
  3. 编号(数字)
  4. 封号(;)

实体符号的组成

  1. 和号(&)
  2. 字符(字母)
  3. 封号(;)

注意点

实体名称(Entity)是区分大小写的

备注

同一个符号,可以用“实体名称”和“实体编号”两种方式引用,“实体名称”的优势在于便于记忆,但不能保证所有的浏览器都能顺利识别它,而“实体编号”则没有这种担忧,但它实在不方便记忆。

HTML 4 DTD标准,定义了252个命名实体。HTML 4规范要求使用标准DTD,并且不允许用户定期其它的命名实体.
在XHTML DTD中,明确声明了253个字符实体(包括5个XML 1.0的预定义实体). 除了’实体这个例外,其它252个字符实体与HTML中的252个字符实体引用一致. 每个XHTML文件实例还可以定义任意数目的字符实体。但是XHTML字符实体的可用性受到该文件的处理方式的影响:

  1. 如果该文件由HTML处理器来处理, 那么只有252个 HTML字符实体可用。’或用户定义的实体引用可能不被支持,产生不可预测的效果.
  2. 如果该文件由XML分析器来处理,只有5个XML预定义的字符实体能安全使用, 虽然定义在内部DTD子集中的其它实体也许可用。
  3. 如果XML分析器能读外部实体,那么除了5个XML预定义的字符实体能安全使用,只要XML分析器能读取XHTML DTD,其它248个HTML字符实体也可以使用。声明在内部DTD子集中的实体也可以使用.

 

举例

一般来说,在编辑HTML文档时,浏览器会自动删除空格。不管你按空格键,加入多少空格,一部分浏览器处理文档时,都看成一个空格。比如你在两个字符之间加上了10个空格,HTML会截去9个空格,只保留一个。为了在网页中,使用空格这个特殊字符,我们便可以使用实体字符或者是实体编码来转义成空格

在html文档中表示为: 或者是 

由于’不能在HTML处理器中一致的安全使用,实际上仅有”, &, <, and >4个字符实体可以在所有处理环境下通用。所以,尽量使用实体编号来转义字符避免部分字符无法转义

我根据Dave从官方的整理做了翻译,查看实体编号和转义字符的对应参照表

附加关键词:< >  &&;&#;&编码;&#编号;是什么意思什么编码实体符号实体编码实体字符&转义符

你可能感兴趣的:(web技术,编程基础)