XML 语法
XML文件主要由XML文档声明,元素,属性,注释,转义字符,CDATA区,处理指令组成。
文档声明必须为结束
;
文档声明必须从文档的0行0列位置开始;
文档声明只有三个属性:
versioin:指定XML文档版本。必须属性,因为我们不会选择1.1,只会选择1.0;
encoding:指定当前文档的编码。可选属性,默认值是utf-8;
standalone:指定文档独立性。可选属性,默认值为yes,表示当前文档是独立文档。如果为no表示当前文档不是独立的文档,会依赖外部文件。
元素是XML文档中最重要的组成部分,
普通元素的结构开始标签、元素体、结束标签组成。例如:大家好
元素体:元素体可以是元素,也可以是文本,例如:你好
空元素:空元素只有开始标签,而没有结束标签,但元素必须自己闭合,例如:
元素命名:
a) 区分大小写
b) 不能使用空格,不能使用冒号:
c) 不建议以XML、xml、Xml开头
属性是元素的一部分,它必须出现在元素的开始标签中
属性的定义格式:属性名=属性值,其中属性值必须使用单引或双引
一个元素可以有0~N个属性,但一个元素中不能出现同名属性
属性名不能使用空格、冒号等特殊字符,且必须以字母开头
XML 文件中注释采用:" " 这样的格式
XML 声明之前不能有注释
注释不能嵌套,比如下面不合规范:
XML中的转义字符与HTML一样。
因为很多符号已经被XML文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符,例如:“<”、“>”、“’”、“””、“&”。
| 转义字符 | 特殊字符 | 含义 |
| — | — | — |
| < | < | 小于 |
| > | > | 大于 |
| & | & | 和号 |
| ' | ’ | 单引号 |
| " | " | 引号 |
当大量的转义字符出现在xml文档中时,会使xml文档的可读性大幅度降低。这时如果使用CDATA段就会好一些。
在CDATA段中出现的“<”、“>”、“””、“’”、“&”,都无需使用转义字符。这可以提高xml文档的可读性。
在CDATA段中不能包含“]]>”,即CDATA段的结束定界符。
用来解析引擎如何解析 XML 文档内容
比如:在 XML 文档中可以使用 xml-stylesheet 指令,通知 XML 解析引擎,应用 CSS 文件显示 XML 文档内容
处理指令必须以 开头,以 > 结尾
XML的解析
a) 优点:元素与元素之间保留结构关系,故可以进行增删改查操作。
b) 缺点:XML文档过大,可能出现内存溢出显现。
a) 优点:处理速度快,可以处理大文件
b) 缺点:只能读,逐行后将释放资源。
根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐,为了方便开发人员,有提供易于操作的解析开发包。
JAXP:sun公司提供支持DOM和SAX开发包
JDom:dom4j兄弟
jsoup:一种处理HTML特定解析开发包
dom4j:比较常用的解析开发包,hibernate底层采用。
XML DOM 和 HTML DOM类似,XML DOM 将 整个XML文档加载到内存,生成一个DOM树,并获得一个Document对象,通过Document对象就可以对DOM进行操作
HelloMyServlet
com.jourwon.HelloMyServlet
HelloMyServlet
/hello
DOM中的核心概念就是节点,在XML文档中的元素、属性、文本等,在DOM中都是节点!
引入dom4j依赖
org.dom4j
dom4j
2.1.1
将xml文件放到指定位置,这里放的是XML 用途配置文件栗子的内容,然后读取这个位置的xml文件,测试代码如下
public class Dome4jTest {
public static void main(String[] args) throws DocumentException {
// 1 创建核心对象(new 方式)
SAXReader saxReader = new SAXReader();
//2 加载xml文档 获得dom树(核心对象调用read读取xml文件)
Document doc = saxReader.read(“E:\IdeaProjects\demo1\src\main\resources\demo.xml”);
//3 获得根元素(文档对象下面就是根元素)
Element root = doc.getRootElement();
//4 获得子元素(根节点下所有子元素)
List list = root.elements();
for (Element e : list) {
// elementText(“标签名”) 获得指定名称元素的文本值 (指定标签的文本值)
// getName() 获得当前元素名
if (“servlet”.equals(e.getName())) {
System.out.println(e.elementText(“servlet-name”));
System.out.println(e.getName());
}
}
}
}
输出结果
HelloMyServlet
servlet
XML的约束
规定xml中可以出现哪些元素及哪些属性,以及他们出现的顺序
《一线大厂Java面试题解析+后端开发学习笔记+最新架构讲解视频+实战项目源码讲义》
【docs.qq.com/doc/DSmxTbFJ1cmN1R2dB】 完整内容开源分享
DTD约束:struts hiebernate等等(会用到)
SCHEMA约束:tomcat spring等等(会用到)
既然是约束就和xml有联系,所以约束要和xml关联,xml的相关限制才能生效。
格式:
格式:
例如:
举例web-app_2_3.dtd文件
接下来xml中只能出现dtd文件中规定的特有的标签了(不能自定义自己随便写了)
ps:idea中你输入< 便会提示能够输入的标签
格式:
如mybatis中mapper的约束
无论是单独的dtd文件还是写在xml中(参考上面方式一)都需要按照语法要求写
再次强调下语dtd文件约束的作用:
规定xml中可以出现哪些元素及哪些属性,以及他们出现的顺序
标签(元素)语法:
数据类型:#PCDATA:普通文本 使用的时候一般用()引起来
功能:能出现那些标签,以及出现顺序
包含内容:该元素下可以出现哪些元素 用()引起来
符号:
? 出现1次或者0次
| 或者
() 分组
, 顺序(元素出现先后顺序,按照都好标记顺序出现)
栗子如下:(上图约束图中的代码)
ps:元素名就是xml中能够出现的元素标签名
属相的约束语法:
属性:
格式:
属性类型:
ID:唯一
CDATA:普通文本
属性是否必须出现
REQUIRED:必须出现
IMPLIED:可以不出现
例如:
注意:一个xml文档中只能添加一个DTD约束
一个xml文档中可以添加多个schema约束
xml和schema的关联.
格式:
<根标签 xmlns="…" …>
<根标签 xmlns:别名="…" …>
名称空间:
关联约束文件
规定元素是来源于那个约束文件的