在有些业务场景下,存储数据或者传输数据给别人的时候需要满足一定的规范进行组织
XML 的全称为(EXtensible Markup Language),是一种 可扩展 的 标记语言,是一种数据表示格式,可以用于自定义数据格式,可以描述非常复杂的数据结构,常用于传输和存储数据。
例如:
<data>
<sender> 张三 sender>
<receiver> 李四 receiver>
<src>
<addr> 北京 addr>
<date>2022-11-11 11:11:11date>
src>
<current> 武汉 current>
<dest> 广州 dest>
data>
XML 的几个特点和使用场景
UTF-8
编码;二是可嵌套;就是创建一个 XML 类型的文件,要求文件的后缀名必须使用 xml
,如:helloworld.xml
。
XML 文件的文档声明必须在第一行
version
: XML 默认的版本号码、该属性是必须存在的
encoding
:本 XML 文件的编码
,必须存在一个根标签,有且只能有一个
<
: <
小于>
: >
大于&
:&
和号'
: '
单引号"
:"
引号示例代码
<student>
<msg>
age > 18 && age <24
18 && age<24
]]>
msg>
student>
问题:由于 XML 文件可以自定义标签,导致 XML 文件可以随意定义,程序在解析的时候可能出现问题。
文档约束是用来限定 XML 文件中的标签以及属性应该怎么写,以此强制约束程序员必须按照文档约束的规定来编写 XML 文件中
文档约束可以分为:DTD和 schema 两种
需求:利用 DTD 文档约束,约束一个 XML 文件的编写。
分析:
.dtd
示例代码
XML 的文档约束 -DTD 的作用和问题?
- 可以约束 XML 文件的编写。
- 不能约束具体的数据类型。
schema 可以约束具体的数据类型,约束能力上更强大,但由于其本身也是一个 XML 文件,也受到其他约束文件的要求,所以编写地更严谨
需求:利用 schema 文档约束,约束一个 XML 文件的编写。
分析:
.xsd
示例代码
XML 的数据的作用是什么,最终需要怎么处理?
主要有两种解析方式: SAX 解析、DOM 解析
Dom 常见的解析工具
DOM 解析解析文档对象模型
Document
对象:整个 xml 文档
Node
对象
Element
对象:标签Attribute
对象:属性Text
对象:文本内容需求:使用 Dom4J 把一个 XML 文件的数据进行解析
分析:
Dom4j 解析 XML- 得到 Document 对象
SAXReader类
Document 类
Dom4j 解析 XML 的元素、属性、文本
示例代码
XML文件
<contactList>
<contact id="1" vip="true">哈哈哈
<name> 潘金莲 name>
<gender>女gender>
<email>[email protected]email>
contact>
<contact id="2" vip="false">
<name>武松name>
<gender>男gender>
<email>[email protected]email>
contact>
<contact id="3" vip="false">
<name>武大狼name>
<gender>男gender>
<email>[email protected]email>
contact>
<user>
user>
contactList>
解析XML文件
import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import org.junit.Test;
import java.io.InputStream;
public class Dom4jDemo {
@Test
public void parseXML() throws Exception{
// 1. 创建一个Dom4j解析器对象,代表了整个Dom4j框架
SAXReader saxReader = new SAXReader();
// 2. 把XML文件加载到内存中称为一个Document对象
// Document document = saxReader.read("xml\\src\\Contacts.xml");
// Document document = saxReader.read(new File("xml\\src\\Contacts.xml"));
// Document document = saxReader.read(new FileInputStream("xml\\src\\Contacts.xml"));
// getResourceAsStream 中的/是直接去src下寻找文件
InputStream is = Dom4jDemo.class.getResourceAsStream("/Contacts.xml");
Document document = saxReader.read(is);
// 3. 获取根元素对象
Element rootElement = document.getRootElement();
System.out.println(rootElement.getName()); // contactList
// 4. 获取子元素
// 4.1 获取根元素下所有的子元素(一级)
// List elements = rootElement.elements();
// for (Element element : elements) {
// System.out.println(element.getName());
// }
// 4.2 获取某个子元素(若同名,默认提取第一个子元素对象)
Element contact = rootElement.element("contact");
System.out.println(contact.getName()); // contact
// 4.3 获取当前元素的文本
System.out.println(contact.getText());
// 去掉前后空格
System.out.println(contact.getTextTrim()); // 哈哈哈
// 4.4 获取子元素文本
System.out.println(contact.elementText("name"));
// 去掉前后空格
System.out.println(contact.elementTextTrim("name")); // 潘金莲
// 4.5 根据元素获取属性值
Attribute id = contact.attribute("id");
// 打印属性名和属性值
System.out.println(id.getName()+":"+id.getValue());
// 4.6 直接获取属性值
System.out.println(contact.attributeValue("id")); // 1
System.out.println(contact.attributeValue("vip")); // true
}
}
需求 : 利用 Dom4J 的知识,将 Contact.xml 文件中的联系人数据封装成 List 集合,其中每个元素是实体类 Contact 。打印输出 List 中的每个元素。
案例用到的 XML 文件见上文
创建 Contact 类
public class Contact {
private String name;
private int id;
private boolean vip;
private char gender;
private String email;
public Contact() {
}
public Contact(String name, int id, boolean vip, char gender, String email) {
this.name = name;
this.id = id;
this.vip = vip;
this.gender = gender;
this.email = email;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public int getId() {
return id;
}
public void setId(int id) {
this.id = id;
}
public boolean isVip() {
return vip;
}
public void setVip(boolean vip) {
this.vip = vip;
}
public char getGender() {
return gender;
}
public void setGender(char gender) {
this.gender = gender;
}
public String getEmail() {
return email;
}
public void setEmail(String email) {
this.email = email;
}
@Override
public String toString() {
return "Contact{" +
"name='" + name + '\'' +
", id=" + id +
", vip=" + vip +
", gender=" + gender +
", email='" + email + '\'' +
'}';
}
}
解析XML
import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import org.junit.Test;
import java.lang.invoke.StringConcatException;
import java.util.ArrayList;
import java.util.List;
public class TestDemo {
@Test
public void parseToList() throws Exception {
// 1. 创建saxReader对象
SAXReader saxReader = new SAXReader();
// 2. 加载XML文件成为Document对象
Document document = saxReader.read(TestDemo.class.getResourceAsStream("/Contacts.xml"));
// 3. 先获取根元素
Element rootElement = document.getRootElement();
// 4. 获取所有的contact子元素
List<Element> contactEles = rootElement.elements("contact");
// 5. 准备一个ArrayList集合封装联系人信息
ArrayList<Contact> contactsList = new ArrayList<>();
// 6. 遍历每一个contact子元素
for (Element contactEle : contactEles) {
// 7. 每一个contact子元素都是一个联系人对象
Contact contact = new Contact();
// 8. 提取信息并给对象赋值
contact.setId(Integer.valueOf(contactEle.attributeValue("id")));
contact.setVip(Boolean.valueOf(contactEle.attributeValue("vip")));
contact.setName(contactEle.elementTextTrim("name"));
contact.setGender(contactEle.elementTextTrim("gender").charAt(0));
contact.setEmail(contactEle.elementTextTrim("email"));
// 9.把联系人对象放入List集合
contactsList.add(contact);
}
// 10. 遍历集合
for (Contact contact : contactsList) {
System.out.println(contact);
}
}
}
输出结果
总结
- Dom4J 解析 XML 文件的核心思想
- 得到文档对象 Document ,从中获取元素对象和内容。
- Dom4J 的解析后的数据形式。
- 通常数据会封装成 Java 的对象,如单个对象,或者集合对象形
式。
如果需要从 XML 文件中检索需要的某个信息(如 name )怎么解决?
XPath 在解析 XML 文档方面提供了一独树一帜的路径思想,更加优雅,高效。XPath 使用路径表达式来定位 XML 文档中的元素节点或属性节点。
使用 Xpath 检索出 XML 文件
需求:使用 Dom4J 把一个 XML 文件的数据进行解析
分析:
Document 中与 Xpath 相关的 API
Xpath 的四大检索方案
示例代码
XML文件
<contactList>
<contact id="1" vip="true">
<name> 潘金莲 name>
<gender>女gender>
<email>[email protected]email>
contact>
<contact id="2" vip="false">
<name>武松name>
<gender>男gender>
<email>[email protected]email>
contact>
<contact id="3" vip="false">
<name>武大狼name>
<gender>男gender>
<email>[email protected]email>
contact>
<user>
<contact>
<info>
<name id="666">西门庆name>
info>
contact>
user>
contactList>
检索XML
import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;
import org.junit.Test;
import java.util.List;
public class XPathDemo {
// 1. 绝对路径
@Test
public void parse01() throws Exception {
// 创建解析器对象
SAXReader saxReader = new SAXReader();
// 将XML文件加载成Document对象
Document document = saxReader.read(XPathDemo.class.getResourceAsStream("/Contacts2.xml"));
// 检索全部名称:name值
List<Node> nodes = document.selectNodes("/contactList/contact/name");
for (Node node : nodes) {
Element nameEle = (Element) node;
System.out.println(nameEle.getTextTrim());
}
}
// 2. 相对路径
@Test
public void parse02() throws Exception {
// 创建解析器对象
SAXReader saxReader = new SAXReader();
// 将XML文件加载成Document对象
Document document = saxReader.read(XPathDemo.class.getResourceAsStream("/Contacts2.xml"));
Element rootElement = document.getRootElement();
// 检索全部名称:name值
List<Node> nodes = rootElement.selectNodes("./contact/name");
for (Node node : nodes) {
Element nameEle = (Element) node;
System.out.println(nameEle.getTextTrim());
}
}
// 3. 全文搜素
@Test
public void parse03() throws Exception {
// 创建解析器对象
SAXReader saxReader = new SAXReader();
// 将XML文件加载成Document对象
Document document = saxReader.read(XPathDemo.class.getResourceAsStream("/Contacts2.xml"));
// 检索数据
// List nodes = document.selectNodes("//name");// 会找"西门庆"
// List nodes = document.selectNodes("//contact/name");// 不会找"西门庆"
List<Node> nodes = document.selectNodes("//contact//name");// 会找"西门庆"
for (Node node : nodes) {
Element nameEle = (Element) node;
System.out.println(nameEle.getTextTrim());
}
}
// 4. 属性查找
@Test
public void parse04() throws Exception {
// 创建解析器对象
SAXReader saxReader = new SAXReader();
// 将XML文件加载成Document对象
Document document = saxReader.read(XPathDemo.class.getResourceAsStream("/Contacts2.xml"));
// 检索数据
// 在全文中检索属性对象
List<Node> nodes = document.selectNodes("//@id");
for (Node node : nodes) {
Attribute attr = (Attribute) node;
System.out.println(attr.getName()+":"+attr.getValue());
}
// 在全文中检索包含该属性的元素对象(若有多个只返回第一个)
// 查询name元素(包含id属性的)
// Node node = document.selectSingleNode("//name[@id]");
// 在全文中检索属性对象且属性值为该值的元素对象
Node node = document.selectSingleNode("//name[@id=666]");
Element ele = (Element) node;
System.out.println(ele.getTextTrim());
}
}
Element
和继承Node
之前我们创建类对象时,都是使用 new 对象的形式创建,在很多业务场景下也提供了不直接 new 的方式 。
工厂模式( Factory Pattern )是 Java 中最常用的设计模式之一, 这种类型的设计模式属于创建型模式,它提供了一种获取对象的方式。
工厂设计模式的作用:
装饰设计模式:创建一个新类,包装原始类,从而在新类中提升原来类的功能。
装饰设计模式的作用: