一、DOM4J是什么
- DOM4J是针对Java开发人员专门提供的XML文档解析规范,它不同与DOM,但与DOM相似。DOM4J针对Java开发人员而设计,所以对于Java开发人员来说,使用DOM4J要比使用DOM更加方便。
- DOM4J同时对DOM和SAX提供了支持。
二、DOM4J依赖jar包
因为DOM4J并非JavaSE中的API,因此使用Dom4j开发,需下载dom4j相应的jar文件。
三、DOM4J获得Document对象的方式
1.读取XML文件,获得document对象
SAXReader reader = new SAXReader();
Document document = reader.read(new File("input.xml"));
2.解析XML形式的文本,得到document对象.
String text = " ";
Document document = DocumentHelper.parseText(text);
3.主动创建document对象.
Document document = DocumentHelper.createDocument();
四、DOM4J解析XML文件实例
现有如下xml文件:
zhangsan
300
m
lisi
30
男
操作一:获取所有name标签中的文本值
public static void selectAll() throws Exception{
//获取解析器
SAXReader reader = new SAXReader();
//获取document对象
Document doc = reader.read("src/zuobiao/testDom4j/person.xml");
//获取根标签
Element root = doc.getRootElement();
//获取所有的p1标签
List p1s = root.elements("p1");
//获取所有p1下面的name标签
Element name = null;
for(Element p1:p1s){
name = p1.element("name");
//获取name标签的文本值
System.out.println(name.getText());
}
}
所用方法:
SAXReader():通过调用该构造方法,来创建一个解析器对象
read():解析器调用该方法来获取解析后的文档
getRootElement():获取该xml文件的根标签
elements("标签名"):父标签调用该方法,获取所有指定标签名的子标签,返回一个List对象
element(("标签名"):父标签调用该方法,获取指定标签名的子标签,返回一个Element对象
getText():标签调用此方法,获取该标签的文本值
操作二:在第一个p1的最后添加一个gender标签
public static void addElementTest() throws Exception{
//获取解析器对象
SAXReader reader = new SAXReader();
//获取解析后的document对象
Document doc = reader.read("src/zuobiao/testDom4j/person.xml");
//获取root
Element root = doc.getRootElement();
//获取第一个p1
Element p1 = root.element("p1");
//添加gender标签
Element gender = p1.addElement("gender"); //在末尾加的时候,不用手动创建标签
//给gender标签的文本值设置为男
gender.setText("男");
//回写操作
OutputFormat format = OutputFormat.createPrettyPrint();
XMLWriter writer = new XMLWriter(new FileOutputStream("src/zuobiao/testDom4j/person.xml"), format);
//格式为:XMLWriter(OutputStream out, OutputFormat format)
writer.write(doc);
writer.close(); //涉及到流的操作,一定要记得关闭
}
所用方法:
addElement("标签名"):父标签调用该方法,创建指定名称的标签,并将此标签添加进来
setText("文本内容"):标签调用此方法,设置自己的文本值
OutputFormat format = OutputFormat.createPrettyPrint():创建输出到XML后的格式
new XMLWriter(参数1, 参数2):创建回写对象
- 参数1:输出流
- 参数2:输出格式对象
write(文档对象):回写对象调用该方法,将修改后的文档对象写回到XML文件
writer.close():关闭输出流
操作三:第二个p1标签下的age标签前面添加school标签
public static void addBefore() throws Exception{
//创建解析器对象
SAXReader saxReader = new SAXReader();
//获取解析后的document对象
Document doc = saxReader.read("src/zuobiao/testDom4j/person.xml");
//获取root对象
Element root = doc.getRootElement();
//获取第二个p1标签
List p1s = root.elements("p1");
Element p1 = p1s.get(1);
//获取p1标签下面的所有标签,返回为list
List eles = p1.elements();
//创建school标签
Element school = DocumentHelper.createElement("school");
//给school标签设置文本值
school.setText("HUFE");
//list调用add(int index, E element)方法插入标签
eles.add(1, school);
//写回
OutputFormat format = OutputFormat.createPrettyPrint();
XMLWriter xmlWriter = new XMLWriter(new FileOutputStream("src/zuobiao/testDom4j/person.xml"), format);
xmlWriter.write(doc);
xmlWriter.close();
}
所用方法:
DocumentHelper.createElement("标签名"):根据给定的标签名创建标签,并返回该标签对象
eles.add(1, school):此处是list调用add(int index, E element)方法在指定位置插入指定标签
注意:
- 如果是在父标签末尾添加标签,则直接使用addElement("标签名")方法即可;
- 但是如果实在父标签中的指定位置添加标签,则需要使用DocumentHelper.createElement("标签名")方法。因为需要 获取Element对象
操作四:修改第一个p1下面的age标签的文本值
private static void modifyAge() {
//创建解析器对象
SAXReader saxReader = new SAXReader();
//获取解析后的document对象
Document doc = saxReader.read("src/zuobiao/testDom4j/person.xml");
//获取根节点
Element root = doc.getRootElement();
//获取第一个p1
Element p1 = root.element("p1");
//获取age
Element age = p1.element("age");
//修改age标签的文本值
age.setText("300");
//回写
OutputFormat format = OutputFormat.createPrettyPrint();
XMLWriter xmlWriter = new XMLWriter(new FileOutputStream("src/zuobiao/testDom4j/person.xml"), format);
xmlWriter.write(doc);
xmlWriter.close();
}
使用方法:
setText("文本内容"):标签调用此方法,设置自己的文本值
操作五:删除第一个p1下面的school标签
public static void delSch(){
//创建解析器对象
SAXReader saxReader = new SAXReader();
//获取解析后的document对象
Document doc = saxReader.read("src/zuobiao/testDom4j/person.xml");
//得到root
Element root = doc.getRootElement();
//获取p1
Element p1 = root.element("p1");
//得到school
Element school = p1.element("school");
//删除
p1.remove(school);
//写回
OutputFormat format = OutputFormat.createPrettyPrint();
XMLWriter xmlWriter = new XMLWriter(new FileOutputStream("src/zuobiao/testDom4j/person.xml"), format);
xmlWriter.write(doc);
xmlWriter.close();
}
使用方法:
remove(标签对象):父标签调用此方法,删除指定子标签
操作六:获取第一个p1的id属性
private static void getValue() {
//创建解析器对象
SAXReader saxReader = new SAXReader();
//获取解析后的document对象
Document doc = saxReader.read("src/zuobiao/testDom4j/person.xml");
//得到root
Element root = doc.getRootElement();
//获取p1
Element p1 = root.element("p1");
//获取属性值
String str = p1.attributeValue("id");
System.out.println(str);
}
所用方法:
attributeValue("属性名"):标签调用此方法获取指定属性名的属性值
五、DOM4J对XPath的支持
(一)什么是XPath
要从 XML 文档中提取信息,最快捷简单的办法就是在程序中嵌入 XPath 表达式。XPath是一种为查询 XML 文档而设计的查询语言。
(二)XPath选择节点时常用的路径表达式
第一种形式
/AAA/DDD/BBB: 表示一层一层的,AAA下面的DDD下面的BBB
第二种形式
//BBB: 表示第二层中只要名称是BBB,都得到
第三种形式
/*: 所有元素
第四种形式
BBB[1]: 表示第一个BBB元素
BBB[last()]:表示最后一个BBB元素
第五种形式
//BBB[@id]: 表示第二层中只要BBB元素上面有id属性,都得到
第六种形式
//BBB[@id='b1'] 表示第二层中名称是BBB,上面有id属性,并且id的属性值是b1的标签
(三)在DOM4J里面提供了两个方法,用来支持XPath
selectNodes("xpath表达式"):获取多个节点
selectSingleNode("xpath表达式"):获取一个节点
(四)DOM4J和XPath结合的实例(需要外部jar包)
操作一:获取所有的name标签
public static void selectAllName() {
//创建解析器对象
SAXReader saxReader = new SAXReader();
//获取解析后的document对象
Document doc = saxReader.read("src/zuobiao/testDom4j/person.xml");
//document对象使用selectNodes()
List names = doc.selectNodes("//name"); //因为XPath也可以获取属性,所以返回值统一为Node
//获取每个name标签的文本值
for(Node name:names){
System.out.println(name.getText());
}
}
操作二:获取第一个p1标签下面的name标签的文本值
public static void selectSingleName(){
//创建解析器对象
SAXReader saxReader = new SAXReader();
//获取解析后的document对象
Document doc = saxReader.read("src/zuobiao/testDom4j/person.xml");
//获取第一个p1标签下面的name标签
Node name = doc.selectSingleNode("//p1[@id='aaa']/name");
//获取文本值
System.out.println(name.getText());
}
Java新手,若有错误,欢迎指正!