//Java解析xml、解析xml四种方法、DOM、SAX、JDOM、DOM4j、XPath
//DOM
//其处理方式是将 XML 整个作为类似树结构的方式读入内存中以便操作及解析,因此支持应用程序对 XML 数据的内容和结构进行修改,
//但是同时由于其需要在处理开始时将整个 XML 文件读入到内存中去进行分析,
//因此其在解析大数据量的 XML 文件时会遇到类似于内存泄露以及程序崩溃的风险,请对这点多加注意。
//XML DOM将XML文档作为树结构,树结构称为一个节点树
//1)Element类:
//是Node类最主要的子对象,被广泛使用,在元素中可以包含属性,因而Element中有存取其属性的方法。
//2)Node类:
//Node对象是DOM中最基本的对象,代表了文档树中的抽象节点。但在实际使用中很少会直接使用Node对象,而是使用Node对象的子对象Element,Attr,Text等。
//3)NodeList类:
//代表了一个包含一个或者多个Node的列表,根据操作可以将其简化的看做为数组。
//先创建一个实例 , 1. DocumentBuilderFactory.newInstance()
//在创建一个DocumentBuilder, 2. DocumentBuilder builder = dbf.newDocumentBuilder();
//用classLoader 来得到resource stream , 一个InputStream
//用 DocumentBuilder builder 来解析inputStream,得到一个Document , 因为Dom就是 一个树状的数据集
//doc.getDocumentElement() 得到root Element , element 是最主要的使用对象,是Node类的子对象
// NodeList tileNodeList = root.getElementsByTagName("Tile"); 得到root节点 某个 element Tag的所有element
// System.err.println("\t" + controlNode.getAttributes().getNamedItem("name").getNodeValue()); 得到节点的 属性,根据属性的名字来得到具体的值
// System.err.print("\t" + controlNode.getAttributes().getNamedItem("flag").getNodeValue());
// NodeList childList = tileNode.getElementsByTagName("page"); //还可以得到某个tag的所有节点,当然是在tileNode节点之下的。
// pageNode.getTextContent() 还能得到某个节点的text内容 <page name="p2">page2</page>
//修改节点
// 新增节点
//Element addCollege = doc.createElement("college"); 创建一个Element ,
//addCollege.setAttribute("name", "c5"); 塞入一个属性
//root.appendChild(addCollege); 父节点加入子节点
//Text text = doc.createTextNode("text"); 创建text属性, 放入子节点中
//addCollege.appendChild(text);
//保存dom
//TransformerFactory transFactory = TransformerFactory.newInstance(); 修改也有个修改的factory
//Transformer transFormer = transFactory.newTransformer(); 从factory 得到一个 transformer
//DOMSource domSource = new DOMSource(doc); 把修改好的document 放入一个DOMSource
//File file = new File("src/dom-modify.xml"); 生成一个文件 ,
//if (file.exists()) {
// file.delete();
//}
//file.createNewFile();
//FileOutputStream out = new FileOutputStream(file); 得到一个文件的输出流
//StreamResult xmlResult = new StreamResult(out); 用StreamResult 来包装这个输出流
//transFormer.transform(domSource, xmlResult); 用transformer 来转化这个 DOMSource 和 实际路径的文件。 把dom 放入 物理文件了。
import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerConfigurationException;
import javax.xml.transform.TransformerException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.w3c.dom.Text;
import org.xml.sax.SAXException;
public class DomXmlParser {
public static void main(String[] args) {
read();
//write();
}
public static void read() {
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
try {
DocumentBuilder builder = dbf.newDocumentBuilder();
InputStream in = DomXmlParser.class.getClassLoader().getResourceAsStream("XmlSample.xml");
Document doc = builder.parse(in);
// root
Element root = doc.getDocumentElement();
if (root == null) return;
System.err.println(root.getAttribute("name"));
// all 'Control' node
NodeList controlNodeList = root.getElementsByTagName("Control");
//Control node 数目
System.out.println(controlNodeList.getLength());
for(int i = 0; i < controlNodeList.getLength(); i++) {
Node controlNode = controlNodeList.item(i);
if (controlNode != null && controlNode.getNodeType() == Node.ELEMENT_NODE) {
System.err.println("\t" + controlNode.getAttributes().getNamedItem("name").getNodeValue());
System.err.print("\t" + controlNode.getAttributes().getNamedItem("flag").getNodeValue());
}
}
NodeList tileNodeList = root.getElementsByTagName("Tile");
for(int i = 0; i < tileNodeList.getLength(); i++) {
Element tileNode = (Element)tileNodeList.item(i);
NodeList childList = tileNode.getElementsByTagName("page");
for(int j = 0; j < childList.getLength(); j++){
Element pageNode = (Element)childList.item(j);
System.out.println(pageNode.getAttributes().getNamedItem("name").getNodeValue());
System.out.println("value = " + pageNode.getTextContent());
}
}
} catch (ParserConfigurationException e) {
e.printStackTrace();
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (SAXException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
public static void write() {
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
try {
DocumentBuilder builder = dbf.newDocumentBuilder();
InputStream in = DomXmlParser.class.getClassLoader().getResourceAsStream("XmlSample.xml");
Document doc = builder.parse(in);
// root <university>
Element root = doc.getDocumentElement();
if (root == null) return;
// 修改属性
root.setAttribute("name", "tsu");
NodeList collegeNodes = root.getChildNodes();
if (collegeNodes != null) {
for (int i = 0; i <collegeNodes.getLength() - 1; i++) {
// 删除节点
Node college = collegeNodes.item(i);
if (college.getNodeType() == Node.ELEMENT_NODE) {
String collegeName = college.getAttributes().getNamedItem("name").getNodeValue();
if ("c1".equals(collegeName) || "c2".equals(collegeName)) {
root.removeChild(college);
} else if ("c3".equals(collegeName)) {
Element newChild = doc.createElement("class");
newChild.setAttribute("name", "c4");
college.appendChild(newChild);
}
}
}
}
// 新增节点
Element addCollege = doc.createElement("college");
addCollege.setAttribute("name", "c5");
root.appendChild(addCollege);
Text text = doc.createTextNode("text");
addCollege.appendChild(text);
// 将修改后的文档保存到文件
TransformerFactory transFactory = TransformerFactory.newInstance();
Transformer transFormer = transFactory.newTransformer();
DOMSource domSource = new DOMSource(doc);
File file = new File("src/dom-modify.xml");
if (file.exists()) {
file.delete();
}
file.createNewFile();
FileOutputStream out = new FileOutputStream(file);
StreamResult xmlResult = new StreamResult(out);
transFormer.transform(domSource, xmlResult);
System.out.println(file.getAbsolutePath());
} catch (ParserConfigurationException e) {
e.printStackTrace();
} catch (SAXException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
} catch (TransformerConfigurationException e) {
e.printStackTrace();
} catch (TransformerException e) {
e.printStackTrace();
}
}
}
<?xml version="1.0" encoding="UTF-8"?>
<Struts>
<Control name="c1" flag="true">firstControl</Control>
<View name="v1">firstView</View>
<Tile>
<page name="p1">page1</page>
<page name="p2">page2</page>
</Tile>
</Struts>