解析XML
(一) 解析XML方式
Xml解析的方式有很多主要有DOM解析,和SAX解析
DOM:把整个xml文档看做是一个树的对象来解析
SAX: 基于事件驱动的解析方式
区别:
DOM解析:
缺点:解析的时候是首先会把xml文档当做一个document对象加载 进
去内存,当文档对象很大时,DOM解析容易内存溢出
优点:能对dom进行增删改的操作
SAX解析:
缺点:不能对dom进行增删改的操作
优点:解析的时候是一边加载,一边解析的。所以SAX解析效率较高
(二) XML解析开发包
JAXP:是SUN公司推出的解析标准实现。
Dom4J:是开源组织推出的解析开发包。(牛,大家都在用,包括SUN公司的
一些技术的实现都在用)
JDom:是开源组织推出的解析开发包。
(三) JAXP解析xml
JAXP:(Java API for XML Processing)开发包是JavaSE的一部分,它由以下几 个包及其子包组成:
org.w3c.dom:提供DOM方式解析XML的标准接口
org.xml.sax:提供SAX方式解析XML的标准接口
javax.xml:提供了解析XML文档的类
1. 利用JAXP用dom的方式解析xml
工具类:
/**
* 通过JAXP中dom方法解析xml
* @author Mrliu
*
*/
public class XmlUtils {
/**
* 通过xml文件的路径解析xml,并获得一个Document对象
* @param url
* @return
* @throws Exception
*/
public static Document getDocument(String url) throws Exception{
//* 创建解析器的工厂类
DocumentBuilderFactory documentbuilderfactory = DocumentBuilderFactory.newInstance();
//*通过解析器的工厂类创建解析器对象
DocumentBuilder documentbuilder = documentbuilderfactory.newDocumentBuilder();
//*解析器解析xml文件,返回document对象
Document document = documentbuilder.parse(url);
return document;
}
/**
* 对xml进行增删改操作后,对xml文件进行回显
* @param document
* @param url
* @throws Exception
*/
public static void writeXmlToFile(Document document,String url) throws Exception{
//创建回写类对象的工厂
TransformerFactory factory = TransformerFactory.newInstance();
//通过工厂创建回写类
Transformer transformer = factory.newTransformer();
//回写,由于我们只在内存中修改了dom对象,最后我们要把dom对象回写进xml文件中,才能保证修改成功
transformer.transform(new DOMSource(document),new StreamResult(new File(url)));
}
}
例子:
/**
* jaxp中dom解析xml
* @author Mrliu
*/
public class JaxpXmlParse {
public static void main(String[] args) throws Exception {
String url = "src/book2.xml";
// getElement(url);
// addElementBeforNode(url);
getAttrbuteName(url);
}
//获得整个文档的属性值
public static void getAttrbuteName(String url) throws Exception {
Document document = XmlUtils.getDocument(url);
getAttributes(document);
}
/**
* 迭代xml文件中所有的属性值
* @param node
*/
public static void getAttributes(Node node) {
//判断node对象是否有属性并且该节点是element对象
if (node.hasAttributes() && node.getNodeType() == Node.ELEMENT_NODE) {
//拿到该节点的属性集合
NamedNodeMap map = node.getAttributes();
for (int i = 0; i < map.getLength(); i++) {
System.out.println(map.item(i));//打印属性名=属性值
}
}
NodeList nodeList = node.getChildNodes();
for (int i = 0; i < nodeList.getLength(); i++) {
//递归查询
getAttributes(nodeList.item(i));
}
}
/**
* 在制定的节点之前添加节点
* @param url
* @throws Exception
*/
public static void addElementBeforNode(String url) throws Exception {
Document document = XmlUtils.getDocument(url);
Node parentNode = document.getElementsByTagName("persons").item(0);
Node jackNode = parentNode.getFirstChild();
// 创建一个子节点
Node tomNode = document.createElement("person");
Node nameNode = document.createElement("name");
// 设置文本的内容为tom
nameNode.setTextContent("tom");
tomNode.appendChild(nameNode);
parentNode.insertBefore(tomNode, jackNode);
// 回显 目前只是在内存中加入了子节点,还要把内存中的数据加载到硬盘中
XmlUtils.writeXmlToFile(document, url);
}
/**
* 利用jdk文档提供的方法解析xml
* @param url
* @throws Exception
*/
public static void getElement(String url) throws Exception {
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder documentbuilder = factory.newDocumentBuilder();
Document document = documentbuilder.parse(url);
NodeList nodeList = document.getElementsByTagName("person");
for (int i = 0; i < nodeList.getLength(); i++) {
Node child = nodeList.item(i);
System.out.print(child.getTextContent());
}
}
}
Book2.xml
<persons>
<person>
<id type="uuid" length="12" value="001"> 001</id>
<name from="gg"> jack</name>
<age> 18</age>
<height><![CDATA[
select * from table
]]></height>
</person>
<person>
<id type="auto" length="13" value="003"> 002</id>
<name from="fg">jim</name>
<age> 19</age>
<height>180cm</height>
</person>
</persons>
2. 利用JAXP用SAX的方式解析xml
public class JaxpXmlSaxParse {
/**
* JAXP中sax解析xml文件
* @param args
* @throws Exception
*/
public static void main(String[] args) throws Exception {
run1();
}
public static void run1() throws Exception {
SAXParserFactory factory = SAXParserFactory.newInstance();
SAXParser saxParese = factory.newSAXParser();
saxParese.parse("src/book2.xml", new myHander());
}
}
class myHander extends DefaultHandler {
//假如迭代元素 <name href="http://www.baidu.com"> 百度 </name>
private Boolean flag = false;
//元素迭代开始
@Override
public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException {
//qName代表元素的名称,attributes代表属性的集合 如:<name href=ddd">迭代标签的开始
if ("name".equals(qName)) {
flag = true;
}
}
//获取元素中的文本
@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
if (flag) {
System.out.println(new String(ch, start, length).trim());
//打印出name标签中的文本:百度
flag = false;
}
}
//元素迭代结束</name>
@Override
public void endElement(String uri, String localName, String qName)
throws SAXException {
}
}