7、DOM解析

DOM解析

非官方,不在jdk中。
使用步骤:
    1)导入dom4j的核心包。 dom4j-1.6.1.jar
    2)编写Dom4j读取xml文件代码

示例:

public static void main(String[] args) {
        try {
            //1.创建一个xml解析器对象
            SAXReader reader = new SAXReader();
            //2.读取xml文档,返回Document对象
            Document doc = reader.read(new File("./src/contact.xml"));

            System.out.println(doc);
        } catch (DocumentException e) {
            e.printStackTrace();
            throw new RuntimeException(e);
        }

    }

Domj4读取API:
类型:

节点:
    Iterator  Element.nodeIterator();  //获取当前标签节点下的所有子节点

标签:
     Element  Document.getRootElement();  //获取xml文档的根标签     
     Element   ELement.element("标签名") //指定名称的第一个子标签
     Iterator<Element> Element.elementIterator("标签名");// 指定名称的所有子标签
     List<Element>   Element.elements(); //获取所有子标签

属性:
    String   Element.attributeValue("属性名") //获取指定名称的属性值
    Attribute    Element.attribute("属性名");//获取指定名称的属性对象 
            Attribute.getName()  //获取属性名称
            Attibute.getValue()  //获取属性值
    List<Attribute>  Element.attributes();  //获取所有属性对象
    Iterator<Attribute>     Element.attibuteIterator(); //获取所有属性对象
文本:
    Element.getText();  //获取当前标签的文本
    Element.elementText("标签名") //获取当前标签的指定名称的子标签的文本内容

修改API

增加: 
        DocumentHelper.createDocument()  增加文档
        addElement("名称")  增加标签
        addAttribute("名称",“值”)  增加属性
修改:
        Attribute.setValue("值")  修改属性值
        Element.addAtribute("同名的属性名","值")  修改同名的属性值
        Element.setText("内容")  修改文本内容
删除
        Element.detach();  删除标签  
        Attribute.detach();  删除属性

读案例

dom4j读取xml文件内容

public class Demo2 {

    /** * 得到节点信息 */
    @Test
    public void test1() throws Exception{
        //1.读取xml文档,返回Document对象
        SAXReader reader = new SAXReader();
        Document doc = reader.read(new File("./src/contact.xml"));

        //2.nodeIterator: 得到当前节点下的所有子节点对象(不包含孙以下的节点)
        Iterator<Node> it = doc.nodeIterator();
        while(it.hasNext()){//判断是否有下一个元素
            Node node = it.next();//取出元素
            String name = node.getName();//得到节点名称
            //System.out.println(name);

            //System.out.println(node.getClass());
            //继续取出其下面的子节点
            //只有标签节点才有子节点
            //判断当前节点是否是标签节点
            if(node instanceof Element){
                Element elem = (Element)node;
                Iterator<Node> it2 = elem.nodeIterator();
                while(it2.hasNext()){
                    Node n2 = it2.next();
                    System.out.println(n2.getName());
                }
            }
        }
    }

    /** * 遍历xml文档的所有节点 * @throws Exception */
    @Test
    public void test2() throws Exception{
        //1.读取xml文档,返回Document对象
        SAXReader reader = new SAXReader();
        Document doc = reader.read(new File("./src/contact.xml"));

        //得到根标签
        Element rooElem = doc.getRootElement();

        getChildNodes(rooElem);

    }

    /** * 获取传入的标签下的所有子节点 * @param elem */
    private void getChildNodes(Element elem){
        System.out.println(elem.getName());

        //得到子节点
        Iterator<Node> it = elem.nodeIterator();
        while(it.hasNext()){
            Node node = it.next();

            //1.判断是否是标签节点
            if(node instanceof Element){
                Element el = (Element)node;
                //递归
                getChildNodes(el);
            }
        };
    }

    /** * 获取标签 */
    @Test
    public void test3() throws Exception{
        //1.读取xml文档,返回Document对象
        SAXReader reader = new SAXReader();
        Document doc = reader.read(new File("./src/contact.xml"));

        //2.得到根标签
        Element  rootElem = doc.getRootElement();
        //得到标签名称
        String name = rootElem.getName();
        System.out.println(name);

        //3.得到当前标签下指定名称的第一个子标签
        /* Element contactElem = rootElem.element("contact"); System.out.println(contactElem.getName()); */

        //4.得到当前标签下指定名称的所有子标签
        /* Iterator<Element> it = rootElem.elementIterator("contact"); while(it.hasNext()){ Element elem = it.next(); System.out.println(elem.getName()); } */

        //5.得到当前标签下的的所有子标签
        List<Element> list = rootElem.elements();
        //遍历List的方法
        //1)传统for循环 2)增强for循环 3)迭代器
        /*for(int i=0;i<list.size();i++){ Element e = list.get(i); System.out.println(e.getName()); }*/

    /* for(Element e:list){ System.out.println(e.getName()); }*/
        /* Iterator<Element> it = list.iterator(); //ctrl+2 松开 l while(it.hasNext()){ Element elem = it.next(); System.out.println(elem.getName()); }*/

        //获取更深层次的标签(方法只能一层层地获取)
        Element nameElem = doc.getRootElement().
                    element("contact").element("name");
        System.out.println(nameElem.getName());

    }

    /** * 获取属性 */
    @Test
    public void test4() throws Exception{
        //1.读取xml文档,返回Document对象
        SAXReader reader = new SAXReader();
        Document doc = reader.read(new File("./src/contact.xml"));

        //获取属性:(先获的属性所在的标签对象,然后才能获取属性)
        //1.得到标签对象
        Element contactElem = doc.getRootElement().element("contact");
        //2.得到属性
        //2.1 得到指定名称的属性值
        /* String idValue = contactElem.attributeValue("id"); System.out.println(idValue); */

        //2.2 得到指定属性名称的属性对象
        /*Attribute idAttr = contactElem.attribute("id"); //getName: 属性名称 getValue:属性值 System.out.println(idAttr.getName() +"=" + idAttr.getValue());*/

        //2.3 得到所有属性对象,返回LIst集合
        /*List<Attribute> list = contactElem.attributes(); //遍历属性 for (Attribute attr : list) { System.out.println(attr.getName()+"="+attr.getValue()); }*/

        //2.4 得到所有属性对象,返回迭代器
        Iterator<Attribute> it = contactElem.attributeIterator();
        while(it.hasNext()){
            Attribute attr = it.next();
            System.out.println(attr.getName()+"="+attr.getValue());
        }

    }

    /** * 获取文本 */
    @Test
    public void test5() throws Exception{
        //1.读取xml文档,返回Document对象
        SAXReader reader = new SAXReader();         
        Document doc = reader.read(new File("./src/contact.xml"));
        /** * 注意: 空格和换行也是xml的内容 */
        String content = doc.getRootElement().getText();
        System.out.println(content);
        //获取文本(先获取标签,再获取标签上的文本)
        Element nameELem = 
            doc.getRootElement().element("contact").element("name");
        //1. 得到文本
        String text = nameELem.getText();
        System.out.println(text);

        //2. 得到指定子标签名的文本内容
        String text2 = 
            doc.getRootElement().element("contact").elementText("phone");
        System.out.println(text2);

    }

}

完整读取xml文档内容

public class Demo3 {

    @Test
    public void test() throws Exception{
        //读取xml文档
        SAXReader reader = new SAXReader();
        Document doc = 
                reader.read(new File("./src/contact.xml"));

        //读取根标签
        Element rootELem = doc.getRootElement();

        StringBuffer sb = new StringBuffer();

        getChildNodes(rootELem,sb);

        System.out.println(sb.toString());

    }

    /** * 获取当前标签的所有子标签 */
    private void getChildNodes(Element elem,StringBuffer sb){
        //System.out.println(elem.getName());

        //开始标签
        sb.append("<"+elem.getName());

        //得到标签的属性列表
        List<Attribute> attrs = elem.attributes();
        if(attrs!=null){
            for (Attribute attr : attrs) {
                //System.out.println(attr.getName()+"="+attr.getValue());
                sb.append(" "+attr.getName()+"=\""+attr.getValue()+"\"");
            }
        }
        sb.append(">");

        //得到文本
        //String content = elem.getText();
        //System.out.println(content);
        Iterator<Node> it = elem.nodeIterator();
        while(it.hasNext()){
            Node node = it.next();

            //标签
            if(node instanceof Element){
                Element el = (Element)node;
                getChildNodes(el,sb);
            }

            //文本
            if(node instanceof Text){
                Text text = (Text)node;
                sb.append(text.getText());
            }
        }

        //结束标签
        sb.append("</"+elem.getName()+">"); 
    }
}

把xml文档信息封装到对象中

public class Demo4 {

        public static void main(String[] args) throws Exception{
            List<Contact> list = new ArrayList<Contact>();

            //读取xml,封装对象
            SAXReader reader = new SAXReader();
            Document doc = reader.read(new File("./src/contact.xml"));
            //读取contact标签
            Iterator<Element> it = doc.getRootElement().elementIterator("contact");
            while(it.hasNext()){
                Element elem = it.next();
                //创建Contact(自己创建的对象)
                Contact contact = new Contact();
                contact.setId(elem.attributeValue("id"));
                contact.setName(elem.elementText("name"));
                contact.setAge(elem.elementText("age"));
                contact.setPhone(elem.elementText("phone"));
                contact.setEmail(elem.elementText("email"));
                contact.setQq(elem.elementText("qq"));
                list.add(contact);
            }

            for (Contact contact : list) {
                System.out.println(contact);
            }   
        }
}

写案例

/** * 讨论写出内容到xml文档的细节 */
public class Demo2 {

    /** * @param args */
    public static void main(String[] args) throws Exception{
        Document doc = new SAXReader().read(new File("./src/contact.xml"));
        //指定文件输出的位置
        FileOutputStream out = new FileOutputStream("e:/contact.xml");
        /** * 1.指定写出的格式 */
        OutputFormat format = OutputFormat.createCompactFormat(); //紧凑的格式.去除空格换行.项目上线的时候
        //OutputFormat format = OutputFormat.createPrettyPrint(); //漂亮的格式.有空格和换行.开发调试的时候
        /** * 2.指定生成的xml文档的编码 * 同时影响了xml文档保存时的编码和xml文档声明的encoding的编码(xml解析时的编码) * 结论: 使用该方法生成的xml文档避免中文乱码问题。 */
        format.setEncoding("utf-8");
        //1.创建写出对象
        XMLWriter writer = new XMLWriter(out,format);
        //2.写出对象
        writer.write(doc);
        //3.关闭流
        writer.close();
    }
}
/** * 修改xml内容 * 增加:文档,标签 ,属性 * 修改:属性值,文本 * 删除:标签,属性 * */
public class Demo3 {
    /** * 增加:文档,标签 ,属性 */
    @Test
    public void test1() throws Exception{
        /** * 1.创建文档 */
        Document doc = DocumentHelper.createDocument();
        /** * 2.增加标签 */
        Element rootElem = doc.addElement("contactList");
        //doc.addElement("contactList");
        Element contactElem = rootElem.addElement("contact");
        contactElem.addElement("name");
        /** * 3.增加属性 */
        contactElem.addAttribute("id", "001");
        contactElem.addAttribute("name", "eric");

        //把修改后的Document对象写出到xml文档中
        FileOutputStream out = new FileOutputStream("e:/contact.xml");
        OutputFormat format = OutputFormat.createPrettyPrint();
        format.setEncoding("utf-8");
        XMLWriter writer = new XMLWriter(out,format);
        writer.write(doc);
        writer.close();
    }

    /** * 修改:属性值,文本 * @throws Exception */
    @Test
    public void test2() throws Exception{
        Document doc = new SAXReader().read(new File("./src/contact.xml"));

        /** * 方案一: 修改属性值 1.得到标签对象 2.得到属性对象 3.修改属性值 */
        //1.1 得到标签对象
        /* Element contactElem = doc.getRootElement().element("contact"); //1.2 得到属性对象 Attribute idAttr = contactElem.attribute("id"); //1.3 修改属性值 idAttr.setValue("003"); */
        /** * 方案二: 修改属性值 */
        //1.1 得到标签对象
        /* Element contactElem = doc.getRootElement().element("contact"); //1.2 通过增加同名属性的方法,修改属性值 contactElem.addAttribute("id", "004"); */
        /** * 修改文本 1.得到标签对象 2.修改文本 */
        Element nameElem = doc.getRootElement().
            element("contact").element("name");
        nameElem.setText("李四");
        FileOutputStream out = new FileOutputStream("e:/contact.xml");
        OutputFormat format = OutputFormat.createPrettyPrint();
        format.setEncoding("utf-8");
        XMLWriter writer = new XMLWriter(out,format);
        writer.write(doc);
        writer.close();
    }
    /** * 删除:标签,属性 * @throws Exception */
    @Test
    public void test3() throws Exception{
        Document doc = new SAXReader().read(new File("./src/contact.xml"));

        /** * 1.删除标签 1.1 得到标签对象 1.2 删除标签对象 */
        // 1.1 得到标签对象
        /* Element ageElem = doc.getRootElement().element("contact") .element("age"); //1.2 删除标签对象 ageElem.detach(); //ageElem.getParent().remove(ageElem); */
        /** * 2.删除属性 2.1得到属性对象 2.2 删除属性 */
        //2.1得到属性对象
        //得到第二个contact标签
        Element contactElem = (Element)doc.getRootElement().
            elements().get(1);
        //2.2 得到属性对象
        Attribute idAttr = contactElem.attribute("id");
        //2.3 删除属性
        idAttr.detach();
        //idAttr.getParent().remove(idAttr);
        FileOutputStream out = new FileOutputStream("e:/contact.xml");
        OutputFormat format = OutputFormat.createPrettyPrint();
        format.setEncoding("utf-8");
        XMLWriter writer = new XMLWriter(out,format);
        writer.write(doc);
        writer.close();
    }
}
/*1.使用dom4j的api来生成以下的xml文件 <Students> <Student id="1"> <name>张三</name> <gender>男</gender> <grade>计算机1班</grade> <address>广州天河</address> </Student> <Student id="2"> <name>李四</name> <gender>女</gender> <grade>计算机2班</grade> <address>广州越秀</address> </Student> </Students> 2.修改id为2的学生的姓名,改为“王丽” 3.删除id为2的学生*/
public class Demo4 {

    /** * 1.生成指定xml文档 * @throws Exception */
    @Test
    public void test1() throws Exception{
        //1.内存创建xml文档
        Document doc = DocumentHelper.createDocument();

        //2.写入内容
        Element rootElem = doc.addElement("Students");

        //2.1 增加标签
        Element studentElem1 = rootElem.addElement("Student");
        //2.2 增加属性
        studentElem1.addAttribute("id", "1");
        //2.3 增加标签,同时设置文本
        studentElem1.addElement("name").setText("张三");
        studentElem1.addElement("gender").setText("男");
        studentElem1.addElement("grade").setText("计算机1班");
        studentElem1.addElement("address").setText("广州天河");
        //2.1 增加标签
        Element studentElem2 = rootElem.addElement("Student");
        //2.2 增加属性
        studentElem2.addAttribute("id", "2");
        //2.3 增加标签,同时设置文本
        studentElem2.addElement("name").setText("李四");
        studentElem2.addElement("gender").setText("女");
        studentElem2.addElement("grade").setText("计算机2班");
        studentElem2.addElement("address").setText("广州越秀");
        //3.内容写出到xml文件
        //3.1 输出位置
        FileOutputStream out = new FileOutputStream("e:/student.xml");
        //3.2 指定格式
        OutputFormat format = OutputFormat.createPrettyPrint();
        // 设置编码
        format.setEncoding("utf-8");
        XMLWriter writer = new XMLWriter(out,format);
        //3.3 写出内容
        writer.write(doc);
        //3.4关闭资源
        writer.close();

    }

    /** * 2.修改id为2的学生姓名 * @throws Exception */
    @Test
    public void test2() throws Exception{
        //1.查询到id为2的学生
        Document doc = new SAXReader().read(new File("e:/student.xml"));
        //1.1 找到所有的Student标签
        Iterator<Element> it = doc.getRootElement().elementIterator("Student");
        while(it.hasNext()){
            Element stuElem = it.next();
            //1.2 查询id为id的学生标签
            if(stuElem.attributeValue("id").equals("2")){
                stuElem.element("name").setText("王丽");
                break;
            }
        }


        //3.1 输出位置
        FileOutputStream out = new FileOutputStream("e:/student.xml");
        //3.2 指定格式
        OutputFormat format = OutputFormat.createPrettyPrint();
        // 设置编码
        format.setEncoding("utf-8");
        XMLWriter writer = new XMLWriter(out,format);
        //3.3 写出内容
        writer.write(doc);
        //3.4关闭资源
        writer.close();
    }

    /** * 3.删除id为2的学生 * @throws Exception */
    @Test
    public void test3() throws Exception{
        //1.查询到id为2的学生
        Document doc = new SAXReader().read(new File("e:/student.xml"));
        //1.1 找到所有的Student标签
        Iterator<Element> it = doc.getRootElement().elementIterator("Student");
        while(it.hasNext()){
            Element stuElem = it.next();
            //1.2 查询id为id的学生标签
            if(stuElem.attributeValue("id").equals("2")){
                //1.3 删除该学生标签
                stuElem.detach();
                break;
            }
        }
        //3.1 输出位置
        FileOutputStream out = new FileOutputStream("e:/student.xml");
        //3.2 指定格式
        OutputFormat format = OutputFormat.createPrettyPrint();
        // 设置编码
        format.setEncoding("utf-8");
        XMLWriter writer = new XMLWriter(out,format);
        //3.3 写出内容
        writer.write(doc);
        //3.4关闭资源
        writer.close();
    }
}

你可能感兴趣的:(7、DOM解析)