XML学习(二)

1、上期回忆

XML基础

        1)XML的作用

                1.1 作为软件配置文件

                1.2 作为小型的"数据库"

        2)XML语法(由w3c组织规定的)

                标签:

                        标签名不能以数字开头,中间不能有空格,区分大小写。有且仅有一个根标签。

                属性:        

                        可有多个属性,但属性值必须用引号(单引号或双引号)包含,但不能省略,也不能单双混用。

                文档声明:

                            

                        encoding="utf-8": 打开或解析xml文档时的编码

                        注意:

                    保存xml文档时的编码 和 解析xml文档时的编码要保持一致,才能避免中文乱码问题!

        3)XML解析

                程序读取或操作xml文档

                两种解析方式: DOM解析 vs SAX解析

                DOM解析原理:一次性把xml文档加载成Document树,通过Document对象得到节点对象,通过节点对象访问xml文档内容(标签,属性,文本,注释)。

                Dom4j工具(基于DOM解析原理):

                        读取xml文档:

                             Document doc = new SAXReader().read("xml文件");

                        节点:

                                nodeIterator(); 所有节点

                        标签:

                                element("名称") 指定名称的第一个子标签对象

                                elementIterator("名称"); 指定名称的所有子标签对象

                                elements(); 所有子标签对象

                        属性:

                                attributeValue("名称") 指定名称的属性值

                                attribute("名称") 指定名称的属性对象

                                        getName() 属性名称

                                        getValue() 属性值

                                atributeIterator() 所有属性对象(Iterator)

                                attributes() 所有属性对象(List)

                        文本:

                                getText() 得到当前标签的文本

                                elementText("子标签名称") 得到子标签的文本

本文内容:Dom4J修改xml 、 xPath技术 、SAX解析 、XML约束学习

2、Dom4j修改xml文档

2.1 写出内容到xml文档

                XMLWriter writer = new XMLWriter(OutputStream, OutputForamt)

                wirter.write(Document);

2.2 修改xml文档的API

            增加:

                    DocumentHelper.createDocument(); 增加文档

                    addElement("名称") ;增加标签

                    addAttribute("名称","值") 增加属性

            修改:

                    Attribute.setValue("值") 修改属性值

                    Element.addAtribute("同名的属性名","值") 修改同名的属性值

                    Element.setText("内容") 修改文本内容

            删除:

                    Element.detach(); 删除标签

                    Attribute.detach(); 删除属性

3 xPath技术       

3.1 xPath作用

当使用dom4j查询比较深的层次结构的节点(标签,属性,文本),比较麻烦。而基于xPath解析xml文档,可以快速获取所需的节点对象。

3.2 在dom4j中如何使用xPath技术

                1)导入xPath支持jar包 。 jaxen-1.1-beta-6.jar

                2)使用xpath方法

                        List selectNodes("xpath表达式"); 查询多个节点对象

                        Node selectSingleNode("xpath表达式"); 查询一个节点对象

3.3 xPath语法

  • / 绝对路径 表示从xml的根位置开始或子元素(一个层次结构)
  • // 相对路径 表示不分任何层次结构的选择元素。
  • * 通配符 表示匹配所有元素
  •  [] 条件 表示选择什么条件下的元素
  • @ 属性 表示选择属性节点
  • and 关系 表示条件的与关系(等价于&&)
  • text() 文本 表示选择文本内容

4 SAX解析

                DOM解析原理:一次性把xml文档加载进内存,然后在内存中构建Document树

                                对内存要求比较要。    

                        缺点: 不适合读取大容量的xml文件,容易导致内存溢出。

                SAX解析原理: 加载一点,读取一点,处理一点。对内存要求比较低。

4.1 SAX解析工具    

                    SAX解析工具- Sun公司提供的。内置在jdk中。org.xml.sax.*

                    核心的API:

                         SAXParser类: 用于读取和解析xml文件对象

                          parse(File f, DefaultHandler dh)方法: 解析xml文件

                        参数一: File:表示 读取的xml文件。

                       参数二: DefaultHandler: SAX事件处理程序。使用DefaultHandler的子类

    例如:{

                    1.创建SAXParser对象

               SAXParser parser=SAXParserFactory.newInstance().newSAXParser();

               2.调用parse方法

                     parser.parse(new File("./src/contact.xml"), new MyDefaultHandler());

    }

                DefaultHandler类的API:

                        void startDocument() : 在读到文档开始时调用

                        void endDocument() :在读到文档结束时调用

                        void startElement(String uri, String localName, String qName, Attributes attributes) :读到开始标签时调用                

                        void endElement(String uri, String localName, String qName) :读到结束标签时调用

                        void characters(char[] ch, int start, int length) : 读到文本内容时调用

5 总结

xml:可扩展的标记语言。

xml:用于存储数据。

 

        XML是严格区分大小写的。

        XML标签也是成对出现的。

        xml有且只能有一个根节点

5.1 通过代码创建XML文档 (C#语言)

        引用命名空间:System.Xml

        //创建XML文档对象:

XmlDocument doc=new XmlDocument();

//创建第一行描述信息,并添加到doc中

XmlDeclaration dec=doc.CreateXmlDeclaration(”1.0”,”utf-8”,null);

doc.AppendChild(dec);

//创建根节点,并添加到doc中

XmlElement books=doc.CreateElement(”Books”);

doc.AppendChild(books);

//给根节books点创建子节点,并添加到books根节点中

XmlElement book1=doc.CreateElement(”Book”);

books.AppendChild(book1);

//给子节点book1创建子节点,并添加到book1子节点中

XmlElement name1=doc.CreateElement(”Name”);

name1.InnerText=”C#编程”;

book1.AppendChild(name1);

 

XmlElement price1=doc.CreateElement(”Price”);

price1.InnerText=”100”;

book1.AppendChild(price1);

 

XmlElement des1=doc.CreateElement(”Des”);

des1.InnerText=”好看”;

book1.AppendChild(des1);

// 保存文件

doc.Save(“Books.xml”); 

 

5.2 DOM解析与SAX解析对比 

DOM解析

SAX解析

原理: 一次性加载xml文档,不适合大容量的文件读取

原理: 加载一点,读取一点,处理一点。适合大容量文件的读取

DOM解析可以任意进行增删改成

SAX解析只能读取

DOM解析任意读取任何位置的数据,甚至往回读

SAX解析只能从上往下,按顺序读取,不能往回读

DOM解析面向对象的编程方法(Node,Element,Attribute),Java开发者编码比较简单。

SAX解析基于事件的编程方法。java开发编码相对复杂。

 

你可能感兴趣的:(XML学习(二))