在使用Java解析XML文档之前,我们先来了解了解什么是XML。
XML即可扩展的标记语言,可以定义语义标记(标签),是元标记语言。XML不像超文本标记语言HTML,HTML只能使用规定的标记,对于XML,用户可以定义自己需要的标记。XML(eXtensible Markup Language)和HTML(Hyper Text Markup Language)师出同门,都是从SGML(Standard Generalized Markup Language)延伸而出的标记语言。
一、解析数据之前,先创建一个XML文档
<?xml version="1.0" encoding="UTF-8"?> <books> <book isbn="223"> <title>三体</title> <author>刘慈欣</author> <price>59</price> </book> <book isbn="456"> <title>失控</title> <author>KK</author> <price>99</price> </book> <book isbn="789"> <title>冰与火</title> <author>乔治马丁</author> <price>129</price> </book> </books>可以看到,XML的编写与HTML相比,用户可以自定义标签,当然,标签的自定义也需要符合面向对象编程中的逻辑思想。
二、DOM解析原理
DOM,Document Object Model,文档对象模型。DOM是html和xml文档的编程接口规范,和平台、语言是无关的。利用dom规范,能够实现dom 文档和xml之间的相互转换,遍历、操作相应dom文档的内容。
DOM规范的核心就是树模型。
此外,JDOM是Java和DOM的结合体。JDOM 致力于建立一个完整的基于 Java 平台的、通过 Java 代码来访问、操作并输出 XML 数据。JDOM是用Java语言读、写、操作XML的新API函数。
DOM解析的原理如下图所示。
三、利用Eclipse创建一个Java项目,创建一个与XML文档相对应的类Book.java,如下:
public class Book { // 书版本号 private String isbn; // 书标题 private String title; // 书作者 private String author; // 书价格 private int price; public Book() { } /** * 构造方法 * * @param isbn * 版本号 * @param title * 标题 * @param author * 作者 * @param price * 价格 */ public Book(String isbn, String title, String author, int price) { super(); this.isbn = isbn; this.title = title; this.author = author; this.price = price; } /** * 获得书版本号 * * @return 版本号 */ public String getIsbn() { return isbn; } /** * 设置书版本号 * * @param isbn * 版本号 */ public void setIsbn(String isbn) { this.isbn = isbn; } /** * 获得书标题名字 * * @return 标题 */ public String getTitle() { return title; } /** * 设置书标题名字 * * @param title * 标题名字 */ public void setTitle(String title) { this.title = title; } /** * 获得书的作者名字 * * @return 作者名字 */ public String getAuthor() { return author; } /** * 设置书的作者名字 * * @param author * 作者名字 */ public void setAuthor(String author) { this.author = author; } /** * 获得书的价格 * * @return 价格 */ public int getPrice() { return price; } /** * 设置书的价格 * * @param price * 价格 */ public void setPrice(int price) { this.price = price; } /** * 重写Object继承下来的toString方法,用于将书的字段变成字符串对象 */ @Override public String toString() { return "Book [isbn=" + isbn + ", title=" + title + ", author=" + author + ", price=" + price + "]"; } }
四、将第一步中的book.xml放置在该项目的目录下,便于java中使用相对路径找到该文件
五、创建一个包含main(主方法)的主类,用于解析book.xml文档,为其创建一个readXML的静态方法,因为要在main方法中进行调用,具体代码如下:
public class RWTest { public static void main(String[] args) { readXML(); } private static void readXML() { // 1.获得解析器工厂 DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); try { // 2.通过工厂获得解析器 DocumentBuilder builder = factory.newDocumentBuilder(); // 3.指定要解析的xml文件 File file = new File("book.xml"); // 4.解析数据:file ----> doc(树形结构) Document doc = builder.parse(file); // 创建一个列表用来保存book信息 List<Book> list = new ArrayList<>(); /* * 节点 Node 1 元素节点 Element 2 属性节点 Attr 3 文本节点 Text */ // 通过标签取该xml文件中所有的Book标签,返回一个链表 NodeList nodeList = doc.getElementsByTagName("book"); // 解析每一个book元素,并将解析的数据存放到Book对象中 for (int i = 0; i < nodeList.getLength(); i++) { // 从nodeList中获得结点元素 Element eBook = (Element) nodeList.item(i); Attr aIsbn = eBook.getAttributeNode("isbn"); String isbn = aIsbn.getValue(); Element eTitle = (Element) eBook.getElementsByTagName("title").item(0); String title = eTitle.getTextContent(); String author = eBook.getElementsByTagName("author").item(0).getFirstChild().getNodeValue(); String strPrice = eBook.getElementsByTagName("price").item(0).getTextContent(); int price = Integer.parseInt(strPrice); // 将解析的数据存储到Book对象 Book book = new Book(isbn, title, author, price); // 将book对象存放到list列表中 list.add(book); // System.out.println(eTitle.getTextContent()); } // 输出list for (Book b : list) { System.out.println(b); } } catch (ParserConfigurationException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (SAXException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } } }