dom4j-1.6.1.jar链接 https://pan.baidu.com/s/1exfHA5d8_hTfRLbkR7yUTg
1.申明xml文件
2.申明dtd
2.1申明内部dtd
注:+表示出现1次或多次 ?表示0次1次 *表示出现任意次
注:#REQUIRED表示必须出现 #IMPLIED表示不是必须的
]>
语文
张三
12.2
数学
李四
15
2.2申明外部dtd
a.创建一个独立的dtd文件
b.在xml中引入外部dtd
3.XML的生成与解析
3.1解析XML
public class XmlTest {
public static void main(String[] args) throws Exception {
//1.用于创建SAXReader对象,用于读取xml文件
SAXReader raeder = new SAXReader();
//2.读取xml文件,获取Document对象
Document doc = raeder.read(new File("src/book.xml"));
//3.获取根元素
Element root = doc.getRootElement();
//4.获取根元素所有子元素
Iterator it = root.elementIterator();
while(it.hasNext()){
//取出元素
Element e = (Element) it.next();
//获取id属性
Attribute a = e.attribute("id");
//取出子元素
Element name = e.element("name");
Element author = e.element("author");
Element price = e.element("price");
}
System.out.println(root);
}
}
3.1生成XML
public class XmlTest2 {
public static void main(String[] args) throws Exception {
//1.通过DocumentHelper生成Document对象
Document doc = DocumentHelper.createDocument();
//2.添加并得到根元素
Element e = doc.addElement("books");
//3.为根元素添加子元素
Element book = e.element("book");
//4.添加属性
book.addAttribute("id","b01");
//5.添加元素
Element name = book.addElement("name");
Element author = book.addElement("author");
Element price = book.addElement("price");
//6.为元素添加文本
name.addText("语文");
author.addText("张三");
price.addText("15");
//7.将doc输出到xml文件
OutputFormat format = OutputFormat.createPrettyPrint();
XMLWriter writer = new XMLWriter(new FileWriter(new File("src/book2.xml")),format);
writer.write(doc);
//8.关闭资源
writer.close();
}
}
long start = System.currentTimeMillis();
常用方法:startElement、endElement、characters
SAX方式解析XML文档
SAXParserFactory spf = SAXParserFactory.newInstance();
2)通过SAX解析工厂得到解析器对象
SAXParser sp = spf.newSAXParser();
3)通过解析器对象得到一个XML的读取器
XMLReader xmlReader = sp.getXMLReader();
4)设置读取器的事件处理器
xmlReader.setContentHandler(new BookParserHandler());
5)解析xml文件
xmlReader.parse("book.xml");
DOM4J解析XML文档
1)Dom4j是一个简单、灵活的开放源代码的库。Dom4j是由早期开发JDOM的人分离出来而后独立开发的。与JDOM不同的是,dom4j使用接口和抽象基类,虽然Dom4j的API相对要复杂一些,但它提供了比JDOM更好的灵活性。
2)Dom4j是一个非常优秀的Java XML API,具有性能优异、功能强大和极易使用的特点。现在很多软件采用的Dom4j,例如Hibernate,包括sun公司自己的JAXM也用了Dom4j。
3)使用Dom4j开发,需下载dom4j相应的jar文件。
Document对象
DOM4j中,获得Document对象的方式有三种:
1.读取XML文件,获得document对象
SAXReader reader = new SAXReader();
Document document = reader.read(new File("input.xml"));
2.解析XML形式的文本,得到document对象.
String text = "
Document document = DocumentHelper.parseText(text);
3.主动创建document对象.
Document document = DocumentHelper.createDocument();
//创建根节点
Element root = document.addElement("members");
节点对象
1.获取文档的根节点.
Element root = document.getRootElement();
2.取得某个节点的子节点.
Element element=node.element(“书名");
3.取得节点的文字
String text=node.getText();
4.取得某节点下所有名为“member”的子节点,并进行遍历.
List nodes = rootElm.elements("member");
for (Iterator it = nodes.iterator(); it.hasNext();) {
Element elm = (Element) it.next();
// do something
}
5.对某节点下的所有子节点进行遍历.
for(Iterator it=root.elementIterator();it.hasNext();){
Element element = (Element) it.next();
// do something
}
6.在某节点下添加子节点.
Element ageElm = newMemberElm.addElement("age");
7.设置节点文字.
element.setText("29");
8.删除某节点.
//childElm是待删除的节点,parentElm是其父节点
parentElm.remove(childElm);
9.添加一个CDATA节点.
Element contentElm = infoElm.addElement("content");
contentElm.addCDATA(diary.getContent());
节点对象属性
1.取得某节点下的某属性
Element root=document.getRootElement();
//属性名name
Attribute attribute=root.attribute("size");
2.取得属性的文字
String text=attribute.getText();
3.删除某属性
Attribute attribute=root.attribute("size");
root.remove(attribute);
4.遍历某节点的所有属性
Element root=document.getRootElement();
for(Iterator it=root.attributeIterator();it.hasNext();){
Attribute attribute = (Attribute) it.next();
String text=attribute.getText();
System.out.println(text);
}
5.设置某节点的属性和文字.
newMemberElm.addAttribute("name", "sitinspring");
6.设置属性的文字
Attribute attribute=root.attribute("name");
attribute.setText("sitinspring");
将文档写入XML文件
1.文档中全为英文,不设置编码,直接写入的形式.
XMLWriter writer = new XMLWriter(new FileWriter("output.xml"));
writer.write(document);
writer.close();
2.文档中含有中文,设置编码格式写入的形式.
OutputFormat format = OutputFormat.createPrettyPrint();
// 指定XML编码
format.setEncoding("GBK");
XMLWriter writer =
new XMLWriter(newFileWriter("output.xml"),format);
writer.write(document);
writer.close();
DTD(Document Type Definition),全称为文档类型定义。
DTD约束的两种方式
1 DTD约束即可以作为一个单独的文件编写,也可以在XML文件内编写。
2. 在xml文件内编写DTD
书架 [
书架 (书+)>
书 (书名,作者,售价)>
书名 (#PCDATA)>
作者 (#PCDATA)>
售价 (#PCDATA)>
]>
<书架>
<书>
<书名>Java书名>
<作者>xx作者>
<售价>85元售价>
书>
...
书架>
XML文件使用 DOCTYPE 声明语句来指明它所遵循的DTD文件,DOCTYPE声明语句有两种形式:
1.当引用的文件在本地时,采用如下方式:
例如:
2.当引用的文件是一个公共的文件时,采用如下方式:
例如:
"-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN" "http://java.sun.com/dtd/web-app_2_3.dtd">
DTD约束语法细节
元素定义
在DTD文档中使用ELEMENT声明一个XML元素,语法格式如下所示:
元素类型可以是元素内容、或类型
如为元素内容:则需要使用()括起来,如
如为元素类型,则直接书写,DTD规范定义了如下几种类型:
EMPTY:用于定义空元素,例如
ANY:表示元素内容为任意类型。
元素内容中可以使用如下方式,描述内容的组成关系
1)元素内容使用空白符分隔,表示出现顺序没有要
2)用逗号分隔,表示内容的出现顺序必须与声明时一致。
3)用|分隔,表示任选其一,即多个只能出现一个
在元素内容中也可以使用+、*、?等符号表示元素出现的次数:
+: 一次或多次 (书+)
?: 0次或一次 (书?)
*: 0次或多次 (书*)
也可使用圆括号( )批量设置,例
属性定义
xml文档中的标签属性需通过ATTLIST为其设置属性
语法格式:
属性名1 属性值类型 设置说明
属性名2 属性值类型 设置说明
……
>
属性声明举例:
类别 CDATA #REQUIRED
颜色 CDATA #IMPLIED
>
对应XML文件:
<商品 类别="服装" 颜色="黄色">…商品>
<商品 类别="服装">…商品>
设置说明:
#REQUIRED:必须设置该属性
#IMPLIED:可以设置也可以不设置
#FIXED:说明该属性的取值固定为一个值,在 XML 文件中不能为该属性设置其它值。但需要为该属性提供这个值
直接使用默认值:在 XML 中可以设置该值也可以不设置该属性值。若没设置则使用默认值。
举例:
姓名 CDATA #IMPLIED
年龄 CDATA #IMPLIED
联系信息 CDATA #REQUIRED
网站职务 CDATA #FIXED "页面作者"
个人爱好 CDATA "上网"
>
常用属性值类型
CDATA:表示属性值为普通文本字符串。
ENUMERATED
ID
ENTITY(实体)
属性值类型àENUMERATED
属性的类型可以是一组取值的列表,在 XML 文件中设置的属性值只能是这个列表中的某个值(枚举)
]>
<购物篮>
<肉 品种="鱼肉"/>
<肉 品种="牛肉"/>
<肉/>
购物篮>
属性值类型à ID
表示属性的设置值为一个唯一值。
ID 属性的值只能由字母,下划线开始,不能出现空白字符
]>
<联系人列表>
<联系人 编号="1">
<姓名>张三姓名>
联系人>
<联系人 编号="2">
<姓名>李四姓名>
联系人>
联系人列表>
实体定义
实体用于为一段内容创建一个别名,以后在XML文档中就可以使用别名引用这段内容了。
在DTD定义中,一条语句用于定义一个实体。
实体可分为两种类型:引用实体和参数实体。
实体定义à引用实体
引用实体主要在 XML 文档中被应用
语法格式:
:直接转变成实体内容
引用方式:
&实体名称;
举例:
……
©right;
实体定义à参数实体
参数实体被 DTD 文件自身使用
语法格式:
引用方式:
%实体名称;
举例1:
举例2:
" id ID #IMPLIED
account CDATA #REQUIRED "
>
...
XML Schema
XML Schema 也是一种用于定义和描述 XML 文档结构与内容的模式语言,其出现是为了克服 DTD 的局限性
XML Schema VS DTD:
targetNamespace="http://www. gtalent.com" elementFormDefault="qualified">
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=“http://www. gtalent.com book.xsd">
名称空间的概念
此处使用gtalent来指向声明的名称,以便于后面对名称空间的引用。
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=“http://www.gtalent.com book.xsd"> 注意,在使用schemaLocation属性时,也需要指定该属性来自哪里 使用默认名称空间 xmlns="URI" <书架 xmlns="http://www.it315.org/xmlbook/schema" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=“http://www.gtalent.com book.xsd"> <书> <书名>Java 书名> <作者>xx作者> <售价>38.00元售价> 书> <书架>