XML

XML即可扩展标记语言(eXtensible Markup Language)。标记是指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种信息的文章等。如何定义这些标记,既可以选择国际通用的标记语言,比如HTML,也可以使用象XML这样由相关人士自由决定的标记语言,这就是语言的可扩展性。XML是从SGML中简化修改出来的。它主要用到的有XML、XSL和XPath等。

XML是一种标记语言,很类似HTML

XML的设计宗旨是传输数据,而非显示数据

XML标签没有被预定义。您需要自行定义标签。

XML被设计为具有自我描述性。

XML是W3C的推荐标准



DOM4J 对xml进行操作

解析xml文件

    SAXReader reader=new SAXReader();
    Document doc=reader.read("book.xml");

获取根节点

    Element root = doc.getRootElement();

遍历

List list=root.elements();//获取所有的子节点
    for (Element ele : list) {      
        List child = ele.elements();
        for (Element element : child) {
            element.getName();//获取标签的名称
            element.getText();//获取标签的内容
            element.getNodeType();//获取标签的类型 1 代表元素类型  3 代表文本类型
        }
    }

Element ele=root.elementByID("1001");//根据ID快速获取指定的元素
Element pwd=ele.element("标签名");//获取指定标签名的元素

保存

OutputFormat format=OutputFormat.createPrettyPrint();//创建一个漂亮的格式
XMLWriter writer=new XMLWriter(new FileOutputStream("book.xml"),format);
writer.write(doc);//将doc对象写入的xml文件中

添加

Element root=doc.getRootElement();
Element author=root.addElement("book");//添加一个book的子元素

删除

Element root=doc.getRootElement();
Element ele=doc.elementByID("b2");
root.remove(ele);//删除指定的子节点,需要通过父节点来删除  
ele.detach();//删除所有的子节点,可以自己删除自己

Element book=root.elementByID("b1");
Element name=book.element("name");
name.setText("西游记");



XPath
使用XPath对xml文件的元素进行导航,需要导包:jaxen.jar

Node password=doc.selectSingleNode("//user[3]/aa/password");//选出单个节点

List list=doc.selectNodes("//user");//选出多个节点
for (Node node : list) {
    System.out.println(node.getName());
}

//表示//后所有的节点
*表示所有
aaa[1]表示第一个
aaa[last()]表示最后一个
bbb[@id="one"]表示属性id为one 的bbb节点



属性

Attribute name = ele.attribute("name");//获取单个指定的属性
List list = ele.attributes("name");//获取所有指定的属性

Element ele=root.elementByID("user");
ele.addAttribute("sex", "men");

Element ele=root.elementByID("user");
ele.removeAttribute("sex");

Attribute name = ele.attribute("name");//获取单个指定的属性
name.setText("lisi");


Schema和DTD的区别

Schema是对XML文档结构的定义和描述,其主要的作用是用来约束XML文件,并验证XML文件有效性。DTD的作用是定义XML的合法构建模块,它使用一系列的合法元素来定义文档结构。它们之间的区别有下面几点:

   1、Schema本身也是XML文档,DTD定义跟XML没有什么关系,Schema在理解和实际应用有很多的好处。

   2、DTD文档的结构是“平铺型”的,如果定义复杂的XML文档,很难把握各元素之间的嵌套关系;Schema文档结构性强,各元素之间的嵌套关系非常直观。

  3、DTD只能指定元素含有文本,不能定义元素文本的具体类型,如字符型、整型、日期型、自定义类型等。Schema在这方面比DTD强大。

  4、Schema支持元素节点顺序的描述,DTD没有提供无序情况的描述,要定义无序必需穷举排列的所有情况。Schema可以利用xs:all来表示无序的情况。

 5、对命名空间的支持。DTD无法利用XML的命名空间,Schema很好满足命名空间。并且,Schema还提供了include和import两种引用命名空间的方法。


XML语法规则
所有 XML 元素都须有关闭标签  
注释:您也许已经注意到 XML 声明没有关闭标签。这不是错误。声明不属于XML本身的组成部分。它不是 XML 元素,也不需要关闭标签。
XML 标签对大小写敏感
XML 必须正确地嵌套
XML 文档必须有根元素
XML 的属性值须加引号
实体引用

XML_第1张图片

XML 中的注释

在 XML 中,空格会被保留
XML 以 LF 存储换行

你可能感兴趣的:(XML)