*eXtensible Markup Language:可扩展标记型语言
**标记型语言:html是标记型语言
-也是使用标签来操作
**可扩展:
-html里面的标签是固定,每个标签都有特定的含义 <h1> <br/> <hr/>
-标签可以自己定义,可以写中文的标签 <person></person、<猫></猫>
*xml用途
**html是用于显示数据,xml也可以显示数据(不是主要功能)
**xml主要功能,为了存储数据
*xml是w3c组织发布的技术
*xml有两个版本 1.0 1.1
-使用都是1.0版本,(1.1版本不能向下兼容)
*不同的系统之间传输数据
**qq之间数据的传输
**画图分析过程
*用来表示生活中有关系的数据
*经常用在文件配置
*比如现在连接数据库 肯定知道数据库的用户名和密码,数据名称
*如果修改数据库的信息,不需要修改源代码,只要修改配置文件就可以了
(1)xml的文档声明(***)
*创建一个文件 后缀名是 .xml
*如果写xml,第一步 必须要有 一个文档声明(写了文档声明之后,表示写xml文件的内容)
**<?xml version="1.0" encoding="gbk"?>
***文档声明必须写在 第一行第一列
*属性
-version:xml的版本 1.0(使用) 1.1
-encoding:xml编码 gbk utf-8 iso8859-1(不包含中文)
-standalone:是否需要依赖其他文件yes/no
*xml的中文乱码问题解决
**画图分析乱码问题
**保存时候的编码和设置打开时候的编码一致,不会出现乱码
(2)定义元素(标签)(***)
(3)定义属性(***)
(4)注释(***)
(5)特殊字符(***)
(6)CDATA区(了解)
(7)PI指令(了解)
**标签定义
**标签定义有开始必须要有结束:<person></person>
**标签没有内容,可以在标签内结束 ; <aa/>
**标签可以嵌套,必须要合理嵌套
***合理嵌套<aa><bb></bb></aa>
***不合理嵌套<aa><bb></aa></bb>: 这种方式是不正确的
**一个xml中,只能有一个根标签,其他标签都是这个标签下面的标签
**在xml中把空格和换行都当成内容来解析,
****下面这两段代码含义是不一样的
*<aa>1111111</aa>
*<aa>
11111111111
</aa>
**xml标签可以是中文
**xml中标签的名称规则
(1)xml代码区分大小写
<p><P>:这两个标签是不一样的
(2)xml的标签不能以数字和下划线(_)开头
<2a><_aa>: 这样是不正确的
(3)xml的标签不能以xml、XML、Xml等开头
<xmla><XmlB> <XMLC>: 这些都是不正确的
(4)xml的标签不能包含空格和冒号
<ab> <b:c> : 这些是不正确的
*html是标记型文档,可以有属性
*xml也是标记型文档,可以有属性
*<person id1="aaa" id2="bbb"></person>
**属性定义的要求
(1)一个标签上可以有多个属性
<personid1="aaa" id2="bbb"></person>
(2)属性名称不能相同
<personid1="aaa" id1="bbb"></person>:这个是不正确,不能有两个id1
(3)属性名称和属性值之间使用= ,属性值使用引号包起来 (可以是单引号,也可以是双引号 )
(4)xml属性的名称规范和元素的名称规范一致
*写法 <!-- xml的注释 -->
**注意的地方
****注释不能嵌套
<!-- <!-- --> -->
<!--<!-- <sex>nv</sex>--> -->
**注释也不能放到第一行,第一行第一列必须放文档声明
*如果想要在xml中现在 a<b ,不能正常显示,因为把<当做标签
*如果就想要显示,需要对特殊字符 < 进行转义
**< <
> >
*可以解决多个字符都需要转义的操作 if(a<b && b<c && d>f) {}
*把这些内容放到CDATA区里面,不需要转义了
**写法
<![CDATA[内容 ]]>
-代码
<![CDATA[<b>if(a<b && b<c && d>f) {}</b> ]]>
**把特殊字符,当做文本内容,而不是标签
*可以在xml中设置样式
*写法:<?xml-stylesheet type="text/css" href="css的路径"?>
*设置样式,只能对英文标签名称起作用,对于中文的标签名称不起作用的。
**xml的语法的总结
所有 XML 元素都须有关闭标签
XML标签对大小写敏感
XML必须正确地嵌套顺序
XML文档必须有根元素(只有一个)
XML的属性值须加引号
特殊字符必须转义 --- CDATA
XML中的空格、回车换行会解析时被保留
*为什么需要约束?
**比如现在定义一个person的xml文件,只想要这个文件里面保存人的信息,比如name age等,但是如果在xml文件中
写了一个标签<猫>,发现可以正常显示,因为符合语法规范。但是猫肯定不是人的信息,xml的标签是自定义的,需要技术来
规定xml中只能出现的元素,这个时候需要约束。
*xml的约束的技术 : dtd约束 和 schema约束 (看懂)
*创建一个文件 后缀名 .dtd
步骤:
(1)看xml中有多少个元素 ,有几个元素,在dtd文件中写几个<!ELEMENT>
(2)判断元素是简单元素还是复杂元素
-复杂元素:有子元素的元素
<!ELEMENT元素名称 (子元素)>
-简单元素:没有子元素
<!ELEMENT元素名称(#PCDATA)>
(3)需要在xml文件中引入dtd文件
<!DOCTYPE根元素名称 SYSTEM"dtd文件的路径">
**打开xml文件使用浏览器打开的,浏览器只负责校验xml的语法,不负责校验约束
**如果想要校验xml的约束,需要使用工具(myeclipse工具)
**打开myeclipse开发工具
***创建一个项目 day05
***在day05的src目录下面创建一个xml文件和一个dtd文件
***当xml中引入dtd文件之后,比如只能出现name age,多写了一个a,会提示出错
(1)引入外部的dtd文件
<!DOCTYPE根元素名称 SYSTEM"dtd路径">
(2)使用内部的dtd文件
-<!DOCTYPE 根元素名称 [
<!ELEMENT person (name,age)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
]>
(3)使用外部的dtd文件(网络上的dtd文件)
<!DOCTYPE根元素 PUBLIC"DTD名称""DTD文档的URL">
-后面学到框架 struts2使用配置文件 使用外部的dtd文件
- <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTDStruts Configuration 2.0//EN"
"http://struts.apache.org/dtds/struts-2.0.dtd">
*语法:<!ELEMENT 元素名 约束>
*简单元素:没有子元素的元素
<!ELEMENT name (#PCDATA)>
***(#PCDATA): 约束name是字符串类型
***EMPTY : 元素为空(没有内容)
-<sex></sex>
***ANY:任意
*复杂元素:
<!ELEMENT person (name,age,sex,school)>
-子元素只能出现一次
*<!ELEMENT 元素名称 (子元素)>
*表示子元素出现的次数
+: 表示一次或者多次
?:表示零次或者一次
*:表示零次或者多次
*子元素直接使用逗号进行隔开,
**表示元素出现的顺序
*子元素直接使用|隔开
**表示元素只能出现其中的任意一个
*语法:<!ATTLIST 元素名称
属性名称 属性类型 属性的约束
>
*属性值类型
-CDATA: 字符串
- <!ATTLIST birthday
ID1CDATA #REQUIRED
>
-枚举 :表示只能在一定的范围内出现值,但是只能每次出现其中的一个
**红绿灯效果
**(aa|bb|cc)
-<!ATTLIST age
ID2(AA|BB|CC) #REQUIRED
>
-ID: 值只能是字母或者下划线开头
-<!ATTLIST name
ID3ID #REQUIRED
>
*属性的约束
-#REQUIRED:属性必须存在
-#IMPLIED:属性可有可无
-#FIXED: 表示一个固定值 #FIXED"AAA"
-属性的值必须是设置的这个固定值
-<!ATTLIST sex
ID4CDATA #FIXED "ABC"
>
-直接值
*不写属性,使用直接值
*写了属性,使用设置那个值
-<!ATTLIST school
ID5CDATA "WWW"
>
*语法:<!ENTITY 实体名称 "实体的值">
***<!ENTITY TEST "HAHAHEHE">
***使用实体 &实体名称; 比如 &TEST;
**注意
*定义实体需要写在内部dtd里面,
如果写在外部的dtd里面,有某些浏览器下,内容得不到
*xml是标记型文档
*js使用dom解析标记型文档?
-根据html的层级结构,在内存中分配一个树形结构,把html的标签,属性和文本都封装成对象
-document对象、element对象、属性对象、文本对象、Node节点对象
*xml的解析方式(技术):dom 和 sax
**画图分析使用dom和sax解析xml过程
***dom解析和sax解析区别:
**dom方式解析
*根据xml的层级结构在内存中分配一个树形结构,把xml的标签,属性和文本都封装成对象
*缺点:如果文件过大,造成内存溢出
*优点:很方便实现增删改操作
**sax方式解析
*采用事件驱动,边读边解析
-从上到下,一行一行的解析,解析到某一个对象,返回对象名称
*缺点:不能实现增删改操作
*优点:如果文件过大,不会造成内存溢出,方便实现查询操作
*想要解析xml,首先需要解析器
**不同的公司和组织提供了 针对dom和sax方式的解析器,通过api方式提供
***sun公司提供了针对dom和sax解析器 jaxp
***dom4j组织,针对dom和sax解析器 dom4j(*** 实际开发中****)
***jdom组织,针对dom和sax解析器 jdom
**jaxp是javase的一部分
**jaxp解析器在jdk的javax.xml.parsers包里面
**四个类:分别是针对dom和sax解析使用的类
***dom:
DocumentBuilder : 解析器类
-这个类是一个抽象类,不能new,
此类的实例可以从DocumentBuilderFactory.newDocumentBuilder() 方法获取
-一个方法,可以解析xml parse("xml路径") 返回是 Document 整个文档
-返回的Document是一个接口,父节点是Node,如果在Document里面找不到想要的方法,到Node里面去找
-在document里面方法
getElementsByTagName(Stringtagname)
--这个方法可以得到标签
--返回集合 NodeList
createElement(StringtagName)
--创建标签
createTextNode(Stringdata)
--创建文本
appendChild(NodenewChild)
--把文本添加到标签下面
removeChild(NodeoldChild)
--删除节点
getParentNode()
--获取父节点
NodeListlist
-getLength() 得到集合的长度
-item(int index)下标取到具体的值
for(inti=0;i<list.getLength();i++) {
list.item(i)
}
getTextContent()
-得到标签里面的内容
DocumentBuilderFactory: 解析器工厂
-这个类也是一个抽象类,不能new
newInstance()获取DocumentBuilderFactory 的实例。
***sax:
SAXParser:解析器类
SAXParserFactory:解析器工厂
***查询xml中所有的name元素的值
*步骤
//查询所有name元素的值
/*
* 1、创建解析器工厂
DocumentBuilderFactory.newInstance();
* 2、根据解析器工厂创建解析器
builderFactory.newDocumentBuilder();
* 3、解析xml返回document
* Document document = builder.parse("src/person.xml");
* 4、得到所有的name元素
使用document.getElementsByTagName("name");
* 5、返回集合,遍历集合,得到每一个name元素
-遍历 getLength()item()
-得到元素里面值 使用 getTextContent()
* */
*** 查询xml中第一个name元素的值
* 步骤
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml,返回document
*
* 4、得到所有name元素
* 5、使用返回集合,里面方法 item,下标获取具体的元素
NodeList.item(下标):集合下标从0开始
* 6、得到具体的值,使用 getTextContent方法
*
* */
***在第一个p1下面(末尾)添加 <sex>nv</sex>
**步骤
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml,返回document
*
*4、得到第一个p1
* - 得到所有p1,使用item方法下标得到
* 5、创建sex标签createElement
* 6、创建文本 createTextNode
* 7、把文本添加到sex下面 appendChild
* 8、把sex添加到第一个p1下面 appendChild
*
* 9、回写xml
//获取Transformer工厂实例
TransformerFactory transformerFactory = TransformerFactory.newInstance();
//通过Transformer工厂获取Transformer实例(Transformer此抽象类的实例能够将源树转换为结果树)
Transformer transformer = transformerFactory.newTransformer();
//使用transform(Source xmlSource, ResultoutputTarget) 将 XML Source 转换为 Result
transformer.transform(newDOMSource(document), new StreamResult("src/person.xml"));
* */
***修改第一个p1下面的sex内容是nan
**步骤
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml,返回document
*
* 4、得到sex item方法
* 5、修改sex里面的值
***setTextContent方法
*
* 6、回写xml
* */
***删除<sex>nan</sex>节点
**步骤
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml,返回document
*
* 4、获取sex元素
* 5、获取sex的父节点 使用getParentNode方法
* 6、删除使用父节点删除 removeChild方法
*
* 7、回写xml
* */
**把xml中的所有元素名称打印出来
**步骤
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml,返回document
*
* ====使用递归实现=====
* 4、得到根节点
* 5、得到根节点子节点
* 6、得到根节点子节点的子节点
* */
**遍历的方法
//递归遍历的方法
privatestatic void list1(Node node) {
//判断是元素类型时候才打印
if(node.getNodeType()== Node.ELEMENT_NODE) {
System.out.println(node.getNodeName());
}
//得到一层子节点
NodeList list = node.getChildNodes();
//遍历list
for(inti=0;i<list.getLength();i++) {
//得到每一个节点
Node node1 = list.item(i);
//继续得到node1的子节点
//node1.getChildNodes()
list1(node1);
}
}