xml xpath dta笔记

 

xml:
    有且只有一个根元素
    默认utf-8 如果是中文且为不是utf-8的必须指定编码
    声明的编码必须和文档的内容保持一致
    well-formed XML :是否符合xml语法
    valid xml:验证此xml是否符合dtd规则
    
dtd定义了哪些:
        1.元素定义规则,只能有哪些标签
        2.元素间关系的的定义,标签出现的顺序,位置
        3.使用的实体或符号规则 &lt &copy
        
//行内dtd写法
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE root[
    <!ELEMENT root EMPTY>
]>
<root></root>
//外部dtd写法 ,对于公共dtd如果浏览器能识别名称,则不会在去请求dtd文件
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE root SYSTEM "test.dtd">
<root />

//test.dtd
<!ELEMENT root EMPTY>


PCDATA:解析
CDATA:不解析,这样就可以不用在乎里面的特殊字符

元素声明使用<!ELEMENT 元素名称 (元素内容)>或<!ELEMENT 元素名称 类别>的语法<!ELEMENT root EMPTY> //EMPTY关键字表示元素是个空元素
    <!ELEMENT root ANY> //ANY关键字表示元素中可以出现任何内容,也可以为空
    //下面这个声明表示root中可以有文本,也可以是空
    <!ELEMENT root (#PCDATA)> //()表示一个分组,其中是放的允许在元素出现的内容,#PCDATA表示文本
    <!ELEMENT root (child)> //child是子元素的名称,这个声明表示root中必须且只能有一个child元素
    <!ELEMENT root (child1,child2)> //以逗号分隔,表示子元素依次出现
    <!ELEMENT root (child1|child2)> //竖线与"OR"的意思相近,表示root元素中只能出现child1或child2
    <!ELEMENT root (child?)> //root中child子元素可以出现一次,也可以不出现
    <!ELEMENT root (child+)> //root中child子元素至少出现一次
    <!ELEMENT root (child*)> //root中child子元素可以出现任意次数或不出现
    <!ELEMENT root (child,(a,b))> //()还可以嵌套,这里表示root元素中第一次子元素必须是child
    //紧接着是a或b
    <!ELEMENT root (child,(a,b)+)> //*,?,+这些量词可作用于分组,这里表示root元素中第一次子元素必须是child
    //紧接着是a或b出现一次或多次
    
    
属性声明使用<!ATTLIST 元素名称 属性名称 属性类型 默认值>的语法.示例如下:
类型     描述
CDATA     值为字符数据 (character data)
(en1|en2|..)     此值是枚举列表中的一个值
ID     值为唯一的 id
IDREF     值为另外一个元素的 id
IDREFS     值为其他 id 的列表
NMTOKEN     值为合法的 XML 名称
NMTOKENS     值为合法的 XML 名称的列表
ENTITY     值是一个实体
ENTITIES     值是一个实体列表
NOTATION     此值是符号的名称
xml:     值是一个预定义的 XML 值

值     属性的默认值.该属性可以出现,也可以不出现,当没有明确指定该属性时,属性值使用默认值
#REQUIRED     属性值是必需的
#IMPLIED     属性不是必需的,可以出现,可以不出现
#FIXED value     属性值是固定的.属性可有可无,但有的时候,其值必须是value

    <!ATTLIST img src CDATA #REQUIRED> //img元素的src属性是必须的,值为字符串
    <!ATTLIST script type CDATA "text/javascript"> //script元素的type属性默认值是text/javascript
    <!ATTLIST div id ID #IMPLIED> //div元素的id属性是唯一的ID标识,可有可无
    <!ATTLIST input type(text|radio|checkbox) "text"> //input元素的type属性是三个值中的一个,默认值是text
    <!ATTLIST label for IDREF #IMPLIED> //label元素的for属性是页面中另一个元素的ID
    
实体的定义:
    //一般实体定义
    <!ENTITY abc "ABCabcABC"> //内部实体
    <!ENTITY abc SYSTEM "abc.ent"> //外部私有实体
    <!ENTITY test PUBLIC "-//AjaxLife//ENTITIES TEST 1 for XML//EN" "test.ent"> //外部公共实体
    //实体引用
    <abc>&abc;</abc>
    
    //参数实体  只在dtd文件中用
    <!ENTITY % abc "root">
    <!ELEMENT %abc; (child)>//这句将声明元素root,具有一个子元素child
    
xml中引入样式表:<?xml-stylesheet type="text/css" href="http://test.cm/test.css"?>

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/css" href="http://test.cm/test.css"?>
<!DOCTYPE root [
    <!ELEMENT root ANY>
    <!ELEMENT node ANY>
    <!ATTLIST node
        name (a|b|c) 'a'
        age  CDATA '24'
        id ID #IMPLIED
        for IDREF 'f'
        fors IDREFS 'a'
    >
    <!ENTITY  sjk "songjiankang">
    
]>
<root>
    <node id="f"></node>
    <node id="a"></node>
    <node for="a"></node>
    <node fors="a f">&sjk;</node>
</root>


xpath:
    body//p 后代元素
    body/p  子元素

    /root  {选取root
    root {选取root
    child {空,因为child不是document的子元素
    //child {选取两个child元素,//表示后代
    //@attr {选取attr属性节点
    /root/child//desc {返回child的后代元素desc

    /root/child[3] {选取root元素的第三个child子元素,注意,这和数组下标不一样,从1开始计数
    //child[@attr] {选取所有具有属性attr的child元素
    //child[@attr="val"]/desc {选取所有属性attr的值为val的child元素的子元素desc
    //child[desc] {选取所有的有desc子元素的child
    //child[position()>3]  {position()是XPath中的一个函数,表示节点的位置
    //child[@attr>12] {XPath表达式还可以进行数值比较,该表达式将选取attr属性值大于12的child元素
    //child[last()] {last()函数返回节点列表最后的位置,该表达式将选取最后一个child元素

    
    * ,和CSS中的选择符一样,这将匹配任何元素节点
    @* ,匹配任何属性节点
    node() ,匹配任何类型的节点

    /root/* {选取根元素下面的所有子元素
    /root/node() {选取根元素下面的所有节点,包括文本节点
    //* {选取文档中所有元素
    //child[@*] {选取所有具有属性的child元素
    //@*  {选取所有的属性节点


  

  xsl:扩展样式表语言,主要用来对xml文档进行格式化
  包括:1.xslt:将一个xml文件转换成另一种格式的xml文件或xhtml文件
    2.xpath
    3.xsl-fo 用来格式化xml

 

 

 

你可能感兴趣的:(xpath)