waterwindsxu

完整理解XML领域(转)

完整理解XML领域(耗费心血,欢迎纠错)

http://my.oschina.net/xpbug/blog/104412

发表于2年前(2013-01-24 15:57) 阅读（ 3138） | 评论（ 10） 213人收藏此文章,我要收藏

3月21日深圳 OSC 源创会正在报名中，送华为海思开发板

xml java javascript

每个人都知道什么是XML,也知道它的格式.如果深入点理解如何使用XML,可能就不是每个人都知道的了. XML是一种自描述性文档,它的作用是内容的承载,和展示没有任何关系.所以,如何将XML里的数据以合理的方式取出展示,是XML编程的主要部分. 这篇文章从广度上来描述XML的一切特性.

XML有一大堆的官方文档和Spec文档以及教程.但是它们都太专业,文字太官方,又难懂,文字多,例子少,篇幅分散且跨度大. 于是需要一篇小文章,以通俗的话语以概括的角度来阐述XML领域的技术.再给几个小的example. 这就是我写这篇文章的原因.写它也是为了自我学习总结.

本文所用的代码结构如下图:

首先确定这篇文章使用的XML例子,后面所有的代码都基于此例.

 
      ? 
     
           xml 
           version 
           = 
           "1.0" 
           encoding 
           = 
           "UTF-8" 
           ?> 
          
           xml-stylesheet 
           type 
           = 
           "test/xsl" 
           href 
           = 
           "bookStore.xsl" 
           ?> 
          
           DOCTYPE 
           bookStore PUBLIC "bookStore.dtd" "bookStore.dtd"> 
          
           < 
           bookStore 
           name 
           = 
           "java" 
           xmlns 
           = 
           "http://joey.org/bookStore" 
           xmlns:audlt 
           = 
           "http://japan.org/book/audlt" 
           xmlns:xsi 
           = 
           "http://www.w3.org/2001/XMLSchema-instance" 
           xsi:noNamespaceSchemaLocation 
           = 
           "bookStore.xsd" 
           > 
          
           < 
           keeper 
           > 
          
           < 
           name 
           >Joey 
           name 
           > 
          
           keeper 
           > 
          
           < 
           books 
           > 
          
           < 
           book 
           id 
           = 
           "1" 
           > 
          
           < 
           title 
           >XML 
           title 
           > 
          
           < 
           author 
           >Steve 
           author 
           > 
          
           book 
           > 
          
           < 
           book 
           id 
           = 
           "2" 
           > 
          
           < 
           title 
           >JAXP 
           title 
           > 
          
           < 
           author 
           >Bill 
           author 
           > 
          
           book 
           > 
          
           < 
           book 
           id 
           = 
           "3" 
           audlt:color 
           = 
           "yellow" 
           > 
          
           < 
           audlt:age 
           > >18  
           audlt:age 
           > 
          
           < 
           title 
           >Love 
           title 
           > 
          
           < 
           author 
           >teacher 
           author 
           > 
          
           book 
           > 
          
           books 
           > 
          
           bookStore 
           >

XML的作用

一种文档格式.只是内容的载体.
常用来做数据存储,数据传输或者配置描述.
它不负责展示.至于里面的内容如何使用,由XML程序来控制.

XML的格式

首先第一行为XML的声明:

紧跟着可能会有DTD校验方法.

 
        ? 
       
             DOCTYPE 
             root-element SYSTEM "filename">

如果XML想依托工具自动展现,需要XML展现方法. CSS或者XSLT.

 
        ? 
       
             xml-stylesheet 
             type 
             = 
             "text/css" 
             href 
             = 
             "cd_catalog.css" 
             ?> 
            
             或者 
            
             xml-stylesheet 
             type 
             = 
             "text/xsl" 
             href 
             = 
             "simple.xsl" 
             ?>

Element所构成的树形结构.
Element上的namespace.

除了用DTD验证方法,也可以Element上使用XSD来校验XML的合法性.

 
        ? 
       
             < 
             note 
             xmlns 
             = 
             "http://www.w3schools.com" 
             xmlns:xsi 
             = 
             "http://www.w3.org/2001/XMLSchema-instance" 
             xsi:schemaLocation 
             = 
             "http://www.w3schools.com note.xsd" 
             > 
            
             ... 
            
             note 
             >

XML字符编码

XML存储时所使用的字符编码. 这个编码告诉解析程序应该使用什么编码格式来对XML解码. 为了国际通用,使用UTF-8吧. 对于纯英文,UTF8只需要一个字节来表示一个英文字符. XML的size也不会太大.

XML命名空间

命名空间语法包括声明部分默认命名xmlns=""或者指定命名xmlns:prefix="http://" 和使用部分或者.

命名空间解决了两个问题.

相同名称的标签表示不同的意义,它们各自存在与自己的命名空间中.比如即可以表示表格,也可以表示桌子. 给他们一个命名空间. 为表单,为桌子.

对既有的元素进行属性扩展或者元素扩展. 比如本文例子中的多了audlt的属性和子元素.它是对原来元素的扩展.

在Java或者JavaScript中是使用namespace的, 注意以下几点:

DOM中存在两个方法getElementsByTagName()和getElementsByTagNameNS(). 第一个方法需要使用qualified name作为参数,而第二个方法需要使用namespace和localname作为参数. 如下

?

1 2	`document.getElementsByTagNameNS(` `"http://japan.org/book/audlt"` `,` `"age"` `);` `document.getElementsByTagName(` `"audlt:age"` `);`

如果XML里面使用了namespace, 那么XSLT和XPATH也必须使用同等的namespace,否则xpath将搜索不到你想查找的元素,在java的Xpath中,需要设置NamespaceContext. 请看DOM实例和我写的XSL文件.

XML语法验证

验证XML合法性靠的是DTD或者XSD.这是XML的两个规范. XSD比DTD要新,所以也先进.

DTD

本文中的XML里面声明了DTD的引用,XML parser就会自动加载DTD来验证XML. 这需要给parser设定两个前提.一是开启了验证模式,而是明白DTD的加载位置. XML parser可以是JS,java或者browser. 加载位置可以使用PUBLIC ID或者SYSTEM ID来判断.请看下面的声明:

 
      ? 
     
           DOCTYPE 
           bookStore SYSTEM "bookStore.dtd">

上面的声明没有PUBLIC ID, 只有SYSTEM ID, SYSTEM ID=XML当前路径+"/bookStore.dtd". 可见system id是一个相对与XML的路径.

声明PUBLIC ID:

 
      ? 
     
           DOCTYPE 
           bookStore PUBLIC "bookStore.dtd" "bookStore.dtd">

PUBLIC ID也为"bookStore.dtd". 这时候,Parser会自动根据这两个ID去尝试加载DTD文件,如果加载不到,则抛出exception. JAVA中,我们可以通过实现EntityResolver接口的方法来自定义DTD的所在位置. 详情请看JAVA部分.

本文用的DTD是:

 
      ? 
     
           ELEMENT 
           bookStore (keeper, books)> 
          
           ATTLIST 
           bookStore name CDATA #REQUIRED> 
          
           ELEMENT 
           keeper (name)> 
          
           ELEMENT 
           name (#PCDATA)> 
          
           ELEMENT 
           books (book)> 
          
           ELEMENT 
           book (title, author)> 
          
           ATTLIST 
           book id ID #REQUIRED> 
          
           ELEMENT 
           title (#PCDATA)> 
          
           ELEMENT 
           author (#PCDATA)>

XSD

使用XSD来验证XML只需要一个XSD的定义文件,开启Parser的XSD验证功能. XSD的验证方法在后面的JAVA代码中可以看到. 本文使用的XSD如下:

 
      ? 
     
           xml 
           version 
           = 
           "1.0" 
           encoding 
           = 
           "UTF-8" 
           ?> 
          
           < 
           xsd:schema 
           xmlns:xsd 
           = 
           "http://www.w3.org/2001/XMLSchema" 
           > 
          
           < 
           xsd:element 
           name 
           = 
           "bookStore" 
           type 
           = 
           "bookStoreType" 
           /> 
          
           < 
           xsd:complexType 
           name 
           = 
           "bookStoreType" 
           > 
          
           < 
           xsd:sequence 
           > 
          
           < 
           xsd:element 
           name 
           = 
           "keeper" 
           type 
           = 
           "keeperType" 
           > 
           xsd:element 
           > 
          
           < 
           xsd:element 
           name 
           = 
           "books" 
           type 
           = 
           "booksType" 
           > 
           xsd:element 
           > 
          
           xsd:sequence 
           > 
          
           < 
           xsd:attribute 
           name 
           = 
           "name" 
           type 
           = 
           "xsd:string" 
           > 
           xsd:attribute 
           > 
          
           xsd:complexType 
           > 
          
           < 
           xsd:complexType 
           name 
           = 
           "keeperType" 
           > 
          
           < 
           xsd:sequence 
           > 
          
           < 
           xsd:element 
           name 
           = 
           "name" 
           type 
           = 
           "xsd:string" 
           > 
           xsd:element 
           > 
          
           xsd:sequence 
           > 
          
           xsd:complexType 
           > 
          
           < 
           xsd:complexType 
           name 
           = 
           "booksType" 
           > 
          
           < 
           xsd:sequence 
           > 
          
           < 
           xsd:element 
           name 
           = 
           "book" 
           type 
           = 
           "bookType" 
           > 
           xsd:element 
           > 
          
           xsd:sequence 
           > 
          
           xsd:complexType 
           > 
          
           < 
           xsd:complexType 
           name 
           = 
           "bookType" 
           > 
          
           < 
           xsd:sequence 
           > 
          
           < 
           xsd:element 
           name 
           = 
           "title" 
           type 
           = 
           "xsd:string" 
           > 
           xsd:element 
           > 
          
           < 
           xsd:element 
           name 
           = 
           "author" 
           type 
           = 
           "xsd:string" 
           > 
           xsd:element 
           > 
          
           xsd:sequence 
           > 
          
           < 
           xsd:attribute 
           name 
           = 
           "id" 
           type 
           = 
           "xsd:int" 
           > 
           xsd:attribute 
           > 
          
           xsd:complexType 
           > 
          
           xsd:schema 
           >

XML查询方法(XPath) 略.

XML展示方法(CSS, XSL)

如下面的代码片段所示,XML可以有stylesheet转换成其他格式, 如HTML, TXT等. stylesheet可以是css,也可以是xsl.

 
      ? 
     
           xml-stylesheet 
           type 
           = 
           "test/xsl" 
           href 
           = 
           "bookStore.xsl" 
           ?>

主流browser都已经支持这种转换格式. 除了自动转换,我们也可以使用代码对转换进行控制.我们可以用java在服务器端进行xslt的转换,也可以使用javascript在前端对xml进行xslt转换. 代码在后面均可找到. 书写xsl的时候,namespace一定要注意. xpath一定要和namespace所对应. 我所使用的XSL为:

 
      ? 
     
 
       
         
         
            
           xml 
           version 
           = 
           "1.0" 
           encoding 
           = 
           "UTF-8" 
           ?> 
          
 
           < 
           xsl:stylesheet 
           version 
           = 
           "1.0" 
          
 
                
           xmlns:xsl 
           = 
           "http://www.w3.org/1999/XSL/Transform" 
           xmlns:b 
           = 
           "http://joey.org/bookStore" 
          
 
                
           xmlns:a 
           = 
           "http://japan.org/book/audlt" 
           > 
          
 
                
           < 
           xsl:output 
           method 
           = 
           "html" 
           version 
           = 
           "1.0" 
           encoding 
           = 
           "UTF-8" 
           indent 
           = 
           "yes" 
           > 
           xsl:output 
           > 
          
 
                
           < 
           xsl:template 
           match 
           = 
           "/" 
           > 
          
 
                    
           < 
           html 
           > 
          
 
                        
           < 
           body 
           > 
          
 
                            
           < 
           h2 
           >Book Store<<< 
           xsl:value-of 
           select 
           = 
           "/b:bookStore/@name" 
           > 
           xsl:value-of 
           >>> 
           h2 
           > 
          
 
                            
           < 
           div 
           > 
          
 
                                
           There are < 
           xsl:value-of 
           select 
           = 
           "count(/b:bookStore/b:books/b:book)" 
           > 
           xsl:value-of 
           > books. 
          
 
                            
            
           div 
           > 
          
 
                            
           < 
           div 
           > 
          
 
                                
           Keeper of this store is < 
           xsl:value-of 
           select 
           = 
           "/b:bookStore/b:keeper/b:name" 
           > 
           xsl:value-of 
           > 
          
 
                            
            
           div 
           > 
          
 
                            
           < 
           xsl:for-each 
           select 
           = 
           "/b:bookStore/b:books/b:book" 
           > 
          
 
                                
           < 
           div 
           > Book: 
          
 
                                    
           < 
           span 
           >title=< 
           xsl:value-of 
           select 
           = 
           "b:title" 
           > 
           xsl:value-of 
           > 
           span 
           >; 
          
 
                                    
           < 
           span 
           >author=< 
           xsl:value-of 
           select 
           = 
           "b:author" 
           > 
           xsl:value-of 
           > 
           span 
           > 
          
 
                                    
           < 
           xsl:if 
           test 
           = 
           "@a:color" 
           > 
          
 
                                        
           < 
           span 
           style 
           = 
           "color:yellow" 
           >H Book, require age< 
           xsl:value-of 
           select 
           = 
           "a:age" 
           > 
           xsl:value-of 
           > 
           span 
           > 
          
 
                                    
            
           xsl:if 
           > 
          
 
                                
            
           div 
           > 
          
 
                            
            
           xsl:for-each 
           > 
          
 
                        
            
           body 
           > 
          
 
                    
            
           html 
           > 
          
 
                
            
           xsl:template 
           > 
          
 
            
           xsl:stylesheet 
           > 
          
 
         
  
       
 
     

XML与javascript

Javascript对XML的支持在IE和FF+Chrome上是不同的. IE使用的ActiveXObject来生成一个XML的实例.FF与Chrome等其它主流浏览器均遵循w3c规范. 生成的XML document可以使用其DOM方法对dom tree进行操作. 也可以借助框架dojo,jquery等简化操作.

下面这个例子是使用JS对XML进行XSLT转化,从而生成HTML.

 
      ? 
     
           function 
            createXMLDoc(xmlStr) { 
          
           var 
           xmlDoc; 
          
           if 
           (window.DOMParser) { 
          
           // FF Chrome 
          
           var 
           parser= 
           new 
            DOMParser(); 
          
           xmlDoc=parser.parseFromString(xmlStr, 
           "text/xml" 
           ); 
          
           }  
           else 
           if 
            (window.ActiveXObject){ 
          
           // Internet Explorer 
          
           xmlDoc= 
           new 
           ActiveXObject( 
           "Microsoft.XMLDOM" 
           ); 
          
           xmlDoc.async= 
           "false" 
           ; 
          
           xmlDoc.loadXML(xmlStr); 
          
           } 
          
           return 
           xmlDoc; 
          
           } 
          
           function 
            transform(xmlDoc, xslDoc) { 
          
           if 
           (window.XSLTProcessor) { 
          
           // chrome FF 
          
           var 
           xslp =  
           new 
            XSLTProcessor(); 
          
           xslp.importStylesheet(xslDoc); 
          
           return 
           xslp.transformToFragment(xmlDoc,document); 
          
           }  
           else 
           if 
            (window.ActiveXObject){ 
          
           // IE 
          
           return 
           xmlDoc.transformNode(xslDoc); 
          
           } 
          
           } 
          
           var 
            xmlStr =  
          
           [ 
           '' 
           , 
          
           'Joey' 
           , 
          
           '' 
           , 
          
           ' XMLSteve' 
           , 
          
           'JAXP Bill' 
           , 
          
           ' >18  Loveteacher' 
           , 
          
           '' 
           ].join( 
           '' 
           ); 
          
           var 
            xslStr =  
          
           [ 
           '' 
           , 
          
           '' 
           , 
          
           '' 
           , 
          
           '' 
           , 
          
           '' 
           , 
          
           '' 
           , 
          
           'Book Store<<>>' 
           , 
          
           'There are  books.
' 
           ,  
          
           'Keeper of this store is 
' 
           ,  
          
           '' 
           , 
          
             'Book: ' 
           , 
          
           'title=;author=' 
           , 
          
           '' 
           , 
          
           'H Book, require age' 
           , 
          
           '' 
           , 
          
           '
',
 
           '' 
           , 
          
           '' 
           , 
          
           '' 
           , 
          
           '' 
           , 
          
           '' 
           ].join( 
           '' 
           ); 
          
           var 
            xmlDoc = createXMLDoc(xmlStr); 
          
           var 
            xslDoc = createXMLDoc(xslStr); 
          
           var 
            dom = transform(xmlDoc, xslDoc); 
          
           console.log(dom.childNodes[0].outerHTML);

XML与java

Java对XML的支持被称为JAXP(Java API for XML Processing). JAXP被当做标准,放入了J2SE1.4.从此以后,JRE自带XML的处理类库. 当然,JAXP允许使用第三方的XML Parser,不同的parser有着不同的优缺点,用户可以自己选择. 但所有的Parser均必须实现JAXP所约定的Interface. 掌握JAXP,需要知道以下内容. 这些都会在后面进行描述.

JAXP的parser以及如何使用第三方parser.
XML的解析方法SAX,DOM以及STAX.
XML的写出方法STAX和XSLT.
使用XPath搜索DOM.
JAXP使用XSLT转换XML.
DOM与JDOM,DOM4J的区别.
JAXP验证XML.
JAXP支持namespace

J2SE的JAXP提供了5个包,用于支持XML.

javax.xml.parsers - 为各种第三方parser提供了接口.
org.w3c.dom - 提供了DOM类
org.xml.sax - 提供了SAX类
javax.xml.transform - 提供了XSLT的API.
javax.xml.stream - 提供了STAX的API. STAX比SAX简单,比DOM快.
javax.xml.xpath - 使用xpath对DOM进行字段查询.

每个接口与类的使用方法就不使用文字描述了,后面会用代码和注释的方式一一介绍JAXP的类库. 在描述SAX,StAX,DOM等方法之前,有必要做一个highlevel的比较. 每一个解析方法的优缺点是什么?改如何选择它们.

首先,XML解析器存在SAX, StAX和DOM, 而XML文件生成方法又有StAX和DOM. XPath是一个查询DOM的工具. XSLT是转换XML格式的工具. 如下图所示:

XML的解析从数据结构上来讲,分两大类: Streaming和Tree. Streaming又分为SAX和StAX. Tree就是DOM. SAX和StAX均是顺序解析XML,并生成读取事件.我们可以通过监听事件来得到我们想要的内容. DOM是一次性的以tree结构形式载入内存.

Streaming VS DOM

DOM需要内存.对于大文档或者多文档,DOM性能差.还有,在android手机上就少用DOM这种占内存的东东吧.
Streaming是实时性的,它没有上下文. 如果一个XML的element需要上下文才能理解,使用DOM会方便.
如果XML来自网络,我们对其结构并不明朗,使用Streaming比较好. DOM适合对XML的结构非常清楚.比如web.xml的结构就是一个人人皆知的结构.
需要对XML进行增删改查.则使用DOM.

Streaming又包含SAX和StAX, SAX是推(push)解析方法,而StAX是拉(pull)解析方法. 后面有SAX和StAX的实例.

Pull VS Push

Pull可以让我们的代码掌握主动权,在合适的时候去调用解析器继续工作. Push是被动的听从解析器只会.解析器会不停的读,并把事件push到handler中.
Pull的代码简单,小.Lib也小.
Pull可以一个线程同时解析多个文档. 因为主动权在我们.
StAX可以将一个普通的数据流伪造成一个个XML的读取事件,从而在构造成一个XML.好似DB中的View.

	SAX	StAX	DOM
API Type	Push, Streaming	Pull, Streaming	Tree, In momery
Support XPath?	No	No	Yes
Read XML	Yes	Yes	Yes
Write XML	No	Yes	Yes
CRUD	No	No	Yes
Parsing Validation (DTD, XSD)	Yes	Optional (JDK embedded Parser does not support it).	Yes

javax.xml.validation包提供了跟XML解析独立与解析过程的验证方法. 性能比不过Parsing Validation. Parsing validation指的是在解析过程中进行验证.

SAX实例

借用oracle网上的一张图来说明SAX的架构.

SAXParser是调用XMLReader的, 如果使用SAXParser,则需要传参DefaultHandler. DefaultHandler实现了上图的4个Handler接口. 你也可以直接使用XMLReader,然后调用它的parser方法.只是在parser前,需set每个Handler. SAXParser是Event-Driven设计模式, 随着读取XML的字节,随着传递event给handler来处理.

读的工作其实是有XMLReader来做的,所有的events也是XMLReader产生的.所以,将一个非XML格式的文件模拟成一个XML,只需要复写XMLReader,读取非XML文件时,发出假的Event,这样handler将会把这个文件当做一个XML来处理. 这种机制会在XSLT中用到.

关于模拟XML

SAX可以将一个非XML格式文件的读取模拟成一个XML的文件的读取.通过构造XML的读取Event. 只是SAX需要复写XMLReader.

ContentHandler

用于处理XML的各种数据类型的读取事件.这里面的事件有

setDocumentLocator. 读取
startDocument and endDocument. XML的最外层tag的开始与结束.
startPrefixMapping and endPrefixMapping. 命名空间影响范围的进入与退出.
startElement and endElement. 每个Element的开始与结束.
characters. 读取Element的text node value.

实现方式可以参考org.xml.sax.helpers.DefaultHandler.

ErrorHandler

用于处理XML解析阶段所发生的警告和错误.里面有三个方法,warning(), error()和fatalError(). waring和error用于处理XML的validation(DTD或XSD)错误.这种错误并不影响XML的解析,你可以把这种错误产生的exception压下来,而不向上抛.这样XML的解析不会被终断. fatalError是XML结构错误,这种错误无法被压制,即使我的handler不抛,Parser会向外抛exception.

DTDHandler

DTD定义中存在ENTITY和NOTATION.这都属于用户自定义属性. XML Parser无法理解用户自定义的ENTITY或者NOTATION, 于是它把这方面的验证工作交给了DTDHandler. DTDHandler里面只有2个方法:notationDecl和unparsedEntityDecl. 我们实现这两个方法来验证我们的NOTATION部分是否正确.

EntityResolver

在XML的验证段落里面提到过DTD的定位. EntityResolver可以帮助我们做这件事情. EntityResolver里面只有一个方法,叫做ResolveEntity(publicId, systemId). 每当Parser需要使用external文件的时候,就会调用这个方法. 我们可以在这个方法里面做一些预处理. 代码如下:

 
      ? 
     
           public 
            class 
           MyEntityResolver  
           implements 
           EntityResolver { 
          
           @Override 
          
           public 
           InputSource resolveEntity(String publicId, String systemId) 
          
           throws 
           SAXException, IOException { 
          
           if 
           ( 
           "bookStore.dtd" 
           .equals(publicId)) { 
          
           InputStream in =  
           this 
           .getClass().getResourceAsStream( 
           "/jaxp/resources/bookStore.dtd" 
           ); 
          
           InputSource is =  
           new 
           InputSource(in); 
          
           return 
           is; 
          
           } 
          
           return 
           null 
           ; 
          
           } 
          
           }

SAX Parser的使用

请注意里面是如何开启validation模式的. XSD有两种开启方法.

 
           public 
            class 
           MySAX { 
          
           private 
           SAXParser parser; 
          
           public 
           static 
           void 
            main(String[] args)  
           throws 
            Exception { 
          
           new 
           MySAX(); 
          
           } 
          
           public 
           MySAX()  
           throws 
            ParserConfigurationException, SAXException, IOException { 
          
           // Use "javax.xml.parsers.SAXParserFactory" system property to specify a Parser. 
          
           // java -Djavax.xml.parsers.SAXParserFactory=yourFactoryHere [...] 
          
           // If property is not specified, use J2SE default Parser. 
          
           // The default Parser is "com.sun.org.apache.xerces.internal.jaxp.SAXParserFactoryImpl". 
          
           SAXParserFactory spf = SAXParserFactory.newInstance(); 
          
           spf.setNamespaceAware( 
           true 
           ); 
          
           // Use XSD defined by JAXP 1.3, JAVA1.5 
          
           //SchemaFactory sf = SchemaFactory.newInstance("http://www.w3.org/2001/XMLSchema"); 
          
           //spf.setSchema(sf.newSchema(this.getClass().getResource("/jaxp/resources/bookStore.xsd"))); 
          
           // or Use old way defined by JAXP 1.2 
          
           // parser.setProperty("http://java.sun.com/xml/jaxp/properties/schemaLanguage","http://www.w3.org/2001/XMLSchema"); 
          
           // parser.setProperty("http://java.sun.com/xml/jaxp/properties/schemaSource", new File("schema.xsd")); 
          
           // XSD disabled, use DTD.  spf.setValidating(true);  this.parser = spf.newSAXParser();  
          
           // You can directly use SAXParser to parse XML. Or use XMLReader. 
          
           // SAXParser warps and use XMLReader internally. 
          
           // I will use XMLReader here. 
          
           //this.parser.parse(InputStrean, DefaultHandler); 
          
           XMLReader reader =  
           this 
           .parser.getXMLReader(); 
          
           reader.setContentHandler( 
           new 
           MyContentHandler()); 
          
           reader.setDTDHandler( 
           new 
           MyDTDHandler()); 
          
           reader.setErrorHandler( 
           new 
           MyErrorHandler()); 
          
           reader.setEntityResolver( 
           new 
           MyEntityResolver()); 
          
           InputStream in =  
           this 
           .getClass().getResourceAsStream( 
           "/jaxp/resources/bookStore.xml" 
           ); 
          
           InputSource is =  
           new 
           InputSource(in); 
          
           is.setEncoding( 
           "UTF-8" 
           ); 
          
           reader.parse(is); 
          
           } 
          
           }

DOM实例 + XPath

借用oracle的图片来说明DOM解析的架构.

JAVA对XML的解析标准存在DOM, JDOM, DOM4J. 有人认为JDOM和DOM4J都是DOM的另一种实现方法,这是错误的.

DOM是XML的数据模型标准,它跨越java,javascript等一切语言和平台.
JDOM和DOM4J是专门针对java的模型.它简化了DOM,更加容易使用. 比如DOM中可以包含混合元素,即texttexttest. JDOM和DOM4J只允许text. 此外,DOM的数据访问模型也非常的复杂. 如果你的XML结构简单,可以使用JDOM和DOM4J. DOM4J的性能最好.

这篇文章只讲一下DOM. DOM的code和SAX的code相似的地方有:

开启DTD或者XSD validation的方法.
都用到ErrorHandler处理parser error和EntityResolver处理external引用.
使用SAXException.但这都不意味着DomBuilder内部使用了SAXParser.

得到DOM数据模型以后，可以使用DOM的遍历方法来寻找元素，也可以使用XPATH来查找指定元素,XPath的重点注意事项是NamespaceContext. 接下来是DOM的code实例.

 
      ? 
     
           public 
            class 
           MyDOM { 
          
           public 
           static 
           void 
            main(String[] args)  
           throws 
            Exception { 
          
           new 
           MyDOM(); 
          
           } 
          
           public 
           MyDOM()  
           throws 
            Exception { 
          
           // Use "javax.xml.parsers.DocumentBuilderFactory" system property to specify a Parser. 
          
           // java -Djavax.xml.parsers.DocumentBuilderFactory=yourFactoryHere [...] 
          
           // If property is not specified, use J2SE default Parser. 
          
           // The default Parser is "com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderFactoryImpl". 
          
           DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); 
          
           dbf.setIgnoringComments( 
           false 
           ); 
          
           dbf.setNamespaceAware( 
           true 
           ); 
          
           dbf.setIgnoringElementContentWhitespace( 
           true 
           ); 
          
           // Use XSD defined by JAXP 1.3, JAVA1.5 
          
           // SchemaFactory sf = SchemaFactory.newInstance("http://www.w3.org/2001/XMLSchema"); 
          
           // dbf.setSchema(sf.newSchema(this.getClass().getResource("/jaxp/resources/bookStore.xsd"))); 
          
           // or Use old way defined by JAXP 1.2 
          
           // dbf.setAttribute("http://java.sun.com/xml/jaxp/properties/schemaLanguage","http://www.w3.org/2001/XMLSchema"); 
          
           // dbf.setAttribute("http://java.sun.com/xml/jaxp/properties/schemaSource", new File("schema.xsd")); 
          
           // dbf.setSchema(schema); 
          
           // XSD disabled, use DTD. 
          
           dbf.setValidating( 
           true 
           ); 
          
           DocumentBuilder db = dbf.newDocumentBuilder(); 
          
           db.setErrorHandler( 
           new 
           MyErrorHandler()); 
          
           db.setEntityResolver( 
           new 
           MyEntityResolver()); 
          
           Document document = db.parse( 
           this 
           .getClass().getResourceAsStream( 
           "/jaxp/resources/bookStore.xml" 
           )); 
          
           // Operate on Document according to DOM module. 
          
           NodeList list = document.getElementsByTagNameNS( 
           "http://joey.org/bookStore" 
           ,  
           "book" 
           ); 
          
           System.out.println(list.item( 
           2 
           ).getAttributes().item( 
           0 
           ).getLocalName()); 
          
           // Node that if you don't specify name space, you need to use Qualified Name. 
          
           System.out.println(document.getElementsByTagName( 
           "audlt:age" 
           ).item( 
           0 
           ).getTextContent()); 
          
           // Use xpath to query xml 
          
           XPathFactory xpf = XPathFactory.newInstance(); 
          
           XPath xp = xpf.newXPath(); 
          
           // Need to set a namespace context. 
          
           NamespaceContext nc =  
           new 
           NamespaceContext() { 
          
           @Override 
          
           public 
           String getNamespaceURI(String prefix) { 
          
           if 
           (prefix.equals( 
           "b" 
           ))  
           return 
           "http://joey.org/bookStore" 
           ; 
          
           if 
           (prefix.equals( 
           "a" 
           ))  
           return 
           "http://japan.org/book/audlt" 
           ; 
          
           return 
           null 
           ; 
          
           } 
          
           @Override 
          
           public 
           String getPrefix(String namespaceURI) { 
          
           if 
           (namespaceURI.equals( 
           "http://joey.org/bookStore" 
           ))  
           return 
           "b" 
           ; 
          
           if 
           (namespaceURI.equals( 
           "http://japan.org/book/audlt" 
           ))  
           return 
           "a" 
           ; 
          
           return 
           null 
           ; 
          
           } 
          
           @Override 
          
           public 
           Iterator getPrefixes(String namespaceURI) { 
          
           return 
           null 
           ; 
          
           } 
          
           }; 
          
           xp.setNamespaceContext(nc); 
          
           System.out.println(xp.evaluate( 
           "/b:bookStore/@name" 
           , document)); 
          
           System.out.println(xp.evaluate( 
           "/b:bookStore/b:books/b:book[@id=3]/@a:color" 
           , document)); 
          
           } 
          
           }

StAX实例

StAX和SAX比较,代码简单,且可以写XML. 但StAX规范对于解析时的validation不是强制的.所以,JDK自带StAX解析器就不支持Parsing Validation.

StAX存在两种API, Cursor API(XMLStreamReader, XMLStreamWriter)和Iterator API(XMLEventReader, XMLEventWriter). Cursor API就是一个像游标一样的读或者写API. 我们得不停的调用XML writer和XML reader来读写XML每一个字段,这是的代码逻辑层和XML解析层交叉在一起,很混乱. Iterator API将逻辑层和XML解析层分离,对Event进行封装,所有的数据都封装在Event中,逻辑层和解析层靠Event实体来打交道,实现了松耦合. 这是我的理解:

Cursor API比Iterator API更底层.
Iterator API对Event封装的比较好,隔离了逻辑层和XML解析层.实现了松耦合.逻辑层只需要focus在event数据本身上.
Iterator API更简单.推荐使用.
使用Iterator API很容易实现将普通文本格式的内容伪装转化成一个XML格式的文件.

下面代码分别用Cursor API和Iterator API对XML解析,然后再重新生成写到JAVA Console.

 
      ? 
     
           public 
            class 
           MyStAX { 
          
           public 
           static 
           void 
            main(String[] args)  
           throws 
            Exception { 
          
           coursorAPIReadWrite(); 
          
           eventAPIReadWrite(); 
          
           } 
          
           // use cursor API to read and write XML. 
          
           public 
           static 
           void 
            coursorAPIReadWrite()  
           throws 
            Exception { 
          
           XMLInputFactory xif = XMLInputFactory.newInstance(); 
          
           // Set properties for validation, namespace... 
          
           // But, JDK embeded StAX parser does not support validation. 
          
           //xif.setProperty(XMLInputFactory.IS_VALIDATING, true); 
          
           xif.setProperty(XMLInputFactory.IS_NAMESPACE_AWARE,  
           true 
           ); 
          
           // Handle the external Entity. 
          
           xif.setXMLResolver( 
           new 
           XMLResolver() { 
          
           public 
           Object resolveEntity(String publicID, String systemID, 
          
           String baseURI, String namespace)  
           throws 
           XMLStreamException { 
          
           if 
           (publicID.equals( 
           "bookStore.dtd" 
           )) { 
          
           return 
           Class. 
           class 
           .getResourceAsStream( 
           "/jaxp/resources/bookStore.dtd" 
           ); 
          
           } 
          
           return 
           null 
           ; 
          
           } 
          
           }); 
          
           XMLOutputFactory xof = XMLOutputFactory.newInstance(); 
          
           // Set namespace repairable. Sometimes it will bring you bug. Use it carefully. 
          
           // xof.setProperty(XMLOutputFactory.IS_REPAIRING_NAMESPACES, true); 
          
           InputStream sourceIn = Class. 
           class 
           .getResourceAsStream( 
           "/jaxp/resources/bookStore.xml" 
           ); 
          
           OutputStream targetOut = System.out;  
           //new FileOutputStream(new File("target.xml")); 
          
           XMLStreamReader reader = xif.createXMLStreamReader(sourceIn); 
          
           XMLStreamWriter writer = xof.createXMLStreamWriter(targetOut, reader.getEncoding()); 
          
           writer.writeStartDocument(reader.getEncoding(), reader.getVersion()); 
          
           while 
           (reader.hasNext()) { 
          
           int 
           event = reader.next(); 
          
           switch 
           (event) { 
          
           case 
           XMLStreamConstants.DTD: 
          
           out(reader.getText()); 
          
           writer.writeCharacters( 
           "\n" 
           ); 
          
           writer.writeDTD(reader.getText()); 
          
           writer.writeCharacters( 
           "\n" 
           ); 
          
           break 
           ; 
          
           case 
           XMLStreamConstants.PROCESSING_INSTRUCTION: 
          
           out(reader.getPITarget()); 
          
           writer.writeCharacters( 
           "\n" 
           ); 
          
           writer.writeProcessingInstruction(reader.getPITarget(), reader.getPIData()); 
          
           break 
           ; 
          
           case 
           XMLStreamConstants.START_ELEMENT: 
          
           out(reader.getName()); 
          
           NamespaceContext nc = reader.getNamespaceContext(); 
          
           writer.setNamespaceContext(reader.getNamespaceContext()); 
          
           writer.setDefaultNamespace(nc.getNamespaceURI( 
           "" 
           )); 
          
           writer.writeStartElement(reader.getPrefix(), reader.getLocalName(), reader.getNamespaceURI()); 
          
           for 
           ( 
           int 
            i= 
           0 
           ; i 
          
           QName qname = reader.getAttributeName(i); 
          
           String name=qname.getLocalPart(); 
          
           if 
           (qname.getPrefix()!= 
           null 
           && !qname.getPrefix().equals( 
           "" 
           )) { 
          
           //name = qname.getPrefix()+":"+name; 
          
           } 
          
           writer.writeAttribute(name, reader.getAttributeValue(i)); 
          
           } 
          
           for 
           ( 
           int 
            i= 
           0 
           ; i 
          
           writer.writeNamespace(reader.getNamespacePrefix(i), reader.getNamespaceURI(i)); 
          
           } 
          
           break 
           ; 
          
           case 
           XMLStreamConstants.ATTRIBUTE:  
          
           out(reader.getText()); 
          
           break 
           ; 
          
           case 
           XMLStreamConstants.SPACE: 
          
           out( 
           "SPACE" 
           ); 
          
           writer.writeCharacters( 
           "\n" 
           ); 
          
           break 
           ; 
          
           case 
           XMLStreamConstants.CHARACTERS: 
          
           out(reader.getText()); 
          
           writer.writeCharacters(reader.getText()); 
          
           break 
           ; 
          
           case 
           XMLStreamConstants.END_ELEMENT: 
          
           out(reader.getName()); 
          
           writer.writeEndElement(); 
          
           break 
           ; 
          
           case 
           XMLStreamConstants.END_DOCUMENT: 
          
           writer.writeEndDocument(); 
          
           break 
           ; 
          
           default 
           :  
          
           out( 
           "other" 
           ); 
          
           break 
           ; 
          
           } 
          
           } 
          
           writer.close(); 
          
           reader.close(); 
          
           } 
          
           public 
           static 
           void 
            eventAPIReadWrite()  
           throws 
            Exception { 
          
           XMLInputFactory xif = XMLInputFactory.newInstance(); 
          
           xif.setProperty(XMLInputFactory.IS_NAMESPACE_AWARE,  
           true 
           ); 
          
           // Handle the external Entity. 
          
           xif.setXMLResolver( 
           new 
           XMLResolver() { 
          
           public 
           Object resolveEntity(String publicID, String systemID, 
          
           String baseURI, String namespace)  
           throws 
           XMLStreamException { 
          
           if 
           (publicID.equals( 
           "bookStore.dtd" 
           )) { 
          
           return 
           Class. 
           class 
           .getResourceAsStream( 
           "/jaxp/resources/bookStore.dtd" 
           ); 
          
           } 
          
           return 
           null 
           ; 
          
           } 
          
           }); 
          
           XMLOutputFactory xof = XMLOutputFactory.newInstance(); 
          
           InputStream sourceIn = Class. 
           class 
           .getResourceAsStream( 
           "/jaxp/resources/bookStore.xml" 
           ); 
          
           OutputStream targetOut = System.out; 
          
           XMLEventReader reader = xif.createXMLEventReader(sourceIn); 
          
           XMLEventWriter writer = xof.createXMLEventWriter(targetOut); 
          
           while 
           (reader.hasNext()) { 
          
           XMLEvent event = reader.nextEvent(); 
          
           out(event.getEventType()); 
          
           writer.add(event); 
          
           } 
          
           reader.close(); 
          
           writer.close(); 
          
           } 
          
           public 
           static 
           void 
            out(Object o) { 
          
           System.out.println(o); 
          
           } 
          
           }

XSLT实例

上面了解了SAX,DOM和STAX，它们均为XML解析方法. 其中SAX只适合解析读取. DOM则是XML内存中的数据展现. STAX可以解析，也可以写出到文件系统.

如果将DOM从内存输出XML文件. 如果需要将一个XML文件转换成一个HTML或任意其他格式文件，则需要JAXP的XSLT特性. 这里的转换包括：

两个结构不同的DOM相互转换. DOMSouce -----> DOMResult
DOM输出到XML. DOMSource -----> StreamResult
DOM转化成另一种格式文件,比如HTML. DOMSource ---(XSL)--->StreamResult.
XML文件转换成另一种格式文件. SAXSource|StreamSource ---(XSL)---->StreamResult
XML文件到DOM. SAXSource|StreamSouce ------> DOMResult
DOM到另一个SAX事件 DOMSource------>SAXResult

XSLT的下面包含了4个包：

javax.xml.transform - 定义了Transformer类，调用Transformer的transform(source, result)方法，可以进行XML的转换.
javax.xml.transform.sax - 里面定义了SAXSource和SAXResult.
javax.xml.transfrom.dom - 定义了DOMSource和DOMResult.
javax.xml.transform.stream - 定义了StreamSource和StreamResult.
javax.xml.transform.stax - 定义了StAXSource和StAXResult.(java1.6)

从上面可以看出，JAXP可以进行4*4=16种转换方式.(sax, sax), (sax, dom), (sax, stream)...

再高级一点,利用SAXSouce----->DOMResult的转化功能, 和SAX模拟XML读取功能, XSLT可以将一个非XML格式的文件,转换成一个DOM. 下面的代码将包含此例. 代码中还包含另外一个例子,就是把XML按照XSL的格式转换成HTML.

注意, XSLT处理DTD有技巧:
在xml2html的转换中, 使用StreamSource在代码的书写上是最简单的, 但为什么使用了SAXSource? 那是因为要转换的XML中引用了DTD, StreamSource无法处理外部引用, 会导致Transformer抛TransformerException. 失败的异常内容为DTD文件找不到. 那么,在这种情况下,我们只能使用SAXSource,并给它赋予一个可以解析外部DTD引用的XMLReader. 终于成功了.

 
      ? 
     
           public 
            class 
           MyXSLT { 
          
           TransformerFactory tff; 
          
           public 
           static 
           void 
            main(String[] args)  
           throws 
            Exception { 
          
           MyXSLT xslt =  
           new 
           MyXSLT(); 
          
           xslt.xml2html(); 
          
           xslt.str2xml(); 
          
           } 
          
           public 
           MyXSLT() { 
          
           tff = TransformerFactory.newInstance(); 
          
           } 
          
           public 
           void 
           xml2html()  
           throws 
           Exception { 
          
           Transformer tr = tff.newTransformer( 
           new 
           SAXSource( 
           new 
            InputSource( 
           this 
           .getClass().getResourceAsStream( 
           "/jaxp/resources/bookStore.xsl" 
           )))); 
          
           SAXParserFactory spf = SAXParserFactory.newInstance(); 
          
           SAXParser parser = spf.newSAXParser(); 
          
           parser.getXMLReader().setEntityResolver( 
           new 
           EntityResolver() { 
          
           @Override 
          
           public 
           InputSource resolveEntity(String publicId, String systemId) 
          
           throws 
           SAXException, IOException { 
          
           if 
           ( 
           "bookStore.dtd" 
           .equals(publicId)) { 
          
           InputStream in =  
           this 
           .getClass().getResourceAsStream( 
           "/jaxp/resources/bookStore.dtd" 
           ); 
          
           InputSource is =  
           new 
           InputSource(in); 
          
           return 
           is; 
          
           } 
          
           return 
           null 
           ; 
          
           } 
          
           }); 
          
           Source source =  
           new 
           SAXSource(parser.getXMLReader(),  
           new 
           InputSource( 
           this 
           .getClass().getResourceAsStream( 
           "/jaxp/resources/bookStore.xml" 
           ))); 
          
           Result target =  
           new 
           StreamResult(System.out); 
          
           tr.transform(source, target); 
          
           } 
          
           // "[joey,bill,cat]" will be transformed to  
          
           // joeybillcat 
          
           public 
           void 
           str2xml()  
           throws 
           Exception { 
          
           final 
           String[] names =  
           new 
           String[]{ 
           "joey" 
           , 
           "bill" 
           , 
           "cat" 
           }; 
          
           Transformer tr = tff.newTransformer(); 
          
           Source source =  
           new 
           SAXSource( 
           new 
           XMLReader() { 
          
           private 
           ContentHandler handler; 
          
           @Override 
          
           public 
           void 
           parse(InputSource input)  
           throws 
           IOException, 
          
           SAXException { 
          
           handler.startDocument(); 
          
           handler.startElement( 
           "" 
           ,  
           "test" 
           ,  
           "test" 
           ,  
           null 
           ); 
          
           for 
           ( 
           int 
            i= 
           0 
           ; i 
          
           handler.startElement( 
           "" 
           ,  
           "name" 
           ,  
           "name" 
           ,  
           null 
           ); 
          
           handler.characters(names[i].toCharArray(),  
           0 
           , names[i].length()); 
          
           handler.endElement( 
           "" 
           ,  
           "name" 
           ,  
           "name" 
           ); 
          
           } 
          
           handler.endElement( 
           "" 
           ,  
           "test" 
           ,  
           "test" 
           ); 
          
           handler.endDocument(); 
          
           } 
          
           @Override 
          
           public 
           void 
           parse(String systemId)  
           throws 
           IOException, SAXException { 
          
           } 
          
           @Override 
          
           public 
           boolean 
           getFeature(String name) 
          
           throws 
           SAXNotRecognizedException, SAXNotSupportedException { 
          
           return 
           false 
           ; 
          
           } 
          
           @Override 
          
           public 
           void 
           setFeature(String name,  
           boolean 
           value) 
          
           throws 
           SAXNotRecognizedException, SAXNotSupportedException { 
          
           } 
          
           @Override 
          
           public 
           Object getProperty(String name) 
          
           throws 
           SAXNotRecognizedException, SAXNotSupportedException { 
          
           return 
           null 
           ; 
          
           } 
          
           @Override 
          
           public 
           void 
           setProperty(String name, Object value) 
          
           throws 
           SAXNotRecognizedException, SAXNotSupportedException { 
          
           } 
          
           @Override 
          
           public 
           void 
           setEntityResolver(EntityResolver resolver) { 
          
           } 
          
           @Override 
          
           public 
           EntityResolver getEntityResolver() { 
          
           return 
           null 
           ; 
          
           } 
          
           @Override 
          
           public 
           void 
           setDTDHandler(DTDHandler handler) { 
          
           } 
          
           @Override 
          
           public 
           DTDHandler getDTDHandler() { 
          
           return 
           null 
           ; 
          
           } 
          
           @Override 
          
           public 
           void 
           setContentHandler(ContentHandler handler) { 
          
           this 
           .handler = handler; 
          
           } 
          
           @Override 
          
           public 
           ContentHandler getContentHandler() { 
          
           return 
           handler; 
          
           } 
          
           @Override 
          
           public 
           void 
           setErrorHandler(ErrorHandler handler) { 
          
           } 
          
           @Override 
          
           public 
           ErrorHandler getErrorHandler() { 
          
           return 
           null 
           ; 
          
           } 
          
           },  
           new 
           InputSource()); 
          
           Result target =  
           new 
           StreamResult(System.out); 
          
           tr.transform(source, target); 
          
           } 
          
           }

分享到：

element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
绘本讲师训练营【24期】8/21阅读原创《独生小孩》 1784e22615e0
24016-孟娟《独生小孩》图片发自App今天我想分享一个蛮特别的绘本，讲的是一个特殊的群体，我也是属于这个群体，80后的独生小孩。这是一本中国绘本，作者郭婧，也是一个80厚。全书一百多页，均为铅笔绘制，虽然为黑白色调，但并不显得沉闷。全书没有文字，犹如“默片”，但并不影响读者对该作品的理解，反而显得神秘，梦幻，給读者留下想象的空间。作者在前蝴蝶页这样写到：“我更希望父母和孩子一起分享这本书，使他
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
2018-07-23-催眠日作业-#不一样的31天#-66小鹿小鹿_33
预言日：人总是在逃避命运的路上，与之不期而遇。心理学上有个著名的名词，叫做自证预言；经济学上也有一个很著名的定律叫做，墨菲定律；在灵修派上，还有一个很著名的法则，叫做吸引力法则。这3个领域的词，虽然看起来不太一样，但是他们都在告诉人们一个现象：你越担心什么，就越有可能会发生什么。同样的道理，你越想得到什么，就应该要积极地去创造什么。无论是自证预言，墨菲定律还是吸引力法则，对人都有正反2个维度的影响
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
直抒《紫罗兰永恒花园外传》雷姆的黑色童话
没看过《紫罗兰永恒花园》的我莫名的看完了《紫罗兰永恒花园外传》，又莫名的被故事中的姐妹之情狠狠地感动了的一把。感动何在：困苦中相依为命的姐妹二人被迫分离，用一个人的自由换取另一个人的幸福。之后，虽相隔不知几许依旧心心念念彼此牵挂。这种深深的姐妹情谊就是令我为之动容的所在。贝拉和泰勒分别影片开始，海天之间一个孩童凭栏眺望，手中拿着折旧的信纸。镜头一转，挑灯伏案的薇尔莉特正在打字机前奋笔疾书。这些片段
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
钢筋长度超限检测检数据集VOC+YOLO格式215张1类别 futureflsl 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：215标注数量(xml文件个数)：215标注数量(txt文件个数)：215标注类别数：1标注类别名称:["iron"]每个类别标注的框数：iron框数=215总框数：215使用标注工具：labelImg标注规则：对类别进
如何成为段子手欣雅阅读
我是一个尬聊大师，与朋友聊天经常把话题聊死，留我一个人在群里，望着自己打下的最后一句话无语凝噎。看到风趣幽默的朋友与人聊天，很是艳羡，觉得自己何时才能成为这样的段子手呢？一、段子是什么？“段子”一词在百度百科上的解释：本是相声中的一个艺术术语，指的是相声作品中一节或一段艺术内容。我的理解：段子就是一些搞笑的故事或者笑话。二、为什么要会说段子？不知道大家有没有这样的朋友，本来很无趣的聚会，只要有他参
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
怎么做淘客赚钱(2022最新免费淘客盈利的方法) 高省_飞智666600
很多人都不知道什么是淘宝客，今天小编为大家解答一下吧。淘宝客，现在简称淘客，是时下比较流行的一个词语，特质为淘宝店推广商品获取提成的人，这些人没有自己的产品，只是在淘宝里面选择适合自己的产品，在自己比较熟悉的领域推广，把产品卖出去之后，会从淘宝店家那里获得百分之五到百分之五十左右的佣金。淘宝客付出的是什么呢？时间。你需要花时间去选适合自己推广的产品，需要花时间去选自己的推广方法，如果你打算自己做个
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
心有蓝天白云，爱情便会晴空万里，然后有花香有鸟鸣有美好的未来曹十二吖
丁南的婚姻，来自于一场她对生命的对比。她曾经说过，当她最爱的母亲用生命去逼迫她结婚的时候，她曾一度不理解到愤怒，甚至于想过用轻生来对抗母亲的不理智。庆幸的是，丁南是一个自我调节能力非常强的人，她想如果我连死亡都不怕，还怕不能经营好一段婚姻吗？抱着这样的念头，24年没有谈过恋爱的她，用短短三个月的时间，完成了少女到女人的蜕变。她曾经说过：“我要把自己最珍贵的东西留给自己命中注定的那个人。”闺蜜几人中
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
【穿过丛林看见你】2015年在《诗歌报》读诗日记（一）快快_ce70
写完《三月的领土》和《手握一把锄头，在翻动诗歌的春天》之后，安稳的睡了个好觉，这是从2013年的五月之后，第一次睡的如此安稳和香甜。其实这对于我来说，也没有什么特别的意义和变故，就像我现在的生活在人人忙着踏青、写生、拍照的春天。在我脚下，没有领土的完整，也没有加剧的破碎。我曾经和现在都是个辛勤的“蜂农”，在这样一个角色里，尽管有人盗走了我所有的蜜，但不妨碍我对甜蜜的不懈追求和喜爱。翻开最近的阅读笔
简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash
Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说
如何选择最适合你的项目研发管理软件？TAPD卓越版全面解析北京云巴巴信息技术有限公司产品经理需求分析
在当今快速发展的科技时代，项目研发管理软件已成为企业不可或缺的重要工具。面对市场上琳琅满目的产品，如何选择一款适合自己团队的项目研发管理软件呢？本文将围绕项目研发管理软件的选择标准，重点介绍TAPD卓越版的特点、优势以及使用体验，让你更好地理解和选择适合自己的项目研发管理软件。项目研发管理软件的选择标准在选择项目研发管理软件时，我们需要考虑以下几个方面的因素：功能全面性：软件是否覆盖了从需求管理、
剧本杀《鲸鱼马戏团》剧本杀剧透+真相答案复盘解析攻略 VX搜_奶茶剧本杀
本文为剧本杀《鲸鱼马戏团》剧本杀测评+部分真相复盘，获取完整真相复盘只需两步：①、关注微信公众号【奶茶剧本杀】→②、回复剧本杀《鲸鱼马戏团》即可获取查看剧本杀《鲸鱼马戏团》剧本杀真相答案复盘+凶手剧透：以下是玩家评测+部分关键证据，凶手，时间线，复盘解析，推理逻辑--------------------------------------------------------------------
SpringBlade dict-biz/list 接口 SQL 注入漏洞文章永久免费只为良心 oracle 数据库
SpringBladedict-biz/list接口SQL注入漏洞POC:构造请求包查看返回包你的网址/api/blade-system/dict-biz/list?updatexml(1,concat(0x7e,md5(1),0x7e),1)=1漏洞概述在SpringBlade框架中，如果dict-biz/list接口的后台处理逻辑没有正确地对用户输入进行过滤或参数化查询（PreparedSta
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他