八、XML部分
1、xml有哪些解析技术?区别是什么?
有DOM,SAX,STAX等
DOM:处理大型文件时其性能下降的非常厉害。这个问题是由DOM的树结构所造成的,这种结构占用的内存较多,而且DOM必须在解析文件之前把整个文档装入内存,适合对XML的随机访问。
SAX:不现于DOM,SAX是事件驱动型的XML解析方式。它顺序读取XML文件,不需要一次全部装载整个文件。当遇到像文件开头,文档结束,或者标签开头与标签结束时,它会触发一个事件,用户通过在其回调事件中写入处理代码来处理XML文件,适合对XML的顺序访问 。
STAX:Streaming API for XML (StAX)
2、你在项目中用到了xml技术的哪些方面?如何实现的?
用到了数据存贮,信息配置两方面。在做数据交换平台时,将不能数据源的数据组装成XML文件,然后将XML文件压缩打包加密后通过网络传送给接收者,接收解密与解压缩后再同XML文件中还原相关信息进行处理。在做软件配置时,利用XML可以很方便的进行,软件的各种配置参数都存贮在XML文件中。
3、编程用JAVA解析XML的方式.
答:用SAX方式解析XML,XML文件如下:
王小明
信息学院
6258113
男,1955年生,博士,95年调入海南大学
事件回调类SAXHandler.java
import java.io.*;
import java.util.Hashtable;
import org.xml.sax.*;
public class SAXHandler extends HandlerBase
{
private Hashtable table = new Hashtable();
private String currentElement = null;
private String currentValue = null;
public void setTable(Hashtable table)
{
this.table = table;
}
public Hashtable getTable()
{
return table;
}
public void startElement(String tag, AttributeList attrs)
throws SAXException
{
currentElement = tag;
}
public void characters(char[] ch, int start, int length)
throws SAXException
{
currentValue = new String(ch, start, length);
}
public void endElement(String name) throws SAXException
{
if (currentElement.equals(name))
table.put(currentElement, currentValue);
}
}
JSP内容显示源码,SaxXml.jsp:
剖析XML文件people.xml
<%@ page errorPage=ErrPage.jsp
contentType=text/html;charset=GB2312 %>
<%@ page import=java.io.* %>
<%@ page import=java.util.Hashtable %>
<%@ page import=org.w3c.dom.* %>
<%@ page import=org.xml.sax.* %>
<%@ page import=javax.xml.parsers.SAXParserFactory %>
<%@ page import=javax.xml.parsers.SAXParser %>
<%@ page import=SAXHandler %>
<%
File file = new File(c:\people.xml);
FileReader reader = new FileReader(file);
Parser parser;
SAXParserFactory spf = SAXParserFactory.newInstance();
SAXParser sp = spf.newSAXParser();
SAXHandler handler = new SAXHandler();
sp.parse(new InputSource(reader), handler);
Hashtable hashTable = handler.getTable();
out.println(教师信息表);
out.println(姓名 | + +
(String)hashTable.get(new String(name)) + |
);
out.println(学院 | + +
(String)hashTable.get(new String(college))+ |
);
out.println(电话 | + +
(String)hashTable.get(new String(telephone)) + |
);
out.println(备注 | + +
(String)hashTable.get(new String(notes)) + |
);
out.println(
);
%>
4、XML文档定义有几种形式?它们之间有何本质区别?
1)两种形式 dtd schema。
2)本质区别:schema本身是xml的,可以被XML解析器解析(这也是从DTD上发展schema的根本目的),
5、XML和HTML的区别?
1)设计上的区别:XML用来存储数据,重点在于数据本身,HTML用来定义数据,重在数据的显示模式。
2)XML可扩展性强,因为他本身就是可拓展性标记语言,课创建个性化的标记语言,提供更多数据操作。
3)XML语法比HTML严格。
4)起始标签和结束标签要匹配
5)嵌套标签不能相互嵌套
6)区分大小写
7)XML属性必须放在引号中,HTML可有可无。
8)XML必须有相应值,但HTML可以有不带属性的属性名。
6、XML文件和普通文件相比有哪些优点?
1)XML是一个标准的技术,在处理上可以更加的统一
2)从对配置文件的后期处理上,对XML的操作的API更多,更方便,而文本文件不是特别方便。
3)XML可以有定义语法的DTD文件,这样兑取配置信息的时候,可以先根据DTD检查当前的XML配置文件是否语法正确,而文本文件没有办法检查语法。
4)XML可以非常方便的转换成其他格式的文件,而文本不可以。
5)XML利用xslt可以非常方便的转换成其他格式的文件,文本文件很难做到。
6)XML可以非常方便的搜索其中的一些配置信息,试想如果配置文件很大,优点还是很明显的,而文本文件则不太方便。
7)XML可以携带很多、更丰富的配置信息,文本文件不容易做到