DOM编程
理解树的概念
DOM是Document Object Model文档对象模型的缩写。根据W3C DOM规范(http://www.w3.org/DOM/),DOM是一种与浏览器,平台,语言无关的接口,使得你可以访问页面其他的标准组件。简单理解,DOM解决了Netscape的Javascript和Microsoft的Jscript之间的冲突,给予web设计师和开发者一个标准的方法,让他们来访问他们站点中的数据、脚本和表现层对像。
在理解DOM眼中的HTML文档结构之前,应该对树状结构有所了解。直接位于一个节点之上的节点是该节点的父节点(parent)。直接位于一个节点之下的节点是该节点的子节点(children)。位于同一层次,具有相同父节点的节点是兄弟节点(sibling)。一个节点的下一个层次的节点集合是那个节点的后代(descendant)。一个节点的父节点、祖父节点及其他所有位于它之上的节点都是那个节点的祖先(ancestor)。
在DOM眼中,HTML是一种树状结构的文档,<html>是根(root)节点,<head>、<title>、<body>是<html>的子(children)节点,互相之间是兄弟(sibling)节点;<body>下面才是子节点<table>、<span>、<p>等等。HTML的文档结构如图4-12所示。
图4-12 HTML文档结构
HTML文档的节点
由于HTML文档的复杂性,DOM定义了nodeType来表示节点的类型。下表列出了Node常用的几种节点类型。
Node常用的几种节点类型
接 口 |
nodeType常量 |
nodeType值 |
备 注 |
Document |
Node.DOCUMENT_NODE |
9 |
document |
Element |
Node.ELEMENT_NODE |
1 |
元素节点 |
Text |
Node.TEXT_NODE |
3 |
文本节点 |
Attr |
Node.ATTRIBUTE_NODE |
2 |
节点属性 |
Comment |
Node.COMMENT_NODE |
8 |
注释文本 |
DocumentFragment |
Node.DOCUMENT_FRAGMENT_NODE |
11 |
document片断 |
每个Node对象都有nodeType属性,它用来指定该节点的类型。例如,一个节点的nodeType属性等于Node.ELEMENT_NODE,则代表该节点为Element类型,可以将其作为Element对象,使用Element对象的属性和方法进行相关操作。
文本节点的toString方法可以获得节点所代表的内容。
文本节点的获得,例:<p>aa</p>,调p对象的childNodes[0]即可。
注:我们这里主要讨论document和Element节点,其它的对象请参看相应的资料。
在DOM下,HTML文档的各个节点被视为各种类型的Node对象。每个Node对象都有自己的属性和方法,利用这些属性和方法可以遍历整个文档树。
Node对象常用的属性
属 性 |
描 述 |
attributes |
如果该节点是一个Element,则以NamedNodeMap形式返回该元素的属性 |
childNodes |
以Node[]的形式存放当前节点的子节点。如果没有子节点,则返回空数组 |
firstChild |
以Node的形式返回当前节点的第一个子节点。如果没有子节点,则为null |
lastChild |
以Node的形式返回当前节点的最后一个子节点。如果没有子节点,则为null |
nextSibling |
以Node的形式返回当前节点的兄弟下一个节点。如果没有这样的节点,则返回null |
nodeName |
节点的名字,Element节点则代表Element的标记名称 |
nodeType |
代表节点的类型 |
parentNode |
以Node的形式返回当前节点的父节点。如果没有父节点,则为null |
previousSibling |
以Node的形式返回紧挨当前节点、位于它之前的兄弟节点。如果没有这样的节点,则返回null |
Node对象常用的方法
方 法 |
描 述 |
appendChild() |
通过把一个节点增加到当前节点的childNodes[]组,给文档树增加节点 |
cloneNode() |
复制当前节点,或者复制当前节点以及它的所有子孙节点 要深度clone,要传一个参数true |
hasChildNodes() |
如果当前节点拥有子节点,则将返回true |
insertBefore() |
给文档树插入一个节点,位置在当前节点的指定子节点之前。如果该节点已经存在,则删除之再插入到它的位置 |
removeChild() |
从文档树中删除并返回指定的子节点 |
replaceChild() |
从文档树中删除并返回指定的子节点,用另一个节点替换它 |
DOM树的根节点是个Document对象, 用document我们可以得到该对象,Document定义的方法大多数是生产型方法,主要用于创建可以插入文档中各种类型的节点。常用的Document方法如表4-12所示。
表4-12 Document常用的方法
方 法 |
描 述 |
createAttribute() |
用指定的名字创建新的Attr节点 |
createComment() |
用指定的字符串创建新的Comment节点 |
createElement() |
用指定的标记名创建新的Element节点 |
createTextNode() |
用指定的文本创建新的TextNode节点 |
getElementById() |
返回文档中具有指定id属性的Element节点 |
getElementsByTagName() |
返回文档中具有指定标记名的所有Element节点 |
getElementsByName() |
返回文档中具有指定标记名的所有Element节点 |
对于Element节点,可以通过调用getAttribute()、setAttribute()、removeAttribute()方法来查询、设置或者删除一个Element节点的性质,比如<table>标记的border属性。
下表分别列出了Element常用的属性和方法。
表4-13 Element常用的属性
属 性 |
描 述 |
tagName |
元素的标记名称,比如<p>元素为P。HTML文档返回的tabName均为大写 |
表4-14 Element常用的方法
方 法 |
描 述 |
getAttribute |
以字符串形式返回指定属性的值 |
getAttributeNode() |
以Attr节点的形式返回指定属性的值 |
getElementsByTagName() |
返回一个Node数组,包含具有指定标记名的所有Element节点的子孙节点,其顺序为在文档中出现的顺序 |
hasAttribute() |
如果该元素具有指定名字的属性,则返回true |
removeAttribute() |
从元素中删除指定的属性 |
removeAttributeNode() |
从元素的属性列表中删除指定的Attr节点 |
setAttribute() |
把指定的属性设置为指定的字符串值,如果该属性不存在则添加一个新属性 |
setAttributeNode() |
把指定的Attr节点添加到该元素的属性列表中 |
Attr对象代表文档元素的属性,有name、value等属性,可以通过Node接口的attributes属性或者调用Element接口的getAttributeNode()方法来获取。不过,在大多数情况下,使用Element元素属性的最简单方法是getAttribute()和setAttribute()两个方法,而不是Attr对象。
使用DOM操作HTML文档
利用Node对象定义了一系列属性和方法,可以方便遍历整个HTML文档。用parentNode属性和childNodes[]数组可以在文档树中上下移动;通过遍历childNodes[]数组或者使用firstChild和nextSibling属性进行循环操作,也可以使用lastChild和previousSibling进行逆向循环操作,也可以枚举指定节点的子节点。而调用appendChild()、insertBefore()、removeChild()、replaceChild()方法可以改变一个节点的子节点从而改变文档树。
需要指出的是,childNodes[]的值实际上是一个NodeList对象。因此,可以通过遍历childNodes[]数组的每个元素,来枚举一个给定节点的所有子节点;通过递归,可以枚举树中的所有节点。
下面的例子示范如何使用上述的DOM应用编程接口,调用DOM相关对象的方法和属性,操作HTML文档。
1.遍历文档树上的节点
DOM将一个HTML文档解析为树状结构,并提供相应的方案来遍历整个HTML文档树。例程4-16和例程4-17为两个遍历树的例子。
这个例子使用了childNodes[]和递归方式来遍历整个文档,统计文档中出现的Element元素总数,并把Element标记名全部打印出来。
例程4-16 sample4_12.htm
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<title>Ch04--统计Element节点总数</title>
<script language="javascript">
var elementName = ""; //全局变量,保存Element标记名,使用完毕要清空
function countTotalElement(node) { //参数node是一个Node对象
var total = 0;
if(node.nodeType == 1) { //检查node是否为Element对象
total++; //如果是,计数器加1
elementName = elementName + node.tagName + "\r\n"; //保存标记名
}
var childrens = node.childNodes; //获取node的全部子节点
for(var i=0;i<childrens.length;i++) {
total += countTotalElement(childrens[i]); //在每个子节点上进行递归操作
}
return total;
}
</script>
</head>
<body>
<table width="100" border="1" cellpadding="0" cellspacing="0">
<tr><td>
<form name="form1" action="" method="post">
<input type="text" name="input1" value=""><br>
<input type="password" name="password1" value="">
</form>
</td></tr>
</table>
<a href="javascript:void(0)" onClick="alert('标记总数:' + countTotalElement (document) + '\r\n全部标记如下:\r\n' + elementName); elementName='';">开始统计</a>
</body>
</html>
注意事项:
1、在使用DOM时,必须等文档被装载完毕再执行遍历等行为操作文档。
2、<tbody>标记并没有被使用,但是在统计Element节点总数的时候,<tbody>还是被统计进来了。因为如果没有显式地指定<tr>所属的<thead>、<tbody>或者<tfoot>,则HTML将<tr>标记置入一个默认的<tbody>标签内加以解析。另外,<thead>、<tbody>和<tfoot>标记在一个表格标记内部只能分别有一个。
例程4-17则使用firstChile、lastChild、nextSibling、previousSibling等树状遍历整个文档树。
例程4-17 sample4_13.htm
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<title>Ch04--统计Element节点总数</title>
<script language="javascript">
var elementName = ""; //全局变量,保存Element标记名,使用完毕要清空
function countTotalElement(node) { //参数node是一个Node对象
var total = 0;
if(node.nodeType == 1) { //检查node是否为Element对象
total++; //如果是,计数器加1
elementName = elementName + node.tagName + "\r\n"; //保存标记名
}
for(var m=node.firstChild; m!=null;m=m.nextSibling) {
total += countTotalElement(m); //在每个子节点上进行递归操作
}
return total;
}
</script>
</head>
<body>
<table width="100" border="1" cellpadding="0" cellspacing="0">
<tr><td>
<form name="form1" action="" method="post">
<input type="text" name="input1" value=""><br>
<input type="password" name="password1" value="">
</form>
</td></tr>
</table>
<a href="javascript:void(0)" onClick="alert('标记总数:' + countTotalElement (document) + '\r\n全部标记如下:\r\n' + elementName); elementName='';">开始统计</a>
</body>
</html>
2.搜索文档中特定的元素
在使用DOM的过程中,有时候需要定位到文档中的某个特定节点,或者具有特定类型的节点列表。这种情况下,可以调用Document对象的getElementsByTagName()和getElementById()方法来实现。document.getElementsByTagName()返回文档中具有指定标记名的全部Element节点数组。Element出现在数组中的顺序就是他们在文档中出现的顺序。传递给getElementsByTagName()的参数忽略大小写。
(注意:可以使用document.body定位到<body>标记,因为它是惟一的。)
getElementsByTagName()返回的数组取决于文档。一旦文档改变,返回结果也立即改变。与其相比,getElementById()则比较灵活,可以随时定位到目标,只是要实现给目标元素一个惟一的id属性值。Element对象也支持getElementsByTagName()和getElementById()。不同的是,搜索领域只针对调用者的子节点。
例程4-18示范使用document.getElementsByTagName()和document.getElement ById()两个方法定位HTML文档中的元素。
例程4-18 sample4_14.htm
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<title>Ch04--定位HTML文档特定节点</title>
<script language="javascript">
//统计input控件总数,结果为3
function countTotal() {
var elements = document.getElementsByTagName("input");
window.alert("input类型的控件总数为:"+elements.length);
}
//定位id设置为submit1的控件,将其value值显示出来
function anchorElement() {
var element = document.getElementById("submit1");
window.alert("控件Value设置值为:"+element.value);
}
</script>
</head>
<body>
<form name="form1" method="post" action="">
<input type="text" name="input1" id="input1" value="">
<span id="input1">文本输入框</span><br>
<input type="password" name="password1" id="password1" value="">
<span id="password1">密码输入框</span><br>
<input type="submit" name="submit1" value="提交" id="submit1">
</form>
<br>
<a href="javascript:void(0)" onClick="countTotal()">统计input控件总数</a>
<a href="javascript:void(0)" onClick="anchorElement()">定位提交按钮</a>
</body>
</html>
3.修改文档内容
遍历整棵文档树、搜索特定的节点,这些操作的最终目的之一是修改文档内容。接下来的两个例子将使用Node的几个常用方法,来演示如何修改文档内容,其代码如例程4-19所示。
例程4-19 sample4_15.htm
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<title>Ch04--颠倒节点顺序</title>
<script language="javascript">
function reverseNode(node) { // 颠倒节点node的顺序
var kids = node.childNodes; //获取子节点列表
var kidsNum = kids.length; //统计子节点总数
for(var i=kidsNum-1;i>=0;i--) { //逆向遍历子节点列表
var c = node.removeChild(kids[i]); //删除指定子节点,保存在c中
node.appendChild(c); //将c放在新位置上
}
}
</script>
</head>
<body>
<p>第一行</p>
<p>第二行</p>
<p>第三行</p>
<p><input type="button" name="reverseGo"
value="颠倒" onClick="reverseNode(document.body)"></p>
</body>
</html>
注意的是,在将一个节点加入文档之前,先要将这个节点删除,即保证这个节点是无父的。
例程4-19通过直接操作body的子节点来修改文档。而在HTML文档中,布局和定位常常通过表格<table>来实现。使用表格来显式信息数据更加普遍。因此,例程4-20将演示操作表格内容,将表格的四个单元行顺序颠倒。如果没有使用<tbody>标记,则<table>把全部的<tr>当作属于一个<tbody>标记的子节点,所以这里采用数组缓存的方式,把行数据颠倒一下。这个例子同时也演示了如何使用DOM创建表格单元行。
例程4-20 sample4_16.htm
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<title>Ch04--颠倒表格行顺序</title>
<script language="javascript">
function reverseTable() {
var node = document.getElementsByTagName("table")[0]; //第一个表格
var child = node.getElementsByTagName("tr"); //取得表格内的所有行
var newChild = new Array(); //定义缓存数组,保存行内容
for(var i=0;i<child.length;i++) {
newChild[i] = child[i].firstChild.innerHTML;
}
node.removeChild(node.childNodes[0]); //删除全部单元行
var header = node.createTHead(); //新建表格行头
for(var i=0;i<newChild.length;i++) {
var headerrow = header.insertRow(i); //插入一个单元行
var cell = headerrow.insertCell(0); //在单元行中插入一个单元格
//在单元格中创建TextNode节点
cell.appendChild(document.createTextNode(newChild [newChild. length-i-1]));
}
}
</script>
</head>
<body>
<table width="200" border="1" cellpadding="4" cellspacing="0">
<thead>
<tr>
<td height="25">第一行</td>
</tr>
<tr>
<td height="25">第二行</td>
</tr>
<tr>
<td height="25">第三行</td>
</tr>
<tr>
<td height="25">第四行</td>
</tr>
</thead>
</table>
<br>
<input type="button" name="reverse" value="开始颠倒" onClick= "reverse Table()">
</body>
</html>
4.往文档添加新内容
在尝试遍历、搜索、修改文档之后,现在试着往文档添加新的内容。其实没有什么新意,只是利用前面提到的Node的属性和方法而已,还是操作<table>标记的内容。有新意的是,我们要实现一个留言簿。用户可以往留言簿里留言,只是不能刷新,数据并没有被持久地保存,其代码如例程4-22所示。
例程4-22 sample4_18.htm
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<title>Ch04--添加表格内容</title>
<script language="javascript">
function insertStr() {
var f = document.form1;
var value = f.str.value;
if(value!="") {
// 从最终的TextNode节点开始,慢慢形成<tbody>结构
var text = document.createTextNode(value); //新建一个TextNode节点
var td = document.createElement("td"); //新建一个td类型的Element节点
var tr = document.createElement("tr"); //新建一个tr类型的Element节点
var tbody = document.createElement("tbody"); //新建一个tbody类型的Element节点
td.appendChild(text); //将节点text加入td中
tr.appendChild(td); //将节点td加入tr中
tbody.appendChild(tr); //将节点tr加入tbody中
var parNode = document.getElementById("table1"); //定位到table上
parNode.insertBefore(tbody,parNode.firstChild); //将节点tbody插入到节点顶部
//parNode.appendChild(tbody); //将节点tbody加入节点尾部
}
}
</script>
</head>
<body>
<form name="form1" method="post" action="">
<input name="str" type="text" id="str" value="">
<input name="insert" type="button" id="insert" value="留言" onClick="insertStr()">
</form>
<table width="400" border="1" cellspacing="0" cellpadding="0" id="table1">
<tbody>
<tr>
<td height="25">网友留言列表:</td>
</tr>
</tbody>
</table>
</body>
</html>
使用DOM操作XML文档
在数据表示方面,XML文档更加结构化。DOM在支持HTML的基础上提供了一系列的API,支持针对XML的访问和操作。利用这些API,可以从XML中提取信息,动态地创建这些信息的HTML呈现文档。处理XML文档,通常遵循“加载XML文档→提取信息→加工信息→创建HTML文档”的过程。
例程4-23 sample4_19.htm
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<title> Ch04--加载XML文档</title>
<script language="javascript">
function loadXML(handler) {
var url = "employees.xml";
if(document.implementation&&document.implementation.create Document) {
var xmldoc = document.implementation.createDocument("", "", null);
xmldoc.onload = handler(xmldoc, url);
xmldoc.load(url);
}
else if(window.ActiveXObject) {
var xmldoc = new ActiveXObject("Microsoft.XMLDOM");
xmldoc.onreadystatechange = function() {
if(xmldoc.readyState == 4) handler(xmldoc, url);
}
xmldoc.load(url);
}
}
function makeTable(xmldoc, url) {
var table = document.createElement("table");
table.setAttribute("border","1");
table.setAttribute("width","600");
table.setAttribute("class","tab-content");
document.body.appendChild(table);
var caption = "Employee Data from " + url;
table.createCaption().appendChild(document.createTextNode (caption));
var header = table.createTHead();
var headerrow = header.insertRow(0);
headerrow.insertCell(0).appendChild(document.createTextNode("姓名"));
headerrow.insertCell(1).appendChild(document.createTextNode("职业"));
headerrow.insertCell(2).appendChild(document.createTextNode("工资"));
var employees = xmldoc.getElementsByTagName("employee");
for(var i=0;i<employees.length;i++) {
var e = employees[i];
var name = e.getAttribute("name");
var job = e.getElementsByTagName("job")[0].firstChild.data;
var salary = e.getElementsByTagName("salary")[0].firstChild. data;
var row = table.insertRow(i+1);
row.insertCell(0).appendChild(document.createTextNode (name));
row.insertCell(1).appendChild(document.createTextNode (job));
row.insertCell(2).appendChild(document.createTextNode (salary));
}
}
</script>
<link href="css/style.css" rel="stylesheet" type="text/css">
</head>
<body onLoad="loadXML(makeTable)">
</body>
</html>
例程4-24 供读取调用的XML文档 – employees.xml
<?xml version="1.0" encoding="gb2312"?>
<employees>
<employee name="J.Doe">
<job>Programmer</job>
<salary>32768</salary>
</employee>
<employee name="A.Baker">
<job>Sales</job>
<salary>70000</salary>
</employee>
<employee name="Big Cheese">
<job>CEO</job>
<salary>100000</salary>
</employee>
</employees>