在Web应用中,难免和数据库打交道,对于返回的结果集,究竟该如何处理?
尤其是,当你的一个查询可能会返回数万条纪录的时候,你还能像某些骗钱骗精力的jsp垃圾书本上介绍的用rs.next()来处理么?
呵呵,我以前就是这么干的,直接传回resultset,在jsp中while(rs.next())循环中一个一个的处理。
还有,返回结果的分页处理的问题。很多时候我们的Web应用(或者其他)都是针对某一种数据库的(感觉商业应用绝大多数是oracle,业余的多是mysql,还敢用jdbc连接sqlServer的,估计是被M$养废了)。所以我常常会针对某些数据库的特性写一些专门的SQL语句或者存储过程来确定返回结果集的大小,以实现分页处理(其实偶是数据库白痴,除了select/insert/update,其他的不知道!)。我以前就是用伪列来实现在Oracle上处理记录结果集的分页的。
慢慢的,为了所谓的降低代码耦合度,我对查询结果集的代码进行了重构,于是稍微进步了一点,在某个queryManager之类的类中传出一个Enumeration,里边的每个对象对应了数据库中的一条纪录。嘿嘿,居然也能凑合着对付500多人使用了。
可是,这也不是最好的办法,毕竟,如果真的返回了几万条纪录,这样的处理方法不但占内存,而且效率也不搞。
记得以前在bqlr.com中看到一篇关于“查询结果返回rs,还是集合”的讨论,答案是用Iterator。
可是里边的代码很笼统,对于从未用过iterator模式的人来说,基本上没有什么可以模仿和参照的。
还好,我们有现成的,那就是Jive。
看看Jive中是怎么实现的。
(A)我们以forum.jsp这个页面为例,缺省的,每页显示15条thread,用户可以指定从第n条开始显示到n+page_size条。
代码如下:
ResultFilter filter = new ResultFilter();
filter.setStartIndex(start); //从第start条thread开始
filter.setNumResults(range); //页面大小
// Set the moderation level minimum
filter.setModerationRangeMin(forum.getModerationMinThreadValue());
// More forum properties
int numThreads = forum.getThreadCount(filter);
int numMessages = forum.getMessageCount(filter);
// Iterator of threads
ForumThreadIterator threads = forum.threads(filter); //返回thread Iterator,
通过分析上面代码,明确了需要重点分析ResultFilter,DBForum和ForumThreadIterator这三个类。
(B)看看ResultFilter.java
这个类其实就是专门保存查询条件的,例如,可以查询某天之前,由某人发布的贴子等。一次查询操作的所有查询条件都保存在这个类里边。
里边有一个函数比较有意思:public void setSortPropertyName(String sortPropertyName),嘿嘿可以把“是否具备某个property”作为查询条件。我本来就想给jive添加thread置顶功能,看起来只要给需要置顶的thread加一个topMost属性,然后改动skin就可以了。可谓是得来全不费工夫啊。
把查询条件填充完毕以后,就可以把resultFilter传给forum.threads()取结果了。
(C)看DBForum.threads()
public ForumThreadIterator threads(ResultFilter resultFilter) {
//根据传入的resultFilter构造一个查询SQL语句(*注1)
String query = getThreadListSQL(resultFilter, false);
//返回一个确定返回的id列表,这里缺省大小是400个,例如,我要看1~15条纪录
// threadBlock的length是400,从1~400(*注2)
long [] threadBlock = getBlock(query.toString(), resultFilter.getStartIndex());
int startIndex = resultFilter.getStartIndex();
int endIndex;
// If number of results is set to inifinite, set endIndex to the total
// number of threads in the forum.
if (resultFilter.getNumResults() == ResultFilter.NULL_INT) {
endIndex = (int)getThreadCount(resultFilter);
}
else {
endIndex = resultFilter.getNumResults() + startIndex;
}
//嘿嘿,理解了上面几句代码先,然后来看这个iterator
return new ForumThreadBlockIterator(threadBlock, query.toString(),
startIndex, endIndex, this.id, factory);
}
OK,关于(注1)
我分析了getThreadListSQL,这里是构造了一个SQL查询语句,这个语句前面的一些内容是:
SELECT jiveThread.threadID FROM jiveThread,xxxxx
那些xxxxx无非是一些查询条件,是根据resultFilter中的查询条件而自动生成的。
原来,如果执行了这个SQL的作用只能取回满足条件的thread的ID号。
(注2)getBlock()
我对这里的Block的理解是:指满足查询条件的查询结果经过排序以后的序号集合,和数据库中的threadID是不一样的。
这里的starIndex就是数组,也就是那个Block的下标,而里边的内容(Long object),是真正的threadID
代码里边对于每Block数组的大小,是固定的400。
举例来说:
如果一次查询返回1000条纪录,我要从第510条开始(startIndex=510),那么就是取第二块block(blockID=1),块起始位置(blockStart)是
500。
int blockID = startIndex / BLOCK_SIZE;
int blockStart = blockID * BLOCK_SIZE;
如果你还有耐性看到这里,并且接着读jive代码的话,会发现,加下来无非就是从Cache中取该Block数组,如果没有找到,则老老实实的从数据库中取出来,老老实实的放到数组里边,放到Cache,最后扔出这个数组。
这里的数据库处理代码比较普通
con = ConnectionManager.getConnection();
stmt = ConnectionManager.createScrollableStatement(con);
// Set the maximum number of rows to end at the end of this block.
ConnectionManager.setMaxRows(stmt, BLOCK_SIZE * (blockID+1));
ResultSet rs = stmt.executeQuery(query);
// Grab BLOCK_SIZE rows at a time.
ConnectionManager.setFetchSize(rs, BLOCK_SIZE); //一次最多取BLOCK_SIZE条,也就是400条
// Position the cursor right before the first row that we're insterested in.
ConnectionManager.scrollResultSet(rs, blockStart);// 滚动游标到blockStart
// Keep reading results until the result set is exhausted or
// we come to the end of the block.
int count = 0;
while (rs.next() && count < BLOCK_SIZE) {
objectList.add(rs.getLong(1));
count++;
}
看到这里,我忽然领悟到,这里的代码也只是复制而已,可是比我以前的复制到enumeration中要高级了好多。
首先,这里限制了jdbc返回结果集的大小。
其次,复制的内容只是一个“指针”(嘿嘿,我喜欢用这个词语)。
这样就比较好的解决了上面的速度慢和浪费内存的问题。
(C)嘿嘿,接下来的事情相对就很简单了。
1.根据startIndex计算出在该Block中的相对位置,也就是这个BlockArray中的下标啦,然后取得内容,也就是真正的threadID啦。
2.到threadCache中去取该threadObject,如果找不到,则老老实实的new thread(threadID),从数据库中去取了。
这一切都是通过ForumThreadIterator中的hasNext()/next()/getElement()来实现的。大家自己去看一下就很容易搞清楚啦。