Java 库的建立方法及其实例

任何一种面向对象语言都有它的库。任何一种面向对象的语言也都离不开库的支持。用我们熟悉的面向对象语言为例子,C++有STL,Java有API函数,具体到开发工具,Visual C++提供了MFC, Borland C++提供了OWL。也有很多第三方提供的库。我们在开发应用程序的时候,也发觉我们也许需要某些特定的库来完成特定的功能。那么,如何编写自己的库呢?

利用Java的面向对象特性,如封装,继承,和一些设计模式,我们可以用标准的方法来建立自己的库。需要明白的一点:在你需要完成某个功能的时候,不要用专有的、特定的方法去编写代码,而要全盘考虑,用通用的方法来完成,这样,在积累了一定数量的库以后,你就能重用这些库来完成新的功能,而不用每回都重头编写代码。这也是面向对象语言提供给我们的好处。也可以用J2EE的规范为例子,J2EE提供了一个CBT(Component Based Transaction),所有的组件都尊崇J2EE规范,在CBT中运行,这样,编写开发并且重用标准的通用的组件库,可以缩短开发周期节约成本,并且可以在任何符合J2EE规范的应用程序服务器(APPLICATION SERVER)中运行,并且可以继承,扩展已有的组件库完成新的任务或者适应新的变化。

在本文中,我将先讨论如何建立自己的库,需要根据哪些标准,然后给出一个简单的例子。在第二部分中,我将通过一个功能比较完善的库来做进一步的讨论。



什么是库?库是一个可以重用的组件,它采用通用的设计,完成通用的任务,可以节约开发者的时间,缩短开发周期节约开发成本。一个设计完善的库,并不只是为了完成某一个特定的任务,而是可以完成各种不同的任务。设计一个库是困难的。写一个算法并不难,但是设计库的时候需要一种比较好的结构,它能够被用在各种需要的环境下,完成各种不同的任务,但是还不能影响使用它的程序代码结构。

为什么要重用代码?重头开发一个新的软件,工作量是非常巨大的,不论你用什么工具什么语言。而代码重用能够节约大部分时间,而把时间花在新的功能的开发上。从一定的意义上来说,写一个新的软件是利用了现有的代码,重新拼装以实现新的功能。从另外一个角度上来讲,即使你没有打算把你写的代码变成一个通用的库并分发给其他人使用,从设计的角度来讲,采用一种全盘的通用的设计方法也能让你对所要完成的任务有更好的理解,并且优化你的设计过程,从而优化你的代码结构。

采用开发库并且让别人来使用它的方式,能够帮助你在使用它的时候发现它的设计上的缺陷或者代码中的错误,并帮助你改正它。比方说,你写了一个库让别人来使用,你不得不考虑通用的设计,因为你并不能预见别人将在什么环境下使用和使用的目的。在其他人使用你的库的过程中,可能会遇到一些问题,有的可能是你的文档写得不够清楚明白,有的也可能是你程序上的错误,也有可能是使用者觉得在结构上使用起来不方便或者不正确。那么你可以继续作一些修改工作,在保持结构和接口不变化的情况下,做一些调整。

在设计库的时候,你需要以一个使用者的眼光来看问题,考虑如何设计和实现它。你需要明白,

1、需要解决的问题是什么?需要达到一个什么目的?

2、使用者关心的问题是什么?使用者需要得到一个什么结果?

3、使用者不需要关心的问题是什么?什么细节是可以对使用者隐藏的?

下面,我们用一个简单的例子来说明如何设计和实现一个有用处的库。

设计一个网络服务程序,我们需要考虑几点:

1、监听一个端口

2、接受连接

3、读取或者写入连接的流

4、处理输入的数据,并且返回一个结果

对于我们将要实现的库来说,需要完成的是前三点,而最后一点我们留给使用者去实现,这也是使用者需要完成和关心的地方。

库的主要类叫做Server, 测试的类叫做EchoServer. EchoServer实现了一个简单的服务,从客户端读取数据,并且返回同样的数据。


设计原则一:封装

一个好的库必须是一个紧凑的关系紧密的整体,而不是一个分散的关系松散的对象的集合。

package是Java提供的一种类库的封装机制。一个package是一个Java类文件的集合,存放在同一个目录中。package有专有的名字空间。

专有的名字空间的一个好处是,你不用担心名称的冲突。因为,如果你的类的名称和别人的类的名称冲突,但是他们不在同一个package中,利用这一点可以避免名字的冲突。

每一个package都有一个字符串来代表,比如java.lang, 或者javax.swing.plaf.basic.实际上每一个类的全名都是由package的名字加上类的名字来代表的,这样就避免了名字的冲突,比如,java.lang.Object或者javax.swing.plaf.basic.BasicMenuBarUI.

注意,有一个特殊的package叫做default package。如果你不声明你的类属于任何一个package,那么它就被假定属于default package.

每一个package的名字都对应一个目录。比如,java.lang.Object 存放在java/lang/Object.java中,每一个.对应一个/. default package存放的目录是当前目录。

声明一个package.

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6">// Server.java<br>package mylib;<br>public class Server implements Runnable<br>{<br>// ...<br> </td></tr></tbody></table></ccid_nobr>
如果有import语句,必须放在package语句的后面。



当然你也可以引入别的package. 例如:

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6">import mylib.Server;<br><br>// ...<br><br>Server server = new Server( portNum ); <br> </td></tr></tbody></table></ccid_nobr>



Java允许你决定package中的哪些类对外部是可见的。public类可以被包外的代码使用,而private类则不行。

比如,让Server类能被外部的代码使用:

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6">// Server.java<br><br>package mylib;<br><br>import java.io.*;<br>import java.net.*;<br><br>public class Server implements Runnable<br>{ <br> </td></tr></tbody></table></ccid_nobr>



如果你不想让类被外部的代码使用,可以用缺省的属性,去掉public. 例如:

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6">// Reporter.java<br><br>package mylib;<br><br>class Reporter implements Runnable<br>{<br><br> </td></tr></tbody></table></ccid_nobr>



设计原则二:继承

在我们的例子中,Server是主要的类。如果你看这个类的代码,就能看到,它本身其实什么也不做。主循环用来监听连接。当连接建立以后,它把处理连接的任务交给一个叫做handleConnection()的函数。

// subclass must supply an implementation

abstract public void handleConnection( Socket s );

因为没有实现这一函数,所以这个类被声明为abstract,使用者必须实现这个函数。

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6">// This is called by the Server class when a connection<br>// comes in. "in" and "out" come from the incoming socket<br>// connection<br>public void handleConnection( Socket socket ) {<br>try {<br>InputStream in = socket.getInputStream();<br>OutputStream out = socket.getOutputStream();<br><br>// just copy the input to the output<br>while (true)<br>out.write( in.read() );<br><br>} catch( IOException ie ) {<br>System.out.println( ie );<br>}<br>}<br> </td></tr></tbody></table></ccid_nobr>



可以说,这一继承的过程叫做定制。因为在Server类中,并没有定义该函数的动作,而是把这个定义的过程留给使用者,让他们来完成所需要的特定的功能。

另外一个定制函数:cleanUp().

在设计类的时候,往往你能考虑到使用者需要的功能,例如上面的handleConnection().但是,也需要考虑另外一种定制,例如在这里,在Server退出后台运行方式的时候,调用了这个cleanUp()函数,在Server类中的实现为空,什么都不做,这把机会留给使用者,使用者可以用这个函数来做一些清除工作,这种函数也可以称之为"钩子"。

设计原则三:调试

没有人能够做到写出一个绝对完美的程序,没有任何的错误。所以,调试是不可缺少的。有时候,使用者可能会遇到一个问题,从而需要知道在库的代码中发生了什么问题。这个错误可能是库代码的问题,也可能是使用者的代码在库代码中引起的问题。

如果你提供了库的源代码,使用者可以用debugger来调试错误。但是,你不能完全依赖于调试器。在库代码中加入打印调试信息的语句,是一个好习惯。它可以帮助使用者明白,什么地方发生了错误。

下面的例子说明了这一技术。使用者的代码使用Server.setDebugStream(),指定一个PrintStream对象。然后,调试信息就被输出到这个流中。

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6">// set this to a print stream if you want debug info<br>// sent to it; otherwise, leave it null<br>static private PrintStream debugStream;<br><br>// call this to send the debugging output somewhere<br>static public void setDebugStream( PrintStream ps ) {<br>debugStream = ps;<br>} <br> </td></tr></tbody></table></ccid_nobr>





当使用者使用了调试的流的时候,你的库代码可以打印错误:

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6">// send debug info to the print stream, if there is one<br>static public void debug( String s ) {<br>if (debugStream != null)<br>debugStream.println( s );<br>}<br> </td></tr></tbody></table></ccid_nobr>



下面,来完整的看一看这个具体的例子:

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6">EchoServer<br><br><br><br><br><br><br>// $Id$<br><br>import java.io.*;<br>import java.net.*;<br>import mylib.*;<br><br>public class EchoServer extends Server<br>{<br>public EchoServer( int port ) {<br>// The superclass knows what to do with the port number, we<br>// don't have to care about it<br>super( port );<br>}<br><br>// This is called by the Server class when a connection<br>// comes in. "in" and "out" come from the incoming socket<br>// connection<br>public void handleConnection( Socket socket ) {<br>try {<br>InputStream in = socket.getInputStream();<br>OutputStream out = socket.getOutputStream();<br><br>// just copy the input to the output<br>while (true)<br>out.write( in.read() );<br><br>} catch( IOException ie ) {<br>System.out.println( ie );<br>}<br>}<br><br>protected void cleanUp() {<br>System.out.println( "Cleaning up" );<br>}<br><br>static public void main( String args[] ) throws Exception {<br>// Grab the port number from the command-line<br>int port = Integer.parseInt( args[0] );<br><br>// Have debugging info sent to standard error stream<br>Server.setDebugStream( System.err );<br><br>// Create the server, and it's up and running<br>new EchoServer( port );<br>}<br>}<br><br><br>mylib.Server<br><br><br><br><br><br><br>// $Id$<br><br>package mylib;<br><br>import java.io.*;<br>import java.net.*;<br><br>abstract public class Server implements Runnable<br>{<br>// the port we'll be listening on<br>private int port;<br><br>// how many connections we've handled<br>int numConnections;<br><br>// the Reporter that's reporting on this Server<br>private Reporter reporter;<br><br>// set this to true to tell the thread to stop accepting<br>// connections<br>private boolean mustQuit = false;<br><br>public Server( int port ) {<br>// remember the port number so the thread can<br>// listen on it<br>this.port = port;<br><br>// the constructor starts a background thread<br>new Thread( this ).start();<br><br>// and start a reporter<br>reporter = new Reporter( this );<br>}<br><br>// this is our background thread<br>public void run() {<br>ServerSocket ss = null;<br>try {<br><br>// get ready to listen<br>ss = new ServerSocket( port );<br><br>while( !mustQuit ) {<br><br>// give out some debugging info<br>debug( "Listening on "+port );<br><br>// wait for an incoming connection<br>Socket s = ss.accept();<br><br>// record that we got another connection<br>numConnections++;<br><br>// more debugging info<br>debug( "Got connection on "+s );<br><br>// process the connection -- this is implemented<br>// by the subclass<br>handleConnection( s );<br>}<br>} catch( IOException ie ) {<br>debug( ie.toString() );<br>}<br><br>debug( "Shutting down "+ss );<br><br>cleanUp();<br>}<br><br>// the default implementation does nothing<br>abstract public void handleConnection( Socket s );<br><br>// tell the thread to stop accepting connections<br>public void close() {<br>mustQuit = true;<br>reporter.close();<br>}<br><br>// Put any last-minute clean-up stuff in here<br>protected void cleanUp() {<br>}<br><br>// everything below provides a simple debug system for<br>// this package<br><br>// set this to a print stream if you want debug info<br>// sent to it; otherwise, leave it null<br>static private PrintStream debugStream;<br><br>// we have two versions of this ...<br>static public void setDebugStream( PrintStream ps ) {<br>debugStream = ps;<br>}<br><br>// ... just for convenience<br>static public void setDebugStream( OutputStream out ) {<br>debugStream = new PrintStream( out );<br>}<br><br>// send debug info to the print stream, if there is one<br>static public void debug( String s ) {<br>if (debugStream != null)<br>debugStream.println( s );<br>}<br>}<br><br><br>mylib.Reporter<br><br><br><br><br><br><br>// $Id$<br><br>package mylib;<br><br>class Reporter implements Runnable<br>{<br>// the Server we are reporting on<br>private Server server;<br><br>// our background thread<br>private Thread thread;<br><br>// set this to true to tell the thread to stop accepting<br>// connections<br>private boolean mustQuit = false;<br><br>Reporter( Server server ) {<br>this.server = server;<br><br> // create a background thread<br>thread = new Thread( this );<br>thread.start();<br>}<br><br>public void run() {<br>while (!mustQuit) {<br>// do the reporting<br>Server.debug( "server has had "+server.numConnections+" connections" );<br><br>// then pause a while<br>try {<br>Thread.sleep( 5000 );<br>} catch( InterruptedException ie ) {}<br>}<br>}<br><br>// tell the background thread to quit<br>public void close() {<br>mustQuit = true;<br>}<br>} </td></tr></tbody></table></ccid_nobr>



下面,我们以一个具体的有实际用处的类库来进一步讨论库的设计方法。这个库是jregex. (jregex.sourceforge.net)。这是一个用Java实现的兼容Perl 5.6的正则表达式的库。有很多这样的库,比如gnu.regexp,com.stevesoft.pat, 还有J2SE SDK 1.4中新增加的regex.为什么选用jregex呢?是因为它是目前源代码公开的regex库中兼容Perl 5.6的正则表达式,而且刚刚更新过源代码,并且是稳定版,另外一个就是,它的内核算法选用了NFA(Not Finite Automata)。



要了解一个包,在看源代码之前先应该看的就是它的API文档。那么,看文档的第一步应该看什么呢?当然是树形结构。

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6">Class Hierarchy<br>class java.lang.Object<br>class jregex.Matcher (implements jregex.MatchResult)<br>class jregex.Optimizer<br>class jregex.util.io.PathPattern<br>class jregex.Pattern (implements jregex.REFlags, java.io.Serializable)<br>class jregex.PerlSubstitution (implements jregex.Substitution)<br>class jregex.Replacer<br>class jregex.RETokenizer (implements java.util.Enumeration)<br>class java.lang.Throwable (implements java.io.Serializable)<br>class java.lang.Exception<br>class java.lang.RuntimeException<br>class java.lang.IllegalArgumentException<br>class jregex.PatternSyntaxException<br>class jregex.util.io.WildcardFilter (implements java.io.FilenameFilter)<br><br>Interface Hierarchy<br>interface jregex.MatchIterator<br>interface jregex.MatchResult<br>interface jregex.REFlags<br>interface jregex.Substitution<br>interface jregex.TextBuffer<br>interface jregex.Replacer.WriterWrap </td></tr></tbody></table></ccid_nobr>





--------------------------------------------------------------------------------



在一个正则表达式中,我们知道有两个元素很重要,第一个就是Pattern(模式), 第二个是Matcher(匹配结果字符串)。在jregex中,Pattern类实现了jregex.REFlags interface, 和java.io.Serializable。先来看看jregex.REFlags的说明。jregex.REFlags定义了一些静态的常量,看起来是一些标志。Pattern实现了jregex.REFlags, 也就是说,Pattern类中包含了这些静态的常量。

下一步,我们看看Pattern的API说明:

Pattern是一个预编译好的正则表达式的表示。要匹配一个正则表达式,先创建一个Pattern实例:

Pattern p=new Pattern(myExpr);



然后取得Matcher的实例

Matcher matcher=p.matcher(myText);

Matcher的实例是一个自动的匹配和搜索的对象。它提供如下方法:

搜索匹配结果: matcher.find() or matcher.findAll();

监测是否全文匹配 : matcher.matches();

监测是否匹配开头 : matcher.isStart();

带选项的查找 : matcher.find(int options)



标志

标志(参考REFlags)改变了在预编译的时候正则表达式符号的意义。这些标志是:



REFlags.IGNORE_CASE - 忽略大小写

REFlags.MULTILINE - 用^和$来表示一行文本的开头和结尾

REFlags.DOTALL - 用.来表示回车换行

REFlags.IGNORE_SPACES - 忽略空格

REFlags.UNICODE - 使用UNICODE, 即w, d不再被解释为正则表达式的意义,而是被解释为UNICODE.

REFlags.XML_SCHEMA - 使用XML语义。



线程

Pattern是线程安全的。也就是说,你可以在不同的线程中使用同一个Pattern的实例。

在API函数说明中,我们还能看到Pattern类的public方法。这一点将在下面有用处。先来看看:

构造函数

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6">Pattern(java.lang.String regex)<br>Compiles an expression with default flags.<br>Pattern(java.lang.String regex, int flags)<br>Compiles a regular expression using REFlags.<br>Pattern(java.lang.String regex, java.lang.String flags)<br>Compiles a regular expression using Perl5-style flags. <br> </td></tr></tbody></table></ccid_nobr>





方法

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6">int groupCount()<br>How many capturing groups this expression includes?<br>java.lang.Integer groupId(java.lang.String name)<br>Get numeric id for a group name.<br>Matcher matcher()<br>Returns a targetless matcher.<br>Matcher matcher(char[] data, int start, int end)<br>Returns a matcher for a specified region.<br>Matcher matcher(MatchResult res, int groupId)<br>Returns a matcher for a match result (in a performance-friendly way).<br>Matcher matcher(MatchResult res, java.lang.String groupName)<br>Just as above, yet with symbolic group name.<br>Matcher matcher(java.io.Reader text, int length)<br>Returns a matcher taking a text stream as target.<br>Matcher matcher(java.lang.String s)<br>Returns a matcher for a specified string.<br>Replacer replacer(java.lang.String expr)<br>Returns a replacer of a pattern by specified perl-like expression.<br>Replacer replacer(Substitution model)<br>Returns a replacer will substitute all occurences of a pattern through applying a user-defined substitution model.<br>RETokenizer tokenizer(char[] data, int off, int len)<br>Tokenizes a specified region by an occurences of the pattern.<br>RETokenizer tokenizer(java.io.Reader in, int length)<br>Tokenizes a specified region by an occurences of the pattern.<br>RETokenizer tokenizer(java.lang.String text)<br>Tokenizes a text by an occurences of the pattern.<br>java.lang.String toString_d()<br>Returns a less or more readable representation of a bytecode for the pattern.<br>java.lang.String toString() </td></tr></tbody></table></ccid_nobr>





接下来,我们来看看Pattern类的内容。这里有两种方法,一种是直接阅读源代码,另外一种是先用工具分析一下Pattern类的内容。这里,我采用第二种方法,用javap来看类的内容。

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6">[games]$javap -classpath .. -private jregex.Pattern<br>Compiled from jregex/Pattern.java<br>public class jregex.Pattern extends java.lang.Object implements java.io.Serializable, jregex.REFlags {<br>java.lang.String stringRepr;<br>jregex.Term root;<br>jregex.Term root0;<br>int memregs;<br>int counters;<br>int lookaheads;<br>java.util.Hashtable namedGroupMap;<br>private jregex.Pattern() throws jregex.PatternSyntaxException;<br>public jregex.Pattern(java.lang.String) throws jregex.PatternSyntaxException;<br>public jregex.Pattern(java.lang.String,java.lang.String) throws jregex.PatternSyntaxException;<br>public jregex.Pattern(java.lang.String,int) throws jregex.PatternSyntaxException;<br>private void compile(java.lang.String, int) throws jregex.PatternSyntaxException;<br>public int groupCount();<br>public java.lang.Integer groupId(java.lang.String);<br>public jregex.Matcher matcher();<br>public jregex.Matcher matcher(java.lang.String);<br>public jregex.Matcher matcher(char[], int, int);<br>public jregex.Matcher matcher(jregex.MatchResult, int);<br>public jregex.Matcher matcher(jregex.MatchResult, java.lang.String);<br>public jregex.Matcher matcher(java.io.Reader, int) throws java.io.IOException;<br>public jregex.Replacer replacer(java.lang.String);<br>public jregex.Replacer replacer(jregex.Substitution);<br>public jregex.RETokenizer tokenizer(java.lang.String);<br>public jregex.RETokenizer tokenizer(char[], int, int);<br>public jregex.RETokenizer tokenizer(java.io.Reader, int) throws java.io.IOException;<br>public java.lang.String toString();<br>public java.lang.String toString_d();<br>static int parseFlags(java.lang.String) throws jregex.PatternSyntaxException;<br>static int parseFlags(char[], int, int) throws jregex.PatternSyntaxException;<br>private static int getFlag(char) throws jregex.PatternSyntaxException;<br>} </td></tr></tbody></table></ccid_nobr>





其中,要关心private和protected成员,因为在使用类的时候,我们只要关心public成员就行了,但是,要阅读源代码,明白类的构成,就必须注意private和protected成员。

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6">private Pattern() throws PatternSyntaxException{}<br> public Pattern(String regex) throws PatternSyntaxException{<br>this(regex,DEFAULT);<br> }<br> public Pattern(String regex,String flags) throws PatternSyntaxException{<br>stringRepr=regex;<br>compile(regex,parseFlags(flags));<br> }<br> public Pattern(String regex, int flags) throws PatternSyntaxException{<br>stringRepr=regex;<br>compile(regex,flags);<br> } <br> </td></tr></tbody></table></ccid_nobr>





可以看出,构造函数中,有一个缺省的构造函数是private。而第二个调用了最后一个构造函数,用this()。第三个和最后一个都是用了一个函数compile来完成构造正则表达式的任务。在上面javap的输出我们也可以看到,compile是一个private函数。

来看看它的说明:

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6">private void compile(String regex,int flags) throws PatternSyntaxException{<br>Term.makeTree(regex,flags,this);<br> }<br> </td></tr></tbody></table></ccid_nobr>



具体到Term类,超出了本文的范围,它采用了hashtable等方法,构造了一个正则表达式,并返回。而我们关心的是库的结构。从这里我们可以明白一点:构造函数往往需要调用另外一个构造函数来完成,而不需要把同样的代码在各个构造函数中都实现。同时,也可以采用另外一个private函数来完成构造函数的功能,而只要在构造函数中调用它就行了。

从Matcher API说明文档中,我们可以看到,有两种通过Pattern实例构造Matcher实例的方法,而在javap的输出中可以看到,有几种不同的matcher函数。

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6"> public Matcher matcher(){<br>return new Matcher(this);<br> }<br> public Matcher matcher(String s){<br>Matcher m=new Matcher(this);<br>m.setTarget(s);<br>return m;<br> }<br> public Matcher matcher(char[] data,int start,int end){<br>Matcher m=new Matcher(this);<br>m.setTarget(data,start,end);<br>return m;<br> }<br> public Matcher matcher(MatchResult res,int groupId){<br>Matcher m=new Matcher(this);<br>if(res instanceof Matcher){<br> m.setTarget((Matcher)res,groupId);<br>}<br>else{<br> m.setTarget(res.targetChars(),res.start(groupId)+res.targetStart(),res.length(groupId));<br>}<br>return m;<br> }<br> public Matcher matcher(Reader text,int length)throws IOException{<br>Matcher m=new Matcher(this);<br>m.setTarget(text,length);<br>return m;<br> } </td></tr></tbody></table></ccid_nobr>



以上都是用来实现第一种返回matcher的方法。可以看到,这几种实现都是通过new Matcher实例,以this(即Pattern实例)为参数,然后根据参数不同调用Matcher.setTarget()方法。

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6"> public Matcher matcher(MatchResult res,String groupName){<br>Integer id=res.pattern().groupId(groupName);<br>if(id==null) throw new IllegalArgumentException("group not found:"+groupName);<br>int group=id.intValue();<br>return matcher(res,group);<br> } <br> </td></tr></tbody></table></ccid_nobr>



这是第二种返回matcher的方法。

从这里我们可以发现一种比较好的方法:当你需要两个互相关联的类,一个类的实例需要构造另一个类的实例,可以在第一个类中用一个public方法,方法实现为调用第二个类的构造函数,并可以用构造出来的实例调用其他方法,根据第一个类的实例的数据来设置第二个类的实例。

同样的,也有Replacer, 和Tokenizer的构造方法。

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6"> public Replacer replacer(String expr){<br>return new Replacer(this,expr);<br> }<br><br>/**<br> * Returns a replacer will substitute all occurences of a pattern<br> * through applying a user-defined substitution model.<br> * @param model a Substitution object which is in charge for match substitution<br> * @see Replacer<br> */<br> public Replacer replacer(Substitution model){<br>return new Replacer(this,model);<br> }<br> public RETokenizer tokenizer(String text){<br>return new RETokenizer(this,text);<br> }<br><br>/**<br> * Tokenizes a specified region by an occurences of the pattern.<br> * Note that a series of adjacent matches are regarded as a single separator.<br> * The same as new RETokenizer(Pattern,char[],int,int);<br> * @see RETokenizer<br> * @see RETokenizer#RETokenizer(jregex.Pattern,char[],int,int)<br> */<br> public RETokenizer tokenizer(char[] data,int off,int len){<br>return new RETokenizer(this,data,off,len);<br> }<br><br>/**<br> * Tokenizes a specified region by an occurences of the pattern.<br> * Note that a series of adjacent matches are regarded as a single separator.<br> * The same as new RETokenizer(Pattern,Reader,int);<br> * @see RETokenizer<br> * @see RETokenizer#RETokenizer(jregex.Pattern,java.io.Reader,int)<br> */<br> public RETokenizer tokenizer(Reader in,int length) throws IOException{<br>return new RETokenizer(this,in,length);<br> } </td></tr></tbody></table></ccid_nobr>





回忆一下,我在本文的开头,曾经提到过:"一个好的库必须是一个紧凑的关系紧密的整体,而不是一个分散的关系松散的对象的集合。"从API说明文档所显示的这个库的树形结构,并不能看出这些类之间的联系。而从源代码的角度,我们则可以清楚地看到这一点。在这一部分的讨论中,我们也明白了两点:

1、如何编写重载构造函数

2、在一个类的实例中返回另外一个类的实例



接下来,看看Matcher类。这个类实现了MatchResult interface. 看看MatchResult的定义:

<ccid_nobr></ccid_nobr>
jregex.MatchResult定义了一些abstract函数。有什么作用?在后面我们将会讨论到。

再看看Matcher的实现。

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6">[games]$javap -classpath .. -s jregex.Matcher<br>Compiled from jregex/Matcher.java<br>public class jregex.Matcher extends java.lang.Object implements jregex.MatchResult {<br>public static final int ANCHOR_START;<br>/* I */<br>public static final int ANCHOR_LASTMATCH;<br>/* I */<br>public static final int ANCHOR_END;<br>/* I */<br>public static final int ACCEPT_INCOMPLETE;<br>/* I */<br>jregex.Matcher(jregex.Pattern);<br>/* (Ljregex/Pattern;)V */<br>public final void setTarget(jregex.Matcher, int);<br>/* (Ljregex/Matcher;I)V */<br>public void setTarget(java.lang.String);<br>/* (Ljava/lang/String;)V */<br>public void setTarget(java.lang.String, int, int);<br>/* (Ljava/lang/String;II)V */<br>public void setTarget(char[], int, int);<br>/* ([CII)V */<br>public final void setTarget(char[], int, int, boolean);<br>/* ([CIIZ)V */<br>public void setTarget(java.io.Reader, int) throws java.io.IOException;<br>/* (Ljava/io/Reader;I)V */<br>public final boolean isStart();<br>/* ()Z */<br>public final boolean matches();<br>/* ()Z */<br>public final boolean matches(java.lang.String);<br>/* (Ljava/lang/String;)Z */<br>public void setPosition(int);<br>/* (I)V */<br>public final boolean find();<br>/* ()Z */<br>public final boolean find(int);<br>/* (I)Z */<br>public jregex.MatchIterator findAll();<br>/* ()Ljregex/MatchIterator; */<br>public jregex.MatchIterator findAll(int);<br>/* (I)Ljregex/MatchIterator; */<br>public final boolean proceed();<br>/* ()Z */<br>public final boolean proceed(int);<br>/* (I)Z */<br>public final void skip();<br>/* ()V */<br>public java.lang.String toString();<br>/* ()Ljava/lang/String; */<br>public jregex.Pattern pattern();<br>/* ()Ljregex/Pattern; */<br>public java.lang.String target();<br>/* ()Ljava/lang/String; */<br>public char targetChars()[];<br>/* ()[C */<br>public int targetStart();<br>/* ()I */<br>public int targetEnd();<br>/* ()I */<br>public char charAt(int);<br>/* (I)C */<br>public char charAt(int, int);<br>/* (II)C */<br>public final int length();<br>/* ()I */<br>public final int start();<br>/* ()I */<br>public final int end();<br>/* ()I */<br>public java.lang.String prefix();<br>/* ()Ljava/lang/String; */<br>public java.lang.String suffix();<br>/* ()Ljava/lang/String; */<br>public int groupCount();<br>/* ()I */<br>public java.lang.String group(int);<br>/* (I)Ljava/lang/String; */<br>public java.lang.String group(java.lang.String);<br>/* (Ljava/lang/String;)Ljava/lang/String; */<br>public boolean getGroup(int, jregex.TextBuffer);<br>/* (ILjregex/TextBuffer;)Z */<br>public boolean getGroup(java.lang.String, jregex.TextBuffer);<br>/* (Ljava/lang/String;Ljregex/TextBuffer;)Z */<br>public boolean getGroup(int, java.lang.StringBuffer);<br>/* (ILjava/lang/StringBuffer;)Z */<br>public boolean getGroup(java.lang.String, java.lang.StringBuffer);<br>/* (Ljava/lang/String;Ljava/lang/StringBuffer;)Z */<br>public java.lang.String groups()[];<br>/* ()[Ljava/lang/String; */<br>public java.util.Vector groupv();<br>/* ()Ljava/util/Vector; */<br>public final boolean isCaptured();<br>/* ()Z */<br>public final boolean isCaptured(int);<br>/* (I)Z */<br>public final boolean isCaptured(java.lang.String);<br>/* (Ljava/lang/String;)Z */<br>public final int length(int);<br>/* (I)I */<br>public final int start(int);<br>/* (I)I */<br>public final int end(int);<br>/* (I)I */<br>public java.lang.String toString_d();<br>/* ()Ljava/lang/String; */<br>static {};<br>/* ()V */ </td></tr></tbody></table></ccid_nobr>



先来看看它的构造函数,这个函数在Pattern中被调用用来构造Matcher类的实例。

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6"> Matcher(Pattern regex){<br> //注意下面这一行,它说明Matcher类的内部有一个指向Pattern实例的reference.<br>this.re=regex;<br>//int memregCount=(memregs=new MemReg[regex.memregs]).length;<br>//for(int i=0;i<memregcount> // this.memregs[i]=new MemReg(-1); //unlikely to SearchEntry, in this case we know memreg indicies by d<br>efinition<br>//}<br>//counters=new int[regex.counters];<br>//int lookaheadCount=(lookaheads=new LAEntry[regex.lookaheads]).length;<br>//for(int i=0;i<lookaheadcount> // this.lookaheads[i]=new LAEntry();<br>//}<br>//定义了一些内部的数据,MemReg是一个有三个整数的类。类的声明见下。<br>int memregCount,counterCount,lookaheadCount;<br>if((memregCount=regex.memregs)&gt;0){<br> MemReg[] memregs=new MemReg[memregCount];<br> for(int i=0;i<memregcount> memregs[i]=new MemReg(-1); //unlikely to SearchEntry, in this case we know memreg indicies by defin<br>ition<br> }<br> this.memregs=memregs;<br>}<br><br>if((counterCount=regex.counters)&gt;0) counters=new int[counterCount];<br>//定义了一些内部的数据。类的声明见下。<br>if((lookaheadCount=regex.lookaheads)&gt;0){<br> LAEntry[] lookaheads=new LAEntry[lookaheadCount];<br> for(int i=0;i<lookaheadcount> lookaheads[i]=new LAEntry();<br> }<br> this.lookaheads=lookaheads;<br>}<br><br>this.memregCount=memregCount;<br>this.counterCount=counterCount;<br>this.lookaheadCount=lookaheadCount;<br><br>first=new SearchEntry(memregCount,counterCount);<br>defaultEntry=new SearchEntry(memregCount,counterCount);<br>minQueueLength=regex.stringRepr.length()/2; // evaluation!!!<br> }<br></lookaheadcount></memregcount></lookaheadcount></memregcount> </td></tr></tbody></table></ccid_nobr>
把这两个类说明为default属性,说明这两个类在jregex这个包的内部可见,而在外部是不可见的。这两个类的作用是专有的,而不是通用的。回忆一下本文前面提到过的,包的封装,"如果你不想让类被外部的代码使用,可以用缺省的属性,去掉public."

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6">class MemReg{<br> int index;<br><br> int in=-1,out=-1;<br> int tmp=-1; //for assuming at GROUP_IN<br><br> MemReg(int index){<br>this.index=index;<br> }<br><br> void reset(){<br>in=out=-1;<br> }<br>}<br><br>class LAEntry{<br> int index;<br> SearchEntry top,actual;<br>} </td></tr></tbody></table></ccid_nobr>

另外,关于包的结构和包中的类的关系,我们感兴趣的还有,MatchIterator。

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6">[games]$javap -classpath .. -s jregex.MatchIterator<br>Compiled from jregex/MatchIterator.java<br>public interface jregex.MatchIterator<br>/* ACC_SUPER bit NOT set */<br>{<br>public abstract boolean hasMore();<br>/* ()Z */<br>public abstract jregex.MatchResult nextMatch();<br>/* ()Ljregex/MatchResult; */<br>public abstract int count();<br>/* ()I */<br>} </td></tr></tbody></table></ccid_nobr>
这是一个interface, 定义了iterator的常用方法,列出所有的MatchResult的实例。

从这里可以看出,定义一个MatchResult interface然后再用Matcher来实现这个interface是一种比较好的方法。因为,这样定义了比较好的层次结构,对于后面的扩展,程序的更新发展都有比较大的好处。在这里也可以看出,MatchIterator的方法返回的也是MatchResult interface, 而不是Matcher类。同时可以看到MatchIterator本身也是一个interface。这就体现了另外一个我们需要明白的重要问题:对interface编程,而不是对类编程。具体说来,如果在以后重新写了一个新的类,叫做AnotherMatcher, 同样也是实现MatchResult interface, 在AnotherMatcher中同样可以使用方法来返回一个MatchIterator的实例,它也许是Matcher类的实例,也可以是AnotherMatcher类的实例。但是,虽然我们作了很多改动,但是没有影响到以前的程序,不需要对以前的程序作任何的改动。从使用者的角度来看,如果他只是使用了MatchResult和MatchIterator这两个interfaces中定义的方法,那么,不论是用Matcher还是AnotherMatcher,他都不需要修改他的代码。

下一个需要看的函数是findAll().

<ccid_nobr><table cellspacing="0" bordercolordark="#ffffff" cellpadding="0" width="550" bordercolorlight="black" border="1"><tbody><tr><td class="code" bgcolor="#e6e6e6">//调用了带参数的重载函数findAll(int)<br> public MatchIterator findAll(){<br>return findAll(0);<br> }<br><br>/**<br> * Returns an iterator over the matches found by subsequently calling find(options), the search starts from t<br>he zero position.<br> */<br> public MatchIterator findAll(final int options){<br>//setPosition(0);<br>//不用关心具体的实现方法,但是我们可以看到,在这里它定义了一个anonymous inner class, 这个inner class实现了MatchIterator,用于把Matcher中匹配到的结果一个个的返回。这个inner class的对象实例的reference被findAll()方法返回。能够用于外部的一个reference,并能读出这些结果。这也是一种需要注意的方法。<br>return new MatchIterator(){<br> private boolean checked=false;<br> private boolean hasMore=false;<br> public boolean hasMore(){<br>if(!checked) check();<br>return hasMore;<br> }<br> public MatchResult nextMatch(){<br>if(!checked) check();<br>if(!hasMore) throw new NoSuchElementException();<br>checked=false;<br>return Matcher.this;<br> }<br> private final void check(){<br>hasMore=find(options);<br>checked=true;<br> }<br> public int count(){<br>if(!checked) check();<br>if(!hasMore) return 0;<br>int c=1;<br>while(find(options))c++;<br>checked=false;<br>return c;<br> }<br>};<br> } </td></tr></tbody></table></ccid_nobr>


在上面这段代码中,我们明白了如下3点:

1、对interface编程,而不是对类编程。

2、如何编写一个iterator(迭代器)。需要有起码的两个函数:hasMore(), NextElement()。这样,使用者可以用如下循环读取迭代器中的内容:

for(;iterator.hasMore();)

iterator.NextElement();

3、把处理方法和处理结果分开。用Matcher来表示匹配的方法的具体实现,而把结果放在另外一个类中。这样做的好处是处理方法和结果分开,更加的灵活可以任意的更改处理的方法,而结果类不受到影响。也可以更改结果类的读取方式,但是不影响处理方法类的实现。这种方法已经被J2SE SDK中的很多集合类所使用。也可以参考它们的实现方法。

当然,还有一点需要注意的就是使用了匿名的inner class方法。

jregex中可以讨论的问题还有很多,比如它所采用的Not Finite Automata方法,它所采用的正则表达式规范等等。但是,作为本文所讨论的范围,即如何设计和实现一个库,已经可以展示它的设计方法了。有兴趣的读者可以到jregex.sourceforge.net下载它的源代码包,二进制文件包,使用范例和文档说明做进一步的研究。

小结:

在本文中,我们讨论了设计和实现一个Java库的若干原则,并用一个简单的例子来说明了这些原则。随后,我们用一个实际应用范围很广的库来讨论了其他的一些需要注意的问题。

设计原则一:封装

一个好的库必须是一个紧凑的关系紧密的整体,而不是一个分散的关系松散的对象的集合。

设计原则二:继承

采用abstract函数,interface, 和"钩子"函数。

设计原则三:调试

在库代码中加入打印调试信息的语句。

以及一些设计方法:

1、如何编写重载构造函数。

2、在一个类的实例中返回另外一个类的实例

3、对interface编程,而不是对类编程。

4、如何编写一个iterator(迭代器)。

5、把处理方法和处理结果分开。

6、如何使用inner class.


同时,我们也讨论了阅读一个Java库源代码的方法:

1、阅读API文档说明,库的树形结构,明白类,interface的关系。

2、用javap来列出类的函数说明,变量,interface中定义的函数,常量等等。

3、注意private, protected函数。

你可能感兴趣的:(java)