摘要:

本文推荐的一个叫Amber的框架提供了一种相反的轻量级实现。这种实现利用Java注解(annotations)来管理JavaBeans的CRUD周期(Create Read Update Delete)。事务处理被交还给数据库,而XML映射描述符则被注解代替。本文所面向的读者是那些对不使用XML描述符来有效操纵数据库感兴趣的Java中级开发者。

计算机业中有一条不成文的说法:面向对象软件和关系数据库之间的数据共享,最好通过对象/关系(O/R)映射框架来进行,而这种框架是实体关系(ER)模型依赖于面向对象模型的。本文推荐的一个叫Amber的框架提供了一种相反的轻量级实现。这种实现利用Java注解(annotations)来管理JavaBeans的CRUD周期(Create Read Update Delete)。事务处理被交还给数据库,而XML映射描述符则被注解代替。本文所面向的读者是那些对不使用XML描述符来有效操纵数据库感兴趣的Java中级开发者。


动机

普通O/R映射框架是非常强大的;但是在介绍如何设计和部署时,一些问题却很少被提及。我们将列出这些缺点,并针对这些问题来演示一个叫Amber的框架。
1.        OO驱动的数据模型导致了过于简单的ER模型。
2.        XML描述符使得维护困难。
3.        在O/R层进行事务处理非常困难。
4.        现有框架的学习曲线相对陡峭。

在两种模型之间交换数据,比如ER模型和OO模型,必须克服所谓的阻抗不匹配。对于大多数O/R模型工具来说,对象模型处于支配地位。大体上,这意味着Java持久层负责从现有的对象模型生成ER模型。这个主意非常引人注目,因为当商务模型确定以后,开发团队就再也不需要担心持久化的问题了。

对于常规的O/R工具而言,ER模型是一个结果,一个产物,顶多是一个容器。而商务过程实际上是按ER模型设计的,这就导致了两者之间的不协调。这样的话,ER模型的调整就非常困难,甚至是不可能的,因为O/R框架可能会在任何时候重构ER模型。同样,当商务过程发生改变时,O/R域的调整会自动重构ER域,于是ER模型变得令人费解,并且有时性能会下降到临界点。

还有另一个问题。会被持久化的类需要在外部XML描述(映射)文件中部署。初看不错,但是当我们处理现存的系统时,这很快就成了烦人的事。只要发生了一点变动,就得有不只一个地方需要修改,也就是源代码和映射文件。

最后,现有的O/R框架是为了处理事务而设计的。综合来看,这不是必须的,因为存储容器(例如关系数据库)是非常傻的容器。尽管我们不得不进行事务处理,但那并不是我们想要的。这些应该是数据库的事。

介绍Amber

Amber从相反的角度来解决数据交换的问题。它采用ER模型为参考来确立OO结构。它还采用存储过程作为数据库访问主要方式,存储过程提供了访问数据库的唯一途径,并且完全的建立起事务处理机制。最后中间层会被实现为一系列存储过程的集合。这意味着ER模型的专家,数据库管理员要负责设计和优化包括存储过程在内的一系列问题,于是比起自动创建的系统,新的系统能够拥有更好的结构,更快的速度和更安全的访问。因此,许多难题迎刃而解。
•        事务能够(或者说应该)被封装进存储过程。
•        读操作仅返回结果集合。
•        写操作只需要调用存储过程,而不是在Java代码中嵌入SQL。
•        使用存储过程,就不会因为SQL注入而导致安全漏洞。

当然,这意味着通常在Java代码中处理的事被转移到存储过程中了。这样不会有人犯错了。这对Java开发者来说有莫大的好处。

映射

Amber的核心在于,不管被提交到数据库的查询是什么,查询结果都是一列Java对象。当然,这是从Java开发者的角度来看的。那么剩下的问题只是把字段映射到对象的属性。以及在把数据写入数据库时,把Java对象的属性映射到存储过程的参数。

Amber把结果集映射到JavaBean,并用相同的机制在增删改时把bean的内容映射到参数。对于JavaBean的相关信息和定义,请查看资源那一段。

这种做法用到了Java语言的新特性,这个叫做注解的特性是从J2SE 5.0开始使用的。

注解,在JSR 175中也叫做“元数据”,是一种辅助代码,可以用来提供类,方法,属性的详细信息。在Javadoc API中,元数据本来是为了用来内联文档的。所以,在不干扰正常代码的前提下,注解可以用来描述代码的具体作用。如果你想知道关于注解更多的信息以及作用,请参考Tiger: A Developer's Notebook,或者看看我写的一篇更有趣的文章" Annotations to the Rescue"。

一步一步来

我们来解决一个小的持久化问题。从数据库读取一列Jedi对象,我们假设返回的结果集看起来像下面的表格。请注意,我们接下来的讨论并不依赖于这些表格,尽管这些例子实际上都是基于这些表格的。一般来说,我们得到的表列数据是通过使用少量的SQL连接多个表或者视图来得到的。(当然,先向星球大战的爱好者们告罪。)


我们先定义一个叫Jedi的简单类。
public class Jedi {

   private Integer _id;
   private String _name;
   private Double _forceRating;
   private Integer _age;
   private Boolean _alive;

   @ColumnAssociation(name="jedi_id")
   public void setId( Integer id ) {
      _id = id;
   }
   @ColumnAssociation(name="name")
   public void setName( String name ) {
      _name = name;
   }
   @ColumnAssociation(name="force_rating")
   public void setForceRating( Double fr ) {
      _forceRating = fr;
   }
   @ColumnAssociation(name="age")
   public void setAge( Integer age ) {
      _age = age;
   }
   @ColumnAssociation(name="alive")
   public void setAlive( Boolean alive ) {
      _alive = alive;
   }

   @ParameterAssociation(name="@jedi_id",
   index=0, isAutoIdentity=true)
   public Integer getId() {
      return _id;
   }
   @ParameterAssociation(name="@name", index=1)
   public String getName() {
      return _name;
   }
   @ParameterAssociation(name="@force_rating",
   index=2)
   public Double getForceRating() {
      return _forceRating;
   }
   @ParameterAssociation(name="@age", index=3)
   public Integer getAge() {
      return _age;
   }
   @ParameterAssociation(name="@alive", index=4)
   public Boolean getAlive() {
      return _alive;
   }
}


这里发生了什么?你在类中看到getter和setter方法上面有两种注解。

注解@ColumnAssociation用来把JavaBean中的setter方法和结果集中的一个字段连接起来,这样从数据库中得到的表列数据就能够被Amber 写入bean的属性里。注解@ColumnAssociation只适用于setter方法,因为Amber使用这些注解以及从数据库中读取的相应值来寻找和调用那些方法。

同样,getter方法需要@ParameterAssociation注解来把JavaBean的属性和调用增删改操作时的参数连接起来。这个注解只适用于getter方法,因为Amber使用getter方法来把值填到参数里。因为JDBC的缘故,需要提供参数的索引。这个也许的多余的,取决于数据库以及存储过程是否需要,不过为了完整性,以及遵循JDBC API规范,最好还是提供一下。

必须提供一个无参数的构造函数,因为这个类会被自动构造(通过反射)。在上面的类中,没有无参数构造函数是允许的,因为我们没有提供其他的构造函数,但是当我们增加了额外的构造函数时,就必须提供一个明确的给Amber。

这个JavaBean的作用是从数据库里读出数据以及写回数据库。完全不需要外部的描述文件。注意,我们也可以用这种方式建立任何类,不只是JavaBean。

你也许会奇怪:为什么用注解?为什么不是像JavaBean那样通过属性名来隐式关联?我们这么做,是为了让我们的设计保持一定的自由度。换句话说,我们的Java代码不需要依赖于ER模型设计的字段名。如果你已经习惯于操作表,你也许不同意这点,但是当你使用的存储过程里需要连接表和视图时,你就不得不使用别名。

Amber的连接器和JDBC

在我们开始读写数据库之前,我们需要与数据库建立连接。Amber使用一个Connector来访问数据库。简单说来,这就是把数据库驱动和连接字符串结合使用而已。在应用中,我们使用一个ConnectorFactory来管理可用连接。像下面的代码那样,我们使用一个本地的type-4驱动来初始化一个到SQL server的连接。我们假设服务器的名字是localhost,数据库的名字是jedi,用户名是use,密码是theforce,为了简单一点,我在下面的代码中省略了全部的异常处理。
String driverClassName = 
   "com.microsoft.jdbc.sqlserver.SQLServerDriver";
String url =
   "jdbc:microsoft:sqlserver://" +
   "localhost;databasename=jedi;" +
   "user=use;pwd=theforce";
Amber's Connector is associated with a String, alias under which it remains accessible from the ConnectorFactory. Here, we're going to use the alias starwars.
Amber的Connector使用一个String作为别名来从ConnectorFactory获取连接,接下来,我们将使用别名starwars。
ConnectorFactory.getInstance().add(
   "starwars", driverClassName, url
);


因为Connector是对JDBC连接的轻量级封装,所以我们可以像以前一样操作这个连接。

读取

封装在Connector外面的是一个BeanReader对象,它需要一个Connector和一个Class来告诉reader从数据库读出的bean是什么类型的。现在读取一列Jedi对象就只需要下面几行了。
Connector connector = 
   ConnectorFactory.createConnector( "starwars" );
BeanReader reader =
   new BeanReader( Jedi.class, connector );
Collection<Jedi> jediList =
   reader.executeCreateBeanList(
      "select * from jedi"
   );


这段代码使用了一种叫泛型的新特性,这种特性是从J2SE 5.0开始使用的。Collection声明的那行代码表明jediList一律由Jedi类型的对象组成。编译器在这里会发出警告,reader只有在运行时刻才知道会产生什么类型的对象。因为在J2SE 5.0中,泛型在执行的时候会把类型信息抹掉,所以可能导致不安全的类型转换。非常遗憾的,因为同一原因,我们不能把BeanReader写成BeanReader<Jedi>。简单说,就是Java的反射和泛型不能混合使用。

那么复合结构会如何呢?好吧,我们有几种方法可以处理这个问题。比如,我们在Jedi和Fighter (例如,每个Jedi有好几艘太空战斗机)之间有一个一对多的关系。在数据库中,Fighter的数据看起来像下面那样。


换句话说,Luke有两艘战斗机(X-和B-Wing),Yoda则拥有一艘Star Destroyer,而Obi Wan已经死掉了。

数据之间的关系在OO域中有几种方法可以模型化。我们只挑选最简单的那种。所以我们需要Jedi类可以拥有一组Fighter对象作为成员。下面的Fighter类是为了让Amber使用而建立的。
public class Fighter {

   private Integer _id;
   private Integer _jediId;
   private String _name;
   private Double _firepowerRating;
   private Boolean _turboLaserEquipped;

   @ColumnAssociation(name="fighter_id")
   public void setId( Integer id ) {
      _id = id;
   }
   @ColumnAssociation(name="jedi_id")
   public void setJediId( Integer jediId ) {
      _jediId = jediId;
   }
   @ColumnAssociation(name="name")
   public void setName( String name ) {
      _name = name;
   }
   @ColumnAssociation(name="firepower_rating")
   public void setFirepowerRating( Double firepowerRating ) {
      _firepowerRating = firepowerRating;
   }
   @ColumnAssociation(name="turbo_laser_equipped")
   public void setTurboLaserEquipped(
      Boolean turboLaserEquipped ) {
      _turboLaserEquipped = turboLaserEquipped;
   }
   @ParameterAssociation(name="@fighter_id",
      index=0,isAutoIdentity=true)
   public Integer getId() {
      return _id;
   }
   @ParameterAssociation(name="@jedi_id",index=1)
   public Integer getJediId() {
      return _jediId;
   }
   @ParameterAssociation(name="@name",index=2)
   public String getName() {
      return _name;
   }
   @ParameterAssociation(name="@firepower_rating",
      index=3)
   public Double getFirepowerRating() {
      return _firepowerRating;
   }
   @ParameterAssociation(name="@turbo_laser_equipped",
      index=4)
   public Boolean getTurboLaserEquipped() {
      return _turboLaserEquipped;
   }
}


下面的是改进后的Jedi类。它新增加了一个List<Fighter>类型的成员。下面的J2SE 5.0代码表明链表只包含Fighter类型的对象。新增加的代码用粗体表示。
public class Jedi {

   private Integer _id;
   private String _name;
   private Double _forceRating;
   private Integer _age;
   private Boolean _alive;
  
   private ArrayList<Fighter> _fighterList =
      new ArrayList<Fighter>();
  
   @ColumnAssociation(name="jedi_id")
   public void setId( Integer id ) {
      _id = id;
   }
   @ColumnAssociation(name="name")
   public void setName( String name ) {
      _name = name;
   }
   @ColumnAssociation(name="force_rating")
   public void setForceRating( Double forceRating ) {
      _forceRating = forceRating;
   }
   @ColumnAssociation(name="age")
   public void setAge( Integer age ) {
      _age = age;
   }
   @ColumnAssociation(name="alive")
   public void setAlive( Boolean alive ) {
      _alive = alive;
   }

   @ParameterAssociation(name="@jedi_id",
      index=0, isAutoIdentity=true)
   public Integer getId() {
      return _id;
   }
   @ParameterAssociation(name="@name", index=1)
   public String getName() {
      return _name;
   }
   @ParameterAssociation(name="@force_rating",
      index=2)
   public Double getForceRating() {
      return _forceRating;
   }
   @ParameterAssociation(name="@age", index=3)
   public Integer getAge() {
      return _age;
   }
   @ParameterAssociation(name="@alive", index=4)
   public Boolean getAlive() {
      return _alive;
   }
   public ArrayList<Fighter> getFighterList() {
      return _fighterList;
   }
   public void setFighterList( ArrayList<Fighter> fighterList ) {
      _fighterList = fighterList;
   }
}


从数据库读取Jedis的代码看起来像下面这样:
Connector connector = 
   ConnectorFactory.getInstance().createConnector( "starwars" );
BeanReader jediReader =
   new BeanReader( Jedi.class, connector );
BeanReader fighterReader =
   new BeanReader( Fighter.class, connector );
Collection<Jedi> jediList =
   reader.executeCreateBeanList( "select * from jedi" );
for( Jedi jedi : jediList ) {
   String query =
      "select * from fighter where jedi_id = " + jedi.getId();
   Collection<Fighter> fighters =
      fighterReader.executeCreateBeanList( query );
   jedi.setFighterList(
      new ArrayList<Fighter>( fighters ) );
}


瞧,这就是Jedi们拥有的战斗机了。请注意,我们并没有敲出把Fighter读进Jedi的代码。因为Jedi和Fighter会严格的匹配。你会说上面的代码在依赖注入模式中只是一些部件。也许我是在说大话,我只想说:把互相依赖的东西分开,并且使分布在各处的代码共同工作。如果你想在这方面知道得更多,请看Martin Fowler的"Inversion of Control Containers and the Dependency Injection pattern"。

写入

现在,该写入了。把改变了的Jedi写入数据库只需要下面几行代码。
Connector connector = 
   ConnectorFactory.getInstance().createConnector( "starwars" );
BeanWriter writer =
   new BeanWriter( Jedi.class, connector );
writer.executeStringUpdate(
   sampleBean, "UpdateJedi" );


这里,数据库访问通过生成SQL查询字符串。最下面一行代码生成执行字符串并发送到数据库,修改了使用1000作为id的Jedi(就是Obi Wan)的状态(假设我们把属性alive改为true,把forceRating改为6.0)。
UpdateJedi 
   @name='Obi Wan Kenobi', @jedi_id=1000,
   @alive=1, @force_rating=6.0, @age=30



如果你想建立一个新的Jedi,我们只需要简单的构造一个新的Jedi并用下面的代码写入数据库。
Jedi newJedi = new Jedi();
newJedi.setName( "Mace Windu");
newJedi.setAge( 40 );
newJedi.setAlive( false );
newJedi.setForceRating( 9.7 );
Connector connector =
    ConnectorFactory.getInstance().createConnector( "starwars" );
BeanWriter writer =
    new BeanWriter( Jedi.class, connector );
writer.executeStringInsert(
    newJedi, "InsertJedi" );


你会注意到,我们使用了不同的方法和存储过程来写入数据。最后字符串会是这样。
InsertJedi 
   @name='Mace Windu', @alive=0,
   @force_rating=9.7, @age=40


发生了什么?我们假设属性jediId是由数据库自动生成的。实际上,在上面定义的Jedi类中,我们指定@ParameterAssociation的属性isAutoIdentity=true来达成这一点。因为数据库会给bean提供主键,所以参数@jedi_id就省略了。

这里需要注意一下。因为jediId是由数据库提供的,所以这个数据一定会通过存储过程InsertJedi传回数据库。随后,方法executeStringInsert返回一个JDBC的ResultSet,用来返回ID或者刚插入的数据行。这个信息可以手动处理,不过Amber提供了辅助函数来把新的ID注入到新对象中。

比起操作的透明度,读写时使用字符串来处理的类型安全问题更容易让人担心。因为把参数转化成字符串后,类型信息就丢失了。然而,这种技术有一个很大的优势:任何查询字符串都会被记录下来,数据库管理员可以通过分析来找出错误原因,并且准确知道应用调用了什么或者从数据库查询了什么。这种类型的透明使得调试更加容易。

如果Jedi的战斗机列表改变了,还是手动更新数据库比较好。取决于Fighter列表发生的变化,比较粗鲁的做法是删除这个Jedi的全部战斗机列表,然后把新的列表写回数据库中。假设我们手里有一个jedi对象和一列新的Fighter对象,我们接下来需要把新列表写进fighters中。更进一步,我们假设通过存储过程InsertFighter把一个新的Fighter对象写进数据库。
Connector connector = 
   ConnectorFactory.createConnector( "starwars" );
BeanWriter writer =
   new BeanWriter( Fighter.class, connector );
connector.execute(
   "delete from fighters where jedi_id = " + jedi.getId() );
for( Fighter fighter : fighters ) {
   fighter.setJediId( jedi.getId() );
   connector.executeStringInsert(
      fighter, "InsertFighter" )
}


这段代码处理一整套的执行字符串,每个字符串中的name分别对应着fighters表中的fighter:
InsertFighter @jediId=..., @name="...";


你也许注意到了,这个方法并没动用事务。像上面说的那样,这里并没使用异常处理,如果delete操作失败了,会产生一个SQLException,而后面的循环根本不会被执行。可是如果是其他情况呢?比如接下来的InsertFighter调用出错了呢?这时事务是必须的,最好把操作放在存储过程里面。如果我想在事务中从Fighter对象获取全部参数以及Jedi ID并处理“新”战斗机呢?这个话题值得在另一篇文章中讨论。

局限和缺点

像任何工具或者技术一样,我们讨论的方法具有一定的局限性。
&#8226;        因为不使用XML描述符,所以当数据库和对象域之间的接口发生改变时,就会出问题。实际上,当改变只发生在名字而不是类型时,或者没有属性/字段增减时,使用XML描述符比Amber好一点。如果不是上述情况,两种系统都需要重新编译和部署。
&#8226;        复合管理不是自动化的。事实上,当你比较Amber和大的O/R框架时,你会发现有很多东西都不是自动化的。在把数据库作为哑存储设备或者用表连接中间层的商业设定中,Amber并没有太大的用处。另一方面,你可以说Amber适合依赖注入风格的设计,以及数据之间的松耦合,这通常认为比隐式依赖要好。
&#8226;        最后,注解分析以及自省机制的运行开销比较大。在一个与数据库有大量交互(比如,一个用于并发用户交互的中间件)而不是单用户或者少量用户偶尔交互的系统中,Amber会导致性能问题。

结论

这篇文章示范了一种相对于传统的O/R映射相反的R/O映射。所谓的面向对象和关系系统之间的阻抗不匹配,在把关系数据模型定义成对象域的引用模型,以及使用存储过程这一工具来操作数据库(尤其是写操作)之后,这个复杂的映射任务被简化了。这种映射是通过注解这种Java 1.5的新语言特性来实现的。我们通过Amber框架来支持和演示了这种方法。

Amber是一个小型框架,易于学习和使用。只需要处理几个非常接近JDBC的类。数据库和JavaBean之间的连接通过注解来实现,不需要任何XML描述符,因为XML对人来说可读性不高。而数据库和应用之间的映射也都在bean类之中。Amber也提供了一种强制检测机制来验证内容,不过为了节约篇幅,就不在这篇文章中讨论了。

Amber只做了一件事并且做得很好:把数据库的列以及查询参数映射到JavaBean的属性。不多,也不少。Amber不是银弹,也没有解决那些庞大的工业O/R框架才能处理的问题。

Amber已经在一个商业环境中证明了它的价值。在Impetus,我们为一家德国最大的邮购公司提供了销售人员解决方案,系统基于Java,使用了MS SQL Server,而我们使用Amber处理了全部的数据库交互。自从今年春天(自从J2SE 5.0的到来)以来,我们没有改变一点API,而且使用中也没出现什么大问题。


版权声明:任何获得Matrix授权的网站,转载时请务必保留以下作者信息和链接
作者:Norbert Ehreke deafwolf(作者的blog: http://blog.matrix.org.cn/page/deafwolf)
原文: http://www.matrix.org.cn/resource/article/44/44381_Amber+Object+Mapping.html
关键字:relational;mapping;Amber