转载请注明来源: http://www.iteye.com/topic/142404
由于项目需要隐士最近在.Net下面搞NHibernate来实现分表操作,参考了大量资料和JavaEye论坛上火热的讨论(这里谢过各位高人),结合对NHibernate代码的研读,隐士找到了一个简单的实现方式,由于NHibernate和Hibernate同宗同源,隐士觉得这个简单的实现方式同样可以适用于Java环境里的Hibernate,所以下面的代码是C#的。如果管理员觉得不适合发在Java版,请转.Net版。
先讨论一下论坛上讨论过的已有做法:
1、用JDBC直接开搞,出处: http://www.iteye.com/topic/133832
如果直接搞,就没有必要用Hibernate了。隐士要找的是在NHibernate框架下实现分表的所有操作。
2、对每个表建模,出处: http://www.iteye.com/topic/133832
如果是几十张表,建几十个模,累死,代码还很不好写,将来的维护也是个大问题。如果要增加一张表,代码可能要改死。
3、直接构造select来实现读取,出处: http://www.iteye.com/topic/29514
仅仅实现了select,而且必须把表名写死,没有实现其它操作,也不利于开发和维护。
4、Hibernate 3.0里面的dynamic models可能可以实现,出处: http://www.iteye.com/topic/13167
这个没有研究过,加上NHibernate还没有跟上Hibernate 3.0,所以没有该功能,也无法研究。
再讨论一下隐士的几个思路:
1、实现MultiTablesEntityPersister
在hbm.xml的class里可以指定persister来加载自己实现的persister,是不是可以实现MultiTablesEntityPersister来掌控全局呢?经过隐士大量试验表明几乎不可能,Hibernate认准了一个class对应一张table,大量代码在AbstractEntityPersister里写死了,如果要实现分表需求,基本相当于要重写小半个Hibernate。隐士决定另找出路。
2、实现SessionFactory,Session,Table
如果可以通过继承实现SessionFactory,Session,Table来实现分表需求,那也不错。经隐士研究源码,发现没有希望,接口都定死了,一些关键部分被seal,private,internal了,类似Java里的final,private,anonymous。除非改NHibernate源码,这是隐士所不希望的,这样改开源的源码实在是不应该。
几个思路都被否决后,隐士转向拿Configuration开刀,毕竟hbm.xml里的配置是在Configuration里解析的。一阵分析后发现Configuration把解析工作外包给HbmBinder,在HbmBinder里隐士找到了这句:
tableName = mappings.NamingStrategy.TableName(tableNode.Value);
哈哈,这句就是万恶之源了,原来可以通过Configuration.SetNamingStrategy(INamingStrategy namingStrategy)来注入我们自己的命名规范。隐士想到此处眼前豁然开朗,只要在Configuration.BuildSessionFactory前注入NamingStrategy,搞出来的SessionFactory就对分表这件事根本不知道,而且对于特定的class只认特定的table。不过也带来一个副作用,就是有多少个分表,就要准备多少个SessionFacotry,再想想未必是副作用,SessionFactory维持的缓存就不会跨表打架,可以说这个想法是解决得很不错的。
接着隐士动手开始试验,以下代码基于NHibernate-1.2.0.GA,MySQL 5.0,不过对于Java的Hibernate几乎可以原封不动拿来用,这步留待看官们自己做了。
隐士随便写了个系统负载表,里面放几个字段。这表也有实际意义,比如有一台机器用来集中监控几十台机器,监控数据都放在一张表里会慢死的,一台机器一张表,干净。
CREATE TABLE IF NOT EXISTS `system_1_loads` ( `loggingDate` datetime NOT NULL default '2006-01-01 00:00:00', `cpuUsage` float NOT NULL default '0', `memoryUsage` float NOT NULL default '0', `bytesReceivedPerSecond` int(32) default '0', `bytesSentPerSecond` int(32) default '0', PRIMARY KEY (`loggingDate`) ) ENGINE=MyISAM DEFAULT CHARSET=utf8; ... system_2_loads ... system_3_loads ... ... system_10_loads
hibernate.cfg.xml照常规配置,一点都不需要改动,这里隐士不贴了。
SystemLoadDO.cs照常规写。
namespace DBPartitionTest { public class SystemLoadDO { #region Member Variables protected DateTime _loggingDate; protected float _cpuUsage; protected float _memoryUsage; protected int _bytesReceivedPerSecond; protected int _bytesSentPerSecond; #endregion ... } }
SystemLoadDO.hbm.xml照常规写,注意class节点里的table,隐士写了system_{0}_loads,看官说了,这个不能用呀,不要紧,反正后面会被NamingStrategy给替换掉。
PartitionNamingStrategy.cs这个抽象类实现了接口INamingStrategy,它的构造函数接受一个数字索引,通过改写方法TableName来实现替换表名的工作,其他还是留给DefaultNamingStrategy。
namespace DBPartitionTest { public abstract class PartitionNamingStrategy : INamingStrategy { private int index; public int Index { get { return index; } } private string partitionTableName; public string PartitionTableName { get { return partitionTableName; } } public abstract string PartitionTableFormat { get;} public PartitionNamingStrategy(int index) { this.index = index; this.partitionTableName = string.Format(PartitionTableFormat, index); // 根据索引构造新的表名 } #region INamingStrategy public string ClassToTableName(string className) { return DefaultNamingStrategy.Instance.ClassToTableName(className); } public string PropertyToColumnName(string propertyName) { return DefaultNamingStrategy.Instance.PropertyToColumnName(propertyName); } public string TableName(string tableName) { if (PartitionTableFormat.Equals(tableName)) // 这句来实现表名替换 return PartitionTableName; return DefaultNamingStrategy.Instance.TableName(tableName); } public string ColumnName(string columnName) { return DefaultNamingStrategy.Instance.ColumnName(columnName); } public string PropertyToTableName(string className, string propertyName) { return DefaultNamingStrategy.Instance.PropertyToTableName(className, propertyName); } #endregion } }
SystemLoadsNamingStrategy.cs是PartitionNamingStrategy的实现类,只需要实现属性PartitionTableFormat,注意这里必须返回和SystemLoadDO.hbm.xml里一样的串。实际项目里可以不必把这个串写死在代码里,Java这里就太简单了,直接Spring里配一个Bean就搞定了,隐士这里只是验证想法。
namespace DBPartitionTest { public class SystemLoadsNamingStrategy : PartitionNamingStrategy { public SystemLoadsNamingStrategy(int index) : base(index) { } public override string PartitionTableFormat { get { return "system_{0}_loads"; } } } }
Program.cs是程序入口,这段代码生成了10个Configuration,10个Configuration创建了10个SessionFactory,每个SessionFactory互不干扰,自己认自己的分表操作,运行结果太长隐士就不附了。这里具体几张表也可以做在配置文件里,这样增加表、减少表可以做到不改代码。
namespace DBPartitionTest { public class Program { public static void Test() { for (int i = 1; i < 11; ++i) { Configuration configuration = new Configuration().SetNamingStrategy(new SystemLoadsNamingStrategy(i)).Configure(); ISessionFactory sessionFactory = configuration.BuildSessionFactory(); ISession session = null; try { session = sessionFactory.OpenSession(); SystemLoadDO systemLoadDO = new SystemLoadDO(); systemLoadDO.LoggingDate = DateTime.Now; systemLoadDO.CpuUsage = 80; systemLoadDO.MemoryUsage = 70; Console.WriteLine(systemLoadDO.LoggingDate.ToString()); session.Save(systemLoadDO); session.Flush(); ICriteria criteria = session.CreateCriteria(typeof(SystemLoadDO)); criteria.AddOrder(Order.Desc("LoggingDate")); criteria.SetFirstResult(0); criteria.SetMaxResults(1); systemLoadDO = criteria.UniqueResult(); Console.WriteLine(systemLoadDO.LoggingDate.ToString()); systemLoadDO.BytesReceivedPerSecond = 1024; session.Flush(); session.Delete(systemLoadDO); session.Flush(); } catch (Exception e) { Console.WriteLine(e.InnerException); Console.WriteLine(e.StackTrace); Console.WriteLine(e.Message); } finally { if (session != null) session.Close(); } } } static void Main(string[] args) { Test(); } } }
总结一下,这个方法的优点是秉承了Hibernate的设计思路,没有修改Hibernate源码,而且是通过Hibernate所允许的方式来进行操作,可以说拿到SessionFactory后所有操作都是和不分表一样的,而且DO实例通过不同的SessionFactory保存、删除就可实现跨表复制、删除。由于SessionFactory不一样,所以缓存维护也没有影响。唯一的缺点就是要维护和分表数量一样的SessionFactory,貌似也就是多写几行代码而已。
隐士这里说完了,希望大家一起讨论。