Java持久化基础-连接池的原理
在上几章我通过JDBC实现了对数据库的连接,并且对JDBC工具类进行了优化和封装,在需要访问数据库时,就新创建一个连接,用完后就关闭它。先来简单回顾一下JDBC连接数据库的步骤:
①装载数据库驱动程序;
②通过jdbc建立数据库连接;
③访问数据库,执行sql语句;
④断开数据库连接。
以一个查询为例:
public class JDBCTest { private static String CLASSNAME = "oracle.jdbc.driver.OracleDriver"; //驱动类 private static String DRIVER = "jdbc:oracle:thin:@127.0.0.1:1521:ORCL"; //驱动,填写数据库IP、端口和数据库名 private static String USERNAME = "scott"; //数据库用户名 private static String PWD = "tiger"; //数据库密码 private Connection conn = null; //连接对象 private PreparedStatement ps = null; //预加载对象 private ResultSet rs = null; //结果集 /** * 获取一个连接对象 */ public Connection getConnection() throws Exception{ Class.forName(CLASSNAME); conn = DriverManager.getConnection(DRIVER, USERNAME, PWD); return conn; } /** * 查询操作 * @throws Exception */ public ResultSet query( String sql,Object[] pares ) throws Exception{ this.getConnection(); ps = conn.prepareStatement(sql); //预编译SQL if( 0!=pares.length ){ for( int i = 0; i<pares.length; i++ ){ ps.setObject(i+1, pares[i]); //循环设置参数 } } rs = ps.executeQuery(); //执行查询返回结果集 this.close(); //关闭所有对象 return rs; } /** * 关闭所有对象 */ public void close() throws Exception{ if( rs != null ){ rs.close(); } if( ps != null ){ ps.close(); } if( conn != null ){ conn.close(); } } }
分析:每一次请求都要建立一次数据库连接,底层原理是使用socket套接字来远程连接,建立连接是一个费时的活动,每次都得花费0.05s~1s的时间,而且系统还要分配内存资源。这个时间对于一次或几次数据库连接操作,或许感觉不出系统有多大的开销,可是对于现在的web应用,尤其是大型电子商务网站,同时有几百人甚至几千人在线访问,频繁的进行数据库连接操作势必占用很多的系统资源,网站的响应速度必定下降,严重的甚至会造成服务器的崩溃。
由此可见“数据库连接”在实际企业级应用中是个昂贵的资源消耗,为保障应用的正常运转,对数据库连接管理显得尤为重要,针对这个问题循环利用的部分理念可以为我们缓解资源消耗的压力:其实我们查询完数据库后,如果不关闭连接,而是暂时存放起来,当别人使用时,把这个连接给他们使用,避免了一次建立数据库连接和断开的操作时间消耗,这样一来对连接的频繁分配和释放成为了重点工作。
一、资源池(Resource Pool) —— 连接池
对于共享资源,有一个很好的设计模式:资源池(Resource Pool),这个模式正是为了解决频繁的分配和释放所带来的问题。为解决上述问题,可以采用数据库连接池技术。数据库连接池的基本思想就是为数据库连接建立一个“缓冲池”。预先在缓冲池中放入一定数量的连接,当需要建立数据库连接时,只需从“缓冲池”中取出一个,使用完毕之后再放回去。我们可以通过设定连接池最大连接数来防止系统无尽的与数据库连接。更为重要的是我们可以通过连接池的管理机制监视数据库的连接的数量﹑使用情况,为系统开发﹑测试及性能调整提供依据。
基本步骤:
① 编写class 实现DataSource 接口
② 在class构造器一次性创建10个连接,将连接保存LinkedList中
③ 实现getConnection 从 LinkedList中返回一个连接
④ 提供将连接放回连接池中方法
二、并发问题
为了使连接管理服务具有最大的通用性,必须考虑多线程环境,即并发问题。这个问题相对比较好解决,因为java语言自身提供了对并发管理的支持,使用synchronized关键字即可确保线程是同步的。使用方法为直接在类方法前面加上synchronized关键字,如:
publicsynchronized connection getconnection()
三、多数据库服务器和多用户
对于大型的企业级应用,常常需要同时连接不同的数据库(如连接oracle和sybase)。如何连接不同的数据库呢?我们采用的策略是:设计一个符合单例模式的连接池管理类,在连接池管理类的唯一实例被创建时读取一个资源文件,其中资源文件中存放着多个数据库的url地址等信息。根据资源文件提供的信息,创建多个连接池类的实例,每一个实例都是一个特定数据库的连接池。连接池管理类实例为每个连接池实例取一个名字,通过不同的名字来管理不同的连接池。
对于同一个数据库有多个用户使用不同的名称和密码访问的情况,也可以通过资源文件处理,即在资源文件中设置多个具有相同url地址,但具有不同用户名和密码的数据库连接信息。
四、事务处理
我们知道,事务具有原子性,此时要求对数据库的操作符合“all-all-nothing”原则即对于一组sql语句要么全做,要么全不做。
在java语言中,connection类本身提供了对事务的支持,可以通过设置connection的autocommit属性为false 然后显式的调用commit或rollback方法来实现。但要高效的进行connection复用,就必须提供相应的事务支持机制。可采用每一个事务独占一个连接来实现,这种方法可以大大降低事务管理的复杂性。
五、连接池的分配与释放
连接池的分配与释放,对系统的性能有很大的影响。合理的分配与释放,可以提高连接的复用度,从而降低建立新连接的开销,同时还可以加快用户的访问速度。
对于连接的管理可使用空闲池。即把已经创建但尚未分配出去的连接按创建时间存放到一个空闲池中。每当用户请求一个连接时,系统首先检查空闲池内有没有空闲连接。如果有就把建立时间最长(通过容器的顺序存放实现)的那个连接分配给他(实际是先做连接是否有效的判断,如果可用就分配给用户,如不可用就把这个连接从空闲池删掉,重新检测空闲池是否还有连接);如果没有则检查当前所开连接池是否达到连接池所允许的最大连接数(maxconn)如果没有达到,就新建一个连接,如果已经达到,就等待一定的时间(timeout)。如果在等待的时间内有连接被释放出来就可以把这个连接分配给等待的用户,如果等待时间超过预定时间timeout 则返回空值(null)。系统对已经分配出去正在使用的连接只做计数,当使用完后再返还给空闲池。对于空闲连接的状态,可开辟专门的线程定时检测,这样会花费一定的系统开销,但可以保证较快的响应速度。也可采取不开辟专门线程,只是在分配前检测的方法。
六、连接池的配置与维护
连接池中到底应该放置多少连接,才能使系统的性能最佳?系统可采取设置最小连接数(minconn)和最大连接数(maxconn)来控制连接池中的连接。最小连接数是系统启动时连接池所创建的连接数。如果创建过多,则系统启动就慢,但创建后系统的响应速度会很快;如果创建过少,则系统启动的很快,响应起来却慢。这样,可以在开发时,设置较小的最小连接数,开发起来会快,而在系统实际使用时设置较大的,因为这样对访问客户来说速度会快些。最大连接数是连接池中允许连接的最大数目,具体设置多少,要看系统的访问量,可通过反复测试,找到最佳点。
如何确保连接池中的最小连接数呢?有动态和静态两种策略。动态即每隔一定时间就对连接池进行检测,如果发现连接数量小于最小连接数,则补充相应数量的新连接以保证连接池的正常运转。静态是发现空闲连接不够时再去检查。
四.实际开发中有成熟的开源连接池供我们使用
理解了连接池的原理就可以了,没有必要什么都从头写一遍,那样会花费很多时间,并且性能及稳定性也不一定满足要求。事实上,已经存在很多流行的性能优良的第三方数据库连接池jar包供我们使用。如:dbcp、c3p0。