详解Hibernate缓存与性能优化

缓存概念

缓存 介于应用程序和永久性数据源(文件,数据库等)之间,作用就是降低应用程序直接读取数据源的频率,从而提高应用程序的运行性能。缓存中的数据就是数据源中数据的复制,应用程序在运行时直接读取缓存中的数据。

缓存的物理介质通常是内存,而永久性数据存储源的物理介质通常是硬盘或磁盘,应用程序读写内存的速度显然比读写硬盘的速度快。如果缓存存放的数据非常大,也会用硬盘作为缓存的物理介质。

Hibernate缓存分类

在hibernate中提供了二种缓存机制:一级缓存、二级缓存,因为二级缓存策略是针对于ID查询的缓存策略,对于条件查询则毫无作用,为此,Hibernate提供了针对条件查询的Query Cache(查询缓存)

1、一级缓存。session缓存就是一级缓存。由于session对象的生命周期通常对应一个数据库事物,因此他的缓存范围是事物范围的缓存。一级缓存是必需的,在一级缓存中,持久化类的每个实例都具有唯一的OID;

2、二级缓存。sessionFactory分为内置缓存和外置缓存。

     内置缓存是hibernate自带的,不可拆卸,是只读缓存,用来存放映射元数据和预定义SQL语句。

     外置缓存是一个可配置的缓存插件,默认sessionFactory不会启用这个缓存插件,外置缓存中的数据就是数据库数据的复制。SessionFactory的外置缓存称为hibernate的二级缓存

     二级缓存由sessionFactory负责管理,SessionFactory的生命周期和应用程序的整个进程对应。二级缓存是可选的,可以在每个类或者每个集合的粒度上配置

3、查询缓存 它是Hibernate为查询结果提供的,依赖于二级缓存。

缓存的作用范围

  1. 事物范围 每个事物都有自己的缓存,缓存内数据不会被多个事物并发访问。例如,Hibernate的一级缓存,事物是不能跨多个Session的,Session内数据只能被当前事物访问,因此它属于事物范围内的缓存。
  2. 进程范围 进程内的所有事物共享缓存,进程结束,缓存结束生命周期。例如,Hibernate的二级缓存,SessionFactory对象的生命周期对应应用程序的整个进程,因此它属于进程范围的缓存。
  3. 集群范围 缓存被一个或多个机器上的进程共享。hibernate的二级缓存也可以作为集群范围的缓存。

Hibernate 一级缓存

Session内的缓存即一级缓存。位于缓存中的对象称为持久化对象,它和数据库中的相关记录对应。Session能够在某些时间点(session.flush(); ,tx.commit(); ),按照缓存中对象的变化来执行相关的SQL语句,从而同步更新数据库,这一过程称为刷新缓存。

当应用程序调用 session的 ‘save() ,update() ,saveOrUpdate() ,load() ,get()'等方法,以及调用Query查询接口的' getResultList()'时,如果在'Session'缓存中还不存在相应的对象,Hibernate就会把该对象加入到缓存中,在刷新缓存时,Hibernate会根据缓存中对象的状态变化来同步更新数据库。

综上所述,Session缓存有两大作用:

  1. 减少访问数据库的频率
  2. 保证数据库中的相关记录和缓存中的相应对象同步

session缓存管理方法

  1. evict(); 从session缓存中清除某个对象
  2. clear(); 清空session缓存

ps: flush()强制进行从缓存到数据库的同步

Hibernate 二级缓存

二级缓存是进程或集群范围内的缓存,可以被所有的Session共享,其生命周期和SessionFactory一样。

二级缓存是可配置的插件,Hibernate打包了一些开源缓存实现,提供对他们的内置支持

缓存插件 缓存实现类 查询缓存
EHCache org.hibernate.cache.EhCacheProvider 支持
OSCache org.hibernate.cache.OSCacheProvider 支持
SwarmCache org.hibernate.cache.SwarmCacheProvider 不支持
JBossCache org.hibernate.cache.TreeCacheProvider 支持

为了把上边的缓存插件集成到Hibernate中,Hibernate提供了CacheProvider接口,它是缓存插件与Hibernate之间的适配器。

表格中的实现类是CacheProvider接口的不同实现。

配置二级缓存的步骤如下:

  1. 选择合适的缓存插件,配置其自带的配置文件
  2. 选择需要使用二级缓存的持久化类,设置它的二级缓存的并发访问策略。

以EHCache配置为例,步骤如下

1、将ehcache.xml文件添加到类路径下

     在路径'hibernate-release-5.2.6.Final\project\etc\'下复制'ehcache.xml'

     标签为每个需要二级缓存的类和集合设定缓存的数据过期策略,配置如下

2、开启二级缓存,在hibernate.cfg.xml配置


true

3、指定缓存产品提供商



 
 org.hibernate.cache.EhCacheProvider

org.hibernate.cache.EhCacheRegionFactory

4、指定使用二级缓存的持久化类。修改持久化类的映射文件,为元素添加元素,配置如下:


 
 
 
 
 
 
 
 
 
 

cache 的属性

  • usage 是必须的,指定并发访问策略,取值为 transactional(事物缓存),read-write(读/写缓存),nonstrict-read-wirte(非严格读/写缓存),或read-only(只读缓存)。
  • region 可选,默认为类或集合的名字
  • include 可选,取值为non-lazy(当缓存一个对象时,不会缓存它的映射为延迟加载的属性)、all,默认值为all

或者在 hibernate.cfg.xml 的mapping元素后面统一配置 (推荐)

关闭二级缓存交互

有时候考虑到内存开销问题,需要关闭与二级缓存的交互,可以调用session的' setCacheMode(CacheMode.IGNORE)方法关闭与二级缓存的交互;

CacheMode.IGNORE参数的意思是当前session和二级缓存不再相互作用

二级缓存使用场景

二级缓存并非适合所有场景,使用不当,反而会降低性能。符合如下条件就适合放入二级缓存

  1. 很少修改的数据
  2. 不是很关键的数据,能容忍短时间内督导过期数据
  3. 应用参考的常量数据。它的实例数目有限,实例会被许多其他类的实例引用,实例极少或从来不被修改

二级缓存不适用场景

  1. 经常修改的数据
  2. 财务数据,绝对不允许读到过期数据
  3. 与其他应用共享的数据。如果其他应用修改了数据库中的数据,Hibernate无法自动保证二级缓存的数据与数据库一致

如果不设置“查询缓存”,那么hibernate只会缓存单个持久化对象,如果想缓存使用 findall()list()Iterator()createCriteria()createQuery()等方法获得的数据结果集的话, 就需要在配置文件中设置 hibernate.cache.use_query_cache true 才行

Hibernate查询缓存

上面说到的二级查询,只有在基于id查找对象时才会用到,对于查询则毫无用处。为此,Hibernate提供了针对的查询的查询缓存。

查询缓存依赖于二级缓存,因此使用查询缓存之前要按步骤配置好二级缓存

使用查询缓存的步骤如下

1、在hibernate.cfg.xml中开启查询缓存


true

2、在程序中启用查询缓存

query.setCacheable(true);

查询缓存的使用场景

  1. 经常使用的查询语句
  2. 对于查询的数据很少有插入、删除或者更新操作

Hibernate性能优化

Hibernate主要从一下几个方面来优化查询性能

  1. 使用迫切左外链接或迫切内链接查询策略、查询缓存等方式,减少select语句的数目,降低访问数据库的频率
  2. 使用延迟加载查询策略等方式避免加载多余的不需要访问的数据
  3. 使用Query接口的iterate()方法减少select语句中的字段,从而降低访问数据库的数据量

HQL优化

HQL优化hibernate程序性能优化的一个方面,HQL的语法和SQL非常类似。HQL是基于SQL的,只是增加了面向对象的封装,如果抛开HQL通Hibernate本身一些缓存机制的关联,HQL的优化技巧通SQL的优化技巧一样,在编写HQL时,需要主要以下几个原则

  1. 避免 or操作的使用不当。如果where子句中有多个条件,并且其中某个条件没有索引,使用or,将导致全表扫描。
  2. 避免使用 not 。如果where子句的条件包含not关键字,那么执行时该字段的索引失效。这些需要分成不同情况区别对待,对于 不大于(不多于)、不小于(不少于)建议使用运算符来替代not
  3. 避免like的特殊形式。某些情况下,会在where子句条件中使用用like。如果like以一个“%”或“_”开始即前模糊,则该字段的索引不起作用。目前没有什么解决 办法。
  4. 避免 having子句。在分组查询中,可在两个位置指定条件,一是where子句中,二是having子句中。尽可能的在where子句而不是在having子句中指定条件。having是在检索出所有记录后对结果集进行过滤。这个处理需要一定的开销,而where子句限制记录数目,能减少这方面的开销
  5. 避免使用 distinct 。指定distinct会导致在结果中删除重复的行,这会对处理时间造成一定的影响。
  6. 索引在以下情况失效,应注意使用

       只要对字段使用函数,该字段的索引将不起作用。

       只要对该字段进行计算,该字段的索引将不起作用。

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对脚本之家的支持。

你可能感兴趣的:(详解Hibernate缓存与性能优化)