文件访问预测

注:“文件访问预测”是我论文的研究工作中的一部分。
 
   处理器与I/O存在速度鸿沟、网络带宽的限制(特别是无线移动网络)、网络应用的断连操作(如移动计算、AFS)等原因,造成了数据访问的延迟,IO和网络成为了制约性能的瓶颈。

  为了解决这个问题,通常采用缓存(Cache)和预取(Pre-fetch)技术。缓存技术利用数据访问的时间局部性,对访问过的数据进行暂时的保留。但由于缓存空间大小以及更新算法的制约,当数据频繁更新时,缓存带来的性能改善不再显著。预取(Pre- fetch)是主动缓存技术,利用数据访问的空间局部性,对将来可能发生的数据请求进行预测,在访问之前取出并Cache,以备用户访问,从而减少访问延迟。

  预取可以提高系统的性能,但是也存一些不足:
 (1)影响正常的数据访问负载
 (2)错误的预取会降低整个系统性能
 (3)很难做到精确地预测并在需要时完成预取

  预取的基础是预测,它解决预取什么的问题。为什么预测是有效的呢?一方面,数据请求并非完全随机,由用户或程序行为驱动的。另一方面,许多数据之间存在内在的关联。预测的关键是挖掘数据访问行为模式,构建数据之间的关联。

  预取的基本思想是:通过对数据本体或历史访问记录的分析,构造合适的预测模型,对未来的访问模式进行预测,在访问之前取出并缓存,以备用户访问,减少访问延迟。

  预取的两种方法:
 (1)基于预测的预取(显式):精确的预测模型,尽量减少错误预测,平滑预取。
 (2)基于分组的预取(隐式):构建稳定数据分组,适用于比较稳定的访问模式。

  预测涉及的相关理论包括统计分析、机器学习、人工智能、数据库等。

 (刘爱贵 / Aiguille.Liu)

你可能感兴趣的:(数据库,工作,算法,cache,网络,网络应用)