[论文阅读] FITing-Tree: A Data-aware Index Structure

索引结构是DBA利用的最重要的工具之一,以提高分析和交易工作负载的性能。然而,在大型数据集上建立几个索引往往会变得令人望而却步,并消耗宝贵的系统资源。事实上,最近的一项研究表明,作为TPC-C基准的一部分而创建的索引可以占到现代DBMS中总内存的55%。这种开销消耗了宝贵而昂贵的主内存,并限制了可用于存储新数据或处理现有数据的空间数量。

在本文中,我们提出了FITing-Tree,这是一种新型的学习索引形式,它使用片断线性函数,在构建时指定了一个有界的误差。这个误差旋钮提供了一个可调整的参数,允许DBA通过平衡查找性能和空间消耗来使索引适应数据集和工作负载。为了引导这种权衡,我们提供了一个成本模型,帮助确定一个适当的误差参数,给定(1)一个查询延迟要求(如500ns)或(2)一个存储预算(如100MB)。通过使用各种真实世界的数据集,我们表明我们的索引能够提供与完整索引结构相媲美的性能,同时将存储空间的占用减少了几个数量级。

你可能感兴趣的:(论文阅读,论文)