破题点

Layout 就是数据分区那个,每个分区有一个 id,大概就是 layout,我们的 layout 其实就是为了迎合 RMI 这个接口,适配上去。

查询的话基本分成三个步骤:

  1. 根据 layout, 找到相交的 block
  2. 利用内部点的相对关系,找出一定的顺序性质
  3. 扫描,得到最后的结果,至于用不用二分查找未知

同使用的是 NYC 数据集,他主要做的就是,他觉得 经度和维度之间可能有的有一些函数关系,这时候这种数据的 CDF 学起来就更有难度,我们更希望学一个拟合的比较均匀的函数。

跑实验直接用 PGM-index,在实验部分说,和相关工作上说就比较好

你可能感兴趣的:(破题点)