Estimating urban functional distributions with semantics preserved POI embedding

文章来源:internationalL journal of geographical information science

目录

1.研究意义

2.目前已有方案    

3.本文提出的方法

4.论文创新点


1.研究意义

     城市由不同区域组成,每个区域承担着不同的功能,例如一个区域中有住宅区,商业区,工业区等。实际上,每个区域的功能都不是单一的,而通常是几种功能类型的组合,例如住宅区不仅包括住宅小区,还会有一些饭馆,购物中心等商业设施。

      遥感影像数据通过地物分类可以实现区域功能划分,但是对区域的社会经济情况描述不足,因此各种基于众包数据源的数据挖掘方法在研究城市功能分布方面越来越受欢迎。其中poi是最常用的众包数据源之一,它与人类行为和城市的社会经济视角有内在联系。

2.目前已有方案    

    早期利用POI挖掘城市功能区的研究主要依赖于特征工程方法,其中POI频率是使用最多的特征。即使不考虑构造特征的繁琐工作,这种方法也会损失许多潜在信息,例如poi的空间分布模式。因此,有学者采用了表示学习方法,根据空间共现信息学习POI类别(如酒店和公园)的低维潜在向量嵌入。之后,又有学者提出了Place2Vec方法,该方法能基于POI邻接关系捕获空间共现信息,实现POI向量化,进行土地利用分类。

但是,目前的方法具有如下缺点

  1. 功能区评估单一:以往的研究通常只对某一特定区域赋予单一的功能标签,忽视了区域的多种功能。
  2. 无法捕捉远距离的空间共现现象。
  3. 忽略了POI层次类别语义。
  4. 以往的研究主要采用均值聚合POI向量嵌入来生成区域嵌入,忽略了POI重要级别对区域功能的影响。例如,一个火车站在一个地区可能只出现一次,而餐馆出现多次,但火车站应该对该地区更重要。

3.本文提出的方法

Estimating urban functional distributions with semantics preserved POI embedding_第1张图片

     本文提出了一种语义保留的POI嵌入的方法,如上图所示。该方法由四个部分组成:

  1. 在区域中,根据POI的空间分布生成迪利克雷三角网,然后POI网络中进行空间显式随机游走,以捕获局部和远程空间共现信息,生成POI嵌入。
  2. 对POI的二级类别进行嵌入,丰富POI的语义信息。
  3. 通过POI嵌入生成区域嵌入:结合LSTM和注意机制的聚合函数,聚合POI嵌入并生成区域嵌入,以解释每个POI在区域中的重要性差异。
  4. 采用多层感知机模型,利用区域嵌入生成区域的功能分布向量。

    实验收集了厦门市的POI数据,交通网络数据(用于区域划分)和厦门市土地利用数据(用于训练和验证),并采用place2vec和one-hot模型进行对比实验。

4.论文创新点

    该论文是基于place2vec的一个改进,Place2Vec模型是根据兴趣点在空间中的距离来构造pairs。但是没有考虑到POI的类别信息和空间共现信息。论文两个比较创新的地方:

1.用迪利克雷三角网形成POI网络,然后进行随机游走,捕获了空间共现信息。

2.考虑了POI类别信息,通过可视化分析,确认POI类别嵌入后具有良好的效果。

Estimating urban functional distributions with semantics preserved POI embedding_第2张图片

 3.采用LSTM 和注意力机制计算了一个区域内POI的重要性程度。

你可能感兴趣的:(数据挖掘,聚类)