论文笔记:Influence of geographical determinants on the spatial distribution of positioning uncertainties

Transactions in GIS. 2021

1 intro

1.1 背景

  • 手机定位(MPL)数据的质量,尤其是空间准确性或不确定性,直接关系到人类移动性研究结果(交通、城市规划、流行病学、社会学)的可靠性
    • 空间准确性主要取决于移动定位技术
      • 基站源(COO)、到达角、差分到达时间。。。
  • COO方法原理简单,不消耗大量计算和网络资源
    • 原理是以给定时间服务于手机的蜂窝塔的地理坐标作为用户位置的近似值
    • ——>MPL数据的空间准确性处于蜂窝塔级别

1.2 相关工作

1.2.1 MPL数据的空间准确性

Reiter(2014)

手机设备的位置准确性在城市高天线密度区域大约为500米。

相比之下,在奥地利的乡村和阿尔卑斯地区,位置准确性大约为2.5公里

Sellin(2017) 在爱沙尼亚城镇(如塔林和塔尔图)中,空间准确性为100-1000米,而在爱沙尼亚其他地区,准确性降至1.5至20公里
Novák(2016)

在布拉格市中心,空间准确性达到200米,而在郊区降至2000米。

捷克共和国也有类似特征:区域中心的定位准确性较高(1.3公里),但在农村地区低至6公里

long(2020)

高空间准确性区域主要分布在建筑密度高的城市区域。

中等空间准确性区域的土地利用类型大多是水体。

非常低空间准确性区域主要位于郊区,那里的主要土地利用类型是山脉或植被

——> MPL数据的空间准确性在蜂窝塔密集分布的城市中心较高,但在蜂窝塔较为稀疏的郊区较低

1.2.2 MPL数据不确定性

zhao(2016)

比较了从通话详细记录(CDRs)中提取的三种常用移动性度量与包含CDRs和主动生成日志的数据集。

他们发现,CDRs倾向于低估总旅行距离和移动熵,同时提供合理的陀螺半径估计。

li(2017)

使用24小时用户追踪的移动信令数据集作为比较数据,评估了从CDRs提取的人口分布的偏差。

他们发现,在人类活跃的小时内,中位数相对误差范围为25至30%

xu(2020)

预处理方法可能导致数据特征的变化。

他们为人类移动模式的表征和解释引入了更多的不确定性

1.2.3 影响MPL数据位置准确性或不确定性的来源和因素

  • 主要分为两个方面
    • 通信工程角度
      • 蜂窝塔的覆盖范围
        • 受到定位系统设备因素的极大影响,例如载波频率、天线高度和蜂窝塔的下倾天线角度
      • 无线信号的传播路径损耗
        • 受到移动站高度、建筑高度等因素的影响
        • 提出了许多模型来模拟和预测各种信道环境中无线信号的传播路径损耗
    • 地理角度
      • 复杂的地理环境会导致无线信号的非视距(NLOS)传播,从而产生大的误差
      • 地理环境直接影响蜂窝塔的选址,进而影响MPL数据的定位准确性
        • MPL数据的空间准确性受到一些地理要素的影响,如地形和植被

1.3 论文思路

  • 尚无研究探讨了MPL数据定位不确定性的空间分布趋势,以及地理因素对MPL数据不确定性空间分布的影响
  • ——>本文调查了地理决定因素对MPL数据定位不确定性空间分布的影响

2 数据

2.1 MPL数据介绍

  • 移动终端与蜂窝塔之间的交互事件主要分为呼叫顺序事件和位置更新事件
    • 呼叫顺序事件包括拨打或接听电话、发送或接收短信以及上网等
    • 位置更新事件主要发生在三种情况下:开机或关机更新、周期性更新和切换更新
      • 当用户从一个蜂窝塔的服务区移动到另一个塔的服务区时,会触发切换更新
      • 一段时间内没有移动终端与蜂窝塔之间的交互事件时,会触发周期性更新
  • 论文中使用的MPL数据集全部来自南京的一家主要运营商
    • 使用COO定位技术记录的MPL数据(使用蜂窝塔的位置近似用户的实际位置)

论文笔记:Influence of geographical determinants on the spatial distribution of positioning uncertainties_第1张图片

2.2 GPS数据(ground-truth)

  • 招募了60名志愿的大学生进行为期两天的数据收集工作。
    • 为了确保样本能代表目标人群(即南京的所有地理环境),构建了120条行程,以便志愿者可以规划涵盖不同地理环境的路线,包括不同的海拔、高楼密度、公园区域和湖泊。

论文笔记:Influence of geographical determinants on the spatial distribution of positioning uncertainties_第2张图片

2.3 数据预处理

  • 坐标系转换(WGS84——>北京1954)
  • 根据定位空间准确性ε对GPS数据记录进行了筛选。
    • ε < 3米的记录被保留
  • 没有消除MPL数据中的振荡,因为它们也是MPL数据中定位不确定性的重要表现

2.4 数据统计分析

MPL和GPS数据集中都有120条轨迹

记录间时间被测量为轨迹中两个连续记录之间的持续时间

论文笔记:Influence of geographical determinants on the spatial distribution of positioning uncertainties_第3张图片 

  • 图1a——MPL数据中轨迹的记录数变化显著,平均值和中位数分别为1,018.99和344
  • 图1b——相比之下,GPS轨迹的变化更为明显,平均值和中位数分别为5,822.7和6,933
  • 图1c——MPL数据的记录间时间从几秒到不到10分钟不等,平均值和中位数分别为41.7秒和13秒
  • 图1d——GPS数据的记录间时间范围更小,平均值和中位数分别为4.21秒和3秒

3 考虑的相关因素

论文笔记:Influence of geographical determinants on the spatial distribution of positioning uncertainties_第4张图片

  • 从各种来源收集了一组12层地理变量(因素) ,可能与MPL数据中的定位不确定性相关
  • 物理地理因素
    • 海拔、坡度、坡向
      • 地形对蜂窝塔的选址有强烈影响,这间接影响了MPL数据的空间准确性
    • 距最近植被的距离(DNV)
    • 距最近水体的距离(DNWB)
    • 修改后的归一化差异水体指数(NDWI)
    • 归一化差异植被指数(NDVI)
      • 植被可能导致无线信号的NLOS传播,水体通常会折射或反射无线信号,导致无线信号传播的损失
  • 人文地理因素
    • 建筑密度、建筑高度
      • 建筑物可以导致NLOS传播
    • 人口密度、道路密度
      • MPL数据的定位偏差还受到负载平衡问题的影响
      • 人口密度和道路密度可以反映通信拥堵的程度
    • 距最近蜂窝塔的距离(DNCT)
      • 空间准确性与蜂窝塔的空间分布密切相关

3.1 划分网格

  • 研究区域内蜂窝塔之间的平均空间距离为95.6米
    • ——>研究区域被划分为100米乘100米的网格。
  • 也就是说,基本空间单元是100米乘100米的网格。
  • 同样地,前面描述的12层地理变量也以100米乘100米的分辨率准备。

4 定义

论文笔记:Influence of geographical determinants on the spatial distribution of positioning uncertainties_第5张图片

TP&RP——某一时刻同时有MP和GP时,MP和GP就是这一时刻对应的TP,RP

5 方法

5.1 两种蜂窝塔

  • 蜂窝塔可以分为微蜂窝塔和宏蜂窝塔。
    • 微蜂窝塔通常分布在建筑密集的区域,其覆盖范围较小。
    • 宏蜂窝塔通常分布在开阔区域,其覆盖范围较大。
    • MPL数据不确定性在微蜂窝塔和宏蜂窝塔区域有不同的空间分布特征,地理因素对其空间分布的影响机制也可能不同。
    • 因此,本研究基于蜂窝塔的类型属性对样本进行了聚类

5.2  方法

论文笔记:Influence of geographical determinants on the spatial distribution of positioning uncertainties_第6张图片

算法笔记:地理探测器-CSDN博客

6 实验

6.1 统计结果

  • 在数据收集和预处理之后,获得了229,839个样本点对,每个样本点对包含一个TP和一个RP
    • 未配对的MPL记录点没有相应的参考点,因此无法测量这些MPL记录点的定位偏差

6.1.1 偏差距离

  • 样本集中的最小定位偏差为17.4米,最大为58,805.9米,平均值为450.3米,标准差为771.19米
  • 大约一半的样本定位偏差小于200米,77.7%的样本定位偏差小于500米,95.9%的样本定位偏差小于1,500米。此外,0.5%的样本有显著的定位偏差(即大于5,000米)

论文笔记:Influence of geographical determinants on the spatial distribution of positioning uncertainties_第7张图片

6.1.2 是否连接至最近的蜂窝塔

论文笔记:Influence of geographical determinants on the spatial distribution of positioning uncertainties_第8张图片

  • 25.9%的RP连接到最近的蜂窝塔,平均空间距离为197.6米
  • 近一半(49.85%)的RP的Rank小于或等于3,平均定位偏差为219.9米
  • 89.9%的RP的Rank不超过30,平均定位偏差为480.1米
  • 6.1%的RP的Rank超过50,平均定位偏差超过1,000米;
  • 3.76%的RP的Rank超过100,平均定位偏差为4,723.5米

6.2 定位误差的空间分布

论文笔记:Influence of geographical determinants on the spatial distribution of positioning uncertainties_第9张图片

  •  图7a
    • 229,839个样本点对的RP(GPS位置)的定位偏差
    • 当志愿者在地面上行走时,MPL数据的定位偏差不断变化。
      • 当志愿者在南京市中心区域(即建筑密集区)内移动时,定位偏差的变化范围较小。南京市中心区域的大多数定位偏差小于500米。
      • 当志愿者走出城区时,定位偏差的范围较大,大多数定位偏差超过1,500米。这些区域的定位不确定性显著
  • 图7b
    • 线段的起点是RP(即GPS点),终点是相应的TP(即蜂窝塔)的样本点对
    • ——>定位不确定性在空间上是聚集的
      • 定位偏差高的区域(即黄色和红色线条)通常具有较高的定位不确定性
        • 一方面,这种现象体现在这些区域中定位偏差值的大范围变化。\
        • 另一方面,它体现在偏差线向各个方向发散,这是蜂窝塔振荡的表现,也称为乒乓效应

6.3 定位误差 在宏观/微观蜂窝塔上的异同

论文笔记:Influence of geographical determinants on the spatial distribution of positioning uncertainties_第10张图片

  • 微蜂窝塔区域的样本占总样本的56.5%,该聚类的平均定位偏差为321.9米(最小17.4米,最大8,281.1米,标准差433.7米)
    • 主要分布在建筑密集的区域
  • 宏蜂窝塔区域的样本占总样本的43.5%,该聚类的平均定位偏差为614.0米(最小30.0米,最大58,805.8米,标准差1,034.6米)
    • 主要分布在开阔区域(例如山脉、湖泊、河流和开放广场)
    • 与微蜂窝塔区域的样本相比,宏蜂窝塔区域的样本的定位不确定性更为明显
  • 论文笔记:Influence of geographical determinants on the spatial distribution of positioning uncertainties_第11张图片

6.4 各参数影响模式

6.4.1 多元线性回归

论文笔记:Influence of geographical determinants on the spatial distribution of positioning uncertainties_第12张图片

  • 基于宏蜂窝塔区域样本的模型拟合效果最好,而基于微蜂窝塔区域样本的模型拟合效果最差
  • 从基于所有样本拟合的模型的回归系数和显著性来看,MPL数据的定位偏差空间分布受到DNCT、海拔和NDVI的较大影响,均表现出显著的正向影响。建筑高度、DNWB和DNV对定位偏差的空间分布没有明显影响
  • 然而,不同聚类样本的定位偏差在影响因素上存在一定差异
    • 微蜂窝塔区域样本的定位偏差最受NDWI的影响,其次是海拔和DNCT,表现出显著的正向效应
    • 在宏蜂窝塔区域,定位偏差最受DNCT的影响,其次是海拔和NDVI,表现出显著的正向效应

6.4.2 地理探测器

  • 根据等分法,D2中所有实值数据的因素被离散化为十个类别(序数级别)

6.4.2.1 定位偏差的影响模式

  • 图9展示了对整个区域、微蜂窝塔区域和宏蜂窝塔区域MPL数据定位偏差的地理探测器分析结果
    • 结果包括地理探测器的三个部分:因子探测器、生态探测器和交互探测器
    • 整个区域和子区域的主要解释变量和交互变量有所不同
    • 在整个区域和宏蜂窝塔区域(图9a,c),海拔和DNCT变量及其交互是定位偏差的主要贡献因素
      • 在整个区域(图9a),物理地理因素海拔(15.8%)对定位偏差的贡献最大,其次是人文地理因素DNCT(12.3%)。海拔和DNCT之间的交互与定位偏差的关联最高(46.7%)
      • 同样,海拔(21.1%)是宏蜂窝塔区域(图9c)的主要单一解释变量,海拔和DNCT之间的交互是定位偏差的主要交互变量(68.8%
    • 尽管微蜂窝塔区域(图9b)的主要单一解释变量仍然是海拔,但解释力仅为6%
  • 生态探测器的结果表明,各种因素的影响没有显著差异
  • 最大的交互影响力达到57%,这来自于物理地理因素NDWI(2.5%)和人文地理因素道路密度(4.3%)之间的交互
  • 与整个区域和宏蜂窝塔区域的MLR结果相似,海拔和DNCT是微蜂窝塔区域的MLR重要的影响因素,而DNV、DNWB和坡向对定位偏差没有明显影响
    • 然而,微蜂窝塔区域的因子探测器测量的主要贡献因素(海拔和人口密度)与MLR结果(NDWI和海拔)不一致

论文笔记:Influence of geographical determinants on the spatial distribution of positioning uncertainties_第13张图片

 6.4.2.2 定位分散的影响模式

一个网格相关联的定位偏差的标准差(SD)可以用来衡量该空间单元的定位分散

  • 论文笔记:Influence of geographical determinants on the spatial distribution of positioning uncertainties_第14张图片同样使用地理探测器模型来探索地理因素对定位分散的影响模式
    • 在整个区域(图10a),与其他因素相比,物理地理因素海拔(6.5%)对定位分散的贡献最大。海拔和坡度之间的交互贡献最高(54.5%),这是单变量非线性增强的结果
      • 人口密度(3.8%)是微蜂窝塔区域(图10b)的主要单一解释因素
      • 与定位偏差的交互探测器结果(图9b)相似,NDWI和道路密度之间的交互是定位分散的主要交互变量(74.6%)
    • 在宏蜂窝塔区域(图10c),海拔(22.2%)是定位分散的主要贡献者,海拔和坡向之间的交互是定位分散的主要交互变量(67.8%)
    • 对于整个区域和所有子区域的MPL数据定位偏差(图9)和定位分散(图10)的交互探测器结果表明,任何两个因素的影响力在交互后都会非线性增强
      • 影响力最弱的因素的解释力在与主要影响因素交互后也显著非线性增强
        • 例如,整个区域海拔和坡向的交互影响力达到0.417(图9a),这显著大于海拔(q = 0.158)和坡向(q = 0.009)的解释力之和
    • 图9和图10表明,海拔是一个特别重要的因素,影响MPL数据定位不确定性的空间分布
      • 结合通信工程领域的相关工作,海拔直接影响蜂窝塔的选址
      • 此外,海拔决定了无线电波的传播损失
      • ——>海拔对MPL数据的定位不确定性有显著影响

你可能感兴趣的:(论文笔记,论文阅读)