泛读论文:urban computing 城市计算合集,持续更新

Detecting Vehicle Illegal Parking Events using Sharing Bikes’ Trajectories

KDD 2018 郑宇组的论文


首先说了这个工作很有意义,并且有数据可以做这个事情,然后定义问题分析难点最后讲述自己的解决方案,并且已部署上线。其中预处理部分非常值得学习,违章检测是基于分布的思想也值得借鉴,主要讲一下轨迹数据预处理。

泛读论文:urban computing 城市计算合集,持续更新_第1张图片

轨迹数据预处理(三个部分)

泛读论文:urban computing 城市计算合集,持续更新_第2张图片
  • Trajectory Data Cleaning

    • which removes the GPS outliers in a trajectory based on the speed and sampling rates;
    • 即通过不正常的速度和停留点检测清洗 outliers
  • Trajectory Map-Matching

    • Adaptive Map-Matching.

      作者采用 interactive-voting based map matching algorithm[37] 的方法(需要看看原文),但不同有

      • 移除了高级的路(就是自行车不能走的路,比如高速,高架等)
      • 省略方向信息,自行车存在逆行的情况
      • 每个路段的限速不用于调整自行车的速度
    • Geometric-based Refinement.

      • 在上一步Map-Matching中,存在两个问题
        1. distance error,由于路网不够详细(存在很多小路)的原因,导致映射不完整(脱离路网),如图7b左侧
        2. directional error,由于行程短或者轨迹数据清理导致的原因,导致方向错误。如图7b右侧,红色应该映射到蓝色路上,因为它们方向一致。
      • 解决方法
        1. 针对问题1,我没看懂,可能是先计算子轨迹平均移动距离,大于20米就过滤掉这条数据?
        2. 针对问题2,计算整个轨迹和道路的方向之间的偏差角(如图8所示),大于60°则移除。
    • Reverse Trajectory Removal ,移除反向轨迹

  • Index Construction

    • 因为后面的任务中,大多数是基于路段ID和时间范围来做的,所以作者对以上处理过后的数据,按照路段ID进行倒排索引,再以时间戳进行二级索引建立。

我的收获

  • 数据预处理是数据挖掘中重中之重,我们一定要根据数据的特性及目标任务进行处理,过程中要多思考,最好要去了解相关行业背景
  • 违章停车检测中关于回归分布就是以前的方法

Periodic-CRN: A Convolutional Recurrent Model for Crowd Density Prediction with Recurring Periodic Patterns

作者发现

  • Many spatio-temporal time-series data in geo-spatial domains show periodic patterns over different time scales such as days or weeks

之前的方法

  • Previous attempts to do so in deep learning based models for other timeseries forecasting applications have been limited; for example, [ST-ResNet] additionally used raw input data from previous periods in their model.

主要的想法

  • Our key idea is using periodic representations of previously observed recurring patterns with tensors, rather than using raw input data from those periods in the learning process as in previous work [ST-ResNet]

实现方法

  • 见论文,主要修改了输入,针对输入引入了多级&循环的结构在网络中

效果

  • 单步&多步预测的 rmse 都比 ST-ResNet 低降低了一点点

你可能感兴趣的:(KDD18,论文笔记)