群智感知-MobiSys2012-论文简析:基于移动电话的参与式感知预测公交车的到站时间

MobiSys2012论文简析:基于移动电话的参与式感知预测公交车的到站时间

  • 论文思想
  • 论文背景
  • 论文工作
  • 解决方法
  • 总结

论文思想

  • 利用手机+群智感知的思想以节能低开销(非用户定位)的方法预测公交车的到达时间;
  • 三个部分:
    Sharing user(在公交车上且愿意分享的乘客)、Querying user(查询公交车到达时间的乘客)、Backend server(后台服务器);
  • 方法思路:
    通过手机麦克风及加速度计的特征变化值去判断Sharing user是否在公交车上;若是,则开始收集Sharing user手机当前蜂窝信号范围内最强的三个信号塔ID去组成公交路线信号序列,通过与数据库中储存的公交线路信号序列做对比从而可判断出Sharing user目前所在的公交路线,接着Backend sever会根据历史数据以及最新的公共汽车路线状态估算其到达公共汽车站的时间发送给Querying user。系统框架如下图所示:
    群智感知-MobiSys2012-论文简析:基于移动电话的参与式感知预测公交车的到站时间_第1张图片

论文背景

  • 已有公交公司系统提供信息更新不实时
    乘客不知道下一趟公交车的到达时间有可能会出现等待时间过长的情况,乘客体验感差;
  • 公交车安装定位、通信设备费用较大
    公交车除了要安装定位设备外还需要安装网络通信设备的支持,提供运输服务的网络基础设施也会提高了部署成本,这些最终将转化为乘客支出的增加。
  • 利用乘客手机的GPS功能去定位能耗很大
    大部分的研究方法都是利用Gps定位去实现的,但因为这篇论文是12年的所以对于当时的手机来说,部分手机可能还没gps功能,即使有其运行能耗也十分的高;

论文工作

  • 如何判断什么时候应该触发手机中的数据收集设备?(即判断用户当前是否在公交车上,当用户在公交车上时自动收集数据,能减少不必要的能耗及错误数据)
  • 如何将各个公交路线与收集的手机信号序列相关联?(即判断该数据收集的用户是在乘坐哪一趟公交车)
  • 如何对重叠公交路线数据进行分类?(在市中心/交通枢纽等地方,不同公交路线中出现重叠路段的情况也会变多,不同公交车上收集的信号序列段有可能相同)
  • 用户不会一直停留在一辆巴士,如何处理多个短信号序列段?(需要拼接多个Sharing users的信息来组装完整的公交线路信息序列)
  • 如何计算所预测的到达时间?
  • 论文方法的可行性验证及效果评估

解决方法

  • 通过麦克风去采集环境声音的样本,当检测到“哔”的声音——即通过512pt快速傅立叶变换FFT将时域信号转换为频域后图我们在1kHz和3kHz频段可观察到清晰峰值(因为新加坡的公交车刷卡会有哔的声音)。作者使用三个标准偏差(即99.7%的噪声置信度)的经验阈值来检测蜂鸣信号,如果在1kHz和3kHz频带中接收到的音频信号强度均超过阈值,则移动电话将确认检测到bus。如下读卡器发出声音的频域信号图所示:群智感知-MobiSys2012-论文简析:基于移动电话的参与式感知预测公交车的到站时间_第2张图片
  • 因为很多在超市/火车(类似城轨)上的入口也会有类似读卡器能发出差不多频率的声音,但是在bus上会经常需要转弯、刹车速度变化比较明显,而火车相对比较平稳,所以同时利用手机上加速度计去检测Sharing user的加速度计读数的变化。通过设置适当的阈值,利用加速度计读数的变化来区分公共汽车和火车。如果测得的加速度方差超出阈值,我们将确认检测到公共汽车,如下图所示可知公共汽车上的加速度值方差明显大于火车上的方差:
    群智感知-MobiSys2012-论文简析:基于移动电话的参与式感知预测公交车的到站时间_第3张图片
  • 当Sharing User上车时,移动电话会采样一系列的信号台ID,如下图所示红色线为公交车行驶路线,数字1~9表示不同ID的信号台,乘客A上车后读取到的信号序列为<7、8、4、5>,将乘客A所采样到的信号序列与数据库中预先设置线路采集的信号序列进行匹配,得知目前乘客A所载在路线即推出目前公交车的位置,如下图所示:群智感知-MobiSys2012-论文简析:基于移动电话的参与式感知预测公交车的到站时间_第4张图片
  • 作者使用了Smith-Waterman算法结合信号强度去权衡topk序列进行动态序列匹配(将Sharing user上传的蜂窝塔序列表示为Sequpload = ,其中m是序列长度;还用Seqdatabase = 表示数据库中的一个信号塔预定设置序列,其中n是设置序列长度。如果ui∈Sj,则ui和Sj被认为是相互匹配的,否则不匹配。我们为匹配分配分数f(sw),其中f(sw)表示非递减得分函数,w是信号强度的等级。根据集合中信号强度的顺序,我们使用f(sw)= 0.5w -1作为评分函数去评定收集信号的分数,如果最高匹配分数或序列长度小于我们的经验阈值,则后端服务器将推迟更新),如下图所示:群智感知-MobiSys2012-论文简析:基于移动电话的参与式感知预测公交车的到站时间_第5张图片
  • 作者通过记录相邻两次beep声出现的时间间隔与声音频域,组成一个“信号指纹”,因为音频信号是高度互相关的,若beep声出现的间隔相似则说明这些Sharing users在同一个bus上。接着需要对同一辆bus上不同Sharing user提供的序列片段进行拼接串联。同一bus上的信号序列拼接如下图所示:群智感知-MobiSys2012-论文简析:基于移动电话的参与式感知预测公交车的到站时间_第6张图片
  • 在公交路线重叠路段检测到的信号台序列可能相似,从而难以去对Sharing user提供数据进行路线区分。作者通过在新加坡的调查研究发现90%的重叠路段长度小于为1400m,而一个信号台的覆盖范围大约为300-900m,故将采集信号序列的长度设置为7,下图展示了信号序列从2~9长度下预测正确率(当长度大于等于8时预测率已经相当准确了):群智感知-MobiSys2012-论文简析:基于移动电话的参与式感知预测公交车的到站时间_第7张图片
  • 后端服务器会根据历史数据以及最新的公共汽车路线状态估算其到达公共汽车站的时间,如下图所示(设公共汽车在当前单元格已停留时间表示为t2公共汽车在停靠站所在的单元格中的旅行时间表示为Tbs公交在单元3处的历史停留时间表示T3):
    群智感知-MobiSys2012-论文简析:基于移动电话的参与式感知预测公交车的到站时间_第8张图片
    则有预测到达时间为T = T2 − t2 + T3 + tbs,
    因此一般条件下,将i单元中的停留时间表示为Ti,1≤i≤n,将bus的当前单元号表示为k,将所查询的公交车站的单元号表示为q。服务器可以如下估算公共汽车的到达时间为:群智感知-MobiSys2012-论文简析:基于移动电话的参与式感知预测公交车的到站时间_第9张图片

总结

这篇论文主要的话就是介绍了一个基于手机的群智感知公交车到达时间预测系统,这个系统有效利用了轻巧的手机传感器(麦克风、加速度计)及廉价且广泛可用的蜂窝信号,从而鼓励并吸引了参与性用户(激励机制也是群众感知中十分重要的部分),为该问题提供了具有成本效益的解决方案。同时,该系统独立于公交机构和位置服务的任何支持,为群众的参与性贡献提供了灵活的框架。
这篇论文毕竟是12年的,其中提到的一些方法对于现在来说会已经过时或者有其他更好的方式,例如现在的手机gps功能已经普及应用。通过阅读这篇论文,对于我主要还是去了解群智感知应用上的思路流程及可用方法,对群智感知有个更好的了解,顺便锻炼下整理论文的能力及方法,嗯。

你可能感兴趣的:(群智感知,数据分析,物联网,时间预测,论文简析)