《数学之美》之有限自动机和动态规划——地图与本地搜索的核心技术

2008年,谷歌、T-Mobile和HTC推出的安卓操作系统的智能手机G1十分引人瞩目,因为它可以利用全球卫星定位系统实现全球导航,并且完全可以媲美任何一个卫星导航仪,更加另导航仪厂商头疼的是,它的地址识别技术远优于卫星导航仪严格的地址匹配技术。
智能手机的定位和导航功能有三项关键技术,分别是

  • 利用卫星定位
  • 地址的识别
  • 根据用户输入的起点和重点,在地图上规划最短路线或者最快路线

1 地址分析和有限状态机

地址的输入显然是自然语言,不同于程序语言,它是上下文有关文法。因此能够精确地识别出相应的地理信息还是很困难,有限状态机是其中最有效的方法。如果一条地址能够从状态机的开始状态经过状态机的若干中间状态,走到终止状态,则这条地址有效,否则无效。
使用有限状态机的关键问题有两个,通过有效的地址建立状态机,以及给一个有限状态机后,地址字串的匹配算法。
但问题在于有限状态机是严格匹配的,当用户输入不标准的地址或有错别字时,有限状态机就无能为力。为了可以进行模糊匹配,科学家提出了基于概率的有限状态机,其与离散的马尔科夫链基本上等效。

2 全球导航和动态规划

如何在众多的路线出找出最优路线呢? 整个地图可以抽象成一个加权图,寻找最短路径也就是图论中很常见的问题,找出图中两点之间的最短路径。
所有的导航系统都采用了动态规划。动态规划的原理是将一个问题分解成子问题,逐渐求解局部最优解并扩展,最终得出全局最优解。


在语言识别和自然语言理解中,通常被使用的是一种特殊的有限状态机——加权的有限状态传感器(Weighted Finite State Transducer, WFST),它的特殊性在于每一个状态由输入和输出符号定义,若每个输入输出被赋予不同的权重,就是加权的有限状态传感器。
有限状态机和动态规划在语音识别、拼写和语法纠错、拼音输入法、工业控制和生物的序列分析等领域都有着极其重要的应用。

你可能感兴趣的:(《数学之美》之有限自动机和动态规划——地图与本地搜索的核心技术)