A Toponym Resolution Service

这几天读了一篇英文论文,基于OGC WPS的地名查询服务。Toponym Resolution Service这个翻译成地名查询服务有点勉强。但想不出来更好的。英文论文真实难读。10页的文章读了4,5遍还没读懂。写一些自己的理解吧

WPS是OGC提出的规范。支持互操作。WPS的提出使得基于Internet的GIS计算成为可能。WPS通过网络为客户端提供一系列GIS操作的服务调用接口。基于XML传输协议。WPS的机制是客户向服务器提交空间处理任务,服务器完成后返回结果。向服务器提出的请求可以使用(KVP)关键值参数对编码的方式。(基于HTTP协议的)。WPS规范定义了三个操作。这三个操作不详细讲了,网上有很多介绍。

一。文章中先阐述了目前地名查询的现状和存在的问题。地名查询常用在GIR(地理信息检索)中。地理信息检索是由地理信息系统和信息检索发展起来的。GIR根据一篇文章中的文字以及文字包含的地理参照信息,定义了索引结构和技术来有效的存储、检索文章。因此,文中提及的地名将作为文章的标签。GIR的优点是已经通过机器学习自动实现,缺点是仅提供地名,不提供与现实世界相关的定量描述,比如经纬度。由此缺点提出了Gazetter(地理词典),可以根据地名返回位置,人口等信息,包括经纬度。但Gazetter的缺点是不能自动实现,而且它的地名与经纬度之间的关联无相关性度量,容易产生二义性。还有就是,Gazetter除了经纬度这个相点信息外,不提供其他的几何信息。而目前已经有学者提出了空间索引结构来描述几何信息。结构中的节点通过包含关系相连,任何非叶子节点(地名)都存储了几何形状(矩形)。因此,本文就在Gazetter和空间索引结构的基础上提出toponym Resolution。

二。相关工作

OGC针对Gazetter服务也提出了规范(WFS-G),目前网上已经有一些免费资源提供Gazetter服务,但是都不支持WFS-G规范。Gazetter最重要的缺点就是不支持Cartographic服务(我理解是制图服务,可能与前面提到的几何信息对应)。因此这篇论文采用Vector Map来实现这个功能。

三。体系结构

不知道咋插入图片,框架图粘不上来。框架分两部分,第一部分是52 North WPS。这是 OGCWPS的一个框架与实现。使得地理服务可以在web上部署,使得WPS使用更容易。52 North wPS中的Request Processor负责管理与客户端的通信协议,实现了OGC WPS规范并封装了所有通信协议的细节。52 North wPS采用库的形式,提供了算法库和数据管理库。提供的每个process都有对应的算法封装在算法库中。对于本论文的特定接口,采用设计模式“适配器”实现。

第二不是是Toponym Resolution部分。这一部分给用户提供了地名解析的接口。TRAdapter作为适配器对52 North wPS提供的算法和Toponym Resolution部分的接口进行适配。Toponym Resolution部分的接口由ToponymResolutionFacade实现,提供两个操作getAll和getMostProbable。getAll根据地名返回所有可能的地理信息,包括几何信息和经纬度等,并根据相关性进行排序。getMostProbable根据需要返回最合适的信息。ToponymResolutionFacade使用了设计模式“外观”,为子系统中的一组接口提供一个一致的界面。getAll和getMostProbable两个操作利用AdministrativeDivision这个类完成。AdministrativeDivision提供操作obtainGeoreferences,返回相关地理信息。具体的实现在子类中由Gazetter和Geometry Supplier完成。AdministrativeDivision派生4个子类,根据现实世界中的行政区域等级管理指定的,包括洲,国家,区,城市。每个子类的具体实现见下一部分。也就是说getAll和getMostProbable的实现采用继承体系,每一个与具体等级对应的类只负责process中对应的部分,剩下的交由下一个等级处理,这是设计模式“职责链”。并且这里所使用的算法也用了设计模式“模板方法”。

四。实现

这一部分是说子类中如何实现Gazetter和Geometry Supplier。这两个操作的实现用了现成的方法,Gazetter采用Geonames,Geonames可以提供地理数据库,包括超过2百万条城市名以及对应的经纬度,并且分类,可以与上面提到的4层等级对应。Geometry Supplier采用Vector Map实现,可以弥补Gazetter不能提供几何信息的缺陷。Vector Map由美国国家测绘局的世界数字化图。提供第一、二级的行政区域几何信息。Gazetter和Geometry Supplier可以采用别的方法实现。算法由两步实现,第一步,每一级别从上到下根据请求的地名从Gazetter中获得所有的位置,第二步,系统自底向上返回完整路径以及信息。

五。结论

总结了一下论文的工作,getAll和getMostProbable这两个操作。提出将来可以在算法方面做出一些改进,也可以将本文的思想用于GIR中。

这篇论文没有说如何进行相关性排序,如何返回最合适的地理描述。这两点应该算作创新点,可惜没做具体阐述。 

 

 

你可能感兴趣的:(设计模式,数据结构,算法,框架,网络协议)