由于百度或者高德的API只能获取国内的POI,谷歌API需要而且还收费,所以一直为为何白嫖国外POI数据头疼。最近终于找到了方法,使用OSMnx,得到基于OSM地图提供的POI数据。
在学习的过程中,发现居然没有人写相关的文章介绍,没办法只能摸着石头过河,一点一点学习,这个功能最提出是在github issue中提到的。里面对于最初的功能设计、内容呈现之类的问题都有讨论,还是挺有意思的。同时也感谢这些开源贡献者,非常感谢!
OSMnx是由南加大规划系的Geoff Boeing教授编写的OpenStreetMap的python拓展包。
参考官网:https://geoffboeing.com/
OSMnx的基本功能:下载街道网络、下载POI、下载城市路网结构、可视化等。
基本的使用教程网上有很多,但我推荐下面这个链接里作者写的介绍
https://geoffboeing.com/2016/11/osmnx-python-street-networks/
对于这个文章,我们只需要知道,如何获得行政地点边界就可以,因为获取POI要使用到。
获得行政地点边界:osmnx.geocode_to_gdf(place)
本文例子以(‘Berkeley, California’) 作为place
import osmnx as ox
place = 'Berkeley, California'
city = ox.geocode_to_gdf(place)
ax = ox.project_gdf(city).plot()
_ = ax.axis('off') # 消除图表框
OSMnx提供获取POI的方法,和最初在github issue中的名字已经不一样了,现在的模块叫做osmnx.geometries module。模块非常规整,给出了5种获得数据的方式,分别是:
osmnx.geometries_from_address(address, tags, dist=1000)
geometries.geometries_from_bbox(north, south, east, west, tags)
osmnx.geometries.geometries_from_place(query, tags, which_result=None, buffer_dist=None)
osmnx.geometries.geometries_from_point(center_point, tags, dist=1000)
osmnx.geometries.geometries_from_polygon(polygon, tags)
这5种方法,大家可以根据需要自己选择。具体的内容可以看官方文档,下面主要使用4和5方法。
需要对tags强调一下。你想要获得的内容就是通过tags进行定义的,详细内容请查阅相关资料。这里只给出获取所有POI。
tags = {"amenity": True} # 表示所有的POI
在这里为了对比不同的方法,使用4和5方法进行演示。
方法4: 给定点的经纬度和搜索范围,获取以点为中心,指点范围内的数据
方法5:给定城市名称,获取城市范围内数据
获取经度 -122.3133443 ; 维度37.9285095,这个点附近10km的POI分布。
# 经度 -122.3133443 维度37.9285095
p1 = ox.geometries.geometries_from_point((37.9285095, -122.3133443),
tags={'amenity': True},
dist=10000)
得到的p1是一个DataFrame,index包括三个:node,way,relation。
我们将p1的内容可视化一下
ds = p1.loc['node']['geometry']
ds2 = p1.loc['way']['geometry']
ds3 = p1.loc['relation']['geometry']
fig = plt.figure(figsize = (15,10))
ax = plt.subplot()
ds.plot(edgecolor = 'b', alpha = 0.5, ax = ax)
ds2.plot(edgecolor = 'k',alpha = 0.5, ax = ax)
ds3.plot(edgecolor = 'r',alpha = 0.5, ax = ax)
plt.show()
way和relation是图中的多边形,对于获取POI而言意义不大,我们只需要node
ox.geometries_from_polygon(place) ,其中的place需要是shapely.geometry.Polygon 或 shapely.geometry.MultiPolygon数据类型,因此这就需要用最开始提到了获取城市边界函数geocode_to_gdf,通过先获取指定城市的边界,之后将边界传入geometries_from_polygon
place = 'Berkeley, California'
city = ox.geocode_to_gdf(place) # 获取城市边界
p2 = ox.geometries_from_polygon(city['geometry'].all(), tags={"amenity": True} )
全部内容可视化
ds = p2.loc['node']['geometry']
ds2 = p2.loc['way']['geometry']
ds3 = p2.loc['relation']['geometry']
fig = plt.figure(figsize = (15,10))
ax = plt.subplot()
ds.plot(edgecolor = 'b', alpha = 0.5, ax = ax)
ds2.plot(edgecolor = 'k',alpha = 0.5, ax = ax)
ds3.plot(edgecolor = 'r',alpha = 0.5, ax = ax)
plt.show()
最后是储存数据,可以将p1所有的内容都存储为csv,方便对POI进行分类和分析,也可以将POI点存为shp文件,方便在gis软件操作。
p2.to_csv(r'..\all_poi.csv')
p2.loc['node']['geometry'].to_file(r'..\node.shp')