“ 鉴于很多学弟学妹对于抓取POI有强烈的的疑问和需求,我不得已把图像识别那一期往后推一推。好,废话少说,我们从抓POI开始吧,来对抓数据有个简单的认识。”
POI: POI是“Point of Interest”的缩写,中文可以翻译为“兴趣点”。在地理信息系统中,一个POI可以是一栋房子、一个商铺、一个邮筒、一个公交站等。每个POI包含四方面信息,名称、类别、坐标、分类,全面的POI讯息是丰富导航地图的必备资讯,及时的POI兴趣点能提醒用户路况的分支及周边建筑的详尽信息,也能方便导航中查到你所需要的各个地方,选择最为便捷和通畅的道路来进行路径规划,因此,导航地图POI多少状况直接影响到导航的好用程度。
如图中为某地区餐饮POI信息,我们可以利用POI来测算设施的分布位置、分布密度等情况。
操作前准备:
ArcGIS 10.3软件
Anaconda软件(其中的Spyder)
代码已经写好了,需要的可以私聊我。初次接触抓数据,我就不给大家解释每一段代码的具体意思了。简单粗暴点,我直接把需要改动的4个地方向大家详细说明一下。
01
—
四至问题(修改1)
1.1四至概念问题
四至是用来确定我们要抓取的POI的范围的,最简单的办法即用2个点来确定一个长方形作为抓取的范围。我们这里一般使用“左下右上”两个点来作为四至的点,因为左下的点可以代表最小经度和最小纬度。同理,右上的点可以代表最大经度和最大纬度。
1.2四至的获取方法
我们以烟台市为例,如下图所示。查询下烟台市大概的经纬度坐标(后面会用到)!我们可以用百度地图拾取经纬度- 拾取坐标系统:去查询所在地点的经纬度信息,经纬度大概在121.438319,37.478746的位置。这样便可以获得所需经纬度范围信息。
(见 http://api.map.baidu.com/lbsapi/getpoint/index.html)
02
—
文件保存位置及搜索POI类型(修改2、3)
修改2:设置抓取到的POI文件的保存位置,生成文件为csv格式。
这里解释下csv格式:逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。
修改3:搜索你需要的POI类型。
跟你用搜索引擎的搜索框一样,你可以随意输入关键词!!!
03
—
创建你自己的密钥(修改4)
声明:这一步大家要是嫌麻烦的话,用我的也可以哇!不过一个密钥每天是有数据抓取额度上限的,当你辛辛苦苦抓了半天,突然发现程序出现“ERROR,ERROR,ERROR”的时候,不要怪我哦!
我编的代码是腾讯地图POI,因此我们以腾讯地图的密钥申请为例:首先是打开网址https://lbs.qq.com/index.html。然后跟着图片上的步骤操作。。。
铛铛铛铛,密钥成功了,妈妈再也管不住你随便抓取数据的能力了。
注册!
铛铛铛铛,密钥成功了,妈妈再也管不住你随便抓取数据的能力了。
但是,不要忘了但是!你每天爬取的数据都有额度限制。但是第二天会重置,你又会满血复活了。 4个代码需要修改的地方已经全部搞定了,你还不快试试?
04
—
spyder抓取,自己动手试试
这里需要解释一下Anaconda。Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。 因为包含了大量的科学包,Anaconda 的下载文件比较大(约 531 MB)。Spyder就是其中的一个主要应用。
如果你觉得Anaconda太大的话,用pycharm也可以,不过还是建议初学者用Anaconda。
改好那4处需要修改的位置,点击运行键(Run),就可以运行了,结果会生成一个csv文件!
生成的csv文件,用excel打开就会看到下面的场景:E/F分别是纬度和经度!
tip:当你突然发现程序出现“ERROR,ERROR,ERROR”的时候,说明你密钥今天的额度用完了!
05
—
CSV导入ArcGIS
x,y分别输入经度和纬度!(即csv中E/F所在的位置。)
佳非猫数据 | 一个可以陪你玩数据、聊生活的铺子
公号微信ID: jiafatcat