python使用geopy包提取城市经纬度及计算距离矩阵

      在做物流调度问题时,我们想要知道供应商发货城市的地理坐标及距离矩阵,为路径推荐算法模型做数据准备工作,这里记录一下怎么使用geopy包提取城市经纬度及计算距离矩阵。

一、读取城市名称

          首先使用pandas包读取城市名称

import pandas as pd
df=pd.read_excel(r"C:\Users\zyy\Desktop\发货城市整理.xlsx")
df.head()   #打印前五行

       将数据读入变成dataframe格式,前五行打印出来结果如下:

python使用geopy包提取城市经纬度及计算距离矩阵_第1张图片

二、根据城市名称提取经纬度坐标

        我们需要对城市这一列提取经纬度坐标,借助python包geopy可以轻松实现经纬度地理位置转换,使用geopy.geocoders的Nominatim地理编码器,分别提取出经度、纬度以及经纬度坐标。

from geopy.geocoders import Nominatim
gps = Nominatim(user_agent='myuseragent')
loc_list_x=[]
loc_list_y=[]
coord=[]
for i in list(df['城市']):
    location = gps.geocode(i)
    loc_list_x.append(location.longitude)
    loc_list_y.append(location.latitude)
    coord.append((location.latitude,location.longitude))
df['经度']=loc_list_x
df['维度']=loc_list_y
df['坐标']=coord
df.head()  #打印前五行

       前五行结果如下所示:

python使用geopy包提取城市经纬度及计算距离矩阵_第2张图片

需要注意,gps = Nominatim(user_agent='myuseragent')这一行一定要写入user_agent='myuseragent',否则可能会报错。

三、计算距离矩阵

       提供两个地理位置的坐标,geopy可以提供几个模型来计算他们之间的距离,默认选择WGS-84 模型,距离误差最高在0.5%左右,可以选择公里、英里等距离单位输出。我们希望计算出城市两两之间的距离并以矩阵的形式输出,具体实现代码如下:

from geopy.distance import distance
rr=np.zeros([len(coord),len(coord)])
for i in range(len(coord)):
    for j in range(len(coord)):
        arr[i,j]=distance(coord[i],coord[j]).km
dis_matrix=pd.DataFrame(arr,index=list(df['城市']),columns=list(df['城市']))

     部分距离矩阵结果如下所示:

python使用geopy包提取城市经纬度及计算距离矩阵_第3张图片

四、数据存储输出

         将发货城市坐标和距离矩阵以excel表格形式存储并输出 

df.to_excel('发货城市地理位置.xlsx')
dis_matrix.to_excel('发货城市距离矩阵.xlsx')

最终xlsx结果:

  1)发货城市地理位置: 

python使用geopy包提取城市经纬度及计算距离矩阵_第4张图片

2)发货城市距离矩阵:

python使用geopy包提取城市经纬度及计算距离矩阵_第5张图片

 完整代码:

# -*- coding:utf-8 -*- 
import pandas as pd
from geopy.geocoders import Nominatim
from geopy.distance import distance
import numpy as np
gps = Nominatim(user_agent='myuseragent')
df=pd.read_excel(r"C:\Users\zyy\Desktop\发货城市整理.xlsx")

loc_list_x=[]
loc_list_y=[]
coord=[]
for i in list(df['城市']):
    location = gps.geocode(i)
    loc_list_x.append(location.longitude)
    loc_list_y.append(location.latitude)
    coord.append((location.latitude,location.longitude))
df['经度']=loc_list_x
df['维度']=loc_list_y
df['坐标']=coord

arr=np.zeros([len(coord),len(coord)])
for i in range(len(coord)):
    for j in range(len(coord)):
        arr[i,j]=distance(coord[i],coord[j]).km
dis_matrix=pd.DataFrame(arr,index=list(df['城市']),columns=list(df['城市']))
df.to_excel('发货城市地理位置.xlsx')
dis_matrix.to_excel('发货城市距离矩阵.xlsx')

完整代码及数据均以上传至我的资源——geopy提取坐标&计算距离矩阵,需要的同学自行下载。

有问题欢迎随时学习交流!

你可能感兴趣的:(经验积累,python,python,矩阵,数据分析)