(一)基于Python的Geotrellis实现-环境部署

  • 关于Geotrellis

Geotrellis是一款基于分布式存储和计算的栅格数据处理框架。

  • 使用环境说明

1、Python

Geotrellis是基于Scala语言编程实现的,同时Geotrellis也提供了其他编程语言如Python、R语言的开发接口。由于项目的需要,这里使用Python语言,版本选择3.7.3,编译器选择pycharm2019.1。具体的安装和部署过程参见其他教程。

2、Spark

Geotrellis使用分布式计算,所以需要安装Sprak。具体的安装步骤可以参考其他教程,这里不再说明。

Spark环境部署完成后,可以通过spark-submit的方式提交python代码。Python使用spark需要引入spark提供的PySpark包,安装方式:

1)使用pip

pip install pyspark

下载的使用需要指定版本,最好和安装的spark版本一致。比如:pip install pyspark==2.2.0

2)直接下载压缩包,地址:https://pypi.org/project/pyspark/#files

(一)基于Python的Geotrellis实现-环境部署_第1张图片

下载后使用pip install 目录\pyspark-2.4.3.tar.gz 

我使用的spark版本是2.2.0

3、GeopySpark

Python需要引入Geotrellis提供的Pytho包,下载方式同pyspark。

如:pip install geopyspark=0.2.0

下载完成后需要生成jar包

Geopyspark install -jar

Python的代码最终会调用这些jar包,如下:

(一)基于Python的Geotrellis实现-环境部署_第2张图片

说明部署完成。注意geopyspark的版本。

(一)基于Python的Geotrellis实现-环境部署_第3张图片

我这里使用的geopyspark版本是0.2.0

至此,基本环境已经部署完成,可以尝试开发了。

你可能感兴趣的:(geotrellis,geotrellis,geotrellis,geopyspark)