【PySpark】 pycharm安装配置pyspark所需环境

第一步下载安装包

spark安装包:http://mirrors.hust.edu.cn/apache/spark/

下载好后将安装包放在没有空格的目录中

第二步配置环境

【PySpark】 pycharm安装配置pyspark所需环境_第1张图片

找到环境变量

【PySpark】 pycharm安装配置pyspark所需环境_第2张图片

进去后点击+号,添加环境的变量

SPARK_HOME 你所安装spark的目录

PYTHONPATH 这个python位置在你spark目录下

随后点击 Apply ->OK

第三步

添加pyspark需要的根文件

py4j.zip, pyspark.zip文件

py4j涉及到底层以后讨论

点击File->Settings->Project Structure->Add Contect Root

两个文件位置在上述python目录下的lib目录

你可能感兴趣的:(Spark,spark,python,大数据)