Exception: Python in worker has different version 2.7 than that in driver 3.5, PySpark cannot run wi

出现上述错误是环境变量设置有误,下面为修改方法

方法1.在py代码中import os修改环境变量:此方法不行可以看方法2

import os

PYSPARK_PYTHON = /home/piting/ENV/anaconda3/bin/python
os.environ["PYSPARK_PYTHON"] = PYSPARK_PYTHON

方法2.有时如果你使用的是虚拟环境或者anaconda,需要修改 .bash_profile文件:

        原因:这种情况不能直接设置export PYSPARK_PYTHON=python3,这样可能直接指向的是系统全局的设置,而不是当前用户的。

        步骤:1.vim .bash_profile 用vi编辑器打开,然后添加export PYSPARK_PYTHON=python3。如下图

                          

                  2.使修改的环境变量立即生效: source .bash_profile
 

你可能感兴趣的:(python,spark,pyspark,算法)