window搭建pyspark环境,不需要hadoop

1.HADOOP_HOME

windows中安装spark环境是不需要安装hadoop的,但是需要安装winutils,下载地址winutils
它是一个windows下hadoop工具包,在windows中起到模拟hadoop的作用,

  1. 下载jdk,配置JAVA_HOME环境变量,并在PATH中增加%JAVA_HOME%\bin
  2. 在本地新建一个hadoop目录,配置环境变量HADOOP_HOME,并在PATH中增加%HADOOP_HOME%\bin,
  3. 然后将winutil等文件放在bin目录下
  4. 下载spark到本地,并解压在本地目录,地址为:http://spark.apache.org/downloads.html
  5. 配置环境变量,配置SPARK_HOME,并且在PATH中添加%SPARK_HOME\bin%
  6. 添加系统环境变量CLASSPATH在这里插入图片描述
  7. 添加系统环境变量PYTHONPATH = %SPARK_HOME%/python:%SPARK_HOME%/python/lib/py4j-0.10.4-src.zip:% PYTHONPATH %
  8. 安装python,pyspark,进行测试,完美成功

参考文档:spark学习教程
Pyspark,Python下安装Spark,无需安装Hadoop
windows下spark开发环境配置
Windows搭建PySpark开发环境

你可能感兴趣的:(hadoop,大数据,spark)