Spark学习笔记-windows环境搭建

下载解压

下载地址:http://spark.apache.org/downloads.html

Spark学习笔记-windows环境搭建_第1张图片

环境配置

先装好java, scala, HDFS

Spark学习笔记-windows环境搭建_第2张图片

配置SPARK_HOME,Path

输入图片说明

启动Spark-shell

启动时出错: The root scratch dir: /tmp/hive on HDFS should be writable. Current permissions are:-------

Spark学习笔记-windows环境搭建_第3张图片

解决方案:D:\hadoop-2.7.3\bin\winutils.exe chmod 777 D:\tmp\hive 输入图片说明   winutils可以到这里下载:https://github.com/steveloughran/winutils

启动成功可以看到:

Spark学习笔记-windows环境搭建_第4张图片

编写单词计数程序

var file=sc.textFile("file:///D:/spark-2.2.0-bin-hadoop2.7/README.md")
var wordCount= file.flatMap(line=>line.split (" ")). map(word=>(word,1)).
 reduceByKey((a,b) =>a+b). collect()

Spark学习笔记-windows环境搭建_第5张图片

读取HDFS文件

var file=sc.textFile("hdfs://127.0.0.1:9000/files/README.txt")
var wordCount= file.flatMap(line=>line.split (" ")). map(word=>(word,1)). 
reduceByKey((a,b) =>a+b). collect()

Spark学习笔记-windows环境搭建_第6张图片

Spark学习笔记-windows环境搭建_第7张图片

界面查看任务

http://127.0.0.1:4040/jobs/

Spark学习笔记-windows环境搭建_第8张图片

转载于:https://my.oschina.net/Endless2010/blog/1422896

你可能感兴趣的:(大数据,操作系统)