在IDEA中直接提交Spark任务

如果在本地安装了Spark,那么就不需要在本地启动一个类似tomcat或者jetty的server
如果没有一般会启动一个jetty,否则无法和Spark通信




这里所说的本地提交是指submit到Spark集群计算环境上的job,也就是一个Jar包,

虽然IDEA的方法中拥有main方法,但是不能再IDEA中直接右键main函数来debug运行.因为不是一个独立的可运行的程序,而是运行在Spark环境上的,由另外一个jvm来调用.所以一定要把项目打包成一个jar包,然后才能在IDEA中右键运行

这个调用就如同调试web程序,把程序部署在tomcat上之后,需要以debug的方式启动tomcat才能调试web程序,所以调试Sparkjob的关键是要以debug的方式启动
Spark Job将要跑的JVM


可以打开浏览器在windows上看Spark运行状况,直接输入localhost:8080 每次刷新都会重新提交一次任务
(返回505啥的没问题,因为本身就没有写过界面)

你可能感兴趣的:(Spark学习)