SparkSession、SparkContext、SQLContext

SparkSession、SparkContext、SQLContext_第1张图片

Application:用户编写的Spark应用程序,Driver 即运行上述 Application 的 main() 函数并且创建 SparkContext。
SparkContext:整个应用的上下文,控制应用的生命周期。
RDD:不可变的数据集合,可由 SparkContext 创建,是 Spark 的基本计算单元。

SparkSession是Spark2.0新引入的

SparkSession内部封装了SparkConf、SparkContext、SQLContext、HiveContext
因此SparkSession可以用他们所有的api

创建方式:

SparkSession、SparkContext、SQLContext_第2张图片

利用SparkSession创建SparkContext和SQLContext:

在这里插入图片描述

你可能感兴趣的:(Spark)