24 分布式SQL执行引擎

1 概念

24 分布式SQL执行引擎_第1张图片

2 配置

24 分布式SQL执行引擎_第2张图片

3 测试

24 分布式SQL执行引擎_第3张图片
24 分布式SQL执行引擎_第4张图片
24 分布式SQL执行引擎_第5张图片

总结

分布式SQL执行引擎就是使用Spark提供的ThriftServer服务,以“后台
进程”的模式持续运行,对外提供端口。
可以通过客户端工具或者代码,以JDBC协议连接使用。
SQL提交后,底层运行的就是Spark任务。
相当于构建了一个以MetaStore服务为元数据,Spark为执行引擎的数
据库服务,像操作数据库那样方便的操作SparkSQL进行分布式的SQL计算

你可能感兴趣的:(spark,spark,big,data,java)