Spark(三)-- SparkSQL扩展(数据读写) -- 读写 Parquet、Json 格式文件(二)
7.3读写Parquet格式文件目标理解Spark读写Parquet文件的语法理解Spark读写Parquet文件的时候对于分区的处理什么时候会用到Parquet?在ETL中,Spark经常扮演T的职务,也就是进行数据清洗和数据转换.为了能够保存比较复杂的数据,并且保证性能和压缩率,通常使用Parquet是一个比较不错的选择.所以外部系统收集过来的数据,有可能会使用Parquet,而Spark进行