Spark,数据压缩

一、压缩的好处和坏处

压缩的优点:以减少磁盘IO、减少磁盘存储空间。

压缩的缺点:增加CPU开销。

二、压缩原则

(1)运算密集型的Job,少用压缩

(2)IO密集型的Job,多用压缩

三、压缩算法对比介绍

Spark,数据压缩_第1张图片

 四、打开我们之前的项目(是下面这个哦)

Spark,数据压缩_第2张图片

 在下面位置添加下下面代码

Spark,数据压缩_第3张图片

 

 然后在第七点上面添加

Spark,数据压缩_第4张图片

 注意:第六点要注释哦

你可能感兴趣的:(spark,hadoop,maven)