Hadoop学习笔记 --- 深入理解 parquet 列式存储格式

最近在总结parquet 相关 的资料,这里对网上资料以及自己的思考做一个总结。


Parquet是面向分析型业务的列式存储格式,由Twitter和Cloudera合作开发,2015年5月从Apache的孵化器里毕业成为Apache顶级项目


列式存储

列式存储和行式存储相比有哪些优势呢?

你可能感兴趣的:(大数据挖掘与大数据应用案例)