Apache CarbonData 1.5.0 发布,华为大数据存储方案

CarbonData 1.5.0 发布了,该版本更贴近于统一分析。我们希望能够从更多的引擎/库中读取CarbonData文件,以支持各种用例。在这方面,我们增加了支持从C++库读取 CarbonData 文件的支持。此外,可以使用Java SDK、Spark 文件格式接口、Spark、Presto 等读取 CarbonData 文件。

此外 CarbonData 添加了多个优化以减少存储大小,以便可以利用较小的IO进行查询。对来自 CarbonData 的流支持进行了一些改进。

在该版本中,包含了超过 150 项 JIRA 的条目,包括新特性、改进和 bug 修复。详细的列表请看 发行说明。

Apache® CarbonData™是由华为开源贡献的大数据高效存储格式解决方案。针对当前大数据领域分析场景需求各异而导致的存储冗余问题,CarbonData提供了一种新的融合数据存储方案,以一份数据同时支持“交互式分析、详单查询、任意维度组合的过滤查询等”多种大数据应用场景,并通过丰富的索引技术、字典编码、列存等特性提升了IO扫描和计算性能,实现百亿数据级秒级响应,与大数据生态Apache Hadoop、Apache Spark等无缝集成。

Apache CarbonData 1.5.0 发布,华为大数据存储方案_第1张图片

你可能感兴趣的:(软件更新新闻)