Apache Kudu:用于实时分析的最佳用例

原文

所有企业都有随着时间的推移贬值的资产。直观地说,延长使用设备的使用会降低其价值,我们在日常生活中看到这些与我们开车的汽车或我们销售的旧电子产品。然而,数据通常不被视为随时间失去价值的资产。

那不对。

虽然可能不是会计部门可以支付的费用,但是在可能导致更好的行动过程的时间段内,业务数据将失去价值。无论数据是否告诉您进行预测性维护,利用市场机会,甚至防止欺诈,机会对数据采取行动的窗口都可能很小。这就是为什么实时数据和分析对于确保您的业务充分发挥潜力至关重要。

作为Cloudera Enterprise 5.10的一部分,Apache Kudu是Cloudera的新增功能,将使以往任何时候都能实时分析运行。以前,对实时数据运行分析有两个共同的途径:通过复杂的体系结构(如lambda)将多个专门的开放源码项目相结合,或者支付极其昂贵的专有软件。使用Kudu,Cloudera可以在客户期望的开源技术的价格点上提供实时分析功能。因此,我们预计市场对实时分析的需求将会增加。

考虑到随着时间的推移,数据贬值的点,有一组用例依赖于实时分析所提供的洞察力,以便在机会仍然存在时采取行动。这些用例是时间序列数据,机器数据分析和在线报告。

时间序列数据

顺序到达并提供离散时间点测量的数据称为时间序列数据。通过不断地将最新的测量结果附加到历史点上,我们可以看到数据中出现的趋势。Kudu可以实时追加数据,并使我们能够对数据进行分析。这种分析能力可以帮助将事后数据的时间序列数据集进行转换,从而在发生不良事件之前对预测数据进行分析,从而分析出现错误。

示例:市场数据流,物联网(IoT),连接汽车,欺诈检测/预防,风险监控

机器数据分析

机器数据分析是指您的网络,计算机和用户在日常业务中产生的数据。在最好的时代,这个信息是平凡的。然而,在暴风雨的天气中,它可以创建导致恶作剧的地图,您的基础设施的瓶颈,以及企业应用的潜在问题。使用Kudu,实时分析可以将该地图置于您的手中,提供“发生了什么”的指南,而不是“发生了什么”。

示例:网络威胁检测,网络健康监控,高级持续威胁(APT),网络安全,应用程序性能监控

在线报告

传统上,在线报告(如操作数据存储)受到数据量和分析能力的限制。保持数据的悠久历史是非常昂贵的,分析能力是数据仓库的领域。然而,随着Kudu,在线报告现在可以实时存储,保存所有历史数据,并提供分析分析。

示例:操作数据存储

总而言之,Kudu通过提供快速数据快速分析的关系存储来扩展Hadoop生态系统的功能。这样可以以更简单和更广泛实现的方式开展特定用例的处理。此外,它还整合了Cloudera提供的全套存储选项,其中包括HDFS,Apache HBase(NoSQL),Kudu(关系型)和基于云的对象存储。这使得客户端能够轻松地在其用例需求的存储类型之间移动,而不需要重新训练数据驻留在平台上的用户。

你可能感兴趣的:(Apache Kudu:用于实时分析的最佳用例)