Apache Kudu 1.4.0 中文文档

为什么80%的码农都做不了架构师?>>>   hot3.png

原文地址 : http://www.apachecn.org/bigdata/kudu/156.html

ApacheCN cwiki 地址为 : http://cwiki.apachecn.org/pages/viewpage.action?pageId=10813594

ApacheCN - 关于我们 : http://www.apache.wiki/pages/viewpage.action?pageId=2887249

已完成 80%,欢迎加入我们一起来完成翻译!~ 

还差一点点就完工了,希望有想法的朋友,一起来维护迭代更新,另找找一位 kudu 的 admin,专门跟进这个事情,有兴趣的联系我!

Apache Kudu 1.4.0 中文文档

  • 介绍 Kudu
  • Kudu 入门指南
  • 安装指南
  • 配置 Kudu
  • Kudu 集成 Apache Impala
  • 管理 Kudu
  • Kudu 故障排除
  • 使用 Kudu 开发应用程序
  • Kudu Schema Design ( 模式设计 )
  • Kudu Security ( 安全 )
  • Kudu Transaction Semantics ( 事务语义 )
  • 后台维护任务
  • Kudu 配置参考
  • Kudu 命令行工具参考
  • 已知的问题和限制
  • 贡献于 Kudu
  • Export Control Notice ( 出口管制通知 )

Kudu 是一个针对 Apache Hadoop 平台而开发的列式存储管理器。Kudu 共享 hadoop 生态系统应用的常见技术特性: 它在 commodity hardware(商品硬件)上运行,horizontally scalable(水平可扩展),并支持 highly available(高可用)性操作。

Kudu 有许多不错的设计,它的一些优点包括 :

  • OLAP 工作的快速处理。
  • 与 MapReduce,Spark 和其他 Hadoop 生态系统组件集成。
  • 与 Apache Impala(incubating)紧密集成,使其与 Apache Parquet 一起使用 HDFS 成为一个很好的可变的替代方案。
  • 强大而灵活的一致性模型,允许您根据每个 per-request(请求选择)一致性要求,包括 strict-serializable(严格可序列化)一致性的选项。
  • 针对同时运行顺序和随机工作负载的情况性能很好。
  • 易于管理以及可以使用 Cloudera Manager 来进行管理。
  • High availability(高可用性)。Tablet Servers 和 Masters 使用了 Raft Consensus Algorithm,确保只要有一半以上的副本可用,该 tablet 便可用于读写。例如,如果 3 个副本中有 2 个或 5 个副本中的 3 个可用,则该 tablet 可用。即使在 leader tablet 出现故障的情况下,读取功能也可以通过 read-only(只读的)follower tablets 来进行服务。
  • 结构化数据模型。

通过结合这些所有的特性,Kudu 目标是支持在当代 Hadoop 存储技术上难以实现的应用的家族。Kudu 是一个很好的解决方案的几个例子是 :

  • 报告那些需要立即向终端用户提供  newly-arrived(新来的)数据的应用程序。
  • 必须同时支持的 Time-series(时间序列)应用程序 :
    • 查询大量历史数据。
    • 必须非常快地返回关于单个实体的细粒度查询。
  • 使用预测模型进行实时决策的应用程序,可根据所有历史数据定期刷新预测模型。
  • 有关这些和其他方案的更多信息,请参阅 Example Use Cases。

。。。。。。

更多细节介绍请看 : http://cwiki.apachecn.org/pages/viewpage.action?pageId=10813605

欢迎转载:ApacheCN » Apache Kudu 1.4.0 中文文档 | ApacheCN

转载于:https://my.oschina.net/repine/blog/1358978

你可能感兴趣的:(Apache Kudu 1.4.0 中文文档)