Clickhouse—数据字典

Clickhouse 数据字典

Clickhouse 数据字典在Clickhouse 中有很多经典应用,它提供的功能有点类似Map-Join ,可以参考数仓工具—Hive语法之map join、reduce join、smb join, 所以比较适合保存常量或者经常使用的维度表数据,以避免不必要的JOIN

1. 数据字典介绍

  • 数据字典是ClickHouse提供的一种非常简单、实用的存储媒介,它以键值和属性映射的形式定义数据。
  • 字典中的数据会主动或者被动加载到内存,并支持动态更新。
  • 由于字典数据常驻内存的特性,所以它非常适合保存常量或经常使用的维度表数据,以避免不必要的JOIN查询。
  • 在默认情况下,字典中的数据只能通过字典函数访问。
  • 数据字典分为内置与扩展两种形式:
    • 内置字典:ClickHouse默认自带的字典
    • 扩展字典:用户通过自定义配置实现的字典
  • 在字典表引擎的帮助下,可以将数据字典挂载到一张代理的数据表下,从而实现数据表与字典数据的JOIN查询。

2. 内置字典

  • ClickHouse目前只有 Yandex.Metrica一种内置字典
  • Yandex.Metrica 设计意图是快速存取 geo 地理数据
  • 因为版权原因Yandex并没有将geo地理数据开放出来,只是提供了字典的定义机制和取数函数
  • 如果想使用 Yandex.Metrica

你可能感兴趣的:(#,Clickhouse,clickhouse,hive,hadoop)