Cloudera Navigator是CDH企业版的工具之一,定位为一个数据管理工具。Hadoop大数据平台拥有存储与分析任何种类和规模数据的能力,并且将其开放给更多用户和分析工具。 但是,这同时也带来数据管理上的挑战:大量的业务用户想自助访问可发掘数据;管理员需要知道数据是怎么被用来优化分析性能的;安全团队需要看见数据的访问方式以及它们是怎么满足合规性的。一个大数据平台必须有能力在整个企业内解决数据管理以及合规性需求,但同时不能牺牲大数据本身的灵活性和优势。所以我们需要数据管理工具Navigator。

1.Navigator介绍


Cloudera Navigator是唯一为大数据和Apache Hadoop提供集成数据管理和监管的工具。Cloudera Navigator作为Cloudera企业版的核心,还是有挺多用户在用的。它提供必要的审计和数据保护,来满足最严苛的规范限制。 有了唯一的全面的元数据基础作支撑,Cloudera Navigator自动将各个平台上的所有技术元数据,以及企业内用户定义的业务元数据整合成一个单一的、可搜索的储存库。至此,Cloudera Navigator可以从四个基础方面提供有效的数据管理。


1.1.自助数据发掘和分析


企业用户可以毫不费力地找到可信的,最重要的数据。
1.通过直观的全文搜索和SQL访问,在统一元数据储存库中发掘和探索数据。
2.基于业务场景和分类来定位数据集,与自动化技术场景相结合– 使其容易找到类似的、 相关的数据。

1.2.活跃数据优化


数据库管理员可以迅速获取如何来优化最关键的工作负载。
1.快速分析现有的SQL日志获取全面的视图,包括哪些查询最为关键、哪些数据被最经常的访问、以及数据是如何来被使用的。
2.通过智能优化指导来提高Hadoop的性能和效率。
3.通过可兼容的识别来减少工作负载的研发时间,从而在Hadoop上快速取得成功。
此功能适用于Navigator Optimizer,因为是一个SAAS服务,不在本文以及后续文章的介绍范围之内。


1.3合规性监管和保护


安全团队可以追踪、了解并且保护对敏感数据的访问。
1.自动保存一个完整的审计记录,追踪每一次访问尝试,细化到用户ID、IP地址以及完整的查询文本。
2.追踪数据的使用方式以及在字段级别和视图沿袭上的变化,从而快速确认一个数据集的来源以及它对下游组件的影响。
3.通过高性能加密,Navigator加密以及密钥管理来保护所有数据。
4.与领先企业的元数据、沿袭、以及SIEM应用进行集成,即插即用。


1.4.Hadoop数据生命周期自动化


数据管理员可以有效管理并且实现关键的生命周期策略,以避免风险。
1.自动化管理与操作 - 如元数据的分类,数据归档以及保存,甚至调用合作伙伴产品作为额外的数据准备及转换 - 通过灵活的策略引擎
2.通过唯一内置的备份及灾难恢复来确保业务连续性
3.通过无缝集成合作伙伴工具,来管理不只是Hadoop的数据生命周期。