本文来自于:
https://bookauthority.org/books/new-data-warehouse-books
网络
看到这篇书单,觉得还是蛮有意思的,毕竟很多 Kimball, Inmon 大师的书都看的差不多了,是时候给自己做补充点货了。
1,Practical Guide to SAP HANA and Big Data Analytics
这是一本为 SAP BI, Big Data 以及 IT 架构师而写的书,详细介绍了现代数据分析体系的解决方案。探讨了当下时兴的大数据计算框架以及预测分析。对于各种企业场景选型各类数据工具有很好的实际指导作用,架构涵盖了企业内部自建,企业云以及混合云。
SAP 的产品历来都喜欢黑马出现,比如 ERP, BW,BO. 一经推出市场,反响都很棒,这次数据仓库级的产品,依然带来很多不可小觑的功能。在技术上,应用了前沿的手段,比如大规模扩展、内存计算、分布式计算的大容量存储以及高速计算;在许多新兴的业务领域,都有拿得出手的设计,比如社交媒体、云服务、物联网感知以及大数据实时计算。 这本书基本都有介绍。
2,Quick Start Guide to Azure Data Factory, Azure Data Lake Server, And Azure Data Warehouse
微软这些年的发力还是有目共睹的,比如 Azure Data Lake Server(ADLS), Azure Data Warehouse(ADW). 对于传统数据仓库技术开发人员说,如何在这些服务之间迁移数据可能是最为关心的问题。更为基础的问题是如何将本地数据迁移到云上,这本书给出了很好的答案。
3, The Datacenter As a Computer (Designing Warehouse-scale Machines
本书是 8 本书中唯一一本讲解硬件技术的书,为我们挖掘支持每日数以千亿计的服务背后的计算平台构成。详细阐述了仓储式计算的主要架构,设计思想,运维,成本以及软件特性。如果你对 Google 背后的硬件,软件运行机理感兴趣,本书可以做参考。
4, Microsoft Azure SQL Data Warehouse a Complete Guide
搭建 Azure SQL 数据仓库需要遵循哪些规则,性能易扩展吗,谁来保障实现项目所需的资源(时间,人手和预算)?哪些模型,工具和技术是构建 Azure SQL 数据仓库的必备?
5, Next-Generation Big Data(A Practical Guide to Apache Kudu, Impala, and Spark)
这是一本帮助传统企业数据仓库以及商业智能平台向现代化数据平台迁移的指导用书。本书涵盖的内容不仅仅包括主要的数据仓库技术栈,还对未来大数据仓库、性能调优以及实时计算和批处理工具以及思路都进行了阐述。书中介绍的技术,包罗万象,简直堪称是数据架构界的重兵器库。
6,Azure SQL Data Warehouse( A Clear and Concise Reference )
如书名所示,这是一本关于 Azure SQL 数据仓库的百科全书。难得的是,书中把 Azure SQL 数据仓库的弱点都一五一十告诉我们了。比如有哪些限制,这些限制对应的影响,如何对数据仓库做操作日志等等。如果是 SQL Server 方向上的数据仓库工程师,这本书推荐看。
7, Data Warehouse Automation( A Pragmatic Guide to the Easiest and Fastest Development of Your Data Warehouse)
在当下的技术背景下 ,中小企业完全可以建立起一个低成本的内建数据仓库,而大型公司则可以建立比以往更大规模的数据仓库。利用书中提到的免费工具,IT 可以快速建立一个独立自主的数据仓库,是一本实战型的参考用书。
8, Amazon Redshift Database Dvelooper Guide
这是一本利用 Amazon Redshift 来搭建数据仓库的书,如果你用这工具,那么本书将是你做设计,开发和管理的必备用书。
往期精选:
Foreign Key 一定是无用的吗?
带读 IBM 关系型数据库经典论文
【万字详解】SQL 优化引擎内幕