从《大数据日知录》的目录想到的学习路径

第0 章 当谈论大数据时我们在谈什么................ 1
第1 章 数据分片与路由......................................9
第2 章 数据复制与一致性.................................20
以上两章数据存储(分布式)相关
第3 章 大数据常用的算法与数据结构................51
第4 章 集群资源管理与调度..............................71
第5 章 分布式协调系统.....................................91
以上两章集群分布式系统调度相关
第6 章 分布式通信..........................................106
第7 章 数据通道..............................................120
以上两章为进程间通信和数据传输相关
第8 章 分布式文件系统....................................131
第9 章 内存KV 数据库.....................................168
第10 章 列式数据库.........................................176
多机器联合存储构成分布式文件系统,按特殊目的设计出特色存储服务
第11 章 大规模批处理系统...............................199
第12 章 流式计算.............................................219
以上两章流行的大数据处理模式,离线批处理和在线流处理
第13 章 交互式数据分析...................................240
第14 章 图数据库:架构与算法.........................271
大数据分析应用场景
第15 章 机器学习:范型与架构.........................313
第16 章 机器学习:分布式算法.........................337
机器学习应用场景
第17 章 增量计算..............................................366
机器学习举例


总结下来学习的路径应该是
分布式文件系统,       以HDFS为例
分布式调度,              以ZooKeeper为例
两种大数据处理模式,以Hadoop为主,比较Storm的异同
在应用方面,              挖掘一下知乎关注图谱

你可能感兴趣的:(笔记)