2. 《大数据之路:阿里巴巴大数据实践》学习笔记,持续更新ing

笔记链接(飞书):https://t0s016els2a.feishu.cn/docx/JrNydGljUonH1ExcGCpcoC8unTb
密码:r6@61391

该书籍部分目录如下:

文章目录

    • 第1篇 数据技术篇
      • 第2章 日志采集
        • 2.1 浏览器的页面日志采集
          • 2.1.1 页面浏览日志采集流程
          • 2.1.2 页面交互日志采集
          • 2.1.3 页面日志的服务端清洗和预处理
        • 2.2 无线客户端的日志采集
          • 2.2.1 页面事件
          • 2.2.2 控件点击及其他事件
          • 2.2.3 特殊场景
          • 2.2.4 H5 & Native 日志统一
          • 2.2.5 设备标识
          • 2.2.6 日志传输
        • 2.3 日志采集的挑战
          • 2.3.1 典型场景
          • 2.3.2 大促保障
      • 第3章 数据同步
        • 3.1 数据同步基础
          • 3.1.1 直连同步
          • 3.1.2 数据文件同步
          • 3.1.3 数据库日志解析同步
        • 3.2 阿里数据仓库的同步方式
          • 3.2.1 批量数据同步
          • 3.2.2 实时数据同步
        • 3.3 数据同步遇到的问题与解决方案
          • 3.3.1 分库分表的处理
          • 3.3.2 高效同步和批量同步
          • 3.3.3 增量与全量同步的合并
          • 3.3.4 同步性能的处理
          • 3.3.5 数据飘移的处理
      • 第4章 离线数据开发
      • 第5章 实时技术
      • 第6章 数据服务
      • 第7章 数据挖掘
    • 第2篇 数据模型篇
    • 第3篇 数据管理篇
    • 第4篇 数据应用篇

第1篇 数据技术篇

第2章 日志采集

2.1 浏览器的页面日志采集
2.1.1 页面浏览日志采集流程
2.1.2 页面交互日志采集
2.1.3 页面日志的服务端清洗和预处理
2.2 无线客户端的日志采集
2.2.1 页面事件
2.2.2 控件点击及其他事件
2.2.3 特殊场景
2.2.4 H5 & Native 日志统一
2.2.5 设备标识
2.2.6 日志传输
2.3 日志采集的挑战
2.3.1 典型场景
2.3.2 大促保障

第3章 数据同步

3.1 数据同步基础
3.1.1 直连同步
3.1.2 数据文件同步
3.1.3 数据库日志解析同步
3.2 阿里数据仓库的同步方式
3.2.1 批量数据同步
3.2.2 实时数据同步
3.3 数据同步遇到的问题与解决方案
3.3.1 分库分表的处理
3.3.2 高效同步和批量同步
3.3.3 增量与全量同步的合并
3.3.4 同步性能的处理
3.3.5 数据飘移的处理

第4章 离线数据开发

第5章 实时技术

第6章 数据服务

第7章 数据挖掘

第2篇 数据模型篇

第3篇 数据管理篇

第4篇 数据应用篇

你可能感兴趣的:(#,业务理解,模型建设,大数据,学习,笔记)