大数据学习路线总结

背景引入

考虑到有对大数据开发感兴趣的同学,因为找资料方向上特别迷茫,不知道大数据具体需要学习什么组件。为了让大家少走弯路,我就把之前的学习笔记发一遍在自己博客,本文就是提供这个博客的链接。可以为大家学习大数据方面以及面试求职有一个很好的认知。

说明:
本文是我的一个学习路线
里面主要是包含大数据开发后端面试(现在大数据是后端这边发展过来的)AI数据分析
数据分析这块,我打算考一个这方面的证书,后面也会更新一部分数据分析的知识点

1 Java学习阶段

⁉️为什么学习大数据也要学Java?
1️⃣Hadoop生态圈底层都是使用Java开发的,如果涉及到源码的修改需要看懂Java
2️⃣Java的生态相比于其他语言(Python、R等)发展比较成熟

第一阶段基础知识

注意:基础知识其实和大学课上讲的Java知识点差不多,但是也有很多对于课堂内容的补充。
☀️Java零基础(一)之Java发展+注释+编译
☀️Java零基础(二)之变量+运算符
☀️Java零基础(三)之运算符+逻辑循环
☀️Java零基础(四)逻辑循环常用案例
☀️Java零基础(五)之eclipse的安装+方法定义
☀️Java零基础(六)之一维数组
☀️Java零基础(七)之数组排序+二维数组
☀️Java零基础(八)之对象那些事
☀️Java零基础(九)之面向对象三大特性

第二阶段高阶(Springboot、MyBatis、Maven系列)

第三阶段JDBC(Mysql系列)

☀️Mysql高频面试题(后端大数据面试必备)

第四阶段 JAVA高频面试题系列

2 Hadoop生态组件(全部要在Linux环境进行安装)

2.1 Linux入门

⚡️Linux指令入门+Shell脚本入门
⚡️Shell脚本实操

2.2 Hadoop集群入门

⚡️Hadoop集群入门

2.3 Zookeeper学习

⚡️Zookeeper知识点

2.4 Mapreduce知识点

⚡️Mpareduce知识点

2.5 Hive知识点

⚡️Hive知识点总结
⚡️Hive相关函数

2.6 Hbase知识点

⚡️Hbase知识点

2.7 Flume知识点

⚡️Flume的使用

2.8 Presto搜索引擎的使用

⚡️Presto使用总结

2.9 Sqoop对于Hadoop生态圈数据与其他来源数据的导入导出操作

⚡️Sqoop知识点

2.10DataX 不同数据库之间数据的导入导出操作

⚡️DataX的使用

2.11 Azkaban调度工作流的使用

⚡️Azkaban

2.12 Kylin对于多维度OLAP分析的使用

⚡️Kylin

2.13 Nginx服务器知识总结

⚡️Nginx

2.14 Superset程序进程管理工具总结

⚡️Superset

2.15 Prometheus监控知识总结

2.16 Grafana作为监控可视化页面的使用总结

2.17Clickhouse知识总结

2.18 Kafka消息队列知识总结

⚡️Kafka知识总结

2.19 Redis(Nosql)知识总结

⚡️redis知识点总结

2.20 ElasticSearch知识总结

2.21 Kettle知识总结

2.22 MangoDB知识总结

2.23 Druid知识总结

3 数仓理论知识

4 Scala版本的Spark开发学习

4.1 Scala学习

Scala学习

4.2 SparkCore开发(开发很少使用)

SparkCore开发

4.3 Sparksql开发(经常使用)

4.4 SparkStreaming开发(一代微批的实时流处理)

4.5 SparkStructuredStreaming 开发(二代微批实时流处理)

5 Flink实时开发系列

6 Python数据分析开发知识总结

7 BI工具使用系列(数据可视化报表工具)

7.1 帆软BI工具

7.2 PowerBI工具使用

7.3 Tableau工具使用

7.4 SmartBI工具使用

8 Git的使用

9 应届毕业生求职篇

第一模块 算法与数据结构

第二模块 23种设计模式

第三模块 计算机网络

第四模块 操作系统

第五模块 计算机组成原理

10 机器学习

11 AI相关

你可能感兴趣的:(大数据那些事,面试,big,data,学习,hadoop)