Hadoop 2.x初级入门到精通(全面深入的Hadoop实战教程)—756人已学习
课程介绍
以Apache Hadoop 2.5.0为准,进行深入浅出的讲解各个模块的功能、架构、使用,主要四个方面内容: 模块一:Hadoop 2.x入门 模块二:分布式文件系统HDFS 模块三:分布式资源管理框架YARN 模块四:分布式计算框架MapReduce
课程收益
掌握课程四大模块内容
讲师介绍
张勇 更多讲师课程
北风网技术总监,在某大型电信设备公司担任架构师,主要从事电信领域的软件开发,经验丰富。对电信计费系统以及核心网软件系统有深入了解,对设计高可靠性,高扩展性的软件系统具有丰富经验。
课程大纲
第1章:Hadoop 2.x入门
1. 为什么开设Hadoop 2.x课程以及企业中的应用 22:10
2. 课程大纲介绍、课程学习注意事项 19:31
3. 安装Linux虚拟机、基本设置(Ip地址配置、主机名、创建用户等) 24:01
4. Linux远程四大工具使用 20:08
5. 主机名与IP映射配置、man命令以及如何创建查看文件内容 25:09
6. Linux系统中文件类型、权限、用户讲解 21:49
7. 对文件cp、mv命令讲解、设置用户sudo和安装JDK 25:22
8. Hadoop 2.x介绍与生态系统重要框架讲解 30:34
9. hadoop 起源、三大版本和下载编译说明 20:54
10. hadoop 2.5.0编译准备工作(安装Maven、系统依赖包等) 19:51
11. 对Haodop 2.5.0进行编译、目录结构讲解以及编译注意事项 23:38
12. 将hadoop 2.x源码导入Eclipse中,进行查看和编辑修改 17:13
13. Hadoop 2.x模块之HDFS架构概要介绍讲解 21:20
14. Hadoop 2.x模块之YARN架构和MapReduce on YARN概要介绍讲解 23:06
15. Hadoop 2.x安装部署前的准备 21:25
16. 在单机模式下运行MapReduce案例和伪分布式安装配置HDFS 17:17
17. 运行MapReduce程序(输入输出数据来源于HDFS)和讲解HDFS基本Shell命令操作 21:06
18. 伪分布式部署YARN(配置与启动)和在YARN上运行MapReduce任务 20:02
19. HDFS权限检查讲解和运行词频统计WordCount程序 23:24
20. MapReduce历史服务JobHistoryServer和启动Hadoop 2.x服务三种方式 18:17
21. 分析三种启动方式脚本和引出ssh协议作用 22:53
22. 讲解SSH协议和SSH无密钥登陆原理 20:55
23. 配置SSH、使用start-dfs.sh启动HDFS组件和Hadoop与Java版本选择 20:21
24. Hadoop 2.x两种配置文件讲解说明 19:30
25. 如何配置Hadoop 2.x中各个守护进程运行的主机 20:17
26. 如何配置HDFS相关数据存储的本地目录 25:27
27. 运行在YARN上的MapReduce程序相关日志(应用日志和Container日志) 20:21
28. 启用运行在YARN上应用程序日志聚合功能和MapReduce Uber模式 21:51
29. Hadoop 2.x分布式安装部署环境准备之克隆虚拟机和配置主机名与IP地址 25:52
30. Hadoop 2.x分布式安装部署环境准备之集群hosts映射配置和时间同步配置 20:08
31. Hadoop 2.x分布式集群安装部署启动(基于伪分布式进行) 24:46
32. Hadoop 2.x分布式安装部署之集群部署的基本测试验证和基准测试 21:53
33. 配置HDFS与YARN的主节点到从节点的SSH无密钥登陆、解决问题 26:46
34. YARN中的Web Application Proxy讲解 24:20
35. 阅读讲解Hadoop 2.x官方文档集群如何安装和CLI MiniCluster讲解 23:18
36. 如何增加和卸载集群节点、卸载HDFS的DataNode节点 24:25
37. 卸载YARN的NodeManager节点和集群增加节点讲解 19:19
38. 企业级Hadoop 2.x中HDFS、YRAN的架构设计和MR运行流程图预览 17:26
第2章:分布式文件系统HDFS
1. 分布式文件系统架构之一设计目标和架构讲解 22:29
2. 分布式文件系统架构之二架构设计NameNode和DataNode详解 20:22
3. 分布式文件系统架构之三块Block的存放策略和垃圾回收 24:56
4. 分布式文件系统架构之四NameNode启动过程详解 20:56
5. 分布式文件系统架构之五NameNode启动过程中安全模式详解 20:36
6. 分布式文件系统架构之六使用oiv和oev查看NameNode的fsimage和edits文件内容 21:01
7. 分布式文件系统架构之七SecondaryNameNode功能详解 20:55
8. 分布式文件系统架构之八如何使用SNN恢复NN 25:09
9. HDFS Shell 命令使用讲解 21:26
10. HDFS 管理命令讲解和使用Eclipse创建Maven工程 19:32
11. 使用HDFS URL API详解和查看IOUtils源码 18:59
12. 使用HDFS FS API详解之一多种方式获取FileSystem实例 21:58
13. 使用HDFS FS API详解之二伪装用户方式操作HDFS和向HDFS上写文件 20:12
14. 使用HDFS FS API详解之三获取文件的存储信息和集群DataNodes信息以及其他操作 19:17
15. 使用HDFS FS API详解之四远程Debug调试跟踪程序 22:41
16. 使用HDFS FS API详解之五本地文件系统LocalFileSystem讲解和百度网盘功能讲解 23:43
17. 深入讲解HDFS客户端配置和配置信息分类 26:04
18. HDFS应用案例讲解之需求说明分析 20:20
19. HDFS应用案例讲解之编码实现与测试说明该 21:00
20. Hadoop 2.x底层通讯协议RPC讲解和编程实现远程过程调用 25:20
21. HDFS各守护进程之间通信的RPC协议和如何调式读取文件内容 23:07
22. 对Hadoop 2.x源码远程调试两种方式讲解和如何使用打印日志进行调试 19:52
23. 使用Eclipse进行对Hadoop 2.x源码进行远程调试(查看NameNode启动过程) 20:46
第3章:分布式资源管理框架YARN
1. 云计算与大数据Hadoop关系、Hadoop 1.x与Hadoop 2.x比较 23:10
2. 分布式资源管理框架YARN功能详解 23:59
3. YARN架构组件详解、通信协议讲解和以YARN为核心的生态系统 22:46
4. YARN监控界面详解(YARN如何管理监控集群资源) 22:31
5. 企业测试机配置说明、如何对节点资源进行配置管理 20:25
6. YARN对集群资源(内存和CPU)管理与隔离讲解 19:44
7. YARN命令使用讲解、YARN的工作流程讲解 21:04
8. YARN中应用历史服务TimelineServer配置讲解 23:00
9. 国内外主要的Hadoop 2.x相关的几大发行版本讲解(CDH,HDP等) 23:13
第4章:分布式计算框架MapReduce
1. 企业大数据应用和MapReduce编程模型讲解 29:45
2. MapReduce思想原理和如何在YARN上运行 23:49
3. 分析WordCount程序执行流程以及编写MapReduce八股文格式 20:57
4. 以[八股文格式]编写WordCount程序 33:42
5. 优化WordCount程序(实现Tool接口)以及总结如何编写MapReduce程序 21:18
6. MapReduce程序中如何自定义计数器和WordCount程序中优化注意事项 29:03
7. MapReduce程序默认情况下如何对输入文件进行读取和输出文件进行写入 21:08
8. 在Linux系统下使用Eclipse开发测试MapReduce程序 19:24
9. 如何编译Win7下Hadoop 2.x插件和配置运行使用 22:42
10. MapReduce不同模式下运行的Counters、从YARN监控页面查询以运行MapReduce 23:19
11. MapReduce Shuffle画图讲解 24:43
12. MapReduce Shuffle讲解 22:37
13. 在MapReduce中设置Shuffle阶段五大要点以及MapReduce没有Reduce类测试讲解 21:23
14. 设置MapReduce Job中Reduce Task数量及总体把握MapReduce 框架运行过程 24:33
15. 通过跟踪源码分析MapReduce提交Job的过程 20:25
16. MapReduce Job运行时如何计算Map Task个数(计算InputSplit) 25:36
17. MapReduce Job提交的两种运行方式源码分析及Mapper和Reducer类分析讲解 26:29
18. 依据基类Mapper和Reducer编写MapReduce编程模板 25:42
19. 最小配置MapReduce Job、MapReduce的默认配置和修改优化MapReduce编程模板 30:41
20. 如何依据MapReduce模板编写Job程序并测试 15:21
21. MapReduce单元测试框架MRUnit基本使用讲解 20:13
22. 使用MRUnit对Mapper、Reducer进行单元测试 18:22
23. 通过MapReduce自定的数据类型源码分析,如何自定义数据类型 23:48
24. 在定义Key的数据类型时,如何定义优化比较器Comaprator 20:11
25. 编写自定义数据类型Key,实现优化比较器Comparator 18:52
26. 自定义数据类型时注意事项及企业大数据中常用的MapReduce应用 21:19
27. 三大运营商业务需求及手机流量统计需求分析(原数据和业务) 26:11
28. 依据业务分析实现手机流量统计MapReduce编码 14:25
29. 编写MapReduce程序及测试 17:36
30. MapReduce初级应用案例之TopKey讲解一 23:05
31. MapReduce初级应用案例之TopKey讲解二 33:42
32. 源码分析讲解MapReduce输入格式InputFormat 29:07
33. 从源码和应用角度讲解常用的InputFormat 27:45
34. SequenceFileInputFormat应用讲解和如何自定义InputFormat 20:03
35. MapReduce输出格式OutputFormat及常用的OutputFormat解析 21:48
36. MapReduce输出多个指定的文件MultipleOutputs使用讲解 30:57
37. MapReduce Shuffle中分区Partitioner讲解(结合实际案例) 18:41
38. MapReduce Shuffle中合并Combiner讲解(功能、实际应用) 17:17
39. Key的比较器讲解RawComparator以及通过实际应用引出二次排序 25:13
40. 依据需求实现key相同时对value进行排序,使用二次排序实现 27:58
41. 二次排序案例的优化 19:08
42. MapReduce编程优化之一配置参数的几种设置方式及优先级 16:54
43. MapReduce编程优化之二MapReduce中的Compression 18:53
44. MapReduce编程优化之三分布式缓存DistributedCache使用讲解一 18:02
45. MapReduce编程优化之三分布式缓存DistributedCache使用讲解二 16:18
46. MapReduce编程优化之四MapReduce 旧API的区别与使用讲解 24:10
47. MapReduce编程优化之五MapReduce多任务依赖 18:09
48. MapReduce编程优化之六链式Mapper的使用ChainMapper和ChainReducer 11:24
49. MapReduce编程优化之七MapReduce Join算法讲解一 16:39
50. MapReduce编程优化之七MapReduce Join算法讲解二 18:14
51. MapReduce编程优化之八小文件处理几种方式讲解 10:24
52. MapReduce Shuffle配置调优以及Hadoop1.x的MR程序运行在2.x上的注意事项 14:21
大家可以点击【 查看详情】查看我的课程