Hadoop3基础与电商行为日志分析 大数据轻松入门

  • 第1章 大数据概述 试看

    本章将从故事说起,让大家明白大数据是与我们的生活息息相关的,并不是遥不可及的,还会介绍大数据的特性,以及大数据对我们带来的技术变革,大数据处理过程中涉及到的技术以及大数据典型应用。

    共 11 节 (58分钟) 收起列表

    •  1-1 课程导学 (14:27)试看
    •  1-2 ***学前必读***(助你平稳踩坑,畅学无忧,课程学习与解决问题指南)
    •  1-3 课程目录 (01:52)
    •  1-4 从一个案例说起 (03:54)
    •  1-5 什么是大数据以及大数据的4V特征 (08:30)试看
    •  1-6 大数据带来的技术变革 (05:37)
    •  1-7 大数据现存的模式 (02:29)
    •  1-8 大数据的技术概念 (08:47)
    •  1-9 大数据带来的挑战 (04:18)
    •  1-10 如何对大数据进行存储和分析 (03:54)
    •  1-11 大数据典型应用 (03:14)
  • 第2章 初识Hadoop

    本章节将带领大家认识Hadoop以及Hadoop生态系统、Hadoop的发展史、Hadoop的优势、Hadoop的三个核心组件、Hadoop发行版的选择,为后续深入讲解Hadoop打下坚实的基础。

    共 10 节 (63分钟) 展开列表

  • 第3章 分布式文件系统HDFS

    本章将从Hadoop的设计目标、架构及文件系统命令空间出发,快速搭建单节点伪分布式HDFS的实验环境,通过讲解使用hdfs shell以及Java API的方式操作HDFS文件系统,详细分析HDFS文件的读写流程,并通过HDFS API来实现词频统计案例,使得大家对Hadoop分布式文件系统HDFS有深刻的认识以及实战。 ...

    共 42 节 (286分钟) 展开列表

  • 第4章 分布式计算框架MapReduce 试看

    本章将从架构、编程模型等角度带大家认识Hadoop的分布式计算框架MapReduce,掌握MapReduce各个核心组件编程,并通过两个案例让大家深入掌握MapReduce编程的方方面面。

    共 17 节 (128分钟) 展开列表

  • 第5章 资源调度框架YARN

    本章将从YARN的产生背景、YARN的架构及执行流程的角度带大家认知Hadoop的资源调度框架YARN,快速搭建单节点伪分布式YARN的实验环境并掌握如何提交MapReduce作业提交到YARN上运行。

    共 8 节 (61分钟) 展开列表

  • 第6章 电商项目实战Hadoop实现

    本章将通过电商用户行为日志分析的项目实战,来将前面几个章节讲解的知识点串联起来,综合使用Hadoop的技术进行离线统计分析。

    共 21 节 (127分钟) 展开列表

  • 第7章 数据仓库Hive

    本章将从Hive的产生背景、体系架构、Hive部署、DDL以及DML来掌握Hive使用的方方面面。

    共 18 节 (103分钟) 展开列表

  • 第8章 电商项目实战Hive实现

    本章将使用Hive对电商用户行为日志分析进行重新实现,让大家对MapReduce编程和Hive实现的方式进行对比,体会Hive在生产上使用的便捷性。

    共 6 节 (39分钟) 展开列表

  • 第9章 Hadoop分布式集群搭建

    本章将带领大家搭建一个三个节点的分布式Hadoop集群环境,让大家对于Hadoop集群的安装有更深入的认识,并将项目实战案例运行在分布式集群环境中。

    共 7 节 (38分钟) 展开列表

  • 第10章 (彩蛋番外篇)Join在MapReduce中的实现

    本章将从SQL中的join入手,详细剖析如何在MapReduce中实现JOIN,这是面试中经常被考察到的点,考察你的MapReduce功底以及优化策略。

    共 5 节 (54分钟) 展开列表

  • 第11章 (讨论群内直播内容分享)Hadoop小问题剖析

    本次分享中,主要针对剖析小文件的产生、对集群带来的影响以及解决方案相关内容进行了讲解。

    共 6 节 (46分钟) 展开列表

  • 第12章 (讨论群内直播内容分享)Hadoop的特性在生产上的使用

    本次分享主题主要剖析在生产上常用的Hadoop特性,如:小文件、集群间数据拷贝、回收站等。

    共 3 节 (44分钟) 展开列表

  • 第13章 (彩蛋番外篇)Hadoop3.x新特性及实操

    本章中,将带领大家学习里程碑版本hadoop 3.x中带来了哪些新特性;掌握云主机的选型以及如何基于云主机进行Hadoop3.x的部署及使用;同时将升级本课程内容到Hadoop3.2.1。

    共 16 节 (115分钟) 展开列表

  • 第14章 (彩蛋番外篇)压缩在大数据中的使用

    本章中,将向大家介绍,压缩能为我们带来哪些好处,压缩格式以及压缩场景,压缩和解压缩编程实战,Hadoop结合压缩的使用。

    共 13 节 (59分钟) 展开列表

  • http://www.iyx668.com/thread-3548-1-1.html

你可能感兴趣的:(大数据,hadoop,编程语言,spark,分布式)