Greenplum Hadoop案例教程 Greenplum Hadoop分布式平台视频教程

   随着云计算、大数据迅速发展,亟需用hadoop解决大数据量高并发访问的瓶颈。谷歌、淘宝、百度、京东等底层都应用hadoop。越来越多的企 业急需引入hadoop技术人才。由于掌握Hadoop技术的开发人员并不多,直接导致了这几年hadoop技术的薪水远高于JavaEE及 Android程序员。

  不过目前的教程非常少,在此给大家推荐一套蒙老师的相关教程――《基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析》


本系列课程主要分三部分:(总共70讲)



        第一部分 Greenplum 分布式数据库基础(35课时)


        第二部分 Hadoop分布式系统基础(30课时)


        第三部分 Greenplum Hadoop大数据分析平台(4课时)


课程大纲:



     第一部分 Greenplum 分布式数据库基础(35课时)


        1 Greenplum架构

           什么是Greenplum

           Greenplum体系结构

           Greenplum高可用性架构


        2 安装Greenplum

           配置环境

           安装并初始化GPDB系统

           启停数据库

           配置GP系统


        3 客户端接口和程序

           pgAdmin III

           PSQL


        4 角色权限管理

           客户端认证

        管理用户和组


        5 分布式数据库存储

           数据是如何存储的

           分布策略


        6 GBDB查询处理

           查询命令的执行

           SQL查询处理机制

           并行查询计划


        7 定义数据库对象

           创建并管理数据库

           创建并管理表空间

           创建并管理模式

           创建并管理表

           分区表

           数据分布与分区

           压缩存储与行列存储

           序列、索引与视图


        8 管理数据

           插入、更新、删除记录

           事务管理

           空间回收和统计


        9 数据加载

           外部表加载

           COPY加载

           GPLOAD加载


        10 资源负载管理

           创建资源队列

           分配资源队列


        11 备份恢复

           串行备份和恢复

           并行恢复和恢复


        12 GP SQL语法

           数据字典

           函数

           存储过程


        13 性能调优

           常见性能问题

           跟踪性能问题

           查询调优


        14 扩展GP系统

           节点的准备和添加

           初始化新Instance

           重分布表


        15 GP MapReduce

           MapReduce基础

           GP MapReduce编程

           MapReduce作业执行和故障诊断



     第二部分 Hadoop分布式系统基础(30课时)


        1 什么是Hadoop

           Hadoop思想起源:Google

           Hadoop的架构

           Hadoop思想体系


        2 部署Hadoop集群

           准备和配置环境

           三种运行模式

           简单集群安装和配置步骤

           大型生产集群部署


        3 HDFS实战

           HDFS体系结构

           HDFS的可靠性

           HDFS文件操作


        4 Map-Reduce体系架构

           Map-Reduce编程模型

           性能调优

           Map-Reduce工作机制

           日志分析


        5 Map-Reduce API开发实战

           Eclipse插件安装

           数据筛选程序

           倒排索引实战


        6 Hadoop组成

           Pig, Hbase, Hive, Zookeeper组件

           Sqoop, Avro, Churkwa, Cassandra组件

           Hbase体系结构


        7 HBase数据库

           单机模式安装

           伪分布式安装

           完全分布模式安装

           HBase数据库操作


        8 Pig实战

           Pig框架

           Pig安装配置

           Pig运行操作


        9 Hive实战应用

           Hive组件与体系架构

           Hive安装配置

           Hive操作


        10 Sqoop应用

           安装配置

           数据操作示例


        11 云计算

           什么是云计算

           云计算模式和形态

           Hadoop在云计算的运用


        12 Hadoop商业应用案例剖析

           京东商城

           百度

           阿里巴巴



     第三部分 Greenplum Hadoop大数据分析平台(4课时)


        1 Greenplum Hadoop架构

           集成架构的特征

           集成架构的优势

           商业案例展示


        2 Greenplum Hadoop集群部署

           部署Hadoop集群

           部署Zookeeper

           部署Hbase

           部署Hive

           部署Pig

           集群操作示例


wKioL1MFa2TzQuC5AAIBnGX5w6g863.jpg

wKiom1MFa4rTzrUBAAJXA990oG8638.jpg

wKiom1MFa4qx3xKLAAIZplpig3E677.jpg



下载地址:


百度:http://pan.baidu.com/s/1o6FJgpk


360:http://yunpan.cn/QpacvJVZ5pu7H (访问密码:09fd)


你可能感兴趣的:(hadoop,GreenPlum,分布式平台)