Greenplum Hadoop视频教程 Greenplum Hadoop大数据教程

《基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析》
课程讲师:蒙老师
课程分类:Java
适合人群:初级
课时数量:70课时
用到技术:MapReduce、HDFS、Map-Reduce、Hive、Sqoop
涉及项目:Greenplum Hadoop大数据分析平台

系列课程主要分三部分:(总共70讲)


         第一部分 Greenplum 分布式数据库基础(35课时)

         第二部分 Hadoop分布式系统基础(30课时)

         第三部分 Greenplum Hadoop大数据分析平台(4课时)


课程大纲:


      第一部分 Greenplum 分布式数据库基础(35课时)

         1 Greenplum架构
            什么是Greenplum
            Greenplum体系结构
            Greenplum高可用性架构

         2 安装Greenplum
            配置环境
            安装并初始化GPDB系统
            启停数据库
            配置GP系统

         3 客户端接口和程序
            pgAdmin III
            PSQL

         4 角色权限管理
            客户端认证
         管理用户和组

         5 分布式数据库存储
            数据是如何存储的
            分布策略

         6 GBDB查询处理
            查询命令的执行
            SQL查询处理机制
            并行查询计划

         7 定义数据库对象
            创建并管理数据库
            创建并管理表空间
            创建并管理模式
            创建并管理表
            分区表
            数据分布与分区
            压缩存储与行列存储
            序列、索引与视图

         8 管理数据
            插入、更新、删除记录
            事务管理
            空间回收和统计

         9 数据加载
            外部表加载
            COPY加载
            GPLOAD加载

         10 资源负载管理
            创建资源队列
            分配资源队列

         11 备份恢复
            串行备份和恢复
            并行恢复和恢复

         12 GP SQL语法
            数据字典
            函数
            存储过程

         13 性能调优
            常见性能问题
            跟踪性能问题
            查询调优

         14 扩展GP系统
            节点的准备和添加
            初始化新Instance
            重分布表

         15 GP MapReduce
            MapReduce基础
            GP MapReduce编程
            MapReduce作业执行和故障诊断


      第二部分 Hadoop分布式系统基础(30课时)

         1 什么是Hadoop
            Hadoop思想起源:Google
            Hadoop的架构
            Hadoop思想体系

         2 部署Hadoop集群
            准备和配置环境
            三种运行模式
            简单集群安装和配置步骤
            大型生产集群部署

         3 HDFS实战
            HDFS体系结构
            HDFS的可靠性
            HDFS文件操作

         4 Map-Reduce体系架构
            Map-Reduce编程模型
            性能调优
            Map-Reduce工作机制
            日志分析

         5 Map-Reduce API开发实战
            Eclipse插件安装
            数据筛选程序
            倒排索引实战

         6 Hadoop组成
            Pig, Hbase, Hive, Zookeeper组件
            Sqoop, Avro, Churkwa, Cassandra组件
            Hbase体系结构

         7 HBase数据库
            单机模式安装
            伪分布式安装
            完全分布模式安装
            HBase数据库操作

         8 Pig实战
            Pig框架
            Pig安装配置
            Pig运行操作

         9 Hive实战应用
            Hive组件与体系架构
            Hive安装配置
            Hive操作

         10 Sqoop应用
            安装配置
            数据操作示例

         11 云计算
            什么是云计算
            云计算模式和形态
            Hadoop在云计算的运用

         12 Hadoop商业应用案例剖析
            京东商城
            百度
            阿里巴巴


      第三部分 Greenplum Hadoop大数据分析平台(4课时)

         1 Greenplum Hadoop架构
            集成架构的特征
            集成架构的优势
            商业案例展示

         2 Greenplum Hadoop集群部署
            部署Hadoop集群
            部署Zookeeper
            部署Hbase
            部署Hive
            部署Pig
            集群操作示例


下载地址:
百度:http://pan.baidu.com/s/1o6FJgpk

360:http://yunpan.cn/QpacvJVZ5pu7H (访问密码:09fd)

你可能感兴趣的:(hadoop,云计算)