4个步骤带你搞定大数据,Linux到大数据学习

4个步骤带你搞定大数据,Linux到大数据学习_第1张图片

运维学习需要分为四个阶段:

①linux初级入门

②linux中级进阶

③linux高级提升

④资深方向细化。

大数据是未来的发展方向,正在挑战我们的分析能力及对世界的认知方式,因此,我们与时俱进,迎接变化,并不断的成长!大数据学习群:8688==47735  一起讨论进步学习
 


 

第一阶段:初级入门

  1. Linux基础知识、基本命令(起源、组成、常用命令如cp、ls、file、mkdir等常见操作命令)
  2. Linux用户及权限基础
  3. Linux系统进程管理进阶
  4. Linux高效文本、文件处理命令(vim、grep、sed、awk、find等命令)

 


 

第二阶段:中级进阶(基础运维)

中级进阶需要在充分了解linux原理和基础知识之后,对上层的应用和服务进行深入学习。

 

  1. TCP/IP网络基础(差不多CCNA、NP的知识就够用)
  2. Linux企业常用服务(如dns、http、ftp、mail、nfs等)
  3. Linux企业级安全原理和防范技巧(系统性能/安全、安全威胁模型和保护方法
  4. 加密/解密原理及数据安全、系统服务访问控制及服务安全基础
  5. iptables安全策略构建
  6. shell脚本进阶(主要是结合一些应用,写一些案例)
  7. MySQL应用原理及管理入门(能管理和搭建一个个人博客站点)

 


 

第三阶段:高级运维

  1. http服务代理缓存加速(其中主要学习varnish、nginx缓存系统,要对CDN的知识有所了解。)
  2. 企业级负载集群(其中主要学习nginx、haproxy、lvs要对主要知识熟练掌握,对负载均衡算法有清晰认识,)
  3. 企业级高可用集群 (其中需要对keepalived,heartbeat等进行深入讲解)
  4. 运维监控zabbix详解(主要是zabbix、cacti、nagios等监控系统,现在用的比较多的是zabbix)
  5. 运维自动化学习(需要学一些开源运维自动化工具的使用如ansible、puppet、cobbler等运维自动化工具)

 


 

第四阶段:资深方向

  1. 大数据方向(需要对hadoop、storm等常见开源大数据系统需要深入了解)云计算方向(主要是openstack这套东西,当然像一些kvm等虚拟化技术,也是需要掌握的,现在docker也比较流行)
  2. 运维开发(主要是python运维开发)
  3. 自动化运维(在之前自动化基础上做深入)
  4. 运维架构师(主要需要广度,差不多5年左右以上经验,可以担当此职位)

阶段一、 Java语言基础

Java开发介绍、熟悉Eclipse开发工具、Java语言基础、Java流程控制、Java字符串、Java数组与类和对象、数字处理类与核心技术、I/O与反射、多线程、Swing程序与集合类

阶段二、 HTML、CSS与Java

PC端网站布局、HTML5+CSS3基础、WebApp页面布局、原生Java交互功能开发、Ajax异步交互、jQuery应用

阶段三、 JavaWeb和数据库

数据库、JavaWeb开发核心、JavaWeb开发内幕

阶段四、 LinuxHadoopt体系

Linux体系、Hadoop离线计算大纲、分布式数据库Hbase、数据仓库Hive、数据迁移工具Sqoop、Flume分布式日志框架

阶段五、 实战(一线公司真实项目)

数据获取、数据处理、数据分析、数据展现、数据应用

阶段六、 Spark生态体系

Python编程语言、Scala编程语言、Spark大数据处理、Spark—Streaming大数据处理、Spark—Mlib机器学习、Spark—GraphX 图计算、实战一:基于Spark的推荐系统(某一线公司真实项目)、实战二:新浪网(www.sina.com.cn)

阶段七、 Storm生态体系

storm技术架构体系、Storm原理与基础、消息队列kafka、Redis工具、zookeeper详解、实战一:日志告警系统项目、实战二:猜你喜欢推荐系统实战

阶段八、 大数据分析 —AI(人工智能)

Data Analyze工作环境准备数据分析基础、数据可视化、Python机器学习

1、Python机器学习2、图像识别神经网络、自然语言处理社交网络处理、实战项目:户外设备识别分析

大数据真的是一门神奇的学科,似乎学好大数据就能踏遍互联网的大部分领域。就像当下很火的区块链、人工智能等等都是跟大数据技术息息相关。每一个想学习大数据的小伙伴,都是未来不可多得的人才,快用技术征服世界吧。

大数据学习QQ群:199427210

一、Hadoop入门,了解什么是Hadoop

1、Hadoop产生背景

2、Hadoop在大数据、云计算中的位置和关系

3、国内外Hadoop应用案例介绍

4、国内Hadoop的就业情况分析及课程大纲介绍

5、分布式系统概述

6、Hadoop生态圈以及各组成部分的简介

7、Hadoop核心MapReduce例子说明

二、分布式文件系统HDFS,是数据库管理员的基础课程

1、分布式文件系统HDFS简介

2、HDFS的系统组成介绍

3、HDFS的组成部分详解

4、副本存放策略及路由规则

5、NameNode Federation

6、命令行接口

7、Java接口

8、客户端与HDFS的数据流讲解

9、HDFS的可用性(HA)

三、初级MapReduce,成为Hadoop开发人员的基础课程

1、如何理解map、reduce计算模型

2、剖析伪分布式下MapReduce作业的执行过程

3、Yarn模型

4、序列化

5、MapReduce的类型与格式

6、MapReduce开发环境搭建

7、MapReduce应用开发

8、更多示例讲解,熟悉MapReduce算法原理

四、高级MapReduce,高级Hadoop开发人员的关键课程

1、使用压缩分隔减少输入规模

2、利用Combiner减少中间数据

3、编写Partitioner优化负载均衡

4、如何自定义排序规则

5、如何自定义分组规则

6、MapReduce优化

7、编程实战

五、Hadoop集群与管理,是数据库管理员的高级课程

1、Hadoop集群的搭建

2、Hadoop集群的监控

3、Hadoop集群的管理

4、集群下运行MapReduce程序

六、ZooKeeper基础知识,构建分布式系统的基础框架

1、ZooKeeper体现结构

2、ZooKeeper集群的安装

3、操作ZooKeeper

七、HBase基础知识,面向列的实时分布式数据库

1、HBase定义

2、HBase与RDBMS的对比

3、数据模型

4、系统架构

5、HBase上的MapReduce

6、表的设计

八、HBase集群及其管理

1、集群的搭建过程讲解

2、集群的监控

3、集群的管理

九、HBase客户端

1、HBase Shell以及演示

2、Java客户端以及代码演示

十、Pig基础知识,进行Hadoop计算的另一种框架

1、Pig概述

2、安装Pig

3、使用Pig完成手机流量统计业务

十一、Hive,使用SQL进行计算的Hadoop框架

1、数据仓库基础知识

2、Hive定义

3、Hive体系结构简介

4、Hive集群

5、客户端简介

6、HiveQL定义

7、HiveQL与SQL的比较

8、数据类型

9、表与表分区概念

10、表的操作与CLI客户端演示

11、数据导入与CLI客户端演示

12、查询数据与CLI客户端演示

13、数据的连接与CLI客户端演示

14、用户自定义函数(UDF)的开发与演示

十二、Sqoop,Hadoop与rdbms进行数据转换的框架

1、配置Sqoop

2、使用Sqoop把数据从MySQL导入到HDFS中

3、使用Sqoop把数据从HDFS导出到MySQL中

十三、Storm

1、Storm基础知识:包括Storm的基本概念和Storm应用

场景,体系结构与基本原理,Storm和Hadoop的对比

2、Storm集群搭建:详细讲述Storm集群的安装和安装时常见问题

3、Storm组件介绍: spout、bolt、stream groupings等

4、Storm消息可靠性:消息失败的重发

5、Hadoop 2.0和Storm的整合:Storm on YARN

6、Storm编程实战

你可能感兴趣的:(编程语言,大数据,大数据学习,大数据开发,Hadoop,spark,linux,Hive,大数据技术,数据分析,程序员)