如何系统规划大数据学习之路

大数据的领域非常广泛,往往使想要开始学习大数据及相关技术的人望而生畏。大数据技术的种类众多,这同样使得初学者难以选择从何处下手。

本文将为你开始学习大数据的征程以及在大数据产业领域找到工作指明道路,提供帮助。目前我们面临的最大挑战就是根据我们的兴趣和技能选定正确的角色。

为了解决这个问题,我在本文详细阐述了每个与大数据有关的角色,同时考量了工程师以及计算机科学毕业生的不同职位角色。

1.如何开始?

人们想开始学习大数据的时候,最常问我的问题是,我应该学Hadoophadoop是一款开源软件,主要用于分布式存储和计算,他由HDFSMapReduce计算框架组成的,他们分别是GoogleGFSMapReduce的开源实现。由于hadoop的易用性和可扩展性,因此成为最近流行的海量数据处理框架。hadoop这个单词来源于其发明者的儿子为一个玩具大象起的名字。), 分布式计算,KafkaKafka是由LinkedIn开发的一个分布式基于发布/订阅的消息系统),NoSQL(泛指非关系型的数据库)还是SparkSpark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处)?

而我通常只有一个答案:这取决于你究竟想做什么。

 因此,让我们用一种有条理的方式来解决这个问题。我们将一步步地探索这条学习之路。

2. 在大数据行业有哪些职业需求?

在大数据行业中有很多领域。通常来说它们可以被分为两类:

  • 大数据工程
  • 大数据分析

这些领域互相独立又互相关联。

大数据工程涉及大量数据的设计,部署,获取以及维护(保存)。大数据工程师需要去设计和部署这样一个系统,使相关数据能面向不同的消费者及内部应用。

而大数据分析的工作则是利用大数据工程师设计的系统所提供的大量数据。大数据分析包括趋势、图样分析以及开发不同的分类、预测预报系统。

因此,简而言之,大数据分析是对数据的高级计算。而大数据工程则是进行系统设计、部署以及计算运行平台的顶层构建。

3.你的领域是什么,适合什么方向?

现在我们已经了解了行业中可供选择的职业种类,让我们想办法来确定哪个领域适合你。这样,我们才能确定你在这个行业中的位置。

通常来说,基于你的教育背景和行业经验我们可以进行如下分类:

  • 教育背景

(包括兴趣,而不一定与你的大学教育有关)

  1. 计算机科学
  2. 数学 
  • 行业经验
  • 新人
  • 数据学家
  • 计算机工程师(在数据相关领域工作)

因此,通过上面的分类,你可以把自己的领域定位如下:

1我是一名计算机科学毕业生,不过没有坚实的数学技巧。

你对计算机科学或者数学有兴趣,但是之前没有相关经验,你将被定义为一个新人。

2我是一个计算机科学毕业生,目前正从事数据库开发工作。

你的兴趣在计算机科学方向,你适合计算机工程师(数据相关工程)的角色。

3我正作为数据科学家从事统计工作。

你对数学领域有兴趣,适合数据科学家的职业角色。

因此,参照着定位你的领域吧。

(此处定义的领域对你确定在大数据行业的学习路径至关重要。)

4.根据领域规划你的角色

现在你已经确定了你的领域,下一步,让我们规划出你要努力的目标职位吧。

如果你有卓越的编程技巧并理解计算机如何在网络(基础)上运作,而你对数学和统计学毫无兴趣,在这种情况下,你应该朝着大数据工程职位努力。

如果你擅长编程同时有数学或者统计学的教育背景或兴趣,你应该朝着大数据分析师职位努力。

你可能感兴趣的:(如何系统规划大数据学习之路)