我是学Java的,想尝试大数据和数据挖掘,该怎么规划学习?

我是学Java的,想尝试大数据和数据挖掘,该怎么规划学习?

学习过Java之后在学习大数据相对会轻松一些,主要是要分清你要先从那个方向入手
1.大数据开发工程师,这个比较适合刚刚从Java转换过来的人员做,主要学习HDFS,MapReduce,Yarn,Hive,Flume,Sqoop,Spark等技术即可转转型。
2.数仓工程师:这个需要SQL基础好一些,其他环境配置基本上公司已经完成,主要是针对Hive方向的开发和数据仓库的建模擦操作
3.实时工程师:这个主要针对的是Spark部分,SparkStreaming是老牌的实时处理,相对公司使用还是比较多的,近年来阿里收购了Flink之后,加速了Flink在国内的步伐,所以这个flink最好也要学习,Storm就可以适当的了解
4.数据挖掘:需要学习完成大数据体系,也就是大数据开发工程需要学习的,除了这些外要学会 机器学习R语言主要是为了统计分析和绘图,在Hadoop生态圈中是有自己的机器学习库的mahout提供可扩展的机器学习领域经典算法的实现,包括聚类、分类、推荐过滤、频繁子项挖掘等,且可通过Hadoop扩展,但是鉴于MapReduce的性能,建议学习Spark MLlib: MLlib是Spark是常用的机器学习算法的实现库,支持二元分类,回归,聚类以及协同过滤等算法。同时也包括一个底层的梯度下降优化基础算法。除了之外,也可以学系python,python中也有一套完整的机器学习库。

你可能感兴趣的:(深圳千锋大数据学习)