好程序员分享Java转行大数据该怎么规划学习?

  好程序员分享Java转行大数据该怎么规划学习?学习过Java之后在学习大数据相对会轻松一些,主要是要分清你要先从那个方向入手

 

  1. 大数据开发工程师,这个比较适合刚刚从Java转换过来的人员做,主要学习HDFS,MapReduce,Yarn,Hive,Flume,Sqoop,Spark等技术即可转转型。

 

  1. 数仓工程师:这个需要SQL基础好一些,其他环境配置基本上公司已经完成,主要是针对Hive方向的开发和数据仓库的建模擦操作。

 

  1. 实时工程师:这个主要针对的是Spark部分,SparkStreaming是老牌的实时处理,相对公司使用还是比较多的,近年来阿里收购了Flink之后,加速了Flink在国内的步伐,所以这个flink最好也要学习,Storm就可以适当的了解。

 

4.数据挖掘:需要学习完成大数据体系,也就是大数据开发工程需要学习的,除了这些外要学会,机器学习R语言主要是为了统计分析和绘图,在Hadoop生态圈中是有自己的机器学习库的mahout提供可扩展的机器学习领域经典算法的实现,包括聚类、分类、推荐过滤、频繁子项挖掘等,且可通过Hadoop扩展,但是鉴于MapReduce的性能,建议学习Spark MLlib: MLlib是Spark是常用的机器学习算法的实现库,支持二元分类,回归,聚类以及协同过滤等算法。同时也包括一个底层的梯度下降优化基础算法。除了之外,也可以学系python,python中也有一套完整的机器学习库,可参考好程序员大数据学习路线。

你可能感兴趣的:(Java学习资源,大数据培训,好程序员,好程序员,Java,大数据)