苦心人,天不负。
求知若饥,虚心若愚 。
珍惜小的概率,维护链接的范围。
当你的才华撑不起你的野心时,请静下心来好好的读书。
知识如百川、而我心如海、随岁月沉淀、凭水滴石穿之韧性、富我人生、富我人生也。
百丈之台,其初则一石耳,由是而两石焉,由是而三石,四石以致于切切石焉,进建亦然,旧日记一事,嫡悟一理,积暂而成教。
你是为自己工作的。
收获与投入成正比。
怨天尤人没有任何作用。
每一件事情一定要做得更好。
混日子事小,浪费青春事大。
英雄不问出处,贡献必有回报。
了解大数据技术人才 ---> 能做大数据部署的人才 --> 大数据运维人才 -->
大数据开发人才( MR ) -- > 大数据开发( spark + MR ) --> 大数据分析师 -- >
大数据挖掘工程师( 算法,数学 )
大数据架构师 --> 大数据数据定义工程师 --> 大数据数据编排工程师
大数据研发型人才 + 大数据架构行人才 + 大数据业务专家
计算密集型应用:机器学习,数据挖掘
IO密集型应用:索引,检索,统计,聚类,数据的解码与解压缩
Python:相当于一个自行车,骑它就走
JAVA:相当于飞机,刚开始起飞慢,越来越快
C/c++:相当于导弹,飞起来容易,以后控制难
Scala:与JAVA一样,运行在JVM之上
hadoop在计算是会把数据落到磁盘,如果数据不在同一个机器上也会走网络,这样就加大了IO以及网络的操作,这两项也是在大数据中最忌讳的,为了避免这样的瓶颈spark腾空而出,spark可以把数据先加载到内存中,在不同的job运算时会在内存中去拿数据,就很好的解决可hadoop的问题。