技术新人的大数据之路

    不可否认,大数据学习最重要的是学习的能力,这种能力要远比你掌握的知识多少要重要,所以,练习大于理论,加油吧。

    首先,大数据不得不讲神器的Google三大论文,你可以骂它看不懂,你可以骂自己英语不好,但是你确实要看的,不推荐你看中文版,会让你误解很多概念和词汇,还是要从英文的开始看起:http://pan.baidu.com/s/1o6G8PGA

    MapReduce可谓是总结了大数据计算的核心:分而治之。如果觉得太难懂,吴军老师有一本《数学之美》,有一章也是说这个东西的,很简洁易懂,同时,建议码农们都读一读这本书,用科学修身养性。

    GFS真是经典的不能再经典啊,计算框架Spark大有Spring一统江湖的架势,但是HDFS你却找不出比它更经典的。

    BigTable奠定了NoSql数据库的理论基础,也是牛的一逼~~

    其次,建议你看一看搜索引擎的一些相关知识,大数据源于搜索引擎,从祖宗学起来,也是一件好事,尤其是Nutch,你可以快速了解一个搜索引擎的工作原理:

    http://wenku.baidu.com/link?url=UnkF6mmM4Uq66T1-lekQWmFwqUhx52fIaJtRrdQvbvH8gb5XnmCc1Nng2STBNvP-K5CVrZbuJ6v5T3uFobdC1HI1fAhMCGiKu6gKcvxyiIm

    http://www.open-open.com/lib/view/open1328670771405.html

    http://www.jtben.com/document/963801

    再次,你需要不断的联系,找一些教学视频,培训机构的也可以,作为入门级的教程,作为兴趣培养的开始作用还是很大的。

    这个自己找就好,百度搜索hadoop培训,一茬一茬的~~

    ok,有了一点入门的知识,有了一些基础,可以看一些书啦,包括hadoop的官方文档,其实大数据的学习中,官方文档的作用是书籍所无法替代的,当然,各种Tutorial都是好东西。

    http://www.tutorialspoint.com/hadoop/

    http://www.tutorialspoint.com/hbase

    再次,想了解一些深入的东西,可以从一些博客看起:

    http://www.cnblogs.com/v-July-v/

    http://duanple.blog.163.com/    

    最后,有了足够多的基础知识,下一步就是架构的能力了,大数据的处理组件众多,技术繁杂,稳定性参差不一,所以你需要有很强的架构能力才能搞定他们,实践吧!

 

你可能感兴趣的:(数据心情)