注:本篇博客摘自OURJS网站,主要作为笔记
历史大浪淘沙经过5次信息革命,终于迎来大数据时代,给信息领域灌入了强劲的血液,催生了很多新生力量,而各行各业谁也无法离开数据存活。尤其近几年来,全球范围内掀起了一股“大数据”热,各地政府、大小企业都在布局大数据,抢占先机。这个局到底怎么设,很少有人能说出清晰的脉络。一个新事物的出现,除了带给人们惊喜之外,还有毫无思绪的迷茫。
据可靠数据显示,截止到2016年,全国的大数据人才只有46万,未来3-5年人才缺口高达150万之多。市面招聘网站上都在争抢大数据人才,有3-5年工作经验的数据分析师年薪直接高达50万元,但是能找到的确是寥寥。高校培养大数据人才仍是初步阶段,短期内无法快速输出人才。
相信身边有很多应届毕业生以及想转行大数据的,状态大多都是:万脸懵逼。
老司机教你:看书、写代码、多交流。
2016年马上就过完,你看了几本书呢?小编为大家精心挑选了大数据领域里十本有价值的书,先干掉这几本书,再和老司机谈大数据!不过,像《大数据时代》、《数据之巅》等这些经典到“烂大街”的书我就不一一推荐了,很多人都看过,没看过的也都听说过。
一、《Presto技术内幕》
Presto是Facebook开发的数据查询引擎,基于Java语言开发的,专门为大数据实时查询计算而设计和开发的产品,更是大数据实时查询计算产品的佼佼者,比Spark、Impala更加简单、高效。
《Presto技术内幕》由浅入深地详细介绍了Presto的安装过程、内部运行原理机制、功能特性、性能优化方法,以及在应用过程中常见的问题及解决方案等,可用于多种数据源混合进行实时大数据分析计算,使一些使用其他大数据技术不能解决的业务场景有了一个全新有效的解决方案。
在最后的附录部分不仅对 Presto 使用过程中出现的各种问题给出了明确的解决方案,还对 Presto中的各个配置参数的含义和作用进行了详细的说明并给出了推荐配置值
作者: JD-Presto 研发团队 ,是京东众多研发团队中的一员,在开源软件领域获得多项大奖
适读人群: Presto技术狂热者&攻城狮、对京东技术内幕好奇的小伙伴
亮点:
市面上第一本详细介绍Presto技术的书籍,可单点突破。
浓缩了京东在开源领域深耕多年的实战经验
京东CTO张晨、京东首席技术顾问翁志等技术大牛重磅推荐
Presto 使用过程中的各种问题都给出明确的解决方案
对Presto中各个配置参数的含义和作用进行详细的说明并给推荐配置值
二、 《为数据而生》
读完《为数据而生》,你会清楚的看到中国在大数据道路上所留下的轨迹,主要包括在智慧城市、科技、医疗、教育、商业、金融等领域的实践。书中分别阐述在大数据1.0、大数据2.0和大数据3.0时代下,相对应的数据分析需要做到分析、外化、集成:
分析,这里作者提供了一套基本的大数据分析框架:确定问题和指标, 清洗数据, 特征提取和选择, 模型训练, 模型融合。
外化,借助外部数据,将两个看起来毫不相干的事物通过数据挖掘建立联系。
集成,主要讲企业、政府如何收集数据、标准化数据,以及最后如何商业化。
未来中国的大数据发展提供一条清晰且可行性的路径指南!
简言之,看了这本书,不管是企业或者政府,都可以看到大数据比较清晰且可实现的一条路径。
作者:周涛,天才少年,电子科技大学最年轻教授,中国大数据领域的传奇人物,创办数之联、数联铭品、国信优易、DataCastle等20多家公司,公司总市值高达百亿。
适读人群:大数据爱好者、政府人员及苦于转型中的企业管理者
亮点:
手把手教企业如何蜕变成一个真正的大数据企业
大数据3.0时代究竟要如何应对
为数不多的把实操、理论都讲明白的书
三、《智能时代》
《智能时代》回顾了科学研究发展的四个范式,用实例证明了数据在科学发现中的位置。这本书作者分七章从不同角度对大数据进行介绍,分别以技术和思维方式的改变为主线,从工业革命这个角度嵌入,顺理成章的延伸出大数据与智能化,但是没有将过多笔墨放在技术的深究上,而是选择从应用层面体现大数据的理念。大数据应用则会渗透到各行各业,这正是作者的用心之处。
作者:吴军,原腾讯副总裁。吴军博士是当前Google中日韩文搜索算法的主要设计者。除了《智能时代》,还著有《数学之美》、《浪潮之巅》和《文明之光》。
适读人群:研究大数据应用的一线实践者、人工智能爱好者
亮点:
深入浅出,用吃瓜群众都能看懂的语言讲生涩难懂的大数据和人工智能
逻辑性强,你能想到问题,作者都备好了答案
雷军、罗振宇、涂子沛、李善友、邬贺铨院士联袂推荐
四、《R语言预测实战》
R语言横跨了金融、生物、医学、互联网等多个领域,主要用于统计、建模及可视化。由于上手快、效率高,备受技术人员青睐。预测是大数据挖掘的主要作用之一,借助R语言来做大数据预测,可以兼具效率与价值于一身。
《R语言预测实战》主要分为预测基础、预测算法、预测案例三大部分。从入门级的阐述逐渐过度到深入分析,抽丝剥茧般的讲明白了用R语言预测的诸多问题。
作者:游皓麟,知名高级数据分析师
适读人群:R语言数据分析师、R语言研究大数据预测的入门者
亮点:
市面上为数不多的系统讲解R语言预测专题的书籍
可以get到做R语言预测时的基本步骤和方法思路,还有更多技术细节
五、《医疗革命》
在医学大数据时代,数据技术带来了临床医学科研的革命性进步。《医疗革命》通过对医疗数据挖掘的基本理论的阐述,将现代统计学与数据挖掘技术有机结合,讲述了大量的医学数据挖掘的案例,提供了大量的医学数据挖掘的实操方法。本书以数据挖掘与模式识别的七大原理在临床医学中的运用案例为切入点,系统而全面地介绍了医学数据挖掘的基本方法与原理,对数据分析的常用算法进行了通俗易懂的讲解。
作者:邵学杰,中国医学大数据概念提出的实践者与先行者,医学数据挖掘的先行者
适读人群:医疗数据挖掘爱好者、临床研究者、 医疗大数据初学者
亮点:
将统计学与医学深度结合,首次提出医学数据模式识别的七大原理
实操技术与案例分析相结合,起到很好的技术示范作用
六、《大数据处理之道》
市面上流行的大数据处理技术已经有数十种了,从最初的Hadoop到Spark,再到Storm,到底哪个战斗力更强?《大数据处理之道》分析比较了当下流行的大数据处理技术的优劣及适用场景,包括Hadoop、Spark、Storm、Dremel、Drill等,详细分析了各种技术的应用场景和优缺点;同时阐述了大数据下的日志分析系统,重点讲解了ELK日志处理方案;最后分析了大数据处理技术的发展趋势,重点从各种技术的起源、设计思想、架构等方面阐述大数据处理之道。
在日志分析方案遍地开花的大数据时代,这本书能够帮助你更理性的做出决策。
作者:何金池, IBM高级软件工程师,熟悉大数据领域内的各项热门技术,具有多年的一线软件研发测试经验
适读人群:软件开发、大数据测试人员
亮点:
全。几乎涵盖所有的大数据处理热门技术
易懂。语言诙谐,大数据处理技术与应用场景并在,初学者好上手,专业人士可系统的扩展知识
预测。对未来新的大数据处理技术发展趋势进行了预测
七、《大数据基础与应用》
数据本身没有丝毫意义,通过统计、分类、萃取、特征抽取等一系列技术手段才能实现其价值。大数据技术是实践性比较强的技术,需要重视工具和应用方法的选择与研究。《大数据基础与应用》作为大数据技术入门的参考书,为小白读者提供了一次系统学习大数据理论知识的机会。
作者:陈明,中国计算机学会理事、中国人工智能学会理事。
适读人群:大数据技术小白
亮点:
基础≠不重要,大数据初级必须要掌握的理论知识都在这里
各章独立阐述,读者可根据自己的需求,有侧重的加强学习
八、《超越大数据》
把社交数据、移动数据、位置数据与主数据结合起来, 可以实现与现有客户建立更加密切的关系、采用合适的产品, 改进寻找的定位新客户的方法、更加深入地了解客户的想法以及对产品的看法等,而《超越大数据》将教你如何通过社交主数据管理深入了解客户。
作者:马丁·奥博欧佛,企业信息架构领域,面向全球大客户的执行架构师
适读人群:企业决策者、大数据架构师
亮点:颠覆了传统的业务数据处理
九、《爆发》
《爆发:大数据时代预见未来的新思维》揭开了人类行为背后隐藏的模式“爆发”,大胆的提出人类有93%的行为都是可预测的,是一本超越《黑天鹅》惊世之作。爆发模式的揭示,其影响力将与20世纪初期的物理学或者基因革命的影响力不相上下。你可以把它当成一本历史小说来看,也可以当成科技读物,社会是一个巨大的数据库,这里所有的数据、科学以及技术都联合起来共同对抗那个很大的谜题——我们的未来。
作者:巴拉巴西,全球复杂网络研究,无尺度网络的创立者。世界著名科技杂志《popularscience》杂志称,“他可以控制世界”。
适读人群:大数据爱好者、乐于探索历史与未来的人
亮点:
神秘色彩十足
观点极具颠覆性
十、《大数据技术概论》
《大数据技术概论》全书共分成11章分别介绍了大数据概论、大数据采集及预处理、大数据分析、大数据数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据解决方案相关案例等内容。每一章中均附有相关术语的注释,方便读者查阅和自学。
作者:娄岩,海归三年,中国医科大学教授,IT专家,作家。
适读人群:大数据小白、培训机构、企划管理人员
亮点:适合自学
其实,上面的书整体都是偏入门的,希望大家认真读完,但这对于大数据来说仅仅是杯水车薪。大数据需要的是复合型的人才,只有不断学习新技术,不断拓展自己,方能跟上技术的脚步,不被时代变革所淘汰!别放弃,小编为大家整理了一部分的学习资源,根据需要可自行索取哟