Hadoop学习资源整理

Hadoop

Hadoop权威指南
大数据相关资料整理
Hadoop官方手册
Hadoop入门进阶课程(实验楼)

windows下配置和启动hadoop
Windows下搭建Hadoop伪分布式
Linux下安装Hadoop环境(虚拟机)
Hadoop体系和计算过程

Idea创建maven项目
Intellij IDEA2.6 + Hadoop2.9.0 本地开发MapReduce并提交到集群
windows Hadoop开发环境搭建及远程提交
Idea+Maven运行简单的Hadoop WordCount程序
Maven 构建配置文件
Maven没有webapp目录解决方法

HIVE

Hive编程指南
HIVE教程
HIVE基础教程
Hadoop Hive基础sql语法
HIVE教程(易百教程)
Hive教程(实验楼)

Hbase

Hbase教程(实验楼)

Spark

流式实时日志分析系统(实验楼)

Python

Python教程 - 廖雪峰的官方网站
Python3 简明教程(实验楼)
使用python爬虫调用selenium来模拟正常用户访问浏览器
python爬取boss直聘数据,原来是复制cookies请求,改为使用selenium

最佳实践

阿里巴巴大数据实践
重构大数据统计
逆流而上:阿里巴巴技术成长之路完整版
尽在双11:阿里巴巴技术演进与超越

数据结构
算法(旅行家,搜索树等)
数学统计方法

万丈高楼平地起

十大经典排序算法
十大编程算法
算法常用概念
算法常用概念(百度快照)
排序算法总结
算法和数据结构教程合集

Shell

shell教程
Linux命令实例练习(实验楼)
正则表达式基础(实验楼)

你可能感兴趣的:(Hadoop学习资源整理)