Hadoop学习笔记第3页

Hadoop学习笔记之三：用MRUnit做单元测试

转载务必注明出处TaobaoQATeam，原文地址：http://qa.taobao.com/?p=10550引言借年底盛宴品鉴之风,继续抒我Hadoop之情，本篇文章介绍如何对Hadoop的MapReduce进行单元测试。MapReduce的开发周期差不多是这样：编写mapper和reducer、编译、打包、提交作业和结果检索等，这个过程比较繁琐，一旦提交到分布式环境出了问题要定位调试，重复这样

liuxinglanyue·2020-09-11 02:25

Hadoop学习笔记—8.Combiner与自定义Combiner

一、Combiner的出现背景1.1回顾Map阶段五大步骤在第四篇博文《初识MapReduce》中，我们认识了MapReduce的八大步凑，其中在Map阶段总共五个步骤，如下图所示：其中，step1.5是一个可选步骤，它就是我们今天需要了解的Map规约阶段。现在，我们再来看看前一篇博文《计数器与自定义计数器》中的第一张关于计数器的图：我们可以发现，其中有两个计数器：Combineoutputrec

HoterSpring·2020-09-11 01:03

Hadoop学习笔记（三）——HDFS垃圾桶机制

Hadoop——HDFS垃圾桶机制HDFS的垃圾桶机制1.基本介绍2.配置操作3.shell操作4.java操作HDFS的垃圾桶机制1.基本介绍每一个文件系统都会有垃圾桶机制，将删除的数据回收到垃圾桶里面去，避免某些误操作删除一些重要文件。回收到垃圾桶里里面的资料数据，都可以进行恢复。HDFS同样拥有垃圾桶机制，但默认为禁用状态，若要开启垃圾桶机制，需要手动配置。如果启用垃圾桶机制，dfs命令删除

AidenBrett·2020-08-26 09:18

Hadoop学习笔记（九）——HDFS Java API

Hadoop——HDFSJavaAPIHDFSJavaAPI一、搭建开发环境二、Maven依赖三、JavaAPI1.目录操作2.上传文件3.下载文件4.查看目录信息，只显示文件5.查看文件及文件夹信息HDFSJavaAPIHDFS在生产应用中主要是客户端的开发，其核心步骤是从HDFS提供的api中构造一个HDFS的访问客户端对象，然后通过该客户端对象操作（增删改查）HDFS上的文件。一、搭建开发环

AidenBrett·2020-08-26 09:18

Hadoop学习笔记（4）－Eclipse下搭建Hadoop2.6.4开发环境并写wordcount

0.前言本文参考博客：http://www.51itong.net/eclipse-hadoop2-7-0-12448.html搭建开发环境前保障已经搭建好hadoop的伪分布式。可参考上个博客：http://blog.csdn.net/xummgg/article/details/511730721.下载安装eclipse下载网址：http://www.eclipse.org/downloads

XianMing的博客·2020-08-24 18:50

Hadoop学习笔记（10）－简述分布式数据仓库Hive原理

0.什么是数据仓库数据仓库，英文名称为DataWarehouse，可简写为DW或DWH。数据仓库，是为企业所有级别的决策制定过程，提供所有类型数据支持的战略集合。它是单个数据存储，出于分析性报告和决策支持目的而创建。为需要业务智能的企业，提供指导业务流程改进、监视时间、成本、质量以及控制。简单的说就是：数据仓库是决策支持系统（dss）和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库

XianMing的博客·2020-08-24 18:50

hadoop学习笔记之hadoop伪集群安装

hadoop安装实际也是很简单的,关键是有些坑不要踩了就好了,hadoop实际就是一个java的程序,跑起来很简单的,前期配置和准备工作做好就能一步安装成功准备工作1安装linux虚拟机,注意安装的时候不要忘记网络设置,不然不能通过局域网连接到虚拟机准备工作2linux要先建立一个跑hadoop的用户并赋给权限[root@~]#useradd-mhadoop-s/bin/bash[root@~]#

xuehanxin·2020-08-24 18:45

Hadoop学习笔记（四）：HBase

HBase是在一个HDFS上开发的面向列的分布式数据库。HBase不是关系型数据库，不支持SQL。HTable一些基本概念Rowkey行主键，HBase不支持条件查询和Orderby等查询，读取记录只能按Rowkey（及其range）或全表扫描，因此Rowkey需要根据业务来设计以利用其存储排序特性（Table按Rowkey字典序排序如1,10,100,11,2）提高性能。ColumnFamily

weixin_34306593·2020-08-24 17:19

Hadoop学习笔记—9.Partitioner与自定义Partitioner

Hadoop学习笔记—9.Partitioner与自定义Partitioner一、初步探索Partitioner1.1再次回顾Map阶段五大步骤在第四篇博文《初识MapReduce》中，我们认识了MapReduce

weixin_34194359·2020-08-24 17:02

Hadoop学习笔记(1)----项目简述

1.Common：一系列组件和接口，用于分布式文件系统和通用I/O(序列化、JavaRPC和持久化数据结构)2.Avro:一种序列化系统，用于支持高效，跨语言的RPC和持久化数据存储3.MapReduce：分布式数据处理模型和执行环境，运行于大型商用机集群4.HDFS：分布式文件系统，运行于大型商用机集群5.Pig：数据流行语言和运行环境，用以探究非常庞大的数据集。Pig运行在MapReduce和

Eickrow·2020-08-24 15:54

Hadoop学习笔记（8）－简述分布式数据库Hbase原理

1.Hbase简介Hbase是一个分布式可扩展的NoSQL数据库，提供对结构化，半结构化，非结构化大数据的实时读写和随机访问能力，而且操作速度与数据量基本无关，所以可以用于海量数据处理。Hbase之于HDFS就类似于数据库之于文件系统。自然Hbase是建立在HDFS之上的，可以存储海量的数据。常见的NoSQL数据库还有：ApacheCassandra，MongoDB等。下图1展示了Hbase在Ha

XianMing的博客·2020-08-24 12:54

Hadoop学习笔记

一.Datanode与NameNode区别HDFS体系结构大数据中，HDFS集群以Master-Slave模式运行，主要有两类节点：一个Namenode(即Master)和多个Datanode(即Slave)。Namenode管理文件系统的Namespace。它维护着文件系统树(filesystemtree)以及文件树中所有的文件和文件夹的元数据(metadata)。Namenode管理者文件系统

zang_coding·2020-08-24 11:09

Hadoop学习笔记（一）

Hadoop2ubuntu安装和配置1.安装hadoop前的准备工作安装jdk安装openssl-server免密码登陆2.安装hadoop>https://hadoop.apache.org/releases.html选择自己要安装的版本。注意每个版本对应两个下载选项source和binary，我们暂时下载binary,下载后我们会得到一个名为hadoop-x.x.x.tar.gz的压缩文件。将

赵大龙·2020-08-22 18:07

Hadoop学习笔记 --- 计算机中存储单位介绍

计算机存储单位一般用字节(Byte)、千字节(KB)、兆字节(MB)、吉字节(GB)、太字节(TB)、拍字节(PB)、艾字节(EB)、泽它字节(ZB，又称皆字节)、尧它字节(YB)表示。它们之间的换算关系是：1KB=1024B1MB=1024KB1GB=1024MB1TB=1024GB1PB=1024TB1EB=1024PB1ZB=1024EB1YB=1024ZB

杨鑫newlfe·2020-08-22 14:00

hadoop学习笔记3 hadoop2.5.2单机模式环境配置和eclipse运行

core-site.xmlhadoop.tmp.dir/home/mouap/hadoop/tmpfs.defaultFShdfs://localhost:9000io.file.buffer.size4096hdfs-site.xmldfs.nameserviceshadoop-cluster1集群别名，可以有多个，逗号分割dfs.namenode.name.dirfile:///home/mo

若水_若水·2020-08-21 20:49

Hadoop学习笔记：Apache Hadoop生态系统

Hadoop学习笔记：ApacheHadoop生态系统作者：雨水，时间：2013-12-9博客地址：http://blog.csdn.net/gobitanHadoop从诞生至今已经发展成为一个大数据相关的庞大的软件生态系统

gobitan·2020-08-21 12:51

Hadoop学习笔记一：HDFS总结

Hadoop的核心优势高可靠性：Hadoop支持同一数据多个副本保存机制，能有效避免数据丢失情况高扩展性：Hadoop能够很方便地扩展大量节点，用于分布式存储与计算高效率性：Hadoop结合MapReduce的思想，支持分布式并行工作，处理工作高容错性：在Hadoop集群中，能够自动将失败节点的任务重新分配Yarn的架构ResourceManager：负责集群任务调度与资源分配的核心，启动监控NM

Chord_Gll·2020-08-21 03:30

Hadoop学习笔记3：org.apache.hadoop.conf

2019独角兽企业重金招聘Python工程师标准>>>主要讲解org.apache.hadoop.conf包里的3个类的作用。看完这个，你绝对可以对配置项这一块非常清楚了。类的个数:3个1包:【org.apache.hadoop.conf】描述:本包与【配置参数配置】相关，包含3个类（接口），Configurable,Configuration,Configured.1.1）Configurabl

weixin_34408717·2020-08-20 19:42

Hadoop学习笔记（4）—— java API 操作 hdfs（1）

前提是已经编译好了hadoop在win7上的源码，并且配置了正确的环境变量。参考笔记（3）参考地址1上传文件packagecom.tzb.hdfs;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.FileSystem;importorg.apache.hadoop.fs.Path;importorg.jun

一角残叶·2020-08-20 18:37

Hadoop学习笔记三：MapReduce的Shuffle图解

学习的时候没有太过留意Shuffle这个概念，以至于还以为是不是漏掉了什么知识点，后面看了一些帖子才发现Shuffle原来是map()方法执行结束到reduce()方法执行这么一大段过程....小声BB：实质上该过程包含许多环节，不知道为啥就统称Shuffle了......1.Mapper的写出图见意现--直接上图：需要明确的点：在环形缓冲区触发溢写时，进行的排序是先根据每个键值对的分区进行排序，

Chord_Gll·2020-08-20 17:15

Hadoop学习笔记三：MapReduce的Shuffle图解

学习的时候没有太过留意Shuffle这个概念，以至于还以为是不是漏掉了什么知识点，后面看了一些帖子才发现Shuffle原来是map()方法执行结束到reduce()方法执行这么一大段过程....小声BB：实质上该过程包含许多环节，不知道为啥就统称Shuffle了......1.Mapper的写出图见意现--直接上图：需要明确的点：在环形缓冲区触发溢写时，进行的排序是先根据每个键值对的分区进行排序，

Chord_Gll·2020-08-20 17:14

Hadoop学习笔记二：MapReduce的IO类型 && 文件切片

1.对MapReduce的理解是什么：Hadoop默认自带的分布式计算框架做什么：提供一系列接口(核心类：InputFormat、OutputFormat、Mapper、Reducer、Driver)，让用户能够实现自定义业务功能的分布式计算任务【优点】：高扩展性：计算资源不够，直接增加节点数量即可。质量可能不够，数量一定管够高容错性：一个节点任务失败，能自动转移到其他空闲节点适合大数据处理：得益

Chord_Gll·2020-08-20 17:37

Hadoop学习笔记二：MapReduce的IO类型 && 文件切片

1.对MapReduce的理解是什么：Hadoop默认自带的分布式计算框架做什么：提供一系列接口(核心类：InputFormat、OutputFormat、Mapper、Reducer、Driver)，让用户能够实现自定义业务功能的分布式计算任务【优点】：高扩展性：计算资源不够，直接增加节点数量即可。质量可能不够，数量一定管够高容错性：一个节点任务失败，能自动转移到其他空闲节点适合大数据处理：得益

Chord_Gll·2020-08-20 17:37

Hadoop学习笔记 Java接口

从hadoopURL读取数据1.自定义编写URLCat方法：importjava.io.IOException;importjava.io.InputStream;importjava.net.MalformedURLException;importjava.net.URL;importorg.apache.hadoop.fs.FsUrlStreamHandlerFactory;importorg

Nobi·2020-08-20 16:21

Hadoop学习笔记(3)-java操作hdfs的API接口

Java操作hdfs的API接口packagecom.zhouxy;importjava.io.FileNotFoundException;importjava.io.IOException;importjava.net.URI;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.FileStatus;impo

米兔by·2020-08-20 14:47

hadoop学习笔记之--完全分布模式安装

Hadoop完全分布式模式安装步骤Hadoop模式介绍单机模式：安装简单，几乎不用作任何配置，但仅限于调试用途伪分布模式：在单节点上同时启动namenode、datanode、jobtracker、tasktracker、secondarynamenode等5个进程，模拟分布式运行的各个节点完全分布式模式：正常的Hadoop集群，由多个各司其职的节点构成安装环境操作平台：vmware2操作系统：o

iteye_4537·2020-08-19 10:19

Hadoop学习笔记01

官方文档：https://hadoop.apache.org/docs/r2.10.0/hadoop-project-dist/hadoop-common/ClusterSetup.html1编译一些软件的官网提供了source和binary两个版本source是源码，需要手动编译成可执行文件binary是可执行版，是已经编译好的以hadoop2.7来说，官网的可执行版不支持snappy和bzip

♂燃烧吧ˇ小宇宙、·2020-08-18 21:31

Hadoop学习笔记（1）－Hadoop生态系统

0.前言先介绍下现在的整体大数据架构的内容。见下图。右边的黑框部分是hadoop的核心架构。包括HDFS，MapReduce，yarn，hive，hbase。中间红框部分是saprk的生态圈，有RDD，sparkCore，sparkSQL，sparkGraphX，sparkML，sparkR，sparkStreaming。Spark可以完全代替Hadoop中的MapReduce部分。现在的hado

XianMing的博客·2020-08-18 12:55

Hadoop学习笔记：（1）Hadoop体系介绍

Hadoop是一个能对大量数据进行分布式处理的软件框架。使得开发人员在不了解底层分布式细节的情况下，开发分布式程序。利用集群的特长进行高速运算和存储。分布式系统是一组通过网络进行通信，为了完成共同的任务为协调工作的计算机节点组成的系统。目的是利用更多的机器，更多更快的处理和存储数据。分布式和集群的差别在于集群中每个节点是相似的，提供相似的功能，而分布式是把任务分为多个子任务，并把子任务分布在不同机

cristan_lsy·2020-08-18 12:44

Hadoop学习笔记_3：运行模式之本地模式

Hadoop运行模式本地模式Bydefault,Hadoopisconfiguredtoruninanon-distributedmode,asasingleJavaprocess.Thisisusefulfordebugging.默认情况下，Hadoop被配置为以非分布式模式作为单个Java进程运行。这对于调试很有用。官方Grep案例Thefollowingexamplecopiestheunp

编程小透明·2020-08-18 10:14

Hadoop学习笔记_4：运行模式之伪分布式模式

伪分布式模式Hadoopcanalsoberunonasingle-nodeinapseudo-distributedmodewhereeachHadoopdaemonrunsinaseparateJavaprocess.Hadoop也可以以伪分布式模式在单节点上运行，其中每个Hadoop守护程序都在单独的Java进程中运行。启动HDFS并运行MapReduce程序配置集群配置etc/hadoop

编程小透明·2020-08-18 10:14

Hadoop学习笔记_1：Hadoop相关生态圈了解学习

写在开头Hadoop生态圈主要解决：海量数据的存储和分析计算问题。大数据特点（4V）：大量（Volume）、高速（Velocity）、多样（Variety）、低价值密度（Value）Hadoop优点（4高）：高可靠性、高拓展性、高效性、高容错性Hadoop1.x和2.x的区别：2.x组成Common：辅助工具HDFS：数据存储MapReduce：计算（1.x版本没有Yarn，MapReduce负责

编程小透明·2020-08-18 10:02

Hadoop学习笔记（1）

使用docker搭建分布式环境今天开始，准备学习大数据分析，参考的教材是O‘REILLY的《Hadoop数据分析》,算是一本比较新的书吧！我自己也属于刚入门，写笔记除了分享，更重要的是可以提高学习的效果！！这里我使用的是docker而不是书上推荐的在vmware上安装虚拟机，至于为什么抛弃vm而选择docker，当然是docker更加轻量级更加好用，docker可以说是当今虚拟化技术的潮流，当然想

One2Four·2020-08-18 05:40

大数据-Hadoop学习笔记09

30.MapReducemapreduce任务过程分为两个处理阶段：map阶段和reduce阶段。每个阶段都以k-v对作为输入和输出，其类型由开发者选择。map阶段的输入时NCDC原始数据。我们选择文本格式作为输入格式，将数据集的每一行作为文本输入。1.编写MR程序【创建mapper】publicclassMyMaxTempMapperextendsMapper{privatestaticfina

就问你吃不吃药·2020-08-16 22:12

hadoop学习笔记4：java实现hdfs -ls/-lsr

作业1：java代码实现hadoopfs-lsr的功能，调用FileSystem.listStatus(...)方法，显示结果，要求结果显示样式如hadoopfs-lsxxx的结果类似。作业2：java代码实现hadoopfs-lsr的功能------上面两题的代码如下：packagehdfs;importjava.io.IOException;importjava.net.URI;importj

yraspen·2020-08-16 22:17

hadoop学习笔记1：实现ssh免密码登录

一、实验目的：启动和运行hadoop集群时，主节点和从节点之间会进行频繁的数据通信，为避免手动进行多次密码认证和提高数据传输的安全性，需要实现ssh免密码登录二、需求分析：（一）实现chaoren1、chaoren2、chaoren3、chaoren4、chaoren5每台机器自身的免密码登录（二）实现chaoren1与其他4台机器的免密码登录三、具体实现：（一）实现chaoren1、chaore

yraspen·2020-08-16 22:46

hadoop学习笔记

文章目录一、hadoop四个核心模块二、Hadoop-HDFS2.1、hadoop架构模型2.1、存储模型：字节（byte）2.3、Block的副本放置策略2.4、优缺点2.5、NN和DN一、hadoop四个核心模块hadoopcommonhadoopdistributedfilesystem（功能：对数据存储功能的访问）分布式存储系统提供了高可靠性、高扩展性和高吞吐率的数据存储服务hadoopy

Ethan-bigdata·2020-08-16 22:07

hadoop学习笔记hadoop学习笔记

目录(?)[-]hadoop在redhatlinux下的安装过程网上有很多讲授在windows下通过Cygwin安装hadoop的，笔者认为hadoop原始设计就是在linux下安装使用的，在windows下通过Cygwin安装也无非是模拟linux环境再在这个模拟的环境上装hadoop，既然要学hadoop就真枪实弹的在linux下安装来学习，但是要搞一台真正的linux系统对一般个人来说不容易

单向街的夏天·2020-08-16 22:19

Hadoop学习笔记：Hadoop基础知识

阅读目录一、Hadoop简介二、Hadoop的特性三、hadoop组成与体系结构四、Hadoop安装方式五、Hadoop集群中的节点类型一、Hadoop简介Hadoop是Apache软件基金会旗下的一个开源分布式计算平台，为用户提供了系统底层细节透明的分布式基础架构Hadoop是基于Java语言开发的，具有很好的跨平台特性，并且可以部署在廉价的计算机集群中Hadoop的核心是HDFS和MapRed

忌颓废·2020-08-16 22:00

Hadoop学习笔记(3)——分布式环境搭建

Hadoop学习笔记(3)——分布式环境搭建前面，我们已经在单机上把Hadoop运行起来了，但我们知道Hadoop支持分布式的，而它的优点就是在分布上突出的，所以我们得搭个环境模拟一下。

weixin_33863087·2020-08-16 21:48

Hadoop学习笔记1：伪分布式环境搭建

在搭建Hadoop环境之前，请先阅读如下博文，把搭建Hadoop环境之前的准备工作做好，博文如下：1、CentOS6.7下安装JDK,地址：http://blog.csdn.net/yulei_qq/article/details/519256732、CenOS虚拟机和Windows通信，地址：http://blog.csdn.net/yulei_qq/article/details/519307

weixin_30755393·2020-08-16 21:50

Hadoop学习笔记

hadoop以下文章都是关于hadoop学习的笔记，不太成体系，知识慢慢积累吧namenode相当于拿着账本的记账员，记录来的货物在哪个仓库里，当然仓库没有备份secondnamenode:比如此处是个中转站，货物需要再次移动，需要再次记录，secondnamenode相当于记账员的助理，来协助namenode来记录数据datanode:相当于码头上的一块块的分区的货物hadoop文件合并文件合并

qq_322235565·2020-08-16 20:55

Hadoop学习笔记1：Hadoop2.7.3分布式部署-Eclipse开发环境部署

SSH免密码登录SSH免密码登录，因为Hadoop需要通过SSH登录到各个节点进行操作，我用的是root用户，每台服务器都生成公钥，再合并到authorized_keys(1)CentOS默认没有启动ssh无密登录，去掉/etc/ssh/sshd_config其中2行的注释，每台服务器都要设置，#RSAAuthenticationyes#PubkeyAuthenticationyes(2)输入命令

pigcoffee·2020-08-16 19:28

Hadoop学习笔记2：eclipse运行Mapreduce程序问题总结

(null)entryincommandstring:nullchmod0700运行mapreduce任务报错：(null)entryincommandstring:nullchmod0700解决办法：在https://github.com/SweetInk/hadoop-common-2.7.1-bin中下载winutils.exe,libwinutils.lib拷贝到%HADOOP_HOME%

pigcoffee·2020-08-16 19:57

hadoop学习笔记3：shell下的hdfs操作

作业：当使用hadoopfs-put上传一个文件到hdfs时，(1)如果目的地是一个已经存在的目录时，上传后的文件名是什么？答：----准备工作：清空hdfs[cr12@chaoren1~]$hadoopfs-rmrhdfs://chaoren1:9012/*Deletedhdfs://chaoren1:9012/mntDeletedhdfs://chaoren1:9012/user----创建目

yraspen·2020-08-16 18:28

hadoop学习笔记2：hadoop分布式环境搭建

一、实验目的：（1）搭建一套hadoop的分布式运行环境，用于学习hadoop相关知识。（2）相对于为分布式和本地模式，分布式环境更接近于实际的生产环境NameNodeJobTrackerSecondaryNameNodeSlaveschaoren1chaoren2chaoren2chaoren3、chaoren4、chaoren5二、实施基础：（1）阿里云服务器5个节点节点名称公网IP内网IPc

yraspen·2020-08-16 18:28

hadoop学习笔记3：分布式搭建及测试

hadoop学习笔记3：集群/分布式搭建及测试hadoop学习笔记3集群分布式搭建及测试节点网络配置ssh无密码登陆节点Hadoop分布式配置hadoop分布式实例测试记录一下hadoop集群搭建，使用

SingleOneMan·2020-08-16 18:27

hadoop学习笔记2：eclipse开发MapReduce

hadoop学习笔记2：eclipse开发MapReduce伪分布式搭建见：Hadoop学习笔记1：伪分布式环境搭建环境：虚拟机：Ubuntu16.0jdk1.8.0_111,eclipse4.6.0,

SingleOneMan·2020-08-16 18:27

hadoop学习笔记4：hadoop、spark概念

hadoop学习笔记4：hadoop、spark概念hadoop学习笔记4hadoopspark概念hadoop1HDFS2MapReduce3YARNspark1.hadoopHadoop是一种开源的适合大数据的分布式存储和处理的平台

SingleOneMan·2020-08-16 18:27

Hadoop 学习笔记二：安装与运行一

Hadoop学习笔记二：安装与运行一搭建Hadoop运行环境虚拟机环境准备安装JDK安装HadoopHadoop的目录结构Hadoop运行模式本地运行模式官方Grep案例官方WordCount案例伪分布式运行模式启动

人在囧途^o^·2020-08-16 18:18

推荐频道

Hadoop学习笔记

Hadoop学习笔记之三：用MRUnit做单元测试

Hadoop学习笔记—8.Combiner与自定义Combiner

Hadoop学习笔记（三）——HDFS垃圾桶机制

Hadoop学习笔记（九）——HDFS Java API

Hadoop学习笔记（4）－Eclipse下搭建Hadoop2.6.4开发环境并写wordcount

Hadoop学习笔记（10）－简述分布式数据仓库Hive原理

hadoop学习笔记之hadoop伪集群安装

Hadoop学习笔记（四）：HBase

Hadoop学习笔记—9.Partitioner与自定义Partitioner

Hadoop学习笔记(1)----项目简述

Hadoop学习笔记（8）－简述分布式数据库Hbase原理

Hadoop学习笔记

Hadoop学习笔记（一）

Hadoop学习笔记 --- 计算机中存储单位介绍

hadoop学习笔记3 hadoop2.5.2单机模式环境配置和eclipse运行

Hadoop学习笔记：Apache Hadoop生态系统

Hadoop学习笔记一 ：HDFS总结

Hadoop学习笔记3：org.apache.hadoop.conf

Hadoop学习笔记（4）—— java API 操作 hdfs（1）

Hadoop学习笔记三：MapReduce的Shuffle图解

Hadoop学习笔记三：MapReduce的Shuffle图解

Hadoop学习笔记二：MapReduce的IO类型 && 文件切片

Hadoop学习笔记二：MapReduce的IO类型 && 文件切片

Hadoop学习笔记 Java接口

Hadoop学习笔记(3)-java操作hdfs的API接口

hadoop学习笔记之--完全分布模式安装

Hadoop学习笔记01

Hadoop学习笔记（1）－Hadoop生态系统

Hadoop学习笔记：（1）Hadoop体系介绍

Hadoop学习笔记_3：运行模式之本地模式

Hadoop学习笔记_4：运行模式之伪分布式模式

Hadoop学习笔记_1：Hadoop相关生态圈了解学习

Hadoop学习笔记（1）

大数据-Hadoop学习笔记09

hadoop学习笔记4：java实现hdfs -ls/-lsr

hadoop学习笔记1：实现ssh免密码登录

hadoop学习笔记

hadoop学习笔记hadoop学习笔记

Hadoop学习笔记：Hadoop基础知识

Hadoop学习笔记(3)——分布式环境搭建

Hadoop学习笔记1：伪分布式环境搭建

Hadoop学习笔记

Hadoop学习笔记1：Hadoop2.7.3分布式部署-Eclipse开发环境部署

Hadoop学习笔记2：eclipse运行Mapreduce程序问题总结

hadoop学习笔记3：shell下的hdfs操作

hadoop学习笔记2：hadoop分布式环境搭建

hadoop学习笔记3：分布式搭建及测试

hadoop学习笔记2：eclipse开发MapReduce

hadoop学习笔记4：hadoop、spark概念

Hadoop 学习笔记二：安装与运行一

Hadoop学习笔记一：HDFS总结