E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop学习笔记
Hadoop学习笔记
之三:用MRUnit做单元测试
转载务必注明出处TaobaoQATeam,原文地址:http://qa.taobao.com/?p=10550引言借年底盛宴品鉴之风,继续抒我Hadoop之情,本篇文章介绍如何对Hadoop的MapReduce进行单元测试。MapReduce的开发周期差不多是这样:编写mapper和reducer、编译、打包、提交作业和结果检索等,这个过程比较繁琐,一旦提交到分布式环境出了问题要定位调试,重复这样
liuxinglanyue
·
2020-09-11 02:25
Hadoop
Hadoop学习笔记
—8.Combiner与自定义Combiner
一、Combiner的出现背景1.1回顾Map阶段五大步骤在第四篇博文《初识MapReduce》中,我们认识了MapReduce的八大步凑,其中在Map阶段总共五个步骤,如下图所示:其中,step1.5是一个可选步骤,它就是我们今天需要了解的Map规约阶段。现在,我们再来看看前一篇博文《计数器与自定义计数器》中的第一张关于计数器的图:我们可以发现,其中有两个计数器:Combineoutputrec
HoterSpring
·
2020-09-11 01:03
Hadoop
Hadoop学习笔记
(三)——HDFS垃圾桶机制
Hadoop——HDFS垃圾桶机制HDFS的垃圾桶机制1.基本介绍2.配置操作3.shell操作4.java操作HDFS的垃圾桶机制1.基本介绍每一个文件系统都会有垃圾桶机制,将删除的数据回收到垃圾桶里面去,避免某些误操作删除一些重要文件。回收到垃圾桶里里面的资料数据,都可以进行恢复。HDFS同样拥有垃圾桶机制,但默认为禁用状态,若要开启垃圾桶机制,需要手动配置。如果启用垃圾桶机制,dfs命令删除
AidenBrett
·
2020-08-26 09:18
Hadoop
Hadoop学习笔记
(九)——HDFS Java API
Hadoop——HDFSJavaAPIHDFSJavaAPI一、搭建开发环境二、Maven依赖三、JavaAPI1.目录操作2.上传文件3.下载文件4.查看目录信息,只显示文件5.查看文件及文件夹信息HDFSJavaAPIHDFS在生产应用中主要是客户端的开发,其核心步骤是从HDFS提供的api中构造一个HDFS的访问客户端对象,然后通过该客户端对象操作(增删改查)HDFS上的文件。一、搭建开发环
AidenBrett
·
2020-08-26 09:18
Hadoop
Hadoop学习笔记
(4)-Eclipse下搭建Hadoop2.6.4开发环境并写wordcount
0.前言本文参考博客:http://www.51itong.net/eclipse-hadoop2-7-0-12448.html搭建开发环境前保障已经搭建好hadoop的伪分布式。可参考上个博客:http://blog.csdn.net/xummgg/article/details/511730721.下载安装eclipse下载网址:http://www.eclipse.org/downloads
XianMing的博客
·
2020-08-24 18:50
Hadoop
Hadoop学习笔记
(10)-简述分布式数据仓库Hive原理
0.什么是数据仓库数据仓库,英文名称为DataWarehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。简单的说就是:数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库
XianMing的博客
·
2020-08-24 18:50
Hadoop
hadoop学习笔记
之hadoop伪集群安装
hadoop安装实际也是很简单的,关键是有些坑不要踩了就好了,hadoop实际就是一个java的程序,跑起来很简单的,前期配置和准备工作做好就能一步安装成功准备工作1安装linux虚拟机,注意安装的时候不要忘记网络设置,不然不能通过局域网连接到虚拟机准备工作2linux要先建立一个跑hadoop的用户并赋给权限[root@~]#useradd-mhadoop-s/bin/bash[root@~]#
xuehanxin
·
2020-08-24 18:45
hadoop安装
Hadoop学习笔记
(四):HBase
HBase是在一个HDFS上开发的面向列的分布式数据库。HBase不是关系型数据库,不支持SQL。HTable一些基本概念Rowkey行主键,HBase不支持条件查询和Orderby等查询,读取记录只能按Rowkey(及其range)或全表扫描,因此Rowkey需要根据业务来设计以利用其存储排序特性(Table按Rowkey字典序排序如1,10,100,11,2)提高性能。ColumnFamily
weixin_34306593
·
2020-08-24 17:19
Hadoop学习笔记
—9.Partitioner与自定义Partitioner
Hadoop学习笔记
—9.Partitioner与自定义Partitioner一、初步探索Partitioner1.1再次回顾Map阶段五大步骤在第四篇博文《初识MapReduce》中,我们认识了MapReduce
weixin_34194359
·
2020-08-24 17:02
Hadoop学习笔记
(1)----项目简述
1.Common:一系列组件和接口,用于分布式文件系统和通用I/O(序列化、JavaRPC和持久化数据结构)2.Avro:一种序列化系统,用于支持高效,跨语言的RPC和持久化数据存储3.MapReduce:分布式数据处理模型和执行环境,运行于大型商用机集群4.HDFS:分布式文件系统,运行于大型商用机集群5.Pig:数据流行语言和运行环境,用以探究非常庞大的数据集。Pig运行在MapReduce和
Eickrow
·
2020-08-24 15:54
Hadoop
Hadoop学习笔记
(8)-简述分布式数据库Hbase原理
1.Hbase简介Hbase是一个分布式可扩展的NoSQL数据库,提供对结构化,半结构化,非结构化大数据的实时读写和随机访问能力,而且操作速度与数据量基本无关,所以可以用于海量数据处理。Hbase之于HDFS就类似于数据库之于文件系统。自然Hbase是建立在HDFS之上的,可以存储海量的数据。常见的NoSQL数据库还有:ApacheCassandra,MongoDB等。下图1展示了Hbase在Ha
XianMing的博客
·
2020-08-24 12:54
Hadoop
hadoop
hbase
分布式数据库
大数据
Hadoop学习笔记
一.Datanode与NameNode区别HDFS体系结构大数据中,HDFS集群以Master-Slave模式运行,主要有两类节点:一个Namenode(即Master)和多个Datanode(即Slave)。Namenode管理文件系统的Namespace。它维护着文件系统树(filesystemtree)以及文件树中所有的文件和文件夹的元数据(metadata)。Namenode管理者文件系统
zang_coding
·
2020-08-24 11:09
Hadoop学习笔记
(一)
Hadoop2ubuntu安装和配置1.安装hadoop前的准备工作安装jdk安装openssl-server免密码登陆2.安装hadoop>https://hadoop.apache.org/releases.html选择自己要安装的版本。注意每个版本对应两个下载选项source和binary,我们暂时下载binary,下载后我们会得到一个名为hadoop-x.x.x.tar.gz的压缩文件。将
赵大龙
·
2020-08-22 18:07
hadoop
Hadoop学习笔记
--- 计算机中存储单位介绍
计算机存储单位一般用字节(Byte)、千字节(KB)、兆字节(MB)、吉字节(GB)、太字节(TB)、拍字节(PB)、艾字节(EB)、泽它字节(ZB,又称皆字节)、尧它字节(YB)表示。它们之间的换算关系是:1KB=1024B1MB=1024KB1GB=1024MB1TB=1024GB1PB=1024TB1EB=1024PB1ZB=1024EB1YB=1024ZB
杨鑫newlfe
·
2020-08-22 14:00
大数据挖掘与大数据应用案例
数据库
hadoop学习笔记
3 hadoop2.5.2单机模式环境配置和eclipse运行
core-site.xmlhadoop.tmp.dir/home/mouap/hadoop/tmpfs.defaultFShdfs://localhost:9000io.file.buffer.size4096hdfs-site.xmldfs.nameserviceshadoop-cluster1集群别名,可以有多个,逗号分割dfs.namenode.name.dirfile:///home/mo
若水_若水
·
2020-08-21 20:49
大数据
Hadoop学习笔记
:Apache Hadoop生态系统
Hadoop学习笔记
:ApacheHadoop生态系统作者:雨水,时间:2013-12-9博客地址:http://blog.csdn.net/gobitanHadoop从诞生至今已经发展成为一个大数据相关的庞大的软件生态系统
gobitan
·
2020-08-21 12:51
5.
大数据
Hadoop学习笔记
一 :HDFS总结
Hadoop的核心优势高可靠性:Hadoop支持同一数据多个副本保存机制,能有效避免数据丢失情况高扩展性:Hadoop能够很方便地扩展大量节点,用于分布式存储与计算高效率性:Hadoop结合MapReduce的思想,支持分布式并行工作,处理工作高容错性:在Hadoop集群中,能够自动将失败节点的任务重新分配Yarn的架构ResourceManager:负责集群任务调度与资源分配的核心,启动监控NM
Chord_Gll
·
2020-08-21 03:30
hadoop2.0
Hadoop学习笔记
3:org.apache.hadoop.conf
2019独角兽企业重金招聘Python工程师标准>>>主要讲解org.apache.hadoop.conf包里的3个类的作用。看完这个,你绝对可以对配置项这一块非常清楚了。类的个数:3个1包:【org.apache.hadoop.conf】描述:本包与【配置参数配置】相关,包含3个类(接口),Configurable,Configuration,Configured.1.1)Configurabl
weixin_34408717
·
2020-08-20 19:42
Hadoop学习笔记
(4)—— java API 操作 hdfs(1)
前提是已经编译好了hadoop在win7上的源码,并且配置了正确的环境变量。参考笔记(3)参考地址1上传文件packagecom.tzb.hdfs;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.FileSystem;importorg.apache.hadoop.fs.Path;importorg.jun
一角残叶
·
2020-08-20 18:37
#
Hadoop学习笔记
Hadoop学习笔记
三:MapReduce的Shuffle图解
学习的时候没有太过留意Shuffle这个概念,以至于还以为是不是漏掉了什么知识点,后面看了一些帖子才发现Shuffle原来是map()方法执行结束到reduce()方法执行这么一大段过程....小声BB:实质上该过程包含许多环节,不知道为啥就统称Shuffle了......1.Mapper的写出图见意现--直接上图:需要明确的点:在环形缓冲区触发溢写时,进行的排序是先根据每个键值对的分区进行排序,
Chord_Gll
·
2020-08-20 17:15
hadoop2.0
mapreduce
Hadoop学习笔记
三:MapReduce的Shuffle图解
学习的时候没有太过留意Shuffle这个概念,以至于还以为是不是漏掉了什么知识点,后面看了一些帖子才发现Shuffle原来是map()方法执行结束到reduce()方法执行这么一大段过程....小声BB:实质上该过程包含许多环节,不知道为啥就统称Shuffle了......1.Mapper的写出图见意现--直接上图:需要明确的点:在环形缓冲区触发溢写时,进行的排序是先根据每个键值对的分区进行排序,
Chord_Gll
·
2020-08-20 17:14
hadoop2.0
mapreduce
Hadoop学习笔记
二:MapReduce的IO类型 && 文件切片
1.对MapReduce的理解是什么:Hadoop默认自带的分布式计算框架做什么:提供一系列接口(核心类:InputFormat、OutputFormat、Mapper、Reducer、Driver),让用户能够实现自定义业务功能的分布式计算任务【优点】:高扩展性:计算资源不够,直接增加节点数量即可。质量可能不够,数量一定管够高容错性:一个节点任务失败,能自动转移到其他空闲节点适合大数据处理:得益
Chord_Gll
·
2020-08-20 17:37
mapreduce
hadoop
Hadoop学习笔记
二:MapReduce的IO类型 && 文件切片
1.对MapReduce的理解是什么:Hadoop默认自带的分布式计算框架做什么:提供一系列接口(核心类:InputFormat、OutputFormat、Mapper、Reducer、Driver),让用户能够实现自定义业务功能的分布式计算任务【优点】:高扩展性:计算资源不够,直接增加节点数量即可。质量可能不够,数量一定管够高容错性:一个节点任务失败,能自动转移到其他空闲节点适合大数据处理:得益
Chord_Gll
·
2020-08-20 17:37
mapreduce
hadoop
Hadoop学习笔记
Java接口
从hadoopURL读取数据1.自定义编写URLCat方法:importjava.io.IOException;importjava.io.InputStream;importjava.net.MalformedURLException;importjava.net.URL;importorg.apache.hadoop.fs.FsUrlStreamHandlerFactory;importorg
Nobi
·
2020-08-20 16:21
Hadoop入门
Hadoop学习笔记
(3)-java操作hdfs的API接口
Java操作hdfs的API接口packagecom.zhouxy;importjava.io.FileNotFoundException;importjava.io.IOException;importjava.net.URI;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.FileStatus;impo
米兔by
·
2020-08-20 14:47
Hadoop
hadoop学习笔记
之--完全分布模式安装
Hadoop完全分布式模式安装步骤Hadoop模式介绍单机模式:安装简单,几乎不用作任何配置,但仅限于调试用途伪分布模式:在单节点上同时启动namenode、datanode、jobtracker、tasktracker、secondarynamenode等5个进程,模拟分布式运行的各个节点完全分布式模式:正常的Hadoop集群,由多个各司其职的节点构成安装环境操作平台:vmware2操作系统:o
iteye_4537
·
2020-08-19 10:19
Hadoop学习笔记
01
官方文档:https://hadoop.apache.org/docs/r2.10.0/hadoop-project-dist/hadoop-common/ClusterSetup.html1编译一些软件的官网提供了source和binary两个版本source是源码,需要手动编译成可执行文件binary是可执行版,是已经编译好的以hadoop2.7来说,官网的可执行版不支持snappy和bzip
♂燃烧吧ˇ小宇宙、
·
2020-08-18 21:31
Hadoop
Hadoop学习笔记
(1)-Hadoop生态系统
0.前言先介绍下现在的整体大数据架构的内容。见下图。右边的黑框部分是hadoop的核心架构。包括HDFS,MapReduce,yarn,hive,hbase。中间红框部分是saprk的生态圈,有RDD,sparkCore,sparkSQL,sparkGraphX,sparkML,sparkR,sparkStreaming。Spark可以完全代替Hadoop中的MapReduce部分。现在的hado
XianMing的博客
·
2020-08-18 12:55
Hadoop
Hadoop学习笔记
:(1)Hadoop体系介绍
Hadoop是一个能对大量数据进行分布式处理的软件框架。使得开发人员在不了解底层分布式细节的情况下,开发分布式程序。利用集群的特长进行高速运算和存储。分布式系统是一组通过网络进行通信,为了完成共同的任务为协调工作的计算机节点组成的系统。目的是利用更多的机器,更多更快的处理和存储数据。分布式和集群的差别在于集群中每个节点是相似的,提供相似的功能,而分布式是把任务分为多个子任务,并把子任务分布在不同机
cristan_lsy
·
2020-08-18 12:44
大数据
JAVA
Hadoop学习笔记
_3:运行模式之本地模式
Hadoop运行模式本地模式Bydefault,Hadoopisconfiguredtoruninanon-distributedmode,asasingleJavaprocess.Thisisusefulfordebugging.默认情况下,Hadoop被配置为以非分布式模式作为单个Java进程运行。这对于调试很有用。官方Grep案例Thefollowingexamplecopiestheunp
编程小透明
·
2020-08-18 10:14
#
Hadoop学习笔记
每天学点大数据
Hadoop学习笔记
_4:运行模式之伪分布式模式
伪分布式模式Hadoopcanalsoberunonasingle-nodeinapseudo-distributedmodewhereeachHadoopdaemonrunsinaseparateJavaprocess.Hadoop也可以以伪分布式模式在单节点上运行,其中每个Hadoop守护程序都在单独的Java进程中运行。启动HDFS并运行MapReduce程序配置集群配置etc/hadoop
编程小透明
·
2020-08-18 10:14
每天学点大数据
#
Hadoop学习笔记
Hadoop学习笔记
_1:Hadoop相关生态圈了解学习
写在开头Hadoop生态圈主要解决:海量数据的存储和分析计算问题。大数据特点(4V):大量(Volume)、高速(Velocity)、多样(Variety)、低价值密度(Value)Hadoop优点(4高):高可靠性、高拓展性、高效性、高容错性Hadoop1.x和2.x的区别:2.x组成Common:辅助工具HDFS:数据存储MapReduce:计算(1.x版本没有Yarn,MapReduce负责
编程小透明
·
2020-08-18 10:02
#
Hadoop学习笔记
每天学点大数据
Hadoop学习笔记
(1)
使用docker搭建分布式环境今天开始,准备学习大数据分析,参考的教材是O‘REILLY的《Hadoop数据分析》,算是一本比较新的书吧!我自己也属于刚入门,写笔记除了分享,更重要的是可以提高学习的效果!!这里我使用的是docker而不是书上推荐的在vmware上安装虚拟机,至于为什么抛弃vm而选择docker,当然是docker更加轻量级更加好用,docker可以说是当今虚拟化技术的潮流,当然想
One2Four
·
2020-08-18 05:40
互联网
Hadoop
docker
大数据-
Hadoop学习笔记
09
30.MapReducemapreduce任务过程分为两个处理阶段:map阶段和reduce阶段。每个阶段都以k-v对作为输入和输出,其类型由开发者选择。map阶段的输入时NCDC原始数据。我们选择文本格式作为输入格式,将数据集的每一行作为文本输入。1.编写MR程序【创建mapper】publicclassMyMaxTempMapperextendsMapper{privatestaticfina
就问你吃不吃药
·
2020-08-16 22:12
大数据学习
hadoop学习笔记
4:java实现hdfs -ls/-lsr
作业1:java代码实现hadoopfs-lsr的功能,调用FileSystem.listStatus(...)方法,显示结果,要求结果显示样式如hadoopfs-lsxxx的结果类似。作业2:java代码实现hadoopfs-lsr的功能------上面两题的代码如下:packagehdfs;importjava.io.IOException;importjava.net.URI;importj
yraspen
·
2020-08-16 22:17
hadoop学习笔记
hadoop集群
java
源代码
rpc
hadoop学习笔记
1:实现ssh免密码登录
一、实验目的:启动和运行hadoop集群时,主节点和从节点之间会进行频繁的数据通信,为避免手动进行多次密码认证和提高数据传输的安全性,需要实现ssh免密码登录二、需求分析:(一)实现chaoren1、chaoren2、chaoren3、chaoren4、chaoren5每台机器自身的免密码登录(二)实现chaoren1与其他4台机器的免密码登录三、具体实现:(一)实现chaoren1、chaore
yraspen
·
2020-08-16 22:46
hadoop学习笔记
hadoop学习笔记
文章目录一、hadoop四个核心模块二、Hadoop-HDFS2.1、hadoop架构模型2.1、存储模型:字节(byte)2.3、Block的副本放置策略2.4、优缺点2.5、NN和DN一、hadoop四个核心模块hadoopcommonhadoopdistributedfilesystem(功能:对数据存储功能的访问)分布式存储系统提供了高可靠性、高扩展性和高吞吐率的数据存储服务hadoopy
Ethan-bigdata
·
2020-08-16 22:07
hadoop学习
hadoop学习笔记
hadoop学习笔记
目录(?)[-]hadoop在redhatlinux下的安装过程网上有很多讲授在windows下通过Cygwin安装hadoop的,笔者认为hadoop原始设计就是在linux下安装使用的,在windows下通过Cygwin安装也无非是模拟linux环境再在这个模拟的环境上装hadoop,既然要学hadoop就真枪实弹的在linux下安装来学习,但是要搞一台真正的linux系统对一般个人来说不容易
单向街的夏天
·
2020-08-16 22:19
大数据处理
Hadoop学习笔记
:Hadoop基础知识
阅读目录一、Hadoop简介二、Hadoop的特性三、hadoop组成与体系结构四、Hadoop安装方式五、Hadoop集群中的节点类型一、Hadoop简介Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,为用户提供了系统底层细节透明的分布式基础架构Hadoop是基于Java语言开发的,具有很好的跨平台特性,并且可以部署在廉价的计算机集群中Hadoop的核心是HDFS和MapRed
忌颓废
·
2020-08-16 22:00
hadoop+spark
Hadoop学习笔记
(3)——分布式环境搭建
Hadoop学习笔记
(3)——分布式环境搭建前面,我们已经在单机上把Hadoop运行起来了,但我们知道Hadoop支持分布式的,而它的优点就是在分布上突出的,所以我们得搭个环境模拟一下。
weixin_33863087
·
2020-08-16 21:48
大数据
运维
java
Hadoop学习笔记
1:伪分布式环境搭建
在搭建Hadoop环境之前,请先阅读如下博文,把搭建Hadoop环境之前的准备工作做好,博文如下:1、CentOS6.7下安装JDK,地址:http://blog.csdn.net/yulei_qq/article/details/519256732、CenOS虚拟机和Windows通信,地址:http://blog.csdn.net/yulei_qq/article/details/519307
weixin_30755393
·
2020-08-16 21:50
Hadoop学习笔记
hadoop以下文章都是关于hadoop学习的笔记,不太成体系,知识慢慢积累吧namenode相当于拿着账本的记账员,记录来的货物在哪个仓库里,当然仓库没有备份secondnamenode:比如此处是个中转站,货物需要再次移动,需要再次记录,secondnamenode相当于记账员的助理,来协助namenode来记录数据datanode:相当于码头上的一块块的分区的货物hadoop文件合并文件合并
qq_322235565
·
2020-08-16 20:55
大数据
Hadoop学习笔记
1:Hadoop2.7.3分布式部署-Eclipse开发环境部署
SSH免密码登录SSH免密码登录,因为Hadoop需要通过SSH登录到各个节点进行操作,我用的是root用户,每台服务器都生成公钥,再合并到authorized_keys(1)CentOS默认没有启动ssh无密登录,去掉/etc/ssh/sshd_config其中2行的注释,每台服务器都要设置,#RSAAuthenticationyes#PubkeyAuthenticationyes(2)输入命令
pigcoffee
·
2020-08-16 19:28
hadoop
Hadoop学习笔记
2:eclipse运行Mapreduce程序问题总结
(null)entryincommandstring:nullchmod0700运行mapreduce任务报错:(null)entryincommandstring:nullchmod0700解决办法:在https://github.com/SweetInk/hadoop-common-2.7.1-bin中下载winutils.exe,libwinutils.lib拷贝到%HADOOP_HOME%
pigcoffee
·
2020-08-16 19:57
hadoop
hadoop
mapreduce
eclipse
hadoop学习笔记
3:shell下的hdfs操作
作业:当使用hadoopfs-put上传一个文件到hdfs时,(1)如果目的地是一个已经存在的目录时,上传后的文件名是什么?答:----准备工作:清空hdfs[cr12@chaoren1~]$hadoopfs-rmrhdfs://chaoren1:9012/*Deletedhdfs://chaoren1:9012/mntDeletedhdfs://chaoren1:9012/user----创建目
yraspen
·
2020-08-16 18:28
hadoop学习笔记
hadoop学习笔记
2:hadoop分布式环境搭建
一、实验目的:(1)搭建一套hadoop的分布式运行环境,用于学习hadoop相关知识。(2)相对于为分布式和本地模式,分布式环境更接近于实际的生产环境NameNodeJobTrackerSecondaryNameNodeSlaveschaoren1chaoren2chaoren2chaoren3、chaoren4、chaoren5二、实施基础:(1)阿里云服务器5个节点节点名称公网IP内网IPc
yraspen
·
2020-08-16 18:28
hadoop学习笔记
hadoop学习笔记
3:分布式搭建及测试
hadoop学习笔记
3:集群/分布式搭建及测试
hadoop学习笔记
3集群分布式搭建及测试节点网络配置ssh无密码登陆节点Hadoop分布式配置hadoop分布式实例测试记录一下hadoop集群搭建,使用
SingleOneMan
·
2020-08-16 18:27
hadoop入门学习笔记
hadoop学习笔记
2:eclipse开发MapReduce
hadoop学习笔记
2:eclipse开发MapReduce伪分布式搭建见:
Hadoop学习笔记
1:伪分布式环境搭建环境:虚拟机:Ubuntu16.0jdk1.8.0_111,eclipse4.6.0,
SingleOneMan
·
2020-08-16 18:27
hadoop入门学习笔记
hadoop学习笔记
4:hadoop、spark概念
hadoop学习笔记
4:hadoop、spark概念
hadoop学习笔记
4hadoopspark概念hadoop1HDFS2MapReduce3YARNspark1.hadoopHadoop是一种开源的适合大数据的分布式存储和处理的平台
SingleOneMan
·
2020-08-16 18:27
hadoop入门学习笔记
hadoop
spark
大数据
分布式存储
Hadoop 学习笔记二:安装与运行一
Hadoop学习笔记
二:安装与运行一搭建Hadoop运行环境虚拟机环境准备安装JDK安装HadoopHadoop的目录结构Hadoop运行模式本地运行模式官方Grep案例官方WordCount案例伪分布式运行模式启动
人在囧途^o^
·
2020-08-16 18:18
Hadoop
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他