E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
【MapReduce】
咱们一起聊聊Zookeeper
根据
MapReduce
,于是我们有了Hadoop;根据GFS,于是我们有了HDFS;根据BigTable,于是我们有了HBase。
java欧阳丰
·
2023-04-16 18:01
hive学习笔记
可以将sql语句转化为
MapReduce
任务进行运行。Hive提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。
MOOJ
·
2023-04-16 17:59
MapReduce
之WordCount案例
前言学习大数据框架通常都是从wordcount案例开始的,也是学习框架的基础,wordcount虽然简单,如果能彻底搞清楚其运行原理,对后续深入学习和掌握
MapReduce
非常有帮助的,本篇以一个wordcount
小码农叔叔
·
2023-04-16 17:41
hadoop
大数据
mapreduce之单词统计
mapreduce词频统计
mapreduce做单词统计
wordcount案例
MapReduce
WordCount 案例实操
MapReduce
WordCount案例实操需求:在给定的文本文件中统计输出每一个单词出现的次数(1)输入数据hello.txt(2)期望输出数据jinghang2banzhang1cls2hadoop1jiao1
流火十二
·
2023-04-16 17:09
hadoop
mapreduce
【Hadoop】
MapReduce
编程案例-WordCount
一个完整的
MapReduce
程序在分布式运行时有三类实例进程:(1)MrAppMaster:负责整个程序的过程调度及状态协调。(2)MapTask:负责Map阶段的整个数据处理流程。
和风与影
·
2023-04-16 17:39
Hadoop
hadoop
mapreduce
大数据
MapReduce
的常见输入格式之CombineTextInputFormat
CombineTextInputFormat框架默认的TextInputFormat切片机制是对任务按文件规划切片,不管文件多小,都会是一个单独的切片,都会交给一个MapTask,这样如果有大量小文件,就会产生大量的MapTask,处理效率极其低下。1)应用场景:CombineTextInputFormat用于小文件过多的场景,它可以将多个小文件从逻辑上规划到一个切片中,这样,多个小文件就可以交给
秋名山车神不开车
·
2023-04-16 17:08
大数据
Hadoop
hadoop
mapreduce
MapReduce
wordcount案例测试代码
org.apache.hadoophadoop-common2.7.5org.apache.hadoophadoop-client2.7.5org.apache.hadoophadoop-hdfs2.7.5org.apache.hadoophadoop-
mapreduce
-client-core2.7.5junitjunitRELEASEjunitjunitRELEASEorg
桑丘紫言
·
2023-04-16 17:38
大数据
MapReduce
学习2-1:以官方wordcount实例为例的
MapReduce
程序学习
1实例演示与源码jar包反编译1.1wordcount实例运行测试1.2jar包反编译2hadoop的序列化类型2.1hadoop序列化类型解析2.1hadoop序列化类型解析常用序列化类型及其与Java类型的比较3编程规范与阶段解析3.1插件开发过程概述3.2Mapper阶段3.3Reducer阶段3.4Driver阶段4本地执行案例实操4.1wordcount.txt输入4.2Wordcoun
愿你被这个世界温暖相待
·
2023-04-16 17:07
#
MapReduce基础
mapreduce
hadoop
jar
big
data
java
MapReduce
经典案例--WordCount 代码(实测可以运行)
MapReduce
经典案例--WordCount代码一.
MapReduce
工作的三阶段1.Map阶段map阶段将要处理的任务切分成一个个的MapTask,每个MapTask各自计算自己负责计算的内容,也就是将计算分布式
夜空Sora
·
2023-04-16 17:37
java大数据处理
hadoop
大数据
分布式
mapreduce
java
MapReduce
经典案例wordcount
Driverpackage
MapReduce
r.wordcount;importorg.apache.hadoop.fs.Path;importorg.apache.hadoop.io.IntWritable
郝大侠001
·
2023-04-16 17:36
大数据基础
大数据基础
Hadoop
MapReduce
测试word count功能
在hadoop的
mapreduce
目录下自带有一个hadoop-
mapreduce
-examples-2.7.5.jar(官方已经为我们写好了用java实现wordcount的jar)可以用来测试wordcount
QYHuiiQ
·
2023-04-16 17:04
大数据之Hadoop
hadoop
MapReduce
之WordCount案例实操
目录前期准备:本机测试:mapper阶段:Reduce阶段:Driver类:集群测试:前期准备:因为
MapReduce
中案例比较多,所以需要单独创建一个工程准备工作创建工程后先改maven仓库的地址(创建工程后默认为
小唐同学(๑><๑)
·
2023-04-16 17:02
Hadoop
maven
java
mapreduce
最新hadoop大数据零基础入门新手学习视频教程
视频下载地址:http://t.cn/EfRxlga-------------------课程目录-------------------第一天hadoop的基本概念伪分布式hadoop集群安装hdfs
mapreduce
山泥若丶
·
2023-04-16 16:39
Hadoop之
Mapreduce
核心运行机制
目录概述
MapReduce
套路图
MapReduce
程序的运行mapTask的并行度MapTask并行度的决定机制切片机制MapTask并行度经验之谈ReduceTask并行度ReduceTask并行度决定机制正文概述一个完整的
多彩海洋
·
2023-04-16 12:29
hive 设置
mapreduce
job的内存大小
#map任务内存总大小set
mapreduce
.map.memory.mb=1524#map堆大小set
mapreduce
.map.java.opts=-Xmx1024m;set
mapreduce
.reduce.memory.mb
姜小嫌
·
2023-04-16 11:00
【Hive-优化】Hive的优化方式一(通过ClouderaManager进行参数优化)
的优化方式一(通过ClouderaManager进行参数优化)1)HDFS副本数2)Yarn基础配置2.1.nodemanager配置2.1.1.CPU配置2.1.2.内存配置2.1.3.本地目录2.2.
MapReduce
bmyyyyyy
·
2023-04-16 07:39
Hive
hive
hadoop
大数据
大数据1 简介
计算:完成海量数据的价值挖掘•传输:协助各个环节的数据传输2.大数据软件生态•存储:ApacheHadoopHDFS、ApacheHBase、ApacheKudu、云平台•计算:ApacheHadoop
MapReduce
像影子追着光梦游_
·
2023-04-16 02:18
大数据
hadoop
大数据
hdfs
大数据4 - 分布式计算
•计算:对数据进行处理,使用统计分析等手段得到需要的结果•分布式计算:多台服务器协同工作,共同完成一个计算任务2.分布式计算常见的2种工作模式•分散->汇总(
MapReduce
就是这种模式)•中心调度-
像影子追着光梦游_
·
2023-04-16 02:16
大数据
大数据
hadoop
mapreduce
spark shuffle·读写流程 和 rdd持久化
1.对比
mapreduce
和spark
mapreduce
里map的第3条就是说,比如我存了很多条数据,如果一条一条写进磁盘,肯定有很多次IO,我先归并到一个缓存里面再溢写磁盘。
代码健身摩托gucci上海
·
2023-04-15 20:54
spark
大数据
spark
分布式
spark分布式计算框架
MapReduce
是计算逻辑清晰的,只有两个步骤,任务是JVM进程级别,每执行到什么步骤去申请具体的资源。而spark根本不知道具体有几个stage,逻辑未知,每个人的jobstage等根本不知道。
代码健身摩托gucci上海
·
2023-04-15 20:23
spark
spark
大数据
分布式
MapReduce
MapReduce
特点–易于编程–良好的扩展性–高容错性–适合PB级以上海量数据的离线处理
MapReduce
的限制•不适合实时计算–要求毫秒级或者秒级内返回结果•不适合流式计算–
MapReduce
的输入数据集是静态的
ᥴꪮꪑρⱤꪮꪑłડꫀ
·
2023-04-15 15:47
oracle
Hadoop----
MapReduce
架构
MapReduce
MR原语:输入(格式化k,v)数据集—>map映射成一个中间数据集(k,v)---->reduce----->输出一个(k,v)值输出“相同”的key为一组,调用一次reduce方法,
奔腾的小野马~~
·
2023-04-15 15:46
数据分析
大数据之
MapReduce
框架简介
文章目录前言一、什么是分布式计算二、
MapReduce
简介(一)介绍(二)特点(三)局限性三、
MapReduce
编程(一)
MapReduce
架构体系(二)
MapReduce
工作执行流程总结前言#博学谷IT
敲键盘的杰克
·
2023-04-15 15:16
Hadoop
大数据
mapreduce
hadoop
MapReduce
的组成架构及工作原理
MapReduce
组成架构一个完整的
MapReduce
程序在分布式运行时有三类实例进程:1.MrAppMaster:负责整个程序的过程调度及状态协调。
敬畏自然.
·
2023-04-15 15:16
MapReduce
MapReduce
体系架构详解
1.什么是
MapReduce
?简言之,
mapreduce
一种可用于数据处理的以数据为中心(数据本地化)分布式编程模型,采用的是一种分而治之的思想,分为map和reduce两个阶段。
小雨滴滴滴的童鞋
·
2023-04-15 15:46
hadoop家族
大数据
mapreduce原理
MapReduce
简述
MapReduce
参考:https://www.cnblogs.com/lixiansheng/p/8942370.htmlhttps://baike.baidu.com/item/
MapReduce
/
会飞的bird
·
2023-04-15 15:15
分布式与云计算
mapreduce
【MR原理-1】
MapReduce
整体架构及工作机制
导读:1.HDFS架构2.
MapReduce
架构3.
MapReduce
作业的生命周期 Hadoop的核心两个组件分别是分布式文件系统和分布式计算框架
MapReduce
。
王小康walker
·
2023-04-15 15:44
Hadoop
MapReduce
hadoop
mapreduce
[ hadoop] Yarn架构
Yarn概述Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台,而
MapReduce
等运算程序则相当于运行于操作系统之上的应用程序。
bone_ds
·
2023-04-15 15:13
hadoop
hadoop
架构
big
data
Hadoop系列-
MapReduce
架构和工作原理简介(十一)
一、
MapReduce
简介
MapReduce
是Hadoop生态下面的计算层,它把任务分割成小任务并分发到集群的机器上并行执行。
Just Jump
·
2023-04-15 15:42
Hive
&
Hadoop
MapReduce工作原理
Hadoop 笔记(一) HDFS 和
MapReduce
体系结构
Hadoop1.x由Common、HDFS、
MapReduce
组成。Hadoop2.x由Common、HDFS、YARN、
MapReduce
组成。
笨蛋程序员
·
2023-04-15 15:11
Hadoop
hadoop
大数据
MapReduce
的体系结构
一
MapReduce
体系结构特点1分布式编程架构2以数据为中心,更看重吞吐率3分而治之4Map将一个任务分解成多个子任务5Reduce将分解后多个子任务分别处理,并将结果汇总为最终结果二相关举例1清点图书馆藏书
chengqiuming
·
2023-04-15 15:11
Hadoop
MapReduce
体系结构
hadoop-
mapreduce
基本架构
MapReduce
是一个分布式计算框架,主要由两部分组成:编程模型和运行时环境。
souy_c
·
2023-04-15 15:11
存储
hadoop
mapreduce
MapReduce
的架构及原理
MapReduce
是一种分布式计算模型,是Hadoop的主要组成之一,承担大批量数据的计算功能。
MapReduce
分为两个阶段:Map和Reduce。
dh026661
·
2023-04-15 15:11
大数据
数据结构与算法
[ hadoop]
MapReduce
架构
1
MapReduce
概述1.1定义
MapReduce
是一个分布式运算程序的编程框架,是用户开发“基于Hadoop的数据分析应用”的核心框架。
bone_ds
·
2023-04-15 15:39
hadoop
hadoop
mapreduce
架构
大数据技术系列文章目录
Hadoop系列之2、Zookeeper实操HadoopHadoop系列之-1、大数据介绍Hadoop系列之-2、HDFS分布式文件系统Hadoop系列之-3、HDFS高阶+实操Hadoop系列之-4、
MapReduce
技术武器库
·
2023-04-15 15:51
大数据专栏
kafka
spark
hive
flink
hadoop
Hive day01
/hive.apache.org2.Facebook(开源):去解决海量3.构建在hadoop之上的数据仓库hdfs:hive的数据是存储在hdfs之上的yarn:hive的作业可以跑在yarn之上的
mapreduce
姚circle
·
2023-04-15 13:59
hive
hive
大数据
大数据开发必备面试题Spark篇02
1、Spark与
MapReduce
的Shuffle的区别?
技术人小柒
·
2023-04-15 13:46
大数据开发
面试
Spark
大数据
spark
hadoop
大数据开发必备面试题Spark篇01
Hadoop底层使用
MapReduce
计算架构,只有map和reduce两种操作,表达能力比较欠缺,而且在MR过程中会重复的读写hdfs,造成大量的磁盘io读写操作,所以适合高时延环境下批处理计算的应用
技术人小柒
·
2023-04-15 13:16
大数据开发
面试
大数据
spark
hadoop
面试
hdfs
大数据开发必备面试题Spark篇合集
Hadoop底层使用
MapReduce
计算架构,只有map和reduce两种操作,表达能力比较欠缺,而且在MR过程中会重复的读写hdfs,造成大量的磁盘io读写操作,所以适合高时延环境下批处理计算的应用
技术人小柒
·
2023-04-15 13:44
面试
Spark
大数据开发
大数据
spark
hadoop
MapReduce
序列化之统计各部门员工薪资总和
MapReduce
序列化之统计各部门员工薪资总和文章目录
MapReduce
序列化之统计各部门员工薪资总和1.1实验目的1.2实验环境1.3需求描述1.4实验步骤1.4.1采用IDEA创建一个Maven工程
桑榆嗯
·
2023-04-15 10:26
mapreduce
java
大数据
1024程序员节
hadoop
数据科学之路(7)即席查询工具Impala
我们在前面两篇中介绍了数据仓库工具Hive,但是早期的Hive是依赖Hadoop的
MapReduce
进行并行数据处理,而
MapReduce
作为离线批处理计算框架的延时是非常高的,用Hive做实时交互式查询的等待一般都是在分钟级别
LiuShaodong
·
2023-04-15 08:07
104_es生产集群备份恢复之部署hadoop hdfs分布式文件存储系统
是什么的同学,简单的介绍,不会花太多时间,hadoop当前大数据领域的事实上的一个标准hadoophdfs,提供的是分布式的文件存储,数据存储hadoopyarn,提供的是分布式的资源调度hadoop
mapreduce
小山居
·
2023-04-15 05:56
MapReduce
理解
MapReduce
理解
MapReduce
原语句
MapReduce
原语:“相同”key的键值对为一组调用一次Reduce方法,方法内迭代这组数据进行计算。
冰可乐~
·
2023-04-15 01:38
Hadoop
mapreduce
hadoop
big
data
MapReduce
计算模型
在Hadoop中,用于执行
MapReduce
任务的机器角色有两个:JobTracker:用于调度工作的,初始化作业,分配作业,与TaskTracker进行通信,协调整个作业的执行TaskTracker:
董家二少
·
2023-04-15 00:37
分布式计算技术(上):经典计算框架
MapReduce
、Spark 解析
本篇我们介绍两个经典的计算框架
MapReduce
和Spark。—
MapReduce
批处理引擎—
MapReduce
是第一个比较成功的计算引擎,主要用于数据批处理。由于企业的大数据
星环科技
·
2023-04-14 12:01
mapreduce
spark
大数据
【Hadoop学习笔记】
文章目录Hadoop概述
MapReduce
概述
MapReduce
优点
MapReduce
缺点
MapReduce
大致流程:举一个简单的例子:HDFS概述HDFS的优点HDFS的缺点HDFS的数据读写过程YARN
枯鱼过河泣
·
2023-04-14 07:00
hadoop
big
data
学习
mapreduce
hdfs
【HDFS】HDFS学习笔记
HDFS优缺点HDFS常用配置HDFS常用命令一、HDFS是什么1.HADOOP1.0中有两个模块:Hadoop分布式文件系统HDFS(HadoopDistrbutedFileSystem)、分布式计算框架
MapReduce
Jessie_hhhhhzy
·
2023-04-14 07:24
HDFS
大数据
hdfs
Spark学习笔记
1.1Spark特点a.快速处理能力:Hadoop的
MapReduce
中间数据采用磁盘存储,而Spark优先使用内存避免大量的磁盘IO,极大的提高了计算速度;b.支持性强:Spark支持Java、Scala
zhglance
·
2023-04-14 03:39
Apache Hadoop 3.x高可用集群部署
Hadoop核心组件有:HDFS(分布式文件系统):解决海量数据存储YARN(作业调度和集群资源管理的框架):解决资源任务调度
MAPREDUCE
(分布式运算编程框架):解决海量数据计算hadoop集群规划准
freesharer
·
2023-04-14 02:11
bigdata
hadoop
大数据
Hadoop2.X之高可用简介及环境搭建
Hadoop2.0之高可用Hadoop2.0产生背景Hadoop1.0中HDFS和
MapReduce
在高可用、扩展性等方面存在问题HDFS存在的问题(2个)NameNode单点故障,难以应用于在线场景HA
瓜不田
·
2023-04-14 02:39
BigData
上一页
39
40
41
42
43
44
45
46
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他