E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
mapreduce运行日志
Hive基本架构和原理
同时,这个语言也允许熟悉
MapReduce
开发者的开发自定义的mapper和reducer来处理内建的mapper和reducer无法
盛装吾步
·
2023-04-01 02:58
hive
hive
架构
hadoop
数据倾斜及一些解决方法
主要表现为:在
mapreduce
程序执行时,reduce节点大部分执行完毕,但是有一个或者几个reduce节点运行很慢,导致整个程序的处理时间很长,这是因为某一个ke
hunter95671
·
2023-04-01 02:26
hive
spark
spark
big
data
大数据
数据仓库
读书笔记丨《数据产品经理修炼手册:从零基础到大数据产品实践》丨DAY4
[可以简单认为Hadoop=HDFS+
MapReduce
/spark+Pig/Hive]02.三驾马车二.HDFS:数据的存
Ray_Shawn
·
2023-04-01 02:17
读书笔记
大数据
hadoop
数据结构
数据仓库
hivesql的几种优化的方法
1.map的优化,job在maptask的过程时间较长set
mapreduce
.map.memory.mb=8240;set
mapreduce
.reduce.memory.mb=8240;sethive.merge.mapfiles
桔梗的犬夜叉
·
2023-04-01 02:42
Hive
hive
hadoop 找不到或无法加载主类org.apache.hadoop.
mapreduce
.v2.app.MRAppMaster
这个是因为在yarn执行
MapReduce
的使用找不到hadoop的classpath一般在shell中输入hadoopclasspath输出为/etc/hadoop/conf:/opt/cloudera
Helen_Cat
·
2023-04-01 01:42
python 日志处理 logging模块 使用 详细解析 整理 参考文档
logging模块是Python内置的标准模块,主要用于输出
运行日志
,可以设置输出日志的等级、日志保存路径、日志文件回滚等。
身价五毛
·
2023-03-31 23:23
python
logging
日志
数据分析
分布式数据库Hbase
HBase来源Hbase是BigTable的开源实现BigTable:分布式存储系统,最初是为了解决在大量数据下互联网的搜索问题特点:(1)架构在GFS上,使用GFS作为底层数据存储;(2)利用谷歌的
MapReduce
雨漪人
·
2023-03-31 22:26
HBase
大数据技术
分布式数据库
pm2基本使用
pm2特性自带热部署---当源文件更新线上项目也会自动重启后台运行---不会占用实时窗口会在后台运行服务信息查看---查看运行中程序的各项信息日志系统---可以随时查看程序的
运行日志
内置负载均衡---在
不知名架构师
·
2023-03-31 20:26
node.js
运维
前端
javascript
服务器
负载均衡
node.js
大数据数据传输 Sqoop (四)
二、Sqoop原理将导入或导出命令翻译成
mapreduce
程序来实现。在翻译出的map
weixin_35688430
·
2023-03-31 19:36
大数据
大数据技术之Sqoop——SQL to Hadoop
1.1工作机制将导入或导出命令翻译成
mapreduce
程序来实现。1.2
five小点心
·
2023-03-31 18:04
Hadoop
#
sqoop
大数据
sqoop
Hadoop 权威指南学习笔记(五)
MapReduce
的工作机制JobTracker对应于NameNodeTaskTracker对应于DataNodeDataNode和NameNode是针对数据存放来而言的JobTracker和TaskTracker
Mingsheng Zhang
·
2023-03-31 17:39
大数据
hadoop
MapReduce
在Yarn上执行流程
目录1、执行流程2、Yarn核心组件功能1、执行流程首先,ResourceManager会为每一个application(比如一个用户提交的
MapReduce
job)在NodeManager里面申请一个
It.explorer
·
2023-03-31 17:06
hadoop
hadoop
初识MR 初识YARN 初识ZooKeeper
学习目标:初识MR初识YARN初识ZooKeeper学习内容:MR(
MapReduce
)什么是MR一个并行计算框架,将一个大文件拆分成一个个小任务,使执行更加效率。
A NIHUAN
·
2023-03-31 17:01
hadoop集群生态的搭建
分布式
大数据
hadoop
java
Yarn与ZooKeeper
Yarn与ZooKeeperYarn是
MapReduce
引入的资源管理器,它的出现为集群在资源利用率、资源统一管理和数据共享等方面带来了巨大好处。
shi_zi_183
·
2023-03-31 16:42
大数据学习
zookeeper
hadoop
big
data
互联网公司常用四大中间件 | 搜索中间件&缓存中间件
大型互联网公司项目请求响应处理:远端通过访问Web->检索->缓存->HBase->
MapReduce
->HDFS2.缓存中间件:Redis缓存常用方法大家都比较
国林哥
·
2023-03-31 16:24
架构设计
架构
java
Presto架构原理
与
MapReduce
Job相比,OLAP引擎常通过SQL的形式
Popcorn丶30
·
2023-03-31 12:36
大数据
Spark性能调优实战--精华总结-极客时间 吴磊
一.spark原理1.spark和
mapReduce
的区别
MapReduce
计算模型最大的问题在于,所有操作之间的数据交换都以磁盘为媒介。
紫金小飞侠
·
2023-03-31 12:47
#
Spark
MapReduce
怎么优雅地实现全局排序
思考想到全局排序,是否第一想到的是,从map端收集数据,shuffle到reduce来,设置一个reduce,再对reduce中的数据排序,显然这样和单机器并没有什么区别,要知道
mapreduce
框架默认是对
Hoult_吴邪
·
2023-03-31 12:44
Sqoop理论知识:介绍-产生背景-架构-数据导入导出流程
是一个
MapReduce
的代码框架。可以实现数据在关系型数据库和Hadoop之间的相互导入和导出。
weixin_49334432
·
2023-03-31 11:32
Sqoop
sqoop
大数据
Azkaban知识点入门
一azkaban的简介1.1调度系统背景1.一个完整的大数据分析系统通常都是由大量任务单元组成:shell脚本程序,
mapreduce
程序、hive脚本、spark程序等。
南潇如梦
·
2023-03-31 11:30
大数据那些事
hadoop
big
data
大数据
Hadoop 2.x组成
MapReduce
:一个分布式的资源调度和离线并行计算框架。Yarn:基于HDFS。用于作业调度和集群资源管理的框架。
weixin_44389390
·
2023-03-31 09:32
Hadoop
Hadoop2
大数据
hadoop 2.x HDFS系统架构详解
Hadoop2.0的核心架构,HDFS2、YARN、
MapReduce
和其他。
辰阳星宇
·
2023-03-31 09:38
#
Hadoop
hadoop
hdfs
big
data
【大数据】【Hadoop】4、Hadoop系统的组成(Hadoop2.x)
文章目录Hadoop2.X简介;一、容器二、节点管理器三、资源管理器四、应用程序管理器五、YARN请求分解Hadoop2.X简介;Hadoop2.0,经常被称为
MapReduce
2.0(MRv2)或者YARN
jts2015
·
2023-03-31 09:16
hadoop
大数据
YARN
hadoop
big
data
mapreduce
HDFS原理与应用
1HDFS基本介绍一些基本概念:在Hadoop中,HDFS是存储层,YARN是调度层,
MapReduce
是应用层HDFS是Hadoop分布式文件系统(HadoopDistributedFileSystem
Popcorn丶30
·
2023-03-31 09:10
hadoop
hdfs
大数据
大数据平台架构及主流技术栈
Google的三篇论文GFS(2003),
MapReduce
(2004),Bigtable(2006)为大数据技术奠定了理论基础。随后,基于这三篇论文的开源实现Hadoop被各个互联网公司广泛使用。
Alex_81D
·
2023-03-31 07:47
大数据从入门到精通
大数据
Hadoop本地运行模式(Grep案例和WordCount 案例)
目录前言运行官方Grep案例1.在当前用户主(HOME)目录下面创建一个input目录2.将Hadoop的xml配置文件复制到input3.执行share目录下的
MapReduce
程序4.查看输出结果运行官方
全栈ing小甘
·
2023-03-31 06:06
大数据
大数据
hadoop
云原生大数据架构中实时计算维表和结果表的选型实践
一前言传统的大数据技术起源于Google三架马车GFS、
MapReduce
、Bigtable,以及其衍生的开源分布式文件系统HDFS,分布式计算引擎
MapReduce
,以及分布式数据库HBase。
阿里云技术
·
2023-03-31 02:53
big
data
hive
hadoop
hadoop之
MapReduce
MR核心编程思想:MR一般需要分成两个阶段,Map和reduce,map阶段,maptask完全并行运行,互不干扰,reduce阶段,reducetask完全不互相干,但是他们的数据依赖于上一个阶段的所有的maptask输出的结果,MR进程:MrAppMaster:负责整个程序的过程调度,计算Maptask的个数Maptask:负责map阶段的数据处理Reducetask:负责reduce阶段的数
USTC_IT
·
2023-03-31 02:16
Hive对比传统数据库区别
Hive对比传统数据库①Hive和关系数据库存储文件系统不同,Hive使用的是hadoop的HDFS(hadoop的分布式文件系统),关系数据库则是服务器本地的文件系统;②Hive使用的计算模型是
MapReduce
栗子呀!
·
2023-03-31 01:30
大数据知识点汇总
大数据
hive
hadoop
数据库
Hive与传统数据库的比较
Hive通过把HiveSQL进行解析和转换,最终生成一系列在hadoop上运行的
mapreduce
任务,通过执行这些任务完成数据分析与处理。
糖潮丽子
·
2023-03-31 01:58
大数据
hive
hadoop
数据仓库
Hive对比传统数据库
①Hive和关系数据库存储文件系统不同,Hive使用的是hadoop的HDFS(hadoop的分布式文件系统),关系数据库则是服务器本地的文件系统;②Hive使用的计算模型是
MapReduce
,而关系数据库则是自己设计的计算模型
Cynicism_Kevin
·
2023-03-31 01:46
hive
数据库
hadoop
Java大数据开发Hadoop
MapReduce
目录1MapRedcue的介绍1.1
MapReduce
定义1.2
MapReduce
的思想1.3
MapReduce
优点1.4
MapReduce
的缺点1.5
MapReduce
进程1.6
MapReduce
-WordCount2Hadoop
·
2023-03-31 01:18
hive的介绍及与传统关系型数据库(mysql)的区别
hive的介绍什么是hive:Hive是基于hadoop的一个数据仓库工具,实质就是一款基于hdfs的
MapReduce
计算框架,对存储在HDFS中的数据进行分析和管理。
JDK1.8.0
·
2023-03-31 01:11
大数据
hive
hive架构和原理以及与传统数据库的区别
如果执行引擎是
MapReduce
的话,hive会将Hql翻译成MR进行数据的计算。用户可以使用命
ChlinRei
·
2023-03-31 01:10
Hive
hive
架构
大数据
数据仓库
数据产品经理有必要了解的
MapReduce
本文是Hadoop组件之
MapReduce
的学习总结性文章。因本人非技术出身,所学均来源于网络,难免有不严谨甚至错误之处,恳请大家指正。
顺子哥66的
·
2023-03-31 00:49
大数据技术原理与应用 笔记 第2章 大数据处理架构Hadoop
大数据处理架构HadoopHadoop发展历程Hadoop起源Hadoop特点Hadoop应用现状不同版本Hadoop项目结构Hadoop集群的部署和使用集群硬件配置HDFS
MapReduce
Hadoop
梦想是吃不完的格力高
·
2023-03-30 23:39
大数据开发
大数据技术原理与应用----大数据处理架构Hadoop
2、Hadoop的理论基础(1)Hadoop的两大核心①分布式文件系统(HDFS);②分布式并行编程框架(
MapReduce
);(2)Hadoop的特性①高可靠性;②高效性;③高可扩展性;④高容错性;⑤
wake D
·
2023-03-30 23:04
大数据学习
hadoop
架构
大数据
【Hadoop】Yarn 资源调度器
Hadoop
MapReduce
:基于Y
和风与影
·
2023-03-30 23:00
Hadoop
hadoop
yarn
了解大数据技术原理与应用(复习知识点)
目录①大数据(BigData)与云计算、物联网的相互关系②介绍Hadoop、
MapReduce
、HDFS和HBase以及其他功能组件,复习重点以及其他可用点!
登登登__
·
2023-03-30 23:20
大数据
hadoop
big
data
大数据技术原理与应用(第七章
MapReduce
)
目录7.1
MapReduce
简介
MapReduce
与传统并行计算框架对比
MapReduce
模型
MapReduce
策略
MapReduce
理念——计算向数据靠拢
MapReduce
架构——Master/SlaveMap
m0_37607242
·
2023-03-30 23:48
大数据
mapreduce
大数据技术原理与应用(第九章 数据仓库HIVE)
数据仓库的概念传统数据仓库面临的挑战9.2HIVE简介Hive适用于数据仓库的特点采用批处理方式处理海量数据提供适合数据仓库操作的工具Hadoop生态系统中Hive与其他部分的关系Hive依赖于HDFS存储数据Hive依赖于
MapReduce
m0_37607242
·
2023-03-30 23:48
hive
大数据
数据仓库
大数据技术原理与应用(第十章 Spark)
BDAS架构Spark生态系统组件的应用场景10.3Spark运行架构Spark基本概念和架构设计RDDDAGExecutorApplicationTaskJobStageSpark运行架构与Hadoop
MapReduce
m0_37607242
·
2023-03-30 23:48
spark
大数据
scala
大数据技术原理与应用(第二章 大数据处理架构Hadoop)
目录2.1Hadoop简介HDFS(分布式文件系统)
MapReduce
(分布式并行编程框架)Hadoop的特点Hadoop的应用编辑Hadoop版本的变化2.2Hadoop项目结构TezSparkHivePigOozieZookeeperHBaseFlumeSqoopAmbari2.3Hadoop
m0_37607242
·
2023-03-30 22:58
大数据
hadoop
架构
Hadoop(HDFS、Yarn、
MapReduce
、Zookeeper、Kafka、Flume、Storm、Spark) 知识点总结
以单词计数为例,简述
MapReduce
计算
皓洲
·
2023-03-30 21:02
大数据
Hadoop核心组件详解—HDFS、YARN、
MapReduce
Hadoop是一个开源的分布式计算和存储框架,它的作用非常简单,就是在多计算机集群环境中营造一个统一而稳定的存储和计算环境,并能为其他分布式应用服务提供平台支持,相当于在某种程度上将多台计算机组织成了一台计算机。Hadoop框架最根本的原理就是利用大量的计算机同时运算来加快大量数据的处理速度。Hadoop集群可运行于一般的商用服务器上,具有高容错、高可靠性、高扩展性等特点。适合一次写入,多次读取的
濛小万
·
2023-03-30 21:25
hadoop
hadoop
hdfs
mapreduce
yarn
redis之哨兵部署
运行日志
解读
转载自http://www.run-debug.com/?p=674192.168.110.21主192.168.110.31从#两台服务器都安装redis#下载最新稳定版本:http://redis.io/downloadwgethttp://download.redis.io/releases/redis-2.8.19.tar.gz#安装tar-zxvfredis-2.8.19.tar.gzc
weixin_30677073
·
2023-03-30 21:46
数据库
第四章大数据离线计算框架(
MapReduce
&YARN)
第四章大数据离线计算框架(
MapReduce
&YARN)一、
MapReduce
技术原理1.1
MapReduce
概述1.2Map函数和Reduce函数二、YARN技术原理2.1YARN的概述与应用2.2YARN
风起天澜、
·
2023-03-30 20:29
大数据原理与技术
大数据
mapreduce
Hadoop、
Mapreduce
、Spark概念
//blog.csdn.net/lbyyy/article/details/53334019https://blog.csdn.net/leanaoo/article/details/83153889
mapreduce
弦歌Charlie
·
2023-03-30 20:22
大数据基础
大数据-Hadoop中的HDFS架构、YARN架构、
MapReduce
架构
HDFS架构NameNode(nn):存储文件的元数据,如文件名,文件目录结构,文件属性(生成时间、副本数、文件权限),以及每个文件的块列表和块所在的DateNode等.DataNode(dn):在本地文件系统存储文件块数据,以及块数据的校验和.SecondaryNameNode(2nn):用来监控HDFS状态的辅助后台程序,每隔一段时间获取HDFS元数据的快照.YARN架构ResourceMan
hmyqwe
·
2023-03-30 20:35
大数据
大数据学习记录-Hadoop框架核心(HDFS、
MapReduce
、YARN)
该文章为lagou学习记录笔记,里面的资源和内容来自lagou,作为大数据菜鸡,如果内容部分有错误还请各位大佬指出并纠正,谢谢大数据技术解决的是什么问题?大数据技术解决的主要是海量数据的存储和计算大数据的定义:是指无法在一定时间内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式。大数据的特点:5v(volumn–大量、velocity–高速、variety–多样、veracity真实
对方还不是你的好友
·
2023-03-30 20:46
hadoop
big
data
mapreduce
hdfs
yarn
上一页
50
51
52
53
54
55
56
57
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他