E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
研磨hadoop
YARN 工作原理
1、
Hadoop
2新增了YARN,YARN的引入主要有两个方面的变更:其一、HDFS的NameNode可以以集群的方式部署,增强了NameNode的水平扩展能力和高可靠性,水平扩展能力对应HDFSFederation
无羡爱诗诗
·
2024-01-27 13:43
一台虚拟机上的文件怎么复制给另一台虚拟机
1.想要将zookeeper文件复制给另一台虚拟机2.使用终端命令压缩该文件3.压缩完毕4.将压缩文件传至另一台虚拟机的
hadoop
账户上5.显示传送完毕6.文件已传送到另一台虚拟机上7.使用终端命令将压缩文件解压缩文件复制完毕
白嫖叫上我
·
2024-01-27 11:44
工具技巧
vmware
大数据
zookeeper
hadoop
深入浅出hdfs源码
1、
hadoop
基本介绍2、周边生态图3、hdfs读源码解析4、hdfs写源码解析5、hdfs副本机制解读6、hdfs常见管理源码解析7、hdfs高可用源码解析-ha8、hdfs监控源码解析-dnmetrics-nnmetrics
大数据之家
·
2024-01-27 10:39
hdfs
hadoop
大数据
2021-03-07
解决存储问题·MapReduce=====>解决计算问题·Yarn=====>资源协调者·Zookeeper=====>分布式应用程序协调服务·Flume=====>日志收集系统·Hive=====>基于
Hadoop
残月冷无声
·
2024-01-27 10:39
深入浅出hdfs-
hadoop
基本介绍
一、
Hadoop
基本介绍
hadoop
最开始是起源于ApacheNutch项目,这个是由DougCutting开发的开源网络搜索引擎,这个项目刚开始的目标是为了更好的做搜索引擎,后来Google发表了三篇未来持续影响大数据领域的三架马车论文
大数据之家
·
2024-01-27 10:03
hdfs
hadoop
大数据
Hadoop
三大核心组件,
hadoop
原理
Hadoop
的三大核心组件分别是:HDFS(
Hadoop
DistributeFileSystem):
hadoop
的数据存储工具。
你敢和我比剑吗
·
2024-01-27 09:03
hadoop
大数据
mapreduce
Hadoop
2.0架构及其运行机制,HA原理
文章目录一、
Hadoop
2.0架构1.架构图2.HA1)NameNode主备切换2)watcher监听3)脑裂问题3.组件1.HDFS2.MapReduce3.Yarn1.组件2.调度流程一、
Hadoop
2.0
Toner_唐纳
·
2024-01-27 09:30
大数据
Hadoop
原理及架构详解
###README本文是基于黑马程序员的
Hadoop
网课的前半部分整理的笔记,主要介绍了相关操作与组件架构。
Should·L
·
2024-01-27 09:25
大数据
hadoop
架构
大数据
Hadoop
与Spark横向比较【大数据扫盲】
大数据场景下的数据库有很多种,每种数据库根据其数据模型、查询语言、一致性模型和分布式架构等特性,都有其特定的使用场景。以下是一些常见的大数据数据库:1.**NoSQL数据库**:这类数据库通常用于处理大规模、非结构化的数据。它们通常提供简单的查询语言,并强调水平扩展和高可用性。例如:-**键值存储**:如Redis,AmazonDynamoDB-**列式存储**:如ApacheCassandra,
super_journey
·
2024-01-27 07:51
大数据
hadoop
spark
Hadoop
增加新节点环境配置(自用)
完成
Hadoop
集群增添一个新的节点配置(文中命名为)
Hadoop
106,没有进行继续为该节点分配身份职能的步骤1.在VMware中安装CentOS7新建虚拟机1.
革斤要加油
·
2024-01-27 07:50
专业课
hadoop
大数据
分布式
Hadoop
-MapReduce-MRAppMaster启动篇
一、源码下载下面是
hadoop
官方源码下载地址,我下载的是
hadoop
-3.2.4,那就一起来看下吧Indexof/dist/
hadoop
/core二、上下文在上一篇中已经将到:作业提交到ResourceManager
隔着天花板看星星
·
2024-01-27 07:20
hadoop
mapreduce
eclipse
企业级大数据安全架构(六)数据授权和审计管理
作者:楼高本节详细介绍企业级大数据架构中的第六部分,数据授权和审计管理1.Ranger简介ApacheRanger是一款被设计成全面掌管
Hadoop
生态系统的数据安全管理框架,为
Hadoop
生态系统众多组件提供一个统一的数据授权和管理界面
云掣YUNCHE
·
2024-01-27 07:30
企业级大数据安全架构
大数据
安全架构
安全
1分钟了解基于
Hadoop
的数据仓库工具Hive(附超实用示例)
Hive功能Hive是基于
Hadoop
构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在
Hadoop
分布式文件系统中的数据:可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL
yuyuyuyo
·
2024-01-27 05:53
Hbase2.1 集群搭建
>Hbase在大数据的体系中扮演着DB角色,不得不说是重要的一员,在上一篇,大猪已经给大家演示了[
Hadoop
3.2集群搭建](https://www.jianshu.com/p/3182aaff918d
kikiki5
·
2024-01-27 03:24
实时分析海量新数据的难点 和解决方案
解决方案:使用分布式计算和存储技术,如
Hadoop
、Spark、Kafka等,将数据分散存储在多个节点上,同时进行分布式计算和处理,以实现数据的实时处理和分析。2.数据质量的保障:海量新
云台095
·
2024-01-27 03:40
大数据的应用
大数据
[AIGC 大数据基础] 浅谈hdfs
HDFS(
Hadoop
DistributedFileSystem)是Apache
Hadoop
生态系统的一部分,是一个分布式文件系统。
程序员三木
·
2024-01-27 01:00
大后端
大数据
AIGC
hdfs
idea上搭建pyspark开发环境
1环境版本说明python版本:Anaconda3.6.5spark版本:spark-2.4.8-bin-
hadoop
2.7idea版本:2019.32环境变量配置2.1python环境变量配置将python.exe
jackyan163
·
2024-01-27 00:06
八.压缩和存储
8.1
Hadoop
源码编译支持Snappy压缩(了解)8.1.1资源准备1)CentOS联网配置CentOS能连接外网。
临时_01e2
·
2024-01-26 21:13
大数据开发必备工具——
Hadoop
及整体架构介绍
Hadoop
是一个由Apache软件基金会开发的开源Java软件框架,专为大数据处理设计,支持在大量计算机组成的集群上进行数据存储和分布式计算。
love6a6
·
2024-01-26 21:03
大数据
hadoop
架构
hadoop
-MR
1.MR执行原理1.MAP阶段在这里插入图片描述2.Reducer在这里插入图片描述3.shuffle阶段在这里插入图片描述2.实操1.导入maven配置org.apache.
hadoop
hadoop
-mapreduce-client-common2.7.1org.apache.
hadoop
hadoop
-mapreduce-client-core2.7.12
炽热_3a57
·
2024-01-26 19:06
Hadoop
3.1.1 HDFS 集群部署
Hadoop
3.1.1HDFS集群部署依赖服务系统优化查看ZooKeeper集群状态创建路径配置/etc/profile配置$
HADOOP
_HOME/etc/
hadoop
/
hadoop
-env.sh配置
JP.Hu
·
2024-01-26 19:37
Hadoop
hadoop
hdfs
大数据
hadoop
安装遇到的一些障碍
一.start-dfs.sh(开启不成功)原因:1.dadoop文件所属者与执行时登陆者不一致(权限不足)报错:WARNING:
HADOOP
_SECURE_DN_USERhasbeenreplacedbyHDFS_DATANODE_SECURE_USER.Usingvalueof
HADOOP
_SECURE_DN_USER.Startingnamenodeson
GetIdea
·
2024-01-26 18:30
指导手册05:MapReduce编程入门
指导手册05:MapReduce编程入门Part1:使用Eclipse创建MapReduce工程操作系统:Centos6.8,
hadoop
2.6.4情景描述:因为
Hadoop
本身就是由Java开发的,所以通常也选用
weixin_30655219
·
2024-01-26 17:56
大数据
Spark3学习笔记
文章目录一、Spark基础1、Spark概述1.1Spark简介1.2SparkVS
Hadoop
1.3Spark特点1.4Spark入门Demo2、Spark运行模式2.1概述2.2Local模式2.3Standalone
魅Lemon
·
2024-01-26 15:38
大数据
spark
Apache 辅助系统工具
一丶ApacheSqoop1.Sqoop的介绍:Sqoop的工作机制是将导入或者导出的命令翻译成MapReduce实现,Sqoop可以理解为:SQL到
Hadoop
或者
Hadoop
到SQL2.Sqoop的安装配置文件修改
月初,
·
2024-01-26 11:16
apache
centos同步服务器时间
不同步互联网查看所有节点ntpd服务状态sudosystemctlstatusntpdsudosystemctlstartntpdsudosystemctlis-enabledntpd查询自己的网段ipaddr修改
hadoop
102
热爱技术的小陈
·
2024-01-26 10:39
服务器
Java
大数据
服务器
centos
linux
Hadoop
3.x源码解析
文章目录一、RPC通信原理解析1、概要2、代码demo二、NameNode启动源码解析1、概述2、启动9870端口服务3、加载镜像文件和编辑日志4、初始化NN的RPC服务端5、NN启动资源检查6、NN对心跳超时判断7、安全模式三、DataNode启动源码解析1、概述2、初始化DataXceiverServer3、初始化HTTP服务4、初始化DN的RPC服务端5、DN向NN注册6、向NN发送心跳四、
魅Lemon
·
2024-01-26 09:54
大数据
hadoop
Hadoop
3.x学习笔记
文章目录一、
Hadoop
入门1、
Hadoop
概述1.1简介1.2
hadoop
优势1.3
hadoop
组成1.4大数据技术生态体系2、环境准备(重点)2.1模板机配置2.2模板创建3、本地运行模式(官方WordCount
魅Lemon
·
2024-01-26 09:24
大数据
hadoop
林浩然与
Hadoop
的奇幻数据之旅
林浩然与
Hadoop
的奇幻数据之旅LinHaoranandtheEnchantingDataJourneywith
Hadoop
在一个名为“比特村”的地方,住着一位名叫林浩然的程序员大侠。
howard2005
·
2024-01-26 09:20
大数据基础
hadoop
大数据
Hadoop
YARN 在快手的应用实践与技术演进之路
yarn的背景yarn大家都比较熟悉了,是从
Hadoop
1.0分离到2.0的比较重要的特性,把原来的jobtracker集中式调度变成yarn的二级调度,解决集群扩展性的问题。
yoku酱
·
2024-01-26 08:32
通过养猪给女朋友讲解
Hadoop
(一)
六、规章整治奈何桥程序员老王,阎王爷,黑白无常,牛头马面,孟婆。“铃铃铃~”刚躺下的老王又被电话吵醒了,老王接起电话,习惯性地说:“老板,又是哪个系统挂了啊。”“我不是你老板,我是阎王爷”电话那头传来沧桑的声音。“阎王爷,我上有老,下有小,我知道我这么加班不对,但我都是为了生计啊,恳请阎王爷再宽限我几年吧,我把房贷还完就下去报道。”老王哽咽地说着。“这次找你不是想结束你在人间的进程,只是想让你来地
程序员峰哥
·
2024-01-26 05:55
Flink1.13集成
Hadoop
3.x以上版本
文章目录背景说明出现问题问题分析问题解决解决展示参考资料背景说明在搭建Flink的HA高可用集群后,打不开webUI界面出现问题打开log日志查看org.apache.flink.core.fs.UnsupportedFileSystemSchemeException:Couldnotfindafilesystemimplementationforscheme'hdfs'.Theschemeisn
未来影子
·
2024-01-26 04:22
Flink
hadoop
hdfs
flink
flink1.13.0 环境搭建
#flink部署1.standalone模式2.yarn模式session-cluster模式job-cluster模式3.k8s模式注:yarn模式需要依赖
hadoop
环境,搭建请参考:https:/
AinUser
·
2024-01-26 04:50
flink
hadoop
flink
yarn
k8s
standalone
橘子皮的实习周记——第一周总结
一周小总结:目前入职上班时间一周,主要内容是对一个项目进行一些基础的添加操作(用领导A的话来说,就是熟悉一下业务),我最头疼的就是使用kafkahbase
hadoop
这些技术,对MySQL内的数据进行一个同步
程序员橘子皮
·
2024-01-26 03:35
java
Flink1.13.x+iceberg环境搭建
1.安装
hadoop
tar-zxvf
hadoop
-2.10.1.tar.gz配置JDK和
Hadoop
环境变量vi/etc/profileexportJAVA_HOME=/usr/lib/jvm/java
姚贤贤
·
2024-01-26 02:22
大数据
flink
hive
hadoop
iceberg
1.13
HDFS操作
文章目录主要内容1.编程实现以下指定功能,并利用
Hadoop
提供的Shell命令完成相同任务:一.shell命令行实现1.向HDFS中上传任意文本文件,如果指定的文件在HDFS中已经存在,则由用户来指定是追加到原有文件末尾还是覆盖原有的文件
K要努力
·
2024-01-26 02:43
算法与数据结构
hdfs
hadoop
大数据
eclipse
Hbase伪分布式的安装和配置
一、版本信息和环境1、版本信息:jdk1.8.0_112
hadoop
-2.6.0zookeeper-3.4.6hbase-1.2.6.12、环境
hadoop
+zookeeper+hbase,
hadoop
lukeyan
·
2024-01-26 00:41
大数据技术之Spark
1.2Sparkand
Hadoop
Hadoop
的MapReduce是大家广为熟知的计算框架,那为什么咱们还要学习新的计算框架Spark呢,这里简单说一下Spark和
Hadoop
的关系。
严同学正在努力
·
2024-01-25 21:38
大数据
spark
hadoop
apache
kafka
大数据开发之Spark(完整版)
第1章:Spark概述1.1什么是spark回顾:
hadoop
主要解决,海量数据的存储和海量数据的分析计算。spark是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。
Key-Key
·
2024-01-25 21:05
大数据
spark
分布式
弹性分布式数据集
hadoop
Hadoop
on Yarn 提交job失败:java.net.ConnectException:Connection refused
报错:INFOorg.apache.
hadoop
.service.AbstractService:ServiceNodeManagerfailedinstateSTARTED;cause:org.apache.
hadoop
.yarn.exceptions.YarnRuntimeException
Anthons
·
2024-01-25 20:58
sqoop之hive数据仓库和oracle数据库数据转换
sqoop(发音:skup)是一款开源的工具,主要用于在
Hadoop
(Hive)与传统的数据库(mysql、oracle)间进行数据的传递,可以将一个关系型数据库(例如:MySQL,Oracle,Postgres
Summer_1981
·
2024-01-25 20:37
spakr 提交任务
当前集群支持3中集群管理Standalone(spak框架自身拥有能力)ApacheMesos
Hadoop
YARNKubernetes使用/spark-submit脚本提交任务,脚本后面可以接参数.
新鲜氧气
·
2024-01-25 19:55
大数据
#
scala
#
spark
scala
spark
大数据
hadoop
问题集
1.org.apache.
hadoop
.yarn.exceptions.InvalidAuxServiceException:TheauxService:mapreduce_shuffledoesnotexistyarn
Pure_Eyes
·
2024-01-25 17:18
hadoop
大数据
分布式
【诗】夕阳落下时见猫
图:小倩星恰如其分丢了钥匙来到庭院的亭子坐在冰凉的长椅上短暂的休憩怀里抱着木心的诗看他的南欧速写和俄国记事
研磨
他诗里奇怪的字母NMHLAW和B天色渐渐成灰成白高楼林立成黑白线条与天空颜色对照就格外的分明想酝酿一首诗时就看看木心的支言片语天气冻人冻的缓慢当看见一只黄白花猫蹑手蹑脚又好奇的看我时这画面使我感激强忍着镇定不去扰它的好奇故作认真的正襟危坐再回头花猫已然不见踪影天色暗下来就连树也都成了墨色我
小倩星
·
2024-01-25 15:51
大数据分析组件Hive-集合数据结构
Hive的数据结构前言一、array数组类型二、map键值对集合类型三、struct结构体类型前言Hive是一个基于
Hadoop
的数据仓库基础设施,用于处理大规模分布式数据集。
Aimyon_36
·
2024-01-25 15:15
Hive
数据分析
hive
数据结构
[AIGC 大数据基础]hive浅谈
Hive作为一个基于
Hadoop
的数据仓库基础设施,为用户提供了类SQL的查询语言和丰富的功能,使得处理大规模数据变得更加简单和高效。
程序员三木
·
2024-01-25 14:17
大后端
大数据
AIGC
hive
hadoop
集群部署
hadoop
简介
Hadoop
是一个由Apache基金会所开发的分布式系统基础架构,是一个存储系统+计算框架的软件框架,主要解决海量数据存储与计算的问题,是大数据技术中的基石。
Cat God 007
·
2024-01-25 12:45
笔记
大数据
大数据
hdfs
Hadoop
集群的部署,安装和管理(头歌)
示例集群信息以下表格为本教程所用示例集群节点信息:我们准备了三台虚拟服务器,连接方式如下:第一步我们需要在evassh服务器初始化虚拟服务器:cd/optwrapdockerulimit-funlimiteddockerload-iubuntu16-ssh.tardocker-composeup-d注意:请不要在各个虚拟服务器之间进行ssh登录,这种操作会导致无法保存配置数据。正确方法是:在虚拟服
小坏蛋儿&
·
2024-01-25 12:14
大数据
hadoop
服务器
linux
hadoop
集群规划部署
一、集群规划三台硬件资源,部署
hadoop
版本,
hadoop
-3.3.5,部署后配置文件。
Hadoop
配置文件分两类:默认配置文件和自定义配置文件。
Snower_2022
·
2024-01-25 12:43
hadoop
hadoop
java
大数据
Hbase集群安装部署
安装好对应版本的
hadoop
集群,并启动安装好对应版本的zookeeper集群,并启动HBase集群安装部署下载安装包并上传到node01服务器安装包下载地址:http://archive.cloudera.com
我还不够强
·
2024-01-25 12:02
上一页
10
11
12
13
14
15
16
17
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他