E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop大数据学习
大数据开发必备工具——
Hadoop
及整体架构介绍
Hadoop
是一个由Apache软件基金会开发的开源Java软件框架,专为大数据处理设计,支持在大量计算机组成的集群上进行数据存储和分布式计算。
love6a6
·
2024-01-26 21:03
大数据
hadoop
架构
hadoop
-MR
1.MR执行原理1.MAP阶段在这里插入图片描述2.Reducer在这里插入图片描述3.shuffle阶段在这里插入图片描述2.实操1.导入maven配置org.apache.
hadoop
hadoop
-mapreduce-client-common2.7.1org.apache.
hadoop
hadoop
-mapreduce-client-core2.7.12
炽热_3a57
·
2024-01-26 19:06
Hadoop
3.1.1 HDFS 集群部署
Hadoop
3.1.1HDFS集群部署依赖服务系统优化查看ZooKeeper集群状态创建路径配置/etc/profile配置$
HADOOP
_HOME/etc/
hadoop
/
hadoop
-env.sh配置
JP.Hu
·
2024-01-26 19:37
Hadoop
hadoop
hdfs
大数据
hadoop
安装遇到的一些障碍
一.start-dfs.sh(开启不成功)原因:1.dadoop文件所属者与执行时登陆者不一致(权限不足)报错:WARNING:
HADOOP
_SECURE_DN_USERhasbeenreplacedbyHDFS_DATANODE_SECURE_USER.Usingvalueof
HADOOP
_SECURE_DN_USER.Startingnamenodeson
GetIdea
·
2024-01-26 18:30
指导手册05:MapReduce编程入门
指导手册05:MapReduce编程入门Part1:使用Eclipse创建MapReduce工程操作系统:Centos6.8,
hadoop
2.6.4情景描述:因为
Hadoop
本身就是由Java开发的,所以通常也选用
weixin_30655219
·
2024-01-26 17:56
大数据
Spark3学习笔记
文章目录一、Spark基础1、Spark概述1.1Spark简介1.2SparkVS
Hadoop
1.3Spark特点1.4Spark入门Demo2、Spark运行模式2.1概述2.2Local模式2.3Standalone
魅Lemon
·
2024-01-26 15:38
大数据
spark
Apache 辅助系统工具
一丶ApacheSqoop1.Sqoop的介绍:Sqoop的工作机制是将导入或者导出的命令翻译成MapReduce实现,Sqoop可以理解为:SQL到
Hadoop
或者
Hadoop
到SQL2.Sqoop的安装配置文件修改
月初,
·
2024-01-26 11:16
apache
centos同步服务器时间
不同步互联网查看所有节点ntpd服务状态sudosystemctlstatusntpdsudosystemctlstartntpdsudosystemctlis-enabledntpd查询自己的网段ipaddr修改
hadoop
102
热爱技术的小陈
·
2024-01-26 10:39
服务器
Java
大数据
服务器
centos
linux
Hadoop
3.x源码解析
文章目录一、RPC通信原理解析1、概要2、代码demo二、NameNode启动源码解析1、概述2、启动9870端口服务3、加载镜像文件和编辑日志4、初始化NN的RPC服务端5、NN启动资源检查6、NN对心跳超时判断7、安全模式三、DataNode启动源码解析1、概述2、初始化DataXceiverServer3、初始化HTTP服务4、初始化DN的RPC服务端5、DN向NN注册6、向NN发送心跳四、
魅Lemon
·
2024-01-26 09:54
大数据
hadoop
Hadoop
3.x学习笔记
文章目录一、
Hadoop
入门1、
Hadoop
概述1.1简介1.2
hadoop
优势1.3
hadoop
组成1.4大数据技术生态体系2、环境准备(重点)2.1模板机配置2.2模板创建3、本地运行模式(官方WordCount
魅Lemon
·
2024-01-26 09:24
大数据
hadoop
林浩然与
Hadoop
的奇幻数据之旅
林浩然与
Hadoop
的奇幻数据之旅LinHaoranandtheEnchantingDataJourneywith
Hadoop
在一个名为“比特村”的地方,住着一位名叫林浩然的程序员大侠。
howard2005
·
2024-01-26 09:20
大数据基础
hadoop
大数据
Hadoop
YARN 在快手的应用实践与技术演进之路
yarn的背景yarn大家都比较熟悉了,是从
Hadoop
1.0分离到2.0的比较重要的特性,把原来的jobtracker集中式调度变成yarn的二级调度,解决集群扩展性的问题。
yoku酱
·
2024-01-26 08:32
通过养猪给女朋友讲解
Hadoop
(一)
六、规章整治奈何桥程序员老王,阎王爷,黑白无常,牛头马面,孟婆。“铃铃铃~”刚躺下的老王又被电话吵醒了,老王接起电话,习惯性地说:“老板,又是哪个系统挂了啊。”“我不是你老板,我是阎王爷”电话那头传来沧桑的声音。“阎王爷,我上有老,下有小,我知道我这么加班不对,但我都是为了生计啊,恳请阎王爷再宽限我几年吧,我把房贷还完就下去报道。”老王哽咽地说着。“这次找你不是想结束你在人间的进程,只是想让你来地
程序员峰哥
·
2024-01-26 05:55
Flink1.13集成
Hadoop
3.x以上版本
文章目录背景说明出现问题问题分析问题解决解决展示参考资料背景说明在搭建Flink的HA高可用集群后,打不开webUI界面出现问题打开log日志查看org.apache.flink.core.fs.UnsupportedFileSystemSchemeException:Couldnotfindafilesystemimplementationforscheme'hdfs'.Theschemeisn
未来影子
·
2024-01-26 04:22
Flink
hadoop
hdfs
flink
flink1.13.0 环境搭建
#flink部署1.standalone模式2.yarn模式session-cluster模式job-cluster模式3.k8s模式注:yarn模式需要依赖
hadoop
环境,搭建请参考:https:/
AinUser
·
2024-01-26 04:50
flink
hadoop
flink
yarn
k8s
standalone
橘子皮的实习周记——第一周总结
一周小总结:目前入职上班时间一周,主要内容是对一个项目进行一些基础的添加操作(用领导A的话来说,就是熟悉一下业务),我最头疼的就是使用kafkahbase
hadoop
这些技术,对MySQL内的数据进行一个同步
程序员橘子皮
·
2024-01-26 03:35
java
Flink1.13.x+iceberg环境搭建
1.安装
hadoop
tar-zxvf
hadoop
-2.10.1.tar.gz配置JDK和
Hadoop
环境变量vi/etc/profileexportJAVA_HOME=/usr/lib/jvm/java
姚贤贤
·
2024-01-26 02:22
大数据
flink
hive
hadoop
iceberg
1.13
HDFS操作
文章目录主要内容1.编程实现以下指定功能,并利用
Hadoop
提供的Shell命令完成相同任务:一.shell命令行实现1.向HDFS中上传任意文本文件,如果指定的文件在HDFS中已经存在,则由用户来指定是追加到原有文件末尾还是覆盖原有的文件
K要努力
·
2024-01-26 02:43
算法与数据结构
hdfs
hadoop
大数据
eclipse
Hbase伪分布式的安装和配置
一、版本信息和环境1、版本信息:jdk1.8.0_112
hadoop
-2.6.0zookeeper-3.4.6hbase-1.2.6.12、环境
hadoop
+zookeeper+hbase,
hadoop
lukeyan
·
2024-01-26 00:41
大数据技术之Spark
1.2Sparkand
Hadoop
Hadoop
的MapReduce是大家广为熟知的计算框架,那为什么咱们还要学习新的计算框架Spark呢,这里简单说一下Spark和
Hadoop
的关系。
严同学正在努力
·
2024-01-25 21:38
大数据
spark
hadoop
apache
kafka
大数据开发之Spark(完整版)
第1章:Spark概述1.1什么是spark回顾:
hadoop
主要解决,海量数据的存储和海量数据的分析计算。spark是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。
Key-Key
·
2024-01-25 21:05
大数据
spark
分布式
弹性分布式数据集
hadoop
Hadoop
on Yarn 提交job失败:java.net.ConnectException:Connection refused
报错:INFOorg.apache.
hadoop
.service.AbstractService:ServiceNodeManagerfailedinstateSTARTED;cause:org.apache.
hadoop
.yarn.exceptions.YarnRuntimeException
Anthons
·
2024-01-25 20:58
sqoop之hive数据仓库和oracle数据库数据转换
sqoop(发音:skup)是一款开源的工具,主要用于在
Hadoop
(Hive)与传统的数据库(mysql、oracle)间进行数据的传递,可以将一个关系型数据库(例如:MySQL,Oracle,Postgres
Summer_1981
·
2024-01-25 20:37
spakr 提交任务
当前集群支持3中集群管理Standalone(spak框架自身拥有能力)ApacheMesos
Hadoop
YARNKubernetes使用/spark-submit脚本提交任务,脚本后面可以接参数.
新鲜氧气
·
2024-01-25 19:55
大数据
#
scala
#
spark
scala
spark
大数据
hadoop
问题集
1.org.apache.
hadoop
.yarn.exceptions.InvalidAuxServiceException:TheauxService:mapreduce_shuffledoesnotexistyarn
Pure_Eyes
·
2024-01-25 17:18
hadoop
大数据
分布式
大数据学习
之Redis、从零基础到入门(一)
目录一、Redis入门概述1.是什么?官方解释:2.能干嘛?2.1主流功能与应用2.1.1分布式缓存2.1.2内存存储和持久化(RDB+AOF)2.1.3高可用架构搭建2.1.4缓存穿透、击穿、雪崩2.1.5分布式锁2.1.6队列2.2总体功能概括2.3优势3.去哪下?官网地址:英文:中文:中文文档:下载安装包:其他文档资料:Redis源码地址:Redis在线测试:Redis命令参考:4.怎么玩?
十二点的泡面
·
2024-01-25 16:09
redis
大数据
学习
redis
大数据学习
之Redis、从零基础到入门(二)
二、Redis安装配置1.VMWare本地虚拟机VMWare准备的为64位查看自己的VMWare是32位还是64位getconfLONG_BIT2.Redis的安装2.1系统选择选择Linux系统2.2Linux版安装2.2.1Linux环境安装Redis必须先具备gcc编译环境①什么是gccgcc是linux下的一个编译程序,是C程序的编译工具GCC(GNUCompilerCollection)
十二点的泡面
·
2024-01-25 16:38
redis
大数据
学习
redis
大数据分析组件Hive-集合数据结构
Hive的数据结构前言一、array数组类型二、map键值对集合类型三、struct结构体类型前言Hive是一个基于
Hadoop
的数据仓库基础设施,用于处理大规模分布式数据集。
Aimyon_36
·
2024-01-25 15:15
Hive
数据分析
hive
数据结构
[AIGC 大数据基础]hive浅谈
Hive作为一个基于
Hadoop
的数据仓库基础设施,为用户提供了类SQL的查询语言和丰富的功能,使得处理大规模数据变得更加简单和高效。
程序员三木
·
2024-01-25 14:17
大后端
大数据
AIGC
hive
hadoop
集群部署
hadoop
简介
Hadoop
是一个由Apache基金会所开发的分布式系统基础架构,是一个存储系统+计算框架的软件框架,主要解决海量数据存储与计算的问题,是大数据技术中的基石。
Cat God 007
·
2024-01-25 12:45
笔记
大数据
大数据
hdfs
Hadoop
集群的部署,安装和管理(头歌)
示例集群信息以下表格为本教程所用示例集群节点信息:我们准备了三台虚拟服务器,连接方式如下:第一步我们需要在evassh服务器初始化虚拟服务器:cd/optwrapdockerulimit-funlimiteddockerload-iubuntu16-ssh.tardocker-composeup-d注意:请不要在各个虚拟服务器之间进行ssh登录,这种操作会导致无法保存配置数据。正确方法是:在虚拟服
小坏蛋儿&
·
2024-01-25 12:14
大数据
hadoop
服务器
linux
hadoop
集群规划部署
一、集群规划三台硬件资源,部署
hadoop
版本,
hadoop
-3.3.5,部署后配置文件。
Hadoop
配置文件分两类:默认配置文件和自定义配置文件。
Snower_2022
·
2024-01-25 12:43
hadoop
hadoop
java
大数据
Hbase集群安装部署
安装好对应版本的
hadoop
集群,并启动安装好对应版本的zookeeper集群,并启动HBase集群安装部署下载安装包并上传到node01服务器安装包下载地址:http://archive.cloudera.com
我还不够强
·
2024-01-25 12:02
详解Linux运维工程师高级篇(大数据安全方向).
hadoop
安全目录:kerberos(已发布)elasticsearch(已发布)http://blog.51cto.com/chenhao6/2113873knoxoozierangerapachesentry
weixin_30588729
·
2024-01-25 10:14
运维
操作系统
java
大数据
Hadoop
/Hive学习笔记一(基础概念)
大数据
Hadoop
/Hive学习笔记一(基础概念)一,概念介绍:大数据:大数据一般用来描述一种数量庞大,复杂的数据集,传统数据处理应用程序难以应对。
lucky_myj
·
2024-01-25 09:46
大数据
hadoop
Hadoop
-HDFS写流程(从命令行到完成)
一、简单回顾下HDFS的架构如果不了解HDFS的可以看下我写的一篇博客,这里先贴下官网架构图:二、源码分析源码中写的肯定是最真实的,下面是
hadoop
官方源码下载地址,我下载的是
hadoop
-3.2.4
隔着天花板看星星
·
2024-01-25 09:23
hadoop
hdfs
大数据
Hadoop
-HDFS高可用
原理参考官网介绍:Apache
Hadoop
3.3.6–HDFSHighAvailabilityUsingtheQuorumJournalManager二、背景在
Hadoop
2.0.0之前,NameNode
隔着天花板看星星
·
2024-01-25 09:52
hadoop
hdfs
大数据
Hadoop
-MapReduce使用说明
下面让我们跟着官网来学习下吧Apache
Hadoop
3.3.6–MapReduceTutorial二、运行流程大致描述1、用户通过jo
隔着天花板看星星
·
2024-01-25 09:52
hadoop
mapreduce
大数据
Hadoop
-YARN概览
一、什么是YARNYetAnotherResourceNegotiator,另一种资源协调者,简称YARN。基本思想是将资源管理和作业调度/监视的功能拆分为单独的守护进程。其想法是拥有一个全局ResourceManager(RM)和每个应用程序的ApplicationMaster(AM)。可以支持单个作业,也可以支持多个作业的DAG。被称为另一种资源协调者,那就证明有一种比YARN更早的资源协调者
隔着天花板看星星
·
2024-01-25 09:52
hadoop
大数据
分布式
Hadoop
-HDFS读流程(从输入命令到回显)
一、简单回顾下HDFS的架构如果不了解HDFS的可以看下我写的一篇博客,这里先贴下官网架构图:二、静静的思考一会儿爱因斯坦说过:想象力比知识更重要。想象力推动世界,是知识进化的源泉。我们先不看源码,先通过官方架构图和我们对HDFS的了解来想象下读流程是什么样的。我要读HDFS上的一份文件,首先需要知道它在哪台节点上,HDFS上存储的文件都是以块的形式存放在各个DataNode节点上。因此需要知道这
隔着天花板看星星
·
2024-01-25 09:52
hadoop
hdfs
大数据
Hadoop
-MapReduce-源码跟读-客户端篇
一、源码下载下面是
hadoop
官方源码下载地址,我下载的是
hadoop
-3.2.4,那就一起来看下吧Indexof/dist/
hadoop
/core二、从WordCount进入源码用idea将源码加载进来后
隔着天花板看星星
·
2024-01-25 09:52
hadoop
mapreduce
eclipse
hadoop
三种运行方式
一、本地运行方式1创建在
hadoop
-3.3.5文件下面创建一个wcinput文件夹[antares@
hadoop
1
hadoop
-3.3.5]$mkdirwcinput[antares@
hadoop
1
hadoop
Snower_2022
·
2024-01-25 09:51
hadoop
大数据
分布式
Hadoop
-MapReduce-跟着日志理解整体流程
一、数据准备viinput_01.txtviinput_02.txtviinput_03.txt文本内容如下:-----------------input_01.txt----------------javascalapythonc++javajsgogovbaccc++javascalapythonphpcsshtmljsjavajavascalavbac#.netRRRjava--------
隔着天花板看星星
·
2024-01-25 09:49
hadoop
mapreduce
大数据
HBase学习五:运维排障之备份与恢复
HBase的所有文件都存储在HDFS上,因此只要使用
Hadoop
提供的文件复制工具distcp将HBASE目录复制到同一HDFS或者其他HDFS的另一个目录中,就可以完成对源HBase集群的备份工作copyTable
Studying!!!
·
2024-01-25 09:49
中间件
hbase
学习
运维
大数据平台组件日常运维操作说明(
Hadoop
/Zookeeper/Kafa/ES/Mysql/Spark/Flume/Logstash/Tomcat)
Hadoop
日常运维操作说明hdfs生产环境
hadoop
为30台服务器组成的集群,统一安装配置,版本号为2.7.7部署路径:/opt/
hadoop
启动用户:
hadoop
配置文件:/opt/
hadoop
/
love6a6
·
2024-01-25 07:12
大数据
java-zookeeper
运维
基于CentOS7
Hadoop
-2.7.2伪分布式部署
1、基本环境Linux版本:CentOS7.0JDK版本:jdk-7u79-linux-x64.tar.gz
Hadoop
版本:
hadoop
-2.7.2.tar.gzjdk以及
Hadoop
安装在/usr目录下
程序员小H
·
2024-01-25 07:23
Hadoop
HDFS 实现原理图文详解
一、HDFS体系结构1.1HDFS简介
Hadoop
分布式文件系统(HDFS)是运行在通用硬件(commodityhardware)上的分布式文件系统(DistributedFileSystem)。
禅与计算机程序设计艺术
·
2024-01-25 07:49
Hive运行机制与使用
hive介绍hive是基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。
小猪Harry
·
2024-01-25 05:09
大数据运维到底是什么 又需要做些什么
疫情期间,大数据的广泛应用发挥了巨大的作用,作为新兴的IT领域技术,大数据行业受到越来越多的人关注,于是想要入行的、转行的纷纷选择
大数据学习
,那么大数据运维到底是什么?又需要做些什么?
科技资讯快报
·
2024-01-25 05:38
Spark基本架构及原理
Hadoop
和Spark的关系Spark运算比
Hadoop
的MapReduce框架快的原因是因为
Hadoop
在一次MapReduce运算之后,会将数据的运算结果从内存写入到磁盘中,第二次Mapredue
李飞_fd28
·
2024-01-24 20:50
上一页
10
11
12
13
14
15
16
17
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他