E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
研磨hadoop
二.
hadoop
环境搭建
image.png配置
hadoop
TODO格式化HDFS这一步操作,只是在第一次时执行,每次如果都格式化的话,那么HDFS上的数据就会被清空。
yanghx
·
2023-08-27 18:39
数据湖:解锁数据价值的新时代
数据湖采用扁平化存储结构,将数据以原始格式保存在大型分布式文件系统中,通常使用
Hadoop
或AWSS3等开源或云存储技术。
Walter Sun
·
2023-08-27 17:11
大数据
数据湖
大数据学习之MapReduce
1.MapReduce定义Mapreduce是一个分布式运算程序的编程框架,是用户开发“基于
hadoop
的数据分析应用”的核心框架。
在远方的你等我
·
2023-08-27 17:45
Hadoop
集群搭建(伪分布式)
集群搭建
hadoop
伪分布式软件准备:VMwareWorkstationProcentos7xshell5jdk-8u141-linux-x64.tar.gz
hadoop
-2.10.1.tar.gz一.
......786
·
2023-08-27 15:11
笔记
hadoop
大数据
centos
(二)大数据实战——
hadoop
的模板虚拟机搭建
前言在实际的开发过程中,我们的
hadoop
都是以集群的方式存在,该系列内容我们使用vmware工具构建我们的虚拟机,从而实现
hadoop
集群搭建。
北溟溟
·
2023-08-27 15:11
#
hadoop
大数据
大数据
hadoop
大数据项目实战(
Hadoop
集群搭建)
一,搭建大数据集群环境1.2
Hadoop
集群搭建1.2.1jdk安装1.下载jdk(1)在根目录下创建三个子目录以备后用。
瑾寰
·
2023-08-27 15:10
大数据
hadoop
java
mysql
sql
big
data
mac 下编译
hadoop
源码
本篇博客主要介绍社区版的
hadoop
源码的编译,以及会遇到的一些问题。
疯狂的哈丘
·
2023-08-27 13:28
Hadoop
-2.6.5完整安装配置过程
记录
Hadoop
-2.6.5完整安装配置过程一、
Hadoop
是什么?
syp_net
·
2023-08-27 13:38
系统开发
hadoop
mapreduce
搜索引擎
Hbase-spring-boot报错解决java.io.FileNotFoundException:
HADOOP
_HOME and
hadoop
.home.dir are unset.配置环境变量
报错信息为:报错描述:java.io.FileNotFoundException:java.io.FileNotFoundException:
HADOOP
_HOMEand
hadoop
.home.dirareunset
一单成
·
2023-08-27 12:48
Hbase
阿丹服务器配置
日常报错解决分析
hbase
数据库
大数据
Hadoop
完全分布模式安装
1准备工作1.1虚拟机规划版本:CentOSLinuxrelease7.6.1810VMware安装三台虚拟机192.168.159.133(linux-01.potato.com)NameNodeDataNodeResourceManagerNodeManager192.168.159.128(linux-02.potato.com)SecondaryNameNodeDataNodeNodeMa
Lugyedo
·
2023-08-27 12:48
Data
大数据
Hadoop
分布式安装
CentOS
VMware
Hbase-技术文档-spring-boot整合使用hbase--简单操作增删改查--提供封装高可用的模版类
HBase是一个分布式、可扩展的大数据存储系统,它基于Google的Bigtable模型,并使用了
Hadoop
分布式文件系统作为底层存储。HBase客户端库是用于与HBase数据库进行交互的工具库,
一单成
·
2023-08-27 12:47
Hbase
hbase
数据库
大数据
构建高可用ZK集群
由于ZooKeeper便捷的使用方式、卓越的性能和良好的稳定性,被广泛地应用于诸如
Hadoop
、HBase、Kafka和Dubbo等大型分布式系统中。本文的目标读者是对ZooKeepe
huangjinsheng1988
·
2023-08-27 12:05
jiagou
zookeeper
(填坑)(
Hadoop
)
HADOOP
_HOME and
hadoop
.home.dir are unset.
一.问题描述:windows本地调试
Hadoop
程序时报错错误信息:
HADOOP
_HOMEand
hadoop
.home.dirareunset.
Movle
·
2023-08-27 12:18
大数据时代之java操作hdsf
前面已经讲过
hadoop
伪分布式和分布式环境搭建,参考大数据时代之
Hadoop
集群搭建本来想直接搞java代码操作hdfs的,想了想还是先简单的复习下命令行操作hdfs吧。
小小的人儿居然已存在
·
2023-08-27 11:49
大数据
大数据
hadoop
hdfs
Hadoop
Hdfs基本命令
0目录1.
hadoop
安装问题处理2.hdfs基本命令3.上传/下载文件和文件夹1.
hadoop
安装问题处理如果安装有进程无法启动,如下图重新检查6个配置文件Core-site.xml\hdfs-site.xml
请给我一串代码好吗
·
2023-08-27 10:20
hadoop
数据库
Hadoop
(四)HDFS 读写流程
HDFS的读写流程 HDFS将文件切割为默认大小的块(block)存放在不同的DataNode上; 上传文件和读取文件是HDFS重要的流程;HDFS的写文件流程图文解释: 1、Client连接HDFS,发送上传文件的请求; 2、NameNode响应请求,对文件进行校验;校验成功后返回要存放文件的block所对应的DataNode的信息列表; 列如: block01:data
车了个车子
·
2023-08-27 10:48
Hadoop
hadoop
hdfs
big
data
Hadoop
之HDFS简介
前言
Hadoop
是由Apache基金会开发的分布式系统基础框架,主要解决海量数据存储和海量数据分析问题。
数新网络
·
2023-08-27 10:18
hadoop
大数据
hdfs
Hadoop
:HDFS读写流程详解
目录1HDFS写数据流程2HDFS读数据流程HDFS写数据流程1)客户端通过分布式文件系统模块向namenode请求上传某个数据(2)namenode根据客户端请求,先查看该用户是否有权限上传数据,再查看客户端所请求的目录是否存在。在namenode检查完全部后,给客户端一个可以上传的响应。(3)客户端听到可以上传的响应后,便开始上传第一个block,询问namenode数据存放在哪些datano
小M姐姐呀~
·
2023-08-27 10:17
大数据
hadoop
big
data
hdfs
Hadoop
笔记 HDFS读写流程
HDFS读写流程一、写流程二、读流程三、总结一、写流程(1)客户端通过DistributedFileSystem(我翻译成分布式文件系统?)模块向NameNode请求上传文件(会给定一个路径),然后NameNode检查目标文件是否存在,以及父目录是否存在。(2)NameNode返回是否可以上传。(3)客户端向NameNode请求上传第一个Block,向NameNode请求可以上传到哪几个DataN
程序员的账号
·
2023-08-27 10:47
大数据
hadoop
【
Hadoop
】HDFS读写流程和客户端命令使用
博主"开着拖拉机回家"带您GotoNewWorld.✨个人主页——开着拖拉机回家_Linux,Java基础学习,大数据运维-CSDN博客✨希望本文能够给您带来一定的帮助文章粗浅,敬请批评指正!感谢点赞和关注,每天进步一点点!加油!目录一、HDFS产出背景及定义1.1.HDFS产生背景1.2.HDFS简介1.3.HDFS的优缺点1、优点2、缺点二、HDFS的特点三、HDFS组成架构1、Client:
开着拖拉机回家
·
2023-08-27 10:17
#
【====
HDFS&YARN
====】
hadoop
HDFS读取流程
har
HDFS客户端
HDFS
shell
安全模式
实战:大数据Spark简介与docker-compose搭建独立集群
独立集群搭建安装docker和docker-composedocker-compose编排docker-compose编排并运行容器Spark集群官方案例测试写在最后前言很多同学都使用过经典的大数据分布式计算框架
hadoop
小沈同学呀
·
2023-08-27 09:28
spark
大数据
docker
大数据
spark
docker
Hadoop
2.10.1 HDFS 透明加密原理 + 实战 + 验证
hadoop
提供了几种不同形式的加密,最底层的加密,加密所有节点数据,有效地保护了数据,但是却缺乏更细粒度的加密;kms透明加密可以做到更细粒度的加密;加密可以在不同的层级进行,包括软件/软件堆栈,选择不同的加密层级各有优缺点应用程序级加密
_lizhiqiang
·
2023-08-27 08:37
Hadoop
hadoop
hdfs
linux
大数据领域如何理解 Merge、Combine和Aggregate
例如,Spark和
Hadoop
中的Join操作就是一种典型的合并操作。Merge操作有多种类型,例如I
_lizhiqiang
·
2023-08-27 08:07
大数据
hadoop
spark
Flink minicluster 报错,因为 JDK 版本引起的错误
2022-10-2415:06:58.411[ORC_GET_SPLITS#1]WARNorg.apache.
hadoop
.hdfs.client.impl.BlockReaderFactory-I/Oerrorconstructingremoteblockreader.java.io.IOException
_lizhiqiang
·
2023-08-27 08:36
Flink
1024程序员节
饿了么大数据计算引擎实践与应用
其中6人的离线团队需要维护大数据集群规模如下:
Hadoop
集群规模1300+HDFS存量数据40+PB,Read3.5PB+/天,Write500TB+/天14WMRJob/天,10WSparkJob/
Alukar
·
2023-08-27 08:39
Docker安装及Docker构建简易版
Hadoop
生态
一、首先在VM创建一个新的虚拟机将Docker安装好更新系统:首先打开终端,更新系统包列表。sudoapt-getupdatesudoapt-getupgrade下图是更新系统包截图安装Docker:使用以下命令在Linux上安装Docker。sudoapt-getinstall-ydocker.io启动Docker服务:使用以下命令启动Docker服务,我们通过ps命令可以看到docker服务的
、小H
·
2023-08-27 07:06
eureka
云原生
关于hive sql进行调优的理解
hive其实是基于
hadoop
的数据库管理工具,底层是基于MapReduce实现的,用户写的hivesql最终转换成MapReduce的任务运行在
hadoop
上,不过MapReduce会因为磁盘IO的问题会运行较慢
世润
·
2023-08-27 07:59
hive
hadoop
数据仓库
【大数据】图解
Hadoop
生态系统及其组件
图解
Hadoop
生态系统及其组件1.HDFS2.MapReduce3.YARN4.Hive5.Pig6.Mahout7.HBase8.Zookeeper9.Sqoop10.Flume11.Oozie12
G皮T
·
2023-08-27 05:27
#
Hadoop
大数据
hadoop
分布式
hdfs
mapreduce
yarn
hive
ZooKeeper 简介
概述ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是
Hadoop
和Hbase的重要组件。
程序员小薰
·
2023-08-27 05:14
其他分类
1024程序员节
zk
zookeeper
pycharm 配置 spark环境
2.安装
Hadoop
并配置环境变量:
hadoop
下载地址:Indexof/apache/
hadoop
/common解压
hadoop
-2.8.3.tar.gz特定路径,如:D:\
hadoop
-2.8.3添加系统变量
ROBOT玲玉
·
2023-08-27 03:09
python
spark
研磨
设计模式day09原型模式
目录场景代码实现有何问题解决方案代码改造模式讲解原型与new原型实例与克隆出来的实例浅度克隆和深度克隆原型模式的优缺点思考何时选用?相关模式场景代码实现定义订单接口packagecom.zsp.bike.day08原型模式;/***订单的接口*/publicinterfaceOrderApi{/***获取订单数量*@return*/publicintgetOrderProductNum();/**
可是我还饿啊
·
2023-08-27 03:05
设计模式
原型模式
java
研磨
设计模式day13组合模式
目录场景不用模式实现代码实现有何问题解决方案代码改造组合模式优缺点思考何时选用场景不用模式实现代码实现叶子对象packageday14组合模式;/***叶子对象*/publicclassLeaf{/***叶子对象的名字*/privateStringname="";/***构造方法,传入叶子对象的名字*/publicLeaf(Stringname){this.name=name;}/***输出叶子对
可是我还饿啊
·
2023-08-27 03:05
设计模式
组合模式
ClickHouse 与 Hbase的对比
HBase的架构对比2.1Hbase架构编辑2.2ClickHouse的架构编辑3基本操作对比3.1HBase3.2ClickHouse4数据查询操作5各维度对比1ClickHouse与Hbase的基础
hadoop
芋辕-
·
2023-08-27 01:05
大数据开发
hbase
hadoop
big
data
黑猴子的家:xshutdown.sh
"================正在关闭102103104集群==========="for((host=104;host>=102;host--));doecho-e"\n---$user@
hadoop
黑猴子的家
·
2023-08-27 01:31
机器学习及其matlab实现竞争神经网络与SOM神经网络进阶与提高视频教程
机器学习及其matlab实现竞争神经网络与SOM神经网络进阶与提高视频教程大数据,云计算,架构,数据分析师,
Hadoop
,Spark,Storm,Docker,Mapreduce,Kafka,Flume
平蝶与波澜
·
2023-08-27 01:56
爱上阳公子宝宝辅食,适合8个月以上的宝宝食用,苹果土豆泥
图片发自App营养价值有:给宝宝从单一的蔬菜或水果泥过渡到两种食材做成的泥,可以把蔬菜水果巧搭配在一起,土豆和苹果都是营养比较丰富食材,富含天然果糖的苹果,搭配口感绵软的土豆,
研磨
成泥状之后再一起加水熬煮一小会
破执从众
·
2023-08-26 22:33
豆浆不是所有的人都是喝的越多越好
不少女性便开始疯狂
研磨
各色豆浆每日三餐不重样的喝。门诊上也有不少病人问我:尹主任,是不是喝豆浆能帮助怀孕啊?
叫我大丽丽好了
·
2023-08-26 22:39
三张图讲清楚大数据基础设施
Hadoop
、Lambda、kappa架构
随着互联网的快速发展,越来越多的人涌入互联网,互联网自此进入大数据时代。在大数据时代之后,云计算、人工智能、物联网、5G技术的发展又将大数据的发展推向高潮。数据已经从最初的信息一步步的演变成了数据产品、数据资产。关于数据的处理技术,包含数据库、数据集市、数据仓库、数据湖、数据中台,每次数据处理的演进都代表着业务需求变化的趋势、技术的演进。除了数据处理方式在演进之外,数据处理的基础措施也在不断的演进
AI课工场
·
2023-08-26 19:58
【
Hadoop
】
Hadoop
入门概念简介
目录一、概述二、优点三、核心架构3.1、HDFS3.2、NameNode3.2、DataNode四、
Hadoop
发行版本4.1、Apache
Hadoop
4.2、CDP4.
开着拖拉机回家
·
2023-08-26 19:21
#
【====
HDFS&YARN
====】
hadoop
大数据
NameNode
DataNode
分布式文件系统
Ubuntu安装Hive,并使用Mysql作为元数据库
版本信息:Ubuntu:16.04JDK:1.8.0_144
Hadoop
:2.7.4Hive:2.1.1MySQL:5.7.22今天捣鼓了一下午关于
Hadoop
集群安装Hive,遇到了一些问题,在此记录下来
Hiwes
·
2023-08-26 17:12
Hive环境搭建_远程部署
Hive的远程部署图解安装步骤前提条件:成功安装了ZK,
Hadoop
,Mysql,JDK并启动启动
hadoop
和ZKZK启动:/export/server/zookeeper/bin/zkServer.shstart
hadoop
一氓
·
2023-08-26 16:37
大数据
hive
hadoop
大数据
hive mysql 远程_Hive配置 远程连接MySQL
因为hive是
Hadoop
的一个组件,作为数据厂库,hive的数据是存储在
Hadoop
的文件系统中的,hive为
Hadoop
提供SQL语句,是
Hadoop
可以通过SQL语句操作文件系统中的数据。
weixin_39733805
·
2023-08-26 16:07
hive
mysql
远程
Linux配置hive(远程模式)
首先:配置好三台虚拟机、免密、
hadoop
我这边用node、node1、node2远程模式:将hive中的相关进程比如hiveserver2或者metastore这样的进程单独开启,使用客户端工具或者命令行进行远程连接这样的服务
小果叮123
·
2023-08-26 16:36
大数据
hive
linux
hadoop
Hive学习之路 (五)hive使用beeline配置远程连接
hive以
hadoop
集群为基础,提供hdfs的SQL支持;hive一般可以以mysql为元数据存储,默认Derby;
hadoop
,hive安装自行百度吧;介绍hive的远程访问:未配置之前使用beeline
hello_world!
·
2023-08-26 16:06
bigdata
远程模式搭建Hive
在之前的博客中已经记录了三台节点搭建的
hadoop
集群,并在
hadoop
02上安装了hive,在
hadoop
03上安装了mysql。
QYHuiiQ
·
2023-08-26 16:35
大数据之Hadoop
hive
hadoop
mysql
livy 安装配置
spark:2.3.0livy:0.5.0下载bin包(下载的livy包的lib中
hadoop
的版本是2.7.3,可能会有问题!)
金刚_30bf
·
2023-08-26 16:45
研磨
设计模式day10中介者模式
目录场景思考解决思路模式讲解调用示意图中介者模式的优缺点中介者模式的本质何时选用场景如果没有主板,电脑各个配件怎么交互呢?有些配件接口不同,必须把数据接口进行转换才能匹配上,无敌复杂。有了主板之后就是下面这个样子思考软件开发中针对,内部复杂的我们可以找一个中介者,让中介者去处理这些事情。解决思路白话解析:1.分为中介者和同事两个层级。同事们都和我交互,而我知道怎么把同事的交互跟别人的串联起来,但单
可是我还饿啊
·
2023-08-26 14:03
设计模式
中介者模式
Yarn 和 Zookeeper
Yarn是
Hadoop
V2.0开始引入的一个组件,这个组件可以说是针对
Hadoop
1.0系统所爆露出的计算资源使用不合理等设计上的问题进行的修正和补
ZhangShiWen
·
2023-08-26 14:42
YARN资源管理框架论述
一、简介为了实现一个
Hadoop
集群的集群共享、可伸缩性和可靠性,并消除早期MapReduce框架中的JobTracker性能瓶颈,开源社区引入了统一的资源管理框架YARN。
Hello.Reader
·
2023-08-26 14:24
大数据
yarn
hadoop
SPARK RDD编程指南
RDDs可以由
Hadoop
文件系统中的一个文件创建,或在驱动程序中已经存在的scala集,然后转换它。用户会要求spark在内存中保留一个RDD,允许它被高效地跨并行操作重利用。
young光素族
·
2023-08-26 13:57
spark
上一页
110
111
112
113
114
115
116
117
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他