E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfshadoop大数据
【HBase】——简介
1HBase定义 ApacheHBase™是以
hdfs
为数据存储的,一种分布式、可扩展的NoSQL数据库。
那时的样子_
·
2023-12-26 15:42
hbase
数据库
大数据
Hadoop集群部署
模板虚拟机安装JDK3模板虚拟机安装Hadoop4克隆虚拟机5虚拟机配置主机名称映射6集群分发脚本7SSH无密登陆配置8Hadoop集群配置8.1集群部署规划8.2修改配置文件8.2.1核心配置文件配置8.2.2
HDFS
程序员储物箱
·
2023-12-26 12:23
安装教程
hadoop
linux
Windows搭建
HDFS
2.6.0(附加搭建Hadoop)
1.环境操作系统:Windows7JDK版本:1.8.0_221Hadoop版本:2.6.02.下载Hadoop官网下载image.pngimage.png3.前期准备3.1.配置JAVA环境变量image.pngimage.png4.安装部署4.1.解压,提示报有错误发生不影响image.png4.2.更改配置文件hadoop-env.cmd-添加JAVA_HOME环境变量排坑:Windows环
夹胡碰
·
2023-12-26 11:20
Hadoop基础操作(学习笔记二)
本笔记按照以下四步进行:1、查看hadoop集群的基本信息http://master:50070/
HDFS
监控服务http://master:8088/cluster/nodes集群的计算资源信息http
Mecury_
·
2023-12-26 10:32
学习笔记
hadoop
大数据
hadoop3.0x 后要比spark快10倍!
Apachehadoop项目组最新消息,hadoop3.x以后将会调整方案架构,将Mapreduce基于内存+io+磁盘,共同处理数据其实最大改变的是
hdfs
,
hdfs
通过最近black块计算,根据最近计算原则
smileyboy2009
·
2023-12-26 10:56
hadoop
spark
内存
mapreduce
spark
hdfs
hadoop
Hive04_DDL操作
HiveDDL操作1DDL数据定义1.1创建数据库CREATEDATABASE[IFNOTEXISTS]database_name[COMMENTdatabase_comment][LOCATION
hdfs
_path
程序喵猴
·
2023-12-26 08:39
hive
hive
大数据
Hive05_DML 操作
overwrite]intotablestudent[partition(partcol1=val1,…)];(1)loaddata:表示加载数据(2)local:表示从本地加载数据到hive表;否则从
HDFS
程序喵猴
·
2023-12-26 08:02
hive
hive
大数据
Linux下配置伪分布式的Hadoop
安装jdk1.8,注意,jdk版本太高会导致hadoop无法正常启动和运行2下载hadoop3.1.3,并上传至服务器解压3编辑etc/hadoop/core-site.xmlfs.defaultFS
hdfs
qq_34324703
·
2023-12-26 05:49
分布式
linux
hadoop
Flume采集日志存储到
HDFS
1日志服务器上配置Flume,采集本地日志文件,发送到172.19.115.96的flume上进行聚合,如日志服务器有多组,则在多台服务器上配置相同的配置#Namethecomponentsonthisagenta1.sources=r1a1.sinks=k1a1.channels=c1#Describe/configurethesourcea1.sources.r1.type=TAILDIRa1
qq_34324703
·
2023-12-26 05:46
flume
hdfs
大数据
大数据技术——处理架构Hadoop
软件基金会旗下的一个开源分布式计算平台,为用户提供了系统底层细节透明的分布式基础架构•Hadoop是基于Java语言开发的,具有很好的跨平台特性,并且可以部署在廉价的计算机集群中•Hadoop的核心是分布式文件系统
HDFS
Imrea
·
2023-12-26 01:55
大数据
架构
hadoop
大数据——手把手教你
HDFS
搭建
第一步:在虚拟机上安装hadoop环境使用XFTP工具,将hadoop的linux版本压缩包导进linux系统的/opt文件夹下。第二步:解压hadoop命令:cd/opttar-zxvfhadoop*******-C/usr/local/解压hadoop压缩包到/usr/local/路径下解压成功以后看一下local下面的所有文件第三步:删除解压包里面的doc文档安装包在local文件夹下,需要
安安DE爸爸
·
2023-12-25 23:31
大数据
LINUX
HDFS
HDFS
hadoop
LINUX
04_hadoop_读取
hdfs
在本地统计单词并将结果放回
hdfs
1文件目录image.png2wordConfig.properties配置文件CLASS_BUSINESS=com.looc.D04
HDFS
单词计数.WordCountRealize
HDFS
_URL=
会摄影的程序员
·
2023-12-25 22:10
Hadoop学习笔记[6]-MapReduce与Yarn安装部署流程
NodeManager和DataNode一般都是1:1,主要是为了计算向数据移动,如果NM和DN分开,就得用网路拷贝数据,在Yarn的体系里NM也是从节点,既然其和DN是1:1的关系,所以配置中和
HDFS
kinglinch
·
2023-12-25 19:09
大数据
mapreduce
yarn
hadoop
大数据
flume 中sink用
hdfs
sink报拒绝连接错误
hdfs
-io
项目场景:提示:这里简述项目相关背景:使用flume,用
hdfs
sink问题描述提示:这里描述项目中遇到的问题:报错:WARN-org.apache.flume.sink.
hdfs
.
HDFS
EventSink.process
m0_58310854
·
2023-12-25 16:38
flume
hdfs
hadoop
flume
云计算与大数据之间的羁绊(期末不挂科版):云计算 | 大数据 | Hadoop |
HDFS
| MapReduce | Hive | Spark
文章目录前言:一、云计算1.1云计算的基本思想1.2云计算概述——什么是云计算?1.3云计算的基本特征1.4云计算的部署模式1.5云服务1.6云计算的关键技术——虚拟化技术1.6.1虚拟化的好处1.6.2虚拟化技术的应用——12306使用阿里云避免了高峰期的崩溃1.6.3虚拟化的关键特征1.6.4虚拟化的HA指的是什么?1.6.5服务器虚拟化1.6.6虚拟机迁移1.6.6.1虚拟机实时迁移对云计算
春人.
·
2023-12-25 14:59
春人闲谈
大数据
hadoop
云计算
HDFS
MapReduce
Nive
Hive
spark log4j日志配置
1.spark启动参数先把log4j配置文件放到
hdfs
:
hdfs
://R2/projects/log4j-debug.properties--confspark.yarn.dist.files=
hdfs
Mint6
·
2023-12-25 12:33
spark
spark
log4j
大数据
日志
debug
【美团大数据面试】大数据面试题附答案
目录1.
hdfs
读写流程解析2.
hdfs
副本机制,三副本原因,副本存放策略3.
hdfs
容错机制原理4.MapReduce执行流程详解5.spark和mr的区别6.TopN求法,大数据量无法完全写入内存解决方案
话数Science
·
2023-12-25 11:19
大数据
面试
大数据
面试
Kafka下沉到
HDFS
报错
错误信息24十二月202312:38:25,127INFO[SinkRunner-PollingRunner-DefaultSinkProcessor](org.apache.flume.sink.
hdfs
.
HDFS
CompressedDataStream.configure
Stephen6Yang
·
2023-12-25 07:12
hadoop
kafka
hdfs
安装Hadoop 3.3.5
常识科普:Kafka的存储与安装不依赖于
hdfs
/spark,从下边安装过程你可以得知这个信息。备注:
IT WorryFree
·
2023-12-25 06:03
hadoop
大数据
分布式
基于
Hadoop大数据
的物资数据可视化分析系统
大家可以帮忙点赞、收藏、关注、评论啦精彩专栏推荐订阅:在下方专栏JAVA实战项目文章目录JAVA实战项目一、项目介绍二、开发环境三、项目展示-基于
Hadoop大数据
的物资数据可视化分析系统四、代码展示五
晨曦编程
·
2023-12-25 05:11
python实战项目
大数据
hadoop
分布式
1024程序员节
spark
课程设计
python
YARN Hadoop2.0 区别
Hadoop2.0与HAdoop1.0的区别:Hadoop1.0主要由
HDFS
和MapReduce两个系统够长,但在Hadoop2.0中主要由HadoopCommon、
HDFS
、HadoopYARN和HadoopMapReduce2.0
omygodvv
·
2023-12-24 23:01
java
【Hadoop学习笔记】(二)——Hive的原理及使用
Hive数据仓库工具能为
HDFS
上的数据提供类似SQL的查询语言(HiveQL),并将SQL语句转变成MapReduce任务来执行。Hive明显降低了Hadoop的使用门槛,任何熟悉SQL的用
wanger61
·
2023-12-24 23:25
大数据开发
hadoop
hive
大数据
四、Hadoop学习笔记————各种工具用法
Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如:MySQL,Oracle,Postgres等)中的数据导进到Hadoop的
HDFS
weixin_30528371
·
2023-12-24 23:25
大数据
数据库
Hive学习笔记(1)——Hive原理初探
文章目录前言一、hive的特点二、hive体系架构及基本原理三、Hive的存储四、总结前言相信大家通过学习MapReduce,已经认识到hadoop利用多台廉价机器集群进行并行计算的优势,了解了
HDFS
Zhou.Y.M
·
2023-12-24 23:55
Hadoop
hive
hadoop
大数据
mapreduce
【Hive笔记】1——Hive入门
本质:将HQL转化为Mapreduce程序Hive处理的数据存储在
HDFS
,HIve分析数据底层的实现是Mapreduce,执行程序运行在Yarn上2.Hive的优缺点优点:操作接口采用类sql语法,提供快速开发能
sdut菜鸟
·
2023-12-24 23:55
hive
hive
hadoop
大数据
hadoop集群坏块处理
hadoop之
hdfs
数据块修复方法:1、手动修复#检查集群的健康状态
hdfs
fsck/#修复指定的
hdfs
数据块。也就是关闭打开的文件。
运维仙人
·
2023-12-24 21:39
hadoop
eclipse
大数据
【Hadoop】
HDFS
shell操作与管理工具
HDFS
shell操作
HDFS
管理工具dfsadminfsck均衡器
HDFS
shell操作
HDFS
是存取数据的分布式文件系统,对
HDFS
的操作就是文件系统的基本操作,如文件的创建、修改、删除、修改权限,
不怕娜
·
2023-12-24 18:41
hadoop
hdfs
npm
【Hadoop】YARN简介(YARN产生的技术需求/YARN的基本架构)
YARN产生的技术需求YARN的基本架构ResourceManagerNodeManagerApplicationMasterContainer
HDFS
与YARNYARN产生的技术需求YARN是Hadoopv2.0
不怕娜
·
2023-12-24 18:41
hadoop
架构
大数据
【Hadoop】
HDFS
简介——是什么/优缺点/适用场景
HDFS
是什么
HDFS
的优点/特性
HDFS
适用场景
HDFS
的缺点与不足
HDFS
不适用场景
HDFS
是什么源自Google的GFS论文Google于2003年10月发表
HDFS
是GFS的一个克隆版
HDFS
(
不怕娜
·
2023-12-24 18:11
hadoop
hdfs
大数据
WARNING: HADOOP_SECURE_DN_USER has been replaced by
HDFS
_DATANODE_SECURE_USER.
Hadoop启动时警告,但不影响使用,强迫症的我还是决定寻找解决办法WARNING:HADOOP_SECURE_DN_USERhasbeenreplacedby
HDFS
_DATANODE_SECURE_USER.UsingvalueofHADOOP_SECURE_DN_USER
玖玖1704
·
2023-12-24 12:59
hadoop
hdfs
大数据
hdfs
.DataStreamer: Exception in createBlockOutputStream XXXXX
java.io.IOException:Goterror,status=ERROR,statusmessage,ackwithfirstBadLinkas192.168.100.13:9866atorg.apache.hadoop.
hdfs
.protocol.datatransfer.DataTransferProtoUtil.checkBlockOpStatus
玖玖1704
·
2023-12-24 12:28
hdfs
hadoop
大数据
HBase基础知识(三):HBase架构进阶、读写流程、MemStoreFlush、StoreFile Compaction、Region Split
1.架构原理1)StoreFile保存实际数据的物理文件,StoreFile以HFile的形式存储在
HDFS
上。
依晴无旧
·
2023-12-24 11:59
大数据
hbase
数据库
大数据
【Hadoop篇08】Hadoop数据压缩
简洁而不简单Hadoop数据压缩数据压缩优点和缺点压缩技术能够有效减少底层存储系统(
HDFS
)读写字节数。压缩提高了网络带宽和磁盘空间的效率。
focusbigdata
·
2023-12-24 10:00
Hadoop学习笔记(一)分布式文件存储系统 ——
HDFS
概念
HDFS
(HadoopDistributedFileSystem),Hadoop分布式文件系统,用来存超大文件的。
zhang35
·
2023-12-24 08:54
大数据技术栈
大数据
分布式
Hadoop
入门
hdfs
大数据高级开发工程师——Hadoop学习笔记(1)
hadoop用户设置免密登录三台虚拟机安装jdkhadoop集群安装环境部署规划安装包下载查看hadoop支持的压缩方式以及本地库修改配置文件修改hadoop-env.sh修改core-site.xml修改
hdfs
-site.xml
讲文明的喜羊羊拒绝pua
·
2023-12-24 08:53
大数据
大数据
hadoop
hdfs
集群
zookeeper
Hadoop入门学习笔记——二、在虚拟机里部署
HDFS
集群
pwd=5ay8Hadoop入门学习笔记(汇总)目录二、在虚拟机里部署
HDFS
集群2.1.部署node1虚拟机2.2.部署node2和node3虚拟机2.3.初始化并启动Hadoop集群(格
faith瑞诚
·
2023-12-24 08:23
大数据
学习笔记
hadoop
学习
笔记
hadoop大数据
学习笔记
或者说将多台计算机组织成了一台计算机,让他们做同一件事,在这其中
HDFS
就相当于这台计算机的硬盘,而MapReduce就是这台计算机的CPU控制器。
驰宇爱吃鱼
·
2023-12-24 08:53
学习笔记
大数据
hadoop
学习
Hadoop学习之
HDFS
——小白入门笔记
(此处的计算机为普通计算机)3.分布式文件系统的多个节点分为两类:名称节点(主节点):文件、目录的操作(创建、删除、重命名等),数据节点与文件块的映射关系数据节点(从节点):数据的读取与存储二、
HDFS
cainiao22222
·
2023-12-24 08:52
hadoop
hdfs
hadoop
hdfs
hive企业级调优策略之CBO,谓词下推等优化
在Hive中,计算成本模型考虑到了:数据的行数、CPU、本地IO、
HDFS
IO、网络IO
Appreciate(欣赏)
·
2023-12-24 07:26
hive
hive
hadoop
数据仓库
Hadoop入门学习笔记——三、使用
HDFS
文件系统
pwd=5ay8Hadoop入门学习笔记(汇总)目录三、使用
HDFS
文件系统3.1.使用命令操作
HDFS
文件系统3.1.1.
HDFS
文件系统基本信息3.1.2.
HDFS
文件系统的2套命令体系
faith瑞诚
·
2023-12-24 07:39
大数据
学习笔记
hadoop
学习
笔记
7000字超详细讲解Hadoop、Spark、Storm、YARN,建议收藏!
核心内容包含
hdfs
和mapreduce。hadoop2.0以后引入yarn.
hdfs
是提供数据存储的,mapreduce是方便数据计算的。
套马杆的程序员
·
2023-12-24 04:49
Hive优化
Hive优化Hive的存储层依托于
HDFS
,Hive的计算层依托于MapReduce,一般Hive的执行效率主要取决于SQL语句的执行效率,因此,Hive的优化的核心思想是MapReduce的优化。
新鲜氧气
·
2023-12-23 22:26
大数据
#
hive
#
hadoop
hive
hadoop
数据仓库
ClickHouse(19)ClickHouse集成Hive表引擎详细解析
文章目录Hive集成表引擎创建表使用示例如何使用
HDFS
文件系统的本地缓存查询ORC输入格式的Hive表在Hive中建表在ClickHouse中建表查询Parquest输入格式的Hive表在Hive中建表在
张飞的猪大数据
·
2023-12-23 20:37
ClickHouse入门与实战
clickhouse
hive
数据仓库
大数据
数据库
浅谈Hadoop容错机制
简单介绍一下Hadoop中数据存储的可靠性和完整性,其中包括
HDFS
的容错机制、NameNode(元数据结点)的单点失效解决机制、Block数据块的多副本存储机制、NameNode与DataNode之间的心跳检测机制
小小少年Boy
·
2023-12-23 15:19
MINIO在java中的使用
对象存储可以充当主存储层,以处理Spark、Presto、TensorFlow、H2O.ai等各种复杂工作负载以及成为Hadoop
HDFS
的替代品--------引自官网的话。
IT小学僧
·
2023-12-23 14:48
MinIo
Java
java
spring
boot
通过
HDFS
API进行
HDFS
操作
HDFS
JavaAPI位于org.apache.hadoop.fs包中,这些API能够支持的操作包括打开文件、读写文件、删除文件等。Hadoop类库中最终面向用户提供的接口类是FileSystem。
CDHong.it
·
2023-12-23 14:30
Hadoop大数据
Java基础
hadoop
hdfs
大数据
Hadoop _
HDFS
_API 创建文件夹
在项目中src/main/java目录下,新建一个文件,命名为com.atguigu.
hdfs
创建文件夹在文件夹里输入代码,创建文件夹客户端代码常用套路1、获取一个客户端对象2、执行相关的操作指令3、关闭资源代码如下
笨鸟先-森
·
2023-12-23 14:29
hadoop
hdfs
java
Hadoop之
HDFS
的API操作
1、环境准备1.1、下载window版本的hadoop-3.1.01.2、配置HADOOP_HOME环境变量1.2、配置Path环境变量2、代码演示2.1、创建maven项目,导入pom坐标org.apache.hadoophadoop-client3.1.3junitjunit4.12org.slf4jslf4j-log4j121.7.302.2、日志配置log4j.rootLogger=INF
后端技术那点事
·
2023-12-23 14:28
大数据系列
hadoop
hdfs
big
data
Hadoop学习之
HDFS
(
HDFS
客户端及API操作)心得
HDFS
客户端及API操作:一、准备条件:1.配置环境变量HADOOP_HOME(路径要求非中文)2.验证环境变量,双击winutils.exe(报错可能是缺少微软运行库MSVCR120.dll)3.在
顺其自然的济帅哈
·
2023-12-23 14:58
Hadoop
hadoop
hdfs
大数据—Hadoop(四)_
HDFS
_03、客户端API
文章目录1、客户端环境准备1.1idea1.2window依赖2、
HDFS
的API案例实操2.1
HDFS
文件上传(测试参数优先级)2.1.1客户端代码常用套路2.1.2普通版2.1.3优化后2.1.4上传文件
大数据之负
·
2023-12-23 14:58
Hadoop
hadoop
hdfs
大数据
上一页
12
13
14
15
16
17
18
19
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他