E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfs
04_hadoop_读取
hdfs
在本地统计单词并将结果放回
hdfs
1文件目录image.png2wordConfig.properties配置文件CLASS_BUSINESS=com.looc.D04
HDFS
单词计数.WordCountRealize
HDFS
_URL=
会摄影的程序员
·
2023-12-25 22:10
Hadoop学习笔记[6]-MapReduce与Yarn安装部署流程
NodeManager和DataNode一般都是1:1,主要是为了计算向数据移动,如果NM和DN分开,就得用网路拷贝数据,在Yarn的体系里NM也是从节点,既然其和DN是1:1的关系,所以配置中和
HDFS
kinglinch
·
2023-12-25 19:09
大数据
mapreduce
yarn
hadoop
大数据
flume 中sink用
hdfs
sink报拒绝连接错误
hdfs
-io
项目场景:提示:这里简述项目相关背景:使用flume,用
hdfs
sink问题描述提示:这里描述项目中遇到的问题:报错:WARN-org.apache.flume.sink.
hdfs
.
HDFS
EventSink.process
m0_58310854
·
2023-12-25 16:38
flume
hdfs
hadoop
flume
云计算与大数据之间的羁绊(期末不挂科版):云计算 | 大数据 | Hadoop |
HDFS
| MapReduce | Hive | Spark
文章目录前言:一、云计算1.1云计算的基本思想1.2云计算概述——什么是云计算?1.3云计算的基本特征1.4云计算的部署模式1.5云服务1.6云计算的关键技术——虚拟化技术1.6.1虚拟化的好处1.6.2虚拟化技术的应用——12306使用阿里云避免了高峰期的崩溃1.6.3虚拟化的关键特征1.6.4虚拟化的HA指的是什么?1.6.5服务器虚拟化1.6.6虚拟机迁移1.6.6.1虚拟机实时迁移对云计算
春人.
·
2023-12-25 14:59
春人闲谈
大数据
hadoop
云计算
HDFS
MapReduce
Nive
Hive
spark log4j日志配置
1.spark启动参数先把log4j配置文件放到
hdfs
:
hdfs
://R2/projects/log4j-debug.properties--confspark.yarn.dist.files=
hdfs
Mint6
·
2023-12-25 12:33
spark
spark
log4j
大数据
日志
debug
【美团大数据面试】大数据面试题附答案
目录1.
hdfs
读写流程解析2.
hdfs
副本机制,三副本原因,副本存放策略3.
hdfs
容错机制原理4.MapReduce执行流程详解5.spark和mr的区别6.TopN求法,大数据量无法完全写入内存解决方案
话数Science
·
2023-12-25 11:19
大数据
面试
大数据
面试
Kafka下沉到
HDFS
报错
错误信息24十二月202312:38:25,127INFO[SinkRunner-PollingRunner-DefaultSinkProcessor](org.apache.flume.sink.
hdfs
.
HDFS
CompressedDataStream.configure
Stephen6Yang
·
2023-12-25 07:12
hadoop
kafka
hdfs
安装Hadoop 3.3.5
常识科普:Kafka的存储与安装不依赖于
hdfs
/spark,从下边安装过程你可以得知这个信息。备注:
IT WorryFree
·
2023-12-25 06:03
hadoop
大数据
分布式
YARN Hadoop2.0 区别
Hadoop2.0与HAdoop1.0的区别:Hadoop1.0主要由
HDFS
和MapReduce两个系统够长,但在Hadoop2.0中主要由HadoopCommon、
HDFS
、HadoopYARN和HadoopMapReduce2.0
omygodvv
·
2023-12-24 23:01
java
【Hadoop学习笔记】(二)——Hive的原理及使用
Hive数据仓库工具能为
HDFS
上的数据提供类似SQL的查询语言(HiveQL),并将SQL语句转变成MapReduce任务来执行。Hive明显降低了Hadoop的使用门槛,任何熟悉SQL的用
wanger61
·
2023-12-24 23:25
大数据开发
hadoop
hive
大数据
四、Hadoop学习笔记————各种工具用法
Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如:MySQL,Oracle,Postgres等)中的数据导进到Hadoop的
HDFS
weixin_30528371
·
2023-12-24 23:25
大数据
数据库
Hive学习笔记(1)——Hive原理初探
文章目录前言一、hive的特点二、hive体系架构及基本原理三、Hive的存储四、总结前言相信大家通过学习MapReduce,已经认识到hadoop利用多台廉价机器集群进行并行计算的优势,了解了
HDFS
Zhou.Y.M
·
2023-12-24 23:55
Hadoop
hive
hadoop
大数据
mapreduce
【Hive笔记】1——Hive入门
本质:将HQL转化为Mapreduce程序Hive处理的数据存储在
HDFS
,HIve分析数据底层的实现是Mapreduce,执行程序运行在Yarn上2.Hive的优缺点优点:操作接口采用类sql语法,提供快速开发能
sdut菜鸟
·
2023-12-24 23:55
hive
hive
hadoop
大数据
hadoop集群坏块处理
hadoop之
hdfs
数据块修复方法:1、手动修复#检查集群的健康状态
hdfs
fsck/#修复指定的
hdfs
数据块。也就是关闭打开的文件。
运维仙人
·
2023-12-24 21:39
hadoop
eclipse
大数据
【Hadoop】
HDFS
shell操作与管理工具
HDFS
shell操作
HDFS
管理工具dfsadminfsck均衡器
HDFS
shell操作
HDFS
是存取数据的分布式文件系统,对
HDFS
的操作就是文件系统的基本操作,如文件的创建、修改、删除、修改权限,
不怕娜
·
2023-12-24 18:41
hadoop
hdfs
npm
【Hadoop】YARN简介(YARN产生的技术需求/YARN的基本架构)
YARN产生的技术需求YARN的基本架构ResourceManagerNodeManagerApplicationMasterContainer
HDFS
与YARNYARN产生的技术需求YARN是Hadoopv2.0
不怕娜
·
2023-12-24 18:41
hadoop
架构
大数据
【Hadoop】
HDFS
简介——是什么/优缺点/适用场景
HDFS
是什么
HDFS
的优点/特性
HDFS
适用场景
HDFS
的缺点与不足
HDFS
不适用场景
HDFS
是什么源自Google的GFS论文Google于2003年10月发表
HDFS
是GFS的一个克隆版
HDFS
(
不怕娜
·
2023-12-24 18:11
hadoop
hdfs
大数据
WARNING: HADOOP_SECURE_DN_USER has been replaced by
HDFS
_DATANODE_SECURE_USER.
Hadoop启动时警告,但不影响使用,强迫症的我还是决定寻找解决办法WARNING:HADOOP_SECURE_DN_USERhasbeenreplacedby
HDFS
_DATANODE_SECURE_USER.UsingvalueofHADOOP_SECURE_DN_USER
玖玖1704
·
2023-12-24 12:59
hadoop
hdfs
大数据
hdfs
.DataStreamer: Exception in createBlockOutputStream XXXXX
java.io.IOException:Goterror,status=ERROR,statusmessage,ackwithfirstBadLinkas192.168.100.13:9866atorg.apache.hadoop.
hdfs
.protocol.datatransfer.DataTransferProtoUtil.checkBlockOpStatus
玖玖1704
·
2023-12-24 12:28
hdfs
hadoop
大数据
HBase基础知识(三):HBase架构进阶、读写流程、MemStoreFlush、StoreFile Compaction、Region Split
1.架构原理1)StoreFile保存实际数据的物理文件,StoreFile以HFile的形式存储在
HDFS
上。
依晴无旧
·
2023-12-24 11:59
大数据
hbase
数据库
大数据
【Hadoop篇08】Hadoop数据压缩
简洁而不简单Hadoop数据压缩数据压缩优点和缺点压缩技术能够有效减少底层存储系统(
HDFS
)读写字节数。压缩提高了网络带宽和磁盘空间的效率。
focusbigdata
·
2023-12-24 10:00
Hadoop学习笔记(一)分布式文件存储系统 ——
HDFS
概念
HDFS
(HadoopDistributedFileSystem),Hadoop分布式文件系统,用来存超大文件的。
zhang35
·
2023-12-24 08:54
大数据技术栈
大数据
分布式
Hadoop
入门
hdfs
大数据高级开发工程师——Hadoop学习笔记(1)
hadoop用户设置免密登录三台虚拟机安装jdkhadoop集群安装环境部署规划安装包下载查看hadoop支持的压缩方式以及本地库修改配置文件修改hadoop-env.sh修改core-site.xml修改
hdfs
-site.xml
讲文明的喜羊羊拒绝pua
·
2023-12-24 08:53
大数据
大数据
hadoop
hdfs
集群
zookeeper
Hadoop入门学习笔记——二、在虚拟机里部署
HDFS
集群
pwd=5ay8Hadoop入门学习笔记(汇总)目录二、在虚拟机里部署
HDFS
集群2.1.部署node1虚拟机2.2.部署node2和node3虚拟机2.3.初始化并启动Hadoop集群(格
faith瑞诚
·
2023-12-24 08:23
大数据
学习笔记
hadoop
学习
笔记
hadoop大数据学习笔记
或者说将多台计算机组织成了一台计算机,让他们做同一件事,在这其中
HDFS
就相当于这台计算机的硬盘,而MapReduce就是这台计算机的CPU控制器。
驰宇爱吃鱼
·
2023-12-24 08:53
学习笔记
大数据
hadoop
学习
Hadoop学习之
HDFS
——小白入门笔记
(此处的计算机为普通计算机)3.分布式文件系统的多个节点分为两类:名称节点(主节点):文件、目录的操作(创建、删除、重命名等),数据节点与文件块的映射关系数据节点(从节点):数据的读取与存储二、
HDFS
cainiao22222
·
2023-12-24 08:52
hadoop
hdfs
hadoop
hdfs
hive企业级调优策略之CBO,谓词下推等优化
在Hive中,计算成本模型考虑到了:数据的行数、CPU、本地IO、
HDFS
IO、网络IO
Appreciate(欣赏)
·
2023-12-24 07:26
hive
hive
hadoop
数据仓库
Hadoop入门学习笔记——三、使用
HDFS
文件系统
pwd=5ay8Hadoop入门学习笔记(汇总)目录三、使用
HDFS
文件系统3.1.使用命令操作
HDFS
文件系统3.1.1.
HDFS
文件系统基本信息3.1.2.
HDFS
文件系统的2套命令体系
faith瑞诚
·
2023-12-24 07:39
大数据
学习笔记
hadoop
学习
笔记
7000字超详细讲解Hadoop、Spark、Storm、YARN,建议收藏!
核心内容包含
hdfs
和mapreduce。hadoop2.0以后引入yarn.
hdfs
是提供数据存储的,mapreduce是方便数据计算的。
套马杆的程序员
·
2023-12-24 04:49
Hive优化
Hive优化Hive的存储层依托于
HDFS
,Hive的计算层依托于MapReduce,一般Hive的执行效率主要取决于SQL语句的执行效率,因此,Hive的优化的核心思想是MapReduce的优化。
新鲜氧气
·
2023-12-23 22:26
大数据
#
hive
#
hadoop
hive
hadoop
数据仓库
ClickHouse(19)ClickHouse集成Hive表引擎详细解析
文章目录Hive集成表引擎创建表使用示例如何使用
HDFS
文件系统的本地缓存查询ORC输入格式的Hive表在Hive中建表在ClickHouse中建表查询Parquest输入格式的Hive表在Hive中建表在
张飞的猪大数据
·
2023-12-23 20:37
ClickHouse入门与实战
clickhouse
hive
数据仓库
大数据
数据库
浅谈Hadoop容错机制
简单介绍一下Hadoop中数据存储的可靠性和完整性,其中包括
HDFS
的容错机制、NameNode(元数据结点)的单点失效解决机制、Block数据块的多副本存储机制、NameNode与DataNode之间的心跳检测机制
小小少年Boy
·
2023-12-23 15:19
MINIO在java中的使用
对象存储可以充当主存储层,以处理Spark、Presto、TensorFlow、H2O.ai等各种复杂工作负载以及成为Hadoop
HDFS
的替代品--------引自官网的话。
IT小学僧
·
2023-12-23 14:48
MinIo
Java
java
spring
boot
通过
HDFS
API进行
HDFS
操作
HDFS
JavaAPI位于org.apache.hadoop.fs包中,这些API能够支持的操作包括打开文件、读写文件、删除文件等。Hadoop类库中最终面向用户提供的接口类是FileSystem。
CDHong.it
·
2023-12-23 14:30
Hadoop大数据
Java基础
hadoop
hdfs
大数据
Hadoop _
HDFS
_API 创建文件夹
在项目中src/main/java目录下,新建一个文件,命名为com.atguigu.
hdfs
创建文件夹在文件夹里输入代码,创建文件夹客户端代码常用套路1、获取一个客户端对象2、执行相关的操作指令3、关闭资源代码如下
笨鸟先-森
·
2023-12-23 14:29
hadoop
hdfs
java
Hadoop之
HDFS
的API操作
1、环境准备1.1、下载window版本的hadoop-3.1.01.2、配置HADOOP_HOME环境变量1.2、配置Path环境变量2、代码演示2.1、创建maven项目,导入pom坐标org.apache.hadoophadoop-client3.1.3junitjunit4.12org.slf4jslf4j-log4j121.7.302.2、日志配置log4j.rootLogger=INF
后端技术那点事
·
2023-12-23 14:28
大数据系列
hadoop
hdfs
big
data
Hadoop学习之
HDFS
(
HDFS
客户端及API操作)心得
HDFS
客户端及API操作:一、准备条件:1.配置环境变量HADOOP_HOME(路径要求非中文)2.验证环境变量,双击winutils.exe(报错可能是缺少微软运行库MSVCR120.dll)3.在
顺其自然的济帅哈
·
2023-12-23 14:58
Hadoop
hadoop
hdfs
大数据—Hadoop(四)_
HDFS
_03、客户端API
文章目录1、客户端环境准备1.1idea1.2window依赖2、
HDFS
的API案例实操2.1
HDFS
文件上传(测试参数优先级)2.1.1客户端代码常用套路2.1.2普通版2.1.3优化后2.1.4上传文件
大数据之负
·
2023-12-23 14:58
Hadoop
hadoop
hdfs
大数据
HDFS
的API操作
的环境变量(1)设置MAVEN_HOME为maven文件夹的路径(2)在path中添加“%MAVEN_HOME%\bin”(3)在idea中创建maven项目(注意在编写代码前应修改“pom.xml”,
hdfs
七玥a
·
2023-12-23 14:58
maven
idea
hadoop
hdfs
Hadoop中
HDFS
的API操作、客户端环境准备、配置HADOOP_HOME环境变量
文章目录7.
HDFS
的API操作7.1客户端环境准备7.1.1下载下面的Windows依赖文件夹,拷贝hadoop-3.1.0到非中文路径(比如d:\)7.1.2配置HADOOP_HOME环境变量7.1.3
Redamancy_06
·
2023-12-23 14:27
#
Hadoop
hadoop
hdfs
大数据
hadoop02_
HDFS
的API操作
HDFS
的API操作1
HDFS
核心类简介Configuration类:处理
HDFS
配置的核心类。
程序喵猴
·
2023-12-23 14:57
hadoop
hdfs
hadoop
大数据
大数据---35.HBase 常用的api的具体解释
Hbase是一个分布式的、面向列的开源数据库,
HDFS
文件操作常有两种方式,一种是命令行方式,即Hbase提供了一套与Linux文件命令类似的命令行工具。
学无止境的大象
·
2023-12-23 13:00
大数据
hbase
数据库
DBeaver连接hive
1.新建hive连接其中主机填写hive所在节点地址,端口10000为默认,数据库名不填则是默认default数据库,用户名密码填写hadoop集群中能操作
hdfs
的用户和密码。
sunweiking
·
2023-12-23 12:38
hive
hive
hadoop
数据仓库
【数仓_01】用户行为采集平台
2.1目标数据2.2埋点3、模拟数据3.1使用说明3.2集群日志生成脚本4、用户行为数据采集模块4.1数据通道4.2环境准备4.2.1集群所有进程查看脚本4.3Hadoop项目经验4.3.1项目经验之
HDFS
温欣2030
·
2023-12-23 10:43
hadoop
hadoop(十二)——自定义分区Partitioner
我们先来看看DataCount这个程序最终的执行结果是什么样子的,在查看之前我们需要先启动
hdfs
和ya
文子轩
·
2023-12-23 08:05
DataX安装与原理
一、简介与安装DataX是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、
HDFS
、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能
大数据点滴
·
2023-12-22 14:05
DataX
DataX
数据库
centos spark单机版伪分布式模式
1.2Spark部署依赖SparkStandalone的运行依赖于JDK、Scala,本来是不依赖于Hadoop的,但Spark自带的许多演示程序都依赖于Hadoop
HDFS
,因此我们也部署了伪分布式的
数据萌新
·
2023-12-22 07:17
HDFS
NFS Gateway(环境配置,超级详细!!)
HDFS
NFSGateway简介:
HDFS
NFSGateway是HadoopDistributedFileSystem(
HDFS
)中的一个组件,它允许客户端通过NFS(NetworkFileSystem
syst1m'
·
2023-12-22 07:41
大数据
hdfs
gateway
hadoop
解决There are 0 datanode(s) running and no node(s) are excluded in this operation.
参考来源:https://blog.csdn.net/weixin_41374755/article/details/107146445解释:出现本问题是在本人在
hdfs
上传本地文件夹过程中出现一大串错误
什么都不太会的研究生
·
2023-12-22 07:08
报错处理
centos
linux
hbase用shell命令新建表报错ERROR: KeeperErrorCode = NoNode for /hbase/master
HMaster,如果没有,开启一下hbase,稍微等一会儿,再看一下HMaster,如果仍和下图一样没有,就基本找到问题了本人问题原因:hbase-site.xml的配置中,例如:hbase.rootdir
hdfs
什么都不太会的研究生
·
2023-12-22 07:32
报错处理
hbase
数据库
大数据
上一页
12
13
14
15
16
17
18
19
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他