E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
********HDFS
报错:-bash: /usr/local/jdk/bin/java: Permission denied
问题:在搭hadoop集群格式化
hdfs
时的报错,-bash:/usr/local/jdk/bin/java:Permissiondenied,发现jdk用不了,/usr/local/jdk/bin/java
黄丕理
·
2023-11-01 07:52
报错
java
bash
hadoop
大数据环境搭建
创建用户并赋予权限ssh免密登录配置编写集群分发脚本xsync安装jdk集群所有进程查看脚本hadoop环境配置Hadoop集群Hadoop环境hadoop集群节点核心配置文件core-site.xml配置
hdfs
-site.xml
yulishi12
·
2023-11-01 07:36
大数据框架
大数据
linux
运维
hadoop
hive
java将
hdfs
上的图片转为base64返回给前端
将
hdfs
上面的图片转化为base64传给前端publicstaticvoidmain(String[]args)throwsIOException{String
hdfs
Path="
hdfs
://192.168.0.0
Alex_81D
·
2023-11-01 04:55
java基础
java
java 读取
hdfs
上的文件内容
用java读取
hdfs
的文件直接撸代码:packagecom.nature.base.util;importcom.nature.component.process.vo.DebugDataResponse
Alex_81D
·
2023-11-01 04:24
大数据基础
java基础
读取文件
flume使用
HDFS
Sink将数据导入到Hive中
整体流程:avroSource获取数据,然后通过SPILLABLEMEMORYchannel,再然后使用
hdfs
sink将数据落地到
hdfs
中,最后通过调度系统执行脚本导入到hive中。
码道功成
·
2023-10-31 22:16
大数据
hive
flume
大数据
hadoop权威指南第四版
问题1磁盘损坏–备份数据
HDFS
问题2读取多个磁盘用于分析,数据容易出错--MR编程模型1.2衍生品1在线访问的组件是hbase。一种使用
hdfs
底层存储的模型。
春风不会绿大地
·
2023-10-31 17:11
hadoop
大数据
分布式
(四)大数据集群运维
大数据集群运维ES常见运维命令windows和linux常用命令文章目录大数据集群运维1:集群扩容均衡1.1:
hdfs
均衡1.2:kafka均衡1.3:es均衡2:hadoop集群服务角色汇总2.1:
hdfs
2.2
猿来如此dj
·
2023-10-31 12:39
hadoop专栏
运维
hadoop
大数据
hdfs
6个人如何维护上千规模的大数据集群?
其中6人的离线团队需要维护大数据集群规模如下:Hadoop集群规模1300+
HDFS
存量数据40+PB,Read3.5PB+/天,Write500TB+/天14WMRJob/天,10WSparkJob/
郭首志
·
2023-10-31 12:05
HBase集群的搭建
://hbase.apache.org/考虑点:版本选择企业常用的:0.96,0.98,hbase-2.x,这里我们选择1.2.12版本兼容问题hadoop-2.7.7hbase-1.2.12依赖环境
HDFS
顾子豪
·
2023-10-31 10:53
分布式存储系统Ceph应用组件介绍
具有可靠性高,性能优良,可伸缩,与
HDFS
不同的地方在于,该架构中没有中心节点。
exitgogo
·
2023-10-31 06:30
分布式
ceph
读书笔记:MIT 6.824
分布式的基础设施:存储常见的
HDFS
通信计算常见的如MapReduce实现上:RPC线程并发控制分布式关注的重点:性能(Performance)可拓展性(Scalability)2倍的机器,2倍的性能容错
elon_wen
·
2023-10-31 01:03
尚硅谷Flume
1.2.2Source1.2.3Sink1.2.4Channel1.2.5Event(事件)二、Flume入门2.1监控端口数据官方案例2.1.1配置好flume-netcat-logger.conf文件2.2实时监控单个追加文件2.2.1配置好flume-file-
hdfs
.conf
小新学java
·
2023-10-30 19:03
hadoop生态圈
flume
Flume入门必看
2.Flume优点①可以和任意存储进程集成②输入的数据速率大于写入目的存储的速率,flume会进行缓冲,减小
hdfs
的压力。
郎er
·
2023-10-30 19:02
大数据
flume
大数据
Flume日志采集框架
uFlume可以采集文件,socket数据包等各种形式源数据,又可以将采集到的数据输出到
HDFS
、hbase、hive、kafka等众多外部存储系统中u一般的采集需求,通过对flume的简单配置即可实现
freefish_yzx
·
2023-10-30 19:30
flume
Flume的安装部署
flume入门指导
Flume 快速入门【概述、安装、拦截器】
它的主要目的是帮助用户将大规模数据从各种数据源(如日志文件、网络数据源、消息队列等)采集、传输和加载到数据存储系统(如Hadoop
HDFS
、ApacheH
月亮给我抄代码
·
2023-10-30 19:55
flume
大数据
kafka
hadoop
hdfs
Checkpoint复杂流程
下图左侧是CheckpointCoordinator,是整个Checkpoint的发起者,中间是由两个source,一个sink组成的Flink作业,最右侧的是持久化存储,在大部分用户场景中对应
HDFS
bigdata张凯翔
·
2023-10-30 19:57
本地windows操作虚拟机中的
HDFS
(伪分布式)
本文章是配合厦门大学林子雨的《大数据技术原理与应用》使用的本篇文章使用的环境如下:虚拟机:Ubuntu18.04百度网盘地址Hadoop:hadoop3.3.0阿里云网盘地址迅雷网盘地址windows:win10JDK:1.8强烈建议是1.8阿里云网盘地址迅雷网盘地址JDK已在windows中安装的,且非1.8的,建议安装两个版本的JDK(一个原有的,一个1.8)0.安装虚拟机后,配置网络参考之前
CMCST
·
2023-10-30 18:10
BigData学习日志
hadoop
hdfs
读写过程
hdfs
文件写入过程Client发起文件上传请求,通过RPC与NameNode建立通讯,NameNode检查目标文件是否已存在,父目录是否存在,返回是否可以上传Client请求第一个block该传输到哪些
吾为天帝乎
·
2023-10-30 16:36
两个重要的端口号
http://ip:50070——Windows进入
hdfs
的端口号,ip为启动的机器iphttp://ip:8088——Windows进入yarn的端口号,ip为启动的机器ip
怀夕
·
2023-10-30 14:41
Spark core通过textFile读取
Hdfs
文件blockSize如何设置?
一、概述其实Sparkcore无论是读取
hdfs
还是读取本地文件都会以hadoopfile的形式进行读取,不同点在于读取本地文件时可以通过在resources文件中放入
hdfs
-site.xml文件设置
客舟听雨2
·
2023-10-30 10:52
spark
hdfs
大数据
hadoop组件及各自的功能
Hadoop=
HDFS
+Yarn+MapReduce+Hbase+Hive+Pig+…1.
HDFS
:分布式文件系统2.Yarn:分布式资源管理系统,3.MapReduce:Hadoop的编程框架4.Pig
ZK_0705
·
2023-10-30 10:17
大数据
hadoop
大数据
spark集群配置
目录1.集群部署规划2.安装Spark3.文件配置4.分发文件5.启动集群6.查看集群1.集群部署规划表1-1集群部署规划主机名masterslave1slave2
HDFS
NameNodeDataNodeSecondaryNameNodeDataNodeDataNodeYARNResourceManagerNodeManageNodeManageNodeManagerSparkMasterWork
EsmeZhao
·
2023-10-30 08:39
Spark
spark
HDFS
(一)
HDFS
基本介绍
HDFS
基本介绍
HDFS
的Master-Slave结构
HDFS
角色作用简介
HDFS
分块存储抽象成数据块的好处
HDFS
副本机制名字空间(NameSpace)NameNode功能DataNode功能机架感知原理
红叶゜
·
2023-10-30 07:27
学习笔记
#
HDFS
大数据
hdfs
java.lang.RuntimeException: The root scratch dir: /tmp/hive on
HDFS
should be writable.
Exceptioninthread“main”java.lang.RuntimeException:Therootscratchdir:/tmp/hiveon
HDFS
shouldbewritable.Currentpermissionsare
红叶゜
·
2023-10-30 07:57
报错
hadoop
linux
大数据
hive
从主机上传文件到
hdfs
,从机看不到上传的文件
从主机上传文件到
hdfs
,从机看不到上传的文件发现是从机未写/etc/profile.d/hadoop.sh文件补全hadoop.sh文件即可
红叶゜
·
2023-10-30 07:56
报错
hadoop
Impala概述
1、Impala是什什么Impala是Cloudera提供的一款开源的针对
HDFS
和HBASE中的PB级别数据进行行交互式实时查询(Impala速度快),Impala是参照谷歌的新三篇论文当中的Dremel
悠然予夏
·
2023-10-30 07:48
Hadoop生态圈技术
impala
大数据
hadoop
1024程序员节
Impala介绍优缺点
Impala的基本概念1.1什么是ImpalaCloudera公司推出,提供对
HDFS
、Hbase数据的高性能、低延迟的交互式SQL查询功能。
墨卿风竹
·
2023-10-30 07:17
Impala基础知识
提供SQL语义,能查询存储在Hadoop的
HDFS
和HBase上的PB级大数据,在性能上比Hive高出3~30倍。基于Hive的大数据实时分析查询引擎,其运行需要依赖于Hive元数据。
johnny233
·
2023-10-30 07:46
大数据
impala
大数据笔记-关于Cassandra的删除问题
Cassandra是Facebook开源的一个NoSQL数据库,它除了具备一般的NoSQL分布式数据库特点以外,最大的一个特点是去中心化架构设计,这和Hadoop
HDFS
/HBase等不一样,比如
HDFS
鬓戈
·
2023-10-30 06:48
大数据
大数据
笔记
Elasticsearch如何备份到
HDFS
es备份到
hdfs
简介elasticsearch副本提供了高可靠性;它可以保证节点丢失而不会中断服务,但是副本不能做到容灾备份,所以需要把elasticsearch的数据被分到
hdfs
中。
勇者1108
·
2023-10-30 04:16
Hadoop 3.x 和2.x主要区别
最低Java版本从7升级到8引入纠删码(ErasureCoding)主要解决数据量大到一定程度磁盘空间存储能力不足的问题.
HDFS
中的默认3副本方案在存储空间中具有200%的额外开销。
勇者1108
·
2023-10-30 04:45
hadoop
Ambari删除节点
1.在需要删除的节点上设置DataNode为Decommissioned查看
HDFS
WEB页面,等待完成之前的数据之后的数据2.停止节点上所有组件3.删除节点在删除节点的命令行执行ambari-agentstop4
字节侠
·
2023-10-29 22:10
大数据
Ambari
Hive创建分区表并插入数据
分区表创建分区表的创建本质是在
HDFS
创建了一个分区字段为名称的文件夹,插入数据时根据分区字段取值插入到文件中。静态分区表定义:静态分区在插入数据时要指定分区名,支持load、inse
Forge_ahead
·
2023-10-29 19:46
work_efficiency
hive
hadoop
数据仓库
hdfs
读写过程是怎样的?
1.文件读取过程1.客户端通过调用FileSyste对象的open()方法来打开希望读取的文件,对于
Hdfs
来说,这个对象是DistributedFileSystem的一个实例,2.通过使用远程过程调用
乌拉乌拉儿
·
2023-10-29 14:34
Hive如何处理大量小文件
生成的小文件也越多小文件的危害从HIVE角度来看的话呢,小文件越多,map的个数也会越多,每一个map都会开启一个JVM虚拟机,每个虚拟机都要创建任务,执行任务,这些流程都会造成大量的资源浪费,严重影响性能在
HDFS
liuzx32
·
2023-10-29 12:20
Hbase面试题(面经)整理
Hbase一个分布式的基于列式存储的数据库,基于Hadoop的
hdfs
存储,zookeeper进行管理。
_Kafka_
·
2023-10-29 12:03
大数据
Hive-day01-简单介绍
2:本质:将HQL转化为MapReduce程序hive处理的数据存储在
HDFS
,hive分析数据底层的实现是MapReduce,执行程序运行在Yarn上。
总会有天明
·
2023-10-29 08:40
Hive
hive
hadoop
big
data
前端文件上传与下载(含 base64流文件)
@param{*}param*/exportfunctionuploadFile(param,fileInfo){returnrequest({method:'post',url:`document/
hdfs
oNexiaoyao
·
2023-10-29 07:19
【ETL工具】Datax-ETL-SqlServerTo
HDFS
目录个人主页——个人主页✨一、DataX概览1.1DataX简介1.2DataX框架1.3功能限制1.4SupportDataChannels二、配置样例2.1环境信息2.2SQLServer数据同步到
HDFS
2.2
开着拖拉机回家
·
2023-10-29 00:58
ETL
工具
etl
datax
数据同步
sqlserver
ETL
大数据Hadoop、Hive、Kafka、Hbase、Spark等框架面经
大数据组件学习路线:阶段1:学习绿色箭头的知识点;阶段2:学习红色箭头的知识点;阶段3:学习蓝色箭头的知识点;1Hadoop1.1Hadoop1.x与Hadoop2.x的区别1.2
HDFS
架构(1)NameNode
For Coding
·
2023-10-28 21:50
大数据
hadoop
hive
spark
flume
zookeeper
java如何快速入门Hadoop大数据技术?
全书共16章,第1章讲解了VMware中CentOS7操作系统的安装;第2章讲解了大数据开发之前对操作系统集群环境的配置;第3~16章讲解了Hadoop生态系统各框架
HDFS
、MapReduce、YARN
xyzkenan
·
2023-10-28 21:01
大数据
hadoop
大数据书籍
大数据开发
新手必备:大数据框架Hadoop主要模块解析
HadoopDistributedFileSystem(
HDFS
™):分布式文
weixin_34185364
·
2023-10-28 21:00
sqoop连接mysql数据库导入导出数据Communications link failure错误解决
在将数据从hive存入mysql或者从
hdfs
存入mysql时出现了如下的错误:ERRORmanager.CatalogQueryManager:Failedtolistdatabasescom.mysql.jdbc.exceptions.jdbc4
马里奥w
·
2023-10-28 20:02
mysql
数据库
sqoop
hadoop常见的面试题
一、
hdfs
上传和下载文件流程
hdfs
上传客户端向namenode发出请求建立通信获得存储文件块的datanode节点,然后客户端将文件按照块的大小进行分块(hadoop2.7.3开始由64MB变成128MB
有一束阳光叫温暖
·
2023-10-28 19:10
Hive分区表和分桶表
本专栏案例数据集链接:https://download.csdn.net/download/shangjg03/884780381.分区表1.1概念Hive中的表对应为
HDFS
上的指定目录,在查询数据时候
shangjg3
·
2023-10-28 18:07
Hive
hive
hadoop
数据仓库
HDFS
工作流程和机制
HDFS
写数据流程(上传文件)核心概念--Pipeline管道
HDFS
在上传文件写数据过程中采用的一种传输方式。
liyantower
·
2023-10-28 16:58
hdfs
hadoop
大数据
Spark(Streaming)写入数据到文件-关键为根据数据内容输出到不同自定义名称文件(saveAsHadoopFile以及自定义MultipleOutputFormat)
之前的Spark实时流处理的数据处理程序,要求把数据从kafka接收之后,分2路分别写入kafka和
hdfs
,写入kafka的部分之前已经有过总结,现在回过头来把之前的写入
HDFS
的地方重新总结一下,整个过程从头到尾有一个写入方式的优化
超级侠哥
·
2023-10-28 15:17
Hadoop大数据相关
spark
streaming
CDH-
hdfs
配置HA后,hive查询报错
在CDH平台上配置HA后,
hdfs
服务正常运行,hive服务可以正常连接,但是进行查询时报错。
jay1122
·
2023-10-28 13:25
hadoop详解
HDFS
:1.
HDFS
文件系统:
HDFS
是大数据开源框架hadoop的组件之一,全称(HadoopDistributedFileSystem),它是一个分布式文件系统,由多台服务器联合起来实现文件存储功能
不吃饭的猪
·
2023-10-28 07:46
hadoop
大数据
分布式
hadoop--
HDFS
基础(适合初学者)
文章目录1
HDFS
分布式文件系统基础1.1文件系统1.2分布式文件系统1.3
HDFS
简介1.4
HDFS
起源发展1.5
HDFS
设计目标1.6
HDFS
应用场景1.7
HDFS
重要特性2
HDFS
shell操作2.1
HDFS
shell
火 玄
·
2023-10-28 04:07
hadoop
hadoop
hdfs
大数据
上一页
28
29
30
31
32
33
34
35
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他