E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
********HDFS
hadoop 3.x 案例3:datanode 异常
一.问题描述
hdfs
web页面显示有的文件是损坏的,需要使用fsck来检查image.png二.解决方案通过fsck检查根目录,看是否有损坏的文件
hdfs
fsck/image.png将检查到的损坏的文件进行删除
只是甲
·
2023-10-28 01:17
flink 在idea中编写的wordcount 重新启动后没有从检查点恢复之前的数据,为什么?
启用了检查点和状态后端,看
hdfs
目录确实有内容,然而重新启动后并没有从检查点恢复数据,这是为什么??
Jaming R
·
2023-10-27 22:18
flink
Presto-交互式计算引擎
为了实现高性能数据处理,交互式极端引擎采用mmp架构,并将充分使用内存加速presto的出现时为了应对hadoop的一些缺点:1、io密集,因为mepreduce作业之间的交互是用
hdfs
作为中介的2、
一个喜欢烧砖的人
·
2023-10-27 15:18
发布人:夏小权 发布时间:2018-12-17
是ApacheHadoop的数据库,是建立在
HDFS
之上,被设计用来提供高可靠性、高性能、列存储、可伸缩、多版本的NoSQL的分布式数据存储系统,实现对大型数据的实时、随机的读写访问。
黑权
·
2023-10-27 14:12
Flink savepoint | checkpoint 恢复
/flinksavepoint0d69ad4b526c7d7e491357bc842b1e75
hdfs
://
hdfs
-namenode-service:9000/flink-savepoints...Triggeringsavepointforjob0d69ad4b526c7
胖胖胖胖胖虎
·
2023-10-27 11:55
Flink
flink
大数据
hadoop
Hive的内部表/外部表/分区表/分桶表
内部表:普通表,相当于mysql的物理表,对应
hdfs
数据,删除时同时删除元数据和
hdfs
表数据外部表:关键字external,指向已存在的
hdfs
数据,删除时只删除元数据(表结构),指向的
hdfs
表数据依然存在分区表
DancingBUG
·
2023-10-27 09:20
Linux安装Mycat1.6.7.6实现Mysql数据库读写分离
简介一个彻底开源的,面向企业应用开发的大数据库集群支持事务、ACID、可以替代MySQL的加强版数据库一个可以视为MySQL集群的企业级数据库,用来替代昂贵的Oracle集群一个融合内存缓存技术、NoSQL技术、
HDFS
GeekXuShuo
·
2023-10-27 09:36
mysql
数据库
linux
mysql
数据仓库Hive
HIveDDL详解HiveDML详解MapReduce编程的不便性传统RDBMS人员的需求由Facebook开源,用于解决海量结构化日志的数据统计问题构建在Hadoop之上的数据仓库(Hive的数据存放在
HDFS
V_6619
·
2023-10-27 07:43
Hadoop-
Hdfs
-添加节点
tags:[Hadoop,
Hdfs
,大数据]1.添加白名单创建白名单文件hadoop3.x/etc/hadoop这个目录下创建白名单文件vimdfs.hosts向白名单文件中添加允许访问NameNode
_Unique_楠楠
·
2023-10-27 06:09
hive笔记
Hive介绍:1.sql2.udf官网:hive.apache.org由Facebook提出的开源=》去解决海量结构化数据的数据统计问题构建在hadoop之上的数据仓库
hdfs
:hive的数据是存储在
hdfs
qq_47721411
·
2023-10-27 04:41
hive
hadoop
大数据
Hive安装笔记
一、安装元数据库MySQLHive的元数据和数据是分开存放的,数据存放在
HDFS
上,而元数据默认是存放在Hive自带的Derby数据库,但由于Derby只支持同时一个用户访问Hive,所以不推荐使用。
碣石观海
·
2023-10-27 04:11
Hive
HIVE1.2.1配置
文章目录HIVE1.2.1配置hive配置在
hdfs
建立hive仓库目录启动单例hive测试配置mysql5.6编辑hive-site.xml使用MySQL做元数据管理HIVE1.2.1配置hive配置
学习做笔记
·
2023-10-27 04:39
数据仓库
hive
hadoop
big
data
【现场问题】CDH文件权限,Permission denied: user=root, access=WRITE, inode=“/user“:
hdfs
:supergroup:drwxr-xr
Hive执行语句的时候提示/user权限不够hive>>selectcount(*)fromfact_sale;QueryID=root_20201119152619_16f496b5-2482-4efb-a26c-e18117b2f10cTotaljobs=1LaunchingJob1outof1Numberofreducetasksdeterminedatcompiletime:1Inorde
吃素的哈士奇
·
2023-10-26 23:09
hive
hadoop
数据仓库
云计算中的大数据处理:尝试
HDFS
和MapReduce的应用
云计算中的大数据处理:尝试
HDFS
和MapReduce的应用文章目录云计算中的大数据处理:尝试
HDFS
和MapReduce的应用一、前言二、第一题1、命令方式2、javaAPI方式三、第二题1、创建CSV
-北天-
·
2023-10-26 19:48
大数据学习
云计算
hadoop
大数据
【智能大数据分析】实验1 MapReduce实验:单词计数
1MapReduce实验:单词计数文章目录【智能大数据分析】实验1MapReduce实验:单词计数一、实验目的二、实验要求三、实验原理1MapReduce编程2JavaAPI解析四、实验步骤1启动Hadoop2验证
HDFS
-北天-
·
2023-10-26 19:05
大数据学习
数据分析
mapreduce
大数据
尚硅谷Flume(仅有基础)
Flume最主要的作用就是,实时读取服务器本地磁盘的数据,将数据写入到
HDFS
。1.2架构1.2.1AgentAgent是一个JVM进程,它以事件的形式将数据从源头送至目的。
Int mian[]
·
2023-10-26 19:43
flume
大数据
Windows下利用Eclipse连接
HDFS
将hadoop-eclipse插件复制到Eclipse下的plugins目录中image.png解压Windows环境下的Hadoop压缩包image.png将解压后的hadoop-3.1.1中bin目录下的hadoop.dll拷贝到C:\Windows\System32image.png配置环境变量新建:HADOOP_HOME=D:\Document\Hadoop\hadoop-3.1.1新建:
上杉丶零
·
2023-10-26 17:22
Hadoop所有命令详解
对
HDFS
文件系统,scheme是
hdfs
,对本地文件系统,scheme是file。其中scheme和authority参数都是可选的,如果未加指定,就会使用配置中指定的默认scheme。
FantJ
·
2023-10-26 16:00
大数据架构:flume-ng+Kafka+Storm+
HDFS
实时系统组合
转载至:http://www.aboutyun.com/thread-6855-1-1.html个人观点:大数据我们都知道hadoop,但并不都是hadoop.我们该如何构建大数据库项目。对于离线处理,hadoop还是比较适合的,但是对于实时性比较强的,数据量比较大的,我们可以采用Storm,那么Storm和什么技术搭配,才能够做一个适合自己的项目。下面给大家可以参考。可以带着下面问题来阅读本文章
向往的生活Life
·
2023-10-26 15:06
hadoop
storm
hadoop
大数据
storm
flume-ng
kafka
来看看年薪80W的大数据大牛是如何理解 hbase 的架构及设计原理
它是Apache软件基金会Hadoop项目的一部分,运行于
HDFS
文件系统之上,为Hadoop提供类似于BigTable规模的服务。
Java程序员YY
·
2023-10-26 13:13
Flink写入
HDFS
(文本,parquet,parquet+snappy)
flink版本:1.10.0code://构建env环境valenv=StreamExecutionEnvironment.getExecutionEnvironmentenv.enableCheckpointing(1000*60)//1000*60s一个checkpointenv.getCheckpointConfig.setCheckpointingMode(CheckpointingMod
乖乖猪001
·
2023-10-26 12:43
flink
大数据
hdfs
flink
java
【Flink 实战系列】Flink SQL 使用 filesystem connector 同步 Kafka 数据到
HDFS
(parquet 格式 + snappy 压缩)
FlinkSQL同步Kafka数据到
HDFS
(parquet+snappy)在上一篇文章中,我们用datastreamAPI实现了从Kafka读取数据写到
HDFS
并且用snappy压缩,今天这篇文章我们来实现一个
JasonLee实时计算
·
2023-10-26 12:12
Flink
实战系列
kafka
flink
sql
hdfs
修炼k8s+flink+
hdfs
+dlink(六:学习namespace,service)
一:什么是namespace?你可以认为namespaces是你kubernetes集群中的虚拟化集群。在一个Kubernetes集群中可以拥有多个命名空间,它们在逻辑上彼此隔离。他们可以为您和您的团队提供组织,安全甚至性能方面的帮助!二:怎么创建绑定namespace?1.创建。cat>>product_namespaces.yaml<
宇智波云
·
2023-10-26 12:36
1024程序员节
Hadoop
HDFS
数据流
HDFS
写数据流程
HDFS
写数据流程.png客户端通过DistributedFileSystem模块向NameNode请求上传文件,NameNode检查目标文件是否已存在,父目录是否存在。
yljphp
·
2023-10-26 09:51
HDFS
集群NameNode高可用改造
文章目录背景高可用改造方案实施环境准备配置文件修改应用配置集群状态验证高可用验证背景假定目前有3台zookeeper服务器,分别为zk-01/02/03,DataNode服务器若干;目前
HDFS
集群的Namenode
qq184861643
·
2023-10-26 07:25
中间件
#
Hadoop
hdfs
hadoop
大数据
Hadoop3.0大数据处理学习2(
HDFS
)
一、简介
HDFS
:HadoopDistributedFileSystem。Hadoop分布式存储系统一种允许文件通过网络在多台主机上分享的文件系统,可以让多机器上的用户分享文件和存储空间。
Huathy-雨落江南,浮生若梦
·
2023-10-26 07:25
Hadoop
大数据
hdfs
hadoop
大数据测试v 1.0
本次测试从6-12到7-12号整整历时1个月,除去休息,真正大约20个工作日,在这20个工作日里面,中途周末加过几次班,满打满算应该20多天,接触并经历了大数据功能测试、一体机性能测试、大数据Hadoop
HDFS
武晓兵
·
2023-10-26 06:17
大数据
云计算
第五课 Hbase存储详解
是建立的
hdfs
之上,提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统。它介于nosql和RDBMS之间,仅能通过主键(rowkey)和主键的range来检索数据,仅支持单行事务。
Arroganter
·
2023-10-26 05:38
大数据系列之Spark集群环境部署
Spark作为一种大数据分布式计算框架,已经构建SparkStreaming、SparkSQL、SparkML等组件,与文件系统
HDFS
、资源调度YARN一起,构建了Spark生态体系,如下图所示:以下部分将主要介绍
solihawk
·
2023-10-26 04:51
大数据系列
#
spark
大数据
spark
HBase 压缩策略DateTieredCompactionPolicy
HBase是采用Log-StructuredMergeTree的架构,随着Flush阶段的不断触发,生成许多的HFile(默认128M),而不管是对于
HDFS
还是现有的HDD磁盘,大量的文件都会产生许多的问题
凡尔Issac
·
2023-10-26 03:44
linux查询日志命令加过滤,Linux记录-筛选日志sed、find、tail,du,awk命令
1.查看某一段时间的日志#cat
hdfs
-audit.log|sed-n'/2018-04-1110:00:00/,/2018-04-1110:01:00/p'|more---直接使用时间段#cat
hdfs
-audit.log
长亮不灭
·
2023-10-26 02:44
linux查询日志命令加过滤
hadoop集群搭建
hadoop有三种部署方式1、Local(Standalone)Mode(单机模式)数据存储在本地2、Pseudo-DistributedMode(伪集群模式)数据存储在
HDFS
3、Fully-DistributedMode
有人看我吗
·
2023-10-25 16:51
#
hadoop
hadoop
大数据
分布式
MR——worldcount案例
junitjunitRELEASEorg.apache.logging.log4jlog4j-core2.8.2org.apache.hadoophadoop-common2.6.0org.apache.hadoophadoop-client2.6.0org.apache.hadoophadoop-
hdfs
2.6.02
尘缘未了-
·
2023-10-25 13:57
hadoop
java
Spark-Core
依赖关系2.1查看血缘关系2.2查看依赖关系2.3窄依赖2.4宽依赖2.5Stage任务划分3、RDD持久化3.1Cache缓存3.2CheckPoint检查点3.3缓存和检查点区别3.4检查点存储到
HDFS
ha_lydms
·
2023-10-25 09:56
大数据
1024程序员节
spark-core
spark
Hadoop核心机制详细解析
Hadoop核心机制详细解析Hadoop的核心机制是通过
HDFS
文件系统和MapReduce算法进行存储资源、内存和程序的有效利用与管理。
Amao_come_on
·
2023-10-25 09:18
1024程序员节
【大数据】Hadoop
文章目录概述Hadoop组成
HDFS
MapReduce写MapReduce程序(Hadoopstreaming)YARNHadoop启动工作方式Hadoop的主从工作方式Hadoop的守护进程运行模式本地运行模式伪分布式运行模式完全分布式运行模式
软泡芙
·
2023-10-25 06:22
开发
1024程序员节
hadoop
大数据
大数据 - (六-2)- HBase
2)⽀持好多列HBase的特点海量存储:底层基于
HDFS
存储海量数据列式存储:HBase表的数据是基于列族进⾏存储的,⼀个列族包含若⼲列极易扩展:底层依赖
HDFS
,当磁盘空间不⾜的时候,只需要动态增加DataNode
啦啦啦喽啰
·
2023-10-25 04:38
未找到 ‘
hdfs
‘ 命令,您要输入的是否是: 命令 ‘hfs‘ 来自于包 ‘hfsutils-tcltk‘ (universe) 命令 ‘hdfls‘ 来自于包 ‘hdf4-tools‘ ....
在学习中碰到这个问题,问了老师,老师说是要配置bin的路径,找到了方法:Firstofall,在这之前,一定要做好备份!!!:直接复制你的虚拟机,粘贴在D盘里,然后打开粘贴后的虚拟机来修改,如果后面出错可以打开你那个原来的虚拟机。then,你需要:vim~/.bashrc你需要在开头加入【但,先将你这里面原先的内容复制一份txt到桌面,以防万一。并且记住你修改的这个文件的位置在哪里。】:expor
ZYT_庄彦涛
·
2023-10-25 03:31
大数据
linux
vim
linux
大数据
你想了解的分布式文件系统
HDFS
,看这一篇就够了
1、分布式文件系统计算机集群结构分布式文件系统把文件分布存储到多个节点(计算机)上,成千上万的计算机节点构成计算机集群。分布式文件系统使用的计算机集群,其配置都是由普通硬件构成的,与用多个处理器和专用高级硬件的并行化处理装置相比,前者大大降低了硬件上的开销。分布式文件系统的结构分布式文件系统在物理结构上是由众多阶段及节点构成的,而这些节点中分为两类。一类是主节点(MasterNode),又被称为名
与李_han
·
2023-10-25 01:48
hive知识点总结
Hive一、Hive简介什么是HiveHive由FaceBook实现并开源基于Hadoop的数据仓库工具可以将结构化的数据映射为一张数据库表并提供HQL(HiveSql)查询功能底层数据是存储在
HDFS
看着天上飞的猪
·
2023-10-25 01:53
大数据开发
hive
hadoop
大数据
Hadoop+Hive+Spark+Hbase开发环境练习
1.练习一1.数据准备在
hdfs
上创建文件夹,上传csv文件[root@kb129~]#
hdfs
dfs-mkdir-p/app/data/exam查看csv文件行数[root@kb129~]#
hdfs
dfs-cat
不吃香菜lw
·
2023-10-24 23:45
hadoop
hive
spark
hbase
HDFS
分布式文件系统设计原理
Hadoop分布式文件系统(
HDFS
)是一种被设计成适合运行在通用硬件上的分布式文件系统。
HDFS
是一个高度容错性的系统,适合部署在廉价的机器上。
zhaohong_bo
·
2023-10-24 19:34
学习笔记
HDFS
分布式文件系统
设计原理
<官网学大数据>Hive
Hive简介Hive是简历在Hadoop
HDFS
上的数据仓库基础架构Hive可以用来进行数据提取转化加载(ETL),通过sqoop加载数据Hive定义了简单的sql查询语言HqlHive是SQL解析引擎
kangapp
·
2023-10-24 16:48
2021年 全网最细大数据学习笔记(二):Hadoop 伪分布式安装
伪分布式安装1、Ubuntu20.04.2.0安装jdk2、配置SSH无密码登录3、Hadoop的下载与安装4、Hadoop环境配置5、启动与关闭Hadoop6、查看Hadoop的基本信息6.1、查看
HDFS
Web
Amo Xiang
·
2023-10-24 16:17
大数据开发
hadoop
大数据
linux
hadoop 伪分布式模式学习笔记
我采用的是hadoop-2.8.0,它主要包含3大块:
hdfs
:分布式存储系统
HDFS
(HadoopDistributedFileSystem)分布式存储层map
金曜软件工程师
·
2023-10-24 16:44
大数据
大数据
大数据学习
hadoop
人工智能
day_01小笔记----本地运行Hadoop 案例、伪分布式运行Hadoop 案例
0、hadoop1.x和hadoop2.x区别Hadoop1.x的核心组件与Hadoop2.x核心组件不一样Hadoop1.x:
hdfs
、common、mapreduce(mapreduce同时处理业务逻辑运算和资源调度
web15285868498
·
2023-10-24 16:12
java
java
后端
Hadoop伪分布式集群笔记
1、基本介绍以下是从其他地方抄过来了,目的是对即将要学的东西做一个基本的了解
HDFS
(分布式文件系统):解决海量数据存储YARN(作业调度和集群资源管理框架):解决资源任务调度MAPREDUCE(分布式运算变成框架
爆炒八酱
·
2023-10-24 16:40
hadoop
hadoop
分布式
大数据
分布式集群上安装hive及问题解决
因为hive是数据仓库,它主要就是将执行的sql语句转化为mapreduce任务,存储结构化数据,其实数据还是存储在
hdfs
上的,所以依赖hadoop集群,在此我们将hive安装到master节点。
技多不压身
·
2023-10-24 15:10
hive
hive
mysql
hadoop
【hadoop——
HDFS
操作常用的Shell命令】
1.Hadoop分布式文件系统(HadoopDistributedFileSystem,
HDFS
)是Hadoop核心组件之一,我们已经安装好了Hadoop2.7.1,其中已经包含了
HDFS
组件,不需要另外安装最基本的
所 爱
·
2023-10-24 14:34
hadoop
hadoop
hdfs
Hadoop单点安装FAQ
安装源:yuminstallepel-release-yQ1:Startingnamenodeson[localhost]ERROR:Attemptingtolaunch
hdfs
namenodeasrootERROR
DoNotStop
·
2023-10-24 11:08
hadoop
hadoop
上一页
29
30
31
32
33
34
35
36
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他