E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
分布式文件系统HDFS
ClickHouse基于数据分析常用函数
1.2调用函数1.3子查询二、GROUPBY子句(结合WITHROLLUP、CUBE、TOTALS)三、FORM语法3.1表函数3.1.1file3.1.2numbers3.1.3mysql3.1.4
hdfs
懒惰的小白521
·
2024-02-03 08:31
大数据
java
数据分析
clickhouse
sql
Hadoop:学习
HDFS
,看完这篇就够了!
HDFS
(HadoopDistributedFileSystem)是ApacheHadoop生态系统中的
分布式文件系统
,用于存储和处理大规模数据集。
爱写代码的July
·
2024-02-03 08:09
大数据与云计算
hadoop
学习
hdfs
大数据
云计算
Hadoop:
HDFS
学习巩固——基础习题及编程实战
一
HDFS
选择题1.对
HDFS
通信协议的理解错误的是?
爱写代码的July
·
2024-02-03 08:09
大数据与云计算
hadoop
hdfs
学习
Hadoop生态圈-组件介绍
Hadoop的核心组件是
HDFS
、MapReduce。
苏尔伯特
·
2024-02-03 00:19
手把手教Hadoop环境搭建,学不会你咬我~
目录前置条件配置SSH免密登录Hadoop(
HDFS
)环境搭建Hadoop(YARN)环境搭建1、前置条件Hadoop的运行依赖JDK,需要预先安装,安装步骤见:1.1下载并解压在官网下载所需版本的JDK
程序IT圈
·
2024-02-02 23:11
hadoop
jdk
linux
centos
hdfs
单机搭建hadoop环境(包括
hdfs
、yarn、hive)
单机可以搭建伪分布式hadoop环境,用来测试和开发使用,hadoop包括:
hdfs
服务器yarn服务器,yarn的前提是
hdfs
服务器,在前面两个的基础上,课可以搭建hive服务器,不过hive不属于
howard_shooter
·
2024-02-02 23:39
大数据
hadoop
大数据
分布式
Flink 的架构与组件
Flink支持各种数据源和接口,如Kafka、
HDFS
、TCP流等,并可以将处理结果输出到各种数据接收器,如
HDFS
、Elasticsearch、Kafka等。
禅与计算机程序设计艺术
·
2024-02-02 20:06
flink
架构
大数据
分布式文件系统
(DFS)-- 详解
1.了解
分布式文件系统
1.1了解什么是
分布式文件系统
分布式文件系统
(DistributedFileSystem,DFS)是一种计算机文件系统,它将网络上不同计算机的文件系统集成在一起,使得用户就像在自己的本地机器上一样访问和操作文件
LtMamba
·
2024-02-02 18:23
#
ds
分布式
fastdfs --详解
1.为什么会存在fastdfs参考链接–了解为什么有分布式参考链接–
分布式文件系统
详解FastDFS是一个开源的轻量级
分布式文件系统
,主要解决了海量数据存储问题,特别适合以中小文件(建议范围:4KB[storageserverlist
LtMamba
·
2024-02-02 18:18
#
C
#
linux
dfs
DataX介绍
一、介绍DataX是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、
HDFS
、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。
有人看我吗
·
2024-02-02 18:03
大数据
datax
datax 学习记录
初识DataX是由阿里巴巴研发并开源的一个异构数据源离线同步工具,DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、
HDFS
、Hive、ADS、HBase
咳咳00
·
2024-02-02 17:58
学习
大数据
datax
datax避坑记录
DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、
HDFS
、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS
佛祖保佑永不宕机
·
2024-02-02 17:28
数据库
数据库
Hadoop原理
Hadoop框架分布式文件存储-
HDFS
即Hadoop内提供分布式数据存储的文件系统分布式计算框架-MapReduce即Hadoop内提供的进行分布式计算的组件分布式资源调度-YARN即Hadoop内提供的进行分布式资源调度的组件
我走之後
·
2024-02-02 14:25
hadoop
大数据
分布式
实现Redis亿级存储的方案
在
hdfs
的帮助下离线存储千亿记录并不困难,然而DMP还需要提供毫秒级的实时查询。由于cookie这种id本
skyito88
·
2024-02-02 12:25
编程
php
Hive基本操作
在所有操作前先启动
hdfs
、yarn、historyserver。
明明德撩码
·
2024-02-02 11:19
Hadoop-生产调优(更新中)
第1章
HDFS
-核心参数1.1NameNode内存生产配置1)NameNode内存计算每个文件块大概占用150byte,一台服务器128G内存为例,能存储多少文件块呢?
OnePandas
·
2024-02-02 07:47
Hadoop
hadoop
大数据
分布式
Docker多节点部署Minio
分布式文件系统
并测试
文章目录一、前提准备二、文件配置1.`.env`2.`env/minio.env`3.`docker-compose-minio.yml`三、测试四、Java测试1.引入依赖2.增删改一、前提准备准备如下文件夹和文件./├──docker-compose-minio.yml├──.env├──env│├──minio.env├──minio│├──minio1││├──data1││└──data
木子dn
·
2024-02-02 01:07
Server架构
#
分布式文件系统
docker
容器
hdfs
黑猴子的家:API 操作
HDFS
文件夹删除
1、Code->GitHubhttps://github.com/liufengji/hadoop_
hdfs
.git2、Code@TestpublicvoiddeleteAt
HDFS
()throwsException
黑猴子的家
·
2024-02-02 00:29
NFS 网络文件系统
NFS协议是在
分布式文件系统
的基础上发展而来的,最早由SunMicrosystems开发,现已成为一个通用的文件共享协议,在UNIX和类UNIX系统中广泛使用。特点:
樂夢
·
2024-02-01 23:08
网络
linux
运维
服务器
1 初识Ceph
Ceph是加州大学SantaCruz分校的SageWeil专为博士论文设计的
分布式文件系统
,支持对象存储、块存储和文件存储。从2004年新建第一个文件夹至今,经历了多次迭代,目前已是分布式存储的首选。
DaemonXiao
·
2024-02-01 21:21
大数据开发流程图
它可以将一个关系数据库中数据导入Hadoop的
HDFS
中,也可以将
HDFS
中的数据导入关系型数据库中。Flume:实时数据采集的一个开源框架,它是Cloudera提供的一个高可用
xyzkenan
·
2024-02-01 14:30
大数据开发
大数据
大数据开发流程
大数据之Spark
专为大规模数据处理而设计的快速通用的计算引擎类HadoopMapReduce的通用并行计算框架拥有HadoopMapReduce所具有的优点但不同于MapReduce的是Job中间输出结果可以缓存在内存中,从而不再需要读写
HDFS
进击的-小胖子
·
2024-02-01 12:37
大数据
spark
big
data
scala
大数据
实时大数据
confluent入库hive安全认证问题
测试环境中已经实现,但生产环境中由于平台开启了Kerberos安全认证服务,所以一直报认证失败的日志.5caab36655bd3confluent:confluent将数据导入hive库:先将数据导入到
hdfs
建康_木子
·
2024-02-01 10:08
Hadoop3.x基础(2)-
HDFS
来源:B站尚硅谷目录
HDFS
概述
HDFS
产出背景及定义
HDFS
优缺点
HDFS
组成架构
HDFS
文件块大小(面试重点)
HDFS
的Shell操作(开发重点)基本语法命令大全常用命令实操准备工作上传下载
HDFS
魅美
·
2024-02-01 09:22
大数据基础
大数据
hadoop
报错:ERROR: org.apache.hadoop.hbase.PleaseHoldException: Master is initializing解决方案
hbase4.关闭hbase输入stop-hbase.sh如果未能退出,就使用kill-9进程号强制删除5.重新启动start-hbase.sh此时已经可以正常运行6.如果以上操作还是不成功删除hbase在
hdfs
:)คิดถึง
·
2024-02-01 09:35
错误处理
hbase
关于Hadoop进行namenode格式化时ERROR conf.Configuration: error parsing conf xxx.xml错误的问题
namenode格式化时ERRORconf.Configuration:errorparsingconfxxx.xml错误的问题在配置完core-default.xml,mapred-site.xml,
hdfs
-default
平江路的鱼
·
2024-02-01 09:34
大数据
hadoop
Linux
格式化
错误
大数据
HBase介绍
GFS是GoogleFileSystem,开源实现是
HDFS
(HadoopFileSystem)。MapReduce计算框架的开源实现是HadoopMapReduce。
M.Rambo
·
2024-02-01 06:09
hbase
数据库
大数据
分布式
java
2019/2/20Hbase单节点安装
解压过程即为安装过程解压=》为了让hbase的存放路径指定ns这个组名(防止出先不认识“ns”的错误)[root@zhiyou01~]#cp/usr/hadoop/hadoop-2.7.3/etc/hadoop/
hdfs
-site.xml
阳光正好微风不燥_c509
·
2024-02-01 05:39
Hadoop 大数据技术原理与应用
Hadoop大数据技术原理与应用大数据概述定义特征大量,多样,高速,价值研究意义应用场景医疗,金融,零售Hadoop概述历史优势扩容能力强,成本低,高效率,可靠性,高容错Hadoop生态分布式存储系统(
HDFS
kk8_
·
2024-02-01 04:33
hadoop
大数据
hdfs
大数据高频面试题一:hive和Oracle的区别
Hive和Oracle数据库最大的区别在于存储和计算方面:Hive存储在
hdfs
上(Hadoop
分布式文件系统
容错性高),Oracle将数保存在本地文件系统中。
半亩书田
·
2024-02-01 02:47
面试题
hive
hadoop
大数据
Sqoop数据的导入导出
数据导入1、导入数据库表数据到
hdfs
mysql创建表,插入数据,为了使用方便复制了如下mysql>usetestReadingtableinformationforcompletionoftableandcolumnnamesYoucanturnoffthisfeaturetogetaquickerstartupwith-ADatabasechangedmysql
小猪Harry
·
2024-01-31 18:21
HDFS
HA 之 HA 原理
1ZKFC解析HA(HighAvailability)是
HDFS
支持的一个重要特性,可以有效解决ActiveNamenode遇到故障时,将可用的Standby节点变成新的Active状态的问题,使集群能够正常工作
Studying!!!
·
2024-01-31 18:54
中间件
hdfs
hadoop
大数据
HDFS
HA 之 Quorum Journal Manager
1、HA的发展历程1.1Secondarynamenode通过Secondarynamenode作为备节点,然后冷备namenode数据,为Namenode分担部分压力,主要执行Checkpoint工作。在这种架构体系下,Namenode以单点的形式运行,一旦系统集群出现故障,可用性是致命的,目前基本不使用了。1.2QJM在HAUsingQJM方案中,涉及的核心部分包括:ActiveNamenod
Studying!!!
·
2024-01-31 18:24
中间件
hdfs
hadoop
大数据
数据湖技术Iceberg0.12预研文档
Iceberg0.12预研本次预研场景主要为kafka=>flinksql=>iceberg=>hive=>
hdfs
=>trino(presto)本次预研使用组件如下:名称版本描述flink1.12.1
我去探险了
·
2024-01-31 15:36
数据湖技术
hive
kafka
big
data
什么是分布式系统!以及分布式系统架构的优缺点
包括分布式操作系统、分布式程序设计语言及其编译系统、
分布式文件系统
分
架构师Javaspring
·
2024-01-31 15:57
Java抽取Hive、
HDFS
元数据信息
maven工程并配置pom.xml文件2.2编写配置文件application.yml2.3编写配置文件application.propertites2.4开发主启动类2.5开发配置类三、测试抽取Hive、
HDFS
m0_46218511
·
2024-01-31 14:06
java
java
hive
hdfs
【Spark系列6】如何做SQL查询优化和执行计划分析
一、查询优化示例1:过滤提前未优化的查询valsalesData=spark.read.parquet("
hdfs
://sales_data.parquet")valresult=salesData.groupBy
周润发的弟弟
·
2024-01-31 08:01
spark
sql
大数据
WARNING: HADOOP_SECURE_DN_USER has been replaced by
HDFS
_DATANODE_SECURE_USER. Using value of HADOOP
Hadoop启动时报错WARNING:HADOOP_SECURE_DN_USERhasbeenreplacedby
HDFS
_DATANODE_SECURE_USER.UsingvalueofHADOOP_SECURE_DN_USER
W_yhhh
·
2024-01-31 08:44
hadoop
hdfs
大数据
hadoop-
hdfs
-site.xml配置文件详解
hadoop:
hdfs
-site.xml配置文件详解
hdfs
-site.xml配置文件j介绍hadoop-
hdfs
相关的配置信息
hdfs
-site.xml配置文件namevaluedescriptionhadoop.
hdfs
.configuration.version1versionofthisconfigurationfiledfs.namenode.logging.levelinfoThelo
许喜朝
·
2024-01-31 08:13
笔记
hdfs
hadoop
关于Hadoop全分布构建no
HDFS
_NAMENODE_USER 错误解决
常常会出现以下错误[root@Hadoopc1hadoop]#start-all.shStartingnamenodeson[192.168.13.245]ERROR:Attemptingtooperateon
hdfs
namenodeasrootERROR
(((φ(◎ロ◎;)φ)))云凡
·
2024-01-31 08:43
笔记
Hadoop
hadoop
hdfs
big
data
Hive基于MR/Tez/本地模式的对比
Hive本地模式在不同语句下的执行效率对比实验结论省去看实验过程的麻烦本地模式肉眼可见,效果极佳,但是对硬件和内存有一定要求,无法处理大数据量Tez优势是将具有依赖的多个作业转换成一个作业,从而减少与
HDFS
九筒-
·
2024-01-31 08:42
大数据
hive
hadoop
大数据
mapreduce
WARNING: HADOOP_SECURE_DN_USER has been replaced by
HDFS
_DATANODE_SECURE_USER.
hadoop启动时WARNING:HADOOP_SECURE_DN_USERhasbeenreplacedby
HDFS
_DATANODE_SECURE_USER.UsingvalueofHADOOP_SECURE_DN_USER
北朽暖栀24
·
2024-01-31 08:41
linux系统
hadoop
hdfs
linux
ubuntu
Hadoop_
HDFS
_
hdfs
文件系统操作指令
hadoop.apache.org/docs/r2.7.3/hadoop-project-dist/hadoop-common/FileSystemShell.html下载文档时,当前最新版本3.0.0beta这里介绍下常用的
hdfs
高达一号
·
2024-01-31 08:11
Hadoop
hadoop
hdfs操作指令
hdfs
启动集群时遇到WARNING: HADOOP_SECURE_DN_USER做替换
启动集群时遇到WARNING:HADOOP_SECURE_DN_USERhasbeenreplacedby
HDFS
_DATANODE_SECURE_USER.UsingvalueofHADOOP_SECURE_DN_USER
Dirth.
·
2024-01-31 08:40
大数据
hadoop
Hadoop搭建集群中输入
hdfs
namenode -format格式化节点时,提示:
hdfs
command not found 解决办法
分析原因:hadoop的安装路径没有加入到当前路径中解决办法:方法1:进入hadoop的安装目录,在执行hadoop命令时在前面加上:./bin./sbin方法2:进入/etc/profile文件中添加hadoop的安装路径sudovim/etc/profile添加:exportHADOOP_HOME=本机的hadoop安装路径exportPATH=$HADOOP_HOME/bin:$HADOOP
drhrht
·
2024-01-31 08:05
java
java
后端
Hadoop中
hdfs
-default.xml的位置
在hadoop安装包中hadoop-2.7.2\share\hadoop\
hdfs
\hadoop-
hdfs
-2.7.jar里面
BugEveryday
·
2024-01-31 08:31
Hadoop
hadoop
Hadoop 3.x
hdfs
-site.xml
HDFS
最小化配置参数
dfs.namenode.http-addressc101:9870dfs.namenode.secondary.http-addressc102:9868########################################################配置文件修改后,启动./start-dfs.sh的时候会提示找不到JAVA_HOME的报错,虽然配置了jdk的环境。还需要配置had
ChengRuoFei
·
2024-01-31 08:31
Hadoop
hadoop
hdfs
xml
2024-01-30(Hadoop_
HDFS
)
1.什么是大数据狭义(技术思维):使用分布式技术完成海量数据的处理,得到数据背后蕴含的价值。广义:大数据是数字化时代,信息化时代的基础(技术)支撑,以数据为生活赋能。大数据的核心工作:从海量的高增长、多类别、低信息密度的数据中挖掘出高质量的结果。(海量数据存储、海量数据传输、海量数据计算)2.大数据的核心工作存储:妥善保存海量待处理数据计算:完成海量数据的价值挖掘传输:协助各个环节的数据传输3.大
陈xr
·
2024-01-31 08:30
随记日志
hadoop
大数据
hdfs
Hadoop生态系统中一些关键组件的详细解析
1.Hadoop核心组件
HDFS
(HadoopDistributedFileSystem):分布式文件存储系统。提供高吞吐量的数据访问,非常适合用于大规模数据集。
薛定谔的zhu
·
2024-01-31 07:27
hadoop
大数据
Springboot快速教程---Docker搭建与整合Hbase
Hbase简介HBase是Hadoop的生态系统,是建立在Hadoop文件系统(
HDFS
)之上的分布式、面向列的数据库,通过利用Hadoop的文件系统提供容错能力。
爆米花机枪手
·
2024-01-31 07:53
JAVA
Maven
Docker
springboot
hbase
docker
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他