E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfs日常维护
综合架构-nfs备份服务(网络文件系统)
NFS系统和Windows网络共享、网络驱动器类似,只不过windows用于局域网,NFS用于企业集群架构中,如果是大型网站,会用到更复杂的分布式文件系统FastDFS,glusterfs,
HDFS
1.1
A宽宽
·
2023-11-20 20:13
分布式架构关键技术
作为这个领域最富盛名的开源项目,Hadoop实现的是分布式的文件系统
HDFS
,和分布式的计算(Map/Reduce)框架。分布式架构关键技术主要有分布式文件系统、分布式存储和分布式数据库。分
talentluke
·
2023-11-20 20:53
架构设计
数据库
运维
java
Flume基本原理及使用
Flume最主要是用在分布式系统中,例如读取服务器本地的磁盘数据,并将数据写入到
HDFS
中。对Flume的学习,最好就是结合官方文档进行学习。
zkyCoder
·
2023-11-20 18:45
Flume
flume
数据仓库
大数据技术之Flume(概述,安装,案例等)
输入的的数据速率大于写入目的存储的速率,flume会进行缓冲,减小
hdfs
的压力。flume中的事务基于channel,使用了两个事务模型(sender+receiver),确保消息被可靠发送
往事随风_h
·
2023-11-20 18:37
Flume
Flume安装
关于Flume
Flume案例
21、MapReduce读写SequenceFile、MapFile、ORCFile和ParquetFile文件
Hadoop系列文章目录1、hadoop3.1.4简单介绍及部署、简单验证2、
HDFS
操作-shell客户端3、
HDFS
的使用(读写、上传、下载、遍历、查找文件、整个目录拷贝、只拷贝文件、列出文件夹下文件
一瓢一瓢的饮 alanchan
·
2023-11-20 13:18
#
hadoop专栏
mapreduce
hadoop
hdfs
大数据
big
data
三十分钟学会Hive
Hive的概念与运用Hive是一个构建在Hadoop之上的数据分析工具(Hive没有存储数据的能力,只有使用数据的能力),底层由
HDFS
来提供数据存储,可以将结构化的数据文件映射为一张数据库表,并且提供类似
地球魔
·
2023-11-20 12:11
hive
hadoop
数据仓库
让你彻底学会HBase
利用Hadoop
HDFS
作为其文件存储系统,利用ZooKeeper作为其分布式协同服务。主要用来存储非结构化和半结构化的松散数据(列式存储NoSQL数据库)。
地球魔
·
2023-11-20 12:11
hbase
数据库
大数据
HDFS
完全分布式集群搭建与配置及常见问题总结
思路:1.准备3台虚拟机(静态IP,IP映射,主机名称,防火墙关闭,普通用户创建等等)2.安装JDK,配置环境变量3.安装Hadoop,配置环境变量4.配置免密登录5.编写同步脚本,配置集群(前三步已完成)搭建集群步骤1.首先要关闭防火墙systemctlstopfirewalldsystemctldisablefirewalldsystemctlstatusfirewalld2.还要关闭SELi
HUNG4050
·
2023-11-20 12:03
分布式
hdfs
java
hadoop
HDFS
常见面试题
HDFS
小文件问题小文件过多有什么坏处?主要是NameNode内存会受限。由于NameNode会将文件系统的元数据都存储在内存中,因此所能存储的文件总量受限于NameNode的内存总容量。
海中大咸鱼
·
2023-11-20 12:02
hadoop
hdfs
hadoop
big
data
dfs
hdfs
修改文件名称_第五讲:hadoop的分布式存储
HDFS
常见操作
HDFS
是一个分布式文件系统,像任何其它文件系统,允许用户使用shell命令操作文件系统。
西岸先生
·
2023-11-20 12:31
dfs
hdfs
修改文件名称
HDFS
常见API操作
HDFS
常见API操作一个刚开始学习大数据的小白,愿意和大家分享所学所得。
_小张要敲代码
·
2023-11-20 12:58
java
hdfs
hadoop
大数据
HDFS
权限管理以及ACL介绍
一篇文章搞懂
HDFS
权限管理
HDFS
承载了公司内多个部门几十条业务线的几十PB数据,这些数据有些是安全级别非常高的用户隐私数据,也有被广泛被多个业务线使用的基础数据,不同的业务之间有着复杂的数据依赖。
Hellooorld
·
2023-11-20 12:57
大数据
hdfs权限
POSIX
POSIX
ACLS
hdfs
集群启动的常见问题
hdfs
集群启动的常见问题1、用浏览器访问namenode的50070端口,不正常,需要诊断问题出在哪里:a、在服务器的终端命令行使用jps查看相关进程观察节点是否存活b、如果已经知道了启动失败的服务进程
一溪云~
·
2023-11-20 12:27
Hadoop
Hadoop
hdfs
*
HDFS
完全分布式集群搭建与配置及常见问题总结*
小组介绍:哈喽大家好!我们是---哈了个Doop小组,接下来为大家做一下小组介绍。一共有六个成员。主要特点是由一名男生和五名女生组成,又称为“一汉娘子组”,由无所不能且帅气的文组长带领。成员有:优秀的诺同学和芝同学、有创意的灵同学、两位颜值担当的杰同学和张同学。组员介绍已完毕。使用电脑时很多朋友会发现一台计算机虽然可以安装多个操作系统,但是对电脑的硬件有着极大的要求,而虚拟机的出现则完美的解决了这
哈了个Doop
·
2023-11-20 12:26
hadoop
hdfs
大数据
HDFS
常见的异常处理方式汇总
ERRORorg.apache.hadoop.
hdfs
.server.datanode.DataNode:jav
Shockang
·
2023-11-20 12:21
大数据技术体系
hdfs
hadoop
big
data
四、
hdfs
文件系统基础操作-保姆级教程
1、启动Hadoop集群想要使用
hdfs
文件系统,就先要启动Hadoop集群。
弦之森
·
2023-11-20 12:20
Hadoop
hdfs
hadoop
大数据
数据库
五、
hdfs
常见权限问题
1、常见问题2、案例(1)问题(2)
hdfs
的超级管理员(3)原因没有使用Hadoop用户对
hdfs
文件系统进行操作。
弦之森
·
2023-11-20 12:48
Hadoop
hdfs
hadoop
大数据
HDFS
命令操作
常用命令一、hadoopfs(
hdfs
dfs)文件操作1)ls显示目录下的所有文件或者文件夹使用方法:hadoopfs-ls[uri形式目录]示例:hadoopfs–ls/显示根目录下的所有文件和目录显示目录下的所有文件可以加
ly稻草
·
2023-11-20 12:55
浅谈交互式查询⼯工具Impala(一)
一、Impala概述(Impala是什什么,优势,劣势,与Hive对⽐)Impala是什什么Impala是Cloudera提供的⼀一款开源的针对
HDFS
和HBASE中的PB级别数据进⾏行行交互式实时查询
顾子豪
·
2023-11-20 11:14
HDFS
、MapReduce原理--学习笔记
(2)狭义解释从狭义上来说,Hadoop是指Hadoop这个开源框架,它的核心组件有:a)
HDFS
(分布式文件系统):解决海量数据存储;b)MapReduce(分布式计算):解决海
祈愿lucky
·
2023-11-20 06:33
大数据
hdfs
mapreduce
学习
hadoop关于
hdfs
详细解答
HDFS
内容大数据的概念及其特征Hadoop简介及其生态圈
HDFS
的内部组件介绍
HDFS
的安装模式介绍独立模式伪分布式模式完全分布式的搭建
HDFS
的常用命令
HDFS
的设计思想
HDFS
的体系结构
HDFS
的工作机制
一个人的小样
·
2023-11-20 04:58
hadopp的hdfs详细解答
hdfs
Hive 剖析
Hive分区表分区为
HDFS
上表目录的子目录,数据按照分区存储在子目录中。
zhixingheyi_tian
·
2023-11-20 03:33
hive
hadoop
数据仓库
Hive效率优化记录
Hive是工作中常用的数据仓库工具,提供存储在
HDFS
文件系统,将结构化数据映射为一张张表以及提供查询和分析功能。
Forge_ahead
·
2023-11-20 03:26
work_efficiency
Study
hive
hadoop
数据仓库
大数据基础——
HDFS
(分布式文件系统)
分布式文件系统——
HDFS
文章目录分布式文件系统——
HDFS
HDFS
概述
HDFS
发展历史
HDFS
的设计目标HDSF应用场景适合的应用场景不适合的应用场景
HDFS
架构
HDFS
的基本原理NameNode概念
我菜的要死
·
2023-11-20 02:49
大数据
hdfs
big
data
hadoop
大数据研发工程师面试
9.
HDFS
的理解?10.hadoop对put一个文件
ChlinRei
·
2023-11-20 01:43
面试
大数据
面试
职场和发展
大数据开发面试(一)
适用于需要将大量数据发送到
HDFS
、HBase等存储系统的场景。具有较强的可靠性、可扩
ChlinRei
·
2023-11-20 01:41
面试
大数据
面试
etl工程师
9
HDFS
架构剖析
HDFS
集群有两类节点:一个namenode(管理节点)和多个datanode(工作节点)。namenode管理文件系统的命名空间。它维
水无痕simon
·
2023-11-19 23:41
Hadoop
hdfs
架构
hadoop
大数据安全 测试
测试1、用户hive/
[email protected]
和nn/1.common2.hadoop.fql.com分别对Hive进行查询(1)
HDFS
配置vim/usr/
bigdata-余建新
·
2023-11-19 22:50
大数据
大数据安全
Python大数据之linux学习总结——day10_hadoop原理
Hadoop原理Hadoop基础分布式和集群Hadoop框架概述生态圈版本更新hadoop架构[重点]官方示例圆周率练习词频统计[重点]需求:步骤:Hadoop-
HDFS
特点
hdfs
架构块和副本shell
笨小孩124
·
2023-11-19 20:38
Hadoop
学习总结
大数据
python
linux
ClickHouse基础知识(个人总结)
本文为我的个人复习总结,并非那种从零基础开始普及知识内容详细全面,言辞官方的文章2.由于是个人总结,所以用最精简的话语来写文章3.若有错误不当之处,请指出特点:列式存储,使用LSMTree结构,OLAP分析引擎,不依赖于
HDFS
hellosrc | forward
·
2023-11-19 18:28
ClickHouse
大数据
大数据
python 时间序列异常值_干货 :时间序列异常检测
有效的异常检测被广泛用于现实世界的很多领域,例如量化交易,网络安全检测、自动驾驶汽车和大型工业设备的
日常维护
。
霏阳
·
2023-11-19 17:22
python
时间序列异常值
Spark数据倾斜解决思路
1.避免数据源倾斜-
HDFS
Spark通过textFile(path,minPartitions)方法读取文件时,使用TextInputFormat。
小小大数据
·
2023-11-19 17:13
Spark
spark
大数据
kafka
4️⃣Hive
(Hive没有存储数据的能力,只有使用数据的能力)2.Hive本质将HQL转化成MapReduce程序Hive处理的数据存储在
HDFS
Hive分析数据底层的实现是MapReduce执行程序运行在Yarn
WovJf
·
2023-11-19 17:39
hive
数据仓库
Hadoop词频统计
这里写自定义目录标题前提制作JAR包启动Hadoop将wordfile1.txt上传到
HDFS
重新上传文件进行词频统计和注意事项
HDFS
常用命令前提1.安装了Linux系统,并且安装了Hadoop下的两个组件
weixin_49670340
·
2023-11-19 16:29
hadoop
HDFS
使用Hadoop 中自带的词频统计程序,对数据集进行词频统计
实验题目:词频统计假设
HDFS
上有两个文件wordfile1.txt和wordfile2.txt(其他文件也行),运行Hadoop中自带的词频统计程序,对数据集进行词频统计。
码猿小菜鸡
·
2023-11-19 16:28
大数据
人工智能
hadoop
big
data
词频统计
hdfs
Hadoop调用MapReduce进行词频统计
.前置准备1.传输文本文件2.环境搭建(1)使用VirtualBox虚拟机软件安装Ubuntu(2)在Ubuntu中安装Hadoop和Eclipse三.具体步骤1.下载保存文本文件2.将文本文件传输至
HDFS
3
MidnightFancy
·
2023-11-19 16:17
大数据
hadoop
ubuntu
mapreduce
eclipse
hdfs
HIVE与
HDFS
映射关系
问题1:Hive一条Select语句,底层是如何读取
HDFS
文件的?
Eqo
·
2023-11-19 15:40
复杂类型,查询--学习笔记
namestring,city_arrayarray)rowformatdelimitedfieldsterminatedby"\t"collectionitemsterminatedby",";--2.上传数据到
hdfs
祈愿lucky
·
2023-11-19 15:29
大数据
学习
笔记
大数据
Python大数据之linux学习总结——day06_hive02
知识点:示例:查看/修改表示例:默认分隔符示例:快速映射表[练习]知识点:示例:数据导入和导出文件数据加载导入1.直接上传文件window页面上传linux本地put上传2.load加载文件:load移动
HDFS
笨小孩124
·
2023-11-19 15:58
hive
学习任务
python
大数据
linux
sqoop
hdfs
入mysql_sqoop将
hdfs
下的数据导入到mysql如何去重?
sqoop执行的脚本我是这样写的sqoopexport–connectjdbc:mysql://localhost:3306/movie–usernameroot–passwordwelcome1–tablemovieRecommend–fields-terminated-by‘,’–export-dir/recommendoutrecommendout是我mapreduce程序处理后的输出目录,
唉唉唉哒
·
2023-11-19 14:05
sqoop
hdfs入mysql
elasticsearch 备份与恢复
本地备份一创建仓库首先需要创建一个仓库,仓库的类型支持Sharedfilesystem,AmazonS3,
HDFS
和AzureCloud,暂时只掌握了文件系统备份方式一:通过命令方式创建备份仓库a.修改
不会写诗的程序猿
·
2023-11-19 14:13
elk
备份与恢复
elasticdump
nfs远程挂载
2023-Hive调优最全指南
性能优化之数据倾斜专题五、HiveSQL优化十二板斧六、Hive面试题(一)七、Hive/Hadoop高频面试点集合(二)01-基于Hadoop的数据仓库Hive基础知识Hive是基于Hadoop的数据仓库工具,可对存储在
HDFS
000X000
·
2023-11-19 13:43
数据仓库
性能测试和优化
HIVE
hive
hadoop
大数据
Hive调优最全指南
大数据之hadoop-
hdfs
知识通俗详解
目录疑问存储模型(重要)架构设计角色功能NameNodeDataNode元数据持久化安全模式
HDFS
中的SNNSecondaryNameNode(SNN)Block的副本放置策略
HDFS
写流程
HDFS
读流程总结疑问分布式文件系统那么多
shw12357
·
2023-11-19 10:27
hadoop
05-Hadoop01之
HDFS
一、Hadoop介绍Hadoop分为三部分:Common、
HDFS
、Yarn、MapReduce(有点过时了)Hadoop生态圈:除了hadoop技术以外,还有hive、zookeeper、flume、
YuPangZa
·
2023-11-19 10:54
大数据
hdfs
hadoop
大数据
大数据基础设施搭建 - Hadoop
案例5.2.1创建wordcount输入文本信息5.2.2执行程序5.2.3查看结果六、分发压缩包到集群中其他机器6.1分发压缩包6.2解压压缩包6.3配置环境变量七、配置集群7.1核心配置文件7.2
HDFS
m0_46218511
·
2023-11-19 10:33
大数据基础设施搭建
大数据
hadoop
hdfs
多用户读写权限设置
多个用户都能对文件有操作(读写)权限.1》在
hdfs
中设置umask为002,则新目录的权限为775,新文件的权限为664,只要都是supergroup组的用户都有权限进行读写2》在namenode上创建
飞有飞言
·
2023-11-19 09:35
大数据实战平台环境搭建
大数据实战平台环境搭建一、创建Hadoop用户二、更新apt和安装Vim编辑器三、安装SSH和配置SSH无密码登录四、安装Java五、安装单机Hadoop六、Hadoop伪分布式安装七、
HDFS
常用命令八
ZShiJ
·
2023-11-19 08:13
虚拟机
hadoop
java
大数据
2023.11.17 hadoop之
HDFS
进阶
目录
HDFS
的机制元数据简介元数据存储流程:namenode生成了多个edits文件和一个fsimage文件edits和fsimage文件SecondaryNameNode辅助NameNode的方式:
HDFS
白白的wj
·
2023-11-19 08:35
hdfs
hadoop
大数据
sql
database
hive
HDFS
的文件写入和文件读取流程
这是
HDFS
在上传⽂件写数据过程时采⽤的⼀种数据传输⽅式。客户端将数据块写⼊第⼀个数据节点,第⼀个数据节点保存数据之后再将块复制到第⼆个数据节点,后者保存后将其复制到第三个数据节点。
cx330上的猫
·
2023-11-19 04:36
hdfs
hadoop
大数据
HDFS
架构
目录一,
HDFS
简介二、
HDFS
架构三、
HDFS
的工作机制一,
HDFS
简介①
HDFS
概念:HadoopDistributedFileSystem,是Hadoop项⽬的核⼼⼦项⽬,是分布式计算中数据存储管理的基础
cx330上的猫
·
2023-11-19 04:29
hdfs
hadoop
架构
上一页
27
28
29
30
31
32
33
34
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他