E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfshadoop大数据
图说
HDFS
基本原理
英文原版作者:ManeeshVarshney,
[email protected]
HDFS
是现在最受欢迎和被人们说熟知的分布式文件系统。
数据萌新
·
2023-12-06 18:40
ambari 安装及使用ambari安装hadoop记录
Ambari已支持大多数Hadoop组件,包括
HDFS
、MapReduce、Hive、Pig、Hbase、Zookeeper、Sqoop和Hcatalog等。ApacheAmbari支持
HDFS
yujianbujianqwe
·
2023-12-06 17:24
ambari
hadoop
大数据
大数据平台Ambari2.7.4+HDP3.1.4详细安装教程
Ambari已支持大多数Hadoop组件,包括
HDFS
、MapReduce、Hive、Pig、Hbase、Zookeeper、Sqoop和Hcatalog等。
csdnuser267
·
2023-12-06 17:20
大数据平台
HDP
大数据
Ambari简介&安装
Ambari目前已支持大多数Hadoop组件,包括
HDFS
、MapReduc
月苍.
·
2023-12-06 17:49
Ambari
ambari
大数据Hadoop分布式文件系统
HDFS
的两类节点NameNode和DataNode
HDFS
集群有两类节点,并以管理者-工作者模式运行,即一个NameNode(管理者)和多个DataNode(工作者)。
A尚学堂Nancy老师
·
2023-12-06 15:56
flume 实时监控 Hive 日志,并上传到
HDFS
中
的日志生成位置二、上传需要的jar包将commons-configuration-1.6.jar、hadoop-auth-3.1.2.jar、hadoop-common-3.1.2.jar、hadoop-
hdfs
无名刺客
·
2023-12-06 12:41
大数据
大数据
Flume 概述+环境配置+监听Hive日志信息并写入到
hdfs
Flume介绍Flume是Apache基金会组织的一个提供的高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。当前Flume有两个版本,Flume0.9x版本之前的统称为Flume-og,Flume1.X版本被统称为Flume-ng。参考文档:http
Transkai47
·
2023-12-06 12:40
大数据
linux
java
hadoop
python
二百一十二、Flume——Flume实时采集Linux中的目录文件写入到
HDFS
中(亲测、附截图)
一、目的在实现Flume实时采集Linux中的Hive日志写入到
HDFS
后,再做一个测试,用Flume实时采集Linux中的目录文件,即使用Flume监听Linux整个目录的文件,并上传至
HDFS
中二、
天地风雷水火山泽
·
2023-12-06 12:10
Flume
flume
linux
hdfs
flume和kafka整合——采集实时日志落地到
hdfs
flume和kafka整合——采集实时日志落地到
hdfs
一、采用架构二、前期准备2.1虚拟机配置2.2启动hadoop集群2.3启动zookeeper集群,kafka集群三、编写配置文件3.1slave1
奋斗的IT小白菜
·
2023-12-06 12:39
Flume
kafka
Flume采集数据到Hive&HBase
文章目录Flume汇入数据到Hive方法一:汇入到Hive指定的
HDFS
路径中:方法二:利用HiveSink汇入数据Flume汇入数据到HBase一、Flume的HBaseSinks详细介绍1.1、HBaseSink1.2
哈了个Doop
·
2023-12-06 12:08
hdfs
hadoop
hive
hbase
Flume监控Hive日志并上传到
HDFS
一、实时监控单个追加文件1.需求:实时监控Hive日志,并上传到
HDFS
2.实现步骤:(1)上传Hadoop相关jar包到flume/lib目录下flume相关jar包https://blog.csdn.net
无发可脱丶
·
2023-12-06 12:37
笔记
学习
flume
大数据
flume
实时监控 Hive 日志,并上传到
HDFS
中
Flume要想将数据输出到
HDFS
,依赖Hadoop相关jar包检查/etc/profile.d/my_env.sh文件,确认Hadoop和Java环境变量配置正确创建flume-file-
hdfs
.conf
夏殿灬青葛石
·
2023-12-06 12:07
Flume
hdfs
hive
hadoop
二百一十一、Flume——Flume实时采集Linux中的Hive日志写入到
HDFS
中(亲测、附截图)
一、目的为了实现用Flume实时采集Hive的操作日志到
HDFS
中,于是进行了一场实验二、前期准备(一)安装好Hadoop、Hive、Flume等工具(二)查看Hive的日志在Linux系统中的文件路径
天地风雷水火山泽
·
2023-12-06 12:36
Flume
flume
hive
hdfs
Doris数据备份及恢复
如BOS、
HDFS
等。可以通过SHOWBROKER;查看当前部署的
shangjg3
·
2023-12-06 08:48
Doris
大数据
数据仓库
doris
sql
spark不同结构Dataset合并
1.先将
hdfs
(或本地)存储的csv文件加载为Dataset先在本地C盘准备两个csv文件test.csvclient_id,behives,del,normal_status,cust_type,no_trd_days7056
容若只如初见
·
2023-12-06 07:03
spark
大数据
分布式
spark 写入 hudi时数据类型报错
Causedby:org.apache.spark.sql.execution.QueryExecutionException:Parquetcolumncannotbeconvertedinfile
hdfs
南城守护
·
2023-12-06 07:31
spark
大数据
分布式
使用 Apache Kafka 进行实时流处理
其架构更多地继承了
HDFS
、HBase或Cassandra等存储系统,而不是实现
wouderw
·
2023-12-06 05:37
apache
kafka
分布式
【读书笔记】《大数据技术体系详解:原理、架构与实践》03.分布式文件系统
这些文件形式的数据具有价值高、数据大、流式产生等特点,需要一个分布式文件系统存储它们,该文件系统应具有良好的容错性、扩展性和易用的API,而
HDFS
(HadoopDistributedFileSystem
粥一样温柔
·
2023-12-06 05:40
hive外部表分区
外部表和内部表内部表:数据由hive自身管理存储在hive指定的
hdfs
目录中删除会删除数据本身外部表(external):数据存储在用户使用location关键字指定的
hdfs
目录中hive中仅存储一份元数据删除操作不会影响到
nil_ddea
·
2023-12-06 00:54
Flink快速入门
分而治之批处理流处理-微信运动、信用卡月度账单、国家季度GDP增速MPI-节点间数据通信-c和pythonMR-2004谷歌提出的编程范式-hadoop/storm/spark/flinkHadoop-MR、
HDFS
WaiSaa
·
2023-12-05 21:30
Java
大数据
flink
大数据
Hadoop 概述
文章目录Hadoop概述Hadoop是什么Hadoop主要发展历程Hadoop优势Hadoop组成Hadoop1.x、2.x、3.x区别
HDFS
概述YARN概述MapReduce架构概述
HDFS
、YARN
撕得失败的标签
·
2023-12-05 19:59
Hadoop
hadoop
大数据
分布式
Hadoop生态圈
Apache Sqoop使用
Hadoop生态系统包括:
HDFS
、Hive、Hbase等RDBMS体系包括:MySQL、Oracle、DB2等Sqoop可以理
高过蓝天的云
·
2023-12-05 10:41
apache
sqoop
hadoop
Hadoop大数据
集群搭建(超详细)
使用了几个学期的实验手册,应该没有啥大问题了,现在分享给大家,希望对你学习hadoop有用实验环境:Vmwareworkstation+CentOS7+Hadoop3.1.3目录第一步:安装虚拟机第二步:虚拟机克隆第三步:网络配置第四步:ssh服务配置第五步:安装JDK第六步:安装Hadoop第七步:Hadoop集群配置第八步:格式化文件系统第九步:启动和关闭hadoop集群第十步:通过UI界面查
小飞飞V5
·
2023-12-05 08:49
大数据Hadoop
hadoop
大数据Hadoop集群的启动
1启动准备工作1.1配置操作系统的环境变量1.2创建Hadoop数据目录1.3格式化文件系统1.4启动和关闭Hadoop1.5验证Hadoop是否成功启动1.6hadoop-daemon.sh的使用2
HDFS
赵广陆
·
2023-12-05 08:13
hadoop
hadoop
big
data
hdfs
Hadoop
Hadoop生态系统是Apache基金会开发的分布式系统基础架构,它包括多个组件,如
HDFS
、MapReduce、Hive、HBase、Zookeeper等,这些组件可以相互兼容,组成了一个独立的应用体系
编织幻境的妖
·
2023-12-05 08:41
hadoop
大数据
分布式
7-
HDFS
的文件管理
单选题题目1:下列哪个属性是
hdfs
-site.xml中的配置?
阿伊同学
·
2023-12-05 06:06
hdfs
hadoop
大数据
Hadoop之YARN详解
Hadoop是一个开源的分布式计算框架,它的核心是
HDFS
和MapReduce。然而,随着Hadoop的发展,它的计算框架也在不断地演进。
蓝胖子的宝贝
·
2023-12-05 06:33
大数据技术分享
hadoop
mapreduce
大数据
Hadoop
Hadoop的基本架构包括以下几个核心组件:
HDFS
(HadoopDistributedFileSystem):它是一个高度容错性的分布式文件系统,能提供高吞吐量的数据访问,非常适合大规模数据集
编织幻境的妖
·
2023-12-05 06:31
hadoop
大数据
分布式
Hadoop的介绍与安装
Hadoop是由java语言编写的,在分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架,其核心部件是
HDFS
与MapReduce。
憨憨小白
·
2023-12-05 06:30
hadoop
大数据
分布式
二百一十、Hive——Flume采集的JSON数据文件写入Hive的ODS层表后字段的数据残缺
一、目的在用Flume把Kafka的数据采集写入Hive的ODS层表的
HDFS
文件路径后,发现
HDFS
文件中没问题,但是ODS层表中字段的数据却有问题,字段中的JSON数据不全二、Hive处理JSON数据方式
天地风雷水火山泽
·
2023-12-05 06:19
Hive
hive
flume
hadoop
大数据技术学习笔记(四)——
HDFS
目录1
HDFS
概述1.1
HDFS
背景与定义1.2
HDFS
优缺点1.3
HDFS
组成架构1.4
HDFS
文件块大小2
HDFS
的shell操作2.1上传2.2下载2.3
HDFS
直接操作3
HDFS
的客户端操作3.1Windows
夏木夕
·
2023-12-05 05:18
#
大数据
大数据
笔记
hdfs
java
03-05-01 lua脚本
根据这些功能,可以实现的使用场景Nginx+lua读取redis:实现分布式session,秒杀限流等Nginx+lua读取
HDFS
:实现图片读取带来的问题基本命令安装启动一个nginx容器,进入执行命令
nan得糊涂
·
2023-12-05 05:30
CDH6下线DataNode节点
CDH6下线DataNode节点1.版本说明2.找到
HDFS
的实例3.解除授权4.重启集群5.注意事项1.版本说明我这里使用的是CDH6,更高版本请参考https://www.dandelioncloud.cn
真香IT
·
2023-12-05 04:01
大数据
hadoop
hdfs
大数据
DataNode
一个大数据架构师应该掌握的技能
APP分析平台mixpanelgrowingIO神策诸葛IO2.技术选型1)CDH2)HDP+HDF3)MAPR4)Transwarp3.平台架构1)HDPCore(平台核心也是Hadoopcore)
HDFS
潘永青
·
2023-12-05 02:13
大数据开发
hadoop
big
data
hive
HDFS
和本地文件系统文件互导
初步了解一下情况,后续根据给出案例一、从本地文件系统到
HDFS
使用
hdfs
自带的命令命令:
hdfs
dfs-copyFromLocalinputPathoutputPathinputPath:本地文件目录的路径
Blank_9c4f
·
2023-12-05 01:07
HDFS
运维问题
转自吐血整理|
HDFS
运维问题大全https://zhuanlan.zhihu.com/p/1704789651这次我吐血整理了一些在维护
hdfs
工作中遇到的问题,有的是血的教训,有的是花了不少功夫定位
专职掏大粪
·
2023-12-04 23:50
sqoop导入导出工具的使用以及通过java代码连接linux,远程执行shell命令
1、sqoop是apache开源提供的一个数据导入导出的工具,从关系型数据库导入到
hdfs
,或者从
hdfs
导出到关系型数据库等等导入数据:MySQL,Oracle导入数据到Hadoop的
HDFS
、HIVE
喵喵秀拌酱
·
2023-12-04 21:20
笔记
数据库
mysql
hadoop
大数据
大数据的技术栈-逐步完善
目录1.hadoopa.
HDFS
分布式文件系统b.Yarn集群资源管理器c.MapReducesql引擎d.Impalasql引擎e.工具概观2.数据仓库知识a.Hive数据库1)HiveSql2)数据库结构
刘文钊1
·
2023-12-04 20:12
大数据
大数据基础设施搭建 - 数据装载
文章目录一、概述二、数据装载(
HDFS
->Hive)2.1创建Hive表2.1.1业务全量表建表语句2.1.2业务增量表建表语句2.1.3流量增量表建表语句2.2数据装载2.2.1初始化装载省份和地区表
m0_46218511
·
2023-12-04 17:50
大数据基础设施搭建
大数据
数据装载
头歌大数据作业二:搭建Hadoop环境及
HDFS
课外作业二:搭建Hadoop环境及
HDFS
作业详情内容阿里云-云起实验室-《搭建Hadoop环境》-Hadoop-2.10.1伪分布式:1.截图本实验ECS的公网IP地址,并添加彩色框标注,如下图所示:
别叫哥喜羊羊
·
2023-12-04 15:42
hadoop
大数据
hdfs
(图文详细)云计算与大数据实训作业答案(之篇三
HDFS
和MapReduce实训 )
HDFS
和MapReduce实训第1关:WordCount词频统计第2关:
HDFS
文件读写第3关:倒排索引第4关:网页排序——PageRank算法
HDFS
和MapReduce实训Hadoop是一个由Apache
Sunny蔬菜小柠
·
2023-12-04 15:11
云计算与大数据
云计算与大数据实训作业答案
大数据生态圈及分布式文件系统
HDFS
实践-part1
Hadoop入门第一章大数据概述1.1大数据概念“人类正在从IT时代走向DT时代”。大数据(BigData):指的是传统数据处理应用软件不足以处理(存储和计算)它们的大而复杂的数据集。主要解决,海量数据的存储和海量数据的运算问题。1.2大数据特征容量大,种类多,速度快,价值高1、容量(Volume):数据的大小决定所考虑的数据的价值和潜在的信息微博,5亿用户,每天上亿条微博朋友圈,10亿用户,每天
落叶飘雪2014
·
2023-12-04 15:40
Hadoop
大数据
Hadoop
HDFS
大数据实训笔记3:
hdfs
HDFS
(HadoopDistributedFileSystem)是一个文件系统,用于存储文件,通过目录树来定位文件。它是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色。
Roslin_v
·
2023-12-04 15:39
hdfs
大数据
hadoop
Java操作
Hdfs
(分布式文件系统)完成文件上传、下载和删除
Java操作
Hdfs
(分布式文件系统)文件上传实现创建Maven项目,项目命名Hadoop_
hdfs
导入pom.xml依赖4.0.0hadoophadoop0.0.1-SNAPSHOThadoop_learnorg.apache.hadoophadoop-client3.2.0
菜鸟小党
·
2023-12-04 15:39
hadoop
hdfs
java
hadoop
HDFS
分布文件系统(1)Shell操作
/article/details/127170478文章目录一、三种Shell命令方式二、FileSystemShell文档三、常用Shell命令四、实例练习1、创建目录2、查看目录3、上传本地文件到
HDFS
4
Kox2021
·
2023-12-04 15:09
大数据
hdfs
hadoop
大数据
HDFS
和MapReduce综合实训:构建大数据处理应用
摘要:本文将介绍如何使用Hadoop分布式文件系统(
HDFS
)和MapReduce框架来构建大数据处理应用。
IbtnLisp
·
2023-12-04 15:09
hdfs
mapreduce
hadoop
【头歌实训】分布式文件系统
HDFS
文章目录第1关:
HDFS
的基本操作任务描述相关知识
HDFS
的设计分布式文件系统NameNode与DataNode
HDFS
的常用命令编程要求测试说明答案代码第2关:
HDFS
-JAVA接口之读取文件任务描述相关知识
撕得失败的标签
·
2023-12-04 15:08
【头歌实训】
hdfs
npm
hadoop
分布式
大数据
HADOOP::Fsimage和Edits解析
curent目录中产生如下文件fsimage_0000000000000000000fsimage_0000000000000000000.md5seen_txidVERSION(1)Fsimage文件:
HDFS
星星失眠️
·
2023-12-04 09:15
大数据开发技术
hdfs
大数据
hadoop
Presto基础学习--学习笔记
1,Presto背景2011年,FaceBook的数据仓库存储在少量大型hadoop/
hdfs
集群,在这之前,FaceBook的科学家和分析师一直靠hive进行数据分析,但hive使用MR作为底层计算框架
祈愿lucky
·
2023-12-04 09:21
大数据
学习
笔记
大数据
【大数据】区分
hdfs
dfs -ls 与
hdfs
dfs -ls /
区分
hdfs
dfs-ls与
hdfs
dfs-ls/1.
hdfs
dfs-ls
hdfs
dfs-ls表示
HDFS
中的当前用户目录,即/user/用户名。
G皮T
·
2023-12-04 07:19
#
Hadoop
大数据
hdfs
hadoop
上一页
16
17
18
19
20
21
22
23
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他