E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
分布式文件系统HDFS
Hdfs
java API
1.在主机上启动hadoopsbin/start-all.sh这里有一个小窍门,可以在本机上打开8088端口查看三台机器的连接状态,以及可以打开50070端口,查看
hdfs
文件状况。
printcsr
·
2023-12-16 12:21
学习
分布式文件存储系统Minio使用总结
分布式文件存储系统Minio使用总结1.
分布式文件系统
应用:1.1、Minlo介绍:Minlo是一个基于ApacheLicensev2.0开源协议的对象存储服务。
北执南念
·
2023-12-16 11:40
微服务
分布式
分布式文件系统
及Minio配置及测试
功能强大,使用简单~
分布式文件系统
要理解
分布式文件系统
首先了解什么是文件系统。文件系统是方便对磁盘上的文件进行管理的一种系统。把若干计算机通过网络连接起来,共同提供存储和访问的服务。
happystudy_neu
·
2023-12-16 11:04
微服务
分布式
java
Hive命令操作
linux语句;3.运行
hdfs
命令-->dfs–
hdfs
语句;4.运行sq
xinxinyydss
·
2023-12-16 08:38
hive
hadoop
数据仓库
华为大数据开发者教程知识点提纲
一、线下处理1.离线处理方案数据支持:
HDFS
调度:YARN收入:Flume,sqoop,loader处理:Mapreduce,SparkSql,spark,hive(,Flink)2.HadoopNamenode
qq_1418269732
·
2023-12-16 06:08
大数据
【Hive】——DDL(TABLE)
describeformattedstudent;2删除表如果已配置垃圾桶且未指定PURGE,则该表对应的数据实际上将移动到
HDFS
垃圾桶,而元数据完全丢失。
那时的样子_
·
2023-12-16 05:05
hive
hadoop
数据仓库
使用sqoop操作
HDFS
与MySQL之间的数据互传
一,数据从
HDFS
中导出至MySQL中1)开启Hadoop、mysql进程start-all.sh/etc/init.d/mysqldstart/etc/init.d/mysqldstatus2)将学生数据
冬瓜的编程笔记
·
2023-12-16 05:44
大数据
sqoop
hdfs
mysql
【Hadoop-Distcp】通过Distcp的方式进行两个
HDFS
集群间的数据迁移
【Hadoop-Distcp】通过Distcp的方式进行两个
HDFS
集群间的数据迁移1)Distcp工具简介及参数说明2)Shell脚本1)Distcp工具简介及参数说明【Hadoop-Distcp】工具简介及参数说明
bmyyyyyy
·
2023-12-16 05:45
Hadoop
hadoop
hdfs
【Hadoop-CosDistcp-Distcp】通过命令方式将Cos中的数据迁移至
HDFS
,再将
HDFS
数据迁移至S3
【Hadoop-CosDistcp-Distcp】通过命令方式将Cos中的数据迁移至
HDFS
,再将
HDFS
数据迁移至S31)Shell脚本2)参数说明1)Shell脚本注意:此Shell脚本内置了按照sample_date
bmyyyyyy
·
2023-12-16 05:15
Hadoop
hadoop
hdfs
大数据
【Hadoop-Distcp】通过Distcp的方式迁移Hive中的数据至存储对象
Distcp的方式迁移Hive中的数据至存储对象1)了解Distcp1.1.Distcp的应用场景1.2.Distcp的底层原理2)使用Distcp4)S3可视化App下载4)S3可视化App使用5)跨集群迁移
HDFS
bmyyyyyy
·
2023-12-16 05:14
Hadoop
hadoop
hive
大数据
【Hadoop-OBS-Hive】利用华为云存储对象 OBS 作为两个集群的中间栈 load 文件到 Hive
利用华为云存储对象OBS作为两个集群的中间栈load文件到Hive1)压缩文件2)上传文件到OBS存储对象3)crontab定时压缩上传4)从obs上拉取下来文件后解压缩5)判断对应文件是否存在6)上传至
HDFS
bmyyyyyy
·
2023-12-16 04:04
Hadoop
hadoop
hive
华为云
Spark编程实验一:Spark和Hadoop的安装使用
一、目的与要求1、掌握在Linux虚拟机中安装Hadoop和Spark的方法;2、熟悉
HDFS
的基本使用方法;3、掌握使用Spark访问本地文件和
HDFS
文件的方法。
Francek Chen
·
2023-12-16 04:32
Spark编程基础
spark
hadoop
大数据
pyspark on yarn
直接下载hive组件的客户端配置就可以,它里面包含了
hdfs
和yarn的配置。如下所示:
[email protected]
骑着蜗牛向前跑
·
2023-12-16 03:34
大数据
pyspark
on
yarn
python
大数据
十四、YARN核心架构
1、目标(1)掌握YARN的运行角色和角色之间的关系(2)理解使用容器做资源分配和隔离2、核心架构(1)和
HDFS
架构的对比
HDFS
架构:YARN架构:(主从模式)(2)角色解释ResourceManager
弦之森
·
2023-12-16 01:52
Hadoop
hdfs
hadoop
yarn
mapreduce
大数据
基于spark的音乐数据分析系统的设计与实现
收藏关注不迷路文章目录前言一、项目介绍二、开发环境三、功能介绍四、核心代码五、效果图六、文章目录前言本文主要对音乐数据,进行分析,系统技术主要使用,1.对原始数据集进行预处理;3.使用python语言编写Spark程序对
HDFS
QQ2743785109
·
2023-12-16 01:05
spark
python
spark
大数据
分布式
单节点hadoop搭建
tar.gz解压文件,配置HADOOP_HOME编辑文件etc/hadoop/hadoop-env.sh配置JAVA_HOME配置etc/hadoop/core-site.xml文件fs.defaultFS
hdfs
曾阿伦
·
2023-12-16 00:04
hadoop
hadoop
大数据
分布式
ambari 开启
hdfs
回收站机制
hdfs
回收站类似于我们常用的windows中的回收站,被删除的文件会被暂时存储于此,和回收站相关的参数有两个:fs.trash.interval:默认值为0代表禁用回收站,其他值为回收站保存文件时间,
dogplays
·
2023-12-16 00:01
hdfs
ambari
hdfs
hue的安装和hadoop集群整合
通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据,例如操作
HDFS
上的数据,运行Map
五块兰州拉面
·
2023-12-16 00:15
#
hue
大数据
大数据学习(一)--------
HDFS
2、hadoophadoop有三个核心组件:
hdfs
:
分布式文件系统
mapreduce:分布式运算编程框架yarn:分布式资源调度平台3
大数据流动
·
2023-12-15 21:01
Hadoop在mac上的安装与配置
adoptopenjdk8安装指导,指导里面把java换成8:https://medium.com/beeranddiapers/installing-hadoop-on-mac-a9a3649dbc4d验证
hdfs
大红豆小薏米
·
2023-12-15 20:45
Hadoop和Spark的区别
SparkSpark模型是对Mapreduce模型的改进,可以说没有
HDFS
、Mapreduce就没有Spark。Spark可以使用Yarn作为他的资源管理器,并且可以处理
HDFS
数据。
旅僧
·
2023-12-15 20:12
hadoop
spark
大数据
【Hadoop】执行start-dfs.sh启动hadoop集群时,datenode没有启动怎么办
执行start-dfs.sh后,datenode没有启动,很大一部分原因是因为在第一次格式化dfs后又重新执行了格式化命令(
hdfs
namenode-format),这时主节点namenode的clusterID
不怕娜
·
2023-12-15 19:13
hadoop
大数据
分布式
spark链接hive时踩的坑
中也可以看到这个数据库,建表插入数据也没有问题,但是当我们去查询数据库中的数据时,发现查不到数据,去查hive的元数据,发现,spark在创建数据库的时候将数据库创建在了本地文件系统中而我们的hive数据是存放在
hdfs
YuPangZa
·
2023-12-15 18:00
大数据中踩过的坑
spark
hive
大数据
大数据基础知识
为了一场紧急考试,没有正经系统学习过大数据知识的我开始恶补概念涉及Hadoop、Hbase、Spark、Flink、Flume、Kafka、Sqoop、
HDFS
、Hive、Mapreduce、Impala
偶余杭
·
2023-12-15 17:22
HBase
HBase是一个基于列式存储的分布式数据库,其核心架构由五部分组成:HBaseClient、HMaster、RegionServer、ZooKeeper以及
HDFS
。
编织幻境的妖
·
2023-12-15 17:35
hbase
数据库
大数据
HBase 详细图文介绍
2.3.1NameSpace2.3.2Table2.3.3Row2.3.4Column2.3.5TimeStamp2.3.6Cell三、HBase基本架构架构角色3.1Master3.2RegionServer3.3Zookeeper3.4
HDFS
Stars.Sky
·
2023-12-15 16:24
HBase
hbase
数据库
大数据
kudu由来、架构、数据存储结构、注意事项
1.1一方面:在KUDU之前,大数据主要以两种方式存储;(1)静态数据:以
HDFS
引擎作为存储引擎,适用于高吞吐量的离线大数据分析场景。这类存储的局限性是数据无法进行随机的读写。(2)动
AllenGd
·
2023-12-15 13:32
KUDU
kudu
【基础知识】Hadoop生态系统
关键词——容灾主从结构、多副本主要特点分布式存储-Hadoop采用
HDFS
文件系统,可以将大数据分布式存储在集群中的多台服务器上。
偏振万花筒
·
2023-12-15 12:40
hadoop
大数据
分布式
【基础知识】大数据概述
发展历程中国开源生态图谱2023参考内容中国开源生态图谱2023.pdf技术组件说明数据集成sqoop、dataX、flume数据存储
hdfs
、kafka数据处理mapreduce、hive、impala
偏振万花筒
·
2023-12-15 12:39
大数据
hadoop-
hdfs
简介及常用命令详解(超详细)
文章目录前言一、
HDFS
概述1.
HDFS
简介2.
HDFS
架构3.
HDFS
文件操作二、
HDFS
命令介绍1.
hdfs
命令简介2.
HDFS
命令的基本语法3.常用的
HDFS
命令选项三、
HDFS
常用命令1.列出指定路径下的文件和目录
大数据魔法师
·
2023-12-15 11:22
大数据
hadoop
hdfs
大数据
hadoop使用内置包进行性能测试TestDFSIO、NNBench、MRBench、SliveTest
使用内置包进行性能测试TestDFSIOread&writeNNBenchMRBenchSliveTestTestDFSIOread&writeTestDFSIO是一个Hadoop自带的基准测试工具,用于测试
HDFS
何亚告
·
2023-12-15 07:51
菜鸟日常
hadoop
大数据
分布式
Ceph入门到精通-ceph二次开发开源协议考虑
Ceph是一个开源的分布式存储系统,它由多个组件组成,包括分布式对象存储(RADOS)、分布式块存储(RBD)和
分布式文件系统
(CephFS)等。
瓦哥架构实战
·
2023-12-15 07:40
Ceph入门到精通
ceph
开源协议
大数据技术13:HBase分布式列式数据库
Hadoop可以通过
HDFS
来存储结构化、半
Java架构何哥
·
2023-12-15 07:05
大数据治理
大数据
HBase列式数据库
Hbase表的数据结构
【Spark精讲】Spark存储原理
目录类比
HDFS
的存储架构Spark的存储架构存储级别RDD的持久化机制RDD缓存的过程Block淘汰和落盘类比
HDFS
的存储架构
HDFS
集群有两类节点以管理节点-工作节点模式运行,即一个NameNode
话数Science
·
2023-12-15 07:29
Spark精讲
Spark
大数据
spark
大数据
【Hadoop】
Hadoop是一个开源的分布式离线数据处理框架,底层是用Java语言编写的,包含了
HDFS
、MapReduce、Yarn三大部分。
想当运维的程序猿
·
2023-12-15 07:43
hadoop
大数据
分布式
hive聚合函数之JOIN原理及案例
1.数据准备原始数据创建dept.txt文件,并赋值如下内容,上传
HDFS
。
Appreciate(欣赏)
·
2023-12-15 06:03
hive
hive
数据仓库
07用户行为日志数据采集
用户行为数据由Flume从Kafka直接同步到
HDFS
,由于离线数仓采用Hive的分区表按天统计,所以目标路径要包含一层日期。具体数据流向如下图所示。
kk_io
·
2023-12-15 06:22
数据仓库
flume
数据仓库
hive的load报错Error: EXECUTION FAILED: Task MOVE error HiveException: [Error 20531] Unable to move sour
Error:EXECUTIONFAILED:TaskMOVEerrorHiveException:[Error20531]Unabletomovesource
hdfs
://nameservice1/tmp
五月天的尾巴
·
2023-12-15 03:12
大数据
数据库
hive
load报错
task
move
error
2.CENTOS安装CDH和Kudu-1
Cloudera企业级数据中心的安装主要分为4个步骤:集群服务器配置,包括安装操作系统、关闭防火墙、同步服务器时钟等;外部数据库安装安装Cloudera管理器;安装CDH集群;集群完整性检查,包括
HDFS
大勇任卷舒
·
2023-12-15 01:40
【Hadoop_03】
HDFS
概述与Shell操作
1、集群配置(1)集群启动/停止方式总结(2)编写Hadoop集群常用脚本(3)常考面试题【1】常用端口号【2】常用配置-文件2、
HDFS
概述(1)
HDFS
产出背景及定义(2)
HDFS
优缺点(3)
HDFS
温欣2030
·
2023-12-14 23:04
【大数据】
hadoop
hdfs
大数据
外部文件数据写入hive
hive数据库是基于
HDFS
的一个数据库,是对
hdfs
数据的一个映射关系。注意:hive数据库存入数据的时候不建议使用insertinto语句来进行插入,这样的的操作方式在效率上会很低效。
小赵要加油
·
2023-12-14 19:24
数据仓库
hive
Hive:从
HDFS
回收站恢复被删的表
1.确认
HDFS
是否开启回收站功能2.查看回收站中的数据被删除的数据会放在删除数据时使用的用户目录下,如:使用pgxl删除的,那么删除的数据会放在如下目录:/user/pgxl/.Trash该目录下会有多个文件夹
有语忆语
·
2023-12-14 19:49
大数据之Hive
hive
hdfs
hadoop
大数据存储技术(1)—— Hadoop简介及安装配置
)概念(二)Hadoop发展历史(三)Hadoop三大发行版本(四)Hadoop的优势二、Hadoop的组成(一)Hadoop1.x和Hadoop2.x的区别编辑(二)Hadoop的三种运行模式(三)
HDFS
Francek Chen
·
2023-12-14 19:08
大数据技术基础
Spark编程基础
大数据
hadoop
linux
Scala-初学
前提,已经安装好Scala在Linux终端准备资料:a.txt内容HIVE底层是
hdfs
和mapreduce实现存储和计算的。
Logan_addoil
·
2023-12-14 19:07
大数据学习之旅
scala
开发语言
后端
MapReduce的执行过程(以及其中排序)
阶段(ReduceTask):拷贝数据(copy)------排序(sort)-----合并(reduce)-----写出(write)1、Maptask读取:框架调用InputFormat类的子类读取
HDFS
Logan_addoil
·
2023-12-14 19:29
大数据学习之旅
mapreduce
大数据
datax的mysql 到
hdfs
文件系统 --- 支持高可用
datax的mysql到
hdfs
文件系统上!
Java页大数据
·
2023-12-14 16:27
datax
hadoop
hive
spring
大数据
HarmonyOS
分布式文件系统
开发指导
分布式文件系统
概述
分布式文件系统
(hmdfs,HarmonyOSDistributedFileSystem)提供跨设备的文件访问能力,适用于如下场景:●两台设备组网,用户可以利用一台设备上的编辑软件编辑另外一台设备上的文档
Android小贾
·
2023-12-14 15:02
HarmonyOS
OpenHarmony
移动开发
harmonyos
华为
OpenHarmony
移动开发
分布式
idea本地调试hadoop 遇到的几个问题
java.lang.IllegalStateException‘exception.Cannotevaluateorg.apache.hadoop.mapreduc解决方法:关闭IDEA中的启用“tostring()”对象视图2.代码和
hdfs
sunweiking
·
2023-12-14 13:43
intellij-idea
hadoop
java
big data tools连接
hdfs
报错Exception during driver request: java.lang.IllegalArgumentException:java.net.U
1.报错在IDEA中使用bigdatatools插件连接虚拟机中的
hdfs
时报错:Exceptionduringdriverrequest:java.lang.IllegalArgumentException
向之 所欣
·
2023-12-14 12:15
报错
大数据
hdfs
java
报错:Permission denied. user=dr.who is not the owner of inode=/tmp
例如
HDFS
网络用户界面(用于浏览文件的用户)。链接:hadoop.apache.org/docs/r3.3.1/hado
撕得失败的标签
·
2023-12-14 12:37
Hadoop
hdfs
hadoop
权限问题
上一页
17
18
19
20
21
22
23
24
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他