E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
分布式文件系统HDFS
Hbase与Hive的区别与联系
Hive,通过元数据来描述
HDFS
上的结构化文本数据。因此,严格地讲,Hive并非数据库,主要是让开发人员能够通过SQL(HQL语
阿乐_822e
·
2023-12-03 12:13
【开源存储】glusterfs
分布式文件系统
部署实践
文章目录一、前言1、介绍说明2、术语说明3、冗余模式3.1、复制卷(Replication)3.2、纠删卷(ErasureCode)二、部署说明1、软件安装2、集群部署2.1、前置准备2.2、部署过程a、添加节点b、配置存储c、创建glusterfs卷d、客户端挂载3、常用操作3.1、扩展卷(add-brick)3.2、收缩卷(remove-brick)三、Q&A1、volumecreate:re
Luxf0
·
2023-12-03 05:25
#
开源存储
开源
Hive----基本概念
3、本质是:将HQL转化成MapReduce程序1)Hive处理的数据存储在
HDFS
2)Hive分析数据底层的实现是MapReduce3)执行程序运行在Yarn上4.Hive的优缺点优点1)操作接口采用类
Hi杯酒故人
·
2023-12-02 21:21
Hadoop架构---
HDFS
补充知识点---三个模式/机制
1.安全模式在安全模式下不允许
HDFS
客户端进行任何修改文件的操作,包括上传文件,删除文件等操作。
Yan_bigdata
·
2023-12-02 19:29
hadoop
架构
hdfs
学习
Hive环境准备[重点学习]
1.前提启动hadoop集群hadoop在统一虚拟机中已经配置了环境变量启动
hdfs
和yarn集群命令:start-all.sh[root@node1/]#start-all.sh启动mr历史服务命令:
Yan_bigdata
·
2023-12-02 19:59
hive
学习
hadoop
Hadoop进阶学习---
HDFS
分布式文件存储系统
1.
hdfs
分布式文件存储的特点分布式存储:一次写入,多次读取
HDFS
文件系统可存储超大文件,时效性较差.
HDFS
基友硬件故障检测和自动快速恢复功能.
HDFS
为数据存储提供很强的扩展能力.
HDFS
存储一般为一次写入
Yan_bigdata
·
2023-12-02 19:59
hadoop
分布式
学习
hdfs
推荐系统lambda架构学习笔记之Hadoop、
HDFS
、YARN&MapReduce(三)
HadoopHadoop介绍Hadoop名字的由来作者:DougcuttingHadoop项目作者的孩子给一个棕黄色的大象样子的填充玩具的命名Hadoop的概念:Apache™Hadoop®是一个开源的,可靠的(reliable),可扩展的(scalable)分布式计算框架允许使用简单的编程模型跨计算机集群分布式处理大型数据集可扩展:从单个服务器扩展到数千台计算机,每台计算机都提供本地计算和存储可
吃一口桃酥
·
2023-12-02 19:50
笔记
hadoop
hdfs
mapreduce
Hadoop之MapReduce学习笔记(一)
1、mapreduce整体工作机制介绍回顾第
HDFS
第一天单词统计实例(
HDFS
版wordcount):统计
HDFS
的/wordcount/input/a.txt文件中的每个单词出现的次数——wordcount
weixin_30752377
·
2023-12-02 19:50
大数据
操作系统
java
hadoop学习笔记——NO.4_HADOOP集群搭建与使用初步
HADOOP集群搭建与使用初步HADOOP集群搭建集群简介HADOOP集群具体来说包含两个集群:
HDFS
集群和YARN集群,两者逻辑上分离,但物理上常在一起
HDFS
集群:负责海量数据的存储,集群中的角色主要有
蔡茂昌
·
2023-12-02 19:20
hadoop学习笔记
Hdoop学习笔记(HDP)-Part.20 安装Flume
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:46
hadoop
学习
笔记
flume
hadoop
Hdoop学习笔记(HDP)-Part.17 安装Spark2
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:45
hadoop
学习
笔记
spark
hadoop
Hdoop学习笔记(HDP)-Part.18 安装Flink
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:45
hadoop
学习
笔记
flink
hadoop
Hdoop学习笔记(HDP)-Part.11 安装Kerberos
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:15
hadoop
学习
笔记
hadoop
Hdoop学习笔记(HDP)-Part.12 安装
HDFS
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:15
hadoop
学习
笔记
hdfs
hadoop
Hdoop学习笔记(HDP)-Part.19 安装Kafka
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:15
hadoop
学习
笔记
kafka
hadoop
Hdoop学习笔记(HDP)-Part.10 创建集群
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:14
hadoop
hadoop
学习
笔记
Hdoop学习笔记(HDP)-Part.09 安装OpenLDAP
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:44
hadoop
学习
笔记
hadoop
Hdoop学习笔记(HDP)-Part.02 核心组件原理
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:14
hadoop
学习
笔记
hadoop
Hdoop学习笔记(HDP)-Part.05 Yum源配置
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:14
hadoop
学习
笔记
hadoop
Hdoop学习笔记(HDP)-Part.07 安装MySQL
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:14
hadoop
学习
笔记
mysql
hadoop
Hdoop学习笔记(HDP)-Part.08 部署Ambari集群
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:14
hadoop
学习
笔记
ambari
hadoop
Hadoop Core -
HDFS
, MapReduce, YARN
HadoopCore-
HDFS
,MapReduce,YARN参加拉勾教育大数据训练营课程笔记引用:《Hadoop-TheDefinitiveGuide,4thEdition》,《拉勾导师笔记》简介大数据特性
DataPeak
·
2023-12-02 19:13
大数据
hadoop
big
data
java
Hdoop学习笔记(HDP)-Part.03 资源规划
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:43
hadoop
学习
笔记
hadoop
Hdoop学习笔记(HDP)-Part.06 安装OracleJDK
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 19:43
hadoop
学习
笔记
hadoop
Hdoop学习笔记(HDP)-Part.04 基础环境配置
Part.06安装OracleJDKPart.07安装MySQLPart.08部署Ambari集群Part.09安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 18:40
hadoop
学习
笔记
hadoop
HDFS
JAVA API的应用
(简答题)使用
HDFS
的JAVAAPI进行编程:(1)获取自己
HDFS
集群下的所有文件和目录;//获取自己
HDFS
集群下的所有文件和目录;importorg.apache.hadoop.conf.Configuration
星星失眠️
·
2023-12-02 16:28
大数据开发技术
hdfs
java
hadoop
HIVE SQL 、Hive MR参数设置
1、知识点回顾hive数据库是
hdfs
上的文件夹,表也是文件夹,表里的数据是文件hive建表createtable表名(字段1类型1,字段2类型2……)rowformatdelimitedfieldsterminatedby
故里良田
·
2023-12-02 15:39
hbase thrift2 jar包冲突导致启动失败问题排查记录
1、启动命令${HBASE_HOME}/bin/hbase-daemon.shstartthrift22、异常情况hbase-root-thrift2-
hdfs
-test07.yingzi.com.out
Java小田
·
2023-12-02 12:53
hbase
大数据
jar冲突
java: 通过URL读取hadoop
HDFS
packagetju;importorg.apache.hadoop.fs.FsUrlStreamHandlerFactory;importorg.apache.hadoop.io.IOUtils;importjava.io.InputStream;importjava.net.MalformedURLException;importjava.net.URL;importjava.net.URLS
amadeus_liu2
·
2023-12-02 11:28
Hadoop
hadoop
java
hdfs
hadoop:通过Configuration读取
hdfs
packagetju;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.FSDataInputStream;importorg.apache.hadoop.fs.FSDataOutputStream;importorg.apache.hadoop.fs.FileSystem;importorg.apache.
amadeus_liu2
·
2023-12-02 11:28
Hadoop
hadoop
hdfs
大数据
【Spark数仓项目】需求八:MySQL的DataX全量导入和增量导入Hive
hive1.增量导入的第一种实现方法2.另一种方法是时间字段3.dataX脚本三、利用Python自动生成Datax的json脚本1.创建mysql和hive数据库2.修改python脚本里面的密码(2处)和
hdfs
程序终结者
·
2023-12-02 10:22
spark
mysql
hive
Hive中parquet压缩格式分区表的跨集群迁移记录
文章目录环境与需求集群环境需求描述操作步骤STEP1STEP2STEP3STEP4STEP5STEP6环境与需求集群环境华为FushionInsightA华为FushionInsightB华为集群管理机localHive3.1.0
HDFS
3.3.1
程序终结者
·
2023-12-02 10:17
hive
hadoop
数据仓库
SparkSQL 学习笔记----将RDD转换成DataFrame
一、RDD转换成DataFrame1、为什么要将RDD转换成DataFrame转换成DataFrame之后就可以直接针对
HDFS
等任何可以构建为RDD的数据,进行SparkSQL进行SQL查询了。
PZ~浪味仙
·
2023-12-02 10:46
Spark
SQL
Hadoop -- hadoop介绍
特性优点hadoop发展hadoop介绍hadoop底层是Java语言实现是Apache软件基金会的一款开源软件允许用户使用简单的编程模型实现跨机器集群对海量数据进行分布式计算处理hadoop核心组件
hdfs
小陈菜奈-
·
2023-12-02 07:07
Hadoop
hadoop
大数据
Hdoop学习笔记(HDP)-Part.14 安装YARN+MR
十四、安装YARN+MR1.MR中间结果存储权限使用Yarn提交MapReduce任务的时候,中间结果会保存在
HDFS
,/user/username/,如果/user目录下用户目录下不存在,则被创建,当
这啥命啊
·
2023-12-02 07:35
hadoop
学习
笔记
mr
yarn
hadoop
Hdoop学习笔记(HDP)-Part.1 关于HDP
源配置Part.6安装OracleJDKPart.7安装MySQLPart.8部署Ambari集群Part.9安装OpenLDAPPart.10创建集群Part.11安装KerberosPart.12安装
HDFS
Part
这啥命啊
·
2023-12-02 07:35
hadoop
学习
笔记
hadoop
hadoop的几个接口
8088接口:MapReduce50070接口:
HDFS
19888接口:jobhistoryseverjob历史服务器端口9000:namenode50090:secondarynamenode
Stephen6Yang
·
2023-12-02 04:03
hadoop
hadoop
HDFS
SecondaryNameNode监控
HDFS
状态的辅助后台程序,合并fsimage与edits。
歌哥居士
·
2023-12-02 02:22
主要
分布式文件系统
架构对比分析:GFS vs. Tectonic vs. JuiceFS
为了满足不断增长的存储需求,
分布式文件系统
作为动态且可扩展的解决方案应运而生。
沃趣数据库管理平台
·
2023-12-02 00:34
技术专栏
架构
分布式
云原生
数据库
IPFS:下一代
分布式文件系统
(filenet)
一概述星际文件系统是一种点对点的
分布式文件系统
,旨在连接所有有相同的文件系统的计算机设备。
壹五叁说IPFS
·
2023-12-01 19:24
大数据基础设施搭建 - Sqoop
文章目录一、上传压缩包二、解压压缩包三、配置环境变量(TODO)四、修改配置文件五、拷贝MySQL驱动六、测试能否连接数据库七、importMySQLto
HDFS
一、上传压缩包官网:http://mirrors.hust.edu.cn
m0_46218511
·
2023-12-01 19:52
大数据基础设施搭建
大数据
sqoop
Java核心知识点整理大全25-笔记
目录25.Hadoop25.1.1.概念25.1.2.
HDFS
25.1.2.1.Client25.1.2.2.NameNode25.1.2.3.SecondaryNameNode25.1.2.4.DataNode25.1.3
希斯奎
·
2023-12-01 17:31
Java
java
开发语言
笔记
textfilestream_Spark从本地文件流式传输到
hdfs
。textFileStream-问答-阿里云开发者社区-阿里云...
我正在尝试将本地目录内容流式传输到
HDFS
。脚本将修改此本地目录,并且每5秒添加一次内容。我的spark程序将流式传输本地目录内容并将其保存到
HDFS
。但是,当我开始流式传输时,没有任何事情发生。
十吾十吾
·
2023-12-01 16:20
textfilestream
hadoop完全分布式搭建
文章目录集群部署规划服务器准备Mobaxterm远程登录实验前准备安装软件工具关闭防火墙安装JDK和Hadoop创建软件包目录解压软件包配置环境变量集群搭建先创建
HDFS
工作目录和LOG目录配置集群配置环境配置
撕得失败的标签
·
2023-12-01 12:24
Hadoop
分布式
hadoop
大数据
Hadoop运行模式及目录结构
文章目录Hadoop运行模式本地模式伪分布式模式完全分布式模式Hadoop目录结构配置文件说明默认配置文件:自定义配置文件:Hadoop运行模式本地模式这种模式在一台单机上运行,没有
分布式文件系统
,而是直接读写本地操作系统的文件系统
撕得失败的标签
·
2023-12-01 12:23
Hadoop
hadoop
大数据
分布式
分布式文件系统
FastDFS
FastDFS是什么FastDFS是一款开源的轻量级
分布式文件系统
:纯C实现,支持Linux、FreeBSD等UNIX系统类googleFS,不是通用的文件系统,只能通过专有API访问,目前提供了C、Java
会踢球的程序源
·
2023-12-01 12:00
java
学习
Flink on Kubernetes 计算和存储分离落地实践
在这种架构下,将计算和存储解耦,计算部分运行在Kubernetes上,而存储则使用
HDFS
等分布式存储系统。这样的架构优势在于可以根据实际情况独立调整计算和存储资源,从而提高整体的效率和弹性。
1661616sjsjsk
·
2023-12-01 07:51
大数据
分布式
flink
kubernetes
[Ubuntu 18.04] RK3399搭建NFS服务实现共享目录
NFS(NetworkFileSystem)是一种
分布式文件系统
协议,允许远程计算机通过网络访问存储在另一台计算机上的文件。
嵌入式逍遥
·
2023-12-01 07:15
嵌入式Linux调试
ubuntu
linux
运维
nfs
rk3399
2019-02-01
大数据技术的产生以及发展谷歌的三篇论文
分布式文件系统
GFS大数据分布式计算框架mapreduceNoSQL数据库系统BigTable大数据计算离线计算——批处理计算(MapReduce、Spark)实时计算
奔跑的风2019
·
2023-12-01 04:34
FastDFS实现本地文件服务器
FastDFS是一个开源的轻量级
分布式文件系统
,它对文件进行管理,功能包括:文件存储、文件同步、文件访问(文件上传、文件下载)等,解决了大容量存储和负载均衡的问题。
user__kk
·
2023-12-01 03:02
技术
java
微服务
nginx
服务器
运维
上一页
20
21
22
23
24
25
26
27
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他