E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfshadoop大数据
Flume基础知识(六):Flume实战之实时监控目录下的多个追加文件
1)案例需求:使用Flume监听整个目录的实时追加文件,并上传至
HDFS
2)需求分析:3)实现步骤:(1)创建配置文件flume-taildir-
hdfs
.c
依晴无旧
·
2024-01-06 17:28
大数据
flume
大数据
高可用分布式部署Spark、完整详细部署教程
Spark基于mapreduce算法实现的分布式计算,拥有HadoopMapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写
HDFS
,因此Spark
一座野山
·
2024-01-06 16:15
spark
bigdata
hadoop
分布式
spark
大数据
linux
SuperMap分布式数据库实操
分布式数据库实操分布式数据库一、MongoDB1.特点2.使用原理3.数据结构4.单节点部署1.下载2.解压安装3.配置开机自启动5.集群部署5.1主从复制集群5.2副本集集群安装部署配置开机自启动5.3分片集群二、DSF(
HDFS
会灭火的程序员
·
2024-01-06 15:42
SuperMap
数据库
数据库
分布式
mongodb
hdfs
hbase
HDFS
的高可用性
HDFS
的高可用性联邦
hdfs
由于namenode在内存中维护系统中的文件和数据块的映射信息,所以对于一个海量文件的集群来说,内存将成为系统横向扩展瓶颈。
zh_harry
·
2024-01-06 10:25
Hive实战:分科汇总求月考平均分
文章目录一、实战概述二、提出任务三、完成任务(一)准备数据1、在虚拟机上创建文本文件2、上传文件到
HDFS
指定目录(二)实现步骤1、启动HiveMetastore服务2、启动Hive客户端3、创建分区的学生成绩表
howard2005
·
2024-01-06 10:48
数仓技术Hive入门
hive
hadoop
分科汇总
Hadoop: 访问
hdfs
报错Failed on local exception: com.google.protobuf.InvalidProtocolBufferExceptio
可能是
hdfs
端口配置的不是默认的9000,
hdfs
getconf-confkeyfs.default.name可以查看端口
amadeus_liu2
·
2024-01-06 08:00
Hadoop
DataX部署及迁移操作说明
DataX安装部署1、DataX简介DataX是阿里巴巴开源的一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、
HDFS
、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能
曹弘毅
·
2024-01-06 06:11
datax
文件查找find命令
-user
hdfs
find.
曹弘毅
·
2024-01-06 06:10
Shell
运维
MR实战:网址去重
文章目录一、实战概述二、提出任务三、完成任务(一)准备数据1、在虚拟机上创建文本文件2、上传文件到
HDFS
指定目录(二)实现步骤1、创建Maven项目2、添加相关依赖3、创建日志属性文件4、创建网址去重映射器类
howard2005
·
2024-01-06 06:09
Hadoop分布式入门
mr
网址去重
大数据管理平台DataSophon开源动态&进行远程Debug方法
新增支持YARN,
HDFS
,ZK,Hive,Kafka,HBase组件集成Kerberos,支持友好的开启和关闭集成Kerberos。新增机
浮世Talk
·
2024-01-06 05:18
分享
大数据
idea
java
2.
HDFS
架构
目录概述架构
HDFS
副本
HDFS
数据写入流程NN工作原理DN工作原理结束概述官方文档快递环境:hadoop版本3.3.6相关文章速递架构
HDFS
HDFS
架构总结如下:amaster/slavearchitecture
流月up
·
2024-01-05 23:01
大数据
hdfs
架构
hadoop
namenode工作原理
datanode工作原理
大数据
HDFS
-存储的王者
文章目录为什么
HDFS
的地位如此稳固?
HDFS
的原理
HDFS
的高可用设计
HDFS
实现过程为什么
HDFS
的地位如此稳固?
善守的大龙猫
·
2024-01-05 21:48
大数据
大数据
hdfs
hadoop
HDFS
&Yarn HA架构设计
一、为什么要用HA在hadoop2.0.0之前,在
hdfs
集群中,NameNode是存在单点故障问题的。
吃货大米饭
·
2024-01-05 20:22
MR实战:词频统计
文章目录一、实战概述二、提出任务三、完成任务(一)准备数据1、在虚拟机上创建文本文件2、上传文件到
HDFS
指定目录(二)实现步骤1、创建Maven项目2、添加相关依赖3、创建日志属性文件4、创建词频统计映射器类
howard2005
·
2024-01-05 19:01
Hadoop分布式入门
mr
词频统计
大数据开发个人简历范本(2024最新版-附模板)
大数据开发工程师个人简历范本>男22本科张三计算机科学与技术1234567890个人概述具备深入的
Hadoop大数据
运维工程师背景,熟悉相关技术和工具具备良好的团队合作能力,善于沟通和协作具有快速学习新知识和解决问题的能力对于数据科学和分析充满热情
itLeeyw
·
2024-01-05 13:53
简历怎么写
大数据
简历
简历工具
个人简历
简历模板
修修改
hdfs
上的文件所属用户、所属组等读写执行控制权限
HDFS
支持权限控制,但支持较弱。
HDFS
的设计是基于POSIX模型的,支持按用户、用户组、其他用户的读写执行控制权限。
liuzx32
·
2024-01-05 11:52
SparkStreaming基础解析(四)
而结果也能保存在很多地方,如
HDFS
,数据
有语忆语
·
2024-01-05 10:05
大数据之Spark
SparkStreaming
Hadoop(04)
HDFS
编程实践操作
Hadoop分布式文件系统(HadoopDistributedFileSystem,
HDFS
)是Hadoop核心组件之一,如果已经安装了Hadoop,其中就已经包含了
HDFS
组件,不需要另外安装。
Eufeo
·
2024-01-05 09:25
Hadoop
hadoop
hdfs
大数据
Hadoop集群环境下
HDFS
实践编程过滤出所有后缀名不为“.abc”的文件时运行报错:Path is not a file: /user/hadoop/input
一、问题描述搭建完Hadoop集群后,在Hadoop集群环境下运行
HDFS
实践编程使用Eclipse开发调试
HDFS
Java程序(文末有源码):假设在目录“
hdfs
://localhost:9000/user
哇咔咔哇咔
·
2024-01-05 09:25
Hadoop
分布式
hadoop
hdfs
eclipse
java
大数据
Hadoop集群环境下
HDFS
实践编程过滤出所有后缀名不为“.abc”的文件时运行报错:java.net.ConnectException: 拒绝连接;
一、问题描述搭建完Hadoop集群后,在Hadoop集群环境下运行
HDFS
实践编程使用Eclipse开发调试
HDFS
Java程序(文末有源码):假设在目录“
hdfs
://localhost:9000/user
哇咔咔哇咔
·
2024-01-05 09:19
Hadoop
分布式
hdfs
hadoop
eclipse
java
大数据
Hive实战处理(二十三)hive整合phoenix
1、hive整合phoenix的原理Hive支持使用
HDFS
之外的存储系统作为底层存储系统,其中官方明确支持HBase,Kudu,Druid和JDBC(MySQL等)。
sheep8521
·
2024-01-05 08:13
hbase
hive
hive
hbase
datax不支持对hive
hdfs
(ha)高可用 的
hdfs
reader(即无法读取到
HDFS
多节点高可用).
处理方案:采用引入CDH的hive、
hdfs
等配置文件到
hdfs
reader,jar替换原的jar文件解决。
whbi
·
2024-01-05 08:06
hive
hdfs
hadoop
datax
HDFS
常用shell命令
#创建名为/abc的文件夹
hdfs
dfs-mkdir/abc#列出根目录中的内容
hdfs
dfs-ls/#递归列出多层文件夹的内容
hdfs
dfs-ls-R/#把Linux系统中/etc/hosts文件上传到
幸福巡礼
·
2024-01-05 08:15
hdfs
npm
hadoop
数据仓库理论进阶 - 01 《阿里大数据之路》第二篇数据模型篇
学习内容链接如下:视频:【一起啃书】阿里大数据之路数据仓库建模基础理论研读(已完结)_哔哩哔哩_bilibili书籍:《阿里大数据之路》8.1为什么需要数据建模建模目标:有序、有结构地分类组织和存储存储在
hdfs
:Concerto
·
2024-01-05 08:43
数据仓库
big
data
数据库
Hadoop大数据
生态系统及常用组件简介
经过多年信息化建设,我们已经进入一个神奇的“大数据”时代,无论是在通讯社交过程中使用的微信、QQ、电话、短信,还是吃喝玩乐时的用到的团购、电商、移动支付,都不断产生海量信息数据,数据和我们的工作生活密不可分、须臾难离。什么是大数据什么是大数据,多大算大,100G算大么?如果是用来存储1080P的高清电影,也就是几部影片的容量。但是如果100G都是文本数据,比如我们的后端kafka里的数据,抽取一条
669生活
·
2024-01-05 08:11
大数据
编程语言
人工智能
大数据
程序员
编程语言
hadoop
java与大数据:Hadoop与MapReduce
它由两个核心组件组成:Hadoop分布式文件系统(
HDFS
):
HDFS
是Hadoop的存储系统,它将大数据集分割成多个块,并将这些块分布
naer_chongya
·
2024-01-05 08:38
大数据
java
hadoop
flink on yarn任务启停脚本(实现一键读取ck启动,保存ck停止)
1.问题描述flink同步任务,长期任务过多,某个任务停止保存checkpoint或者savepoint后,修改代码,使用命令行读取检查点重新启动需要人工去
hdfs
上找寻检查点保存位置。
tuoluzhe8521
·
2024-01-05 06:20
Shell脚本相关
flink
大数据
yarn
kudu介绍和使用
kudu架构同
hdfs
和Hbase相似,kudu使用单个的master节点,用来管理集群的元数据,并且使用任意数量的tabletserver节点来存储实际数据。
古城的风cll
·
2024-01-04 23:12
大数据
kudu
Impala查询详解
而Impala可以说是一个MPP计算引擎,它需要处理的数据存储在
HDFS
、Hbase或者Kudu之上,这些存储引擎都是独立于Impala的,可以称之为第三方存储引擎,Impala使
weixin_34234823
·
2024-01-04 23:41
系统架构
数据库
c/c++
kudu NoSQL数据库详解
一、Hbase、Kudu和ClickHouse对比Hadoop生态圈中
HDFS
一直用来保存底层数据。
wespten
·
2024-01-04 23:09
数据库存储
块存储
文件存储
对象存储
分布式网络存储
ui
备份kudu表数据(Kudu导入导出)
INSERTINTOTABLEsome_parquet_tableSELECT*FROMkudu_table方法一:(在Hue中进行即可)1,利用impala进行备份,将Kudu表结构转化为impala表结构(其数据存储在
hdfs
冬瓜螺旋雪碧
·
2024-01-04 23:38
Hadoop
Kudu
自己踩得坑
Impala
kudu数据导入导出
impala备份kudu表数据
kudu数据备份
impala数据备份
ceph存储
ceph一.存储分类1.本地存储的文件系统ext3ext4efsntfs2.网络存储nfs网络文件系统
hdfs
分布式网络文件系统glusterfs分布式网络文件系统3.传统存储(1).DASSAS,SATA
MoonSoin
·
2024-01-04 17:26
云原生
k8s
ceph
windows
云原生
11111111
core-site.xml文件的内容如下:hadoop.tmp.dirfile:/usr/local/hadoop/tmpAbaseforothertemporarydirectories.fs.defaultFS
hdfs
SunsPlanter
·
2024-01-04 15:23
tomcat
服务器
java
没脾气的周四
昨天所说的Sqoop由
hdfs
入Mysql主键重复的问题,今天去生产查了一下,并不像预料的那样,还是一筹莫展,对还是集群上主键没有重复,然后入Mysql报主键重复,很让人尴尬,又没有脾气,你想想如果春节期间
阳春没有雪
·
2024-01-04 13:50
Flume基础知识(四):Flume实战之实时监控单个追加文件
1)案例需求:实时监控Hive日志,并上传到
HDFS
中2)需求分析:3)实现步骤:(1)Flume要想将数据输出到
HDFS
,依赖Hadoop相关jar包检查/etc/profile.d/my_env.sh
依晴无旧
·
2024-01-04 10:08
大数据
flume
大数据
Flume基础知识(五):Flume实战之实时监控目录下多个新文件
1)案例需求:使用Flume监听整个目录的文件,并上传至
HDFS
2)需求分析:3)实现步骤:(1)创建配置文件flume-dir-
hdfs
.conf创建一个文件vimflume-dir-
hdfs
.conf
依晴无旧
·
2024-01-04 10:08
大数据
flume
大数据
Java技术栈 —— Hadoop入门(一)
Java技术栈——Hadoop入门(一)一、Hadoop第一印象二、安装Hadoop三、Hadoop解析3.1Hadoop生态介绍3.1.1MapReduce-核心组件3.1.2
HDFS
-核心组件3.1.3YARN
键盘国治理专家
·
2024-01-04 08:02
Java技术栈
java
hadoop
开发语言
大数据-
HDFS
原理
什么是
HDFS
?
运维仙人
·
2024-01-04 07:00
大数据
运维
【Hadoop-
HDFS
-S3】
HDFS
和存储对象 S3 的对比
【Hadoop-
HDFS
-S3】
HDFS
和存储对象S3的对比1)可扩展性2)数据的高可用性3)成本价格4)性能表现5)数据权限6)其他限制虽然ApacheHadoop以前都是使用
HDFS
的,但是当Hadoop
bmyyyyyy
·
2024-01-04 07:25
Hadoop
hadoop
hdfs
大数据
#存储对象
#S3
利用python将excel文件转成txt文件,再将txt文件上传
hdfs
,最后传入hive中
将excel文件转成txt文件,再将txt文件上传
hdfs
,最后传入hive中1.利用python将excel转成txt文件#!
m0_37759590
·
2024-01-04 06:03
python
hive
python
hdfs
hive
Hive08_分区表
一分区表1概念:分区表实际上就是对应一个
HDFS
文件系统上的独立的文件夹,该文件夹下是该分区所有的数据文件。Hive中的分区就是分目录,把一个大的数据集根据业务需要分割成小的数据集。
程序喵猴
·
2024-01-04 02:00
hive
hive
hadoop
数据仓库
从零开始了解大数据(七):总结
系列文章目录从零开始了解大数据(一):数据分析入门篇-CSDN博客从零开始了解大数据(二):Hadoop篇-CSDN博客从零开始了解大数据(三):
HDFS
分布式文件系统篇-CSDN博客从零开始了解大数据
橘子-青衫
·
2024-01-04 02:19
从零开始了解大数据
大数据
大数据
hadoop
hive
big
data
hdfs
数据仓库
hdfs
dfs 命令学习实践
1、
hdfs
dfs-ls查看目录或文件参数:[-C][-d][-h][-R][-t][-S][-r][-u][...]参数释义:-C仅显示文件和目录的路径-d目录列为普通文件-h以人类可读的方式显示文件大小
probtions
·
2024-01-03 23:25
bigdata
hdfs
Spark相关知识点(期末复习集锦)
一、Spark简介Spark,拥有hadoopMR所具有的优点,但不同于MR的是job中监测结果可以保存在内存中,从而不再需要读写
HDFS
,因此spark能够更好的适用于数据挖掘与机器学习等需要迭代的mr
夜をむかえる
·
2024-01-03 22:49
spark
大数据
分布式
启动Hbase后HMaster老是掉的原因
1.启动Hbase之前先启动
hdfs
,zookeeper,再启动Hbase,但是隔一会就发现HMaster掉线了,但是hregionserver还在.2.解决:重新启动Hbase之前,先kill掉hregionserver
夺命大翻斗
·
2024-01-03 22:12
hbase
数据库
大数据
hive基本概念原理与底层架构
hadoop是一个开源框架,在分布式环境中存储和处理大型数据,他包括两个模块,一个是mapreduce,另一个是
hdfs
.mapreduce:他是一个并行编程模型在大型集群普通硬件可用于处理大型
byway_lyn
·
2024-01-03 20:22
大数据Hadoop入门学习线路图
Hadoop是系统学习大数据的必会知识之一,Hadoop里面包括几个组件
HDFS
、MapReduce和YARN,
HDFS
是存储数据的地方就像我们电脑的硬盘一样文件都存储在这个上面,MapReduce是对数据进行处理计算的
千_锋小小千
·
2024-01-03 19:12
电商数仓可视化1--数据导入
商品分类信息、商品信息、店铺信息、订单数据、订单支付信息、活动信息、物流信息等2、埋点数据埋点日志相对业务数据是用于数据分析、挖掘需求,一般以日志形式存储于日志文件中,随后通过采集落地分布式存储介质中如
hdfs
bigdata从入门到放弃
·
2024-01-03 18:53
数据仓库
linux
hadoop
大数据
java
数据仓库
我的大数据之路:2023年度总结
同时对“数据治理”有了一定的实践经验:存储治理:
HDFS
基于纠删码的存储空间占用上优于多副本存储;冷数据使用对象存储可以大幅降低成本。
话数Science
·
2024-01-03 18:07
大数据
面试
大数据
面试
spark
HDFS
重温
今天被问到分布式,有些忘记,查资料回忆起分布式集群构建,现在重温集群搭建过程费话不多说,来个简图NameNode:
HDFS
群集包含单个NameNode(主服务器),它管理文件系统命名空间并控制客户端对文件的访问权限
zty_1995
·
2024-01-03 18:18
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他