E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
研磨hadoop
HDFS 的元数据辅助管理-SecondaryNameNode
HDFS的元数据辅助管理当
Hadoop
的集群当中,NameNode的所有元数据信息都保存在了FsImage与Eidts文件当中,这两个文件就记录了所有的数据的元数据信息,元数据信息的保存目录配置在了hdfs-site.xml
你值得拥有更好的12138
·
2023-09-08 14:29
【大数据学习-
hadoop
1】大数据如何处理
文章目录1.大数据启蒙1.1意义1.1.1查找元素1.1.2单机处理大数据问题1.2历史1.3
hadoop
1.大数据启蒙学习视频大数据多,复杂度很重要,内存不够,分治处理IO仍成为瓶颈,多机器并行多机器间通信也可以并行
叶落叶子
·
2023-09-08 13:49
big
data
大数据
0301yarn&mapredude入门-
hadoop
-大数据学习
文章目录1MapReduce概述2YARN2.1yarn概述2.2yarn与MapReduce关系2.3yarn架构2.4辅助角色3MapReduce&YARN部署3.1集群规划3.2配置文件3.3分发配置文件4体验4.1集群启动命令介绍4.2提交MapReduce任务到YARN执行结语1MapReduce概述分布式计算是一种计算模型,它涉及将计算任务分解成多个子任务,并将这些子任务分配给多台计算
gaog2zh
·
2023-09-08 12:16
#
Hadoop
大数据
hadoop
mapreduce
yarn
一百七十一、Flume——Flume1.9.0单机版安装(亲测有效)
一、目的以防万一,为了避免kettle从Kafka同步数据到HDFS有问题,因此也测试了用Flume去采集Kafka中的数据然后同步到HDFS,算是一套备用方案二、安装包版本(一)
Hadoop
版本
hadoop
天地风雷水火山泽
·
2023-09-08 12:47
Flume
flume
大数据
【已解决】Could not locate executable E:\
Hadoop
\bin\winutils.exe in the
Hadoop
binaries.
【已解决】CouldnotlocateexecutableE:\
Hadoop
\bin\winutils.exeinthe
Hadoop
binaries.问题原因:在
hadoop
/bin目录下缺少了winutils.exe
君问归期魏有期
·
2023-09-08 12:11
SpringBoot
maven
centos
hadoop
spring
boot
个人开发
IDEA
intellij-idea
大数据错误
question1:Couldnotlocate
Hadoop
executable:D:\
hadoop
-3.3.1\bin\winutils.exe-【已解决】CouldnotlocateexecutableE
我是老孙
·
2023-09-08 12:41
大数据
linux
数据库
大规模数据处理平台架构
采集的数据需要经过预处理和清洗,然后存储到可扩展的数据存储系统中,如
Hadoop
分
AlianBlank
·
2023-09-08 09:17
大数据
架构
linq
c#
大数据
Spark【RDD编程(三)键值对RDD】
因为毕竟通过我们之前
Hadoop
的学习中,我们就可以看到对数据的处理,基本都是以键值对的形式进行统一批处理的,因为MapReduce模型中,Mapper和Reducer之间的联系就是通过键和值进行连接产生关系的
让线程再跑一会
·
2023-09-08 08:21
Spark
spark
大数据
分布式
一百七十二、Flume——Flume采集Kafka数据写入HDFS中(亲测有效、附截图)
它在项目中最常见的就是采集Kafka中的数据然后写入HDFS或者HBase中,这里就是用flume采集Kafka的数据导入HDFS中二、各工具版本(一)Kafkakafka_2.13-3.0.0.tgz(二)
Hadoop
天地风雷水火山泽
·
2023-09-08 06:03
Flume
flume
kafka
hdfs
Hadoop
:HDFS--分布式文件存储系统
目录HDFS的基础架构VMware虚拟机部署HDFS集群HDFS集群启停命令HDFSShell操作
hadoop
命令体系:创建文件夹-mkdir查看目录内容-ls上传文件到hdfs-put查看HDFS文件内容
独憩
·
2023-09-08 06:40
Hadoop
linux
服务器
hadoop
分布式
大数据技术之
Hadoop
:HDFS存储原理篇(五)
目录一、原理介绍1.1Block块1.2副本机制二、fsck命令2.1设置默认副本数量2.2临时设置文件副本大小2.3fsck命令检查文件的副本数2.4block块大小的配置三、NameNode元数据3.1NameNode作用3.2edits文件3.3FSImage文件3.4元素据合并控制参数3.5SecondaryNameNode的作用四、HDFS的读写流程4.1写入流程4.2读取流程一、原理介
何苏三月
·
2023-09-08 06:39
大数据技术
大数据
hadoop
hdfs
java
hdfs滚动升级(rollingUpgrade )
最近对hdfs的升级过程很感兴趣,所以准备研究下其升级的过程,本篇文章是依据官网文档进行的升级过程(地址:Apache
Hadoop
2.10.2–HDFSRollingUpgrade),该文章中还有关于降低的介绍
Interest1_wyt
·
2023-09-08 05:09
hdfs
hadoop
大数据
hive数据迁移
数新网络官网已全新上线,欢迎点击访问www.datacyber.com数新网络_让每个人享受数据的价值01数据迁移场景不同平台之间的迁移,比如apache
hadoop
到cdh数据迁移;集群数据集体迁移,
数新网络
·
2023-09-08 04:06
大数据
hive
hadoop
数据仓库
Kafka优化
Linkedin公司开发,是一个分布式、支持分区的(partition)、多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于
hadoop
数新网络
·
2023-09-08 04:05
大数据
java
浅谈数据仓库工具——Hive
前言
Hadoop
分布式文件系统(HDFS)因其高容错性、高吞吐量的特点,且适合部署在廉价的机器上,使其非常适合大批量数据的存储,但是如何快速地对HDFS上的文件进行统计分析操作呢?
数新网络
·
2023-09-08 04:04
hive
数据仓库
hadoop
GaussDB(DWS)与Hive在功能上存在一定的差异
GaussDB(DWS)与Hive在功能上存在一定的差异,主要体现在以下几个方面:Hive是基于
Hadoop
MapReduce的数据仓库,GaussDB(DWS)是基于Postgres的MPP的数据仓库
燃烧的岁月_
·
2023-09-08 02:55
高斯数据库
其他
namenode-HA
Namenode在HDFS中是一个非常重要的组件,相当于
hadoop
集群系统的心脏,在显示分布式集群环境中,还是会有可能出现Namenode的崩溃或各种意外。所以,高可用模式就体现出作用了。
MOOJ
·
2023-09-08 00:29
2019-04-24
昨晚看别人吃牛排看的自己百爪挠心,今天终于过了一把瘾,不得不说按照别人讲授的方法煎出来的牛排确实比自己刚开始煎的好吃,可惜的是没有买那种
研磨
的黑胡椒,只好退而求其次用黑胡椒粉代替了,可以算的上是唯一美中不足的了
只吃八两饺子
·
2023-09-07 23:29
如何免费获取CDH集群技术支持
CDH拥有全球70%的
Hadoop
用户,在国内也拥有庞大的用户群体。
碧茂大数据
·
2023-09-07 21:10
cloudera
大数据
hadoop
kafka
spark
zookeeper
空间节省50%,时序性能提升5倍,三一重工从
Hadoop
+Spark到MatrixDB架构变迁实现One for ALL
工业互联网快速崛起在“工程机械之都”湖南•长沙如何高效走向制造业转型升级三一泵机引入超融合时序数据库MatrixDB更大满足各种业务场景需求作者于成铭-智能化所副所长褚凤天-大数据工程师工业设备互联采集是数字化工厂建设的基础,设备在运行的过程中会产生大量有价值的数据,例如:新泵车运行状态、搅拌压力、总泵送方量、异常报警信息等,为后续的数据分析挖掘提供最可靠的数据来源。MatrixDB专门针对工业互
YMatrix 官方技术社区
·
2023-09-07 20:56
hadoop
spark
架构
时序数据库
postgresql
【zookeeper】ZooKeeper的特点及应用场景
ZooKeeper的特点/设计目标ZooKeeper(动物园管理员),顾名思义,是用来管理
Hadoop
(大象)、Hive(蜜蜂)、Pig(小猪)的管理员,同时ApacheHBase、ApacheSolr
margu_168
·
2023-09-07 16:49
zookeeper
zookeeper
01-ZooKeeper快速入门
1Zookeeper概念Zookeeper是Apache
Hadoop
项目下的一个子项目,是一个树形目录服务。
书香恋仁心
·
2023-09-07 16:17
ZooKeeper
zookeeper
分布式
Hive概述
一、概述Hive是
hadoop
集群中一个数据仓库,可以将结构化的数据文件映射为一张表,并提供类似SQL的查询功能,其本质就是将HQL转化成mapreduce程序。
诗云HSY
·
2023-09-07 14:11
启动
hadoop
并测试问题合集
首先
hadoop
和jdk都已经装好了的,如下:然后相应的这五个配置文件也配好了:然后格式化了:cd/opt/
hadoop
/bin/sudo.
Aure_xl
·
2023-09-07 13:45
存档处
hadoop
java
ambari安装
hadoop
Host checks were skipped on 3 hosts that failed to register.
ambari2.7.1安装
hadoop
时报错。
仔仔H
·
2023-09-07 13:43
AccessControlException: Permission denied: user=root
Numberofreducetasksissetto0sincethere'snoreduceoperatororg.apache.
hadoop
.security.AccessControlException
arbalest1080
·
2023-09-07 10:41
hive
报错 could only be replicated to 0 nodes instead of minReplication (=1). There are 0 datanode(s)
Causedby:org.apache.
hadoop
.ipc.RemoteException:File/tmp/linkis/root/bml/20230809/68d17478-8b31-44f7-984f
gs80140
·
2023-09-07 10:05
hadoop
各种问题
hadoop
linkis
并发编程专题三-JAVA线程的并发工具类
一、Fork-Join框架1、分而治之规模为N的问题,N阈值,将N分解为K个小规模子问题,子问题互相对立,与原问题形式相同,将子问题的解合并得到原问题的解,像
hadoop
中的mapreduce,以及二分查找
王老狮
·
2023-09-07 10:34
并发编程
Fork-Join
分而治之
CountDownLatch
Callable
CyclicBarrier
Hadoop
集中式的缓存管理demo
www.infoq.com/cn/articles/hdfs-centralized-cachehttps://blog.csdn.net/javastart/article/details/50586743从
Hadoop
2.3.0
orisonchan
·
2023-09-07 09:52
终于产完了!Zookeeper 打怪升级进阶成神之路(2023最新版)
前面给大家介绍了:关系型数据库MySQL、NoSQL数据库Redis、MongoDB、搜索引擎ElasticSearch、大数据
Hadoop
框架、PostgreSQL数据库、消息中间件Kafka等知识体系学习的文章
·
2023-09-07 09:58
2.k8s账号密码登录设置
文章目录前言一、启动脚本二、配置账号密码登录2.1.在
hadoop
1,也就是集群主节点2.2.在master的apiserver启动文件添加一行配置2.3绑定admin2.4修改recommended.yaml2.5
落叶的悲哀
·
2023-09-07 09:23
k8s
kubernetes
容器
云原生
大数据之MapReduce
MapReduce概述是一个分布式的编程框架,MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个
Hadoop
集群上。
十七✧ᐦ̤
·
2023-09-07 08:42
大数据
mapreduce
大数据面试题
Hadoop
1,
Hadoop
集群中都需要启动那些进程,它们的作用分别是什么?
牛壹壹
·
2023-09-07 07:13
大数据
java
开发语言
Hadoop
入门hello world
Hadoop
是个高效的工具介绍了
Hadoop
的由来和组成,当然提供给你用来分析的数据,以及最快的方式。更重要的是描述第一个
Hadoop
工程的详细编写过程。
知止乎尔
·
2023-09-07 07:10
Hadoop
的分布式文件存储系统HDFS组件的使用
Hadoop
的第一个核心组件:HDFS(分布式文件存储系统)一、HDFS的组成1、NameNode2、DataNode3、SecondaryNameNode4、客户端:命令行/JavaAPI二、HDFS
Augenstern K
·
2023-09-07 06:56
Hadoop
hadoop
分布式
hdfs
pyspark 报错:local class incompatible的解决方法
1.总结如果使用jupyter以standalone方式调试pyspark程序时,务必要保持driver端的pyspark版本与
hadoop
里的pyspark版本一致。
euler1983
·
2023-09-07 06:54
pyspark
spark
pyspark报错JavaSparkContext. : java.lang.NullPointerException
本例是由于
hadoop
集群是用的shadownet网段,而pyspark程序所在的容器启动时没有加--networkshadownet。spark_master='spark://
euler1983
·
2023-09-07 06:24
pyspark
spark
hive
CentOS7安装时直接跳过了安装信息摘要页面的解决方法
最近在配置
Hadoop
虚拟机的时候,创建的centos7虚拟机在安装信息摘要时直接自动跳过,直接跳到设置用户名和密码,在重复多次的重新删除安装后发现了问题所在:在进行到选择操作系统来源时,注意是否出现“
袁既望
·
2023-09-07 05:57
linux
hadoop
centos
大数据技术之
Hadoop
:使用命令操作HDFS(四)
文件内容五、下载HDFS文件六、拷贝HDFS文件七、HDFS数据移动操作八、HDFS数据删除操作九、HDFS的其他命令十、hdfsweb查看目录十一、HDFS客户端工具11.1下载插件11.2本地安装
Hadoop
何苏三月
·
2023-09-07 05:58
大数据技术
大数据
hadoop
hdfs
java
Hadoop
数据压缩
在
Hadoop
下,尤其是数据规模很大和工作负载密集的情况下,使用数据压缩显得非常重要。在这种情况下,I/O操作和网络数据传输要花大量的时间。
南巷的旧猫
·
2023-09-07 05:09
Hadoop
的第二个核心组件:MapReduce框架第一节
Hadoop
的第二个核心组件:MapReduce框架第一节一、基本概念二、MapReduce的分布式计算核心思想三、MapReduce程序在运行过程中三个核心进程四、如何编写MapReduce计算程序:
Augenstern K
·
2023-09-07 04:42
Hadoop
hadoop
mapreduce
大数据
mapreduce 本地开发环境
本地环境配置1、解压缩
hadoop
.*.tar.gz2、解压缩
hadoop
.dll、winutils.exe等安装文件,并拷贝到hadopp解压缩文件夹的bin目录下3、配置环境变量
HADOOP
_HOME
mr_酱
·
2023-09-07 04:12
(二十一)大数据实战——Flume数据采集之复制和多路复用案例实战
整体架构如下:正文①在
hadoop
101服务器的/opt/module/a
北溟溟
·
2023-09-07 03:59
大数据
大数据
flume
(二十三)大数据实战——Flume数据采集之采集数据聚合案例实战
我们使用
hadoop
101服务器采集nc数据,
hadoop
102采集文件数据,将
hadoop
101和
hadoop
102服务器采集的数据聚合到
hadoop
103服务器输出到控制台。
北溟溟
·
2023-09-07 03:59
大数据
flume
大数据
(二十二)大数据实战——Flume数据采集之故障转移案例实战
整体架构如下:正文①在
hadoop
101服务器的/opt/module/apache-flume-1.9.0/job目录下创建job-nc-flume-avro.conf配置文件,用
北溟溟
·
2023-09-07 03:28
大数据
大数据
flume
Hadoop
的第二个核心组件:MapReduce框架第三节
Hadoop
的第二个核心组件:MapReduce框架九、MR程序运行的核心阶段的细节性知识1、MR程序在运行过程中,涉及到的阶段和作用2、MR程序运行的的第一个组件:InputFormat3、MR程序的
Augenstern K
·
2023-09-07 03:25
Hadoop
hadoop
mapreduce
前端
Hadoop
的第二个核心组件:MapReduce框架第四节
Hadoop
的第二个核心组件:MapReduce框架十、MapReduce的特殊应用场景1、使用MapReduce进行join操作2、使用MapReduce的计数器3、MapReduce做数据清洗十一、
Augenstern K
·
2023-09-07 03:55
Hadoop
hadoop
mapreduce
前端
Hadoop
的第二个核心组件:MapReduce框架第二节
Hadoop
的第二个核心组件:MapReduce框架第二节六、MapReduce的工作流程原理(简单版本)七、MapReduce中的序列化机制问题八、流量统计案例实现(序列化机制的实现)六、MapReduce
Augenstern K
·
2023-09-07 03:54
Hadoop
hadoop
mapreduce
php
HDFS完全分布式集群搭建与配置
HDFS完全分布式集群搭建与配置介绍HDFS前言HDFS的概念和特性整体思路准备工作配置过程三台虚拟机都已经完成的步骤
hadoop
-env.shyarn-env.shcore-site.xmlhdfs-site.xmlmapred-site.xmlyarn-site.xmlslaves
stupid_gentleman
·
2023-09-07 00:53
hdfs
hadoop
分布式
Hadoop
生态圈(八)- HDFS动态节点管理
目录前言1.背景2.动态扩容、节点上线2.1新机器基础环境准备2.1.1主机名、IP2.1.2Hosts映射2.1.3防火墙2.1.4SSH免密登录2.1.5JDK环境配置2.2
Hadoop
配置2.2.1DataNode
大Null
·
2023-09-07 00:22
Hadoop生态圈
hadoop
hdfs
上一页
102
103
104
105
106
107
108
109
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他