E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop大数据学习
【
Hadoop
】分布式文件系统 HDFS
数据复制复制的实现原理三、HDFS的特点四、图解HDFS存储原理1.写过程2.读过程3.HDFS故障类型和其检测方法故障类型和其检测方法读写故障的处理DataNode故障处理副本布局策略一、介绍HDFS(
Hadoop
DistributedFileSystem
和瑚
·
2023-11-30 20:06
#
Hadoop
hadoop
hdfs
大数据
Linux(三):“/”和“~”的区别
而每个用户都有”家“目录,也就是用户的个人目录,比如root用户的”家“目录就是/root,普通用户
hadoop
的家目录就是/home/
hadoop
。
CodingALife
·
2023-11-30 18:20
Linux
linux
Hyper-v虚拟机
Hadoop
集群搭建
大数据
Hadoop
简介
Hadoop
是一个由Apache基金会所开发的分布式系统基础架构。
Hadoop
实现了一个分布式文件系统(
Hadoop
DistributedFileSystem),简称HDFS。
真.电脑人
·
2023-11-30 16:16
hadoop
大数据
分布式
大数据学习
-离线数仓项目实战笔记(上)
1.前置1.1.软件版本产品版本
Hadoop
2.9.2Hive2.3.7Flume1.9DataX3.0Airflow1.10Atlas1.2.0Griffin0.4.0Impalaimpala-2.3.0
ys4tnaf
·
2023-11-30 15:24
hadoop
大数据
数据仓库
hive
flume
大数据项目实践过程笔记
开发工具intelijidea2.19.3目前围绕
Hadoop
体系的大数据架构包括:传统大数据架构数据分析的业务没有发生任何变化,但是因为数据量、性能等问题导致系统无法正常使用,需要进行升级改造,那么此类架构便是为了解决这个问题
提莫_
·
2023-11-30 15:54
BigData
大数据
【
大数据学习
笔记-1】大数据
hadoop
平台基本组件
Hadoop
是一个由Apache基金会所开发的分布式计算和存储架构。说人话的通俗描述:你在爱奇艺网站看过一次科幻片后,下次再登录爱奇艺,首页会把最新科幻动作片推送给你,目的是要向你多收点会员费。
工匠小能手
·
2023-11-30 15:19
相关概念和应用场景
大数据
Hbase学习笔记(三)Shell操作
[leon@
hadoop
102HBase]$bin/HBaseshell1.其他操作1.1查看集群状态使用status可以查看集群状态,默认为summary,可以选择‘simple’和‘detailed
做个合格的大厂程序员
·
2023-11-30 15:59
大数据之
Hadoop
hadoop
主要解决:海量数据的存储和海量数据的分析计算
hadoop
发展历史Google是
hadoop
的思想之源(Google在大数据方面的三篇论文)2006年3月,Map-reduce和NutchDistributedFileSystem
小裕哥略帅
·
2023-11-30 13:41
大数据
hadoop
java
01数仓平台
Hadoop
介绍与安装
Hadoop
概述
Hadoop
是数仓平台的核心组件。在
Hadoop
1.x时代,
Hadoop
中的MapReduce同时处理业务逻辑运算和资源调度,耦合性较大。在
Hadoop
2.x时代,增加了Yarn。
kk_io
·
2023-11-30 13:38
数据仓库
hadoop
大数据
分布式
hadoop
简介
大数据和
hadoop
的关系:随着近几年计算机技术和互联网的发展,“大数据”这个名词越来越多进入我们的视野。大数据的快速发展也在无时无刻影响着我们的生活。那大数据究竟是什么呢?
owlcity123
·
2023-11-30 13:06
电商平台数据仓库搭建02-
Hadoop
集群搭建
虚拟机需要配置3台,分别为
Hadoop
102,
Hadoop
103,
Hadoop
104。配置ssh、jdk1.vm-tools,并创建新用户
hadoop
并配置root权
王小磊~
·
2023-11-30 13:04
电商数据仓库搭建
hadoop
数据仓库
hive
sql
大数据
【
Hadoop
】集群资源管理器 YARN
一、yarn简介ApacheYARN(YetAnotherResourceNegotiator)是
hadoop
2.x引入的分布式资源管理系统。
和瑚
·
2023-11-30 13:34
#
Hadoop
hadoop
大数据
分布式
在centos7上搭建
hadoop
大数据平台
目录一、安装搭建java环境1、安装方法2、查看是否已安装3、卸载4、安装4.1检查yum中有没有java1.8包4.2开始安装5、验证二、
Hadoop
安装1、下载2、准备启动
Hadoop
集群2.1配置
船长灬普朗克
·
2023-11-30 13:03
大数据
hadoop
大数据
java
Windows11编译
Hadoop
3.3.6源码
kontext-tech/winutils还未发布3.3.6版本,因此尝试源码编译目录环境和安装包准备,见2zlib编译方法一:方法二:配置文件更改1.maven阿里云镜像2.Node版本3.越过Javadoc检查编译
Hadoop
Error
斐硕人
·
2023-11-30 13:33
僧旅
hadoop
数据仓库搭建
目录1数据仓库概念1.1什么是数据仓库1.2OLTP与OLAP2项目需求及架构设计3项目框架4框架版本选型4.1
Hadoop
版本综述4.2社区版与第三方发行版的比较4.2.1.Apache社区版4.2.2
赵广陆
·
2023-11-30 13:32
bigdata
数据仓库
00
Hadoop
数据仓库平台
在这里是学习大数据的第一站什么是数据仓库常见大数据平台组件及介绍什么是数据仓库在计算领域,数据仓库(DW或DWH)也称为企业数据仓库(EDW),是一种用于报告和数据分析的系统,被认为是商业智能的核心组件。数据仓库是来自一个或多个不同来源的集成数据的中央存储库。它们将当前和历史数据存储在一个位置,用于为整个企业的员工创建分析报告。这对公司来说是有益的,因为它使他们能够询问数据并从数据中汲取见解并做出
kk_io
·
2023-11-30 13:29
数据仓库
hadoop
数据仓库
大数据
2019-12-11
Hive是基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
diedfish_qyf
·
2023-11-30 11:41
Ubuntu 文件系统成为只读模式的解决办法
虚拟机环境的Linux系统由于是虚拟化虚拟出来的主机环境,因此经常会出现一些操作系统的问题,今天我遇到了一个Ubuntu操作系统文件系统成了只读模式,无法进行系统的操作,由于出问题的主机是我个人搭建的
Hadoop
Kevin-K先森
·
2023-11-30 10:46
Android
技术···
技术
Ubuntu
Hadoop
-HDFS详解与HA,完全分布式集群搭建(细到令人发指的教程)
是什么hdfs的由来hdfs架构体系hdfs的优缺点优点缺点二、HDFS_block简介和注意事项Block拆分标准三、HDFS_block安全与管理Block数据安全Block的管理效率四、HDFS_
Hadoop
3
毫无感情的dj
·
2023-11-30 10:06
hadoop
hdfs
大数据
分布式
zookeeper
Hadoop
-HDFS角色工作机制
一、角色职责介绍
Hadoop
DistributedFileSystem(HDFS,分布式文件系统):HDFS是
Hadoop
应用程序使用分布式存储,HDFS集群主要由管理文件系统元数据的NameNode
H.S.T不想卷
·
2023-11-30 10:33
大数据
hadoop
hdfs
大数据
【大数据
Hadoop
】HDFS-Namenode-format格式化的源码步骤分析
Namenodeformat流程格式化命令源码解读初始化操作格式化操作本地写VERSION文件JournalManager的格式化持久化FsImage文件流程根据配置项获取nameserviceId、namenodeId判断配置项dfs.namenode.support.allow.format是否允许格式化,一般生产环境建议配置,防止误操作格式化了已有数据。获取格式化的目录(fsImage和ed
笑起来贼好看
·
2023-11-30 10:30
Hadoop
大数据
服务运维部署
hadoop
大数据
hdfs
大数据技术之
Hadoop
(HDFS)
2.HDFS定义HDFS(
Hadoop
DistributedFileSystem),它是一个文件系统,用于存储文件,
江苏彭与晏
·
2023-11-30 10:23
hadoop
大数据
hdfs
大数据 -
Hadoop
- HDFS
前言
Hadoop
是一个专为离线和大规模数据分析而设计的,并不适合那种对几个记录随机读写的在线事务处理模式。
蒙蒙的林先生
·
2023-11-30 10:21
大数据
大数据
大数据
hadoop
hdfs
大数据
Hadoop
-HDFS_架构、读写流程
大数据
Hadoop
-HDFS基本系统架构HDFS架构包含三个部分:NameNode,DataNode,Client。NameNode:NameNode用于存储、生成文件系统的元数据。运行一个实例。
大沙头三马路
·
2023-11-30 09:48
BigDate
Linux
大数据
hadoop
hdfs
HCIA
大数据-
hadoop
-hdfs
Hadoop
分布式文件系统(HDFS)是指被设计成适合运行在通用硬件(commodityhardware)上的分布式文件系统(DistributedFileSystem)。
像影子追着光梦游_
·
2023-11-30 09:48
大数据
hadoop
hdfs
大数据
Hadoop
-HDFS_元数据持久化
大数据
Hadoop
-HDFS_元数据持久化(1)在HDFS第一次格式化后,NameNode(即图中的主NameNode)就会生成fsimage和editslog两个文件;(2)备用NameNode(即图中的备
大沙头三马路
·
2023-11-30 09:14
BigDate
Linux
大数据
hadoop
hdfs
linux
【物联网与大数据应用】
Hadoop
数据处理
Hadoop
是目前最成熟的大数据处理技术。
Bosenya12
·
2023-11-30 09:06
大数据
hadoop
分布式
Map和Reduce在
Hadoop
与Python中有何异同?
Hadoop
是一个大数据处理平台,也是一个集群,能够对海量数据进行存储和运算。MapReduce是
Hadoop
众多组件当中的一个。
值得一看的喵
·
2023-11-30 09:25
阿里云ECS-Centos7.9集群部署Redis服务遭木马攻击
阿里云ECS-Centos7.9集群部署Redis服务遭木马攻击#背景阿里云ECS-Centos7.9集群:
hadoop
202,
hadoop
203,
hadoop
204
hadoop
202启动redis-server
start@today
·
2023-11-30 07:45
Linux
阿里云ECS
Redis安全漏洞
阿里云
redis
运维
MapReduce的基础知识
1、什么是MapReduce
Hadoop
MapReduce是一个分布式计算框架,用于轻松编写分布式应用程序,这些应用程序以可靠,容错的方式并行处理大型硬件集群(数千个节点)上的大量数据(多TB数据集)MapReduce
huan1993
·
2023-11-30 07:44
scp(secure copy)安全拷贝和rsync远程同步的区别
(fromserver1toserver2)(2)基本语法#命令递归要拷贝的文件路径/名称目的用户@主机:目的路径/名称scp-r$pdir/$fname$user@
hadoop
$host:$pdir/
宇文智
·
2023-11-30 05:09
大数据技术
安全
服务器
linux
Hadoop
学习笔记---大数据概论入门
第一章:大数据概念大数据是指无法在一定时间范围内,用常用的工具软件进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。大数据主要解决海量数据的采集、存储和分析计算问题。按顺序给出存储单位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。1Byte=8bit1KB=1024MB1MB=102
沉迷技术不能自拔
·
2023-11-30 05:14
大数据
hadoop
学习
Hadoop
入门笔记
第1章
Hadoop
概述1.1
Hadoop
是什么1.2
Hadoop
发展历史(了解)1.3
Hadoop
三大发行版本(了解)
Hadoop
三大发行版本:Apache、Cloudera、Hortonworks。
阳宝宝的向日葵
·
2023-11-30 05:44
大数据
hadoop
hdfs
big
data
Hadoop
入门+组成学习笔记
Hadoop
学习笔记
Hadoop
的优势(4高)1.高可靠性—
Hadoop
底层有多个数副本,保存再不同的服务器里,即使一台计算机出现故障,也不会丢失数据2.高扩展性—可以添加多个节点3.高效性—再MapReduce
Fan_Coder
·
2023-11-30 05:14
Hadoop
hadoop
大数据
mapreduce
Hadoop
入门学习笔记-第五天(
hadoop
-hive安装部署与配置笔记)
1.准备安装包:MySQL-5.6.26-1.linux_glibc2.5.x86_64.rpm-bundlemysql-connector-java-5.1.39.jar(驱动,需要放入/hive/lib)apache-hive-1.2.1-bin.tar.gz2.安装mysql数据用于储存元数据,hive自带Derby,但该数据库不稳定,使用mysql作为元数据管理1).只需要安装在集群里面的
渣男程序员007
·
2023-11-30 05:44
Hadoop入门学习笔记
数据库
hadoop
mysql
java
hive
Hadoop
入门学习笔记-第六天(hive数据库命令相关操作)
hive命令行操作/user/hive/warehouse(hdfs目录))说明:hive创建的数据库和数据库表都存在hdfs,一般默认目录为:/user/hive/warehouse1…创建hive的数据库1.hive创建数据库的最简单写法和mysql差不多:createdatabasefoo;2.仅当名为foo的数据库当前不存在时才创建:createdatabaseifnotexistsfoo
渣男程序员007
·
2023-11-30 05:44
Hadoop入门学习笔记
hadoop
数据库
java
hive
mysql
Hadoop
入门学习笔记
视频课程地址:https://www.bilibili.com/video/BV1WY4y197g7课程资料链接:https://pan.baidu.com/s/15KpnWeKpvExpKmOC8xjmtQ?pwd=5ay8这里写目录标题一、VMware准备Linux虚拟机1.1.VMware安装Linux虚拟机1.1.1.修改虚拟机子网IP和网关1.1.2.安装Linux虚拟机1.2.VMwa
faith瑞诚
·
2023-11-30 05:43
hadoop
学习
笔记
Hadoop
入门学习笔记-第四天(wordCount实例代码编写笔记)
1.新建一个maven项目2.pom文件中引入以下jar包org.apache.
hadoop
hadoop
-client2.7.3org.apache.
hadoop
hadoop
-common2.7.3org.apache.
hadoop
hadoop
-hdfs2.7.3org.apache.
hadoop
hadoop
-client2.7.33
渣男程序员007
·
2023-11-30 05:43
Hadoop入门学习笔记
java
大数据
hadoop
mapreduce
spark
Hadoop
入门学习笔记-第二天 (HDFS:NodeName高可用集群配置)
说明:hdfs:nn单点故障,压力过大,内存受限,扩展受阻。hdfsha:主备切换方式解决单点故障hdfsFederation联邦:解决鸭梨过大。支持水平扩展,每个nn分管一部分目录,所有nn共享dn资源。使用JN集群保证数据一致性,使用zk集群解决主备切换1.若使用主备节点,常常存在的问题:强一致性,若一致性。强一致性(同步):nn主节点必须等到nn副本返回成功后,才能向客户端返回成功。主和副本
渣男程序员007
·
2023-11-30 05:13
Hadoop入门学习笔记
hadoop
java
大数据
hdfs
Hadoop
入门学习笔记-第三天(Yarn高可用集群配置及计算案例)
什么是mapreduce首先让我们来重温一下
hadoop
的四大组件:HDFS:分布式存储系统MapReduce:分布式计算系统YARN:
hadoop
的资源调度系统Common:以上三大组件的底层支撑组件
渣男程序员007
·
2023-11-30 05:13
Hadoop入门学习笔记
分布式
hadoop
大数据
spark
mapreduce
Flink-shell
1.FlinkSQl客户端启动一个flink的集群可以使用flink独立集群,也可以使用yarn-session.sh1.启动
Hadoop
集群2.yarn-session.sh-d3.sql-client.sh1.1sql-client.sh-isql-client.sh-i
大学生爱编程
·
2023-11-30 04:46
flink
hadoop
大数据
Spark3 on Yarn分布式集群安装部署(YARN模式)
Spark3onYarn分布式集群安装部署一、配置spark-defaults.conf二、配置spark-env.sh三、配置yarn-site.xml四、启动
Hadoop
和Spark集群五、基于YARN
最笨的羊羊
·
2023-11-30 03:57
大数据
Spark3.0.1
分布式集群搭建
spark on yarn模式安装部署
配置spark之前,请自行部署
Hadoop
2.7.2,JDK1.8,ssh免密码登录等准备工作。
乖乖猪001
·
2023-11-30 03:56
大数据
spark
Spark集群安装(On Yarn)
说明:基于已经搭建完成的
Hadoop
集群,关于
Hadoop
集群搭建,可参考:https://blog.csdn.net/weixin_37901366/article/details/13017066一
maplea2012
·
2023-11-30 03:55
Spark
spark
大数据
hadoop
【Spark】on yarn集群模式安装部署
官方文档http://spark.apache.org/docs/latest/running-on-yarn.html前提安装启动
Hadoop
(需要使用HDFS和YARN)安装单机版Spark不需要集群
没去过埃及的法老
·
2023-11-30 03:23
Sprak
大数据
spark
on
yarn集群模式
安装部署
云计算/大数据
Spark on YARN的部署
SparkonYARN的原理就是依靠yarn来调度Spark,比默认的Spark运行模式性能要好的多,前提是首先部署好
hadoop
HDFS并且运行在yarn上,然后就可以开始部署sparkonyarn了
GoodInSun
·
2023-11-30 03:23
spark
spark
on
yarn
spark on yarn集群的安装与搭建
注:(搭建sparkonyarn需要jdk,
hadoop
环境,其搭建可参照前面jdk和
hadoop
的安装与搭建).1.解压spark安装包[root@master/]#tar-zxvf/h3cu/spark
爱做梦的小鱼。
·
2023-11-30 03:52
我的笔记
大数据
hadoop
spark
hadoop
大数据
spark on yarn 安装部署
准备下载spark,地址:http://spark.apache.org/downloads.html下载不带
hadoop
预编译环境的spark最新版本,好处是可以自由使用最新版本的
hadoop
下载
hadoop
积极流年
·
2023-11-30 03:51
spark
ambari部署
hadoop
ambari搭建
hadoop
集群为何选用ambari安装前准备部署节点间做免密登陆搭建nginx服务创建repo源安装mysql服务安装ambari服务启动ambari服务登陆ambari-ui配置为何选用
hello_world_99
·
2023-11-30 03:23
大数据技术
大数据运维
大数据开发
大数据
hadoop
运维
ambari运维问题记录
综合问题记录1、hdfs无法启动错误:2018-04-2514:36:09,293-Retryingafter10seconds.Reason:Executionof'/usr/hdp/current/
hadoop
-hdfs-namenode
人生匆匆
·
2023-11-30 03:23
ambari
ambari
运维
hadoop
上一页
41
42
43
44
45
46
47
48
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他