E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop学习篇
Hadoop
_Yarn实践 (三) => (Yarn的基础架构、原理、容量/公平调度器、Tool接口、Yarn常用命令、核心参数)
目录
Hadoop
_HDFS、
Hadoop
_MapReduce、
Hadoop
_Yarn实践(三)一、
Hadoop
_HDFS二、
Hadoop
_MapReduce三、
Hadoop
_Yarn1、Yarn资源调度
常名先生
·
2023-12-18 09:23
hadoop
大数据
hdfs
Hadoop
_MapReduce实践 (二) => (核心架构、序列化、Inputformat/切片、Shuffile/分区/排序、outputformat、join、ETL、压缩)
目录
Hadoop
_HDFS、
Hadoop
_MapReduce、
Hadoop
_Yarn实践(二)一、
Hadoop
_HDFS二、
Hadoop
_MapReduce1、MapReduce概述1.1、MapReduce
常名先生
·
2023-12-18 09:52
hadoop
mapreduce
架构
搭建
Hadoop
集群之环境配置系列-配置静态ip
说在前面的话由于老师给我们学生布置了一个Linux作业,虽然有几个可选的题,但是最后我还是觉得选择
Hadoop
应用开发,毕竟我一直想尝试这个新东西,趁着这个机会学点东西挺好的。
pSomng
·
2023-12-18 09:15
一些小坑
学习笔记
linux
centos
zookeeper和nacos区别是什么,注册中心用zookeeper还是nacos
以下是它们的主要区别:设计目标和适用场景:Zookeeper最初是为
Hadoop
的分布式协调而设计,主要用于服务注册和发现
greedy-hat
·
2023-12-18 07:02
实习
zookeeper
分布式
云原生
Windows10安装
Hadoop
3.1.3环境
Windows10安装
Hadoop
3.1.3环境文章目录1.安装包下载1.1.
hadoop
官网下载1.2下载winutils1.3安装文件2.配置安装2.1安装配置JDK环境2.2解压
hadoop
压缩包
大飞哥~BigFei
·
2023-12-18 07:29
hadoop
Ubuntu-报错
Hadoop
-Eclipse-java:耽误进度的几个报错错误1:桥接模式与NAT模式相互切换后导致两种模式都不能访问互联网(1)具体错误:(2)错误原因:(3)解决方案:(4)问题解决:错误2:Exceptioninthread"main"org.apache.
hadoop
.hdfs.server.namenode.SafeModeException
春风LiuK
·
2023-12-18 06:23
Linux
ubuntu
linux
【Spark面试】Spark面试题&答案
(☆☆☆☆☆)3、简单说一下
hadoop
和spark的shuffle相同和差异?(☆☆☆☆☆)4、Spark工作机制(☆☆☆☆☆)5、Spark的优化怎么做?
话数Science
·
2023-12-18 06:52
面试
Spark
大数据
spark
面试
大数据
【
Hadoop
面试】
Hadoop
面试题汇总附答案
题目介绍下
Hadoop
Hadoop
的特点说下
Hadoop
生态圈组件及其作用
Hadoop
主要分哪几个部分?他们有什么作用?
Hadoop
1.x,2x,3.x的区别
Hadoop
集群工作时启动哪些进程?
话数Science
·
2023-12-18 06:22
大数据
Hadoop
面试
hadoop
面试
大数据
【
Hadoop
面试】HDFS读写流程
HDFS(
Hadoop
DistributedFileSystem)是GFS的开源实现。
话数Science
·
2023-12-18 06:16
大数据
面试
Hadoop
hadoop
hdfs
大数据
ElasticSearch
学习篇
8_Lucene之数据存储(Stored Field、DocValue、BKD Tree)
前言Lucene全文检索主要分为索引、搜索两个过程,对于索引过程就是将文档磁盘存储然后按照指定格式构建索引文件,其中涉及数据存储一些压缩、数据结构设计还是很巧妙的,下面主要记录学习过程中的StoredField、DocValue以及磁盘BKDTree的一些相关知识。参考:https://juejin.cn/post/6978437292549636132https://juejin.cn/user
scl、
·
2023-12-18 06:37
#
ElasticSearch
elasticsearch
学习
lucene
hbase
环境安装java坏境centos安装java
hadoop
环境
hadoop
安装hbase配置vi/etc/profile.d/
hadoop
-eco.sh写入:HBASE_HOME=/opt/hbasePATH
心里没有一点AC数
·
2023-12-18 05:31
hbase
hadoop
big
data
十七、如何将MapReduce程序提交到YARN运行
1、启动某个节点的某一个用户
hadoop
@node1:~$jps13025Jps
hadoop
@node1:~$yarn--daemonstartresourcemanager
hadoop
@node1:~
弦之森
·
2023-12-18 04:48
Hadoop
linux
服务器
hdfs
hadoop
mapreduce
大数据
python学习3
大家好,今天又来更新python
学习篇
了。
七七喝椰奶
·
2023-12-18 03:38
python
python
学习
开发语言
Hadoop
(海量数据存储及计算) 基本概念
Hadoop
Hadoop
是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。
ronmy
·
2023-12-18 02:51
大数据
Hadoop
大数据
海量数据
存储
Hadoop
完全分布式搭建 详细流程
Hadoop
的完全分布式搭建是一项复杂的任务,其中包含了很多步骤和细节。以下是一个简要的流程,供参考:确定
Hadoop
版本和操作系统首先,您需要确定要安装的
Hadoop
版本和所使用的操作系统。
palma_he
·
2023-12-18 01:53
hadoop
Hadoop
入门学习之二:一步一步运行WordCount
WordCount是学习
Hadoop
的经典入门范例。下面通过一步步的操作,来编译、打包、运行WordCount程序。
小_强
·
2023-12-18 00:39
Hadoop
hadoop
wordcount
入门
Hadoop
入门学习之一:Ubuntu12.04下
Hadoop
1.0.4的伪分布式安装
一、安装JDK1、下载并安装sudoapt-getinstallopenjdk-6-jdk(安装JDK7为:sudoapt-getinstallopenjdk-7-jdk)要求输入当前用户密码时输入密码,回车;要求输入YES/NO时,输入YES,回车,一路向下安装完成;2、在命令行输入JAVA-VERSION查看是否安装成功3、配置环境变量编辑文件/etc/profile,在文件最下面加入以下三行
小_强
·
2023-12-18 00:09
Hadoop
hadoop
Hadoop
hadoop1.0.4
ubuntu12.04
伪分布式安装
Hadoop
问题:启动
hadoop
时报namenode未初始化:java.io.IOException: NameNode is not formatted.
1、启动
Hadoop
ubuntu@ubuntu:~/
hadoop
-1.0.4/bin$.
小_强
·
2023-12-18 00:09
Hadoop
hadoop
Hadoop
Namenode
NameNode
namenode
入门
Linux安装
Hadoop
超详细教程
本机的配置环境如下:
Hadoop
(3.1.1)UbuntuLinux(64位系统)二、安装ssh服务ubuntu中默认是没有安装sshserver的,只有sshclient,可以使用如下命令安装:sudoapt
Jagger-Q
·
2023-12-18 00:37
大数据
hadoop
hdfs
提交Application的两种方式
Application的两种方式分别是client方式和cluster方式1.client方式这种方式,Driver进程是在client端启动启动代码样例spark-submit--masterspark://
hadoop
1
0_9f3a
·
2023-12-17 23:54
备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项——任务2:离线数据处理
MySQLhttps://www.mysql.com/软件名称版本ubuntu18.0464位
Hadoop
:
hadoop
-3.1.3.tar.gz3.1.3Jdk:jdk-8u212-linux-x64
Stitch .
·
2023-12-17 22:18
我的大学笔记
MySQL
笔记
大数据
mysql
scala
HBase 使用JDK21
HBase使用JDK21启动zookeeper和
hadoop
创建软件目录mkdir-p/opt/softcd/opt/soft下载软件wgethttps://dlcdn.apache.org/hbase
李昊哲小课
·
2023-12-17 21:40
数据库
大数据
云计算
hbase
数据库
大数据
java
数据分析
MapReduce运行模式
$
HADOOP
_HOME/etc/
hadoop
/mapred-site.xml文件中设置相关配置(默认就是该配置)。
皮卡丘要进化
·
2023-12-17 21:34
Flume在企业大数据仓库中数据收集架构
数据仓库架构文件数据和关系数据企业大数据仓库之数据收集架构||linux企业大数据仓库之数据收集架构||window总结实时收集文件框架有很多,但是其中Flume使用最广泛,主要由于其架构设计和使用简单清晰明了,又支持
Hadoop
明明德撩码
·
2023-12-17 20:45
基于
Hadoop
的智慧社区大数仓库系统设计与开发
基于
Hadoop
的智慧社区大数仓库系统设计与开发DesignandDevelopmentofaSmartCommunityDataWarehouseSystembasedon
Hadoop
目录目录2摘要3
wusp1994
·
2023-12-17 18:45
hadoop
大数据
分布式
分布式文件系统之HDFS
2)HDFS定义HDFS(
Hadoop
Distribu
僖僖cc
·
2023-12-17 17:41
hdfs
hadoop
大数据
分布式数据库HBase
HBase是依赖
Hadoop
的。为什么HBase能存储海量的数据?因为HBase是在HDFS的基础之上构建的,HDFS是分布式文
僖僖cc
·
2023-12-17 17:41
分布式
数据库
hbase
从传统型数据库到非关系型数据库
一什么是数据库数据库顾名思义保存数据的仓库,其本质是一个具有数据存储功能的复杂系统软件,数据库最终把数据保存在计算机硬盘,但数据库并不是直接读写数据在硬盘,而是中间隔了一层操作系统,通过文件系统把数据保存为本地文件系统的数据文件;我们讲过
Hadoop
僖僖cc
·
2023-12-17 17:38
数据库
nosql
Presto连接Hive
配置HiveConnectoretc/catalog/hive.propertiesconnector.name=hive-
hadoop
2hive.metastore.uri=thrift://:9083hive.config.resources
kongxx
·
2023-12-17 16:46
7.Sqoop安装
1下载并解压1.1下载地址http://mirrors.hust.edu.cn/apache/sqoop/1.4.6/1.2上传安装包sqoop-1.4.6.bin__
hadoop
-2.0.4-alpha.tar.gz
Rex_2013
·
2023-12-17 15:47
流批一体神器 Flink 之 Flink State 架构原理解析
身为大数据工程师,你还在苦学Spark、
Hadoop
、Storm,却还没搞过Flink?醒醒吧!
zhisheng_blog
·
2023-12-17 14:32
分布式
大数据
编程语言
flink
hadoop
基于
Hadoop
的电商数据分析系统设计与实现
基于
Hadoop
的电商数据分析系统设计与实现DesignandImplementationofE-commerceDataAnalysisSystembasedon
Hadoop
目录目录2摘要3关键词3第一章绪论
wusp1994
·
2023-12-17 13:40
hadoop
电商数据分析
数据分析
高效存储大规模数据的方法与实现
Hadoop
DistributedFileSystem(HDFS)是一个常用的分布式文件系统,它使用主从架构,
静谧星光c
·
2023-12-17 11:47
大数据
基于ambari
hadoop
平台的搭建
环境准备1:jdk安装,防止在/opt/data下,tar–zxf安装包在/opt/apps下所有节点都需要2:sudoaptupdate源升级,所有节点都需要3:/etc/hosts10.68.29.243iZwz9870dk1soyw67s3ephZ10.68.29.244iZwz9870dk1soyw67s3epgZ10.68.29.245iZwz9870dk1soyw67s3eplZ10.
大数据小应用
·
2023-12-17 10:04
kafka学习笔记--节点的服役与退役
如有侵权、联系速删视频教程链接:【尚硅谷】Kafka3.x教程(从入门到调优,深入全面)文章目录服役新节点新节点准备执行负载均衡操作退役旧节点执行负载均衡操作执行停止命令服役新节点依旧使用前面文章创建的三个
hadoop
102
向着百万年薪努力的小赵
·
2023-12-17 10:25
#
Kafka学习--入门到调优
kafka
学习
笔记
物联网架构之
Hadoop
修改/etc/hosts文件192.168.107.197node1192.168.107.196node2192.168.107.195node3创建用户并加入组groupadd
hadoop
useradd-g
hadoop
hduserpasswdhduservim
叮咚网工
·
2023-12-17 10:25
云计算
linux服务器
大数据
架构
hadoop
大数据
HDFS介绍+Shell操作
看黑马网课记录第二章-wwww操]使用命令操作HDFS文件系统_哔哩哔哩_bilibiliHDFS1.什么是HDFS
hadoop
三大组件之一,负责海量数据的分布式存储2.HDFS架构角色:主节点(领导)
Y蓝田大海
·
2023-12-17 10:14
大数据开发
hdfs
hadoop
大数据
Hadoop
分布式配置小白篇(附加各阶段问题解决方式)
3.ssh免密4.创建
hadoop
用户5.jdk、
Y蓝田大海
·
2023-12-17 09:09
大数据开发
hadoop
大数据
分布式
2018-06-14
Hadoop
:1.官网:http://
hadoop
.apache.org/2.
Hadoop
的狭义和褒义认识:狭义:软件(HDFS、MapReduce、Yarn)褒义:以
Hadoop
为主的生态圈3.
Hadoop
hoose
·
2023-12-17 09:26
Flink 简介
Flink简介#一、Flink简介#1.Flink发展这几年大数据的飞速发展,出现了很多热门的开源社区,其中著名的有
Hadoop
、Storm,以及后来的Spark,他们都有着各自专注的应用场景。
lz_matlab
·
2023-12-17 09:09
Flink
flink
大数据
Hadoop
中Join案例
ReduceJoin案例Map端的主要工作:为来自不同表或文件的key/value对,打标签以区别不同来源的记录。然后用连接字段作为key,其余部分和新加的标志作为value,最后进行输出。Reduce端的主要工作:在Reduce端以连接字段作为key的分组已经完成,我们只需要在每一个分组当中将那些来源于不同文件的记录(在Map阶段已经打标志)分开,最后进行合并就ok了。订单数据表t_orderi
zmx_messi
·
2023-12-17 08:43
hadoop
大数据
分布式
Docker中执行tar: Cannot read: Is a directory in docker
我想要在Docker镜像中安装
Hadoop
,下面是Dockerfile的一部分:COPY
hadoop
-3.1.2.tar.gz/usr/
hadoop
/
hadoop
-3.1.2.tar.gzRUNcd/usr
王勇1024
·
2023-12-17 08:04
Hadoop
,Hive和Spark大数据框架的联系和区别
Hadoop
,Hive和Spark是大数据相关工作中最常用的三种框架。1
Hadoop
hadoop
是一个分布式计算框架,是大数据处理的基石,大多其他框架都是以
hadoop
为基础。
Weiyaner
·
2023-12-17 06:00
数据库
大数据
hadoop
mapreduce
spark
Win10下安装大数据开发环境 spark+
hadoop
+hive(实测可用)
Win10下安装大数据开发环境spark+
hadoop
+hive(实测可用)基础环境安装spark安装
Hadoop
安装hive安装总结参考博客基础环境安装首先,我们需要搭建软件的运行环境,本文中所使用的软件均需要运行在
YannAdams
·
2023-12-17 06:30
Spark
Hadoop
Hive
大数据环境
Windows
spark
hadoop
hive
大数据生态中‘
Hadoop
’、‘Hive’、‘Spark’、‘Mapreduce’、‘HDFS’、‘Yarn’是什么关系
所以用到了
Hadoop
生态来管理信息。
Hadoop
生态中HDFS:处理存储,管理信息的分布式存储、提供接口,让用户感觉集群中的信息
小书生啊
·
2023-12-17 06:29
大数据
hadoop
hive
大数据 |
Hadoop
、Hive、Spark的关系
文章总括图数据存储单机数据库时代所有数据在单机都能存的下,数据处理的任务都是IO密集型,更谈不上分布式系统一个典型的2U服务器可以插6块硬盘,每块硬盘4T,共24T原始容量,再加上一些数据包的可用冗余,再加上一些格式化的损失,保守估计一台服务器至少可以有10T以上的可用容量,再加上128G内存和两颗CPU,装入DBMS,稍微调优,单表处理10e条数据问题不大多机数据库时代当数据量变多时,单台机器无
xyzhang2018
·
2023-12-17 06:58
数据库
hadoop
大数据
spark
[AIGC ~大数据] 深入理解
Hadoop
、HDFS、Hive和Spark:Java大师的大数据研究之旅
在这个充满机遇和挑战的领域中,我深入研究了
Hadoop
、HDFS、Hive和Spark等关键技术。本篇博客将从"是什么"、"为什么"和"怎么办"三个角度,系统地介绍这些技术。文章目录是什么?
程序员三木
·
2023-12-17 06:55
AI
大数据
hadoop
AIGC
基于
Hadoop
的铁路货运大数据平台设计与应用
完整下载:基于
Hadoop
的铁路货运大数据平台设计与应用基于
Hadoop
的铁路货运大数据平台设计与应用DesignandApplicationofRailwayFreightBigDataPlatformbasedon
Hadoop
wusp1994
·
2023-12-17 06:24
大数据
hadoop
分布式
Hadoop
文章目录1、
Hadoop
是什么2、
Hadoop
优势3、
Hadoop
组成(1)HDFS(2)YARN(3)MapReduce架构概述(4)HDFS、YARN、MapReduce三者关系(5)大数据技术生态体系
Gong_yz
·
2023-12-17 06:39
大数据
hadoop
分布式
hive学习笔记
1.HIVE结构Hive是建立在
Hadoop
上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在
Hadoop
中的大规模数据的机制。
Tech_Hog
·
2023-12-17 05:05
Hadoop
hadoop
hive
上一页
35
36
37
38
39
40
41
42
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他