E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfs集群搭建
Spark提交代码到集群中运行
一、将Spark代码提交到集群:1、将setMaster注释:2、注意输入和输出的路径,必须是
HDFS
存在的某个路径3、使用maven将代码打成jar包并上传4、构建提交命令(使用的是cluster):
新手小农
·
2023-11-08 09:23
Spark
spark
大数据
分布式
Kafka(消息队列)--简介
1、kafka:是一个高吞吐的分布式消息系统,与
Hdfs
比较相似,但是与
hdfs
的区别是在于
hdfs
是存储的是历史的、海量的数据,然而kafka存储的是实时的、最新的数据。
新手小农
·
2023-11-08 09:14
Kafka
2.11-1.0.0
kafka
分布式
airflow mysql_Airflow 使用及原理分析
这个平台拥有和Hive、Presto、MySQL、
HDFS
、Postgres等数据源
weixin_39549110
·
2023-11-08 06:40
airflow
mysql
Hadoop中Yarn资源调度器、Yarn工作机制、作业提交全过程、Yarn调度器和调度算法、先进先出调度器(FIFO)、容量调度器(Capacity Scheduler)、公平调度器(Fair Sc
文章目录16.Yarn资源调度器16.1Yarn基础架构16.2Yarn工作机制16.3作业提交全过程16.3.1
HDFS
、YARN、MapReduce三者关系16.3.2作业提交过程值YARN16.3.3
Redamancy_06
·
2023-11-08 05:03
#
Hadoop
hadoop
大数据
分布式
Redis概述和安装
今天开启中间件专栏的第一篇文章,先以Redis中间件为例,从部署安装、封装使用、原理剖析、
集群搭建
、场景模拟等多个角度,全方位总结Redis各种场景下的使用特性和相关领域知识,将自己的经验和学习进行输出
可为编程
·
2023-11-08 02:06
中间件
Redis
redis
IO多路复用
单一模型
nosql
缓存
Hadoop不主动退出安全模式
hdfs
dfsadmin-safemodeget查看安全模式的状态
hdfs
dfsadmin-safemodeleave主动关闭安全模式或者
hdfs
fsck/查看损坏的数据块
hdfs
fsck/-delete
南城守护
·
2023-11-07 22:26
hadoop
大数据
分布式
Hadoop从入门到入土(第五天)
cd/opt/module/hadoop文件名>ll>cdetc/hadoop/>复制(fs.defaultFS
hdfs
://hadoop102:8020hadoo
南城守护
·
2023-11-07 22:56
hadoop
hdfs
big
data
flink
集群搭建
1flink下载2.上传安装包3解压4修改配置文件4.1配置slaves4.2修改配置文件flink-conf.yaml5传送安装包到集群其他服务器6启动集群7验证7.1本地提交作业7.2打包提交作业1flink下载flink官方下载地址:https://flink.apache.org/downloads.html本示例下载1.7.12.上传安装包3解压tar-zxvfflink-1.7.1-b
菜菜的中年程序猿
·
2023-11-07 22:49
flink
flink集群搭建
【flink集群+高可用搭建】
flink1.
集群搭建
上传flink压缩包到指定目录解压tar-zxvfflink-1.10.1-bin-scala_2.12.tgz重命名mvflink-1.10.1flink配置环境变量:exportFLINK_HOME
长安不问
·
2023-11-07 22:49
flink
服务器
big
data
Flink Standlone
集群搭建
文章目录Flink1.12standalone集群模式搭建一、
集群搭建
准备(1)服务器资源(2)JAVA执行环境(3)flink安装包(4)服务间需要配置免密登录①执行生成SSHKEY命令②将公钥发送给需要免密的机器上二
保护我方胖虎
·
2023-11-07 22:18
flink
hadoop
linux
java
大数据
flink
云服务器搭建flink集群
2.修改集群配置3.访问WebUI4.提交作业方式5.Yarn部署模式配置5.1会话模式部署(SessionMode)5.2单作业模式(Per-jobMode)5.3应用模式部署(推荐)5.3.1上传
HDFS
几窗花鸢
·
2023-11-07 22:47
大数据应用
hadoop
服务器
flink
大数据
DataX数据同步工具
DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、
HDFS
、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS
躺着听Jay
·
2023-11-07 17:23
大数据
数据仓库
Hadoop-3.3.6完全分布式
集群搭建
目录1.克隆两台虚拟机,作为从机使用2.从机ip设置3.Xshell连接5.配置环境变量6.配置hadoop-env.sh文件及其他重要文件7.分发文件8.启动hadoop集群并测试9.访问web界面10.运行官方案例1.克隆两台虚拟机,作为从机使用右击创建好的虚拟机hadoopbase,选择管理-克隆-点击下一步-虚拟机中的当前状态-下一步-创建完整克隆-下一步-设置克隆机名称,安装位置-完成。
-ikL1122
·
2023-11-07 11:04
分布式
hadoop
大数据
ES(ElasticSearch)快速入门和
集群搭建
文章目录1.ES快速入门1.1.index管理1.2.mapping管理1.3.document管理1.4.ES读写过程1.4.1.documnetrouting(数据路由)1.4.2.为什么primaryshard数量不可变?1.5.luke查看ES的逻辑结构2.IK分词器2.1.测试分词器2.2.中文分词器2.2.1.Lucene自带中文分词器2.2.2.第三方中文分析器2.3.安装IK分词器
AiTtang
·
2023-11-07 08:28
ElasticSearch
elasticsearch
全文检索
Hadoop知识点全面总结
文章目录什么是HadoopHadoop发行版介绍Hadoop版本演变历史Hadoop3.x的细节优化Hadoop三大核心组件介绍
HDFS
体系结构NameNode介绍总结SecondaryNameNode
小崔的技术博客
·
2023-11-07 08:40
大数据学习
hadoop
大数据
分布式
Haddop,
HDFS
和MapDeduce简单理论
HadoopHadoop1Hadoop2
HDFS
3.MapDeduceHadoop1Hadoop开源的分布式存储+分布式计算平台核心组件:
HDFS
:分布式文件系统,存储海量数据。
杰KaMi
·
2023-11-07 06:25
linux
hadoop
大数据
面试最新整理常问Spark知识点
RDD的五个特性:1.AlistofpartitionsRDD是一个由多个partition(某个节点里的某一片连续的数据)组成的的list;将数据加载为RDD时,一般会遵循数据的本地性(一般一个
hdfs
000X000
·
2023-11-07 05:13
Spark
Spark知识点
面试
Spark Streaming知识点总结
而结果也能保存在很多地方,如
HDFS
,数
「miraitowa」
·
2023-11-07 05:41
Spark
大数据
spark
Spark基础知识点
分布式文件系统(HadoopDistributedFileSystem)当数据集达到一定规模,单机无法处理把数据分布到各个独立的机器上(多机器共同协作)网络
HDFS
优缺点优点:构建在廉价的机器上使用大数据处理高容错硬件错误流式数据访问大规模数据集简单的一致性模型
蛋炒双黄蛋
·
2023-11-07 05:04
Spark
数据库
Java-Hbase介绍
HDFS
为Hbase提供可靠的底层数据存储服务,MapReduce为Hbase提供高性能的计算能力,Zookeeper为Hbase提供稳定服务和Failover机制,因此我们说Hbase是一个通过大量廉价的机器解决海量数据的高速存储和读取的分布式数据库解决方案
狠情
·
2023-11-06 23:05
hbase
数据库
大数据
DCU
集群搭建
虚拟环境方法简介
1.conda安装方法:wgethttps://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh#下载miniconda安装包chmod750Miniconda3-latest-Linux-x86_64.sh#添加执行权限bash./Miniconda3-latest-Linux-x86_64.sh#安装下载的minncon
eating_Y
·
2023-11-06 20:04
集群学习
linux
dcu
集群
第一章 搭建你的第一个Kubernetes集群
文章目录第一章搭建你的第一个Kubernetes集群1.1课程目标1.2搭建k8s集群步骤和重点介绍1.2.1kubernetes
集群搭建
前的诸多问题1.2.2安装步骤总监1.3环境准备,这里使用ubuntu1.4
秋雪夜雨寒
·
2023-11-06 19:44
kubernetes
k8s
docker
Hadoop分布式系统架构详解
分组:比如有一个大型数据,那么他就会将这个数据按照算法分成多份,每份存储在从属主机上,并且在从属主机上进行计算,主节点主要负责Hadoop两个关键功能模块
HDFS
、MapReduce的监督。
25577033_malong
·
2023-11-06 19:30
大数据
hadoop
架构
big
data
HDFS
速通之一文详解
HDFS
全部知识点
文章目录
HDFS
介绍
HDFS
体系
HDFS
的Shell介绍
HDFS
的常见Shell操作
HDFS
案例实操Java操作
HDFS
配置环境
HDFS
的回收站
HDFS
的安全模式实战:定时上传数据至
HDFS
HDFS
的高可用和高扩展
小崔的技术博客
·
2023-11-06 18:49
大数据学习
hdfs
hadoop
大数据
Flume从入门到精通一站式学习笔记
文章目录什么是FlumeFlume的特性Flume高级应用场景Flume的三大核心组件Source:数据源channelsinkFlume安装部署Flume的使用案例:采集文件内容上传至
HDFS
案例:采集网站日志上传至
小崔的技术博客
·
2023-11-06 18:49
大数据学习
flume
学习
笔记
基于
HDFS
实现的简易云盘系统
文章目录前言一、实验简介二、分析与设计1.功能需求分析:2.系统设计三、效果展示四、环境配置五、功能实现1.基础部分2.用户管理3.文件管理六、项目资源七、其他八、参考文件前言基于
HDFS
的云盘系统实现了云盘的基本数据存储和访问功能
putaojuzi
·
2023-11-06 16:02
学习总结
Hadoop
hdfs
hadoop
大数据
java
【大数据处理框架】Hadoop大数据处理框架,包括其底层原理、架构、编程模型、生态圈
首先,我们来了解一下
HDFS
。
HDFS
是Hadoop的核心组件之一,它是一个分布式文件系统,将文件分成多个数据块,并存储在集群中的不同节点上,每个数据块的默认
我是廖志伟
·
2023-11-06 15:41
#
大数据开发
hadoop
架构
大数据
spark课程大纲
Spark环境搭建CentosSpark单机版伪分布式模式Spark单机版intelij开发(maven)Spark完全分布式
集群搭建
Sparkhistoryserver配置使用二种方法实现Spark计算
张明洋_4b13
·
2023-11-06 15:41
【MongoDB】
集群搭建
实战 | 副本集 Replica-Set | 分片集群 Shard-Cluster | 安全认证
文章目录MongoDB集群架构副本集主节点选举原则搭建副本集主节点从节点仲裁节点连接节点添加副本从节点添加仲裁者节点删除节点副本集读写操作副本集中的方法分片集群分片集群架构目标第一个副本集第二个副本集配置集初始化副本集路由集添加分片开启分片集合分片删除分片安全认证MongoDB用户和角色权限副本集安全认证创建副本集认证的key文件修改配置文件指定keyfile分片集群安全认证MongoDB集群架构
ღCauchyོꦿ࿐
·
2023-11-06 15:49
MongoDB
mongodb
安全
数据库
集群
分布式
阿里终面:10亿数据如何快速插入MySQL
假设和面试官明确后,有如下约束10亿条数据,每条数据1Kb数据内容是非结构化的用户访问日志,需要解析后写入到数据库数据存放在
Hdfs
或S3分布式文件存储里10亿条数据并不是1个大文件,而是被近似切分为100
TNT报社
·
2023-11-06 13:49
mysql
数据库
大数据量
批量插入
Zookeeper监控机制
Zookeeper是有⼀个⼼跳监控机制存在的,⼀般都是每隔2秒就⼼跳⼀下来确认Controller是否还存活,如果不存在的话就会把资源节点让给其他的Controller,这个⼼跳检测机制是⽐较常⻅的,⽐如
HDFS
冷艳无情的小妈
·
2023-11-06 11:23
java
大数据
开发语言
zookeeper
kafka
mapreduce详细工作流程
mapreduce工作流程map任务处理1.1框架使用InputFormat类的子类把输入文件(夹)划分为很多InputSplit,默认,每个
HDFS
的block对应一个InputSplit。
瞌死在大数据
·
2023-11-06 09:57
hadoop
mapreduce
hadoop
hdfs
【Hadoop】MapReduce工作流程
MapReducer工作流程读数据1.客户端提交作业任务;2.Job根据作业任务获取文件信息;3.InputFormat将文件按照设定的切片大小(一般切片大小等于
HDFS
中的Block块大小)进行切片操作
温wen而雅
·
2023-11-06 09:57
大数据
hadoop
mapreduce
MapReduce详细工作流程
源码链接1.文本job提交------Job源码链接2.FileInputFormat按照块大小(128m)进行切片------切片源码链接3.切片信息,jar包(Job提交到集群运行时),配置信息上传到
HDFS
水花一直飞
·
2023-11-06 09:56
mapreduce
大数据
hadoop
mapreduce
hadoop
大数据
12.ActiveMQ基于 ZooKeeper + LevelDB 的 HA
集群搭建
&& 集群Demo
目录1.概要2.ActiveMQ基于ZooKeeper+levelDB的HA
集群搭建
3.ActiveMQ集群高可用案例1.概要使用ZooKeeper实现的master-slave实现方式,是对ActiveMQ
扛麻袋的少年
·
2023-11-06 05:35
ActiveMQ
ActiveMQ
+
LevelDB
模式集群
2021-02-21
13面试问题(2)是否存在i+1{(line.split(",")(3),1)}).reduceByKey(_+_).foreach(println)B、
HDFS
中有两个文件a.text与b.text,
saluch
·
2023-11-06 05:43
Hadoopo-MapReduce(数据处理)
以Hadoop分布式文件系统(HadoopDistrributedFileSystem,
HDFS
)和MapReduce(GoogleMapReduce的开源实现)为核心的Hadoop,为用户提供了系统底层细节透明的分布式基
qq_42601983
·
2023-11-06 05:53
WARNING: HADOOP_SECURE_DN_USER has been replaced by
HDFS
_DATANODE_SECURE_USER. Using value of HADOOP
hadoop启动时报错:WARNING:HADOOP_SECURE_DN_USERhasbeenreplacedby
HDFS
_DATANODE_SECURE_USER.UsingvalueofHADOOP_SECURE_DN_USER
D老歪
·
2023-11-06 05:23
微服务专题
hadoop
hdfs
大数据
【基础篇】大数据学习笔记(4)相关名词解释
GFS:GoogleFileSystemGoogle文件系统
HDFS
:HadoopDsitributedFileSystemHadoop分布式文件系统Zookeeper:分布式应用程序协调服务,是Hadoop
风也醉
·
2023-11-06 02:54
Apache Doris整体架构、FE元数据管理及数据组织
目录1.Doris整体架构2.FE元数据管理3.Doris数据组织1.Doris整体架构Doris主要分为FE和BE两个组件,FE主要负责查询的编译,分发和元数据管理(基于内存,类似
HDFS
NN);BE
国林哥
·
2023-11-06 02:47
Doris
架构
database
大数据
数据仓库
etl
2020-04-21
通过命令-setrep设置
HDFS
中文件的副本数量[
[email protected]
]$hadoopfs-setrep10/sanguo/shuguo/kongming.txt这里设置的副本数只是记录在
Map_Reduce
·
2023-11-06 02:57
Hadoop2.6.5
集群搭建
搭建虚拟机以下搭建所需环境和资源包为VMwareCentOS7Hadoop2.6.5.tar.gzJDK1.8+使用虚拟机安装3个CentOS7的主机模拟服务器,分别为master、slave1、slave2主节点需要额外的内存资源开销,所以在生产环境中给master节点多分配内存资源从节点需要额外的磁盘资源,所以在生产环境给每个slave节点多分配磁盘空间如果通过克隆虚拟机等设置的虚拟机需要配置
Alexciヾ
·
2023-11-06 01:26
大数据
大数据
hadoop
linux
java
centos
windows 平台上使用 pyarrow 连接
hdfs
详细教程
Indexwindows平台上使用pyarrow连接
hdfs
详细教程连接教程踩坑记录进入支线:编译
hdfs
.dll进入支线的支线:编译OpenSSL多个OpenSSL的设置问题意想不到的大坑回到支线,编译
Loasn
·
2023-11-06 00:24
hadoop
大数据
hdfs
python
pyarrow读写
hdfs
官方API文档:https://arrow.apache.org/docs/python/index.html1、测试服务器能够正确连接
hdfs
:>hadoopfs-ls/Found5itemsdrwxrwxrwx-hbasesupergroup02021
影子飞扬
·
2023-11-06 00:19
python基础教程
hdfs
hadoop
big
data
python
pyarrow 实现
hdfs
和本地文件传输
目录pyarrow实现
hdfs
和本地文件传输1.安装pyarrow2.相关代码2.1.
hdfs
->本地2.2.本地->
hdfs
2.3.一个简单的例子参考文章pyarrow实现
hdfs
和本地文件传输python
Solarzhou
·
2023-11-06 00:17
大数据
程序人生
hdfs
hadoop
大数据
python
Spark系列—spark简介
具有如下特性:1、高效性体现在内存存储中间计算结果,基于DAG图执行引擎的优化,减少多次中间结果写
HDFS
开销。
数据小白的进阶之路
·
2023-11-05 23:19
Spark
spark
大数据
Centos8中Hadoop3.3.1安装详细过程(含图文)
版本五、安装Hadoop3六、配置hadoop环境变量七、Hadoop伪分布式配置1、Hadoop环境变量设置2、Hadoop配置文件的修改(1)修改配置文件core-site.xml(2)修改配置文件
hdfs
-site.xml
wat-999
·
2023-11-05 23:17
开发语言
hadoop
分布式
Elasticsearch
集群搭建
手册及配置详情(基于elasticsearch-8.5.2版本)
Elasticsearch
集群搭建
手册及配置详情(基于elasticsearch-8.5.2版本)0安装前准备工作0.1安装包下载组件安装包下载地址eselasticsearch-8.5.2-linux-x86
可乐大数据
·
2023-11-05 23:12
elasticsearch
大数据
Hadoop
集群搭建
,基于3.3.4hadoop和centos8【图文教程-从零开始搭建Hadoop集群】,常见问题解决
Hadoop
集群搭建
,基于3.3.4hadoop和centos8【小白图文教程-从零开始搭建Hadoop集群】,常见问题解决Hadoop
集群搭建
,基于3.3.4hadoop1.虚拟机的创建1.1第一台虚拟机的创建
杀死一只知更鸟debug
·
2023-11-05 23:10
Linux
hadoop
大数据
hdfs
hadoop完全分布式
集群搭建
步骤
观看此文档的基础为已经在VMWareWorkStationPro里面安装好了一台centOS7.最好是最小安装版本的.(最好在磁盘预留30G左右空间用于安装三台虚拟机)在这里插入图片描述先确认虚拟机是否可以联网pingwww.baidu.com(正常安装后可以联网)如图所示可以联网,然后可以ctrl+c停掉安装网络工具:yuminstallnet-tools(会出现y/n的选项输入yes即可)输入
xxxyyyttt!
·
2023-11-05 23:09
上一页
36
37
38
39
40
41
42
43
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他