E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfs集群搭建
Flink 本地单机/Standalone集群/YARN模式
集群搭建
准备工作本文简述Flink在Linux中安装步骤,和示例程序的运行。需要安装JDK1.8及以上版本。下载地址:下载Flink的二进制包点进去后,选择如下链接:解压flink-1.10.1-bin-scala_2.12.tgz,我这里解压到soft目录[root@hadoop1softpackage]#tar-zxvfflink-1.10.1-bin-scala_2.12.tgz-C../soft/
程序猿进阶
·
2023-12-16 20:26
Flink
flink
大数据
Hbase2.1
集群搭建
>Hbase在大数据的体系中扮演着DB角色,不得不说是重要的一员,在上一篇,大猪已经给大家演示了[Hadoop3.2
集群搭建
](https://www.jianshu.com/p/3182aaff918d
kikiki4
·
2023-12-16 19:41
RabbitMQ
集群搭建
介绍RabbitMQ是一个开源的消息代理软件,实现了高级消息队列协议(AMQP,AdvancedMessageQueuingProtocol)。它充当了消息的中间件,用于在分布式系统中传递消息,提供了可靠的、异步的、跨应用程序的消息传递机制。RabbitMQ的主要特点和用途:消息队列:RabbitMQ作为消息队列(MessageQueue)的一种实现,允许应用程序之间通过消息进行通信。消息队列可以
云计算1028
·
2023-12-16 16:29
rabbitmq
Sqoop基础理论与常用命令详解(超详细)
文章目录前言一、Sqoop概述1.Sqoop简介2.Sqoop架构(1)SqoopClient(2)SqoopServer(3)Connector(4)Metastore(5)Hadoop/
HDFS
3.
大数据魔法师
·
2023-12-16 15:57
大数据
sqoop
hadoop
hive
Zookeeper
集群搭建
文章目录Zookeeper
集群搭建
一.简介二.环境准备三.安装zookeeper3.1下载zookeeper3.2安装jdk解压zookeeper四.配置集群4.1配置zookeeper服务器文件4.2
Direct_
·
2023-12-16 14:37
zookeeper
zookeeper
linux
zookeeper部署
Mapreduce小试牛刀(1)
1.与
hdfs
一样,mapreduce基于hadoop框架,所以我们首先要启动hadoop服务器-----------------------------------------------------
printcsr
·
2023-12-16 12:51
mapreduce
Mapreduce小试牛刀(2)--java api
1.同
hdfs
的javaapi,我们首先要在IDE中建立一个maven项目pom.xml中配置如下:org.apache.hadoophadoop-mapreduce-client-common3.3.4org.apache.hadoophadoop-mapreduce-client-jobclient3.3.4org.apache.hadoophadoop-client3.3.4org.slf4
printcsr
·
2023-12-16 12:51
学习
Hdfs
java API
1.在主机上启动hadoopsbin/start-all.sh这里有一个小窍门,可以在本机上打开8088端口查看三台机器的连接状态,以及可以打开50070端口,查看
hdfs
文件状况。
printcsr
·
2023-12-16 12:21
学习
nacos linux
集群搭建
1.2.1
第一步下载nacoshttps://github.com/alibaba/nacos/releases手动下载再传到服务器,或者linux直接wget都可以解压修改application.properties内容如下server.contextPath=/nacosserver.servlet.contextPath=/nacosserver.port=8484db.num=1db.url.0=j
昵称违规
·
2023-12-16 11:13
Hive命令操作
linux语句;3.运行
hdfs
命令-->dfs–
hdfs
语句;4.运行sq
xinxinyydss
·
2023-12-16 08:38
hive
hadoop
数据仓库
华为大数据开发者教程知识点提纲
一、线下处理1.离线处理方案数据支持:
HDFS
调度:YARN收入:Flume,sqoop,loader处理:Mapreduce,SparkSql,spark,hive(,Flink)2.HadoopNamenode
qq_1418269732
·
2023-12-16 06:08
大数据
【Hive】——DDL(TABLE)
describeformattedstudent;2删除表如果已配置垃圾桶且未指定PURGE,则该表对应的数据实际上将移动到
HDFS
垃圾桶,而元数据完全丢失。
那时的样子_
·
2023-12-16 05:05
hive
hadoop
数据仓库
使用sqoop操作
HDFS
与MySQL之间的数据互传
一,数据从
HDFS
中导出至MySQL中1)开启Hadoop、mysql进程start-all.sh/etc/init.d/mysqldstart/etc/init.d/mysqldstatus2)将学生数据
冬瓜的编程笔记
·
2023-12-16 05:44
大数据
sqoop
hdfs
mysql
Docker-compose部署zookeeper+storm集群【保成,秒回】
docker-hub官网教程dockerstorm官网docker-compose安装请参考【Docker安装部署Zookeeper+Kafka集群详细教程、部署过程中遇到问题&解决方案】zookeeper
集群搭建
请参考
小小小秃头
·
2023-12-16 05:24
docker
zookeeper
storm
【Hadoop-Distcp】通过Distcp的方式进行两个
HDFS
集群间的数据迁移
【Hadoop-Distcp】通过Distcp的方式进行两个
HDFS
集群间的数据迁移1)Distcp工具简介及参数说明2)Shell脚本1)Distcp工具简介及参数说明【Hadoop-Distcp】工具简介及参数说明
bmyyyyyy
·
2023-12-16 05:45
Hadoop
hadoop
hdfs
【Hadoop-CosDistcp-Distcp】通过命令方式将Cos中的数据迁移至
HDFS
,再将
HDFS
数据迁移至S3
【Hadoop-CosDistcp-Distcp】通过命令方式将Cos中的数据迁移至
HDFS
,再将
HDFS
数据迁移至S31)Shell脚本2)参数说明1)Shell脚本注意:此Shell脚本内置了按照sample_date
bmyyyyyy
·
2023-12-16 05:15
Hadoop
hadoop
hdfs
大数据
【Hadoop-Distcp】通过Distcp的方式迁移Hive中的数据至存储对象
Distcp的方式迁移Hive中的数据至存储对象1)了解Distcp1.1.Distcp的应用场景1.2.Distcp的底层原理2)使用Distcp4)S3可视化App下载4)S3可视化App使用5)跨集群迁移
HDFS
bmyyyyyy
·
2023-12-16 05:14
Hadoop
hadoop
hive
大数据
【Hadoop-OBS-Hive】利用华为云存储对象 OBS 作为两个集群的中间栈 load 文件到 Hive
利用华为云存储对象OBS作为两个集群的中间栈load文件到Hive1)压缩文件2)上传文件到OBS存储对象3)crontab定时压缩上传4)从obs上拉取下来文件后解压缩5)判断对应文件是否存在6)上传至
HDFS
bmyyyyyy
·
2023-12-16 04:04
Hadoop
hadoop
hive
华为云
Spark编程实验一:Spark和Hadoop的安装使用
一、目的与要求1、掌握在Linux虚拟机中安装Hadoop和Spark的方法;2、熟悉
HDFS
的基本使用方法;3、掌握使用Spark访问本地文件和
HDFS
文件的方法。
Francek Chen
·
2023-12-16 04:32
Spark编程基础
spark
hadoop
大数据
Nacos配置管理-nacos
集群搭建
二、计划实现--计划架构--3个Nacos节点;3个mysql库;--计划节点地址--三、
集群搭建
3.1基本步骤(1)搭建数据库,初始化数据库表结构(2)下载nacos安装包(3)配置nacos(4)启动
Crhy、Y
·
2023-12-16 04:50
java
开发语言
intellij-idea
spring
cloud
nginx
dubbo
Redis-分片集群大纲
1.Redis集群方案比较哨兵分片2.Redis分片
集群搭建
3.Java操作redis分片集群jedislettuce4.Redis集群原理分析槽位定位算法HASH_SLOT=CRC16(key)mod16384
JackHuan_code
·
2023-12-16 04:23
redis
redis
数据库
缓存
pyspark on yarn
直接下载hive组件的客户端配置就可以,它里面包含了
hdfs
和yarn的配置。如下所示:
[email protected]
骑着蜗牛向前跑
·
2023-12-16 03:34
大数据
pyspark
on
yarn
python
大数据
十四、YARN核心架构
1、目标(1)掌握YARN的运行角色和角色之间的关系(2)理解使用容器做资源分配和隔离2、核心架构(1)和
HDFS
架构的对比
HDFS
架构:YARN架构:(主从模式)(2)角色解释ResourceManager
弦之森
·
2023-12-16 01:52
Hadoop
hdfs
hadoop
yarn
mapreduce
大数据
基于spark的音乐数据分析系统的设计与实现
收藏关注不迷路文章目录前言一、项目介绍二、开发环境三、功能介绍四、核心代码五、效果图六、文章目录前言本文主要对音乐数据,进行分析,系统技术主要使用,1.对原始数据集进行预处理;3.使用python语言编写Spark程序对
HDFS
QQ2743785109
·
2023-12-16 01:05
spark
python
spark
大数据
分布式
单节点hadoop搭建
tar.gz解压文件,配置HADOOP_HOME编辑文件etc/hadoop/hadoop-env.sh配置JAVA_HOME配置etc/hadoop/core-site.xml文件fs.defaultFS
hdfs
曾阿伦
·
2023-12-16 00:04
hadoop
hadoop
大数据
分布式
ambari 开启
hdfs
回收站机制
hdfs
回收站类似于我们常用的windows中的回收站,被删除的文件会被暂时存储于此,和回收站相关的参数有两个:fs.trash.interval:默认值为0代表禁用回收站,其他值为回收站保存文件时间,
dogplays
·
2023-12-16 00:01
hdfs
ambari
hdfs
hue的安装和hadoop集群整合
通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据,例如操作
HDFS
上的数据,运行Map
五块兰州拉面
·
2023-12-16 00:15
#
hue
大数据
大数据学习(一)--------
HDFS
2、hadoophadoop有三个核心组件:
hdfs
:分布式文件系统mapreduce:分布式运算编程框架yarn:分布式资源调度平台3
大数据流动
·
2023-12-15 21:01
利用 docker 掌握 kafka 总集篇
文章目录第一节Kafka集群承前Kafka
集群搭建
**概述****操作流程**Kafka集群快速搭建安装Docker**zookeeper**集群**新建docker网络****yml脚本****验证*
lluxury
·
2023-12-15 21:59
kafka
cluster
Hadoop在mac上的安装与配置
adoptopenjdk8安装指导,指导里面把java换成8:https://medium.com/beeranddiapers/installing-hadoop-on-mac-a9a3649dbc4d验证
hdfs
大红豆小薏米
·
2023-12-15 20:45
Hadoop和Spark的区别
SparkSpark模型是对Mapreduce模型的改进,可以说没有
HDFS
、Mapreduce就没有Spark。Spark可以使用Yarn作为他的资源管理器,并且可以处理
HDFS
数据。
旅僧
·
2023-12-15 20:12
hadoop
spark
大数据
Spark 随机森林算法原理、源码分析及案例实战
大家可以根据自己的喜好使用自己擅长的Linux发行版Java与Scala版本:Scala2.10.4,Java1.7Spark集群环境(3台):Hadoop2.4.1+Spark1.4.0,Spark
集群搭建
方式参见本人博客
黑谷子
·
2023-12-15 19:51
spark
scala
源码
ElasticSearch高可用
集群搭建
1.环境准备本文已三个节点(服务器)为例,准备三台服务器2.搭建过程1).三台服务器分别搭建es(ES8+JDK17)上传安装包和解压tar-zxvfelasticsearch-8.4.1-linux-x86_64.tar.gz新建一个用户,安全考虑,elasticsearch默认不允许以root账号运行创建用户:useraddes_user设置密码:passwdes_user修改目录权限#chm
01宇宙
·
2023-12-15 19:20
elasticsearch
大数据
搜索引擎
全文检索
【Hadoop】执行start-dfs.sh启动hadoop集群时,datenode没有启动怎么办
执行start-dfs.sh后,datenode没有启动,很大一部分原因是因为在第一次格式化dfs后又重新执行了格式化命令(
hdfs
namenode-format),这时主节点namenode的clusterID
不怕娜
·
2023-12-15 19:13
hadoop
大数据
分布式
spark链接hive时踩的坑
中也可以看到这个数据库,建表插入数据也没有问题,但是当我们去查询数据库中的数据时,发现查不到数据,去查hive的元数据,发现,spark在创建数据库的时候将数据库创建在了本地文件系统中而我们的hive数据是存放在
hdfs
YuPangZa
·
2023-12-15 18:00
大数据中踩过的坑
spark
hive
大数据
K8s 入门指南(一):单节点集群环境搭建
系统配置CentOS7.9(2核2G)本文为k8s入门指南专栏,将会使用kubeadm搭建单节点k8s集群,详细讲解环境搭建部署的细节,专栏后面章节会以实战代码介绍相关概念,带您快速入门k8s搭建方式k8s
集群搭建
有三种方式
ReturnTmp
·
2023-12-15 17:48
k8s
k8s
kubernetes
容器
容器编排
集群搭建
大数据基础知识
为了一场紧急考试,没有正经系统学习过大数据知识的我开始恶补概念涉及Hadoop、Hbase、Spark、Flink、Flume、Kafka、Sqoop、
HDFS
、Hive、Mapreduce、Impala
偶余杭
·
2023-12-15 17:22
HBase
HBase是一个基于列式存储的分布式数据库,其核心架构由五部分组成:HBaseClient、HMaster、RegionServer、ZooKeeper以及
HDFS
。
编织幻境的妖
·
2023-12-15 17:35
hbase
数据库
大数据
HBase 详细图文介绍
2.3.1NameSpace2.3.2Table2.3.3Row2.3.4Column2.3.5TimeStamp2.3.6Cell三、HBase基本架构架构角色3.1Master3.2RegionServer3.3Zookeeper3.4
HDFS
Stars.Sky
·
2023-12-15 16:24
HBase
hbase
数据库
大数据
万字详解RocketMq
集群搭建
步骤
1.配置三台主机的IP与主机名的映射三台机器都使用vim/etc/hosts将上边的ip与主机名称放到hosts文件里边。cat/etc/hosts可以显示hosts文件里边的内容192.168.150.139mq1192.168.150.137mq2192.168.150.138mq32.安装JDK1.8和RocketMQ在三台机器/usr/local/目录下mkdir/jdk创建放置压缩包的目
努力的布布
·
2023-12-15 15:25
rocketmq
kudu由来、架构、数据存储结构、注意事项
1.1一方面:在KUDU之前,大数据主要以两种方式存储;(1)静态数据:以
HDFS
引擎作为存储引擎,适用于高吞吐量的离线大数据分析场景。这类存储的局限性是数据无法进行随机的读写。(2)动
AllenGd
·
2023-12-15 13:32
KUDU
kudu
【基础知识】Hadoop生态系统
关键词——容灾主从结构、多副本主要特点分布式存储-Hadoop采用
HDFS
文件系统,可以将大数据分布式存储在集群中的多台服务器上。
偏振万花筒
·
2023-12-15 12:40
hadoop
大数据
分布式
【基础知识】大数据概述
发展历程中国开源生态图谱2023参考内容中国开源生态图谱2023.pdf技术组件说明数据集成sqoop、dataX、flume数据存储
hdfs
、kafka数据处理mapreduce、hive、impala
偏振万花筒
·
2023-12-15 12:39
大数据
Flink
集群搭建
1安装包下载根据自己的环境下载相应的flink安装包:https://flink.apache.org/downloads.html下载的版本要与自己的scala版本一致,我安装的scala版本为2.11,所以要下载对应scala2.11版本的flink我使用的环境linux-CentOS7.9、Scala-2.11.6、jdk-1.8、flink-1.7.2-bin-hadoop27-scala
NemoonFish
·
2023-12-15 12:20
flink集群搭建
flink
hadoop-
hdfs
简介及常用命令详解(超详细)
文章目录前言一、
HDFS
概述1.
HDFS
简介2.
HDFS
架构3.
HDFS
文件操作二、
HDFS
命令介绍1.
hdfs
命令简介2.
HDFS
命令的基本语法3.常用的
HDFS
命令选项三、
HDFS
常用命令1.列出指定路径下的文件和目录
大数据魔法师
·
2023-12-15 11:22
大数据
hadoop
hdfs
大数据
【深入剖析K8s】第四章 K8S
集群搭建
与配置
使用kubeadm工具来部署K8SK8S部署利器:kubeadm2017年一个独立的部署工具才终于诞生名叫kubeadm。这个项目的目标就是要让用户能够通过如下两条指令部署—个Kubernetes集群:#创建一个Master节点kubeadminit#将一个Node节点加入当前集群Kubeadmjoinkubeadm的工作原理直接在宿主机上运行kubelet,然后使用容器部署其他Kubemetes
偶入编程深似海
·
2023-12-15 08:20
kubernetes
容器
云原生
hadoop使用内置包进行性能测试TestDFSIO、NNBench、MRBench、SliveTest
使用内置包进行性能测试TestDFSIOread&writeNNBenchMRBenchSliveTestTestDFSIOread&writeTestDFSIO是一个Hadoop自带的基准测试工具,用于测试
HDFS
何亚告
·
2023-12-15 07:51
菜鸟日常
hadoop
大数据
分布式
大数据技术13:HBase分布式列式数据库
Hadoop可以通过
HDFS
来存储结构化、半
Java架构何哥
·
2023-12-15 07:05
大数据治理
大数据
HBase列式数据库
Hbase表的数据结构
【Spark精讲】Spark存储原理
目录类比
HDFS
的存储架构Spark的存储架构存储级别RDD的持久化机制RDD缓存的过程Block淘汰和落盘类比
HDFS
的存储架构
HDFS
集群有两类节点以管理节点-工作节点模式运行,即一个NameNode
话数Science
·
2023-12-15 07:29
Spark精讲
Spark
大数据
spark
大数据
【Hadoop】
Hadoop是一个开源的分布式离线数据处理框架,底层是用Java语言编写的,包含了
HDFS
、MapReduce、Yarn三大部分。
想当运维的程序猿
·
2023-12-15 07:43
hadoop
大数据
分布式
上一页
21
22
23
24
25
26
27
28
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他