E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
集群搭建Hadoop
hadoop
hive spark flink 安装
下载地址Indexof/distubuntu安装
hadoop
集群准备IP地址主机名称192.168.1.21node1192.168.1.22node2192.168.1.23node3上传
hadoop
nsa65223
·
2023-12-28 11:59
hadoop
hive
spark
Spark从入门到精通23:Spark SQL简介
我们知道Hive是
Hadoop
生态中的一个数据分析引擎,它可以将HiveSQL转换成MapReduce任务提交到
Hadoop
集群中执行,大大简化了编写MapReduce程序的
金字塔下的小蜗牛
·
2023-12-28 09:20
Nacos使用快速入门
namespace给微服务配置namespaceNacos与Eureka的区别Nacos做配置中心快速入门在nacos中添加配置文件从微服务拉取配置配置热更新方式一方式二配置共享配置共享的优先级Nacos
集群搭建
集群结构图搭建集群初始化
Binary Oracle
·
2023-12-28 07:45
#
SpringCloud
java
spring
boot
spring
cloud
Nginx+keepalived从入门到
集群搭建
(手把手教学,建议收藏)
目录一、什么是Nginx二、Nginx的相关概念1.正向代理2.反向代理3.负载均衡4.动静分离三、Nginx安装1.安装2.其他配置3.windows中nginx安装四、Nginx常用命令1.查看nginx版本号2.启动3.关闭4.重新加载命令五、Nginx的配置文件1.配置文件位置2.分析nginx.conf配置文件六、Nginx配置-反向代理11.实现效果:2.tomcat启动3.nginx
秃了也弱了。
·
2023-12-28 06:03
中间件
nginx
构建高效数据中台:集群规划与搭建的最佳实践指南
然而,
Hadoop
也支持通过调整队列的权重和使用抢占策略来优化资源的使用。例如&
数据与后端架构提升之路
·
2023-12-28 04:20
#
数据中台
大数据
win7配置
hadoop
-2.7.7详细教程
Date:2019/09/27Version:
hadoop
2.7.7;java1.8.0_221;流程安装java下载并解压
hadoop
压缩包修改配置文件下载winutil,并覆盖启动
hadoop
0.安装
pluo1717
·
2023-12-28 04:02
Hive
Hive是基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射为一张表(类似于RDBMS中的表),并提供类SQL查询功能;Hive是由Facebook开源,用于解决海量结构化日志的数据统计。
之古
·
2023-12-28 02:58
Hadoop
集成对象存储和HDFS磁盘文件存储
1.环境配置1.1版本说明组件版本是否必须其他事项
Hadoop
3.3.0+是
hadoop
3.3.0之后原生支持国内主要对象存储Hive3.1.3否实测没有Hive也可以使用sparksql,使用hive
tuoluzhe8521
·
2023-12-28 02:38
Hadoop
hadoop
hdfs
大数据
阿里云
Hadoop
集群找不到native-
hadoop
1.问题描述========hive运行中的问题,需要把把native复制进去/usr/lib2023-02-1519:59:42,165WARNscheduler.TaskSetManager:Losttask11.0instage1.0(TID3,common4,executor2):java.lang.RuntimeException:HiveRuntimeErrorwhileclosing
tuoluzhe8521
·
2023-12-28 02:38
Hadoop
hadoop
大数据
分布式
EMR集群迁移自建
Hadoop
(元数据及HDFS数据)
1.背景老集群采用的腾讯emr集群,使用过程中磁盘扩容成本费用高且开源组件兼容性存在问题,因此决定采用自建
hadoop
集群,需要将emr的元数据和hdfs基础数据迁移过来。
tuoluzhe8521
·
2023-12-28 02:37
Hadoop
hadoop
hdfs
大数据
大数据开发之Sqoop详细介绍
测试环境CDH6.3.1Sqoop1.4.7一.Sqoop概述ApacheSqoop(SQL-to-
Hadoop
)项目旨在协助RDBMS与
Hadoop
之间进行高效的大数据交流。
lcz-2000
·
2023-12-27 23:31
大数据
sqoop
hadoop
Hive 部署
Hive构建在Apache
Hadoop
之上,并通过hdfs支持S3,adls,gs等存储。Hive允许用户使用SQL读取、写入和管理PB级数据。官网地址二、架构Hive中主要包
有人看我吗
·
2023-12-27 23:54
hive
hadoop
数据仓库
大数据-Zookeeper 安装步骤(亲测保成功)
第2章Zookeeper本地安装步骤1.上传到
hadoop
01上面的apps包下面[root@
hadoop
01current]#cd/opt/apps2.解压该文件tar-zxvfzookeeper-3.4.6
王哪跑nn
·
2023-12-27 21:39
大数据
linux
linux
zookeeper
大数据
Hadoop
集群shell常用命令
1.启动
hadoop
所有进程start-all.sh#等价于start-dfs.sh+start-yarn.sh但是一般不推荐使用start-all.sh(因为开源框架中内部命令启动有很多问题)。
Youngmon
·
2023-12-27 21:10
MATLAB入门
设计和问题求解而设计的桌面环境用于可视化数据的图形和用于创建自定义绘图的工具用于曲线拟合、数据分类、信号分析、控制系统优化和许多其他任务的APP用于各种工程和科学应用程序的附加功能工具箱用于构建包含自定义用户界面的应用程序的工具用于C/C++、Java、Net、Python、SQL、
Hadoop
Litle_Pudding
·
2023-12-27 21:39
MATLAB学习笔记
matlab
算法
Hadoop
期末考试自用
绪论大数据定义从字面意思来看,大数据指的是巨量数据最早提出“大数据”这一概念的是全球知名咨询公司麦肯锡,他是这样定义大数据的:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型以及价值密度四大特征。大数据的基本特点大量(Volume)多样(Varity)时效性(Velocity)结果准确性(Veracity)价
Yolo_jin
·
2023-12-27 20:04
hadoop
【大数据存储与处理】开卷考试总复习笔记
7.
hadoop
批量数据导入before三、MongoDB数据库操作0.
friklogff
·
2023-12-27 20:31
大数据
笔记
oracle
数据库
信息可视化
机器学习
python
计算机视觉
【头歌实训】Spark 完全分布式的安装和部署
文章目录第1关:Standalone分布式
集群搭建
任务描述相关知识课程视频Spark分布式安装模式示例集群信息配置免密登录准备Spark安装包配置环境变量修改spark-env.sh配置文件修改slaves
撕得失败的标签
·
2023-12-27 20:56
【头歌实训】
分布式
spark
大数据
头歌实训
【头歌实训】Spark 完全分布式的安装和部署(新)
文章目录第1关:Standalone分布式
集群搭建
任务描述相关知识课程视频Spark分布式安装模式主机映射免密登录准备Spark安装包配置环境变量修改spark-env.sh配置文件修改slaves文件分发安装包启动
撕得失败的标签
·
2023-12-27 20:56
【头歌实训】
分布式
spark
wpf
头歌实训
Spark与PySpark(1.概述、框架、模块)
目录1.Spark概念2.
Hadoop
和Spark的对比3.Spark特点3.1运行速度快3.2简单易用3.3通用性强3.4可以允许运行在很多地方4.Spark框架模块4.1SparkCore4.2SparkSQL4.3SparkStreaming4.4MLlib4.5GraphX5
还是那个同伟伟
·
2023-12-27 18:06
Spark
spark
大数据
分布式
python
将本地镜像推送到阿里云
文章目录创建仓库镜像登录并上传下载上传的创建仓库镜像利用下面的脚本进行配置登录并上传[root@
hadoop
100~]#dockerlogin--username=13thmregistry.cn-hangzhou.aliyuncs.comPassword
我是小水水啊
·
2023-12-27 16:18
docker
docker
Gearman-任务分发系统
简介Gearman是一个分发任务的程序框架,可以用在各种场合,与
Hadoop
相比,Gearman更偏向于任务分发功能。
瞎胡侃
·
2023-12-27 15:58
其他
gearman
开源
任务调度
并行处理
server
There are 4 missing blocks. The following files may be corrupted
Thereare4missingblocks.ThefollowingfilesmaybecorruptedPleasecheckthelogsorrunfsckinordertoidentifythemissingblocks.Seethe
Hadoop
FAQforcommoncausesandpotentialsolutions
玖玖1704
·
2023-12-27 14:53
hadoop
etl
Spark与
Hadoop
的关系和区别
在大数据领域,Spark和
Hadoop
是两个备受欢迎的分布式数据处理框架,它们在处理大规模数据时都具有重要作用。本文将深入探讨Spark与
Hadoop
之间的关系和区别,以帮助大家的功能和用途。
晓之以理的喵~~
·
2023-12-27 12:13
Spark
spark
hadoop
大数据
Hadoop
生产集群各种维护命令
1.HDFS运维1.1HDFS集群操作命令#HDFS集群启停start-dfs.shstop-dfs.sh#获取HDFS集群信息hdfsdfsadmin-report#namenode和datanode启动停止命令hdfs--daemonstopdatanodehdfs--daemonstopnamenodehdfs--daemonstartnamenodehdfs--daemonstartdat
tuoluzhe8521
·
2023-12-27 12:12
hadoop相关
hadoop
大数据
分布式
Hadoop
真的要死了吗?
10月3日,Hortonworks宣布将与其主要竞争对手Cloudera合作创建一家年收入约为7.3亿美元、拥有2,500名客户、市场估值达52亿美元的公司,这令很多人感到意外。SpliceMachine首席执行官MonteZweben表示:“我认为对于我们来说,这是个好消息。我们已经看到了运营由这两家公司和其他公司部署的所有数据湖的巨大机会,而这样的机会在两年前可能连想都不敢想”。Conflue
伯雅之英
·
2023-12-27 11:23
Spark生产集群各种使用
1.环境配置1.1版本说明要求版本是否必须其他事项
Hadoop
3.3.4是
hadoop
3.3.0之后原生支持国内主要对象存储Hive3.1.3否实测没有Hive也可以使用sparksql,使用hive更好的管理
tuoluzhe8521
·
2023-12-27 10:15
hive相关
spark
大数据
分布式
七牛云存储
Flink on K8S
集群搭建
及StreamPark平台安装
1.环境准备1.1介绍在使用Flink&Spark时发现从编程模型,启动配置到运维管理都有很多可以抽象共用的地方,目前streampark提供了一个flink一站式的流处理作业开发管理平台,从流处理作业开发到上线全生命周期都做了支持,是一个一站式的流出来计算平台。未来spark开发也在规划范围内,目前还不支持1.2下载StreamPark安装包下载:https://streampark.apach
tuoluzhe8521
·
2023-12-27 10:45
flink
flink
kubernetes
大数据
StreamPark
Harbor
Hadoop
-3.3.4集群部分lib缺失问题
1.问题描述(base)[
hadoop
@
hadoop
1native]$
hadoop
checknative2023-12-2514:20:21,615INFObzip2.Bzip2Factory:Successfullyloaded
tuoluzhe8521
·
2023-12-27 10:13
hadoop相关
hadoop
大数据
分布式
Es三节点+vip
集群搭建
部署方案
线上环境Es三节点
集群搭建
部署方案1.目标Es集群架构图!
大雪冬至
·
2023-12-27 10:12
elasticsearch
jenkins
大数据
【
Hadoop
】简单说下Zookeeper选举过程?
选票的时候,当一个服务器收到超过半数服务器以上的选票的时候,该服务器就被选举为Leader。首先需要知道在选举的过程中,服务器投票的时候会交换选票信息,这个选票信息就包括三个值:Epoch:每个Leader任期的代号。也就是一个逻辑时钟值。每投完一次票这个数据就会增加。所以每一轮选举的Epoch都不一样,如果Epoch值不是最大的,说明这次选票信息是过期的,也就不能参加本次选举ZXID:事务ID。
不怕娜
·
2023-12-27 10:40
hadoop
zookeeper
大数据
mongodb生成自签名证书以及配置SSL以及mongo
集群搭建
(亲测有效)版本-5.0.6
@[TOC](mongodb生成自签名证书以及配置SSL(亲测有效)版本-5.0.6一直以来都是向大神学习,今天也做回大神分享,哈哈!!几个小时的努力不算白费。一、自签名证书生成1、生成根证书ca.pem1、生成CA私钥(ca.key)(不加密)opensslgenrsa-outca.key20482、生成CA证书签名请求(ca.csr)opensslreq-new-keyca.key-outca
HappyLearnerL
·
2023-12-27 08:38
mongodb
ssl
Zookeeper特性与节点数据类型详解
客户端常见命令2.3可视化工具3.Zookeeper数据结构3.1节点分类3.2监听机制3.3节点特性3.4应用场景1.初识ZookeeperZooKeeper是一个开源的分布式协调框架,是Apache
Hadoop
瑜伽娃娃
·
2023-12-27 07:01
Zookeeper
zookeeper
linux
分布式
删除azkaban的执行历史
azkaban通常用在大数据任务调度场景,把任务提交之后,如果任务是spark,hive,
hadoop
,flink等任务的话,
飞有飞言
·
2023-12-27 07:09
【运维路不弯】最简单的k8s
集群搭建
(基于ubuntu22.04 cloud-img)
配置详情节点k8sdockercontainerdmasterv1.26.024.0.61.6.22node1v1.26.024.0.61.6.22node2v1.26.024.0.61.6.22node3v1.26.024.0.61.6.22所有节点操作替换系统源cat/etc/apt/sources.list#默认注释了源码镜像以提高aptupdate速度,如有需要可自行取消注释debhttp
指剑
·
2023-12-27 07:43
K8S
运维
kubernetes
容器
ubuntu
Hadoop
-Hbase
集群搭建
archive.cloudera.com/cdh5/cdh/5/hbase-1.2.0-cdh5.7.0.tar.gz2.解压#解压到指定的文件夹tarxzvfhbase-1.2.0-cdh5.7.0.tar.gz-C/usr/loca/
hadoop
GuangHui
·
2023-12-27 07:17
hive学习笔记
一、Hive基本概念1.1hive是什么hive是基于
hadoop
的一个数仓分析工具,hive可以将hdfs上存储的结构化的数据,映射成一张表,然后让用户写HQL(类SQL)来分析数据telupdown138383843813451567138383843953451567138383844012411657713838384413453157571383838434353551567567
不爱吃鱼的馋猫
·
2023-12-27 06:05
hive
大数据
hadoop
hive中metastore服务、hiveserver2服务、hive客户端、beeline客户端连接元数据的方式
1.前言hive是
Hadoop
的客户端,启动hive前必须启动
hadoop
,同时hive的元数据存储在mysql中,是由于hive自带的derby数据库不支持多客户端访问。
不爱吃鱼的馋猫
·
2023-12-27 06:35
hive
[使用Python操作
Hadoop
,Python-MapReduce
环境环境使用:
hadoop
3.1,Python3.6,ubuntu18.04
Hadoop
是使用Java开发的,推荐使用Java操作HDFS。有时候也需要我们使用Python操作HDFS。
叫我老村长
·
2023-12-27 05:35
git 从一个源导入分支到另一个源
新增一个remote源gitremoteaddgithubhttps://github.com/apache/
hadoop
.git显示现在的remotegitremote-v获取gitfetchgithub
houzhizhen
·
2023-12-27 02:53
git
git
github
Rancher小白学习之路
load-balancer/_indexhttp://docs.rancher.cn/docs/rancher1/rancher-service/load-balancer/_indexRancher2.5
集群搭建
weixin_42124960
·
2023-12-27 01:07
rancher
学习
分布式系统面试连环炮
他们有共同的一个问题,就是都没怎么搞过分布式系统,现在互联网公司,一般都是做分布式的系统,大家都不是做底层的分布式系统、分布式存储系统
hadoop
hdfs、分布式计算系统
hadoop
mapreduce/
Java机械师
·
2023-12-26 23:13
YARN知识点总结
如果把大数据
Hadoop
集群当作一台计算机,那么HDFS=磁盘YARN=任务调度器+资源管理器所有任务都是运行在Yarn上Yarn分为两个大的模块:ResourceManagerNodeManagerResourceManager
飞有飞言
·
2023-12-26 23:16
灵蜂BeeDI ETL
大数据时代的集成利器ETL工具https://blog.csdn.net/little_bee_2004/article/details/80006047在信息时代大数据环境下,基于分布式的开源
Hadoop
weixin_49476464
·
2023-12-26 23:38
学习
hadoop
big
data
数据库
为什么Spark比MapReduce快?
一般而言,DAG相比
Hadoop
的MapReduce在大多数情况下可以减少shuffle次数(怎么体现?)。Spark的DAGScheduler相当于一个改进版的MapReduce,如果计算不涉及与
tracy_668
·
2023-12-26 23:00
Hadoop
大数据实战系列文章之HDFS文件系统
Hadoop
附带了一个名为HDFS(
Hadoop
分布式文件系统)的分布式文件系统,专门存储超大数据文件,为整个
Hadoop
生态圈提供了基础的存储服务。
测试帮日记
·
2023-12-26 21:39
从零开始学大数据框架Hudi,这些学习网站,助你一臂之力!
Hudi的设计使得您可以在
Hadoop
兼容的存储之上存储大量数据,并且它提供了两种原语,除了经典的批处理之外,还可以在数据湖上进行流处理。
知识分享小能手
·
2023-12-26 20:39
学习心得体会
大数据
大数据
学习
10.
hadoop
安装(全分布式安装)
全分布式首先必须有jdk安装,这里不再概述,参考4首先如果有不同就修改注意要改为disabled关闭防火墙iptable首先要免秘钥主节点要分发秘钥51020303540
文茶君
·
2023-12-26 20:43
hive下库里有表数据,删不了库的解决办法
hive下库里有表数据,删不了库的解决办法报错:FAILED:ExecutionError,returncode1fromorg.apache.
hadoop
.hive.ql.exec.DDLTask.InvalidOperationException
北凉-徐凤年
·
2023-12-26 20:07
日常工作遇到的问题
hive
借助 KMS (
Hadoop
Key Management Server) 实现 HDFS 数据加密
原生KMS模型概览适用场景将DataNode上的数据block加密存放,这样即使恶意用户通过某种方式绕过了权限控制,或直接访问了DataNode,获取了其它用户的数据block,也看不到这些block的真实内容。对HDFS的读写性能会有一定的降低,但应该不会太严重(未测试),HDFS优先使用native的libcrypto.so完成加解密(默认算法AES-CTR,支持128位AES加密),新版本的
xudong1991
·
2023-12-26 18:55
上一页
30
31
32
33
34
35
36
37
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他