E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
研磨hadoop
基于centos7的
hadoop
2.7、zookeeper3.5、hbase1.3、spark2.3、scala2.11、kafka2.11、hive3.1、flume1.8、sqoop1.4组件部署
部署前准备修改主机名1、修改主机名(6台机器都要操作,以Master为举例)hostnamectlset-hostnameMaster(永久修改主机名)reboot(重启系统)修改hosts将第一行127.0.0.1xxxx注释掉,加上:195.168.2.127master195.168.2.128slave1195.168.2.129slave2确认网卡信息vi/etc/sysconfig/n
luoz_python
·
2023-11-25 19:42
大数据平台运维
hadoop
大数据
spark
flume
kafka
hadoop
-kerbero等相关搭建可能遇到的问题和排查
/datapool/loongoop/tmp/
hadoop
-yarn/staging/yarntest/.staging/job_1537338393901_0001/job.jardoesnotexist
Winhole
·
2023-11-25 19:10
hadoop
Linux
hive 报错return code 40000 from org.apache.
hadoop
.hive.ql.exec.MoveTask解决思路
https://github.com/apache/hive/blob/2b57dd27ad61e552f93817ac69313066af6562d9/ql/src/java/org/apache/
hadoop
cclovezbf
·
2023-11-25 19:10
hive
hadoop
hive
apache
Scala深海奇遇记-当case class遇到了Spark的聚集函数
致谢在调试的过程中,得到了我们
Hadoop
组老大,项目组老大,以及其他同事的深度支持与帮助,非常感谢他们。结论先说结论。如果有朋友不感兴趣,不想深究原理,只是想知道怎么
AlstonWilliams
·
2023-11-25 18:58
在dss中运行scala任务报java.lang.NullPointerException: null
版本信息:dss:1.1.1linkis1.1.1
hadoop
:3.1.3hive:3.1.2spark:3.0.0修改文件:SparkScalaExecutor.scala修改文件内容如下:上图红色标记内容
heheha_zj
·
2023-11-25 18:18
dss
or
linkis
hive 数据导入和导出
hive命令数据导入与导出数据导入●本地文件导入●HDFS文件导入●表数据导入●创建表的时候导入--本地文件导入(local)LOADDATAlocalINPATH'/home/
hadoop
/sourceA.txt'INTOTABLEtestAPARTITION
heheha_zj
·
2023-11-25 18:48
数仓
hive
hdfs
Hadoop
集群升级(3.1.3 -> 3.2.4)
升级前确认旧版本:3.1.3升级版本:3.2.4旧版本安装路径:/ddhome/bin/
hadoop
/新版本安装路径:/ddhome/bin/
hadoop
-3.2.4安装新版本
hadoop
解压安装#解压安装包到相应目录下
heheha_zj
·
2023-11-25 18:09
大数据
hadoop
大数据
关于
Hadoop
12个事实
现如今,Apache
Hadoop
已经无人不知无人不晓。
丨程序之道丨
·
2023-11-25 17:53
基于 Flink SQL 和 Paimon 构建流式湖仓新方案
传统数仓包括Hive、
Hadoop
正在往湖、Lakehouse架构上演进,L
阿里云大数据AI技术
·
2023-11-25 15:52
flink
sql
大数据
Java、Redis、Jackson序列化与反序列化
例如Java中的ObjectOutputStream、Python中的pickle是专门的序列化类、
Hadoop
中各节点数据传输。反序列化:将序列化对象从磁盘、网络等位置重新转化
__如风__
·
2023-11-25 15:54
Java
Spring
java
开发语言
spring
问题org.apache.
hadoop
.io.nativeio.NativeIO$Windows.createDirectoryWithMode0(Ljava/lang/String;I)V的解决方案
前提条件:
Hadoop
集群(
hadoop
2.7.3)Java编译环境(jdk1.8)操作系统:win7IDE:eclipse
hadoop
插件下载附件链接:https
一朝风月S
·
2023-11-25 14:55
Hadoop
大数据
问题集
运行mapreduce程序问题
hadoop
MapReduce
mapreducer 分布式计算框架
mapreducer是经典的计算框架,是学习大数据处理的基础,请带着这句话“化大为小,分而治之”点击下面连接按笔记顺序进行学习mapreducer原理
hadoop
的Windows伪分布式环境部署Windows
海牛大数据_青牛老师
·
2023-11-25 14:21
cdh亲测2022/11/12
一、
Hadoop
大数据平台1、
Hadoop
发行版(1)完全开源的原生的Apache
Hadoop
(2)Cloudera与Hortonworks公司的CDH和HDP:在Cloudera和Hortonworks
Tian.Mrs
·
2023-11-25 14:18
大数据
hadoop
spark
CDH6安装教程(亲自测试越坑版)
一、
Hadoop
大数据平台1、
Hadoop
发行版(1)完全开源的原生的Apache
Hadoop
(2)Cloudera与Hortonworks公司的CDH和HDP:在Cloudera和Hortonworks
inrgihc
·
2023-11-25 14:14
Hadoop
big
data
hadoop
spark
分布式计算 第五章 大数据多机计算:
Hadoop
文章目录分布式计算第五章大数据多机计算:
Hadoop
5.2大数据和分布式的基础概念5.2.1从硬件思考大数据5.1.2从软件角度看大数据5.1.3分布式DISTRIBUTED5.1.4谷歌“三驾马车”5.1.5
一只大小菜
·
2023-11-25 14:42
大数据
hadoop
分布式
Hadoop
发行版 Cloudera CDH 6.3.2及CM 安装包下载(阿里云盘 不限速)
CDH(全称Cloudera’sDistribution,includingApache
Hadoop
)是由Cloudera公司构建的
Hadoop
稳定发行版,不仅含有Apache
Hadoop
,还整合了Hive
风情客家__
·
2023-11-25 14:11
大数据框架
CDH
6.3.2
使用DolphinScheduler调度DataX完成Mysql到Mysql的数据同步
DataX完成Mysql到Mysql的数据同步DolphinScheduler集群的部署基础环境:Mysql(5.7.25)JDK(1.8.0_144)Zookeeper(3.4.10)节点部署安排三台主机
hadoop
01
下雨不撑伞丶
·
2023-11-25 13:35
大数据
mysql
大数据
数据仓库
关于大数据的一些拙见
大数据是一个概念也是一个技术,是在以
Hadoop
为代表的大数据平台框架上进行各种数
weixin_30384217
·
2023-11-25 13:52
大数据
嵌入式
运行Hbase提示SLF4J: Class path contains multiple SLF4J bindings
运行Hbase提示SLF4J:ClasspathcontainsmultipleSLF4Jbindings在实际启用HBase的时候,因为
Hadoop
中的jar包和HBase中的包版本不一致,就会出现对应的
6个日的梦想
·
2023-11-25 11:41
hbase
大数据
hadoop
关于Hbase启动 报SLF4J: Class path contains multiple SLF4J bindings.冲突问题
出现这个问题,是路径下两个jar包的.class文件冲突了分别是
hadoop
和hbase的。
今天博学了吗?
·
2023-11-25 11:11
hbase
hadoop
大数据
Hadoop
(5-1) HBase 提示SLF4J: Class path contains multiple SLF4J bindings.
SLF4J:ClasspathcontainsmultipleSLF4Jbindings.SLF4J:Foundbindingin[jar:file:/usr/local/
hadoop
-3.3.6/share
Eufeo
·
2023-11-25 11:10
Hadoop
hadoop
大数据
分布式
关于UnsupportedOperationException: Constructor threw an exception for org.apache.
hadoop
.hbase.ipc的问题
今天在搭建hbase的环境的时候正常配置了hbase-env.sh,hbase-site.xml文件后,先启动HDFS环境和Zookeeper环境之后,启动hbase,启动之后发现我们的进程HRegionServer并没有出现,我就回去查日志发现报错:UnsupportedOperationException:Constructorthrewanexceptionfororg.apache.had
holywangle
·
2023-11-25 11:36
apache
hadoop
hbase
关于提示SLF4J: Class path contains multiple SLF4J bindings的问题解决
...........SLF4J:ClasspathcontainsmultipleSLF4Jbindings.SLF4J:Foundbindingin[jar:file:/opt/software/
hadoop
holywangle
·
2023-11-25 11:03
java
hadoop
hbase
大数据
少见的hive集群时间不同步报错。
DiagnosticMessagesforthisTask:Containerlaunchfailedforcontainer_1603712387555_0006_02_000006:org.apache.
hadoop
.yarn.exceptions.YarnException
Kris林
·
2023-11-25 10:13
数据仓库 Hive
Hive3.1.2目录Hive3.1.21、数据仓库概念1.2、传统仓库面临的挑战2、Hive简介2.1、Hive的特点2.2、Hive的优缺点2.3、Hive与
Hadoop
生态系统中的关系2.4、Hive
忄凝^
·
2023-11-25 09:48
大数据
hadoop
大数据
hive
Zookeeper+
Hadoop
+Hbase+Hive+Kylin+Nginx集群搭建
Zookeeper+
Hadoop
+Hbase+Hive+Kylin+Nginx集群搭建一、虚拟机安装Centos71.准备工作2.centos7安装过程3.关闭防火墙(关键)二、安装jdk1.卸载镜像自带
桃橙柳
·
2023-11-25 09:15
大数据生态安装
大数据
hadoop
linux
hdfs
centos
Hive数据仓库工具基本架构和入门部署详解
Python量化交易实战入门级手把手带你打造一个易扩展、更安全、效率更高的量化交易系统@目录*概述+定义+本质+特点+Hive与
Hadoop
关系+Hive与关系型数据库区别+优缺点+其他说明架构组成部分数据模
虚幻私塾
·
2023-11-25 09:15
python
数据仓库
hive
架构
计算机
完全分布式安装
Hadoop
,Hive,Hbase,Hwi,Zookeeper
完全分布式安装
Hadoop
,Hive,Hbase,Hwi,Zookeeper其他部分见:HDFSYARNzookeeperHBASEHIVEHIVEhwi的启动HDFS和HBASE动态增加和减少节点一.
ljtyxl
·
2023-11-25 09:45
bigdata
hadoop
hbase
zookeeper
hive
Hadoop
完全分布式安装(Centos7+
Hadoop
2.5.0)
Hadoop
部署模式
Hadoop
部署模式有:本地模式、伪分布模式、完全分布式模式、HA完全分布式模式。
fang·up·ad
·
2023-11-25 09:43
自学框架
Hadoop
hadoop
(6)--NameNode元数据管理(3)
今天分享的的是NameNode中edit日志文件怎么和fsimage合并的,又是什么时候进行合并的,谁负责合并的,好的,带着这几个问题来思考1,先来一张图说明合并过程在这个过程中很好的解释了edit日志文件怎么和fsimage合并的,又是什么时候进行合并的,谁负责合并的,下来我在用文字描述一下1,默认情况下,当3600秒/edits文件达到64M的时候,要进行合并(checkPoint)操作,这时
ROCK_杰哥
·
2023-11-25 07:33
玩转人工智能(11)使用Pyspark上手机器学习
文件系统HDFS
Hadoop
DistributedFileSystem,简称HDFS,是一个分布式文件系统。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。
Moscar_M
·
2023-11-25 07:10
大数据组件图谱
大数据组件图谱文件系统数据存储内存技术数据搜集消息系统数据处理查询引擎分析和报告工具调度与管理服务机器学习开发平台文件系统HDFS
Hadoop
DistributedFileSystem,简称HDFS,是一个分布式文件系统
饮水思源09
·
2023-11-25 07:40
Hadoop
18-Sqoop、DataX和Azkaban的介绍
Sqoop10.4Sqoop的简介10.4.1Sqoop产生背景对于工作中经常遇到的问题的提出如何将关系型数据库中某张表的数据抽取到
Hadoop
(HDFS/Hive/HBase)上;如何将
Hadoop
上的数据导出到关系型数据库中对于问题的传统的解决通常情况下是通过开发
大数据下的画像人
·
2023-11-25 07:07
大数据
sqoop
hadoop
大数据
(二)大数据---
Hadoop
组件介绍,区别
YARN:分布式资源管理MapReduce、Spark、Flink:分布式计算框架Yarn/Mesos:分布式资源管理器zookeeper:分布式协作服务sqoop:数据同步工具hive/Impala基于
Hadoop
(─__─)
·
2023-11-25 07:37
Hadoop
hadoop
big
data
大数据
Flume采集Kafka并把数据sink到OSS
安装环境Java环境,略(Flume依赖Java)Flume下载,略Scala环境,略(Kafka依赖Scala)Kafak下载,略
Hadoop
下载,略(不需要启动,写OSS依赖)配置
Hadoop
下载JindoSDK
不住在隔壁的老王
·
2023-11-25 07:34
大数据
flume
kafka
大数据
Flink物理分区
默认策略轮询,会将数据轮询发送给下游任务valfsEnv=StreamExecutionEnvironment.getExecutionEnvironmentfsEnv.socketTextStream("
Hadoop
Node00
深夜的星星
·
2023-11-25 06:07
flink
大数据
常用的HDFS操作
常用的HDFS操作利用
Hadoop
提供的shell命令完成任务(1)向HDFS中上传任意文本文件,如果指定的文件在HDFS中已经存在,由用户指定是追加到原有文件末尾还是覆盖原有文件(2)从HDFS中下载指定文件
TheHuan_9
·
2023-11-25 05:55
hadoop
大数据
HDFS客户端上传下载文件流程
1.3客户端根据配置(dfs.blocksize-块大少、
hadoop
2.x默认为128M)将文件切成N个block。
_Kafka_
·
2023-11-25 05:51
HDFS文件上传和下载流程
1、HDFS上传文件客户端请求上传文件:客户端(通常是
Hadoop
集群中的一个节点)发出上传文件的请求,改请求包括文件的本地路径、文件名以及在HDFS中的目标路径NameNode验证请求:客户端请求首先到达集群中的
鲸落万物
·
2023-11-25 05:49
hdfs
大数据
hadoop
3.
hadoop
系列之HDFS架构及文件上传下载
本文我们学习
Hadoop
中HDFS架构、优缺点、文件块大小、通过shell命令文件上传下载1.HDFS使用场景适合一次写入,多次读取。
沈健_算法小生
·
2023-11-25 05:43
大数据
hadoop
hdfs
架构
Hadoop
之MapReduce
文章目录概要整体架构流程技术名词解释技术细节小结MadReduce概要定义:是一个分布式运算程序的编程框架,是
Hadoop
内部编写的。
僖僖cc
·
2023-11-25 04:41
hadoop
mapreduce
大数据
搜狗日志查询分析 (MapReduce+Hive+idea综合实验)
前提条件:安装好
hadoop
2.7.3(Linux系统下)安装好MySQL(Windows或Linux系统下)安装好Hive(Linux系统下)参考:Hive安装配置题目:从搜狗实验室下载搜索数据进行分析下载的数据包含
CrazyHacking望
·
2023-11-25 04:41
hadoop
hive
mapreduce
intellij-idea
Hadoop
平台搭建与数据分析实验报告
目录
Hadoop
简介实验一:构建虚拟机网络(一)VirtualBox的安装及配置(二)Ubuntu虚拟机的安装及配置(三)修改Ubuntu系统内的网络配置1.查看网卡状态2.更改配置文件3.启动网卡4.
椅糖
·
2023-11-25 04:09
云计算导论
hadoop
数据分析
大数据
如何解除
hadoop
安全模式问题
hadoop
安全模式无法关闭问题问题描述:今天在
hadoop
上传递数据时,由于数据文件太大,运行到一半突然复制中断,导致出现了安全模式,报“namenodeisinsafemode”的错误提示。
青枫浦上看桃花
·
2023-11-25 03:16
hadoop
大数据
big
data
linux
分布式
Spark-----第 2 章 Spark 部署模式
ClusterManager),分别为:Standalone:独立模式,Spark原生的简单集群管理器,自带完整的服务,可单独部署到一个集群中,无需依赖任何其他资源管理系统,使用Standalone可以很方便地搭建一个集群;
Hadoop
YARN
Wzideng
·
2023-11-25 01:18
#
spark
spark
大数据
分布式
Spark是什么?以及它有哪些应用场景呢?
首先说说Spark的起源:Spark是UCBerkeleyAMPlab所开源的类
Hadoop
MapReduce的通用的并行计算框架,Spark基于mapreduce算法实现的分布式计算,拥有
Hadoop
MapReduce
陈影鸿在进步
·
2023-11-25 01:07
大数据处理
WhatsApp技术
容器
HDFS命令行操作熟练
前置命令
hadoop
fshdfsdfs实际命令
hadoop
fs-helprm帮助
hadoop
fs-ls显示目录信息,递归-lsr
hadoop
fs-mkdir/user/tguigu在hdfs上创建目录
hadoop
fs-moveFromlocaltest.txt
秋风暮霞挽红曲_5f60
·
2023-11-24 22:20
ElasticSearch(ES)——概述/API
1.4ES的特点1.5Lucene、Nutch、ElasticSearch关系二、基本概念ES概念和MySQL关系对比三、安装ES3.1解压、改名3.2修改配置文件3.3教学环境启动优化分发3.4修改
hadoop
163
平平无奇小码农
·
2023-11-24 22:15
笔记
大数据
elasticsearch
数据库
搜索引擎
大数据之
Hadoop
流存储
通过对
Hadoop
分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程,以及数据仓库工具Hive和分布式数据库Hbase的介绍,基本涵盖了
Hadoop
分布式平台的所有技术核心。
陌名_9b41
·
2023-11-24 18:01
hadoop
2.x linux集群部署
hadoop
2.x集群部署下载
hadoop
需要提前准备好jdk1.8和rsync和ssl集群信息解压安装配置环境变量配置site配置文件(/
hadoop
/etc/
hadoop
目录下)core-site.xmlhdfs-site.xmlyarn-site.xmlmapred-site.xml
hadoop
-env.sh
何浩翔
·
2023-11-24 18:21
hadoop
大数据
上一页
46
47
48
49
50
51
52
53
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他