E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
HADOOP
hadoop
(10)--MR运行模式以及Yarn的调度流程
首先开门见山,说明一下MR的l两种种运行模式1,在本地运行模式①在windows中,intellijidea或者eclipse中直接运行,文件存储可以是本地也可以是HDFS②在linux中,运行eclipse,文件存储可以是本地也可以是HDFS2,集群运行模式①,在windows中将MR程序编写好,运行main提交到集群中,交由yarn去调度运行,这一种,需要修改好多信息,因为平台不一样,需要修改
ROCK_杰哥
·
2023-11-26 13:14
2023年全国职业院校技能大赛-赛题第01套-GZ033 大数据应用开发
目录任务A:大数据平台搭建(容器环境)(15分)子任务一:
Hadoop
完全分布式安装配置子任务二:SparkonYarn安装配置子任务三:HBase分布式安装配置任务B:离线数据处理(25分)子任务一:
你可知这世上再难遇我
·
2023-11-26 13:48
各类赛项赛题比赛综合任务书
大数据
数据采集
数据挖掘
1.5.1.2 Spark的部署与安装
总目录:https://www.jianshu.com/p/e406a9bc93a9
Hadoop
-子目录:https://www.jianshu.com/p/9428e443b7fdSpark的部署方式单机
寒暄_HX
·
2023-11-26 13:16
Spark多文件输出的两种形式
#所需环境版本jdk=1.8scala.version=2.11.0spark.version=2.3.2
hadoop
.verison=2.7.2importorg.apache.
hadoop
.io.
一只咸鱼va
·
2023-11-26 09:58
spark
spark
scala
大数据
简析
Hadoop
的三种运行模式
一、本地独立模式(单机模式)本地独立模式不进行任何配置,是
Hadoop
的默认工作模式。
我要下东西噢
·
2023-11-26 08:13
hadoop
hadoop
mapreduce
HADOOP
大数据之HDFS数据安全与隐私保护
HDFSTrash垃圾桶功能概述HDFSTrash机制,叫做回收站或者垃圾桶。Trash就像Windows操作系统中的回收站一样。它的目的是防止你无意中删除某些东西。默认情况下是不开启的。启用ITrash功能后,从HDFS中删除某些内容时,文件或目录不会立即被清除,它们将被移动到回收站Current目录中(/user/$(username}/.Trash/current)。.Trash中的文件在用
奋斗的韭菜汪
·
2023-11-26 08:24
基于
Hadoop
的区块链海量数据存储的设计与实现
点我完整下载:基于
Hadoop
的区块链海量数据存储的设计与实现.docx基于
Hadoop
的区块链海量数据存储的设计与实现DesignandImplementationofMassDataStorageforBlockchainbasedon
Hadoop
桃宝护卫队
·
2023-11-26 07:50
hadoop
大数据
区块链
Hadoop
+Hive+Spark+Hbase开发环境练习
1.练习一1.数据准备在hdfs上创建文件夹,上传csv文件[root@kb129~]#hdfsdfs-mkdir-p/app/data/exam查看csv文件行数[root@kb129~]#hdfsdfs-cat/app/data/exam/meituan_waimai_meishi.csv|wc-l2.分别使用RDD和SparkSQL完成以下分析(不用考虑数据去重)开启sparkshell[r
不吃香菜lw
·
2023-11-26 07:48
hadoop
hive
spark
HBase入门篇
HBase是Apache
Hadoop
中的一个子项目,Hbase依托于
Hadoop
的HDFS作为最基本存储基础单元,通过使用
hadoop
的DFS工具就可以看到这些这些数据存储文件夹的结构,还可以通过Map
youzhouliu
·
2023-11-26 06:51
hbase
入门
一篇文章带你入门HBase
目录HBase特性
Hadoop
的限制基本概念NameSpaceTableRowKeyColumnTimeStampCell存储结构HBase数据访问形式架构体系HBase组件HBase读写流程读流程写流程
快乐无限出发
·
2023-11-26 06:17
hbase
大数据
hadoop
一篇文章入门Hbase
1.HBaseHBase是
Hadoop
Database的简称,是建立在
Hadoop
文件系统之上的分布式面向列的数据库,为横向发展类型数据库,提供快速随机访问海量结构化数据,它是
Hadoop
生态系统,提供对数据的随机实时读
王知无(import_bigdata)
·
2023-11-26 06:15
【SpringBoot+HBase 】快速入门
基础命令1.2表的基本操作1.3表的数据增删改查指令1.3.1HBase数据模型1.3.2表的增删改查指令1.3.3过滤器条件查询二、JavaAPI操作Hbase2.1Maven依赖2.2复制HBase和
Hadoop
豆腐脑lr
·
2023-11-26 06:39
hbase
spring
boot
数据库
Hadoop
Hadoop
中常问的就三块,第一:分布式存储(HDFS);第二:分布式计算框架(MapReduce);第三:资源调度框架(YARN)。
烈火138
·
2023-11-26 05:34
java
hadoop
大数据
分布式
HBase详细部署流程
Zookeeper-6.2安装部署成功
Hadoop
-3.2.2安装部署成功操作系统设置完毕,包括:
yujianbujianqwe
·
2023-11-26 04:50
hbase
apache
服务器
HBase部署及数据库基本操作
(部署步骤)①安装JDK;②部署
Hadoop
;③配置
Hadoop
集群;④部署Zookeeper;⑤Hbase部署:(1)通过SecureCRT工具将HBase安装包上传到服务器nosql01的/opt/
Faine__001
·
2023-11-26 04:19
hbase
数据库
hadoop
docker devicemapper: Error running DeleteDevice dm_task_run failed
docker删除容器,遇到:devicemapper:ErrorrunningDeleteDevicedm_task_runfailed异常[
hadoop
@
hadoop
02~]$sudodockerrm5ede1280f0bfErrorresponsefromdaemon
胖胖胖胖胖虎
·
2023-11-25 23:43
Docker
docker
脚本
exit;fiforfilein$@dopdir=$(cd-P$(dirname$file);pwd)fname=$(basename$file)forhostinmz-
hadoop
-01mz-
hadoop
都教授2000
·
2023-11-25 22:53
大数据
Day68 Kafka 快速实战 核心原理
可以实时处理大量数据,满足各种需求场景.
Hadoop
批处理系统。
小周爱吃瓜
·
2023-11-25 21:31
Apache BookKeeper 简介
Research)开发,旨在实现
Hadoop
分布式文件系统(HDFS)NameNode的高可用,在此之前,NameNode不具备高可用特性,存在单点故障的问题。
StreamNative
·
2023-11-25 20:11
hadoop
hive 常见问题解决持续更新
安装过程中,由于网络终端,导致下面问题:问题1:安装停止在获取安装锁/tmp/scm_prepare_node.tYlmPfrTusingSSH_CLIENTtogettheSCMhostname:172.16.77.203395022openingloggingfiledescriptor正在启动安装脚本...正在获取安装锁...BEGINflock4这段大概过了半个小时,一次卸载,一次等了快1
weixin_34122604
·
2023-11-25 19:46
大数据
SQL on
Hadoop
在快手大数据平台的实践与优化 | 分享实录
快手大数据架构工程师钟靓本文是根据快手大数据架构工程师钟靓于5月18-19日在A2M人工智能与机器学习创新峰会《SQLon
Hadoop
在快手大数据平台的实践与优化》演讲中的分享内容整理而成。
weixin_34292959
·
2023-11-25 19:46
大数据
面试
后端
基于centos7的
hadoop
2.7、zookeeper3.5、hbase1.3、spark2.3、scala2.11、kafka2.11、hive3.1、flume1.8、sqoop1.4组件部署
部署前准备修改主机名1、修改主机名(6台机器都要操作,以Master为举例)hostnamectlset-hostnameMaster(永久修改主机名)reboot(重启系统)修改hosts将第一行127.0.0.1xxxx注释掉,加上:195.168.2.127master195.168.2.128slave1195.168.2.129slave2确认网卡信息vi/etc/sysconfig/n
luoz_python
·
2023-11-25 19:42
大数据平台运维
hadoop
大数据
spark
flume
kafka
hadoop
-kerbero等相关搭建可能遇到的问题和排查
/datapool/loongoop/tmp/
hadoop
-yarn/staging/yarntest/.staging/job_1537338393901_0001/job.jardoesnotexist
Winhole
·
2023-11-25 19:10
hadoop
Linux
hive 报错return code 40000 from org.apache.
hadoop
.hive.ql.exec.MoveTask解决思路
https://github.com/apache/hive/blob/2b57dd27ad61e552f93817ac69313066af6562d9/ql/src/java/org/apache/
hadoop
cclovezbf
·
2023-11-25 19:10
hive
hadoop
hive
apache
Scala深海奇遇记-当case class遇到了Spark的聚集函数
致谢在调试的过程中,得到了我们
Hadoop
组老大,项目组老大,以及其他同事的深度支持与帮助,非常感谢他们。结论先说结论。如果有朋友不感兴趣,不想深究原理,只是想知道怎么
AlstonWilliams
·
2023-11-25 18:58
在dss中运行scala任务报java.lang.NullPointerException: null
版本信息:dss:1.1.1linkis1.1.1
hadoop
:3.1.3hive:3.1.2spark:3.0.0修改文件:SparkScalaExecutor.scala修改文件内容如下:上图红色标记内容
heheha_zj
·
2023-11-25 18:18
dss
or
linkis
hive 数据导入和导出
hive命令数据导入与导出数据导入●本地文件导入●HDFS文件导入●表数据导入●创建表的时候导入--本地文件导入(local)LOADDATAlocalINPATH'/home/
hadoop
/sourceA.txt'INTOTABLEtestAPARTITION
heheha_zj
·
2023-11-25 18:48
数仓
hive
hdfs
Hadoop
集群升级(3.1.3 -> 3.2.4)
升级前确认旧版本:3.1.3升级版本:3.2.4旧版本安装路径:/ddhome/bin/
hadoop
/新版本安装路径:/ddhome/bin/
hadoop
-3.2.4安装新版本
hadoop
解压安装#解压安装包到相应目录下
heheha_zj
·
2023-11-25 18:09
大数据
hadoop
大数据
关于
Hadoop
12个事实
现如今,Apache
Hadoop
已经无人不知无人不晓。
丨程序之道丨
·
2023-11-25 17:53
基于 Flink SQL 和 Paimon 构建流式湖仓新方案
传统数仓包括Hive、
Hadoop
正在往湖、Lakehouse架构上演进,L
阿里云大数据AI技术
·
2023-11-25 15:52
flink
sql
大数据
Java、Redis、Jackson序列化与反序列化
例如Java中的ObjectOutputStream、Python中的pickle是专门的序列化类、
Hadoop
中各节点数据传输。反序列化:将序列化对象从磁盘、网络等位置重新转化
__如风__
·
2023-11-25 15:54
Java
Spring
java
开发语言
spring
问题org.apache.
hadoop
.io.nativeio.NativeIO$Windows.createDirectoryWithMode0(Ljava/lang/String;I)V的解决方案
前提条件:
Hadoop
集群(
hadoop
2.7.3)Java编译环境(jdk1.8)操作系统:win7IDE:eclipse
hadoop
插件下载附件链接:https
一朝风月S
·
2023-11-25 14:55
Hadoop
大数据
问题集
运行mapreduce程序问题
hadoop
MapReduce
mapreducer 分布式计算框架
mapreducer是经典的计算框架,是学习大数据处理的基础,请带着这句话“化大为小,分而治之”点击下面连接按笔记顺序进行学习mapreducer原理
hadoop
的Windows伪分布式环境部署Windows
海牛大数据_青牛老师
·
2023-11-25 14:21
cdh亲测2022/11/12
一、
Hadoop
大数据平台1、
Hadoop
发行版(1)完全开源的原生的Apache
Hadoop
(2)Cloudera与Hortonworks公司的CDH和HDP:在Cloudera和Hortonworks
Tian.Mrs
·
2023-11-25 14:18
大数据
hadoop
spark
CDH6安装教程(亲自测试越坑版)
一、
Hadoop
大数据平台1、
Hadoop
发行版(1)完全开源的原生的Apache
Hadoop
(2)Cloudera与Hortonworks公司的CDH和HDP:在Cloudera和Hortonworks
inrgihc
·
2023-11-25 14:14
Hadoop
big
data
hadoop
spark
分布式计算 第五章 大数据多机计算:
Hadoop
文章目录分布式计算第五章大数据多机计算:
Hadoop
5.2大数据和分布式的基础概念5.2.1从硬件思考大数据5.1.2从软件角度看大数据5.1.3分布式DISTRIBUTED5.1.4谷歌“三驾马车”5.1.5
一只大小菜
·
2023-11-25 14:42
大数据
hadoop
分布式
Hadoop
发行版 Cloudera CDH 6.3.2及CM 安装包下载(阿里云盘 不限速)
CDH(全称Cloudera’sDistribution,includingApache
Hadoop
)是由Cloudera公司构建的
Hadoop
稳定发行版,不仅含有Apache
Hadoop
,还整合了Hive
风情客家__
·
2023-11-25 14:11
大数据框架
CDH
6.3.2
使用DolphinScheduler调度DataX完成Mysql到Mysql的数据同步
DataX完成Mysql到Mysql的数据同步DolphinScheduler集群的部署基础环境:Mysql(5.7.25)JDK(1.8.0_144)Zookeeper(3.4.10)节点部署安排三台主机
hadoop
01
下雨不撑伞丶
·
2023-11-25 13:35
大数据
mysql
大数据
数据仓库
关于大数据的一些拙见
大数据是一个概念也是一个技术,是在以
Hadoop
为代表的大数据平台框架上进行各种数
weixin_30384217
·
2023-11-25 13:52
大数据
嵌入式
运行Hbase提示SLF4J: Class path contains multiple SLF4J bindings
运行Hbase提示SLF4J:ClasspathcontainsmultipleSLF4Jbindings在实际启用HBase的时候,因为
Hadoop
中的jar包和HBase中的包版本不一致,就会出现对应的
6个日的梦想
·
2023-11-25 11:41
hbase
大数据
hadoop
关于Hbase启动 报SLF4J: Class path contains multiple SLF4J bindings.冲突问题
出现这个问题,是路径下两个jar包的.class文件冲突了分别是
hadoop
和hbase的。
今天博学了吗?
·
2023-11-25 11:11
hbase
hadoop
大数据
Hadoop
(5-1) HBase 提示SLF4J: Class path contains multiple SLF4J bindings.
SLF4J:ClasspathcontainsmultipleSLF4Jbindings.SLF4J:Foundbindingin[jar:file:/usr/local/
hadoop
-3.3.6/share
Eufeo
·
2023-11-25 11:10
Hadoop
hadoop
大数据
分布式
关于UnsupportedOperationException: Constructor threw an exception for org.apache.
hadoop
.hbase.ipc的问题
今天在搭建hbase的环境的时候正常配置了hbase-env.sh,hbase-site.xml文件后,先启动HDFS环境和Zookeeper环境之后,启动hbase,启动之后发现我们的进程HRegionServer并没有出现,我就回去查日志发现报错:UnsupportedOperationException:Constructorthrewanexceptionfororg.apache.had
holywangle
·
2023-11-25 11:36
apache
hadoop
hbase
关于提示SLF4J: Class path contains multiple SLF4J bindings的问题解决
...........SLF4J:ClasspathcontainsmultipleSLF4Jbindings.SLF4J:Foundbindingin[jar:file:/opt/software/
hadoop
holywangle
·
2023-11-25 11:03
java
hadoop
hbase
大数据
少见的hive集群时间不同步报错。
DiagnosticMessagesforthisTask:Containerlaunchfailedforcontainer_1603712387555_0006_02_000006:org.apache.
hadoop
.yarn.exceptions.YarnException
Kris林
·
2023-11-25 10:13
数据仓库 Hive
Hive3.1.2目录Hive3.1.21、数据仓库概念1.2、传统仓库面临的挑战2、Hive简介2.1、Hive的特点2.2、Hive的优缺点2.3、Hive与
Hadoop
生态系统中的关系2.4、Hive
忄凝^
·
2023-11-25 09:48
大数据
hadoop
大数据
hive
Zookeeper+
Hadoop
+Hbase+Hive+Kylin+Nginx集群搭建
Zookeeper+
Hadoop
+Hbase+Hive+Kylin+Nginx集群搭建一、虚拟机安装Centos71.准备工作2.centos7安装过程3.关闭防火墙(关键)二、安装jdk1.卸载镜像自带
桃橙柳
·
2023-11-25 09:15
大数据生态安装
大数据
hadoop
linux
hdfs
centos
Hive数据仓库工具基本架构和入门部署详解
Python量化交易实战入门级手把手带你打造一个易扩展、更安全、效率更高的量化交易系统@目录*概述+定义+本质+特点+Hive与
Hadoop
关系+Hive与关系型数据库区别+优缺点+其他说明架构组成部分数据模
虚幻私塾
·
2023-11-25 09:15
python
数据仓库
hive
架构
计算机
完全分布式安装
Hadoop
,Hive,Hbase,Hwi,Zookeeper
完全分布式安装
Hadoop
,Hive,Hbase,Hwi,Zookeeper其他部分见:HDFSYARNzookeeperHBASEHIVEHIVEhwi的启动HDFS和HBASE动态增加和减少节点一.
ljtyxl
·
2023-11-25 09:45
bigdata
hadoop
hbase
zookeeper
hive
Hadoop
完全分布式安装(Centos7+
Hadoop
2.5.0)
Hadoop
部署模式
Hadoop
部署模式有:本地模式、伪分布模式、完全分布式模式、HA完全分布式模式。
fang·up·ad
·
2023-11-25 09:43
自学框架
Hadoop
上一页
43
44
45
46
47
48
49
50
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他