E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
研磨hadoop
Ambari和ClouderManager分析对比
第一章导论运维过
hadoop
集群的人都应该清楚,
hadoop
生态从安装、配置到后期运维是一个非常艰辛的过程,一般来说安装
hadoop
可能就需要几天时间,运维一个小型集群同样需要几个人。
weixin_30481087
·
2023-12-14 20:42
ui
数据库
python
大数据存储技术(1)——
Hadoop
简介及安装配置
目录一、
Hadoop
简介(一)概念(二)
Hadoop
发展历史(三)
Hadoop
三大发行版本(四)
Hadoop
的优势二、
Hadoop
的组成(一)
Hadoop
1.x和
Hadoop
2.x的区别编辑(二)
Hadoop
Francek Chen
·
2023-12-14 19:08
大数据技术基础
Spark编程基础
大数据
hadoop
linux
Scala-初学
HIVE也可以使用
hadoop
配置的压缩方法对中间结果或最终数据进行压缩1importscala.io.Sourcescala>vallines=Source.fromFile(“/usr/local/
Logan_addoil
·
2023-12-14 19:07
大数据学习之旅
scala
开发语言
后端
大数据之旅-问题反思
2.
hadoop
1.0和
hadoop
2.0明显的差异如何理解?
Logan_addoil
·
2023-12-14 19:07
大数据学习之旅
大数据
【python】多任务编程
多任务编程有哪些编程提速的方法单线程串行:不加改造的程序多线程并发:利用CPU和IO可以同时执行的原理,让CPU不会干巴巴等待IO完成多CPU并行/多进程:利用多核CPU的能力,真正的并行执行任务多机器并行:
hadoop
小赵要加油
·
2023-12-14 19:33
python
python
开发语言
sqoop安装及测试(坑解决)
sqoop安装:下载sqoop-1.4.7.bin__
hadoop
-2.6.0.tar.gz(非sqoop-1.4.7.tar.gz)解压修改sqoop-env-template.sh文件名为sqoop-env.sh
Java页大数据
·
2023-12-14 16:27
sqoop
hadoop
大数据
基于
hadoop
-3.3.2安装hbase-2.4.11,报错:object is not an instance of declaring class(已处理)
基于
hadoop
-3.3.2安装hbase-2.4.11,报错:objectisnotaninstanceofdeclaringclass安装之前看了hbase官网,hbase-2.4.11和
hadoop
Java页大数据
·
2023-12-14 16:27
hadoop
hbase
hbase
hadoop
big
data
大数据云计算——Docker环境下部署
Hadoop
集群及运行集群案列
大数据云计算——Docker环境下部署
Hadoop
集群及运行集群案列本文着重介绍了在Docker环境下部署
Hadoop
集群以及实际案例中的集群运行。
星川皆无恙
·
2023-12-14 14:57
大数据系统运维
Linux
Docker
docker
hadoop
spark
大数据
云计算
运维
容器
基于
Hadoop
技术的计算机专业画像平台的设计与研究
完整下载:基于
Hadoop
技术的计算机专业画像平台的设计与研究.docx基于
Hadoop
技术的计算机专业画像平台的设计与研究DesignandResearchofComputerProfessionalProfilingPlatformBasedon
Hadoop
Technology
wu_fei_yu
·
2023-12-14 14:24
信息可视化
idea本地调试
hadoop
遇到的几个问题
MapReduce的toString调用报错:Methodthrew‘java.lang.IllegalStateException‘exception.Cannotevaluateorg.apache.
hadoop
.mapreduc
sunweiking
·
2023-12-14 13:43
intellij-idea
hadoop
java
big data tools连接hdfs报错Exception during driver request: java.lang.IllegalArgumentException:java.net.U
hdfs时报错:Exceptionduringdriverrequest:java.lang.IllegalArgumentException:java.net.UnknownHostException:
hadoop
002
向之 所欣
·
2023-12-14 12:15
报错
大数据
hdfs
java
CentOS7
Hadoop
3.X完全分布式环境搭建
环境:windows10、centos7.9、
hadoop
3.x、jdk1.8-8u162
hadoop
各版本jdk各版本特此说明:
Hadoop
版本最好不要选
hadoop
3.1.0,因为官网显示此
hadoop
向之 所欣
·
2023-12-14 12:45
Hadoop
分布式
hadoop
大数据
mapreduce
二百一十八、
Hadoop
——
Hadoop
启动报错Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password)
一、目的在完成Flume拓扑结构之聚合的开发案例,启动了hurys23服务器早已安装好的
Hadoop
,结果居然报错了二、报错详情hurys23:Permissiondenied(publickey,gssapi-keyex
天地风雷水火山泽
·
2023-12-14 12:39
Hadoop
hadoop
ssh
idea连接Hbase卡住,没有输出
1.项目场景(idea连接hbase)先检查
hadoop
,zookeeper,hbase启动没有idea连接hbase,创建命名空间,idea一直卡住在日志,没有输出packagecom.wf.hbase
挽风821
·
2023-12-14 12:38
大数据
intellij-idea
hbase
java
报错:Permission denied. user=dr.who is not the owner of inode=/tmp
文章目录用户名问题权限问题修改权限的正确做法用户名问题首先是为什么用户名是dr.who,我可以在core-default.xml文件中可以查到
hadoop
.http.staticuser.user参数默认为
撕得失败的标签
·
2023-12-14 12:37
Hadoop
hdfs
hadoop
权限问题
解决ERROR:Can‘t get master address from Zookeeper;znode data == null报错
发现有全部进程,但是打开hbaseshell进行使用的时候,会报错ERROR:Can’tgetmasteraddressfromZookeeper;znodedata==null,详细请看下图:原因分析:虽然启动
hadoop
夢醒汐月
·
2023-12-14 12:36
hbase
nosql
数据库
hadoop
HBase Error : Can't get master address from ZooKeeper; znode data == null
Error:Can’tgetmasteraddressfromZooKeeper;znodedata==null 首先先检查进程是否都有启动,(JPS)Zookeeper一个 QuorumPeerMain
Hadoop
isOllie
·
2023-12-14 12:33
HBase
HBase启动报错
Error
【大数据】详解 AVRO 格式
2.2.1Records2.2.2Enums2.2.3Arrays2.2.4Maps2.2.5Unions2.2.6Fixed3.Avro的文件存储格式3.1数据编码3.1.1原始类型3.1.2复杂类型3.2存储格式3.3存储格式4.小结1.Avro介绍ApacheAvro是
Hadoop
G皮T
·
2023-12-14 12:19
大数据
大数据
编码格式
avro
文件格式
十三、YARN资源分配调用
在
Hadoop
文件系统中,YARN作为
Hadoop
系统的第三大组件,其中,第二大组件MapReduce组件是基于YARN运行的,即没有YARN无法运行MapReduce程序,所以需要同时学习YARN。
弦之森
·
2023-12-14 12:34
Hadoop
开发语言
hadoop
大数据
hdfs
yarn
Hadoop
3.x完全分布式环境搭建Zookeeper和Hbase
集群规划IP地址主机名集群身份192.168.138.100
hadoop
00主节点192.168.138.101
hadoop
01从节点192.168.138.102
hadoop
02从节点
Hadoop
完全分布式环境搭建请移步传送门先在主节点上进行安装和配置
向之 所欣
·
2023-12-14 12:32
Hadoop
分布式
zookeeper
hbase
hadoop
Flume+Kafka双剑合璧玩转大数据平台日志采集
一般而言,这些系统需要具有以下特征:构建应用系统和分析系统的桥梁,并将它们之间的关联解耦;支持近实时的在线分析系统和类似于
Hadoop
之类的离线分析系统;具有高可扩展性。
java菜
·
2023-12-07 00:17
大数据实战项目_电商推荐系统
一、项目介绍
Hadoop
+Spark+(Python)Scala+SparkSQL+SparkStreaming+MongoDB+Redis+Kafka+Flume+(SpringMVC+vue)1项目介绍
Guff_hys
·
2023-12-06 20:28
大数据开发学习
大数据
服务器
hadoop
spark
zookeeper
flume
kafka
hadoop
学习之路3-MapReduce作业生命周期
本系列均为
hadoop
1版本为准。。MR作业生命周期,即用户从作业提交到运行结束经历的整个过程。如图所示:
hadoop
MR作业生命周期1.作业提交与初始化。
乌拉乌拉儿
·
2023-12-06 18:09
解决安装pyspark所遇到的所有问题
一开始安装
Hadoop
,hive,hbase,spark很顺利。但是到了pyspark时候已
天亮说晚安ii
·
2023-12-06 17:33
大数据
spark
ambari 安装及使用ambari安装
hadoop
记录
大数据平台XSailboat简介_OkGogooXSailboat的博客-CSDN博客1、ambari简介ApacheAmbari是一种基于Web的工具,支持Apache
Hadoop
集群的供应、管理和监控
yujianbujianqwe
·
2023-12-06 17:24
ambari
hadoop
大数据
ambari全攻略流程,认识ambari(一)
ambari介绍ApacheAmbari项目旨在通过开发用于供应、管理和监控Apache
Hadoop
集群的软件来简化
Hadoop
管理。
进无止
·
2023-12-06 17:53
ambari
hadoop
大数据
大数据平台Ambari2.7.4+HDP3.1.4详细安装教程
Ambari已支持大多数
Hadoop
组件,包括HDFS、MapReduce、Hive、Pig、Hbase、Zookeeper、Sqoop和Hcatalog等。
csdnuser267
·
2023-12-06 17:20
大数据平台
HDP
大数据
Ambari简介&安装
文件关闭防火墙和selinuxssh免密安装JDK和Mysql安装JDK安装mysql时钟同步安装ambari-server搭建HDP本地源简介ApacheAmbari是一种基于Web的工具,支持Apache
Hadoop
月苍.
·
2023-12-06 17:49
Ambari
ambari
Could not find or load main class org.apache.
hadoop
.mapreduce.v2.app.MRAppMaster
问题:运行mapreduce出现以下报错:2023-12-0415:06:00,849INFOmapreduce.Job:map0%reduce0%2023-12-0415:06:00,879INFOmapreduce.Job:Jobjob_1701673087217_0001failedwithstateFAILEDdueto:Applicationapplication_17016730872
Appreciate(欣赏)
·
2023-12-06 16:14
apache
hadoop
mapreduce
大数据
Hadoop
分布式文件系统HDFS的两类节点NameNode和DataNode
HDFS集群有两类节点,并以管理者-工作者模式运行,即一个NameNode(管理者)和多个DataNode(工作者)。HDFS官方架构图一、NameNode(NN)——基于内存存储:不会和磁盘发生交换·只存在内存中·持久化——NameNode主要功能·接受客户端的读写服务·收集DataNode汇报的Block列表信息——NameNode保存metadata信息包括·文件owership和permi
A尚学堂Nancy老师
·
2023-12-06 15:56
Hbase JAVA API 增删改查操作
mvnrepository.com/搜索hbase选择hbase-client,2.2.4版本,点进去复制依赖代码org.apache.hbasehbase-client2.2.4创建表格importorg.apache.
hadoop
.hbase.TableName
会java的怪蜀黍
·
2023-12-06 12:09
大数据
hbase
java
数据库
flume 实时监控 Hive 日志,并上传到 HDFS 中
一、首先配置hive的日志生成位置二、上传需要的jar包将commons-configuration-1.6.jar、
hadoop
-auth-3.1.2.jar、
hadoop
-common-3.1.2.
无名刺客
·
2023-12-06 12:41
大数据
大数据
二百一十二、Flume——Flume实时采集Linux中的目录文件写入到HDFS中(亲测、附截图)
Flume实时采集Linux中的Hive日志写入到HDFS后,再做一个测试,用Flume实时采集Linux中的目录文件,即使用Flume监听Linux整个目录的文件,并上传至HDFS中二、前期准备(一)安装好
Hadoop
天地风雷水火山泽
·
2023-12-06 12:10
Flume
flume
linux
hdfs
flume和kafka整合——采集实时日志落地到hdfs
flume和kafka整合——采集实时日志落地到hdfs一、采用架构二、前期准备2.1虚拟机配置2.2启动
hadoop
集群2.3启动zookeeper集群,kafka集群三、编写配置文件3.1slave1
奋斗的IT小白菜
·
2023-12-06 12:39
Flume
kafka
Flume监控Hive日志并上传到HDFS
一、实时监控单个追加文件1.需求:实时监控Hive日志,并上传到HDFS2.实现步骤:(1)上传
Hadoop
相关jar包到flume/lib目录下flume相关jar包https://blog.csdn.net
无发可脱丶
·
2023-12-06 12:37
笔记
学习
flume
大数据
flume
实时监控 Hive 日志,并上传到 HDFS 中
Flume要想将数据输出到HDFS,依赖
Hadoop
相关jar包检查/etc/profile.d/my_env.sh文件,确认
Hadoop
和Java环境变量配置正确创建flume-file-hdfs.conf
夏殿灬青葛石
·
2023-12-06 12:07
Flume
hdfs
hive
hadoop
二百一十一、Flume——Flume实时采集Linux中的Hive日志写入到HDFS中(亲测、附截图)
一、目的为了实现用Flume实时采集Hive的操作日志到HDFS中,于是进行了一场实验二、前期准备(一)安装好
Hadoop
、Hive、Flume等工具(二)查看Hive的日志在Linux系统中的文件路径
天地风雷水火山泽
·
2023-12-06 12:36
Flume
flume
hive
hdfs
1.2.2.4eclipse开发MapReduce
总目录:https://www.jianshu.com/p/e406a9bc93a9
Hadoop
-子目录:https://www.jianshu.com/p/9428e443b7fd开发环境搭建:阶段一
寒暄_HX
·
2023-12-06 11:23
Spark由浅到深(1)--安装,测试,问题排错
安装部署//选择需要的版本.官网下载:http://spark.apache.org/downloads.html//部署tar-zxfspark-1.4.0-bin-
hadoop
2.6.tgzcdspark
GeezKe
·
2023-12-06 10:04
Spark
Spark
BigData
Spark 环境安装
Spark环境安装一、准备工作1、
hadoop
成功安装2、防火墙关闭二、解压安装1、上传spark安装包到/opt/soft目录,进入该目录下,执行如下命令:tar-zxvfspark-2.1.1-bin-
hadoop
2.7
会java的怪蜀黍
·
2023-12-06 07:35
大数据
spark
大数据
分布式
HBase 伪分布式集群模式安装md
HBase伪分布式集群模式安装(Pseudo-Distributed)1.解压
hadoop
到/usr/local/src路径下,改名为hbasetar-zxvf/opt/soft/hbase…tar.gz-C
会java的怪蜀黍
·
2023-12-06 07:52
分布式
hbase
debian
Dropwizard-metric的使用
背景近期在开发中用到了dropwizard-metric作为监控metric的埋点框架,由于是分布式的系统,前期曾经对比过
hadoop
-metric的实现和dropwizard-metric的实现,因为开发的项目后续会和
想做一个offer收割机
·
2023-12-06 06:21
大数据相关
java
java
大数据
学习
IDEA连接Redis注意事项
禁用Linux防火墙[atguigu@
hadoop
102~]$sudosystemctlstopfirewalld[atguigu@
hadoop
102~]$sudosystemctldisablefirewalld
curtime
·
2023-12-06 06:20
redis
数据库
缓存
Hadoop
高可用(主备切换)---配合Zookeeper
1.
Hadoop
高可用(
Hadoop
HighAvailability)概述HA(HighAvailable),高可用,是保证业务连续性的有效解决方案,一般有两个或两个以上的节点,分为活动节点(Active
Yan_bigdata
·
2023-12-06 06:16
hadoop
zookeeper
大数据
学习
架构
ZooKeeper常见面试题
1、Zookeeper是什么框架分布式的、开源的分布式应用程序协调服务,原本是
Hadoop
、HBase的一个重要组件。
辰辰
·
2023-12-06 06:40
zookeeper
zookeeper
分布式
云原生
【Python笔记】Parquet介绍及简单使用
1什么是parquet定义:Parquet是列式存储的一种文件类型官网描述:无论数据处理框架,数据模型或编程语言的选择如何,ApacheParquet都是
Hadoop
生态系统中任何项目可用的列式存储格式由来
阳光快乐普信男
·
2023-12-06 06:55
工作札记
Python笔记
数据库
比较 Apache Hive 和 Spark
Hive是一个运行在
Hadoop
分布式文件系统上
vvoennvv
·
2023-12-06 06:50
apache
hive
spark
Ambari hdp Spark多版本并存
本示例基于ambarihdp-2.6.0.3(spark2.1.0),集成spark2.2.2,其他的版本思路类似(spark2.3经测试也是没问题的)下载spark-2.2.2-bin-
hadoop
2.7
Respect123
·
2023-12-06 05:20
【读书笔记】《大数据技术体系详解:原理、架构与实践》03.分布式文件系统
这些文件形式的数据具有价值高、数据大、流式产生等特点,需要一个分布式文件系统存储它们,该文件系统应具有良好的容错性、扩展性和易用的API,而HDFS(
Hadoop
DistributedFileSystem
粥一样温柔
·
2023-12-06 05:40
大数据各个工具随笔
#基本配置```shell#目录结构:bin:二进制的客户端命令etc:存放配置文件etc/conflib:存放jar包的目录sbin:存放管理类的脚本启动服务share:
hadoop
所有的jar包#查看主机名
weixin_30710457
·
2023-12-06 03:01
运维
大数据
数据库
上一页
38
39
40
41
42
43
44
45
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他