E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop集群
阿里云三台节点,搭建完全分布式
hadoop集群
,超简单
完全分布式的安装1、集群规划角色分配NODE-47NODE-101NODE-106HDFSNamenodeDatanodeSecondaryNamenodeDatanodeDatanodeYARNNodemanagerNodemanagerRecourceManagerNodemanagerHistroryHistroryServer2、阿里云环境CentOS7.4hadoop2.8.3jdk1.
zhangshk_
·
2020-07-30 06:31
hadoop基础
Kudu 学习 - 第三篇 配置规划
一、Kudu与
Hadoop集群
Kudu很多情况下会被安装在现有的
Hadoop集群
上尽管Kudu本身对Hadoop的任何其他组件没有依赖性,但Kudu几乎总是和Impala一起使用。
程序了个猴
·
2020-07-30 06:29
大数据
Kudu
kudu
单机版
hadoop集群
的搭建
1.下载安装官网下载链接1.1这里选择安装的是2.9.2,使用下面命令进行下载:1#cd~/software2wgethttp://apache.communilink.net/hadoop/common/hadoop-2.9.2/hadoop-2.9.2.tar.gz1.2解压重命名1tar-xzvfhadoop-2.9.2.tar.gz2mvhadoop-2.9.2hadoop1.3配置环境变
wendy0101
·
2020-07-30 05:10
本地连接
hadoop集群
问题汇总
1.本地运行代码读取云主机hadoop数据超时本地代码简版,其中hadoopcluster为集群的命名空间valspark=SparkSession.builder().appName("SparkStatFormatData").master("*").getOrCreate()valdata=spark.sparkContext.textFile("hdfs://hadoopcluster/t
weixin_44641024
·
2020-07-30 05:57
hadoop
hadoop集群
安装配置
HDFS2分布式文件系统YARN集群资源管理器来做任务的分发调度mapReduce分布式离线计算框架,主要做日志分析(java语言编写),storm实时计算框架Zookcaper高可用系统一、hadoop单节点配置1、hadoop安装部署[root@server1~]#id800id:800:Nosuchuser[root@server1~]#useradd-u800hadoop[root@ser
不会测试的开发不是好运维
·
2020-07-30 04:29
企业级运维方案
大数据环境搭建(Hadoop,Spark,Zookeeper,Hbase,Kafka)
本教程基于4台机器(预装有CentOS7Linux系统)完成
Hadoop集群
及其相关组件的搭建,1个master,3个slave。
安中古天乐
·
2020-07-30 02:21
Hadoop完全分布式安装
因为我们硬件设施有限,所以我们采用虚拟机的方式模拟
hadoop集群
,我们准备建立四台虚拟机,一台机器master作为管理节点,其他三台机器slave1、slave2和slave3作为子节点。
祖国的沙漠-SUN
·
2020-07-30 01:40
大数据学习
hadoop集群
分布式
运维 -- 在阿里云搭建
hadoop集群
,如何在购买和选择服务器
1.点击创建实例2.选择服务器1).计费方式:包年包月:费用过高,对于个人使用不推荐按量付费:用多少付多少钱,用完就摧毁,个人推荐这种2).地域选择:选择离自己最近的地域,或者选择一个相对便宜的地域,如果这台服务器需要连接国际互联网就选择国外的,我选择张家口的可用分区A,随机分区(不推荐),如果购买多台服务器,必须选择同一的分区,保证所用的服务器的内网IP在同一个网段中,这样多台服务器间数据传输走
游九河
·
2020-07-29 23:40
运维
hadoop安装与集群
启动
hadoop集群
在hadoop01上输入start-dfs.sh在hadoop01上输入start-yarn.sh在hadoop02上/opt/modules/app/hadoop/sbin输入.
Dream_wdl
·
2020-07-29 22:32
hadoop副本数设置
在客户端eclipse通过java的API接口向
hadoop集群
远程上传文件,设置副本数的时候一直是3,无论改了hdfs-site.xml中的dfs.replication还是hdfs-default.xml
lllgggglt
·
2020-07-29 20:19
重点来了!!!!分布式multiple-executor模式(azkaban三)
最近公司
hadoop集群
升级ambari迁移后,发现我们用的azkaban是solo-server模式的,所以我要搭建个分布式multiple-executor模式(这样才对的起新集群平台)Azkaban
轻风细雨
·
2020-07-29 19:18
azkaban
宝付大数据分析解析
Chukwa提供了一个对大数据量日志类数据采集、存储、分析和展示的全套解决方案和框架,可以用于监控大规模
Hadoop集群
的整体运
congl3110
·
2020-07-29 17:18
hadoop 集群 rebalance 和磁盘 均衡
image.png在我们使用
hadoop集群
的时候,由于日志数据不断流入写入到hdfs上,而且算法人员不断的清洗数据做特征工程又会产生新的中间数据,而且量一点都不小。
Helen_Cat
·
2020-07-29 17:32
Hadoop集群
安装 (4) 配置JobTracker_conf/mapred-site.xml
conf/mapred-site.xml总结:主要配置JobTracker的address,scheduler,queue等。1.配置JobTracker(必须设置)mapreduce.jobtracker.addressnode14:9001jobtracker'saddress2.还有其他可配置项具体见hadoop-0.21.0/mapred/src/java/mapred-default.x
amaowolf
·
2020-07-29 17:10
Hadoop
阿里云ECS7安装搭建:hadoop2.7.6分布式集群
是一个分布式系统基础架构,是大数据生态的一个总称;核心设计包括:HDFS和MapReduce,HDFS为海量数据提供了存储,而MapReduce则为海量数据提供了计算;本篇博客则主要描述在阿里云服务器下部署
hadoop
尘光掠影
·
2020-07-29 17:32
hadoop
Hadoop CDH4.4.0上HIVE安装
接上一篇
Hadoop集群
安装,hive是少不了的。简单记录下安装过程。
K_James
·
2020-07-29 15:45
阿里云服务器搭建
Hadoop集群
阿里云服务器搭建
Hadoop集群
一、环境介绍二、修改hosts、hostname文件三、ssh互信四、安装java(只需在master操作,配置后再发送到slave机器)五、安装并配置Hadoop六、阿里云踩过的坑一
阿三的学习之路
·
2020-07-29 15:50
大数据
hadoop
centos
linux
shell脚本执行jps时:-bash: jps: command not found
我构建了
hadoop集群
。我们一定会写一个shell脚本去每一个节点上去jps,查看每个节点的进程情况。原先以为shell很简单:#!
Bryce_Loski
·
2020-07-29 09:24
HDFS RPC 调度策略 DecayRpcScheduler 与 BackOff
优化HDFSNameNodeRPC的服务质量配置场景数个成品
Hadoop集群
由于NameNode超负荷运行并失去响应而发生故障。这种阻塞现象是由于Hadoop的初始设计造成的。
张伯毅
·
2020-07-29 07:07
Hadoop完全分布式安装Kafka
应用场景按照搭建hadoop完全分布式集群博文搭建完
hadoop集群
后,发现hadoop完全分布式集群自带了HDFS,MapReduce,Yarn等基本的服务,一些其他的服务组件需要自己重新安装,比如Hive
weixin_33720078
·
2020-07-29 06:03
华为云集群部署踩坑指南。
2
hadoop集群
使用指南1)客户端IP用户名密码,在Xshell客户端里打开new一个session进行连接。使用远程连接工具(xshell)连接IP:
qq_39662852
·
2020-07-29 05:31
Hadoop与Spark
什么是 Apache Sentry , Apache Sentry 介绍
Sentry可以在
Hadoop集群
上对通过身份认证的用户和应用程序控制数据访问权限。
jast_zsh
·
2020-07-29 02:48
Hue
sentry
你需要了解Namenode和Secondarynamenode的关系
我需要了解
hadoop集群
中的两个进程secondarynamenode和namenode的区别在Hadoop中,有一些命名不好的模块,SecondaryNameNode是其中之一。
一尘在心
·
2020-07-29 02:57
大数据~~Hadoop
社区版hadoop和第三方发行版比较
基于Apache的组件部署较繁琐且容易出错,组件耦合性太大,因此考虑到
Hadoop集群
部署的高效,集群的稳定性,以及后期集中的配置管理,业界多使用Cloudera公司的发行版(CDH),综述两者的区别及第三方发行版本如下
有腹肌的小蝌蚪_
·
2020-07-29 01:23
hadoop学习(九)Hadoop2.2.0+HA+zookeeper3.4.5详细配置过程+错误处理(2)
Hadoop2.2.0+HA+zookeeper3.4.5详细配置过程+体系结构+错误处理(2)这篇文章,主要是针对zookeeper和
hadoop集群
的整体测试,以及自己在实际过程遇到的问题和解决思路
dufman
·
2020-07-29 01:28
BigDate
Hadoop
zookeeper
hadoop集群
测试
错误处理
hadoop学习(五)Hadoop2.2.0完全分布式安装详解(1)
和同伴一起搭建
hadoop集群
中遇到的各种问题,整理如下:前言在寒假前的一段时间,开始调研Hadoop2.2.0搭建过程,当时苦于没有机器,只是在3台笔记本上,简单跑通一些数据。
dufman
·
2020-07-29 01:27
Hadoop
BigDate
Hadoop集群
运维-基础、均衡器
为了使
Hadoop集群
保持健康的状态,集群需要进行日常的维护,主要从基础运维,集群扩容和异常处理三个方面。1、基础运维1.1启动/停止Hadoop在Hadoop_HOME/bin下执行.
洋葱ycy
·
2020-07-29 01:56
大数据
hadoop集群
空间使用情况报告脚本
最近集群空间有点紧张,总是担心空间不足而崩溃,近期扩容又不太现实,经与集群用户沟通发现:集群上存储了很多无用的历史数据,可以删除,这样就可以通过一个crontab脚本每天生成集群空间使用报告,当使用量超过70%、80%是分别报警,并通知那些用户占用空间较大,预留当机冗余空间,这样就不需要时刻担心集群空间爆满了。[hdfs@hanagios48root]$more/home/hdfs/dfsadmi
运维-Frank
·
2020-07-29 01:28
kettle输出数据到hadoop 的hdfs 系统,错误总结
最近自己在练习使用kettle时,想把MySQL中的数据同步到Hadoop中,就测试了一下,到最后发现怎么也连接不上
hadoop集群
,好不容易连接上了,结果文件又无法写入到指定的目录中,一直提示权限不够
星月情缘02
·
2020-07-29 00:52
ETL技术
prestodb安装配置 —参考prestodb官方文档配置
1.安装环境操作系统:CentOSrelease6.2(Final)
hadoop集群
:CDH-5.5.1-1JDK版本:jdk1.8.0_73注意:(jdk1.6.0_31版本的
wulantian
·
2020-07-28 23:21
prestodb
presto on yarn生产实践
prestoonyarn方案缺点
hadoop集群
的jdk版本过低无法满足prestoserver需求配置文件不易维护,特别是如果涉及多个
hadoop集群
,这点在大公司很常见
hadoop集群
单独团队维护,
woloqun
·
2020-07-28 23:17
presto
大数据hadoop 集群搭建(三个节点)
hadoop集群
的搭建分为两部分前提要有---》1.准备编译好的hadoop-2.6.0-cdh5.14.0和jdk-8u144-linux-642.在linux的根目录下创建export目录,目录下分别创建两个同等级目录
牛犊6
·
2020-07-28 23:16
Hadoop离线项目
离线项目下的Hadoop生态栈Hadoop生态离线项目Hadoop:(无论什么大数据项目Hadoop是少不了的)HDFSMapReduce(主要是做清洗)YARN(大数据项目基本都是跑在yarn资源框架上)
Hadoop
Try Everything、
·
2020-07-28 21:33
Hadoop
Hadoop数据迁移MaxCompute最佳实践
1.环境准备1.1
Hadoop集群
搭建进行数据迁移前,您需要保证自己的
Hadoop集群
环境正常。
煊琰
·
2020-07-28 20:19
hadoop:
hadoop集群
有哪3种模式可以运行?
单机(本地)模式:这种模式在一台单机上运行,没有分布式文件系统,而是直接读写本地操作系统的文件系统。在单机模式(standalone)中不会存在守护进程,所有东西都运行在一个JVM上。这里同样没有DFS,使用的是本地文件系统。单机模式适用于开发过程中运行MapReduce程序,这也是最少使用的一个模式。伪分布式模式:也是在一台单机上运行,但用不同的Java进程模仿分布式运行中的各类结点(NameN
花和尚也有春天
·
2020-07-28 20:40
hadoop
hadoop 解决内存溢出问题 2.1 GB of 2.1 GB virtual memory used. Killing container
hadoop集群
启动成功之后,牛刀小试一下自带的jar包里的程序,计算一下pi值:报如下错误:2.1GBof2.1GBvirtualmemoryused.Killingcontainer1.在etc/hadoop
yelena_scr
·
2020-07-28 20:05
hadoo
NAMENODE工作机制,元数据管理(元数据存储机制、元数据手动查看)、元数据的checkpoint、元数据目录说明(来自学习资料)...
NAMENODE工作机制学习目标:理解namenode的工作机制尤其是元数据管理机制,以增强对HDFS工作原理的理解,及培养
hadoop集群
运营中“性能调优”、“namenode”故障问题的分析解决能力问题场景
weixin_34411563
·
2020-07-28 19:20
饿了么大数据计算引擎实践与应用
其中6人的离线团队需要维护大数据集群规模如下:
Hadoop集群
规模1300+HDFS存量数据40+PB,Read3.5PB+/天,Write500TB+/天14WMRJob/天,10WSparkJob/
weixin_34406796
·
2020-07-28 19:47
hive执行更新和删除操作
许多用户使用诸如ApacheFlume、ApacheStorm或ApacheKafka这样的工具将流数据灌入
Hadoop集群
。当这些工具以每秒数百行的频率写入时,Hive也许只
weixin_34352005
·
2020-07-28 19:25
ssh证书登录(实例详解)
前言本文基于实际Linux管理工作,实例讲解工作中使用ssh证书登录的实际流程,讲解ssh证书登录的配置原理,基于配置原理,解决实际工作中,windows下使用SecureCRT证书登录的各种问题,以及实现
hadoop
weixin_34336526
·
2020-07-28 19:40
运维
大数据
操作系统
Hadoop集群
上检查磁盘使用量和清理相关日志文件脚本
#####----检查
Hadoop集群
上的磁盘使用量----######!
weixin_34310127
·
2020-07-28 19:53
Hadoop集群
datanode磁盘不均衡的解决方案
二、问题:因业务需要搭建一个新
hadoop集群
,
weixin_34203832
·
2020-07-28 19:42
python
java
swift
Hadoop集群
提交作业问题总结
2019独角兽企业重金招聘Python工程师标准>>>我们知道可以在本地节点向远程集群提交作业。为了实现远程作业的提交:首先,要确保本地机器的用户名需要跟远程集群的用户名一致(在实验环境中,集群的用户名是hadoop,因此要在本地机器上创建一个hadoop用户)。其次,要确保本地机器上的用户对hadoop执行文件和配置文件具备相应的权限(在实验环境中,hadoop用户需要对hadoop安装文件具有
weixin_34194317
·
2020-07-28 19:01
hive小文件合并思路
对于hdfs来说,系统的压力主要集中在namenode如果在整个
hadoop集群
中存在大量的小文件,会消耗namenode的大量内存(大概146B一个元数据)另一方面,如果小文件过多,有没有开启combineinputformat
weixin_34161029
·
2020-07-28 18:31
Hadoop集群
部署权限总结
这是一篇总结的文章,主要介绍
Hadoop集群
快速部署权限的步骤以及一些注意事项。如果你想了解详细的过程,请参考本博客中其他的文章。
weixin_34081595
·
2020-07-28 18:12
hadoop集群
内存设置
1.内存hadoop为各个守护进程(namenode,secondarynamenode,jobtracker,datanode,tasktracker)统一分配的内存在hadoop-env.sh中设置,参数为HADOOP_HEAPSIZE,默认为1000M。大部分情况下,这个统一设置的值可能并不适合。例如对于namenode节点,1000M的内存只能存储几百万个文件的数据块的引用。如果我想单独设
weixin_34034670
·
2020-07-28 18:11
ganglia安装配置(监控hadoop)
环境:系统CentOS6.0
hadoop集群
中有3台服务器server01->master192.168.255.128server02->slave192.168.255.130server03->slave192.168.255.131
weixin_33901641
·
2020-07-28 18:38
HIVE的安装配置、mysql的安装、hive创建表、创建分区、修改表等内容、hive beeline使用、HIVE的四种数据导入方式、使用Java代码执行hive的sql命令...
tar-zxvfapache-hive-1.2.1-bin.tar.gz-C/home/tuzq/software/hive/3.安装mysql数据库(切换到root用户)(装在哪里没有限制,只有能联通
hadoop
weixin_33725126
·
2020-07-28 17:29
hadoop集群
启动脚本——解决启动
hadoop集群
时,效率低问题
解决启动
hadoop集群
时,效率低问题当搭建好了
hadoop集群
时,需要先启动协调zookeeper,再启动hdfs,最后启动yarn,很麻烦呀,效率太低了,有木有!!!!!!!!!!
十点进修
·
2020-07-28 17:18
hadoop
一次
hadoop集群
机器加内存的运维过程
由于前期的集群规划问题,导致当前
Hadoop集群
中的硬件并没有完全利用起来。
weixin_30773135
·
2020-07-28 17:37
上一页
41
42
43
44
45
46
47
48
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他