E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop集群
基于linux平台的Hadoop完全分布式集群搭建
前一段因为课设搭建了基于linux的
Hadoop集群
,现将搭建过程记录如下,如有错误,望不吝指出。注:下文从自己的课设报告中直接粘贴下来的,可能有些格式问题。
sutaotao_s77
·
2020-06-26 16:35
实践
Linux环境下安装ssh
前言在配置
Hadoop集群
分布时,要使用SSH免密码登录,spark也是。此处只简单介绍ssh的安装,后续的免密码登录在Spark配置文章中详细介绍、记录。
CMSurprise
·
2020-06-26 16:22
技术
ssh
linux
Ubuntu
大数据平台的使用(Hadoop 生态圈、CDH)
目录一、shell自行搭建
Hadoop集群
(2节点以上)1.1系统准备1.2系统基础配置1.3组件安装与配置1.3.1Hadoop1.3.2Hive1.3.3Hbase1.3.4Spark二、ClouderaCDH
longongng
·
2020-06-26 15:01
bigdata
CDH6.0.1详细安装步骤及问题解决
CDH6.0.1详细安装步骤及常见问题解决ClouderaManager能够大大减轻配置
hadoop集群
的工作量,安装好以后能够快速熟悉Hadoop生态系统常用的一些组件,如HBase,Hive,Spark
sunfect
·
2020-06-26 15:10
大数据
Yarn NodeManager解析
YarnNodeManager解析篇NodeManager简介NodeManager是Yarn中单节点的代理,它管理
Hadoop集群
中单个计算节点,他需要与应用程序的ApplicationMaster和集群管理器
小狼星I
·
2020-06-26 15:13
有赞搜索引擎实践(算法篇)
有赞搜索引擎实践(算法篇)18April20161.搜索算法总体架构在上篇文章(工程篇)中,我们介绍了有赞搜索引擎的基本框架.搜索引擎主要3个部件构成.第一,
hadoop集群
,用于生成大规模搜索和实时索引
starzhou
·
2020-06-26 14:37
使用Docker搭建
hadoop集群
https://blog.csdn.net/qq_33530388/article/details/72811705外网访问iptables-tnat-ADOCKER-ptcp--dport50070-jDNAT--to-destination172.17.0.3:50070------------------------------------------------------------1下
SoLucky2017
·
2020-06-26 14:23
hadoop
大数据系列之hadoop(三、HA
hadoop集群
搭建)
HA
hadoop集群
完美搭建此博文可以堪称史上最全、宇宙最详细的HA
hadoop集群
搭建攻略,是本人呕心制作,亲自搭建完成后的全过程笔录。
snail_bing
·
2020-06-26 13:55
大数据
hadoop集群
搭建步骤全
hadoop2.0已经发布了稳定版本了,增加了很多特性,比如HDFSHA、YARN等。最新的hadoop-2.6.4又增加了YARNHA注意:apache提供的hadoop-2.6.4的安装包是在32位操作系统编译的,因为hadoop依赖一些C++的本地库,所以如果在64位的操作上安装hadoop-2.6.4就需要重新在64操作系统上重新编译(建议第一次安装用32位的系统,我将编译好的64位的也上
shiyanshi805
·
2020-06-26 09:53
大数据
RHEL 5下配置
Hadoop集群
:java.net.NoRouteToHostException: No route to host问题的解决
最近,要把原来基于Ubuntu下配置的
Hadoop集群
迁移到RHEL5下,结果在启动的时候,出现了莫名其妙的问题:Namenode进程启动起来了,但是在登录到Datanode上启动集群slaves的时候
千与
·
2020-06-26 09:32
Open
Source
Ambari系列(一):在离线环境中自动化安装
Hadoop集群
机器部署:cluster-01:yumservercluster-02:mysqlserver,ambariserver安装思路:在生产环境中,应该是没有外网链接的环境,或者做了外网隔离,因此在离线环境下搭建集群很有价值。在内网集群中搭建yum服务器,安装ambari和集群,是一种比较好的解决思路。安装步骤:搭建Yum源服务器安装MySQL服务安装Ambari服务安装过程:(一)搭建Yum源服务器
zachary_OOM
·
2020-06-26 09:59
Hadoop
配置SSH免密码登录案例
在搭建
Hadoop集群
时,经常需要设置多个节点之间的免密码登录,今天把这个操作完整的整理出来,以便事后参考总体思路:1.在集群各节点上产生公匙和私匙2.把公匙copy到需要免密码登录的节点上我们用两个节点来举例
see_you_see_me
·
2020-06-26 08:08
centos7搭建
hadoop集群
先期准备主机系统ip地址hadoop-mastercentos7192.168.196.162hadoop-slave1centos7192.168.196.163hadoop-slave2centos7192.168.196.164ps:大家使用克隆的方式复制多个独立的虚拟机,每个虚拟机创建一个hadoop用户并加入到root组中useradd-mhadoop-Groot-s/bin/bash利
seal__jing
·
2020-06-26 07:39
大数据课程学习笔记
centos7 搭建ha(高可用)hadoop2.7.3集群
前面一章写了centos7搭建
hadoop集群
再跟着做本章实验前建议初学者先去实验上一章的内容。有任何问题欢迎反馈,我也好做出修改。
seal__jing
·
2020-06-26 07:39
大数据课程学习笔记
大数据培训怎么选?16张国际公认的大数据“学历”证书
具有分析大数据所需技术的数据科学家和分析师,以及了解
Hadoop集群
和其他技术的开发人员供不应求。如果有人正在寻找一个方法来获得一个优势,无论你是工作,狩猎,钓鱼或只是想要
华为女程序员
·
2020-06-26 06:04
大数据
编程语言
hadoop
程序员
Hadoop命令汇总
1.用户命令
hadoop集群
用户的常用命令。archive创建一个hadoop档案文件。
rosefunR
·
2020-06-26 06:06
Hadoop
hadoop初入门(3)
hadoopfs-getoutputoutput$catoutput/*在分布式文件系统上查看输出文件:$bin/hadoopfs-catoutput/*完成全部操作后,停止守护进程:$bin/stop-all.sh2.
Hadoop
rosefunR
·
2020-06-26 06:34
Hadoop
HBase全网最佳学习资料汇总
注意大公司有数十个数百个HBase集群,此点跟
Hadoop集群
很不相同。
rainbowzhouj
·
2020-06-26 05:56
HBase
Hadoop集群
搭建-HA模式
Hadoop集群
搭建-HA模式基础设施Hadoop配置初始化运行简单使用权限管理基础设施设置网络(设置IP;设置主机名;设置本机的ip到主机名的映射关系)关闭防火墙,关闭selinux做时间同步安装JDKssh
旺仔花馒头
·
2020-06-26 01:47
MacOS下,如何搭建大数据
Hadoop集群
环境,看这一篇足矣!
首先声明,以下的所有配置都是基于VMWareFusion搭建,倘如没下载此软件,请自行下载。第一步环境准备此时,我已经默认你有了一台虚拟机了(如果没有,请自行下载)。在启动第一台虚拟机的时候,这个时候,你的虚拟机是无法ping通外网的,因为没和mac网关相关联。首先,查看你的mac网关ip和子网掩码。使用command+空格输入ter显示出终端操作界面,输入如下指令即可(这时,请不要关闭终端,因为
晴初1997
·
2020-06-26 01:34
macos
大数据
hadoop
大数据点点滴滴积少成多---进阶之路
1.HADOOP入门61.1大数据部分的课程介绍61.2学习建议61.3就业前景及发展规划61.4HADOOP简介71.4.1前言71.4.2hadoop应用场景71.5
hadoop集群
部署安装72.HDFS92.1hdfs
_Jack_LI
·
2020-06-25 23:03
大数据
使用docker搭建
hadoop集群
Hello小伙伴们,上一篇我们讲了怎么使用虚拟机搭建
hadoop集群
。由于这种方式搭建起来,虚拟机较大,如果是从0开始搭建的话,那是十分缓慢。
喜讯XiCent
·
2020-06-25 23:03
hadoop
CDH是什么?
大致提出一个问题,假如公司要求给500台机器,进行安装
hadoop集群
。只
乔治大哥
·
2020-06-25 22:21
#
bigdata_CDH
YARN资源调度框架
Yarn资源调度系统一、课前准备1.三个节点的
hadoop集群
二、课堂主题1.yarn架构、核心组件2.yarn应用提交过程3.yarn的调度策略4.yarn的优化三、课堂目标1.数据yarn资源的任务调度原理
起始的地方
·
2020-06-25 22:00
Hive学习 (三)Hive的连接三种连接方式
目录一、CLI连接二、HiveServer2/beeline1、修改
hadoop集群
的hdfs-site.xml配置文件2、修改
hadoop集群
的core-site.xml配置文件三、WebUI正文:一
匿名啊啊啊
·
2020-06-25 21:37
Hive
hive集成spark和mysql
参考:http://ihoge.cn/2018/HiveSpark.html一、Hive安装1.Hive简介Hive是Facebook开发的构建于
Hadoop集群
之上的数据仓库应用,可以将结构化的数据文件映射为一张数据库表
ihoge
·
2020-06-25 20:09
环境搭建
HBase(Hadoop3.1.2 HBase2.2.4) 伪分布式安装与配置
使用伪分布式安装之前,你应该已经安装了:JDK7+HadoopHadoop的安装和配置可以参考Hadoop配置,
Hadoop集群
环境搭建(如果按照我的Hadoop配置的话,可以先不用搭建集群
虚言假面
·
2020-06-25 19:23
Linux
如何使用HDFS高可用性设置
Hadoop集群
这个博客中的主题的顺序如下:HDFSHA体系结构介绍NameNode可用性医管局的架构HA(JournalNode和SharedStorage)的实施如何在
Hadoop集群
中设置HA(QuorumJournalNodes
踩到最基点
·
2020-06-25 18:09
【亲测可用】Linux环境下搭建最新版Hadoop 3.1.3版本的真集群环境
2.服务器功能规划(提前规划好,有利于我们后面配置文件的修改和搭建)3.搭建第一台虚拟机的Hadoop环境4.克隆虚拟机5.配置虚拟机之间的映射(三台虚拟机都需要配置)6.设置SSH无密码登录7.启动
hadoop
斗士(Carroll)
·
2020-06-25 18:23
大数据学习
hadoop集群
多namenode配置
多namenode配置规划:bigdata01.combigdata02.combigdata03.comnamenodenamenodedatanodedatanodedatanode两个HDFS集群联盟部署:在[bigdata01]$cp-racluster-hadoop-2.5.0/hadoop-2.5.0第一台,fs.defaultFShdfs://node-1:8020hadoop.tm
无敌策哥
·
2020-06-25 16:30
大数据
hadoop集群
启动失败的一些常见问题
1.没有关闭防火墙2.没有生效配置文件[netlab@master~]$source~/.bash_profile3.Hadoop中的配置文件是添加,不是替换4.配置免密钥登录时注意用户的统一;多次配置需删除.ssh在生成密钥对,重启虚拟机5.(1)格式化一次启动:start-all.sh(2)格式化多次:①关闭集群②删除hadoopdata目录③hadoop-2.7.1/logs,删除logs里
喋喋以喋以喋喋
·
2020-06-25 15:51
hadoop
Spark+
Hadoop集群
搭建:(一)单一节点上搭建Hadoop环境
Spark+
Hadoop集群
搭建:(一)单一节点上搭建Hadoop环境1安装JDK2下载安装Hadoop2.1下载Hadoop2.2解压2.3配置Hadoop环境变量2.3.1设置JDK与Hadoop安装路径
闻曦
·
2020-06-25 14:38
大数据平台
面经2(大数据方向)
1.
Hadoop集群
可以运行的3个模式?单机(本地)模式伪分布式模式全分布式模式2.单机(本地)模式中的注意点?在单机模式(standalone)中不会存在守护进程,所有东西都运行在一个JVM上。
XiaoYu@
·
2020-06-25 14:17
面试
hadoop
Hbase,Zookeeper完全分布式安装
前段时间安装配置了
hadoop集群
,这两天想装个hbase然后用些数据学习学习。网上教程有点多也有点乱,摸索了很久,所以还是记录一下自己的配置经验。
-水中月-
·
2020-06-25 13:58
大数据
百亿数据入库mongodb生产实践(一)
源数据通过一个中转集群拷贝至我们的生产环境
hadoop集群
中,业务数据分为几块大的领域,但是每个领域的数据结构基本相同。主要是三个事实表(这里用r1,r
人生如流沙
·
2020-06-25 13:20
mongodb
搭建3个节点的
hadoop集群
(完全分布式部署)5 flume安装及flume导数据到hdfs
下载并安装flume,安装目录为/opt/flumemvflume-conf.properties.templateflume-conf.propertiesmvflume-env.sh.templateflume-env.sh修改flume-env.sh环境变量,添加如下:exportJAVA_HOME=/opt/jdk1.8.0_121FLUME_CLASSPATH="/opt/hadoop-
qq_37581329
·
2020-06-25 13:14
hadoop
linux下Spark安装与环境配置
Hadoop测试:按照上一篇文章安装完
Hadoop集群
之后,启动hdfs文件系统及yarn资源管理器(也可通过start-dfs.sh和start-yarn.sh完成):start-all.sh之后通过
大数据之眸
·
2020-06-25 12:57
教程
hadoop
spark
linux
HIVE调优【2】如何优化任务的mapper和reducer个数
写在前面:1个
hadoop集群
可以提供的map和reduce资源(可称为“插槽”)个数是固定的。因此如果某个大job消耗完所有的插槽,会导致其他job无法执行。
upup-我是昵称存在的分割线
·
2020-06-25 09:36
Hive
大数据之Hadoop(五):MapReduce实战、利用MRJob编写和运行MapReduce代码、运行MRJOB的不同方式、mrjob 实现 topN统计(实验)
MapReduce实战3.3.1利用MRJob编写和运行MapReduce代码mrjob简介使用python开发在Hadoop上运行的程序,mrjob是最简单的方式mrjob程序可以在本地测试运行也可以部署到
Hadoop
汪雯琦
·
2020-06-25 09:58
【Lambda大数据开发】
Hadoop集群
搭建实验(1) _伪分布式部署
〇基础练习1)安装虚拟机VirtualBox先卸载,再安装,学会基本操作,启动虚拟机,新建虚拟机,主机网络管理器查看虚拟网卡,2)安装CentOS安装1台干净的CentOS作为搭建
hadoop集群
的基础环境纯命令行界面安装
whvcse_hlzhang
·
2020-06-25 09:22
基于
Hadoop集群
的Redis集群搭建以及自定义脚本运行
前期准备:
hadoop集群
Redis集群的搭建:这里以3台虚拟机,6个redis数据库为例1、集群通信是通过“ping-pong”机制进行通信;2、客户端不需要将所有的节点都连接上,只需要连接其中一个节点即可
章鱼没有小丸子
·
2020-06-25 09:32
BIGDATA
hadoop2.7.2学习笔记06-CLI MiniCluster
CLIcluster功能可以使用一个命令直接启动一个包含yarn/mapreduce和hdfs的
hadoop集群
,避免了配置环境变量和配置文件。
流浪小肥羊
·
2020-06-25 08:03
hadoop
基于flume的日志收集系统配置
大数据系统中通常需要采集的日志有:系统访问日志用户点击日志其他业务日志(比如推荐系统的点击日志)在收集日志的时候,一般分为三层结构:采集层、汇总层和存储层,而不是直接从采集端将数据发送到存储端,这样的好处有:如果存储端如
Hadoop
张薄薄
·
2020-06-25 07:17
hadoop集群
配置flume
1.先从官网下载flume的jar包。我们下载最新的ApacheFlumebinary(tar.gz)1.8版本地址:http://www.apache.org/dyn/closer.lua/flume/1.8.0/apache-flume-1.8.0-bin.tar.gz2.之后再hadoop中解压tar-zxvfapache-flume-1.8.0-bin.tar.gz然后我们可以改变文件名,
System_FFF
·
2020-06-25 06:51
云计算/hadoop
Yarn的原理以及配置不同的资源分配策略
Yarn是一个分布式的资源管理系统,它是
hadoop集群
的资源管理系统,它使得各种类型的应用可以运行在hadoop上面,并通过Yarn从系统层面进行统一管理,使得各种应用共享集群资源它诞生的原因是原来的
前行中632
·
2020-06-25 06:38
面试
Hadoop资源调度框架YARN
本文概述:1、YARN概述2、YARN架构3、YARN执行流程4、YARN容错5、YARN环境搭建准备工作:之前博主有发过
Hadoop集群
环境的搭建以及分布式环境的搭建,可以参考任意博客http://blog.csdn.net
OnTheRoad_Kang
·
2020-06-25 06:43
Big
Data
Hadoop
Flume采集日志信息到HDFS中
1.
Hadoop集群
搭建的配置1.1搭建步骤如下链接:https://blog.csdn.net/qq_31987649/article/details/850378331.2启动hadoop只需要启动
一只小菜鸡
·
2020-06-25 05:24
flume
Time的hadoop学习笔记之--搭建有三台主机的
Hadoop集群
搭建有三台主机的
Hadoop集群
:原材料:笔记本、vm虚拟机、centOS镜像、CDH安装包1准备工作,主机及网络配置:安装好linux系统后,为演示方便,我们将三台主机分别命名为hadoop0、hadoop1
Time_Now
·
2020-06-25 05:17
Hadoop学习
hadoop框架之MapReduce介绍
MapReduce简单介绍MapReduce是一个分布式的计算框架,核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算框架,并发运行在
hadoop集群
上。
Luffy_captain
·
2020-06-25 05:25
hadoop框架
实时数仓和离线数仓
数据日益增多部署
hadoop集群
采集录入数据构建数据仓库数据统一计算任务统一调度数据统一查询用户统一使用2.数仓和数据库的区别项目HiveRDBMS查询语言
大数据AI笔记
·
2020-06-25 04:58
大数据
上一页
59
60
61
62
63
64
65
66
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他