E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop2
Hive源码调试
文章目录1、概述2、安装
Hadoop2
.1下载及配置2.2配置环境变量2.3格式化namenode2.4启动hdoop3、编译Hive3.1编译3.2配置hive3.3初始化元数据库4、调试参考链接1、
0x3E6
·
2023-10-11 14:50
大数据
Hive
hadoop
hdfs
mapreduce
hive
大数据
Yarn
Yarn简介ApacheYARN(YetAnotherResourceNegotiator)是
hadoop2
.0引入的集群资源管理系统。
秦时明月_16b7
·
2023-10-11 01:27
Hadoop大数据综合案例1-
Hadoop2
.7.3伪分布式环境搭建
Hadoop大数据招聘网数据分析综合案例Hadoop大数据综合案例1-
Hadoop2
.7.3伪分布式环境搭建Hadoop大数据综合案例2-HttpClient与Python招聘网数据采集Hadoop大数据综合案例
CDHong.it
·
2023-10-11 00:26
Hadoop大数据
大数据
hadoop
linux
数据库
Hadoop2
.0探讨
文章目录8.Hadoop再探讨8.1Hadoop的优化与发展8.2HDFS的FA和Federation(
Hadoop2
.0新特性)8.2.1HDFSHA8.2.2HDFSFederation8.3YARN8.3.1MapReduce1.0
几窗花鸢
·
2023-10-10 23:16
大数据应用
hadoop
hadoop
大数据
Hudi第三章:集成Flink
:集成SparkHudi第二章:集成Spark(二)Hudi第三章:集成Flink文章目录系列文章目录前言一、环境准备1.上传并解压2.修改配置文件3.拷贝jar包4.启动sql-client1.启动
hadoop2
超哥--
·
2023-10-10 21:23
Hudi学习专栏
flink
大数据
CentOS 6.5 搭建Hadoop 2.5.2集群
记录在64位CentOS6.5环境下搭建
Hadoop2
.5.2集群的步骤,同时遇到问题的解决办法,这些记录都仅供参考!
weixin_33892359
·
2023-10-10 16:11
大数据
java
开发工具
hadoop2
.5.2 安装部署
0x00平台环境OS:CentOS-6.5-x86_64JDK:jdk-8u111-linux-x64Hadoop:hadoop-2.6.50x01操作系统基本设置1.1网络配置1.1.1修改主机名//查看当前主机名#hostname//修改当前主机名#vim/etc/sysconfig/networkNETWORKING是否利用网络GATEWAY默认网关IPGATEWAYDEV默认网关的接口名H
weixin_33772645
·
2023-10-10 16:40
大数据
运维
开发工具
Hadoop2
.5.2完全分布式搭建
该博客主要帮助实现Hadoop完全分布式环境的搭建:(已经安装好Ubuntu前提下,并且保证虚拟机可以相互ping同还有上网情况下)事先准备:jdk-7u51-linux-x64.tarhadoop-2.5.2第一大步骤:1创建root密码:sudopasswdroot2新增一个用户:sudoadduserhadoop3切换到rootsuroot执行给sudoers增加写权限:chmodu+w/e
原来简单
·
2023-10-10 16:39
hadoop
Hadoop
完全分布环境搭建
ubuntu
大数据
hadoop2
.5.2伪分布式搭建
1.准备Linux环境1.0点击VMware快捷方式,右键打开文件所在位置->双击vmnetcfg.exe->VMnet1host-only->修改subnetip设置网段:192.168.8.0子网掩码:255.255.255.0->apply->ok回到windows-->打开网络和共享中心->更改适配器设置->右键VMnet1->属性->双击IPv4->设置windows的IP:192.16
持之以恒_fighting
·
2023-10-10 16:32
大数据
搭建
Hadoop2
.5.2环境
教程:http://blog.csdn.net/l1028386804/article/details/51536051部署期间遇到最主要的一个问题:hdfs-site.xml这个文件,不论怎么改都不生效。现象是:执行hadoopnamenode-format时,namenode的存放位置,是hadoop的默认路径;然后执行hadoopdfsadmin-report,提示java.net.Conn
licongdong
·
2023-10-10 16:01
Nutch2.3.1
hadoop
centos
namenode
Hadoop2
.5.2 安装部署
0x00平台环境OS:CentOS-6.5-x86_64JDK:jdk-8u111-linux-x64Hadoop:hadoop-2.5.20x01操作系统基本设置1.1网络配置修改主机名//查看当前主机名#hostname//修改当前主机名vim/etc/sysconfig/networkNETWORKING是否利用网络GATEWAY默认网关IPGATEWAYDEV默认网关的接口名HOSTNAM
dengyu9760
·
2023-10-10 16:01
大数据
运维
开发工具
Hadoop2
.5.2+Zookeeper3.4.6 + HBase0.98.8-
hadoop2
环境搭建
Hadoop集群Zookeeper集群1配置11zoocfg12分发到集群的其它机器13设置myid身份唯一标识14一些配置参数的解释2启动关闭3启动日志分析4测试验证5注意事项Hbase集群1配置11配置hbase-envsh12hbase-sitexml13regionservers14一些配置参数的解释15Hbase分发到集群的其它机器2启动关闭3测试4注意事项5遇到的问题1.Hadoop集
码上笔记
·
2023-10-10 16:30
hbase
hadoop
hbase
zookeeper
hadoop学习笔记-搭建环境
跌跌撞撞的几天,终于完成了一个初步的hadoop的安装及测试,具体如下:动力:工作中遇到的数据量太大,服务器已经很吃力,sql语句运行老半天,故想用大数据技术来改善一下环境:centos5.11+jdk1.7+
hadoop2
.5.21
励志重写JDK
·
2023-10-10 16:30
redis
hadoop
MacBook Pro18 安装
hadoop2
.7.7版本和eclipse插件安装
1.安装工具
Hadoop2
.7.7。eclipse-Mac版2.在home下设置java和hadoop的环境路径即进入~/.bash_p
秃顶高富帅
·
2023-10-09 22:19
hadoop安装
Mac
Hadoop
eclipse插件安装
hadoop环境搭建———Hadoop安装教程_伪分布式配置_CentOS6.4/
Hadoop2
.6.0【转载搬运】
最近开始学习大数据,想自己在虚拟机上搭建个伪分布,在网上也找了很多教程,踩了很多坑,最后发现了厦门大学大数据实验室林子雨老师的这个教程,按着步骤终于成功搭建,所以想分享一下,大家可以少踩一些坑,还有就是林子雨老师在慕课上的课程也都很有趣,在这里我也推荐有兴趣的可以去看看,以下均为转载内容,如有侵权,可以联系我删除。本Hadoop教程由厦门大学数据库实验室出品,转载请注明。本教程适合于在CentOS
JYeontu
·
2023-10-09 00:09
hadoop
伪分布
大数据
hadoop环境配置
hdfs
Hadoop(林子雨慕课课程)
文章目录2.
Hadoop2
.1Hadoop简介2.2Hadoop版本演变2.3Hadoop项目结构2.4Hadoop集群的部署和使用2.
Hadoop2
.1Hadoop简介Hadoop可以支持多种编程语言
几窗花鸢
·
2023-10-09 00:05
大数据应用
hadoop
hadoop
大数据
分布式
Spark完全分布式集群搭建
用户搭建集群(生产环境中root用户不是可以任意使用的)spark安装包下载地址:https://mirrors.aliyun.com/apache/spark/我用的spark-2.2.0-bin-
hadoop2
.7
piziyang12138
·
2023-10-08 20:20
Hadoop2
.x安全:hadoop集群之kerberos认证(一、原理+安装配置)
微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读一、为什么启用Kerberos安全认证大家都知道,Hadoop1.0.0或者CDH3版本以前,并没有安全认证的概念,用户与HDFS文件系统或者提交分布式任务(Mapreduce、Spark)都是不需
大数据开发运维架构
·
2023-10-08 15:16
Hadoop ----HDFS MapReduce
操作日志文件fsimage元数据文件SecondaryNameNode获取NameNode的数据延后将新的NameNode数据进行合并然后再次写入NameNode中DataNode负责数据的存储数据是按块存储的
hadoop2
烟解愁、酒上头
·
2023-10-08 07:55
hadoop
分布式
离线数仓
hadoop
mapreduce
hdfs
分布式
Hadoop之hdfs简介
Hadoop的hdfs简介
hadoop2
x三大核心:hdfs、yarn、mapreduce.hadoop四大模块:HadoopCommon:为其他Hadoop模块提供基础设施。
墙角的枫叶
·
2023-10-08 07:53
hadoop学习笔记
hdfs简介
HDFS搭建及使用一《基础设施》
HDFS搭建及使用一《基础设施》环境:CentOS7Xjdk1.8
Hadoop2
.6.5第一部分:基础设施基础设施是架构搭建的基础,很多中间件架构都有着类似的操作,所以这些也很重要。
程崇越
·
2023-10-05 05:42
大数据
hdfs
hadoop
big
data
大数据面试题
第1章核心技术1.1Linux&Shell1.1.1Shell常用工具及写过的脚本1)awk、sed、cut、sort1.2Hadoop1.2.1Hadoop常用端口号
hadoop2
.xhadoop3.
_画一方禁地
·
2023-10-04 20:48
hadoop
hive
Hadoop2
复安装过程详细步骤
1、在vmware中更改了虚拟机的网络类型,--->NAT方式,(虚拟交换机的ip可以从vmvare的edit-->vertualnetworkeditor看到)2、根据这个交换机(网关)的地址,来设置我们的客户端windows7的ip(Vmnet8这块网卡)3、启动linux主机,修改linux系统的ip地址(通过图形界面修改),修改完成之后在terminal(命令行终端)中切换到root用户执
小小哭包
·
2023-10-04 08:55
大数据
开发技巧经验分享
Linux
hadoop
大数据
分布式
hadoop 小文件处理方案
hadoophdfs被设计用作海量数据存储,适合存储大文件,文件在hdfs中是以block的形式存储的,在hadoop1.x中,hdfsblock的默认大小为64m,而在
hadoop2
.x中,block
Ivan_030c
·
2023-10-03 23:49
hadoop2
.4.1伪分布式搭建
1.准备Linux环境1.0点击VMware快捷方式,右键打开文件所在位置->双击vmnetcfg.exe->VMnet1host-only->修改subnetip设置网段:192.168.1.0子网掩码:255.255.255.0->apply->ok回到windows-->打开网络和共享中心->更改适配器设置->右键VMnet1->属性->双击IPv4->设置windows的IP:192.16
小小哭包
·
2023-10-03 12:30
大数据
Linux
开发技巧经验分享
分布式
大数据
Hadoop
Hadoop2
.x安全:Window下Kerberos客户端安装及浏览器配置
微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读Hadoop集群启用Kerberos认证后,我们平时需要在Window通过界面查看集群的一些webUI,通常需要安装一个Window的Kerberos客户端。1.Kerberos官网下载地址:htt
大数据开发运维架构
·
2023-10-02 16:05
mac docker部署hadoop集群
dockerdocker安装过程可自行查找资料,mac下docker可以使用brew命令安装安装之后,查看docker版本,确认安装成功docker-v2.下载jdk最好下载jdk-8,jdk的版本过高可能
hadoop2
几窗花鸢
·
2023-09-29 12:20
hadoop
macos
docker
hadoop
历史服务器
二、配置历史服务器在spark-3.1.1-bin-
hadoop2
.7/conf/spark-defaults.conf添加以下配置,其中d:/log/spark为日志保存位置spark.eventLog.enabledtruespark.eventLog.dirfile
qq_40135006
·
2023-09-29 06:14
服务器
spark
在虚拟机中搭建高可用集群,超详解,保姆级教学
/
hadoop2
60/etc/hadoop开始配置xml和jdk环境变量首先修改下面三个里面的Java变量[root@gree
大数据与云计算开发者Cd
·
2023-09-28 17:33
zookeeper
分布式
云原生
云计算 第五章 Hadoop 2.0 主流开源云架构
文章目录5.1引例5.1.1问题概述5.1.2常规解决方案5.1.3分布式下的解决方案1.分布式存储冗余存储与冗余计算5.1.4小结img5.2
Hadoop2
.0简述5.2.1
Hadoop2
.0由来5.2.2
Hadoop2
.0
是我,Zack
·
2023-09-27 07:23
#
Hadoop
#
云计算
hadoop
分布式
大数据
hdfs
yarn
Hadoop期末试题复习题
A、Hadoop3.xB、
Hadoop2
.xC、Hadoop4.xD、Hadoop1.x正确答案:A大数据的4V特征是指?
-Kcaco
·
2023-09-27 07:20
hadoop
hdfs
big
data
【大数据存储与处理】1. hadoop单机伪分布安装和集群安装
0.写在前面0.1软件版本
hadoop2
.10.2ubuntu20.04openjdk-8-jdk0.2hadoop介绍Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
唐生一
·
2023-09-27 02:59
大数据存储与处理
大数据
hadoop
分布式
hadoop安装
Cloudera Hadoop 分层存储实战
HDFS分层存储why为何要使用分层存储(充分利用资源,降低成本)http://developer.51cto.com/art/201504/470660.htmHDFS从
Hadoop2
.3开始支持分层存储
shaopi0211
·
2023-09-27 01:25
Python大数据之PySpark(一)SparkBase
LocalSparkBase环境基础Spark学习方法:不断重复,28原则(使用80%时间完成20%重要内容)Spark框架概述Spark风雨十年s2012年Hadoop1.x出现,里程碑意义2013年
Hadoop2
Maynor996
·
2023-09-26 14:42
#
PySpark
python大数据
python
大数据
ajax
Hadoop集群大数据解决方案之搭建Hadoop3.X+HA模式
why
hadoop2
.X?IBM上有篇论文讲的够详细了:文章链接。
脆弱的天炎
·
2023-09-26 01:02
大数据开发轻量级入门方案
那个时候大部分企业用的还是1.X版本的hadoop,正逐渐的升级到
hadoop2
.X。当时可以很容易的转型,一大部分原因是大数据的技术还没有普及,需要学的框
小萝卜算子
·
2023-09-25 14:36
数据仓库
大数据
hadoop
java
Hadoop 2.6.0的Web UI无法看到应用执行的历史信息
环境
Hadoop2
.6.0Java1.8.0_151Ubuntu16.04解决方案开始在配置Hadoop时,由于是按照官网配置的非常简洁版的伪分布式版本,缺少了某些选项,才会造成这个问题。
AlstonWilliams
·
2023-09-25 12:35
Linux每次登录用户会提示未找到的命令
[root@
hadoop2
03~]#su-hadoopLastlogin:ThuDec3014:15:12CST2021onpts/0-bash:hadoop:commandnotfound登录hadoop
万事于足下
·
2023-09-23 18:40
Linux
CentOS
一些错误
linux
bash
hadoop
hive连接Presto
配置HiveConnectoretc/catalog/hive.propertiesconnector.name=hive-
hadoop2
hive.metastore.uri=thrift://:9083hive.config.resources
大数据开发工程师-宋权
·
2023-09-21 09:52
presto
hive
数据库
hadoop
【Linux基础】第29讲 Linux用户和用户组权限控制命令(一)
1useradd添加新用户(注意:当前用户必须有添加用户的权限)1)基本语法useradd用户名(功能描述:添加新用户)2)案例root@sue-virtual-machine:/usr/local#useradd
hadoop2
passwd
月光水岸New
·
2023-09-21 08:25
Linux
linux
服务器
sqoop1.4.7和hadoop的兼容性,sqoop的安装和使用
sqoop1.4.7兼容
hadoop2
.6以上所有版本1下载并解压1)下载地址:http://mirrors.hust.edu.cn/apache/sqoop2)上传安装包sqoop-1.4.7.bin
Cynicism_Kevin
·
2023-09-21 05:43
hadoop
sqoop
Windows下Pycharm的Spark、Hadoop、Scala安装及常见报错(graphframes避坑、jupyter的文件位置更换、conda环境建立)
sbt包安装1、安装py4j2、安装pyspark接下来是新建python项目1、项目配置2、使用graphframes库项目环境jdk1.8.0_333python3.7.13scala2.11.8
hadoop2
.7.1spark2.4.3
soberld
·
2023-09-21 02:21
pycharm
spark
hadoop
Mac pycharm 导入pyspark
转载于:点击打开链接1前提:已经安装了pycharm,下载了spark(官网下载,我下的是spark-2.1.1-bin-
hadoop2
.7.tgz,解压缩后为文件夹spark-2.1.1-bin-
hadoop2
.7
大师兄你家猴跑啦
·
2023-09-21 02:51
spark
linux
python
Hadoop的YARN高可用
一、YARN简介
Hadoop2
.0即第二代Hadoop,由分布式存储系统HDFS、并行计算框架MapReduce和分布式资源管理系统YARN三个系统组成,其中YARN是一个资源管理系统,负责集群资源管理和调度
万里长江横渡
·
2023-09-19 20:23
hadoop
大数据
分布式
Hadoop2
.0 HDFS高可用架构
上图是一个典型的HA集群,NameNode会被配置在两台独立的机器上,在任何时间上,一个NameNode处于活动状态,而另一个NameNode处于备份状态,活动状态的NameNode会响应集群中所有的客户端,备份状态的NameNode只是作为一个副本,保证在必要的时候提供一个快速的转移。为了让StandbyNode与ActiveNode保持同步,这两个Node都与一组称为JNS的互相独立的进程保持
truezqx
·
2023-09-19 09:35
大数据学习1.4-xShell配置Hadoop
1.创建hadoop目录mkdir/usr/local/
hadoop2
.切换到hadoop中cd/usr/local/hadoop/3.将hadoop直接拖到xShell中4.解压hadooptar-zxvfhadoop
汉卿HanQ
·
2023-09-19 09:09
信息安全
大数据
学习
hadoop
Hive工作原理
.Driver组件:该组件包括:Compiler、Optimizer、Executor,它可以将Hive的编译、解析、优化转化为MapReduce任务提交给Hadoop1中的JobTracker或者是
Hadoop2
丢雷劳谋
·
2023-09-19 07:57
大数据
hive
hadoop
数据仓库
macOS Big Sur系统基于docker部署Hadoop集群
博主部署环境的时候,本地系统环境版本为:macOSBigSur11.3.11.集群环境要求类别版本OScentos7jdkjdk1.8hadoop
Hadoop2
.9.22.集群规划集群服务器名称IP集群规划
回笼觉觉猪
·
2023-09-19 05:48
HBase1.1.2编译
说明:1.HBase1.1.2社区版基于
Hadoop2
.6.0-cdh5.4.5编译、打包(不要问我为什么这么怪,一两句说不清,其他版修改为对应的version即可)操作步骤:一、源码下载http://
数大招疯
·
2023-09-19 04:16
hadoop
HBase
编译
打包
hbase1.0
HBase(hbase-0.96.2) 安装
明天要讲HBase课程,由于以前使用的是0.92的版本,所以在此记录下新版本的安装步骤(基于hadoop-2.2.0安装,
hadoop2
.2安装有空补上)。
数大招疯
·
2023-09-19 04:16
hadoop
HBase
0.96.2
安装
配置
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他