E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop2
hadoop2
.x之IO:MapReduce压缩
前面我们说到了hadoop的压缩,在Hadoop所运行的数据一般都是很大的,输入的数据很大,输出的数据也很大。因此我们有必要对map和Reduce的数据进行压缩存储。如果我们想对Reduce进行压缩,有两种方法,一种是配置使用Configuration配置。另一种是还是用FileOutputFormat类对输出进行设置。1.对Reduce进行压缩(使用Configuration)使用Configu
erygreat
·
2020-08-08 10:35
hadoop
hadoop2
.x之IO:压缩和解压缩
文件压缩可以降低存储需要的空间,并且在传输过程中加快传输速度。因此对于大量数据的处理时,压缩是十分重要的。我们考虑一下Hadoop在文件中的压缩用法。有许多压缩方式,如下:压缩格式工具算法文件拓展名是否可切分DEFLATE无DEFLATE.deflate否GzipgzipDEFLATE.gz否bzip2bzip2bzip2bz2是LZOlzopLZO.lzo否LZ4无LZ4.lz4否Snappy无
erygreat
·
2020-08-08 10:34
hadoop
Hadoop2
.9.1 安装配置,并在 Idea 中运行自带的 WordCount 示例
一、Linux基础配置1、创建Hadoop用户如果Linux系统安装的时候不是hadoop用户,那么你最好需要创建一个hadoop用户,密码设置为hadoop(密码可以随意指定),使用下面命令创建新用户。创建hadoop用户的时候使用的是root用户,没有其他说明本文中的所有命令都是在root用户下完成的,如果你的登录用户不是root,那么执行本文中的一些命令需要在命令之前增加sudo才可以正确执
Bin594505536
·
2020-08-08 10:47
hadoop单机版
Hadoop
WordCount
远程示例
【解决办法】
Hadoop2
.6.4 datanode 无法启动,错误:All specified directories are failed to load.
在部署
hadoop2
.6.4集群的时候碰到下面的错误FATALorg.apache.hadoop.hdfs.server.datanode.DataNode:InitializationfailedforBlockpool
超丨哥
·
2020-08-08 02:18
大数据
hadoop
datanode
无法启动
hadoop
集群
initialization
大数据平台Ambari2.7.4+HDP3.1.4安装
Linux准备机器1Ambari172.16.21.43机器2Hadoop1172.16.21.40机器3
Hadoop2
172.16.21.41机器4Hadoop3172.16.21.42需要实现SSH
Venom码哥
·
2020-08-08 01:11
大数据开发
centos
大数据
hadoop
ambari
hdp
window上连接集群跑hadoop问题之java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows.
环境:window764位集群
hadoop2
.6.0,ubuntuwindow上连接集群跑hadoop问题之java.lang.UnsatisfiedLinkError:org.apache.hadoop.io.nativeio
KeepLearningBigData
·
2020-08-08 01:39
hadoop
Ubuntu搭建Hadoop集群的详细操作流程
虚拟机安装程没安装Ubuntu的可参考:Ubuntu的安装教程Haddop的下载可以到https://mirrors.cnnic.cn/apache/hadoop/common/这个网址下载,下载的时候版本是选择
Hadoop2
小嗯子
·
2020-08-07 21:52
hadoop
Ubuntu
hbase与zookeeper完全分布式集群搭建
hbase与zookeeper完全分布式集群搭建auth:hahallytime:2019.11.29版本:ubuntu18
hadoop2
.9.2jdk1.8hbase前提:hadoop集群已经搭建成功配置说明参考
Theoyah
·
2020-08-07 17:20
分布式文件系统
hadoop环境配置出现的问题
导致这种原因是由于你配置Java环境设时,路径含有空格
Hadoop2
.7.1Subversionhttps://git-wip-us.apach
侠客刀
·
2020-08-07 16:43
hadoop
CentOS安装Hadoop、hbase单机版
一、首先安装JDK并设置环境变量二、安装
hadoop2
.9.22.1下载
hadoop2
.9.2地址http://mirrors.hust.edu.cn/apache/hadoop/common/放到/usr
happyzwh
·
2020-08-07 10:49
Hadoop2
.7.4分布式集群安装配置文件
master192.168.1.15slave01192.168.1.16slave02192.168.1.17服务器上安装hadoop的目录结构为/home/用户名/hadoopsoftware:存放的是安装的软件包app:存放的是所有软件的安装目录
hadoop2
.7.4
NULL
·
2020-08-07 07:12
java
hadoop
Hadoop2
.7.7 API: hadoop-env.sh 解析
namedescriptiondefaultvalueexportJAVA_HOME=/home/hadoop/software/jdk1.8.0_171设置JAVAHOMEexportHADOOP_HOME_WARN_SUPPRESS=1压制警告1exportHADOOP_HOME=${HADOOP_HOME:-/usr/hdp/2.6.5.0-292/hadoop}设置HADOOP_HOME目
张伯毅
·
2020-08-06 13:36
Hadoop官方API
工具
API
速查
Hadoop安装教程_单机/伪分布式配置_
Hadoop2
.6.0/Ubuntu14.04
本教程适合于原生
Hadoop2
,包括
Hadoop2
.6.0,
东方无赖
·
2020-08-06 13:25
java
hadoop
Eclipse搭建hadoop开发环境[hadoop-eclipse-plugin-2.5.2]
开发环境:系统:window7IDE:EclipseJavaEEIDEforWebDevelopers【Version:JunoServiceRelease2】Hadoop版本:
hadoop2
.5.2准备工作下载
antgan
·
2020-08-06 12:55
大数据分析
大数据环境单点安装(hadoop,hbase,zookeeper,phoenix,spark)
linux-x64apache-phoenix-5.0.0-HBase-2.0-binapache-zookeeper-3.5.5-binhadoop-3.1.2hbase-2.0.5spark-2.3.3-bin-
hadoop2
.72
Sword1996
·
2020-08-06 12:32
大数据
如何解决Hadoop Connection Refused和FileNotFoundException问题
本例子中使用的
Hadoop2
.7.3版本。URLCat实例下面的例子是使用URLStreamHandler将Hadoop文件系统中的文件输出的标准输出中。//ccURLCatDisplaysfil
Bob Liu
·
2020-08-06 11:00
Hadoop
Hadoop
Connection
Refused
hadoop-2.5.0-cdh5.3.0 HA在线升级
本文升级到
hadoop2
.61、hadoop升级前准备,namenode元数据和配置备份等信息参考上篇文章:http://blog.csdn.net/linux_ja/article/details/519084662
谷雨hadoop
·
2020-08-06 11:18
hadoop
Hadoop 2.6.0升级至Hadoop 3.2.1及回滚
2、问题
Hadoop2
.6.0升级至3.2.1步骤停掉集群,替换安装包:1.启动journalnode集群.
Deegue
·
2020-08-06 11:45
hadoop
hadoop
游戏行业最全大数据知识点分析和企业级架构设计分享
文章目录游戏行业最全大数据知识点分析和企业级架构设计分享1数据分析流程以及分析指标1.1数据来源1.2数据收集和落地1.3离线分析1.4实时数据分析1.5用户肖像2相关知识2.1离线数据统计技能相关要求2.1.1
Hadoop2
.1.2Hive2.1.3HBase2.1.4SparkCore2.1.5SparkSQL2.2
开封程序员阿强
·
2020-08-06 09:27
大数据系列学习笔记
Spark学习总结——Yarn和Standalone提交任务方式、资源调度和任务调度流程
/lib/spark-examples-1.6.0-
hadoop2
.6.0.jar100或者./spark-submit--masterya
System_FFF
·
2020-08-05 17:44
大数据进阶之路
Hadoop里的设计模式之单例模式
我们以
Hadoop2
.7版本中的ShutdownHookManager举例讲解单例模式的几个需要注意的地方:1)将构造方法私有化。
wisgood
·
2020-08-05 17:13
MapReduce
MapReduce计数实例
MapReduce计数本实例是基于
Hadoop2
.8.5的伪分布式平台。如果j
神奇的DW
·
2020-08-05 04:01
大数据
安装hadoop3问题及解决
Hadoop2
.6.0/Ubuntu14.04安装教程_单机/伪分布式配置一、bin/hdfsnamenode-format没有出现如下内容其他教程一般会说格式化namenode需要有"Exitingwithstatus0
xssl_csdn
·
2020-08-05 03:12
hadoop
sudo vi ~/etc/profile 报错E212:Can't open file for writing
linux系统,安装SPARK时,命令行窗口输入:sudovi~/etc/profile输入:#SPARK_HOMESPARK_HOME=/home/luoji/JAVA/spark-2.3.1-bin-
hadoop2
.7PATH
罗辑_CSDC
·
2020-08-05 03:20
SPARK学习
hadoop2
.0以后不需要借助cywin运行在Windows上
Hadoop2
.0及以后的版本可以直接在windows上跑,不用cygwin了,凡是讲cygwin的攻略都可以忽略.去官网下载hadoop,其实都是tar.gzlinux版本,所以我们单独下载window
lxlmycsdnfree
·
2020-08-05 01:52
分布式集群服务与工具和方案
apache-hive-1.2.1和hbase-1.2.2的整合(伪分布式)
我的机器环境:
hadoop2
.6.0的伪分布式Hbase伪分布式环境参考:hbase权威指南P2401.启动hadoop和hbase2.下载apache-hive-1.2.13.修改hive中conf下的
kenneth
·
2020-08-05 00:51
单节点安装spark
版本:系统版本:ubuntu1804jdk:openjdk11.0.7spark-3.0.0-bin-
hadoop2
.7.tgz步骤:1的下载安装包:wgethttps://mirrors.tuna.tsinghua.edu.cn
一个程序员...
·
2020-08-05 00:03
spark
Pig 常用操作
所有命令和脚本都在Pig0.12.0&
Hadoop2
.2.0下测试通过。准备两个数据文件:1)student.txt结构为(班级号,学号,成绩),字段间逗号分隔。
serven-star
·
2020-08-04 23:03
Pig
Hadoop2
.7.1 eclipse plugin Install
在eclipse中安装Hadoop插件用了很长时间,所以仅以此文来纪念那些被浪费的时间....此文默认
Hadoop2
.7.1已安装成功。
Joker-C
·
2020-08-04 22:44
大数据资源共享网盘下载
网盘下载地址:下载地址下载地址点击下载概述参与方式hadoop安装
hadoop2
.6.0集群安装管理工具top-10-hadoop-cluster-management-tools插件HDFS图形化管理工具
weixin_44304265
·
2020-08-04 21:29
hadoop2
.9全分布式安装
一.环境说明安装介质:virtualboxcentos6.8网络模式NAT+host-only(双网卡模式公司内网无法使用简单的桥连接—因为ip自动获取会被占用)三台虚拟机hostip节点h1192.168.56.11namenoderesourcemanagersecondarynamenodeh2192.168.56.12datanodenodemanagerh3192.168.56.13da
qq893555741
·
2020-08-04 16:35
java
使用Python 递归合并不同目录下小文件
#背景项目中,由网络爬虫爬取的日志文件,需要导入到hive数据仓库中,但日志文件包含很多的小文件(指代文件大小远小于HDFS块大小的文件,
hadoop2
.x之后,HDFS块大小默认未128M,那么1M,
江畔独步
·
2020-08-04 15:03
Python
安装使用Drill-1.10
准备材料:jdk-8u121-linux-x64.rpm(运行Drill1.6及其后续版本需要jdk7或8)apache-drill-1.10.0.tar.gzzookeeper-3.4.6
hadoop2
江畔独步
·
2020-08-04 11:33
bigdata
使用Eclipse编译运行MapReduce程序
Hadoop2
.6.0_Ubuntu/CentOS
本教程介绍的是如何在Ubuntu/CentOS中使用Eclipse来开发MapReduce程序,在
Hadoop2
.6.0下验证通过。
xiaoyatouxihuanchen
·
2020-08-04 08:37
Eclipse
解决HBase分布式集群中zookeeper无法正常启动的问题
Hadoop集群用到的工具版本号节点名称
hadoop2
.7.1Masterhbase1.4.7Slave1zookeeper3.4.10Slave2Zookeeper下载:Apache官网上自行下载合适版本
Runningluffy
·
2020-08-04 06:37
技术小白GO
Hadoop 综合揭秘——MapReduce 基础编程(介绍 Combine、Partitioner、WritableComparable、WritableComparator 使用方式)...
请确保源代码运行在
Hadoop2
.x以上版本,并以伪分布形式安装以方便进行调
weixin_34111819
·
2020-08-04 05:19
Hadoop2
.7.3下Hive 与MySQL
Hadoop2
.7.3下Hive与MySQLHadoop安装环境参考:Hadoop安装如果ubuntu安装软件,一直安装不上,参考:Storm下面有sourcelist第一步:安装Hive1.先安装mySql
wangxiaoming
·
2020-08-04 03:52
Hadoop2
.8.5的HDFS的高可用集群搭建(HDFS HA)
Zookeeper实现故障转移HDFSHA集群角色的分配(在搭建好的集群的基础上进行修改相应的配置文件)节点角色centoshadoop1NameNodeDataNodeJournalNodezkfccentos
hadoop2
NameNodeDataNodeJournalNodezkfccentoshadoop3DataNodeJournalNodecentoshadoop4DataN
蜗牛杨哥
·
2020-08-04 03:47
大数据架构
HDFS高可用集群搭建HA
spark Shell启动的时候报错:ERROR spark.SparkContext: Error initializing SparkContext.ConnectException
sparkShell启动的时候报错:ERRORspark.SparkContext:ErrorinitializingSparkContext.ConnectException:CallFrom
hadoop2
02
技术探求
·
2020-08-04 02:43
Hadoop
ubuntu下搭建
hadoop2
.7.4+sqoop
主要参考视频:https://edu.hellobi.com/course/93/lessons1、安装虚拟机这里直接用的阿里云主机,因为搭建虚拟机各种奇怪的问题。。2、远程连接其实这个步骤也是可以省略的,不过用Xshell5和Xftp5可以复制粘贴以及传文件都很方便3、在linux下搭建hadoop(目前只是打了伪分布)下载软件:1、jdk:http://www.oracle.com/techn
hqwuu
·
2020-08-04 02:11
hadoop
HBase安装教程
部署软件版本号如下所示:软件名称版本号
Hadoop2
.9.2HBase2.2.3Zookeeper3.5.5安装步骤第一步:下载安装包hbase-2.2.3-bin.tar.gz
twypx
·
2020-08-04 01:38
BigData
hadoop2
.2.0遇到64位操作系统平台报错,重新编译hadoop
说明:经过实测,
hadoop2
.6.0在OracleLinux
bamuta
·
2020-08-04 01:53
cmake
protobuf
maven
Hadoop
hadoop2
.2.0遇到NativeLibraries错误的解决过程
问题描述在安装好hadoop进行测试学习时,遇到下面的问题。hadoop为2.2.0,操作系统为oraclelinux6.364位。[hadoop@hadoop01input]$hadoopdfs-put./inDEPRECATED:Useofthisscripttoexecutehdfscommandisdeprecated.Insteadusethehdfscommandforit.13/10
bamuta
·
2020-08-04 01:53
Hadoop
用java编写spark程序,简单示例及运行
我的环境:
hadoop2
.2.0spark-0.9.0scala-2.10.3jdk1.7[java]viewplaincopyprint?
_从头再来_
·
2020-08-04 00:41
大数据
搭建
Hadoop2
.7.3+Hive2.1.1及MySQL(配置Hive+Hadoop)(二)
续上一篇:搭建
Hadoop2
.7.3+Hive2.1.1及MySQL(配置Hadoop)(一)1、创建文件夹1.1、在hive文件下创建文件夹[root@localhosthive]#cd/usr/hive
中国风
·
2020-08-04 00:11
大数据应用
spark安装出现的问题
PSC:\BigData\spark-2.4.3-bin-
hadoop2
.7\bin>pysparkPython3.7.3(default,Mar272019,17:13:21)[MSCv.191564bit
cba2019
·
2020-08-03 23:26
HA-高可用的HDFS搭建(hdfs+zookeeper)(一)
为了解决这个问题在
Hadoop2
.x中借助于中间特定的中间渠道解决单点故障点问题,官方文档中提供两种解决方法:NFS和QJMNFS:采用的是网络共享文件模式QJM:QuorumJournalManager
勇敢先生
·
2020-08-03 22:52
Hadoop
大数据
实战-Spark单机环境安装教程
spark2.4.5为例演示,最后启动的是cdh安装的spark2.4.0.下载http://spark.apache.org/downloads.html解压tar-zxvfspark-2.4.5-bin-
hadoop2
.7
再难也要坚持
·
2020-08-03 22:08
Spark
搭建
Hadoop2
.6.4集群 Zookeeper版
集群搭建Files:hadoop集群搭建Tags:Mar10,20191.搭建前提centOS6.7集群hadoop1192.168.111.133
hadoop2
192.168.111.134hadoop3192.168.111.135
糟得很
·
2020-08-03 21:54
hadoop
hadoop学习之HIVE(3):
hadoop2
.7.2下安装hive2.1.0并关联mysql数据库
前提是安装好
hadoop2
.7.2,再往下继续。1,首先安装mysql数据库:详见本人博客:点我进入博客root密码,设为123456,下面会用到。然后通过mysql–uroot–p登陆。
name_s_Jimmy
·
2020-08-03 21:46
hadoop
hive
上一页
31
32
33
34
35
36
37
38
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他