E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
研磨hadoop
Spark SQL访问Hive表数据
前提:Hive的元数据保存在MySQL中Hive配置文件hive-site.xml内容如下:javax.jdo.option.ConnectionURLjdbc:mysql://
hadoop
000:3306
温文尔雅的流氓
·
2023-10-17 10:24
Spark
Spark
SQL
linux使用:配置SSH免密码登陆
另外在
hadoop
的使用中也会使用ssh命令去连接其它的主机。我们可以设置SSH免密码登陆来实现其他主机登录该主机是不用输入密码。现在我们有两台测试的linux的虚拟机,我们称之为主机1和主机2。
erygreat
·
2023-10-17 09:59
linux
2019-08-28
:在针对性强方面:更适合中国饮食的垃圾处理器更适合中国下水道的垃圾处理器更适合中国食材的垃圾处理器更适合中国人习惯的垃圾处理器更适合中国餐桌的垃圾处理器液体离心涡旋技术:是国内唯一可以将高纤维食物垃圾
研磨
成水状的垃圾处理器
研磨
系统
自诩顽石奈何草木
·
2023-10-17 08:56
Hive Standalone Metastore Docker 镜像构建
一、环境组件版本ApacheHive3.1.3PostgresJDBC42.3.6Apache
Hadoop
3.3.2ApacheIceberg0.14.0Java1.8.0_111Apachemaven3.8.6
独行者也
·
2023-10-17 07:54
云原生数据湖
hive
docker
大数据
Hadoop
-总览
Hadoop
一、什么是
hadoop
1.什么是
hadoop
2.
hadoop
产生背景3.生态圈4.集群搭建:二、常见命令三、HDFS3.1HDFS构成3.2概述3.3NameNode工作机制3.3.1职责:
吃再多糖也不长胖
·
2023-10-17 05:39
hadoop问题
hdfs
hadoop
2018-07-13 hbase
hive与hbase如果hive相当与hadop中的传统关系数据数据库,那么hbase就是
hadoop
中的nosql,非关系型数据库安装环境
hadoop
,zookeeper1.解压hbase2.编辑hbase_env.sh
江江江123
·
2023-10-17 04:32
Hadoop
3教程(十六):MapReduce中的OutputFormat
文章目录(105)OutputFormat概述(106)自定义OutputFormat案例需求分析(107/108)自定义OutputFormat案例实现自定义Mapper自定义Reducer自定义OutputFormatDriver参考文献(105)OutputFormat概述我们之前讲过了Map阶段的InputFormat,对应的,Reduce阶段也有自己的OutputFormat。Reduc
经年藏殊
·
2023-10-17 03:51
大数据技术
mapreduce
大数据
hadoop
Hadoop
3教程(十七):MapReduce之ReduceJoin案例分析
文章目录(113)ReduceJoin案例需求分析(114)ReduceJoin案例代码实操-TableBean(115)ReduceJoin案例代码实操-TableMapper(116)ReduceJoin案例代码实操-Reducer及Driver参考文献(113)ReduceJoin案例需求分析现在有两个文件:orders.txt,存放的是订单ID、产品ID、产品数量pd.txt,这是一个产品
经年藏殊
·
2023-10-17 03:51
大数据技术
mapreduce
大数据
hadoop
Hadoop
3教程(十四):MapReduce中的排序
文章目录(99)WritableComparable排序什么是排序什么时候需要排序排序有哪些分类如何实现自定义排序(100)全排序案例案例需求思路分析实际代码(101)二次排序案例(102)区内排序案例参考文献(99)WritableComparable排序什么是排序排序是MR中最重要的操作之一,也是面试中可能被问到的重点。MapTask和ReduceTask中都会对数据按照KEY来排序,主要是为
经年藏殊
·
2023-10-17 03:50
大数据技术
mapreduce
大数据
hadoop
Hadoop
3教程(十五):MapReduce中的Combiner
文章目录(103)Combiner概述什么是CombinerCombiner有什么用处Combiner有什么特点如何自定义Combiner(104)Combiner合并案例实操如何从日志里查看Combiner如果不存在Reduce阶段,会发生什么自定义Combiner的两种方式参考文献(103)Combiner概述什么是CombinerCombiner(即合并)是MR里shuffle的一项可选流程
经年藏殊
·
2023-10-17 03:45
大数据技术
mapreduce
数据库
hadoop
linux系统怎么设置静态ip
这里以
hadoop
01节点为例,首先在控制台输入命令vi/etc/sysconfig/network-scripts/ifcfg-eth0打开配置文件,然后修改
hadoop
01节点的网卡信息,具体配置如图
猫狗熊蛇
·
2023-10-17 01:14
Hadoop
linux
tcp/ip
网络
Mac os 安装hive3.1.2及报错解决方案
一、各版本号macos:10.14
Hadoop
:3.2.1Hive:3.1.2mysql:8.0.18二、安装前准备(1)
hadoop
和hive都是用brewinstall
hadoop
,brewinstallhive
luogps9
·
2023-10-16 23:02
搭建Atlas2.2.0 集成CDH6.3.2 生产环境+kerberos
首先确保环境的干净,如果之前有安装过清理掉相关残留确保安装atlas的服务器有足够的内存(至少16G),有必要的
hadoop
角色HDFS客户端—检索和更新
Hadoop
使用的用户组信息(UGI)中帐户成员资格的信息
Mumunu-
·
2023-10-16 21:49
大数据
atlas
大数据入门:
Hadoop
Yarn组件基础解析
在
Hadoop
框架当中,Yarn组件是在
Hadoop
2.0之后的版本开始引入,主要是为了解决资源管理和调度的相关问题,是在大数据平台的实际运用当中,根据实际需求而引入的解决方案。
成都加米谷大数据
·
2023-10-16 19:10
记
Hadoop
3.1.3安装排错之ERROR: but there is no YARN_RESOURCEMANAGER_USER defined. Aborting operation.
butthereisnoYARN_RESOURCEMANAGER_USERdefined.Abortingoperation.原因:没有配置好YARN_RESOURCEMANAGER_USER变量解决方案:vim$
HADOOP
_HOME
贞贞星球球王
·
2023-10-16 18:51
在shell中判断hdfs文件是否存在
Hadoop
内置提供了判断某个文件是否存在的命令:[
[email protected]
~]$
hadoop
fs-help......-test-[defsz]:A
尤小闹
·
2023-10-16 16:13
java spark 消费kafka_spark streaming消费kafka数据写入hdfs避免文件覆盖方案(java版)
对于写入hdfs中,如果是普通的rdd则API为saveAsTextFile(),如果是PairRDD则API为saveAs
Hadoop
File()。当然高版本的spar
吴羽舒
·
2023-10-16 11:40
java
spark
消费kafka
[OpenJDK:环境变量配置]:填充Profile并修改默认配置
文章目录一:背景:安装
hadoop
启动提示未找到JAVA_HOME1.1:配置
Hadoop
的Java环境变量二:排查-定位解决2.1:查看环境变量配置发现没有JAVA_HOME2.1.1:解决:查看java
凡解
·
2023-10-16 07:08
Java-后端
eclipse
java
ide
[BigData:
Hadoop
]:安装部署篇
文章目录一:机器103设置密钥对免密登录二:机器102设置密钥对免密登录三:机器103安装
Hadoop
安装包3.1:wget拉取安装
Hadoop
包3.2:解压移到指定目录3.2.1:解压移动路径异常信息
凡解
·
2023-10-16 07:37
大数据
hadoop
linux
java
Mapreduce运行异常Container exited with a non-zero exit code 1
文章目录
Hadoop
版本3.3.1问题描述解决方案
Hadoop
版本3.3.1问题描述用idea编写mapreduce读写hbase,并打包jar放到集群服务器上运行时出现下面错误:解决方案
hadoop
classpath
寅月十八
·
2023-10-16 07:50
mapreduce
hadoop
big
data
【大数据】 Hive安装 【学习笔记】
什么是HiveHive是一个数据仓库基础设施工具,用于处理
Hadoop
中的结构化数据。它位于
Hadoop
的顶部,用于汇总大数据
一个平凡de人
·
2023-10-16 06:31
大数据
hadoop
hive
大数据
Hive-SQL学习笔记
HIVE-SQLDDL(DataDefinationLanguage)DML(Datamanipulationlanguage)DQL(dataquerylanguage)Hive是基于
Hadoop
的一个数据仓库工具
Sais_Z
·
2023-10-16 06:00
数据库相关
大数据相关
hive
大数据
数据库
大数据--hive学习笔记
一、Hive简介建立在
Hadoop
之上的数据仓库架构hive的设计目标:可伸缩、可扩展、容错及输入格式松耦合!一套方便的实施数据抽取(ETL)的工具。一种让用户对数据描述其结构的机制。
TaroLee
·
2023-10-16 06:29
大数据系列
hive
hadoop
大数据
Hadoop
未来展望
我们很荣幸能够见证
Hadoop
十年从无到有,再到称王。感动于技术的日新月异时,希望通过这篇内容深入解读
Hadoop
的昨天、今天和明天,憧憬下一个十年。
贾诩是也
·
2023-10-16 06:19
Big
DATA
Hadoop
配置 Kerberos 认证
1、安装Kerberos服务器和客户端1.1规划服务端:bigdata3客户端(
Hadoop
集群):bigdata0bigdata1bigdata2192.168.50.7bigdata0.example.combigdata0192.168.50.8bigdata1
非理性地界生物
·
2023-10-16 06:39
hadoop
网络
oracle
Hadoop
3教程(十三):MapReduce中的分区
Hadoop
里默认的分区方式是HashPartitioner分区,核心代码:publicclassHash
经年藏殊
·
2023-10-16 06:34
大数据技术
mapreduce
大数据
hadoop
Hadoop
3教程(十):MapReduce中的InputFormat
文章目录(87)切片机制与MapTask并行度决定机制(90)切片源码总结(91)FileInputFormat切片机制(92)TextInputFormat及其他实现类一览(93)CombineTextInputFormat切片机制原理案例讲解参考文献(87)切片机制与MapTask并行度决定机制什么是MapTask的并行度?即在一个MR程序里,需要并行开启多少个MapTask,来处理数据。并行
经年藏殊
·
2023-10-16 06:04
大数据技术
mapreduce
大数据
hadoop
Hadoop
3教程(十一):MapReduce的详细工作流程
文章目录(94)MR工作流程Map阶段Reduce阶段参考文献(94)MR工作流程本小节将展示一下整个MapReduce的全工作流程。Map阶段首先是Map阶段:首先,我们有一个待处理文本文件的集合;客户端开始切片规划;客户端提交各种信息(如切片规划文件、代码文件及其他配置数据)到yarn;yarn接收信息,计算所需的MapTask数量(按照切片数);MapTask启动,读取输入文件,默认使用的是
经年藏殊
·
2023-10-16 06:04
大数据技术
mapreduce
数据库
大数据
hadoop
Spark-Submit参数设置说明
集群配置软件配置
Hadoop
2.6.0Spark2.2.0硬件配置三台服务器,32核64G500G总资源:32核64Gx3=48核192GYarn可分配总资源:48核60Gx3=144核180G默认情况下
我在北国不背锅
·
2023-10-16 06:33
Spark
spark
spark-submit
Hadoop
3教程(十二):MapReduce中Shuffle机制的概述
文章目录(95)Shuffle机制什么是shuffle?Map阶段Reduce阶段参考文献(95)Shuffle机制面试的重点什么是shuffle?Map方法之后,Reduce方法之前的这段数据处理过程,就叫做shuffle,中文直译"洗牌"。参考上一小节的MR工作流程,整个shuffle的工作流程如下图,可以理解成shuffle横跨map和reduce阶段:Map阶段1)Map()处理之后的数据
经年藏殊
·
2023-10-16 06:01
大数据技术
mapreduce
大数据
数据库
hadoop
hadoop
组成
在
hadoop
1.x时代,
Hadoop
中的MapReduce同时处理业务逻辑运算和资源调度,耦合性较大;在
hadoop
2.x时代,新增了yarn,主要负责资源的调度,MapReduce仅负责运算;在
hadoop
3
jiedaodezhuti
·
2023-10-16 03:53
大数据技术
hadoop
最新
Hadoop
的面试题总结
1、集群的最主要瓶颈 磁盘IO,网络带宽2、
Hadoop
运行模式 单机版、伪分布式模式、完全分布式模式3、
Hadoop
生态圈的组件并做简要描述 1)Zookeeper:是一个开源的分布式应用程序协调服务
大数据老哥
·
2023-10-16 02:06
CentOS_Tomcat安装图解
二、解压tomcat安装包①第一种方式:解压本地[root@
hadoop
100software]#tar-zxvfapache-tomcat-8.0.53.tar.gz②第二种方式:解压指定目录[root
Hola_怡宝
·
2023-10-16 02:25
本地报
HADOOP
_HOME and
hadoop
.home.dir are unset 错误处理
在本地idea上运行
Hadoop
相关服务,控制台打印出此错误“
HADOOP
_HOMEand
hadoop
.home.dirareunset”,这是由于在本地Windows系统配置
hadoop
环境就会报此错误
HoneyYHQ9988
·
2023-10-15 20:23
Hadoop
配置hadoop环境
HBase 数据迁移方案介绍 (转载)
/hbase_data_transfer.html一、前言HBase数据迁移是很常见的操作,目前业界主要的迁移方式主要分为以下几类:图1.HBase数据迁移方案从上面图中可看出,目前的方案主要有四类,
Hadoop
weixin_30548917
·
2023-10-15 20:38
大数据
数据库
shell
hbase集群之间数据迁移_HBase 数据迁移方案介绍
[1]图1.HBase数据迁移方案从上面图中可看出,目前的方案主要有四类,
Hadoop
层有一类,HBase层有三类。下面分别介绍一下。
眠子子子
·
2023-10-15 20:08
hbase集群之间数据迁移
hbase数据迁移
一、前言HBase数据迁移是很常见的操作,目前业界主要的迁移方式主要分为以下几类:图1.HBase数据迁移方案从上面图中可看出,目前的方案主要有四类,
Hadoop
层有一类,HBase层有三类。
徐雄辉
·
2023-10-15 20:37
hbase
一种不同网络环境下HBase数据备份及恢复方法
这里我们引入Hbase的一个API,hbaseorg.apache.
hadoop
.hbase.mapreduce.Export,该A
莫叫石榴姐
·
2023-10-15 20:06
Hbase
hadoop
hadoop
mapreduce
大数据
记一次Hbase2.1.x历史数据数据迁移方案
DWM_TRIP_PART”的快照snapshot'vaas_dwm:DWM_TRIP_PART','dwm_trip_part_snapshot'3.统计待迁移表数据总数hbaseorg.apache.
hadoop
.hbase.mapreduce.RowCounter'vaas_dwm
日复一日伐树的熊哥
·
2023-10-15 20:32
跟着熊哥学大数据hadoop
hadoop
hbase
hbase数据迁移
snapshot
cdh
SparkCore编程RDD
RDD和
Hadoop
MR的区别:RDD是先明确数据处理流程,数据在行动算子执行前实际上并未被修改MR本质上是摸石头过河,每一步操作时,数据本体已经被修改了,无法恢复。
十七✧ᐦ̤
·
2023-10-15 18:04
spark
java
scala
德和医
还有晓颖,我不在的国粹堂的时候,给我送来了
研磨
药的小工具,李光荣老师亲自去家里给姥姥出
国粹堂1
·
2023-10-15 18:53
Hadoop
+Hive三节点集群环境搭建
etc/hosts在后面添加ip地址和主机名的映射配置多台服务器间的免密登录可以参考:https://blog.csdn.net/u010698107/article/details/119079821
Hadoop
赤雁麟
·
2023-10-15 17:27
hadoop
hive
大数据
基于
Hadoop
安装Hive
文章目录一、安装准备工作二、安装三、启动和测试一、安装准备工作1、安装HIve前得安装好
Hadoop
集群,不会安装的去我前面文章找2、安装包准备3、在
Hadoop
的namenode节点服务器安装即可链接
"小王"
·
2023-10-15 17:54
大数据
hive
hadoop
linux
java
mysql
Linux 下搭建 Hive 环境
Linux下搭建Hive环境作者:Grey原文地址:博客园:Linux下搭建Hive环境CSDN:Linux下搭建Hive环境前置工作首先,需要先完成Linux下搭建Kafka环境Linux下搭建
Hadoop
GreyZeng
·
2023-10-15 17:49
Linux
大数据
Linux
Hive
大数据
运维
linux下基于
hadoop
安装hive和Zeppelin安装
将包放在opt目录下/opt/soft/hive110/lib目录下[root@wqopt]#tar-zxfhive-1.1.0-cdh5.14.2.tar.gz[root@wqopt]#mvhive-1.1.0-cdh5.14.2soft/hive110[root@wqopt]#cd/opt/soft/hive110/conf[root@wqconf]#touchhive-site.xml[ro
SKY_WU95
·
2023-10-15 17:17
hadoop
hive
linux
Apache Hive概述以及在linux安装hive
目录一、ApacheHive概述二、ApacheHive基础架构1.Hive架构图2.Hive组件三、Hive集群部署1.安装MySQL数据库(root用户)2.配置
Hadoop
3.下载Hive4.提供
菜鸟一千零八十六号
·
2023-10-15 17:16
大数据
apache
hive
hadoop
基于Linux系统的HIVE安装
在安装HIVE之前需要在Linux上安装好mysql、
hadoop
和zookeeper。在这里我介绍一下zookeeper和hive的安装。
叶子不落
·
2023-10-15 17:46
linux
hive
zookeeper
hive
基于Linux安装Hive
root@masterlocal]#tar-zxvf/opt/apache-hive-3.1.2-bin.tar.gz重命名及更改权限mvapache-hive-3.1.2-binhivechown-R
hadoop
Matrix70
·
2023-10-15 17:14
Hive
linux
hive
运维
hadoop
hdfs
大数据
黑猴子的家:Linux scp 命令安装
[root@
hadoop
102~]#yuminstall-yscp2、发现scp这东西属于openssh-clients这个包[root@
hadoop
102~]#yuminstall-yopenssh-clients
黑猴子的家
·
2023-10-15 15:36
杀死僵尸进程ZooKeeperMain
关闭
Hadoop
后jps发现还有个进程ZooKeeperMain没有关闭,使用==kill-9<>==也没有用,这种就是僵尸进程,需要用父进程ID来杀死解决方法话不多说,直接上解决方案,1.第一步清楚需要关闭的进程
严同学正在努力
·
2023-10-15 14:15
服务器
linux
运维
上一页
78
79
80
81
82
83
84
85
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他