E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
研磨hadoop
大数据学习——MapReduce
计算流程1.4.2环境准备创建maven工程,添加如下依赖配置log4j.properties1.4.3编写程序(1)Mapper类(2)Reducer类(3)Driver1.4.4测试本地测试集群测试2
Hadoop
daybreak98
·
2023-10-20 18:39
Hadoop
大数据
mapreduce
学习
如何从Oracle迁移到Greenplum 第一篇
从传统的单机数据库迁移到分布式数据库,这些原则也仍然适用,很多用户都成功的从Oracle、Teradata、DB2、SybaseIQ、
Hadoop
等平台迁移到了Greenplum。1综述
Greenplum中文社区
·
2023-10-20 18:02
数据库
网络
大数据
分布式
编程语言
第十章 计算层优化之系统优化
从系统优化方面来讲:HBO1)HBO是根据任务的历史执行情况优化资源分配2)HBO方案提出:①在
Hadoop
中maptask与reducetask的task个数分配是根据用户提交的任务总数据量和每个maptask
被爱的天青色
·
2023-10-20 18:21
hive中操作hdfs命令
版本:
Hadoop
2.7.4–查看dfs帮助信息[root@hadp-mastersbin]#dfsUsage:dfs[genericoptions][-appendToFile…][-cat[-ignoreCrc
侠客刀
·
2023-10-20 17:48
hive
大数据
hadoop
使用 ClickHouse 深入了解 Apache Parquet (一)
【squids.cn】全网zui低价RDS,免费的迁移工具DBMotion、数据库备份工具DBTwin、SQL开发工具等自2013年作为
Hadoop
的列存储发布以来,Parquet几乎已经成为一种无处不在的文件交换格式
沃趣数据库管理平台
·
2023-10-20 17:01
技术专栏
clickhouse
性能优化
数据库
运维
sql
01-初识大数据-我的大数据工程师成长之路:
Hadoop
介绍
首先声明由于学习过程是根据阿里云大学的大数据学习路线学习,所以本系列的文章也会引用来自该路线课程中的一些资料,如侵权请联系我删除,谢谢。转载请注明来源:https://blog.csdn.net/yezisuifengbiao/article/details/115742261很久没有更新博客了,最近因为工作原因,打算考一考阿里云ACP的大数据工程师认证,于是开始了我的大数据学习之路……因为长期做
风华是一指流砂
·
2023-10-20 17:28
大数据
hadoop
大数据
Microsoft Exchange Server 2016 - 3: Mailbox Databases
OverviewoftheMailboxServerRoleServerRole1.pngexchange.pngdatabase有点像
Hadoop
,高冗余而且可以用低价硬件,不一定要买高配置硬件服务器
LeeMin_Z
·
2023-10-20 16:19
Flink On Yarn 模式部署提交
FlinkOnYarn模式部署提交一、环境准备Ubuntu
hadoop
2.6.0(官网下载)Flink1.12.2jdk8二、
Hadoop
完全分布式-yarn配置永久关闭防火墙修改主机名vim/etc/
Anthons
·
2023-10-20 15:07
org.apache.
hadoop
.hive.ql.exec.MoveTask
insertoverwritetable操作的时候出现下面报错Errorwhileprocessingstatement:FAILED:ExecutionError,returncode1fromorg.apache.
hadoop
.hive.ql.exec.MoveTask.Exceptionwhenloading42intableintelligent
微亮之海
·
2023-10-20 15:37
大数据
大数据
(初学者强烈推荐)Ubuntu 配置
hadoop
超详细教程(全过程)
本机的配置环境如下:
hadoop
(3.3.1)jdk版本(jdk-8)Linux(64位)1、安装jdk在Ubuntu中用压缩包安装jdk较为麻烦,需要配置系统环境变量和配置文件,一步出错可能无法使用。
头发好多
·
2023-10-20 14:54
ubuntu
hadoop
linux
hadoop
解决Exception in thread “main“ java.lang.NoClassDefFoundError: org/apache/
hadoop
/yarn/util/Apps
在Ubuntu虚拟环境下运行eclipse的WordCount所抛出的异常如下图:原因:没有导入或者没导入完整
hadoop
目录下的yarn相关jar包解决方法:/usr/local/
hadoop
-3.1.1
头发好多
·
2023-10-20 14:53
java
hadoop
apache
Kafka三种认证模式,Kafka 安全认证及权限控制详细配置与搭建
Kafka三种认证模式使用kerberos认证bootstrap.servers=
hadoop
01.com:9092,
hadoop
02.com:9092,
hadoop
03.com:9092,
hadoop
04
代码讲故事
·
2023-10-20 13:30
架构师成长之路
kafka
分布式
sasl
acl
scram
Kerberos
ssl
大数据技术系列(1)
1系统平台(
Hadoop
、CDH、HDP)1.1
Hadoop
Apache
Hadoop
是一个
爱吃西瓜的小菜鸟
·
2023-10-20 11:32
数据库
大数据
Sqoop技术文档笔记
Sqoop是一个用于在
Hadoop
和关系型数据库之间传输数据的开源工具。
小辉懂编程
·
2023-10-20 11:30
sqoop
sqoop
hadoop
hive
Hadoop
启动报错 master: Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password).
报错信息和截图[ec2-user@master
hadoop
]$sbin/start-all.shWARNING:AttemptingtostartallApache
Hadoop
daemonsasec2-
小辉懂编程
·
2023-10-20 11:30
报错问题
hadoop
eclipse
大数据
hive初始化报错:.HiveMetaException: Schema initialization FAILED! Metastore state would be inconsistent !!
报错信息和截图:org.apache.
hadoop
.hive.metastore.HiveMetaException:SchemainitializationFAILED!
小辉懂编程
·
2023-10-20 11:00
报错问题
hadoop
hive
apache
3、Kafka Broker
[
hadoop
102zookeeper-3.5.7]$bin/zkCli.sh(2)通过ls命令可以查看kafka相关信息。
myprince003
·
2023-10-20 11:09
Kafka
kafka
分布式
kafka生产者和消费者
目录生产者命令行操作消费者命令行操作Kafka生产者生产者消息发送流程:发送原理生产者重要参数列表生产者命令行操作1、查看操作生产者命令参数[atguigu@
hadoop
102kafka]$bin/kafka-console-producer.sh
笨鸟先-森
·
2023-10-20 10:05
kafka
分布式
java
Hadoop
和大数据:60款顶级开源工具
说到处理大数据的工具,普通的开源解决方案(尤其是Apache
Hadoop
)堪称中流砥柱。
yoku酱
·
2023-10-20 09:00
windows 配置kerberos访问启用spnego的CDH 集群web UI页面
一问题描述CDH集群启用HTTPWeb控制台的Kerberos身份验证后,FireFox下HTTP访问HDFS、Yarn、Hive、HBase等
Hadoop
服务的WebUI(如Namenode的50070
weixin_34038652
·
2023-10-20 08:18
ui
操作系统
大数据
启用Kerberos后,Windows上浏览器访问CDH页面的那些事
前言在对
Hadoop
集群施加安全认证的过程中,往往会有需要开启对应服务组件WebUI认证的需求。在启用认证后,如果直接使用浏览器打开WebUI页面,都会提示需要进行认证。
咕噜咕噜大数据
·
2023-10-20 08:47
大数据安全
CDH
大数据
kerberos
hadoop
Windows 配置kerberos访问并启动访问CDH 集群web UI页面
1、问题描述:CDH集群启用HTTPWeb控制台的Kerberos身份验证后,FireFox下HTTP访问HDFS、Yarn、Hive、HBase等
Hadoop
服务的WebUI(如Namenode的50070
大大大大大大太阳
·
2023-10-20 08:14
Kerberos
Kerberos
CDH
web
ui
Windows
大数据开发复习Spark篇
11.2、spark与
Hadoop
的区别尽管Spark相对于
Hadoop
而言具有较大优势,但Spark并不能完全替代
Hadoop
,Spark主要用于替代Ha
落幕7
·
2023-10-20 08:29
大数据开发复习整理
spark
大数据之
Hadoop
-MapReduce(1)
第1章MapReduce概述1.1MapReduce定义MapReduce是一个分布式运算程序的编程框架,是用户开发“基于
Hadoop
的数据分析应用”的核心框架。
jackyan163
·
2023-10-20 08:58
大数据
hadoop
mapreduce
big
data
【大数据开发技术】实验06-SequenceFile、元数据操作与MapReduce单词计数
SequenceFile、元数据操作与MapReduce单词计数一、实验目标二、实验要求三、实验内容四、实验步骤附:系列文章SequenceFile、元数据操作与MapReduce单词计数一、实验目标熟练掌握
hadoop
Want595
·
2023-10-20 08:48
《
Hadoop大数据开发技术
》
大数据
mapreduce
Hadoop
分布式存储和计算MapReduce的使用以及Hive数据仓库等内容精讲
一,zookeeper环境搭建ZooKeeper致力于为分布式应用提供一个高性能、高可用,且具有严格顺序访问控制能力的分布式协调服务服务器IP主机名myid的值192.168.186.133vmone1192.168.186.134vmtwo2192.168.186.135vmthree3myid的值越高,被选举的几率越大!先把这三台机器分别重置主机名为vmone,vmtwo,vmthree,具体
刻苦的樊同学
·
2023-10-20 07:32
大数据
hadoop
数据仓库
MapReduce
大数据技术之
Hadoop
(入门)V3.0 --配置安装较多
1.1大数据概念1.2大数据特点(4V)1.3大数据应用场景1.4大数据发展前景1.5大数据部门业务流程分析1.6大数据部门组织结构(重点)第2章从
Hadoop
框架讨论大数据生态2.1
Hadoop
是什么
okbin1991
·
2023-10-20 07:00
hadoop
大数据
hdfs
分布式
mapreduce
Hadoop
HA集群部署 - A - 详解
理论简介:HA概念以及作用HA(HighAvailable),高可用性群集,是保证业务连续性的有效解决方案,一般有两个或两个以上的节点,且分为活动节点及备用节点。通常把正在执行业务的称为活动节点,而作为活动节点的一个备份的则称为备用节点。当活动节点出现问题,导致正在运行的业务(任务)不能正常运行时,备用节点此时就会侦测到,并立即接续活动节点来执行业务。从而实现业务的不中断或短暂中断。HDFS概述基
仗剑江湖.红尘笑
·
2023-10-20 07:28
㊣
应用架构解析
㊣
hadoop
Hadoop
3教程(二十五):Yarn的多队列调度器使用案例
文章目录(136)生产环境多队列创建&好处(137)容量调度器多队列提交案例如何创建多个队列如何向指定队列提交任务(138)容量调度器任务优先级(139)公平调度器案例参考文献(136)生产环境多队列创建&好处生产环境下怎么创建队列?调度器默认只会开一个default队列,这个肯定是不满足生产要求的;可以按照框架来划分队列。比如说hive/spark/flink的任务分别放在不同的队列里,不过这么
经年藏殊
·
2023-10-20 07:36
大数据技术
大数据
hadoop
yarn
HIVE字段简单加密
select'123456789't,encode('123456789','UTF-8')t1--存储
hadoop
字段类型binary,base64(cast('123456789'asbinary)
yipiantian
·
2023-10-20 06:06
hive
大数据
Hive编程指南
第1章基础知识前言Hive提供了一个被称为Hive查询语言(简称HiveQL或HQL)的SQL语言,来查询存储在
Hadoop
集群中的数据;Hive可以将大多数的查询转换为MapReduce任务;Hive
weixin_43177696
·
2023-10-20 06:04
大数据经典书籍笔记
hadoop
hive
数据仓库
hive 解密_hive 中自定义 base64 加密 解密 UDF 函数
一、maven依赖org.apache.
hadoop
hadoop
-client2.7.3org.apache.hivehive-exec1.2.1org.apache.maven.pluginsmaven-shade-plugin1.4packageshade
weixin_39988164
·
2023-10-20 06:04
hive
解密
Hive编程指南pdf
Hive在
Hadoop
系统中的应用趋势比较可观。
weixin_30468137
·
2023-10-20 06:02
大数据
java
人工智能
hive自定义UDF实现md5加密函数
hive自定义UDF实现md5加密函数1pom.xm配置4.0.0com.itcastUDFtest1.0-SNAPSHOTorg.apache.hivehive-exec1.2.1org.apache.
hadoop
hadoop
-common2.7.4org.apache.maven.pluginsmaven-shade-plugin2.2packageshade
青眼酷白龙
·
2023-10-20 06:30
Hive
hive
Hive UDF实现RAS加密解密
话不多说,直接上代码RSA加密:importorg.apache.commons.codec.binary.Base64;importorg.apache.
hadoop
.hive.ql.exec.MapredContext
HoweSea
·
2023-10-20 06:24
hive
hadoop
big
data
【Zookeeper】3. Zookeeper 集群安装
命令行语法3.2.2znode节点数据信息3.2.3节点类型3.2.4监听器原理3.2.5节点的删除与查看3.3客户端API操作集群3.4客户端向服务端写数据流程3.1集群操作3.1.1⭐集群安装集群规划在
hadoop
102
coolcoo1cool
·
2023-10-20 06:40
Zookeeper
zookeeper集群安装
zookeeper选举机制
zookeeper客户端API
Griffin成为Apache顶级项目
在
Hadoop
,Spark,Storm等分布式系统中,提供了一整套统一的流程来定义和检测数据集的质量并及时报告问题。来源Griffin起源于eBay中国,并与2016年12月进入Apache孵化器。
小强的进阶之路
·
2023-10-20 05:58
创建快照过程中报异常:SnapshotCreationException
业务中需要以读取快照的方式读取hbase表,刚开始会重新创建快照,但是遭遇了以下的异常:rg.apache.
hadoop
.hbase.snapshot.SnapshotCreationException
糖哗啦
·
2023-10-20 03:14
使用Java API将txt文件转换为orc文件
目录1,第一步,添加相关依赖(出处来源于官网),测试该程序时应具备
Hadoop
的相关环境依赖。2,确定我们转换的数据
予岁月以文明
·
2023-10-20 03:06
orc
hadoop
hdfs
大数据
hive
hdfs orc格式_大数据:Hive - ORC 文件存储格式
一、ORCFile文件结构ORC的全称是(OptimizedRowColumnar),ORC文件格式是一种
Hadoop
生态圈中的列式存储格式,它的产生早在2013年初,最初产生自ApacheHive,用于降低
weixin_39854369
·
2023-10-20 03:35
hdfs
orc格式
ORC文件写入java代码实现汇总(开发笔记)
importjava.io.DataOutput;importjava.io.IOException;importio.airlift.compress.lzo.LzoCodec;importorg.apache.
hadoop
.fs.Fil
冷心笑看丽美人
·
2023-10-20 03:34
大数据
java
hive
Hive - ORC 文件存储格式详细解析
一、ORCFile文件结构ORC的全称是(OptimizedRowColumnar),ORC文件格式是一种
Hadoop
生态圈中的列式存储格式,它的产生早在2013年初,最初产生自ApacheHive,用于降低
浪尖聊大数据-浪尖
·
2023-10-20 03:33
java
hadoop
大数据
hive
hdfs
Java写本地ORC文件(Hive2 API)
代码如下:packagecom.lxw1234.hive.orc; importorg.apache.
hadoop
.conf.Configuration;importorg.apa
XiaoGuang-Xu
·
2023-10-20 03:02
Hive
Java API 写 Hive Orc文件
packagecom.lxw1234.test;importjava.io.DataInput;importjava.io.DataOutput;importjava.io.IOException;importorg.apache.
hadoop
.f
赶路人儿
·
2023-10-20 03:31
java
hadoop
#
hive
hive
orc
Java API连接HDFS并创建Orc文件
1、设置连接,参考之前文章:JavaAPI操作HA方式下的
Hadoop
staticStringClusterName="nsstargate";privatestaticfinalString
HADOOP
_URL
空山苦水禅人
·
2023-10-20 03:31
大数据
hdfs
java
hadoop
centos7
hadoop
2.8.5 安装
一、下载地址https://www-eu.apache.org/dist/
hadoop
/common/
hadoop
-2.8.5/
hadoop
-2.8.5.tar.gz二、前置条件1.安装jdk8需要安装好
O_vv_O
·
2023-10-20 02:18
后天之本,你好吗
脾胃健康,我们吃下去的食物在胃里
研磨
、消化,之后由脾进行再次消化,去掉其中的糟粕,把营养物质这个精华转运到全身,五脏六腑得营养而健康。
厂厂九九
·
2023-10-20 02:13
hive数据仓库安装与使用
第一部分:hive介绍1、hive的概念hive是基于
hadoop
的一个数据仓库的工具,也是数据库,存放的是历史数据,用于数据挖掘etl。
rose and war
·
2023-10-20 01:24
大数据
hive
数据仓库
hadoop
Hive3.x数仓开发
文章目录一、数仓仓库概念二、数据仓库分层架构ODS\DW\DA(ADS)ETL\ELT三、ApacheHive概述为什么使用HiveHive和
Hadoop
关系四、ApacheHive架构、组件组件五、ApacheHive
_七七
·
2023-10-20 01:24
大数据数仓
数据仓库
学习
hive
[Hive] 07 - HQL:数据检索-查询(select)
环境宿主机:Windows1064_bit虚拟机:VMwarepro12CentOS7.564_bit(3台:1个master、2个slave)
Hadoop
-2.6.5MariaDB-5.5.60Hive1.2.2ssh
神是念着倒
·
2023-10-20 01:53
Hive
Hive
QL
数据检索
查询
select
from
排序
上一页
74
75
76
77
78
79
80
81
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他