E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Haddoop
Haddoop
大数据教程笔记_09_HIVEsql复杂用法举例
目录HIVEsql复杂用法举例1.保存select查询结果的几种方式:2.行转列,根据主键对某列进行合并3.列转行,将某列数据拆分成多行4.hive实现wordcount5.级联查询实现累积报表(笨办法)6-12均为9.hive窗口分析函数6.窗口分析函数sum()over():可以实现在窗口中进行逐行累加(简单办法)7.分组排序求topn8.各种打序号方法9.LAG函数10.LEAD函数11.F
Snowing_inhope
·
2023-11-13 12:02
大数据Hadoop教程
大数据
hive
hadoop
数据分析
数据仓库
计算机网络
是一个将分散的具有独立功能的计算机系统通过通信设备与线路连接起来有功能完善的软件实现资源的共享和信息传递的系统(是互联的,自治的计算计集合)功能:数据通信,资源共享(硬件,软件,数据),分布式处理(多台计算机各自承担同一个工作任务的不同部分
HadDoop
相见不如相离
·
2023-10-28 19:38
网络
服务器
运维
Haddoop
大数据教程笔记_11_Hadoop辅助工具——Flume&Sqoop
目录前言1.Flume日志采集框架1.1Flume介绍1.1.1概述1.1.2运行机制1.1.4Flume采集系统结构图1.2Flume实战案例1.2.1Flume的安装部署1.2.2采集案例1.3更多source和sink组件2.sqoop数据迁移工具2.1概述2.2工作机制2.3sqoop实战及原理2.3.1sqoop安装2.4Sqoop的数据导入2.4.1语法2.4.2示例2.5Sqoop的
Snowing_inhope
·
2023-08-31 08:06
大数据Hadoop教程
hadoop
大数据
flume
sqoop
大数据
Haddoop
(二) 架构与原理
Haddoop
架构与原理Hadoop架构架构概述Hadoop经典版本架构HadoopV1.0核心:HDFSMapReduceHadoopV2.0,引入了Yarn。
傅二毛
·
2023-08-22 17:45
Hadoop3.1.3完全分布式安装(Centos7.x)
目录一、环境准备二、JDK的安装三、安装
haddoop
四、配置hadoop配置文件五、将jdk、hadoop分发到slave1、slave2节点六、hdfs格式化七、环境变量配置八、集群启动九、进程查看十
Hedgehog
·
2022-09-27 16:04
分布式
hadoop
hdfs
Haddoop
中的hdfs、hbase、 hive区别与联系
Hive:Hive不支持更改数据的操作,Hive基于数据仓库,提供静态数据的动态查询。其使用类SQL语言,底层经过编译转为MapReduce程序,在Hadoop上运行,数据存储在HDFS上。HDFS:HDFS是GFS的一种实现,他的完整名字是分布式文件系统,类似于FAT32,NTFS,是一种文件格式,是底层的。Hive与Hbase的数据一般都存储在HDFS上。HadoopHDFS为他们提供了高可靠
羊子雄起
·
2020-09-12 07:34
HBase
Hadoop3 新特性、端口号的改变(二)
Hadoop版本
Haddoop
1.xHaddoop2.xHaddoop3.xHaddoop3.0GA版本于2017年12月份正式发布下面来说一下版本号后面的后缀表示的含义Alpha:内部测试版Beta:
云飞Ran
·
2020-09-12 03:33
Hadoop
Haddoop
大数据教程笔记_02_Hadoop生态圈简介
Hadoop生态圈简介目录Hadoop生态圈简介Hadoop生态圈:(一)Hdfs(二)Mapreduce(三)Hive(四)Hbase(五)Zookeeper(六)Sqoop(七)Pig(八)Mahout(九)Flume(十)Spark(十一)Storm(十二)Impala(十三)Kafka(十四)Yarn(十五)Hue(十六)Oozie(十七)AmbariHadoop生态圈:狭义上的Hadoo
Snowing_inhope
·
2020-08-18 10:58
大数据Hadoop教程
Hadoop权威指南_第四版_中文版pdf
全书共16章,3个附录,涉及的主题包括:
Haddoop
简介;MapReduce简介;Hadoop分布式文件系统;Hadoop的I/O、MapReduce应用程序开发;MapReduce的工作机制;Ma
weixin_30622107
·
2020-08-16 21:09
Haddoop
大数据教程笔记_010_HBASE安装及使用
目录HBASE安装及使用HBASE简介:HBASE是一个数据库----可以提供数据的实时随机读写HBASE相比于其他nosql数据库(mongodb、redis、cassendra、hazelcast)的特点:HBASE安装:HBASE是一个分布式系统安装准备:安装步骤:1.安装zookeeper(前文已述)2.安装hbase3.启动hbase集群(hdfs,zk集群正常运行):4.启动hbase
Snowing_inhope
·
2020-08-09 06:44
大数据Hadoop教程
Java 多线程(上)
如
haddoop
分布式集群。所以并发编程的目标是充分利用处理器的每一个核,以达到最高的处理性。二、线程和进程的区别?进程是指程序运行和资源分配的基本单位,一个程
我姓周i
·
2020-08-04 00:00
学习笔记
Yarn源代码分析之旅---总体架构---概述与总体架构
欢迎转载,转载请注明出处
Haddoop
1.0的不足与Hadoop2.0的产生学习和研究过Hadoop1.0的人都应该知道,在Hadoop1.0中,使用了Master\Slave的架构模式,jobTracker
JJZHK
·
2020-07-07 11:15
Yarn
vs2017编译
haddoop
3.1.0
我是在windows1064位系统使用VisualStudio2017编译hadoop3.1.0源码按照官方文档(BUILDING.txt),编译hadoop需要以下环境1、JDK1.8jdk-8u171-windows-x64.exe下载地址2、Maven3.0orlaterapache-maven-3.5.3-bin.zip下载地址3、ProtocolBuffer2.5.0protoc-2.5
缥缈大师
·
2020-07-04 13:23
大数据
hadoop3.1.0
Windows编译
vs2017
HADOOP HA部署
本次部署
haddoop
集群三台hostname:HBASE01HBASE02HBASE03192.168.240.129HBASE01192.168.240.130HBASE02192.168.240.131HBASE03
红与黑hyh
·
2020-02-06 13:00
Haddoop
中的hdfs、hbase、 hive区别与联系
Hive:Hive不支持更改数据的操作,Hive基于数据仓库,提供静态数据的动态查询。其使用类SQL语言,底层经过编译转为MapReduce程序,在Hadoop上运行,数据存储在HDFS上。HDFS:HDFS是GFS的一种实现,他的完整名字是分布式文件系统,类似于FAT32,NTFS,是一种文件格式,是底层的。Hive与Hbase的数据一般都存储在HDFS上。HadoopHDFS为他们提供了高可靠
a6jishuren
·
2018-08-06 10:47
大数据
安装部署(八) Hive+Sqoop安装部署和使用
Hive+Sqoop安装
haddoop
2.7.2spark2.0.0zookeeper3.4.8kafka0.10.0.0hbase1.2.2jdk1.8.0_101ubuntu14.04.04x64参考
dst1213
·
2016-08-12 22:52
安装部署
【Spark】Spark一:Spark伪分布式安装
Spark1.2.0伪分布式安装JDK1.7.0_67
Haddoop
2.5.2(伪分布式安装)Scala2.11.4Spark1.2.0(伪分布式安装) 下载并配置Scala1.下载Scala2.11.4
bit1129
·
2015-01-02 10:00
spark
【Spark】Spark一:Spark伪分布式安装
Spark1.2.0伪分布式安装JDK1.7.0_67
Haddoop
2.5.2(伪分布式安装)Scala2.11.4Spark1.2.0(伪分布式安装) 下载并配置Scala1.下载Scala2.11.4
bit1129
·
2015-01-02 10:00
spark
【Spark】Spark一:Spark伪分布式安装
Spark1.2.0伪分布式安装JDK1.7.0_67
Haddoop
2.5.2(伪分布式安装)Scala2.11.4Spark1.2.0(伪分布式安装) 下载并配置Scala1.下载Scala2.11.4
bit1129
·
2015-01-02 10:00
spark
storm-topology
类似在
haddoop
中的partition的过程。spout和bolt都可以产生数据流,但是grouping可以决定如何选择下一个处理stream。 Shufle Grouping &n
wind35
·
2014-09-11 09:00
storm
Haddoop
RAID Node 调研
RAIDNode调研1. 简介分布式文件系统主要用于解决海量数据存储的问题,如Goolge、Facebook等大型互联网企业都使用分布式文件系统作为数据存储的基础设施,并在其上构建很多服务,分布式文件系统通常采用三副本的策略来保证数据的可靠性,但随着应用数据量的不断膨胀,三副本策略为可靠性牺牲的存储空间也越来越大,如何在不降低数据可靠性的基础上,进一步降低存储空间成本?Facebook将era
guoqiangma
·
2014-04-11 18:00
上一页
1
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他