E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop
Hadoop
真的要死了吗?
10月3日,Hortonworks宣布将与其主要竞争对手Cloudera合作创建一家年收入约为7.3亿美元、拥有2,500名客户、市场估值达52亿美元的公司,这令很多人感到意外。SpliceMachine首席执行官MonteZweben表示:“我认为对于我们来说,这是个好消息。我们已经看到了运营由这两家公司和其他公司部署的所有数据湖的巨大机会,而这样的机会在两年前可能连想都不敢想”。Conflue
伯雅之英
·
2023-12-27 11:23
Spark生产集群各种使用
1.环境配置1.1版本说明要求版本是否必须其他事项
Hadoop
3.3.4是
hadoop
3.3.0之后原生支持国内主要对象存储Hive3.1.3否实测没有Hive也可以使用sparksql,使用hive更好的管理
tuoluzhe8521
·
2023-12-27 10:15
hive相关
spark
大数据
分布式
七牛云存储
Hadoop
-3.3.4集群部分lib缺失问题
1.问题描述(base)[
hadoop
@
hadoop
1native]$
hadoop
checknative2023-12-2514:20:21,615INFObzip2.Bzip2Factory:Successfullyloaded
tuoluzhe8521
·
2023-12-27 10:13
hadoop相关
hadoop
大数据
分布式
【
Hadoop
】简单说下Zookeeper选举过程?
选票的时候,当一个服务器收到超过半数服务器以上的选票的时候,该服务器就被选举为Leader。首先需要知道在选举的过程中,服务器投票的时候会交换选票信息,这个选票信息就包括三个值:Epoch:每个Leader任期的代号。也就是一个逻辑时钟值。每投完一次票这个数据就会增加。所以每一轮选举的Epoch都不一样,如果Epoch值不是最大的,说明这次选票信息是过期的,也就不能参加本次选举ZXID:事务ID。
不怕娜
·
2023-12-27 10:40
hadoop
zookeeper
大数据
Zookeeper特性与节点数据类型详解
客户端常见命令2.3可视化工具3.Zookeeper数据结构3.1节点分类3.2监听机制3.3节点特性3.4应用场景1.初识ZookeeperZooKeeper是一个开源的分布式协调框架,是Apache
Hadoop
瑜伽娃娃
·
2023-12-27 07:01
Zookeeper
zookeeper
linux
分布式
删除azkaban的执行历史
azkaban通常用在大数据任务调度场景,把任务提交之后,如果任务是spark,hive,
hadoop
,flink等任务的话,
飞有飞言
·
2023-12-27 07:09
Hadoop
-Hbase集群搭建
archive.cloudera.com/cdh5/cdh/5/hbase-1.2.0-cdh5.7.0.tar.gz2.解压#解压到指定的文件夹tarxzvfhbase-1.2.0-cdh5.7.0.tar.gz-C/usr/loca/
hadoop
GuangHui
·
2023-12-27 07:17
hive学习笔记
一、Hive基本概念1.1hive是什么hive是基于
hadoop
的一个数仓分析工具,hive可以将hdfs上存储的结构化的数据,映射成一张表,然后让用户写HQL(类SQL)来分析数据telupdown138383843813451567138383843953451567138383844012411657713838384413453157571383838434353551567567
不爱吃鱼的馋猫
·
2023-12-27 06:05
hive
大数据
hadoop
hive中metastore服务、hiveserver2服务、hive客户端、beeline客户端连接元数据的方式
1.前言hive是
Hadoop
的客户端,启动hive前必须启动
hadoop
,同时hive的元数据存储在mysql中,是由于hive自带的derby数据库不支持多客户端访问。
不爱吃鱼的馋猫
·
2023-12-27 06:35
hive
[使用Python操作
Hadoop
,Python-MapReduce
环境环境使用:
hadoop
3.1,Python3.6,ubuntu18.04
Hadoop
是使用Java开发的,推荐使用Java操作HDFS。有时候也需要我们使用Python操作HDFS。
叫我老村长
·
2023-12-27 05:35
git 从一个源导入分支到另一个源
新增一个remote源gitremoteaddgithubhttps://github.com/apache/
hadoop
.git显示现在的remotegitremote-v获取gitfetchgithub
houzhizhen
·
2023-12-27 02:53
git
git
github
分布式系统面试连环炮
他们有共同的一个问题,就是都没怎么搞过分布式系统,现在互联网公司,一般都是做分布式的系统,大家都不是做底层的分布式系统、分布式存储系统
hadoop
hdfs、分布式计算系统
hadoop
mapreduce/
Java机械师
·
2023-12-26 23:13
YARN知识点总结
如果把大数据
Hadoop
集群当作一台计算机,那么HDFS=磁盘YARN=任务调度器+资源管理器所有任务都是运行在Yarn上Yarn分为两个大的模块:ResourceManagerNodeManagerResourceManager
飞有飞言
·
2023-12-26 23:16
灵蜂BeeDI ETL
大数据时代的集成利器ETL工具https://blog.csdn.net/little_bee_2004/article/details/80006047在信息时代大数据环境下,基于分布式的开源
Hadoop
weixin_49476464
·
2023-12-26 23:38
学习
hadoop
big
data
数据库
为什么Spark比MapReduce快?
一般而言,DAG相比
Hadoop
的MapReduce在大多数情况下可以减少shuffle次数(怎么体现?)。Spark的DAGScheduler相当于一个改进版的MapReduce,如果计算不涉及与
tracy_668
·
2023-12-26 23:00
Hadoop
大数据实战系列文章之HDFS文件系统
Hadoop
附带了一个名为HDFS(
Hadoop
分布式文件系统)的分布式文件系统,专门存储超大数据文件,为整个
Hadoop
生态圈提供了基础的存储服务。
测试帮日记
·
2023-12-26 21:39
从零开始学大数据框架Hudi,这些学习网站,助你一臂之力!
Hudi的设计使得您可以在
Hadoop
兼容的存储之上存储大量数据,并且它提供了两种原语,除了经典的批处理之外,还可以在数据湖上进行流处理。
知识分享小能手
·
2023-12-26 20:39
学习心得体会
大数据
大数据
学习
10.
hadoop
安装(全分布式安装)
全分布式首先必须有jdk安装,这里不再概述,参考4首先如果有不同就修改注意要改为disabled关闭防火墙iptable首先要免秘钥主节点要分发秘钥51020303540
文茶君
·
2023-12-26 20:43
hive下库里有表数据,删不了库的解决办法
hive下库里有表数据,删不了库的解决办法报错:FAILED:ExecutionError,returncode1fromorg.apache.
hadoop
.hive.ql.exec.DDLTask.InvalidOperationException
北凉-徐凤年
·
2023-12-26 20:07
日常工作遇到的问题
hive
借助 KMS (
Hadoop
Key Management Server) 实现 HDFS 数据加密
原生KMS模型概览适用场景将DataNode上的数据block加密存放,这样即使恶意用户通过某种方式绕过了权限控制,或直接访问了DataNode,获取了其它用户的数据block,也看不到这些block的真实内容。对HDFS的读写性能会有一定的降低,但应该不会太严重(未测试),HDFS优先使用native的libcrypto.so完成加解密(默认算法AES-CTR,支持128位AES加密),新版本的
xudong1991
·
2023-12-26 18:55
Grafana二进制部署并配置prometheus数据源
pg=graf&plcmt=deploy-box-1grafana官网下载地址[root@ambari-
hadoop
1~]#cd/opt/module/grafana/[root@ambari-
hadoop
1grafana
万里长江横渡
·
2023-12-26 13:04
grafana
prometheus
Hive01_安装部署
Hive的安装上传安装包解压tarzxvfapache-hive-3.1.2-bin.tar.gzmvapache-hive-3.1.2-binhive解决Hive与
Hadoop
之间guava版本差异cd
程序喵猴
·
2023-12-26 12:47
hive
hive
Hadoop
集群部署
目录1模板虚拟机环境准备1.1修改网卡配置文件扩展1.2修改主机名1.3在虚拟机中需要的基础文件包1.4关闭防火墙1.5创建
Hadoop
的账户及文件2模板虚拟机安装JDK3模板虚拟机安装
Hadoop
4克隆虚拟机
程序员储物箱
·
2023-12-26 12:23
安装教程
hadoop
linux
Windows搭建HDFS 2.6.0(附加搭建
Hadoop
)
1.环境操作系统:Windows7JDK版本:1.8.0_221
Hadoop
版本:2.6.02.下载
Hadoop
官网下载image.pngimage.png3.前期准备3.1.配置JAVA环境变量image.pngimage.png4
夹胡碰
·
2023-12-26 11:20
Hadoop
基础操作(学习笔记二)
本笔记按照以下四步进行:1、查看
hadoop
集群的基本信息http://master:50070/HDFS监控服务http://master:8088/cluster/nodes集群的计算资源信息http
Mecury_
·
2023-12-26 10:32
学习笔记
hadoop
大数据
六:Spark集群安装和部署
我的系统配置:(1)安装一个虚拟机:三个ubuntu16.04系统;(2)Master节点:内存分配2g;Slave1节点:内存分配512MB;Slave2节点:内存分配512MB;2.安装路径:(1)
Hadoop
2.6.5
玉成226
·
2023-12-26 10:21
spark
大数据Spark实战高手之路职业学习路线图
从零起步,分阶段无任何障碍逐步掌握大数据统一计算平台Spark,从Spark框架编写和开发语言Scala开始,到Spark企业级开发,再到Spark框架源码解析、Spark与
Hadoop
的融合、商业案例和企业面试
smileyboy2009
·
2023-12-26 10:56
hadoop
spark
spark
hadoop
hadoop
3.0x 后要比spark快10倍!
Apache
hadoop
项目组最新消息,
hadoop
3.x以后将会调整方案架构,将Mapreduce基于内存+io+磁盘,共同处理数据其实最大改变的是hdfs,hdfs通过最近black块计算,根据最近计算原则
smileyboy2009
·
2023-12-26 10:56
hadoop
spark
内存
mapreduce
spark
hdfs
hadoop
Iceberg1.4.2 java 表管理(DDL和DML)操作
既然是一种开放的表管理格式,那就不应该依赖
hadoop
,hive,spark,flink
smileyboy2009
·
2023-12-26 10:26
java
开发语言
Hive02_基本使用,常用命令
Hive是基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
程序喵猴
·
2023-12-26 08:39
hive
hive
pycharm连接虚拟机
要在PyCharm中远程连接到Linux上的Spark和
Hadoop
集群,您可以
俺会hello我的
·
2023-12-26 07:22
pycharm
ide
SpringBoot 2 集成Spark 3
前提条件:运行环境:
Hadoop
3.
在奋斗的大道
·
2023-12-26 06:12
Java架构专栏
深蓝计划
hadoop
spark
大数据
分布式
iceberg1.4.2 +minio通过spark创建表,插入数据
下层支持
hadoop
,s3,对象存储,上层支持hive,spark,flink等应用。实现在中间把两部分隔离开来,实现一种对接和数据管理的标准。有这个标准,不管是谁建的表,都可以操作和访问。
smileyboy2009
·
2023-12-26 06:39
spark
大数据
分布式
HBase基础知识(五):HBase 对接
Hadoop
的 MapReduce
通过HBase的相关JavaAPI,我们可以实现伴随HBase操作的MapReduce过程,比如使用MapReduce将数据从本地文件系统导入到HBase的表中,比如我们从HBase中读取一些原始数据后使用MapReduce做数据分析。1官方HBase-MapReduce1.查看HBase的MapReduce任务的执行./bin/hbasemapredcpSLF4J:Classpathcontai
依晴无旧
·
2023-12-26 06:01
大数据
hbase
mapreduce
数据库
Hadoop
——分布式计算
一、分布式计算概述1.什么是计算、分布式计算?计算:对数据进行处理,使用统计分析等手段得到需要的结果分布式计算:多台服务器协同工作,共同完成一个计算任务2.分布式计算常见的2种工作模式分散->汇总(MapReduce就是这种模式)将数据分片,多台服务器各自负责一部分数据处理然后将各自的结果,进行汇总处理最终得到想要的计算结果中心调度->步骤执行(大数据体系的Spark、Flink等是这种模式)1.
weixin_50458070
·
2023-12-26 06:38
大数据
hadoop
大数据
分布式
HBase深度历险 | 京东物流技术团队
简介HBase的全称是
Hadoop
Database,是一个分布式的,可扩展,面向列簇的数据库,是一个通过大量廉价的机器解决海量数据的高速存储和读取的分布式数据库解决方案。
京东云技术团队
·
2023-12-26 06:57
hbase
数据库
大数据
Linux下配置伪分布式的
Hadoop
伪分布式的意思就是集群只有一台服务器1安装jdk1.8,注意,jdk版本太高会导致
hadoop
无法正常启动和运行2下载
hadoop
3.1.3,并上传至服务器解压3编辑etc/
hadoop
/core-site.xmlfs.defaultFShdfs
qq_34324703
·
2023-12-26 05:49
分布式
linux
hadoop
Linux下安装Flume
1下载FlumeWelcometoApacheFlume—ApacheFlume下载1.9.0版本2上传服务器并解压安装3删除lib目录下的guava-11.0.2.jar(如同服务器安装了
hadoop
qq_34324703
·
2023-12-26 05:49
linux
flume
运维
09-为Java开疆拓土的ZGC深度剖析
文章目录引言ZGC出现背景STW带来的问题手机系统(Android)显示卡顿证券交易系统实时性要求大数据平台(
Hadoop
集群性能)垃圾回收器的发展ZGC介绍ZGC中JVM内存布局和设计为什么这么设计?
月球程序猿
·
2023-12-26 04:15
性能调优
JVM
java
ZGC
垃圾回收器
JVM
软件体系结构
名词解释Zookeeper:是一个分布式的,开放源码的分布式应用程序协调服务,是Google的一个开源的实现,是
Hadoop
和Hbase的重要组件。
城堡修炼者
·
2023-12-26 04:42
hadoop
mapreduce
hbase
大数据——技术生态体系
Hive构建在
Hadoop
之上,并提供了一种类似SQL的查询语言,被称为HiveQL(HiveQueryLanguage),用于处理和分析大规模数据。
Imrea
·
2023-12-26 01:56
大数据
hadoop
分布式
大数据技术——处理架构
Hadoop
•2.1概述•2.1.1
Hadoop
简介•
Hadoop
是Apache软件基金会旗下的一个开源分布式计算平台,为用户提供了系统底层细节透明的分布式基础架构•
Hadoop
是基于Java语言开发的,具有很好的跨平台特性
Imrea
·
2023-12-26 01:55
大数据
架构
hadoop
大数据——手把手教你HDFS搭建
第一步:在虚拟机上安装
hadoop
环境使用XFTP工具,将
hadoop
的linux版本压缩包导进linux系统的/opt文件夹下。
安安DE爸爸
·
2023-12-25 23:31
大数据
LINUX
HDFS
HDFS
hadoop
LINUX
黑猴子的家:Spark RDD 之
Hadoop
输入输出(数据读取与保存的主要方式之一)
1、
hadoop
RDD和new
Hadoop
RDDSpark的整个生态系统与
Hadoop
是完全兼容的,所以对于
Hadoop
所支持的文件类型或者数据库类型,Spark也同样支持.另外,由于
Hadoop
的API
黑猴子的家
·
2023-12-25 23:05
04_
hadoop
_读取hdfs在本地统计单词并将结果放回hdfs
1文件目录image.png2wordConfig.properties配置文件CLASS_BUSINESS=com.looc.D04HDFS单词计数.WordCountRealizeHDFS_URL=hdfs://vm01:9000/HDFS_USER=rootOUT_PUT_SRC=/wordCount/result/RESOURCE_SRC=/wordCount/resource/3Word
会摄影的程序员
·
2023-12-25 22:10
学习笔记
Hadoop
(十四)—— MapReduce开发入门(2)—— MapReduce API介绍、MapReduce实例
四、MapReduceAPI介绍一般MapReduce都是由Mapper,Reducer及main函数组成。Mapper程序一般完成键值对映射操作;Reducer程序一般完成键值对聚合操作;Main函数则负责组装Mapper,Reducer及必要的配置;高阶编程还涉及到设置输入输出文件格式、设置Combiner、Partitioner优化程序等;4.1、MapReduce程序模块:Main函数4.
别呀
·
2023-12-25 19:09
hadoop
big
data
java
学习笔记
Hadoop
(十一)——
Hadoop
基础操作(3)—— MapReduce常用Shell操作、MapReduce任务管理
四、MapReduce常用Shell操作4.1、MapReduce常用ShellMapReduceShell此处指的是可以使用类似shell的命令来直接和MapReduce任务进行交互(这里不严格区分MapReduceshell及Yarnshell)。提交任务命令:yarnjar[mainClass]args...查看及修改任务命令:yarnapplication[options]Usage:ya
别呀
·
2023-12-25 19:09
hadoop
big
data
Hadoop
学习笔记[6]-MapReduce与Yarn安装部署流程
Hadoop
学习笔记[6]-MapReduce与Yarn安装部署流程 前面的文章已经对MR和Yarn做了基本介绍,本文主要介绍MR和Yarn的安装部署流程1、角色划分 NodeManager和DataNode
kinglinch
·
2023-12-25 19:09
大数据
mapreduce
yarn
hadoop
大数据
HBase 集群搭建
文章目录安装前准备兼容性官方网址集群搭建搭建
Hadoop
集群搭建Zookeeper集群解压缩安装配置文件高可用配置分发HBase文件服务的启停启动顺序停止顺序验证进程查看Web端页面安装前准备兼容性1)
撕得失败的标签
·
2023-12-25 19:05
大数据技术
hbase
数据库
大数据
zookeeper
hadoop
HBase 搭建过程中常见问题
文章目录进程问题HQuorumPeer和QuorumPeerMain区别HRegionServerHMaster自动关闭启动顺序停止顺序无法关闭一直等待运行报错日志中报错问题无法调用方法启动HBase无法找到
Hadoop
撕得失败的标签
·
2023-12-25 19:05
大数据技术
hbase
数据库
大数据
zookeeper
hadoop
上一页
26
27
28
29
30
31
32
33
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他