E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop;hdfs
数据写入HBase(scala)
packagesourceimportorg.apache.
hadoop
.hbase.
莫噶
·
2024-01-30 07:51
HBase
hbase
数据库
大数据
Hadoop
-MapReduce-YarnChild启动篇
一、源码下载下面是
hadoop
官方源码下载地址,我下载的是
hadoop
-3.2.4,那就一起来看下吧Indexof/dist/
hadoop
/core二、上下文在上一篇中已经将到:MRAppMaster的启动
隔着天花板看星星
·
2024-01-30 07:21
hadoop
mapreduce
大数据
Hadoop
与Spark横向比较【大数据扫盲】
大数据场景下的数据库有很多种,每种数据库根据其数据模型、查询语言、一致性模型和分布式架构等特性,都有其特定的使用场景。以下是一些常见的大数据数据库:NoSQL数据库:这类数据库通常用于处理大规模、非结构化的数据。它们通常提供简单的查询语言,并强调水平扩展和高可用性。例如:-键值存储:如Redis,AmazonDynamoDB-列式存储:如ApacheCassandra,HBase-文档数据库:如M
super_journey
·
2024-01-30 06:51
大数据
hadoop
spark
2.图说
HDFS
基本原理
英文原版作者:ManeeshVarshney,
[email protected]
HDFS
是现在最受欢迎和被人们说熟知的分布式文件系统。
__元昊__
·
2024-01-30 03:59
hadoop
必记知识点(1)
1.
Hadoop
是什么,解决什么问题?
Hadoop
是一个由Apache基金会所开发的分布式系统基础架构。它可以让使用者在普通的硬件上搭建起一个强大的计算集群。
运维仙人
·
2024-01-30 02:40
hadoop
大数据
分布式
hadoop
必记知识点(2)
6.
hadoop
集群计算的时候,什么是集群的主要瓶颈?展开说一下,生产遇到了什么问题?在
Hadoop
集群进行计算时,可能会遇到多个瓶颈,但最主要的通常包括网络带宽、存储以及CPU处理能力。
运维仙人
·
2024-01-30 02:39
hadoop
大数据
分布式
hadoop
必记知识点(3)
在这里插入图片描述
Hadoop
的Combiner的作用
Hadoop
的Combiner是一个在map任务执行完之后、在数据被发送到reduce任务之前执行的函数。
运维仙人
·
2024-01-30 02:09
hadoop
大数据
分布式
大数据 -
Hadoop
系列《三》- MapReduce(分布式计算引擎)概述
上一篇文章:大数据-
Hadoop
系列《三》-
HDFS
(分布式文件系统)概述-CSDN博客目录12.1针对MapReduce的设计构思1.如何对付大数据处理场景2.构建抽象编程模型3.统一架构、隐藏底层细节
王哪跑nn
·
2024-01-29 23:31
大数据
hadoop
大数据
hadoop
hdfs
浅析大数据的技术生态圈(
Hadoop
,hive,spark)
大数据本身是个很宽泛的概念,
Hadoop
生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗瓢盆,各有各的用处,互相之间又有重合。
Rysinal
·
2024-01-29 19:11
hadoop
大数据
hadoop
spark
生态圈
浅析大数据技术架构
数据源的种类比较多:1、网站日志作为互联网行业,网站日志占的份额最大,网站日志存储在多台网站日志服务器上,一般是在每台网站日志服务器上部署flumeagent,实时的收集网站日志并存储到
HDFS
上。
at小白在线中
·
2024-01-29 19:11
大数据
big
data
架构
hive
浅析大数据汇总
传统的数据库技术已经无法满足对这些海量数据的存储和处理需求,因此出现了分布式存储和计算技术,如
Hadoop
、HBase等。
shinelord明
·
2024-01-29 19:10
大数据
开源
PiflowX组件-FileRead
hdfs
://server1:8020/flink/test/text.txtformatformat“”Set(“json”,“csv”,“avro”,“parquet”,“orc”,“r
PiflowX
·
2024-01-29 18:03
PiflowX
大数据
spark
big
data
flink
hadoop
PiflowX组件-FileWrite
hdfs
://server1:8020/flink/test/text.txtformatformat“”Set(“json”,“csv”,“avro”,“parquet”,“orc”,“
PiflowX
·
2024-01-29 18:29
spark
flink
big
data
大数据
hadoop
阿里云服务器2024年2核16G、4核32G、8核64G配置最新收费标准及活动价格
2核16G、8核64G、4核32G配置的云服务器处理器与内存比为1:8,这种配比的云服务器一般适用于数据分析与挖掘,
Hadoop
、Spark集群和数据库,缓存等内存密集型场景,因此,多为企业级用户选择,
qq_3304559116
·
2024-01-29 18:17
阿里云
阿里云
服务器
云计算
Flink容错机制
流式程序的状态存储在可配置的位置(如主节点或
HDFS
上)。当程序失败(由于机器、网
王知无
·
2024-01-29 18:11
全面解析基于
Hadoop
模型的数据分析平台框架
本文主要讲解以下两个方面:♦
Hadoop
MapReduce与Hive技术研究♦数据分析平台框架设计与环境配置
Hadoop
MapReduce与Hive技术研究一、
Hadoop
框架工作机制
Hadoop
框架定义
丨程序之道丨
·
2024-01-29 17:04
HDFS
文件系统之存储优化篇1
随着业务数据规模逐渐变大,业务成本越来越高,同时
HDFS
本身的数据冗余多副本机制放大存储成本过高文题,且近年来各大公司都在搞降本增效,所以相关降本要求越来越高,对
HDFS
本身存储系统提出更多的挑战。
风筝Lee
·
2024-01-29 16:35
HDFS
hdfs
数据库
linux
NameNode,NameNode,Secondary NameNode
壹:NameNode(名称节点)
HDFS
采用master/slave架构。一个
HDFS
集群是由一个Namenode和一定数目的Datanodes组成。
Summer_1981
·
2024-01-29 14:59
【若泽大数据第一天】--在vmware workstation上安装CentOS6.5系统
一、下载并安装vmwareworkstationpro12二、下载CentOS6.5镜像文件三、创建虚拟机并命名为
hadoop
0011、在VM12中选择创建新虚拟机2、自定义高级3、默认下一步4、选择稍后安装操作系统
naroutofan
·
2024-01-29 11:25
Elasticsearch集群部署及Head插件安装
由于ES比较吃内存,所以每台服务器的配置要求为:CPU:2核内存:2G我的三个节点分别是
Hadoop
Node01、
Hadoop
Node02、
Hadoop
Node03,以下操作全部基于
Hadoop
Node01
景鹏虎晓
·
2024-01-29 11:54
elasticsearch
es
spark快速入门java_Spark 快速入门
既然本教程中我们不使用
HDFS
,你可以随便下载一个适配任何
Hadoop
的版本的Spark。
陈兰香
·
2024-01-29 11:54
spark快速入门java
基于大数据平台的kylin安装部署手册
目录一.单例Kylin部署1.环境准备1.1软件要求1.2硬件要求1.3
Hadoop
环境1.4安装前环境检查1.4.1开启时钟同步1.4.2安装net-tools1.4.3检查hbase是否可用1.4.4
猿来孺词
·
2024-01-29 10:26
部署安装
大数据
kylin
分布式
数据仓库
数据分析
MR和Spark的比较
二、
hadoop
和spark的shuffle相同和差异?三、Spark与
Hadoop
差异一、Spark为什么比MR快?
猿来孺词
·
2024-01-29 10:55
mr
spark
大数据
分布式
hadoop
Elk运维-Elastic7.6.1集群安装部署
集群安装结果说明实例配置安装软件安装账号
hadoop
12C4G磁盘:50G云服务器elasticsearchkibanard
hadoop
22C4G磁盘:50G云服务器elasticsearchrd
hadoop
32C4G
消逝的bug
·
2024-01-29 10:11
运维
elk
数据库
Hadoop
学习之路(七) MapReduce框架Partitioner分区
Partitioner分区的作用是什么?在进行MapReduce计算时,有时候需要把最终输出数据分到不同的文件中,比如按照省份划分的话,需要把同一省份的数据放到一个文件中;按照性别划分的话,需要把同一性别的数据放到一个文件中。我们知道最终的输出数据是来自于Reducer任务。那么如果要得到多个文件,意味着有相同数量的Reducer任务在运行。Reducer任务的数据来自于Mapper任务,也就是M
shine_rainbow
·
2024-01-29 10:26
HDFS
HDFS
入门1.1.
HDFS
介绍
HDFS
是
Hadoop
DistributeFileSystem的简称,意为:
Hadoop
分布式文件系统。是
Hadoop
核心组件之一,作为最底层的分布式存储服务而存在。
VincentLeon
·
2024-01-29 08:44
Hadoop
, HIve, Spark关系简述
HDFS
用于存放多机器的数据并提供相关Api接口。
HDFS
中引入了一个模块:MapReduce(基于磁盘计算)。
小白兔奶糖ovo
·
2024-01-29 07:22
hadoop
hive
spark
【cdh】hive执行SQL提示缺少3.0.0-cdh6.3.2-mr-framework.tar.gz文件
问题:执行SQL报错提示缺少文件异常信息如下在
hdfs
上查看的时候连文件夹都没有,所以这个异常会抛出,但是我是基于CDH搭建的,可以直接基于下面操作执行完成之后查看
HDFS
文件重新执行SQL发现可以正常执行了
谷新龙001
·
2024-01-29 07:46
hive
sql
mr
记一次Flink自带jar包与第三方jar包依赖冲突解决
flink版本1.14.5
hadoop
2.6.0为了实现flink读取hive数据写入第三方的数据库,写入数据库需要调用数据库的SDK,当前SDK依赖的protobuf-java-3.11.0.jar,
一枚小刺猬
·
2024-01-29 06:10
flink
flink
jar
hadoop
Hadoop
面试题及参考答案
目录1、什么是
Hadoop
及其组件2、
Hadoop
的守护进程3、
Hadoop
的YARN/
HDFS
/MapReduce分别包含哪些组件,每个组件的职能是什么?
zuolixiangfisher
·
2024-01-29 06:02
Hadoop
hadoop
hdfs
大数据
hadoop
面试题
0.思维导图1.
HDFS
1.
HDFS
的架构♥♥
HDFS
主要包括三个部分,namenode,datanode以及secondarynamenode。
韩顺平的小迷弟
·
2024-01-29 06:27
大数据面试题
hadoop
大数据
分布式
大数据之
Hadoop
-MapReduce(1)
第1章MapReduce概述1.1MapReduce定义MapReduce是一个分布式运算程序的编程框架,是用户开发“基于
Hadoop
的数据分析应用”的核心框架。
jackyan163
·
2024-01-29 04:18
Hive初体验
首先,确保启动了Metastore服务{runjar就是metastore;
hadoop
要先启动}可以执行:bin/hive进入到HiveShell环境中,可以直接执行SQL的语句;·创建表(hive里面的字符串就是
%HelloWorld%
·
2024-01-29 03:09
hive
hadoop
数据仓库
[m1pro ] ssh: connect to host localhost port 22: Connection refused
在学习
Hadoop
的时候,使用sshlocalhost遇到以下问题原因:本地没有打开远程登录解决办法:打开远程登录成功结果
程序员三木
·
2024-01-29 03:33
大后端
ssh
服务器
数据库
spark shuffle
这个就是spark和
hadoop
的主要区别,基于内存进行运算。
流砂月歌
·
2024-01-29 01:13
Spark工作原理
standalone集群,集群中有6个节点左边是Spark的客户端节点,这个节点主要负责向Spark集群提交任务,假设在这里我们向Spark集群提交了一个任务那这个Spark任务肯定会有一个数据源,数据源在这我们使用
HDFS
小崔的技术博客
·
2024-01-28 23:12
大数据学习
spark
大数据
hadoop
Spark运行原理
无论是性能,还是方案的统一性,对比传统的
Hadoop
,优势都非常明显。
hellozhxy
·
2024-01-28 23:41
spark
spark
HDFS
_DELEGATION_TOKEN 还原及解决方案
HDFS
_DELEGATION_TOKEN这个BUG在很多文章中都出现着,讲了很多原理,但是只给出了官方引用地扯,完全没有给出如何解决,我们线上的业务就有着这样的问题,7天一到马上出现这问题了,官方明明说这个
kikiki4
·
2024-01-28 23:18
数仓治理-小文件治理
小文件治理本文中将介绍Hive中小文件治理的方法和技巧,希望对大家有所帮助https://mp.weixin.qq.com/s/HDxAGhGIPvXF38wPiXZ7xg[离线计算-Spark|Hive]
HDFS
爱吃辣条byte
·
2024-01-28 23:40
数据治理
大数据
数据仓库
2021-08-10
HDFS
Web报错Couldn‘t preview the file.
在查看文件内容时,在红框位置出现报错“Couldn’tpreviewthefile”解决方法第一步:修改
hdfs
-site.xml,添加配置信息dfs.web
hdfs
.enabledtrue第二步:配置浏览器所在系统的
学习是一种信仰_zdy
·
2024-01-28 21:28
大数据
hadoop
大数据
hdfs
HDFS
文件系统的根目录和用户主目录解析
HDFS
文件系统的根目录和用户主目录分别是什么?根据这四个截图,你能得出什么结论?
问君何能尔?心远地自偏
·
2024-01-28 21:57
大数据
Name node is in safe mode
相信
hadoop
用户经常为安全模式头痛,但是又是难以避免的。安全模式开启通常是由于
hdfs
文件系统数据完整性缺失造成。所以核心就是想办法让
hdfs
文件系统数据变得完整,相对没有损坏。
大数据东哥(Aidon)
·
2024-01-28 21:27
大数据
hadoop
safemode
safemode
hadoop
safe
mode
Name
node
is
in
safe
记一次
HDFS
Web报错Couldn‘t preview the file. NetworkError: Failed to execute ‘send‘ on ‘XMLHttpRequest‘
tpreviewthefile.NetworkError:Failedtoexecute‘send’on‘XMLHttpRequest’:Failedtoload‘http://slave1:9864/web
hdfs
一花一世界~
·
2024-01-28 21:55
Linux-Centos
x.x
Hadoop
大数据
hadoop
hdfs
大数据
经验分享
centos
Java技术栈 ——
Hadoop
入门(二)
Java技术栈——
Hadoop
入门(二)一、用MapReduce对统计单词个数1.1项目流程1.2可能遇到的问题1.3代码勘误1.4总结一、用MapReduce对统计单词个数1.1项目流程(1)上传jar
键盘国治理专家
·
2024-01-28 21:51
Java技术栈
java
hadoop
开发语言
flink架构
它集成了使用所有常见的群集资源管理器,例如
Hadoop
YARN和Kubernetes,但也可以设置为作为独立集群,甚至作为库。
m0_66520412
·
2024-01-28 20:29
flink
架构
大数据
数据湖技术之发展现状篇
首先是随着
Hadoop
生态相关技术的大量应用,批处理架构应运而生,借助离线计算引擎的能力很好的满足了业务对大规模数据分析处理场景的需求。
风筝Lee
·
2024-01-28 18:56
数据湖
hive
hadoop
spark
4.Doris数据导入导出
导入Doris支持多种数据源导入如S3
HDFS
Kafka本地文件Binlog等官方文档导入的原子性保证Doris的每一个导入作业,不论是使用BrokerLoad进行批量导入,还是使用INSERT语句进行单条导入
夹毛局的程序员
·
2024-01-28 16:27
doris
doris
Doris系列12-数据导入之Broker Load
适用场景:源数据在Broker可以访问的存储系统中,如
HDFS
。数据量在几十到百GB级别。名词解释:Frontend(FE):Doris系统的元数据和调度节点。在导入流程中主要负责导入plan生
只是甲
·
2024-01-28 15:29
大数据处理系统的架构
Lambda架构的主要组成部分包括:批处理层(BatchLayer):存储:使用分布式存储系统(如Apache
Hadoop
HDFS
)
demo123567
·
2024-01-28 14:58
大数据
架构
[SparkSQL] Rdd转化DataFrame 通过StructType为字段添加Schema
1、开发环境spark-2.1.0-bin-
hadoop
2.62、Rdd转换成DataFrame,为字段添加列信息参数nullable说明:Indicatesifvaluesofthisfieldcanbenullvaluesvalschema
林沐之森
·
2024-01-28 13:51
上一页
18
19
20
21
22
23
24
25
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他