E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
HADOOP
【jceks】使用keytool和
hadoop
credential生成和解析jceks文件(无密码storepass)
com.xxx.test'version='1.0-SNAPSHOT'repositories{mavenCentral()}dependencies{implementation("org.apache.
hadoop
lisacumt
·
2025-05-03 14:34
hadoop
大数据
分布式
Spark和
hadoop
的区别与联系
一、Spark和
Hadoop
的联系:1.同属大数据生态体系二者均为Apache旗下的大数据处理框架,服务于大规模数据的存储与计算,共同构成了大数据技术栈的核心。
Amu_Yalo
·
2025-05-03 14:02
spark
hadoop
大数据
如何搭建spark yarn模式的集群
2.安装
Hadoop
下载
Hadoop
:从Apache
Hadoop
官网下载合适版本的
Hadoop
。解压安装:将
Hadoop
解压到指定目录,例如/opt/
hadoop
。
rylshe1314
·
2025-05-03 10:40
spark
大数据
分布式
Spark与Hive的数据分区与分桶策略详解
Apache
Hadoop
作为首个成熟的开源分布式计算框架,为大规模数据
AI天才研究院
·
2025-05-03 08:25
AI大模型企业级应用开发实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
spark简介和核心编程
Shark基于Hive开发,提升了SQL-on-
Hadoop
的性能,但对Hive的过度依赖制约了Spark发展。
小名叫咸菜
·
2025-05-03 06:06
spark
在Spark中通过jps命令看到的进程名,是哪个命令产生有什么作用
Hadoop
分布式系统中的相关进程:Worker:产生命令:yarn命令产生。
Betty_蹄蹄boo
·
2025-05-03 01:34
spark
大数据
分布式
搭建spark yarn模式集群
如何搭建SparkYarn模式集群1.前置条件准备在开始搭建SparkYARN集群之前,需要确保
Hadoop
和YARN已经正常部署并运行。
只因只因爆
·
2025-05-03 01:03
spark
大数据
分布式
Hadoop
和 Spark 生态系统中的核心组件
二、NodeManager1.来源:
Hadoop
YARN的工作节点服务
心仪悦悦
·
2025-05-03 00:59
hadoop
spark
大数据
在 IDEA 中编写 spark wordcount 程序
一、环境准备安装好jdk安装好idea安装好scala安装好windows编译后的
hadoop
环境变量都要配置好二、用maven将程序打成jar包上传到集群运行1、创建一个maven项目2、安装scala
火成哥哥
·
2025-05-02 23:53
spark
大数据
hadoop
scala
spark
log4j
Spark和
Hadoop
之间的对比和联系
Spark和
Hadoop
都是大数据处理领域的重要框架,它们之间的对比和联系如下:对比-计算模型:
Hadoop
采用MapReduce计算模型,将任务分为Map和Reduce两个阶段,适用于批处理。
祈533
·
2025-05-02 06:57
虚拟机
Python实战,
Hadoop
开发环境,如何分析处理大数据
同时,
Hadoop
作为
好知识传播者
·
2025-05-01 17:30
Python实例开发实战
大数据
python
hadoop
分析处理大数据
搭建spark-local模式
Java环境):1.下载Spark安装包:访问Spark官方网站(https://spark.apache.org/downloads.html),选择合适的版本进行下载,比如可以下载预编译好的适用于
Hadoop
祈533
·
2025-05-01 13:38
虚拟机
Java架构师之路六、高并发与性能优化:高并发编程、性能调优、线程池、NIO、Netty、高性能数据库等。
-CSDN博客下篇:Java架构师之路七、大数据:
Hadoop
、Spark、Hive、HBase、Kafka等-CSDN博客高并发编程:高并发编程是指针对大量用户同时访问的情况下,如何设计和实现能够支持大规模并发访问的系统
述清-架构师之路
·
2025-05-01 07:28
Java架构师之路
java
性能优化
nio
【
Hadoop
核心技术】
《
Hadoop
核心技术》一、定义与概述二、
Hadoop
基础架构三、MapReduce编程模型四、
Hadoop
生态系统组件一、定义与概述
Hadoop
是一个开源的分布式计算平台,主要用于存储和处理大规模数据集
谭雪华
·
2025-04-30 23:33
hadoop
大数据
分布式
【Hive入门】Hive高级特性:视图与物化视图
在大数据分析中,Hive作为
Hadoop
生态系统中的重要组件,提供了强大的数据查询和管理能力。除了基本表的操作,Hive还支持视图和物化视图,这两种特性在数据管理和查询优化中扮演着重要角色。
IT成长日记
·
2025-04-30 20:46
大数据成长笔记
hive
hadoop
数据仓库
视图与物化视图
全开源彩虹易支付系统源码搭建教程附源码
为了实现高效的数据处理和分析,系统使用了大数据技术,包括分布式数据存储和计算框架,如
Hadoop
、Spark等。源码演示站:fakaysw.top数据库技术:彩虹易支付系统需要存储用
qinheyan
·
2025-04-30 16:22
开源
Spark On YARN环境配置
环境配置教程二、修改配置文件一、修改spark-env.shcd/export/server/spark/confvim/export/server/spark/conf/spark-env.sh#添加以下内容
HADOOP
_CONF_DIR
飞Link
·
2025-04-30 10:14
Water
spark
yarn
hadoop
Spark 配置 YARN 模式
在大数据处理领域,Spark是一个强大的分布式计算框架,而YARN(YetAnotherResourceNegotiator)则是
Hadoop
生态系统中出色的资源管理器。
谁偷了我的炒空心菜
·
2025-04-30 10:42
spark
大数据
yarn
Apache Sqoop数据采集问题
Sqoop数据采集格式问题一、Sqoop工作原理二、Sqoop命令格式三、Oracle数据采集格式问题四、Sqoop增量采集方案ApacheSqoop是一款开源的工具,主要用于在
Hadoop
(Hive)
Aimyon_36
·
2025-04-30 02:11
Data
Development
apache
sqoop
hadoop
如何搭建spark yarn模式的集群
搭建SparkYARN模式集群指南在大数据处理领域,Spark是一款强大的分布式计算框架,而YARN(YetAnotherResourceNegotiator)则是
Hadoop
生态系统中的资源管理系统。
谁偷了我的炒空心菜
·
2025-04-29 23:18
spark
大数据
分布式
【课程笔记】华为 HCIA-Big Data 大数据 总结
列式数据库管理系统MapReduce分布式计算框架Yarn资源管理调度器Spark分布式计算框架Flink分布式计算框架Flume日志采集工具Kafka分布式消息队列本课程主要围绕以下几个服务展开:HDFS(
Hadoop
淵_ken
·
2025-04-29 22:12
华为
HCIA-Big
Data
大数据
大数据
搭建speak yarn集群:从零开始的详细指南
在大数据处理领域,ApacheSpark是一个高性能的分布式计算框架,而YARN(YetAnotherResourceNegotiator)是
Hadoop
的资源管理器。
anqi27
·
2025-04-29 16:24
spark
后端
开发语言
yarn
Spark On Yarn集群模式搭建
另一种资源协调者(ONYARN)是基于HDFS这个
Hadoop
南l鹿
·
2025-04-29 13:30
运维
spark
分布式
大数据核心面试题(
Hadoop
,Spark,YARN)
大数据核心面试题(
Hadoop
,Spark,YARN)高频面试题及答案1.什么是
Hadoop
?它的核心组件有哪些?2.解释HDFS的架构及其工作原理。3.HDFS如何保证数据的高可用性和容错性?
闲人编程
·
2025-04-29 12:53
程序员面试
大数据
hadoop
spark
面试
yarn
如何搭建spark yarn 模式的集群集群
###搭建SparkonYarn模式的集群配置步骤####1.环境准备在搭建SparkonYarn的集群之前,需要确保
Hadoop
和YARN已经正常部署并运行。
yyywoaini~
·
2025-04-29 11:50
大数据
如何搭建spark yarn模式的集合集群
Hadoop
集群:已经搭建并运行的
Hadoop
集群,包括HDFS和YARN。二、安装Spark下载Spark从ApacheSpark官方网站下载适合您
Hadoop
版本的Spark安装包。
刘翔在线犯法
·
2025-04-29 11:19
spark
大数据
分布式
Windows PC上创建大数据职业技能竞赛实验环境之三--Spark、Hive、Flume、Kafka和Flink环境的搭建
在前述
hadoop
-base基础容器环境的基础上,实现Spark、Hive、Flume、kafka和Flink实验环境的搭建。
liu9ang
·
2025-04-29 03:19
大数据平台
hadoop
spark
kafka
flink
大数据领域分布式计算的智能交通数据处理
通过深入探讨
Hadoop
、Spark等分布式框架的核心原理,结合交通流数学模型与机器学习算法,展示从数据采集、清洗到实时分析与预测的全流程实践。
大数据洞察
·
2025-04-29 02:44
CSDN
大数据
ai
spark和
Hadoop
之间的对比和联系
Spark和
Hadoop
的对比1.架构层面
Hadoop
:HDFS(分布式文件系统):
Hadoop
的核心组件之一,用于存储大规模数据。
夏天吃哈密瓜
·
2025-04-29 02:44
spark
hadoop
大数据
spark和
Hadoop
之间的对比与联系
对比计算模型:
Hadoop
:采用MapReduce计算模型,分map与reduce两个阶段,数据处理按阶段顺序执行,数据处理按阶段顺序执行,中间结果会写入磁盘,I/O开销大。
End928
·
2025-04-29 01:39
spark
hadoop
大数据
Hive从入门到精通(1)—— Hive 3.1.3 离线安装
1.安装前准备1.1安装
hadoop
Hadoop
3.3.2离线安装_shangjg3的博客-CSDN博客1.2在mysql中创建hivemeta数据库,用于保存hive的元数据mysql-uroot-p
shangjg3
·
2025-04-29 01:38
大数据从入门到精通
hive
hadoop
数据仓库
大数据
[大数据技术与应用省赛学习记录一]——软件准备
@JIAQI第一章大数据平台环境搭建在指定主机上完成
Hadoop
完全分布式、Spark、Flink、kafka、flume的安装配置赛前准备主办方要求使用以下相关版本软件环境,仅供参考:设备类型软件类别软件名称
Ench77
·
2025-04-29 01:07
大数据技术与应用比赛筹备
大数据
Hive4.0.1集群安装部署(
Hadoop
版本为3.3.6)(详细教程)
前置环境Linux环境Zookeeper集群安装(详细教程)-CSDN博客
Hadoop
HA高可用集群3.3.6搭建(详细教程)-CSDN博客MySQL8.0.40离线安装(详细教程)_mysql8.0.40ftp-CSDN
大数据探索者
·
2025-04-29 01:06
Hive
Hadoop
Centos
hadoop
大数据
hive
分布式
运维
centos
mysql
如何搭建spark yarn模式的集群
搭建SparkonYARN模式的集群需要完成
Hadoop
和Spark的安装与配置,并确保它们能够协同工作。以下是详细的搭建步骤和代码示例:1系统准备操作系统:推荐使用CentOS或Ubuntu。
lix的小鱼
·
2025-04-28 20:03
spark
大数据
分布式
Spark总结
1、Sparkand
Hadoop
的关系(1)首先从时间节点上来看:➢
Hadoop
2006年1月,DougCutting加入Yahoo,领导
Hadoop
的开发2008年1月,
Hadoop
成为Apache顶级项目
等雨季
·
2025-04-28 12:51
spark
大数据
分布式
spark和
Hadoop
之间的对比和联系
Spark和
Hadoop
是大数据领域两个核心的开源框架,虽然功能有重叠,但设计理念和适用场景有显著差异。
财神爷的心尖宠55
·
2025-04-28 12:50
spark
hadoop
大数据
hadoop
初学:MapReduce项目实践
一、
Hadoop
简介
Hadoop
是一个开源的分布式存储和计算框架,能够处理大规模数据集,并且具有高可靠性和高扩展性。
hlxhcl
·
2025-04-28 07:13
hadoop
大数据
分布式
探索大数据的奥秘:
Hadoop
大数据课程设计资源推荐
探索大数据的奥秘:
Hadoop
大数据课程设计资源推荐【下载地址】
Hadoop
大数据课程设计资源下载本仓库提供了一个名为“
hadoop
大数据课程设计”的资源文件下载。
富阔典
·
2025-04-28 07:13
探索
Hadoop
:学习思路与超强实用性全解析
在大数据风起云涌的时代,
Hadoop
已然成为了数据处理领域的中流砥柱。如果你也渴望踏入这个充满机遇的大数据世界,掌握
Hadoop
绝对是关键一步。
20210320043-wjw
·
2025-04-28 07:12
hadoop
学习
大数据
【
hadoop
】HBase分布式数据库安装部署
一、HBase集群的安装与配置步骤:1、使用XFTP将HBase安装包hbase-1.2.0-bin.tar.gz发送到master机器的主目录。2、解压安装包:tar-zxvf~/hbase-1.2.0-bin.tar.gz3、修改文件夹的名字,将其改为hbase,或者创建软连接也可:mv~/hbase-1.2.0~/hbase以上也可以通过命令的方式安装:看这篇文章:版本号不同没关系的,正常使
火龙谷
·
2025-04-28 07:42
hadoop
分布式
数据库
hadoop
【
hadoop
】HBase shell 操作
1.创建course表hbase(main):002:0>create'course','cf'2.查看HBase所有表hbase(main):003:0>list3.查看course表结构hbase(main):004:0>describe'course'4.向course表插入数据hbase(main):005:0>put'course','001','cf:cname','hbase'hba
火龙谷
·
2025-04-28 05:58
hadoop
hadoop
hbase
大数据
hive关键字在mysql_Hive基础sql语法(DDL)
首先了解下Hive的数据存储结构,抽象图如下:Hive存储.png1.Database:Hive中包含了多个数据库,默认的数据库为default,对应于HDFS目录是/user/
hadoop
/hive/
凯二七
·
2025-04-27 15:04
hive关键字在mysql
Ubuntu下安装Hive3.1.2教程(附MySQL安装方法及安装包)
下载压缩包并解压2.安装Hive3.配置环境变量4.修改配置文件二、MySQL安装与配置1.安装MySQL2.安装MySQLjdbc包3.为Hive创建MySQL账号三、验证Hive安装及错误处理1.启动
Hadoop
2
hjseo_seg
·
2025-04-27 14:01
面试
阿里巴巴
mysql
ubuntu
hadoop
开发语言
人工智能
Ubuntu22.04下安装Spark2.4.0(Local模式)
目录一、版本信息二、安装
Hadoop
(伪分布式)三、安装JAVAJDK四、安装Spark(Local模式)1.将Spark安装包移到下载目录中2.下载Spark并确保
hadoop
用户对Spark目录有操作权限五
哇咔咔哇咔
·
2025-04-27 14:26
Spark
spark
hadoop
linux
大数据
如何配置Spark
命令是:mvspark-3.1.1-bin-
hadoop
3.2/spark-standalone4.配置
悻运
·
2025-04-27 13:23
spark
大数据
分布式
spark数据分析基于python语言 中文版pdf_Spark数据分析:基于Python语言
译者序前言引言第一部分Spark基础第1章大数据、
Hadoop
、Spark介绍21.1大数据、分布式计算、
Hadoop
简介21.1.1大数据与
Hadoop
简史21.1.2
Hadoop
简介31.2Spark
weixin_39901332
·
2025-04-27 11:41
中文版pdf
Hadoop
基本操作命令全解析:掌控数据海洋的「舵手指南」
引言:
Hadoop
命令——数据巨轮的「方向盘」
Hadoop
作为大数据处理的「航空母舰」,承载着海量数据的存储与计算。
我不是秋秋
·
2025-04-27 09:26
hadoop
大数据
分布式
Hadoop
进阶之路
目录一、
Hadoop
基础概念二、
Hadoop
运行模式三、HDFS3.1HDFS架构与组件3.2HDFS读写流程3.3HDFS容错机制四、MapReduce4.1MapReduce原理与架构4.2MapReduce
£菜鸟也有梦
·
2025-04-27 02:07
大数据基础
hadoop
大数据
分布式
大数据开发教程——构建
Hadoop
开发环境
什么是
Hadoop
?
Hadoop
是由Apache基金会开发和维护的一个开源的分布式计算和存储框架。
比屋大数据
·
2025-04-26 21:41
大数据架构师源码零基础教程
hadoop
big
data
mapreduce
Hive架构
其特点是通过SQL处理
Hadoop
的大数据,数据规模可以伸缩扩展到100PB+,数据形式可以是结构或非结构数据。
漂漂1
·
2025-04-26 17:43
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他