E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
研磨hadoop
Hadoop
入门学习笔记-第二天 (HDFS:NodeName高可用集群配置)
说明:hdfs:nn单点故障,压力过大,内存受限,扩展受阻。hdfsha:主备切换方式解决单点故障hdfsFederation联邦:解决鸭梨过大。支持水平扩展,每个nn分管一部分目录,所有nn共享dn资源。使用JN集群保证数据一致性,使用zk集群解决主备切换1.若使用主备节点,常常存在的问题:强一致性,若一致性。强一致性(同步):nn主节点必须等到nn副本返回成功后,才能向客户端返回成功。主和副本
渣男程序员007
·
2023-11-30 05:13
Hadoop入门学习笔记
hadoop
java
大数据
hdfs
Hadoop
入门学习笔记-第三天(Yarn高可用集群配置及计算案例)
什么是mapreduce首先让我们来重温一下
hadoop
的四大组件:HDFS:分布式存储系统MapReduce:分布式计算系统YARN:
hadoop
的资源调度系统Common:以上三大组件的底层支撑组件
渣男程序员007
·
2023-11-30 05:13
Hadoop入门学习笔记
分布式
hadoop
大数据
spark
mapreduce
Flink-shell
1.FlinkSQl客户端启动一个flink的集群可以使用flink独立集群,也可以使用yarn-session.sh1.启动
Hadoop
集群2.yarn-session.sh-d3.sql-client.sh1.1sql-client.sh-isql-client.sh-i
大学生爱编程
·
2023-11-30 04:46
flink
hadoop
大数据
Spark3 on Yarn分布式集群安装部署(YARN模式)
Spark3onYarn分布式集群安装部署一、配置spark-defaults.conf二、配置spark-env.sh三、配置yarn-site.xml四、启动
Hadoop
和Spark集群五、基于YARN
最笨的羊羊
·
2023-11-30 03:57
大数据
Spark3.0.1
分布式集群搭建
spark on yarn模式安装部署
配置spark之前,请自行部署
Hadoop
2.7.2,JDK1.8,ssh免密码登录等准备工作。
乖乖猪001
·
2023-11-30 03:56
大数据
spark
Spark集群安装(On Yarn)
说明:基于已经搭建完成的
Hadoop
集群,关于
Hadoop
集群搭建,可参考:https://blog.csdn.net/weixin_37901366/article/details/13017066一
maplea2012
·
2023-11-30 03:55
Spark
spark
大数据
hadoop
【Spark】on yarn集群模式安装部署
官方文档http://spark.apache.org/docs/latest/running-on-yarn.html前提安装启动
Hadoop
(需要使用HDFS和YARN)安装单机版Spark不需要集群
没去过埃及的法老
·
2023-11-30 03:23
Sprak
大数据
spark
on
yarn集群模式
安装部署
云计算/大数据
Spark on YARN的部署
SparkonYARN的原理就是依靠yarn来调度Spark,比默认的Spark运行模式性能要好的多,前提是首先部署好
hadoop
HDFS并且运行在yarn上,然后就可以开始部署sparkonyarn了
GoodInSun
·
2023-11-30 03:23
spark
spark
on
yarn
spark on yarn集群的安装与搭建
注:(搭建sparkonyarn需要jdk,
hadoop
环境,其搭建可参照前面jdk和
hadoop
的安装与搭建).1.解压spark安装包[root@master/]#tar-zxvf/h3cu/spark
爱做梦的小鱼。
·
2023-11-30 03:52
我的笔记
大数据
hadoop
spark
hadoop
大数据
spark on yarn 安装部署
准备下载spark,地址:http://spark.apache.org/downloads.html下载不带
hadoop
预编译环境的spark最新版本,好处是可以自由使用最新版本的
hadoop
下载
hadoop
积极流年
·
2023-11-30 03:51
spark
ambari部署
hadoop
ambari搭建
hadoop
集群为何选用ambari安装前准备部署节点间做免密登陆搭建nginx服务创建repo源安装mysql服务安装ambari服务启动ambari服务登陆ambari-ui配置为何选用
hello_world_99
·
2023-11-30 03:23
大数据技术
大数据运维
大数据开发
大数据
hadoop
运维
ambari运维问题记录
综合问题记录1、hdfs无法启动错误:2018-04-2514:36:09,293-Retryingafter10seconds.Reason:Executionof'/usr/hdp/current/
hadoop
-hdfs-namenode
人生匆匆
·
2023-11-30 03:23
ambari
ambari
运维
hadoop
本地IDEA、spark程序远程读取hive数据
1下载winutilsgithub-winutils各个版本集合下载里面和自己服务器版本对应的,配置
HADOOP
_HO
一加六
·
2023-11-30 02:08
大数据
hive
spark
idea对spark程序进行远程提交和调试
第一部分远程提交本文以WordCount程序来实现idea对spark程序进行远程提交和调试环境利用虚拟机搭建拥有3台主机的spark集群
hadoop
102
hadoop
103
hadoop
104IntelliJIDEA2020.3.2
akenseren
·
2023-11-30 02:06
大数据
spark
hive
大数据
Hadoop
大数据开发__Spark on YARN模式分布式集群安装部署
1、下载解压sparkcd/home/
hadoop
/apptar-zxvfspark-3.3.0-bin-
hadoop
3.tgzrmspark-3.3.0-bin-
hadoop
3.tgzln-sspark
姚华军
·
2023-11-30 02:32
大数据
大数据
hadoop
spark
Spark
on
YARN
YARN
spark写出分布式的训练算法_Spark分布式计算执行模型
引言相对
Hadoop
,Spark在处理需要迭代运算的机器学习训练等任务上有着很大性能提升,同时提供了批处理、实时数据处理、机器学习以及图算法等一站式的服务,因此最近大家一起来学习Spark,特别是MLLib
weixin_39965673
·
2023-11-30 02:01
spark写出分布式的训练算法
Spark 分布式环境搭建
Spark分布式环境搭建1.scala环境搭建1)下载scala安装包scala2.12.10.tgz安装到/usr/scala[root@
hadoop
001scala]#tar-zxvfscala-2.12.10
陈同学�
·
2023-11-30 02:01
spark
分布式
scala
Spark完全分布式搭建
Spark完全分布式搭建教程(Standalone:Master+Slave)分析:1.配置好IP2.修改主机名3.做好IP主机映射4.关闭防火墙5.配置SSH免密登入6.安装Java7.安装
Hadoop
明天要开心
·
2023-11-30 02:00
大数据
spark
分布式
Spark2.3.1的安装运行(伪分布式)
一、spark的安装1、本地安装1、在安装spark之前需要先安装JDK和scala环境,
hadoop
环境2、解压安装即可2、standalone安装模式1、解压安装,配置环境变量(通过spark-shell
翻斗花园牛爷爷..
·
2023-11-30 02:30
分布式
spark
hadoop
搭建Spark伪分布式
文章目录零、本讲学习目标一、搭建伪分布式
Hadoop
(一)登录ied虚拟机(二)配置免密登录1、在ied虚拟机上生成密钥对2、将生成的公钥发送到本机3、验证虚拟机是否能免密登录本机(三)下载与Spark
jzy2024
·
2023-11-30 02:00
spark
分布式
hadoop
Spark完全分布式搭建(On Yarn)
目录一、集群规划二、配置Spark路径三、修改配置文件1.spark-env.sh2.修改slaves文件四、启动集群1.先起动
Hadoop
的HDFS和Yarn2.启动Spark五、Web查看集群启动情况六
Congee小周
·
2023-11-30 02:00
大数据
hadoop
spark
完全分布式
spark-env.sh
slaves
Spark分布式安装模式
Spark分布式环境安装目前有四种模式:1.Standalone:Spark自带的简单群资源管理器,安装较为简单,不需要依赖
Hadoop
;2.
Hadoop
YARN:使用YARN作为集群资源管理,安装需要依赖
qq_58647543
·
2023-11-30 02:59
spark
spark
分布式
抖音SEO矩阵系统源码开发关键要素详解!
在该系统的开发过程中,多种编程语言(如Java、Python等)和框架技术(如
Hadoop
、Spark、PyTorch等)被应用,以提高数据处理和分析的效率。
矩阵源码_Muoyu111
·
2023-11-30 01:26
短视频矩阵系统开发
矩阵
线性代数
The Log: What every software engineer should know about real-time data's unifying abstraction
LinkIn2013年的日志与流处理架构,bolg中涉及到了大量的参考资料,与我的架构类似,但是基于JAVA
Hadoop
生态,并用Kafka作为日志底层文章地址:https://engineering.linkedin.com
doubeye
·
2023-11-30 00:23
谨慎Apache-Zookeeper-3.5.5以后在CentOS7.X安装的坑
资源环境列表如下:序号依赖组件说明1jdk-8u201-linux-x64.tar.gz基础的jdk依赖2
hadoop
-3.1.3.tar.gz
hadoop
依赖3apache-zookeeper-3.5.7
夜郎king
·
2023-11-30 00:25
数据库技术
zookeeper
分布式
云原生
数据中台·实时开发计算平台
在数据中台中,不同计算引擎对应不同的数据处理场景,
Hadoop
、MPP(g
数据先生
·
2023-11-30 00:33
数据仓库
大数据
职场和发展
数据库
数据挖掘
spark-submit:未找到命令
在执行过程中出现错误
hadoop
@Master:~/sparkapp$spark-submit--class"hw10_1_CountLine"/usr/local/spark/sparkapp/target
ZYT_庄彦涛
·
2023-11-29 22:02
报错
Spark
spark
大数据
flink AskTimeoutException异常
java.util.concurrent.CompletionException:akka.pattern.AskTimeoutException:Asktimedouton[Actor[akka.tcp://
[email protected]
.
hadoop
Jackson_Tan
·
2023-11-29 22:48
Spark面试题
(☆☆☆☆☆)1)本地模式 Spark不一定非要跑在
hadoop
集群,可以在本地,起多个线程的方式来指定。
終于、
·
2023-11-29 22:38
hadoop
源码解读
一、
hadoop
rpc总结1、RPC指的是不同进程的方法调用,分为客户端和服务端,客户端调用服务端的方法,方法的执行在服务端。
半_调_子
·
2023-11-29 21:10
hadoop
大数据
分布式
【解决】HDFS JournalNode启动慢问题排查
文章目录一.问题描述二.问题分析1.排查机器性能2.DNS的问题三.问题解决1.修复DNS服务2.添加主机映射为0.0.0.03.修改
hadoop
源码一句话:因为dns的问题导致journalnode启动时很慢
roman_日积跬步-终至千里
·
2023-11-29 20:12
hadoop运维
hdfs
网络
hadoop
大数据之HBase教程
大数据的出现后,好多公司实现处理大数据并从中受益,并开始选择像
Hadoop
的解决方案。
Hadoop
使用分布式文件系统,用于存储大数据,并使用MapReduce来处理。
@轻流
·
2023-11-29 20:00
Hbase
大数据
大数据之Hbase(心得)
什么是HBase(1)HBase的原型是Google的BigTable论文,受到了该论文思想的启发,目前作为
Hadoop
的子项目来开发维护,用于支持结构化的数据存储。
宝宝不哭^_^
·
2023-11-29 20:30
心得体会
Hbase
大数据技术之 HBase安装配置
大数据技术之HBase安装1.hbase依赖于
hadoop
以及zookeeper,所以1.1首先my
hadoop
.shstart1.2然后zk.shstart接下来安装hbase1.3HBase的解压[
大数据小理
·
2023-11-29 20:57
hbase
大数据
hbase
大数据
hadoop
大数据之HBase
HBase介绍Apache的三篇论文,GFS谷歌文件系统->HDFS;MR->MR;BigTable->HBase;HBase是
hadoop
数据库,一种分布式、可扩展的大数据NoSQL数据库之一。
十七✧ᐦ̤
·
2023-11-29 20:55
大数据
hbase
数据库
如何能打进去idea引入外部jar包
文件中加入下面代码:org.apache.maven.pluginsmaven-war-plugin3.2.3${project.basedir}/libWEB-INF/lib/**/*.jar然后导入依赖即可com
hadoop
-hdfs-client2.7
一个正在努力的小白码农
·
2023-11-29 19:57
intellij-idea
jar
Module-Spark使用文档
1.1.Spark说明ApacheSpark是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一,与
Hadoop
SuperScfan
·
2023-11-29 17:21
HBase的微博案例
HBase的微博案例1.实验环境说明2.实验目的3.实验步骤3.1正常启动
HADOOP
、ZOOKEEPER3.2启动HBASE3.3实验步骤3.3.1先把虚拟机的地址映射加入到windows下的Hosts3.3.2
YGSBlog
·
2023-11-29 15:05
HBase
hbase
hadoop
大数据
HBase初识之学生心得总结
c、HBase:理解为
Hadoop
base--3.大数据框架:a、数据的存储:hdfs/hive/hbaseb、数据的传输:flume/sqoopc、数据的计算
程序员驴子酱
·
2023-11-29 15:33
大数据
大数据技术基础实验五:Zookeeper实验——部署ZooKeeper
实验目的与要求三、实验原理四、实验步骤1、安装JDK2、修改ZooKeeper配置文件3、启动ZooKeeper集群4、查看java进程和ZooKeeper集群目录五、最后我想说一、前言本期我们将学习
Hadoop
-北天-
·
2023-11-29 15:03
大数据学习
大数据
java-zookeeper
zookeeper
hadoop
安装
简介
Hadoop
是一个开源的分布式存储和计算框架,最初由Apache软件基金会开发。
necessary653
·
2023-11-29 14:11
hadoop
大数据
分布式
Spark 学习笔记3. spark-submit + spark-shell
spark-submit:相当于
hadoop
jar命令--->提交MapReduce任务(jar文件)提交Spark的任务(jar文件)Spark提供Example例子:/root/training/spark
aimmon
·
2023-11-29 12:05
Spark
spark-submit
spark-shell
基于
hadoop
的商品推荐系统_基于知识图谱的推荐系统
作为大数据应用的两大类应用,搜索引擎和推荐系统既相互伴随和影响,又满足不同的产品需求。在作为互联网产品的连接器:连接人、信息、服务之间的桥梁,搜索和推荐有其各自的特点移联动互网、人工智能等技术的迅速发展为人们的工作生活带来了很多便利,用户面临着海量的信息,传统的搜索算法只能呈现给用户相同的物品排序结果,无法针对不同用户的兴趣爱好提供相应的服务。信息爆炸使得信息的利用率反而降低,这种现象被称为信息超
weixin_39936086
·
2023-11-29 12:26
基于hadoop的商品推荐系统
基于jsp的网上推荐系统
R
Hadoop
实践系列之三 R实现MapReduce的协同过滤算法
1.基于物品推荐的协同过滤算法介绍2.R本地程序实现3.R基于
Hadoop
分步式程序实现每一章节,都会分为”文字说明部分”和”代码部分”,保持文字说明与代码的连贯性。
wbj0110
·
2023-11-29 12:26
Hadoop家族
Hadoop家族
R实现MapReduce的协同过滤算法
基于物品推荐的协同过滤算法介绍R本地程序实现R基于
Hadoop
分布式程序实现1.基于物品推荐的协同过滤算法介绍文字说明部分:越来越多的互联网应用,都开始使用推荐算法(协同过滤算法)。
Gold_Spring
·
2023-11-29 12:46
Mahout
r语言
Mahout
mapreduce
协同过滤算法
基于
Hadoop
的异构网络协同过滤推荐算法设计
基于
Hadoop
的异构网络协同过滤推荐算法设计基于
Hadoop
的异构网络协同过滤推荐算法设计DesignofHeterogeneousNetworkCollaborativeFilteringRecommendationAlgorithmbasedon
Hadoop
wusp1994
·
2023-11-29 12:43
hadoop
推荐算法
大数据
Flink读取MongoDB中的数据
1.pom.xml添加相关依赖org.apache.flinkflink-
hadoop
-compatibility_2.111.6.0org.mongodb.mongo-
hadoop
mongo-
hadoop
-core2.0.02
fantasticMao
·
2023-11-29 08:01
5. MapReduce 和 Yarn 技术原理【华为HCIA-BigData】
5.1导读本章主要讲述大数据领域中最著名的批处理与离线处理计算框架MapReduce,包括MapReduce的原理、流程、使用场景,以及
Hadoop
集群中负责统一的资源管理与调度的组件Yarn,包括Yarn
Mengo_x
·
2023-11-29 08:45
BigData
hadoop
mapreduce
yarn
大数据
HCIA-Big Data V3.0 华为认证大数据工程师在线课程章节测试题汇总
1.大数据发展趋势与鲲鹏大数据1、(单选)以下哪个不是大数据时代新兴的技术:A.HBaseB.
Hadoop
C.MySQLD.Spark正确答案:C2、(单选)第三次信息化浪潮的标志是:A.云计算、大数据
gaogao_jack
·
2023-11-29 08:11
华为ICT
华为认证
大数据
华为云
华为
使用Spark Streaming处理Kafka数据流
1系统软件本文实验基于的各软件版本如下:Java1.8.0_191Scala2.11
hadoop
-3.0.3zookeeper-3.4.10Spark2.3.2kafka_2.12-2.0.1kafka-manager
打酱油的葫芦娃
·
2023-11-29 07:28
大数据
spark
kafka
linq
上一页
43
44
45
46
47
48
49
50
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他