E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
HADOOP
搭建Spark伪分布式
文章目录零、本讲学习目标一、搭建伪分布式
Hadoop
(一)登录ied虚拟机(二)配置免密登录1、在ied虚拟机上生成密钥对2、将生成的公钥发送到本机3、验证虚拟机是否能免密登录本机(三)下载与Spark
jzy2024
·
2023-11-30 02:00
spark
分布式
hadoop
Spark完全分布式搭建(On Yarn)
目录一、集群规划二、配置Spark路径三、修改配置文件1.spark-env.sh2.修改slaves文件四、启动集群1.先起动
Hadoop
的HDFS和Yarn2.启动Spark五、Web查看集群启动情况六
Congee小周
·
2023-11-30 02:00
大数据
hadoop
spark
完全分布式
spark-env.sh
slaves
Spark分布式安装模式
Spark分布式环境安装目前有四种模式:1.Standalone:Spark自带的简单群资源管理器,安装较为简单,不需要依赖
Hadoop
;2.
Hadoop
YARN:使用YARN作为集群资源管理,安装需要依赖
qq_58647543
·
2023-11-30 02:59
spark
spark
分布式
抖音SEO矩阵系统源码开发关键要素详解!
在该系统的开发过程中,多种编程语言(如Java、Python等)和框架技术(如
Hadoop
、Spark、PyTorch等)被应用,以提高数据处理和分析的效率。
矩阵源码_Muoyu111
·
2023-11-30 01:26
短视频矩阵系统开发
矩阵
线性代数
The Log: What every software engineer should know about real-time data's unifying abstraction
LinkIn2013年的日志与流处理架构,bolg中涉及到了大量的参考资料,与我的架构类似,但是基于JAVA
Hadoop
生态,并用Kafka作为日志底层文章地址:https://engineering.linkedin.com
doubeye
·
2023-11-30 00:23
谨慎Apache-Zookeeper-3.5.5以后在CentOS7.X安装的坑
资源环境列表如下:序号依赖组件说明1jdk-8u201-linux-x64.tar.gz基础的jdk依赖2
hadoop
-3.1.3.tar.gz
hadoop
依赖3apache-zookeeper-3.5.7
夜郎king
·
2023-11-30 00:25
数据库技术
zookeeper
分布式
云原生
数据中台·实时开发计算平台
在数据中台中,不同计算引擎对应不同的数据处理场景,
Hadoop
、MPP(g
数据先生
·
2023-11-30 00:33
数据仓库
大数据
职场和发展
数据库
数据挖掘
spark-submit:未找到命令
在执行过程中出现错误
hadoop
@Master:~/sparkapp$spark-submit--class"hw10_1_CountLine"/usr/local/spark/sparkapp/target
ZYT_庄彦涛
·
2023-11-29 22:02
报错
Spark
spark
大数据
flink AskTimeoutException异常
java.util.concurrent.CompletionException:akka.pattern.AskTimeoutException:Asktimedouton[Actor[akka.tcp://
[email protected]
.
hadoop
Jackson_Tan
·
2023-11-29 22:48
Spark面试题
(☆☆☆☆☆)1)本地模式 Spark不一定非要跑在
hadoop
集群,可以在本地,起多个线程的方式来指定。
終于、
·
2023-11-29 22:38
hadoop
源码解读
一、
hadoop
rpc总结1、RPC指的是不同进程的方法调用,分为客户端和服务端,客户端调用服务端的方法,方法的执行在服务端。
半_调_子
·
2023-11-29 21:10
hadoop
大数据
分布式
【解决】HDFS JournalNode启动慢问题排查
文章目录一.问题描述二.问题分析1.排查机器性能2.DNS的问题三.问题解决1.修复DNS服务2.添加主机映射为0.0.0.03.修改
hadoop
源码一句话:因为dns的问题导致journalnode启动时很慢
roman_日积跬步-终至千里
·
2023-11-29 20:12
hadoop运维
hdfs
网络
hadoop
大数据之HBase教程
大数据的出现后,好多公司实现处理大数据并从中受益,并开始选择像
Hadoop
的解决方案。
Hadoop
使用分布式文件系统,用于存储大数据,并使用MapReduce来处理。
@轻流
·
2023-11-29 20:00
Hbase
大数据
大数据之Hbase(心得)
什么是HBase(1)HBase的原型是Google的BigTable论文,受到了该论文思想的启发,目前作为
Hadoop
的子项目来开发维护,用于支持结构化的数据存储。
宝宝不哭^_^
·
2023-11-29 20:30
心得体会
Hbase
大数据技术之 HBase安装配置
大数据技术之HBase安装1.hbase依赖于
hadoop
以及zookeeper,所以1.1首先my
hadoop
.shstart1.2然后zk.shstart接下来安装hbase1.3HBase的解压[
大数据小理
·
2023-11-29 20:57
hbase
大数据
hbase
大数据
hadoop
大数据之HBase
HBase介绍Apache的三篇论文,GFS谷歌文件系统->HDFS;MR->MR;BigTable->HBase;HBase是
hadoop
数据库,一种分布式、可扩展的大数据NoSQL数据库之一。
十七✧ᐦ̤
·
2023-11-29 20:55
大数据
hbase
数据库
如何能打进去idea引入外部jar包
文件中加入下面代码:org.apache.maven.pluginsmaven-war-plugin3.2.3${project.basedir}/libWEB-INF/lib/**/*.jar然后导入依赖即可com
hadoop
-hdfs-client2.7
一个正在努力的小白码农
·
2023-11-29 19:57
intellij-idea
jar
Module-Spark使用文档
1.1.Spark说明ApacheSpark是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一,与
Hadoop
SuperScfan
·
2023-11-29 17:21
HBase的微博案例
HBase的微博案例1.实验环境说明2.实验目的3.实验步骤3.1正常启动
HADOOP
、ZOOKEEPER3.2启动HBASE3.3实验步骤3.3.1先把虚拟机的地址映射加入到windows下的Hosts3.3.2
YGSBlog
·
2023-11-29 15:05
HBase
hbase
hadoop
大数据
HBase初识之学生心得总结
c、HBase:理解为
Hadoop
base--3.大数据框架:a、数据的存储:hdfs/hive/hbaseb、数据的传输:flume/sqoopc、数据的计算
程序员驴子酱
·
2023-11-29 15:33
大数据
大数据技术基础实验五:Zookeeper实验——部署ZooKeeper
实验目的与要求三、实验原理四、实验步骤1、安装JDK2、修改ZooKeeper配置文件3、启动ZooKeeper集群4、查看java进程和ZooKeeper集群目录五、最后我想说一、前言本期我们将学习
Hadoop
-北天-
·
2023-11-29 15:03
大数据学习
大数据
java-zookeeper
zookeeper
hadoop
安装
简介
Hadoop
是一个开源的分布式存储和计算框架,最初由Apache软件基金会开发。
necessary653
·
2023-11-29 14:11
hadoop
大数据
分布式
Spark 学习笔记3. spark-submit + spark-shell
spark-submit:相当于
hadoop
jar命令--->提交MapReduce任务(jar文件)提交Spark的任务(jar文件)Spark提供Example例子:/root/training/spark
aimmon
·
2023-11-29 12:05
Spark
spark-submit
spark-shell
基于
hadoop
的商品推荐系统_基于知识图谱的推荐系统
作为大数据应用的两大类应用,搜索引擎和推荐系统既相互伴随和影响,又满足不同的产品需求。在作为互联网产品的连接器:连接人、信息、服务之间的桥梁,搜索和推荐有其各自的特点移联动互网、人工智能等技术的迅速发展为人们的工作生活带来了很多便利,用户面临着海量的信息,传统的搜索算法只能呈现给用户相同的物品排序结果,无法针对不同用户的兴趣爱好提供相应的服务。信息爆炸使得信息的利用率反而降低,这种现象被称为信息超
weixin_39936086
·
2023-11-29 12:26
基于hadoop的商品推荐系统
基于jsp的网上推荐系统
R
Hadoop
实践系列之三 R实现MapReduce的协同过滤算法
1.基于物品推荐的协同过滤算法介绍2.R本地程序实现3.R基于
Hadoop
分步式程序实现每一章节,都会分为”文字说明部分”和”代码部分”,保持文字说明与代码的连贯性。
wbj0110
·
2023-11-29 12:26
Hadoop家族
Hadoop家族
R实现MapReduce的协同过滤算法
基于物品推荐的协同过滤算法介绍R本地程序实现R基于
Hadoop
分布式程序实现1.基于物品推荐的协同过滤算法介绍文字说明部分:越来越多的互联网应用,都开始使用推荐算法(协同过滤算法)。
Gold_Spring
·
2023-11-29 12:46
Mahout
r语言
Mahout
mapreduce
协同过滤算法
基于
Hadoop
的异构网络协同过滤推荐算法设计
基于
Hadoop
的异构网络协同过滤推荐算法设计基于
Hadoop
的异构网络协同过滤推荐算法设计DesignofHeterogeneousNetworkCollaborativeFilteringRecommendationAlgorithmbasedon
Hadoop
wusp1994
·
2023-11-29 12:43
hadoop
推荐算法
大数据
Flink读取MongoDB中的数据
1.pom.xml添加相关依赖org.apache.flinkflink-
hadoop
-compatibility_2.111.6.0org.mongodb.mongo-
hadoop
mongo-
hadoop
-core2.0.02
fantasticMao
·
2023-11-29 08:01
5. MapReduce 和 Yarn 技术原理【华为HCIA-BigData】
5.1导读本章主要讲述大数据领域中最著名的批处理与离线处理计算框架MapReduce,包括MapReduce的原理、流程、使用场景,以及
Hadoop
集群中负责统一的资源管理与调度的组件Yarn,包括Yarn
Mengo_x
·
2023-11-29 08:45
BigData
hadoop
mapreduce
yarn
大数据
HCIA-Big Data V3.0 华为认证大数据工程师在线课程章节测试题汇总
1.大数据发展趋势与鲲鹏大数据1、(单选)以下哪个不是大数据时代新兴的技术:A.HBaseB.
Hadoop
C.MySQLD.Spark正确答案:C2、(单选)第三次信息化浪潮的标志是:A.云计算、大数据
gaogao_jack
·
2023-11-29 08:11
华为ICT
华为认证
大数据
华为云
华为
使用Spark Streaming处理Kafka数据流
1系统软件本文实验基于的各软件版本如下:Java1.8.0_191Scala2.11
hadoop
-3.0.3zookeeper-3.4.10Spark2.3.2kafka_2.12-2.0.1kafka-manager
打酱油的葫芦娃
·
2023-11-29 07:28
大数据
spark
kafka
linq
Spark Streaming的基本数据流
在大数据环境中,尤其是使用
Hadoop
分布式文件系统(HDFS)时,数据通常被认为是静态的,这是因为HDFS被设计成适合一次写入和多次读取的场景
俺会hello我的
·
2023-11-29 07:55
spark
大数据
数据仓库
启动集群时datanode进程没有启动 执行jps没有datanode的解决方法 亲测有效Incompatible clusterIDs in /export/servers/
hadoop
-3.1
执行jps查看进程时没有datanode进程:另外可以检查日志文件catlogs/
hadoop
-root-datanode-
hadoop
101.log#查看最新的log文件可以看到的是,这里给出的错误提示信息是
'一生所爱
·
2023-11-29 06:43
分布式
hadoop
big
data
数据库
大数据
阿里云服务器搭建
Hadoop
报错“Incompatible clusterIDs”“Excluding datanode”“Cannot assign requested address”
阿里云服务器搭建
Hadoop
确实有一些坑,以下进行一个错误总结记录:!!
暮月七
·
2023-11-29 06:40
云计算
Hadoop
hadoop
服务器
阿里云
hadoop
启动datanode报错:Incompatible clusterIDs in
Hadoop
版本为3.1.2。在启动datanode时报错,日志如下:意思是namenode的集群ID和datanode的集群ID不一致。解决方案:将datanode存放数据的文件目录清空。
兔帮大人
·
2023-11-29 06:09
大数据
hadoop
解决
Hadoop
DataNode ‘Incompatible clusterIDs‘报错
问题启动
hadoop
时报错Failedtoaddstoragedirectory2023-11-2612:02:06,840WARNcommon.Storage:Failedtoaddstoragedirectory
gcygeeker
·
2023-11-29 06:03
BigData
hadoop
大数据
分布式
hadoop
集群环境搭建和常用命令
搭建过程1.集群配置cat/etc/hosts2.步骤安装Java是否安装whichjava或者echo$JAVA_HOME3.解压安装包tar-zxvf4.修改配置文件cd$
HADOOP
_HOME/etc
Logan_addoil
·
2023-11-29 05:04
大数据学习之旅
hadoop
大数据
分布式
Linux安装flume并实现监控文件
sudotar-zxvfflume-ng-1.6.0-cdh5.6.0.tar.gz步骤3.更名成flumesudomvapache-flume-1.6.0-cdh5.6.0-binflume步骤4.修改权限为
hadoop
sudochown
思君_4cd3
·
2023-11-29 02:56
【Spark入门】基础入门
【大家好,我是爱干饭的猿,本文重点介绍Spark的定义、发展、扩展阅读:SparkVS
Hadoop
、四大特点、框架模块、运行模式、架构角色。
爱干饭的猿
·
2023-11-29 02:30
spark
spark
大数据
分布式
(四)
Hadoop
HA高可用集群的配置-Zookeeper的安装
目录一、目的及要求:二、环境要求:三、操作步骤:项目一:Zookeeper的基本安装配置项目二:Zookeeper完全分布模式配置(在admin用户下进行)项目三:同步安装和配置项目四:配置Zookeeper节点标识文件(在admin)用户下进行项目五:Zookeeper完全分布模式启动和验证(所有主机的admin用户下进行)四、可能会遇到的问题:一、目的及要求:实验目的:掌握完全分布模式的整合平
T.machine
·
2023-11-28 23:27
云存储技术
Zookeeper的安装
Hadoop
HA高可用集群的配置
KerberOS
Hadoop
认证安装配置
安装yum源配置参考3.安装kerberos的server端4.配置krb5.conf文件5.配置kdc.conf6.配置kadm5.acl文件7.初始化kerberos库8.Kerberos客户端9.
hadoop
kerberos
夜古诚
·
2023-11-28 23:54
hadoop
Linux
hadoop
linux
kerberos
Bigtop介绍
Bigtop是一个工程的系统开发包,对Apache
Hadoop
生态系统的测试。Bigtop的主要目标就是构建一个Apache
Hadoop
生态系统的包和交互式测试的社区。
未竟
·
2023-11-28 21:24
大数据组件
bigtop
hive总结
当处理的数据量非常大时,单一的MySQL数据库无法满足需求,需要使用分布式存储和处理工具,如
Hadoop
和Hive。
墨苏玩电脑
·
2023-11-28 18:26
hive
hadoop
数据仓库
大数据实验:MapReduce的编程实践
环境说明VMware+Ubantu18.04桌面版本+
Hadoop
3.2.1+Eclipse2021在开始实验之前,先把
hadoop
启动起来!!,不然后续程序会有问题!!start-all.sh
jiachengren
·
2023-11-28 16:46
大数据
mapreduce
hadoop
大数据
大数据技术基础实验四:HDFS实验——读写HDFS文件
大数据技术基础实验四:HDFS实验——读写HDFS文件文章目录大数据技术基础实验四:HDFS实验——读写HDFS文件一、前言二、实验目的三、实验原理1、JavaClasspath2、Eclipse
Hadoop
-北天-
·
2023-11-28 16:13
大数据学习
hdfs
大数据
hadoop
大数据编程技术基础实验八:Flume实验——文件数据Flume至HDFS
Flume至HDFS文章目录大数据编程技术基础实验八:Flume实验——文件数据Flume至HDFS一、前言二、实验目的三、实验要求四、实验原理1、flume的特点2、flume的可靠性五、实验步骤1、启动
Hadoop
-北天-
·
2023-11-28 16:13
大数据学习
大数据
hdfs
flume
大数据处理实验(三)HDFS基本操作实验
HDFS基本操作实验1、
Hadoop
配置环境变量2、列出当前目录下的文件3、级联创建一个文件夹,类似这样一个目录:/mybook/input4、上传文件至HDFS5、从HDFS上下载文件6、查看HDFS
吱唔朱_
·
2023-11-28 16:43
大数据处理
hadoop
mapreduce
大数据
hdfs
云计算实验1 基于
Hadoop
的云计算平台配置和map-reduce编程案例
一、实验目的本实验考察学生
Hadoop
平台下的环境配置、分布式文件存储操作和管理以及基于
Hadoop
的分布式编程的设计与实现。
MrNeoJeep
·
2023-11-28 16:43
#
云计算
hadoop
云计算
大数据
HDFS-实验指导书 -更新
Hadoop
02核心介绍1.HDFSHDFS(
Hadoop
DistributedFileSystem)是一个ApacheSoftwareFoundation项目,是Apache
Hadoop
项目的一个子项目
撒娇的猫
·
2023-11-28 16:42
hdfs
hadoop
big
data
HDFS与Hive实战 + 滴滴出行数据分析
HDFS与Hive实战+滴滴出行数据分析1.HDFS1.1分布式文件系统1.2HDFS的Shell命令行1.3启动
Hadoop
集群1.4大数据环境清单2.数据仓库2.1数据仓库与数据库区别3.Hive3.1
jialun0116
·
2023-11-28 16:41
大数据
Hive
数据仓库
数据库
数据仓库
数据挖掘
hadoop
大数据
上一页
41
42
43
44
45
46
47
48
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他