E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
集群搭建Hadoop
Hadoop
入门笔记
第1章
Hadoop
概述1.1
Hadoop
是什么1.2
Hadoop
发展历史(了解)1.3
Hadoop
三大发行版本(了解)
Hadoop
三大发行版本:Apache、Cloudera、Hortonworks。
阳宝宝的向日葵
·
2023-11-30 05:44
大数据
hadoop
hdfs
big
data
Hadoop
入门+组成学习笔记
Hadoop
学习笔记
Hadoop
的优势(4高)1.高可靠性—
Hadoop
底层有多个数副本,保存再不同的服务器里,即使一台计算机出现故障,也不会丢失数据2.高扩展性—可以添加多个节点3.高效性—再MapReduce
Fan_Coder
·
2023-11-30 05:14
Hadoop
hadoop
大数据
mapreduce
Hadoop
入门学习笔记-第五天(
hadoop
-hive安装部署与配置笔记)
1.准备安装包:MySQL-5.6.26-1.linux_glibc2.5.x86_64.rpm-bundlemysql-connector-java-5.1.39.jar(驱动,需要放入/hive/lib)apache-hive-1.2.1-bin.tar.gz2.安装mysql数据用于储存元数据,hive自带Derby,但该数据库不稳定,使用mysql作为元数据管理1).只需要安装在集群里面的
渣男程序员007
·
2023-11-30 05:44
Hadoop入门学习笔记
数据库
hadoop
mysql
java
hive
Hadoop
入门学习笔记-第六天(hive数据库命令相关操作)
hive命令行操作/user/hive/warehouse(hdfs目录))说明:hive创建的数据库和数据库表都存在hdfs,一般默认目录为:/user/hive/warehouse1…创建hive的数据库1.hive创建数据库的最简单写法和mysql差不多:createdatabasefoo;2.仅当名为foo的数据库当前不存在时才创建:createdatabaseifnotexistsfoo
渣男程序员007
·
2023-11-30 05:44
Hadoop入门学习笔记
hadoop
数据库
java
hive
mysql
Hadoop
入门学习笔记
视频课程地址:https://www.bilibili.com/video/BV1WY4y197g7课程资料链接:https://pan.baidu.com/s/15KpnWeKpvExpKmOC8xjmtQ?pwd=5ay8这里写目录标题一、VMware准备Linux虚拟机1.1.VMware安装Linux虚拟机1.1.1.修改虚拟机子网IP和网关1.1.2.安装Linux虚拟机1.2.VMwa
faith瑞诚
·
2023-11-30 05:43
hadoop
学习
笔记
Hadoop
入门学习笔记-第四天(wordCount实例代码编写笔记)
1.新建一个maven项目2.pom文件中引入以下jar包org.apache.
hadoop
hadoop
-client2.7.3org.apache.
hadoop
hadoop
-common2.7.3org.apache.
hadoop
hadoop
-hdfs2.7.3org.apache.
hadoop
hadoop
-client2.7.33
渣男程序员007
·
2023-11-30 05:43
Hadoop入门学习笔记
java
大数据
hadoop
mapreduce
spark
Hadoop
入门学习笔记-第二天 (HDFS:NodeName高可用集群配置)
说明:hdfs:nn单点故障,压力过大,内存受限,扩展受阻。hdfsha:主备切换方式解决单点故障hdfsFederation联邦:解决鸭梨过大。支持水平扩展,每个nn分管一部分目录,所有nn共享dn资源。使用JN集群保证数据一致性,使用zk集群解决主备切换1.若使用主备节点,常常存在的问题:强一致性,若一致性。强一致性(同步):nn主节点必须等到nn副本返回成功后,才能向客户端返回成功。主和副本
渣男程序员007
·
2023-11-30 05:13
Hadoop入门学习笔记
hadoop
java
大数据
hdfs
Hadoop
入门学习笔记-第三天(Yarn高可用集群配置及计算案例)
什么是mapreduce首先让我们来重温一下
hadoop
的四大组件:HDFS:分布式存储系统MapReduce:分布式计算系统YARN:
hadoop
的资源调度系统Common:以上三大组件的底层支撑组件
渣男程序员007
·
2023-11-30 05:13
Hadoop入门学习笔记
分布式
hadoop
大数据
spark
mapreduce
Flink-shell
1.FlinkSQl客户端启动一个flink的集群可以使用flink独立集群,也可以使用yarn-session.sh1.启动
Hadoop
集群2.yarn-session.sh-d3.sql-client.sh1.1sql-client.sh-isql-client.sh-i
大学生爱编程
·
2023-11-30 04:46
flink
hadoop
大数据
Spark3 on Yarn分布式集群安装部署(YARN模式)
Spark3onYarn分布式集群安装部署一、配置spark-defaults.conf二、配置spark-env.sh三、配置yarn-site.xml四、启动
Hadoop
和Spark集群五、基于YARN
最笨的羊羊
·
2023-11-30 03:57
大数据
Spark3.0.1
分布式集群搭建
spark on yarn模式安装部署
配置spark之前,请自行部署
Hadoop
2.7.2,JDK1.8,ssh免密码登录等准备工作。
乖乖猪001
·
2023-11-30 03:56
大数据
spark
Spark集群安装(On Yarn)
说明:基于已经搭建完成的
Hadoop
集群,关于
Hadoop
集群搭建
,可参考:https://blog.csdn.net/weixin_37901366/article/details/13017066一
maplea2012
·
2023-11-30 03:55
Spark
spark
大数据
hadoop
【Spark】on yarn集群模式安装部署
官方文档http://spark.apache.org/docs/latest/running-on-yarn.html前提安装启动
Hadoop
(需要使用HDFS和YARN)安装单机版Spark不需要集群
没去过埃及的法老
·
2023-11-30 03:23
Sprak
大数据
spark
on
yarn集群模式
安装部署
云计算/大数据
Spark on YARN的部署
SparkonYARN的原理就是依靠yarn来调度Spark,比默认的Spark运行模式性能要好的多,前提是首先部署好
hadoop
HDFS并且运行在yarn上,然后就可以开始部署sparkonyarn了
GoodInSun
·
2023-11-30 03:23
spark
spark
on
yarn
spark on yarn集群的安装与搭建
注:(搭建sparkonyarn需要jdk,
hadoop
环境,其搭建可参照前面jdk和
hadoop
的安装与搭建).1.解压spark安装包[root@master/]#tar-zxvf/h3cu/spark
爱做梦的小鱼。
·
2023-11-30 03:52
我的笔记
大数据
hadoop
spark
hadoop
大数据
spark on yarn 安装部署
准备下载spark,地址:http://spark.apache.org/downloads.html下载不带
hadoop
预编译环境的spark最新版本,好处是可以自由使用最新版本的
hadoop
下载
hadoop
积极流年
·
2023-11-30 03:51
spark
ambari部署
hadoop
ambari搭建
hadoop
集群为何选用ambari安装前准备部署节点间做免密登陆搭建nginx服务创建repo源安装mysql服务安装ambari服务启动ambari服务登陆ambari-ui配置为何选用
hello_world_99
·
2023-11-30 03:23
大数据技术
大数据运维
大数据开发
大数据
hadoop
运维
ambari运维问题记录
综合问题记录1、hdfs无法启动错误:2018-04-2514:36:09,293-Retryingafter10seconds.Reason:Executionof'/usr/hdp/current/
hadoop
-hdfs-namenode
人生匆匆
·
2023-11-30 03:23
ambari
ambari
运维
hadoop
本地IDEA、spark程序远程读取hive数据
1下载winutilsgithub-winutils各个版本集合下载里面和自己服务器版本对应的,配置
HADOOP
_HO
一加六
·
2023-11-30 02:08
大数据
hive
spark
idea对spark程序进行远程提交和调试
第一部分远程提交本文以WordCount程序来实现idea对spark程序进行远程提交和调试环境利用虚拟机搭建拥有3台主机的spark集群
hadoop
102
hadoop
103
hadoop
104IntelliJIDEA2020.3.2
akenseren
·
2023-11-30 02:06
大数据
spark
hive
大数据
Hadoop
大数据开发__Spark on YARN模式分布式集群安装部署
1、下载解压sparkcd/home/
hadoop
/apptar-zxvfspark-3.3.0-bin-
hadoop
3.tgzrmspark-3.3.0-bin-
hadoop
3.tgzln-sspark
姚华军
·
2023-11-30 02:32
大数据
大数据
hadoop
spark
Spark
on
YARN
YARN
spark写出分布式的训练算法_Spark分布式计算执行模型
引言相对
Hadoop
,Spark在处理需要迭代运算的机器学习训练等任务上有着很大性能提升,同时提供了批处理、实时数据处理、机器学习以及图算法等一站式的服务,因此最近大家一起来学习Spark,特别是MLLib
weixin_39965673
·
2023-11-30 02:01
spark写出分布式的训练算法
Spark 分布式环境搭建
Spark分布式环境搭建1.scala环境搭建1)下载scala安装包scala2.12.10.tgz安装到/usr/scala[root@
hadoop
001scala]#tar-zxvfscala-2.12.10
陈同学�
·
2023-11-30 02:01
spark
分布式
scala
Spark完全分布式搭建
Spark完全分布式搭建教程(Standalone:Master+Slave)分析:1.配置好IP2.修改主机名3.做好IP主机映射4.关闭防火墙5.配置SSH免密登入6.安装Java7.安装
Hadoop
明天要开心
·
2023-11-30 02:00
大数据
spark
分布式
Spark2.3.1的安装运行(伪分布式)
一、spark的安装1、本地安装1、在安装spark之前需要先安装JDK和scala环境,
hadoop
环境2、解压安装即可2、standalone安装模式1、解压安装,配置环境变量(通过spark-shell
翻斗花园牛爷爷..
·
2023-11-30 02:30
分布式
spark
hadoop
搭建Spark伪分布式
文章目录零、本讲学习目标一、搭建伪分布式
Hadoop
(一)登录ied虚拟机(二)配置免密登录1、在ied虚拟机上生成密钥对2、将生成的公钥发送到本机3、验证虚拟机是否能免密登录本机(三)下载与Spark
jzy2024
·
2023-11-30 02:00
spark
分布式
hadoop
Spark完全分布式搭建(On Yarn)
目录一、集群规划二、配置Spark路径三、修改配置文件1.spark-env.sh2.修改slaves文件四、启动集群1.先起动
Hadoop
的HDFS和Yarn2.启动Spark五、Web查看集群启动情况六
Congee小周
·
2023-11-30 02:00
大数据
hadoop
spark
完全分布式
spark-env.sh
slaves
Spark分布式安装模式
Spark分布式环境安装目前有四种模式:1.Standalone:Spark自带的简单群资源管理器,安装较为简单,不需要依赖
Hadoop
;2.
Hadoop
YARN:使用YARN作为集群资源管理,安装需要依赖
qq_58647543
·
2023-11-30 02:59
spark
spark
分布式
抖音SEO矩阵系统源码开发关键要素详解!
在该系统的开发过程中,多种编程语言(如Java、Python等)和框架技术(如
Hadoop
、Spark、PyTorch等)被应用,以提高数据处理和分析的效率。
矩阵源码_Muoyu111
·
2023-11-30 01:26
短视频矩阵系统开发
矩阵
线性代数
The Log: What every software engineer should know about real-time data's unifying abstraction
LinkIn2013年的日志与流处理架构,bolg中涉及到了大量的参考资料,与我的架构类似,但是基于JAVA
Hadoop
生态,并用Kafka作为日志底层文章地址:https://engineering.linkedin.com
doubeye
·
2023-11-30 00:23
谨慎Apache-Zookeeper-3.5.5以后在CentOS7.X安装的坑
资源环境列表如下:序号依赖组件说明1jdk-8u201-linux-x64.tar.gz基础的jdk依赖2
hadoop
-3.1.3.tar.gz
hadoop
依赖3apache-zookeeper-3.5.7
夜郎king
·
2023-11-30 00:25
数据库技术
zookeeper
分布式
云原生
数据中台·实时开发计算平台
在数据中台中,不同计算引擎对应不同的数据处理场景,
Hadoop
、MPP(g
数据先生
·
2023-11-30 00:33
数据仓库
大数据
职场和发展
数据库
数据挖掘
ElasticSearch非权威完整指南(实战)
ES基础什么是eslucene和es的关系es解决的问题es的工作原理es的核心概念安装快速开始安装ik分词插件
集群搭建
集群管理需要多大的集群规模集群节点角色分配防脑裂索引分片数量设置分
fastji
·
2023-11-29 23:51
elasticsearch
大数据
数据库
搜索引擎
nosql
spark-submit:未找到命令
在执行过程中出现错误
hadoop
@Master:~/sparkapp$spark-submit--class"hw10_1_CountLine"/usr/local/spark/sparkapp/target
ZYT_庄彦涛
·
2023-11-29 22:02
报错
Spark
spark
大数据
flink AskTimeoutException异常
java.util.concurrent.CompletionException:akka.pattern.AskTimeoutException:Asktimedouton[Actor[akka.tcp://
[email protected]
.
hadoop
Jackson_Tan
·
2023-11-29 22:48
Spark面试题
(☆☆☆☆☆)1)本地模式 Spark不一定非要跑在
hadoop
集群,可以在本地,起多个线程的方式来指定。
終于、
·
2023-11-29 22:38
hadoop
源码解读
一、
hadoop
rpc总结1、RPC指的是不同进程的方法调用,分为客户端和服务端,客户端调用服务端的方法,方法的执行在服务端。
半_调_子
·
2023-11-29 21:10
hadoop
大数据
分布式
Redis 面试常问问题
Redis系列笔记:第一篇:Redis基础命令第二篇:Redis常见应用场景第三篇:RedisCluster
集群搭建
第四篇:Redis主从及哨兵搭建第五篇:Redis主从及集群第六篇:Redis持久化第七篇
云三木
·
2023-11-29 21:30
Redis
redis
数据库
【解决】HDFS JournalNode启动慢问题排查
文章目录一.问题描述二.问题分析1.排查机器性能2.DNS的问题三.问题解决1.修复DNS服务2.添加主机映射为0.0.0.03.修改
hadoop
源码一句话:因为dns的问题导致journalnode启动时很慢
roman_日积跬步-终至千里
·
2023-11-29 20:12
hadoop运维
hdfs
网络
hadoop
大数据之HBase教程
大数据的出现后,好多公司实现处理大数据并从中受益,并开始选择像
Hadoop
的解决方案。
Hadoop
使用分布式文件系统,用于存储大数据,并使用MapReduce来处理。
@轻流
·
2023-11-29 20:00
Hbase
大数据
大数据之Hbase(心得)
什么是HBase(1)HBase的原型是Google的BigTable论文,受到了该论文思想的启发,目前作为
Hadoop
的子项目来开发维护,用于支持结构化的数据存储。
宝宝不哭^_^
·
2023-11-29 20:30
心得体会
Hbase
java异常问题处理 工具教程博客目录汇总
分页插件-CSDN博客sql语句操作执行新增语句后返回主键属性_sql新增后返回主键-CSDN博客虚拟机安装部署redis启动五种数据类型key命令(过期时间)redis持久化方案-CSDN博客redis
集群搭建
简单使用项目中
T浩浩
·
2023-11-29 20:00
java
开发语言
大数据技术之 HBase安装配置
大数据技术之HBase安装1.hbase依赖于
hadoop
以及zookeeper,所以1.1首先my
hadoop
.shstart1.2然后zk.shstart接下来安装hbase1.3HBase的解压[
大数据小理
·
2023-11-29 20:57
hbase
大数据
hbase
大数据
hadoop
大数据之HBase
HBase介绍Apache的三篇论文,GFS谷歌文件系统->HDFS;MR->MR;BigTable->HBase;HBase是
hadoop
数据库,一种分布式、可扩展的大数据NoSQL数据库之一。
十七✧ᐦ̤
·
2023-11-29 20:55
大数据
hbase
数据库
如何能打进去idea引入外部jar包
文件中加入下面代码:org.apache.maven.pluginsmaven-war-plugin3.2.3${project.basedir}/libWEB-INF/lib/**/*.jar然后导入依赖即可com
hadoop
-hdfs-client2.7
一个正在努力的小白码农
·
2023-11-29 19:57
intellij-idea
jar
Module-Spark使用文档
1.1.Spark说明ApacheSpark是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一,与
Hadoop
SuperScfan
·
2023-11-29 17:21
HBase的微博案例
HBase的微博案例1.实验环境说明2.实验目的3.实验步骤3.1正常启动
HADOOP
、ZOOKEEPER3.2启动HBASE3.3实验步骤3.3.1先把虚拟机的地址映射加入到windows下的Hosts3.3.2
YGSBlog
·
2023-11-29 15:05
HBase
hbase
hadoop
大数据
HBase初识之学生心得总结
c、HBase:理解为
Hadoop
base--3.大数据框架:a、数据的存储:hdfs/hive/hbaseb、数据的传输:flume/sqoopc、数据的计算
程序员驴子酱
·
2023-11-29 15:33
大数据
大数据技术基础实验五:Zookeeper实验——部署ZooKeeper
实验目的与要求三、实验原理四、实验步骤1、安装JDK2、修改ZooKeeper配置文件3、启动ZooKeeper集群4、查看java进程和ZooKeeper集群目录五、最后我想说一、前言本期我们将学习
Hadoop
-北天-
·
2023-11-29 15:03
大数据学习
大数据
java-zookeeper
zookeeper
hadoop
安装
简介
Hadoop
是一个开源的分布式存储和计算框架,最初由Apache软件基金会开发。
necessary653
·
2023-11-29 14:11
hadoop
大数据
分布式
上一页
47
48
49
50
51
52
53
54
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他