E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
2.Hadoop
大数据之Spark:Spark大厂面试真题
2.hadoop
和spark使用场景?3.spark如何保证宕机迅速恢复?4.hadoop和spark的相同点和不同点?5.RDD持久化原理?checkpoint检查点机制?
浊酒南街
·
2024-02-01 12:35
大数据系列三
spark
big
data
面试
Hadoop基本概论
目录一、大数据概论1.大数据的概念2.大数据的特点3.大数据应用场景二、Hadoop概述1.Hadoop定义
2.Hadoop
发展历史3.Hadoop发行版本4.Hadoop优势5.Hadoop1.x/2
LzYuY
·
2024-01-22 08:25
Hadoop
hadoop
大数据
分布式
【学习笔记】尚硅谷Hadoop大数据教程笔记
一、Hadoop入门大数据的特点:Volume(大量)Velocity(高速)Variety(多样)Value(低价值密度)1.Hadoop概念是一个分布式系统基础架构
2.Hadoop
优势高可靠高扩展性高效性高容错性
棉花糖灬
·
2024-01-09 23:17
大数据
大数据
hadoop
MapReduce
yarn
hdfs
2024.1.5 Hadoop各组件工作原理,面试题
目录1.简述下分布式和集群的区别
2.Hadoop
的三大组件是什么?3.请简述hive元数据服务配置的三种模式?4.数据库与数据仓库的区别?5.简述下数据仓库经典三层架构?
白白的wj
·
2024-01-06 23:34
hadoop
hive
zookeeper
spark
数据仓库
mapreduce
hdfs
Spark与PySpark(1.概述、框架、模块)
目录1.Spark概念
2.Hadoop
和Spark的对比3.Spark特点3.1运行速度快3.2简单易用3.3通用性强3.4可以允许运行在很多地方4.Spark框架模块4.1SparkCore4.2SparkSQL4.3SparkStreaming4.4MLlib4.5GraphX5
还是那个同伟伟
·
2023-12-27 18:06
Spark
spark
大数据
分布式
python
2018-06-14
Hadoop:1.官网:http://hadoop.apache.org/
2.Hadoop
的狭义和褒义认识:狭义:软件(HDFS、MapReduce、Yarn)褒义:以Hadoop为主的生态圈3.Hadoop
hoose
·
2023-12-17 09:26
大数据Hadoop技术的发展历史与未来前景
3)广义上来说,HADOOP通常是指一个更广泛的概念——HADOOP生态圈
2.Hadoop
发展历史1)Lucene–DougCutting开创的开源软件,用java书写代码,
人工智能和大数据时代
·
2023-12-03 14:04
大数据
Hadoop
大数据系列-Hadoop集群搭建(2)集群配置
目录1.初步认识Hadoop1.1模块认知1.2关联工程/项目1.3Hadoop架构1.3.1HDFS架构1.3.2YARN架构
2.Hadoop
部署规划2.1节点规划2.2端口规划3.Hadoop集群配置
zhm6422107
·
2023-11-17 03:59
大数据
hadoop
big
data
hdfs
大数据分布式集群搭建(5)
下面我们来操作大数据中的重头戏Hadoop1.HADOOP背景介绍1.1什么是HADOOP1.HADOOP是apache旗下的一套开源软件平台
2.HADOOP
提供的功能:利用服务器集群,根据用户的自定义业务逻辑
KongX_B
·
2023-11-17 03:25
大数据
大数据
hadoop
分布式
集群
2023.11.8 hadoop学习-概述,hdfs dfs的shell命令
目录1.分布式和集群
2.Hadoop
框架3.版本更新4.hadoop架构详解5.页面访问端口6.Hadoop-HDFSHDFS架构HDFS副本7.SHELL命令8.启动hive服务1.分布式和集群分布式
白白的wj
·
2023-11-10 12:54
hadoop
学习
大数据
大数据复习考试
填空题—范围(10*2)1.大数据概念,
2.Hadoop
概念及两个配置文件:hadoop-env.sh,core-site.xml3.HDFS概念及底层结构,4.HBASE数据模型及原理简答题—范围(10
我叫小武,不是跳舞的舞
·
2023-11-03 14:19
大数据
hadoop
spark
经验分享
大数据面试题汇总
2.hadoop
和spark使用场景?3.spark如何保证宕机迅速恢复?4.hadoop和spark的相同点和不同点?5.RDD持久化原理?6.checkpoint检查点机制?
kuntoria
·
2023-10-25 20:28
hadoop面试题
1.从前到后从你教育背景(学过哪些课)到各个项目你负责的模块,问的很细(本以为他是物理学博士,但是所有的技术都懂)
2.hadoop
的namenode宕机,怎么解决先分析宕机后的损失,宕机后直接导致client
清沐挽曦
·
2023-10-23 01:03
java
大数据
hadoop
hadoop
Windows下搭建hadoop 搭建本地hadoop开发环境
一、下载所需文件1.JDK下载地址:点击打开链接
2.Hadoop
下载地址:点击打开链接3.Windows下安装Hadoop工具下载地址:点击打开链接密码:yk9u二、jdk安装1.不会看这里点击打开链接三
生活的探路者
·
2023-10-21 05:48
【数据仓库】hadoop生态圈与数据仓库
文章目录1.大数据定义
2.Hadoop
与数据仓库3.关系数据库的可扩展性瓶颈4.CAP理论5.Hadoop数据仓库工具5.1.RDS和TDS5.2.抽取过程5.3.转换与装载过程5.4.过程管理和自动化调度
roman_日积跬步-终至千里
·
2023-10-19 11:12
数据仓库
数据仓库
hadoop
大数据
大数据编程实验3 熟悉常用的HBase操作前期准备
二、实验平台1.操作系统:Linux(建议Ubuntu16.04或Ubuntu18.04);
2.Hadoop
版本:3.1.3;3.HBase版本:2.2.2;4.JDK版本:1.8;5.JavaIDE:
Blossom i
·
2023-10-11 01:25
大数据编程
hbase
大数据
hadoop
【大数据】Hadoop 生态系统及其组件
Hadoop生态系统及其组件1.Hadoop生态系统的组成
2.Hadoop
生态系统简介2.1HDFS2.2MapReduce2.3YARN2.4Hive2.5Pig2.6HBase2.7HCatalog2.8Avro2.9Thrift2.10Drill2.11Mahout2.12Sqoop2.13Flume2.14Ambari2.15Zookeeper2.16Oozie1
G皮T
·
2023-10-10 02:36
#
Hadoop
hadoop
big
data
大数据
hdfs
hive
mapreduce
yarn
Linux和Hadoop的学习
目录1.Linux的常用快捷键
2.Hadoop
集群部署问题汇总1.Linux的常用快捷键复制:Ctrl+shift+C粘贴:Ctrl+shift+VTAB:补全命令编写输入:i退出编写:esc保存并退出
蓝翔技校的码农
·
2023-10-07 05:26
linux
hadoop
学习
实验五 熟悉 Hive 的基本操作
2.Hadoop
版本:3.3.0。3.Hive版本:3.1.2。4.JDK版本:1.8。实验内容与完成情况:(1)创建一个内部表stocks,字段分隔符为英文逗号,表结构如表A-6所示。
谢三公主
·
2023-09-28 18:58
课程作业
软件质量保证+Java
web技术课程实验
hive
hadoop
数据仓库
一、大数据技术基础——分布式文件系统HDFS
目录1.引入1.1.传统存储系统面临的难题1.2.解决之道
2.Hadoop
集群架构3.HDFS1.03.1.概念3.2.Block块3.3.NameNode维护文件:fsimage与editlog3.4
百颂伊
·
2023-09-28 02:48
大数据技术基础学习笔记
hadoop
大数据
【02】Hadoop简介及安装
2.Hadoop
特点3.Hadoop中5个重要的进程二、Hadoop的安装·伪分布式模式安装1.下载Hadoop2.安装Hadoop3.配置Hadoop4.格式化文件系统。5.启动Hadoop并验证。
忻辰i
·
2023-09-18 05:21
hadoop
大数据重点知识点
Volume(大量)2.Velocity(高速)3.Variety(多样)4.value(低价值密度)二.大数据的应用场景(了解)三.大数据业务流程(无所谓)四.Hadoop入门1.hadoop基本介绍(了解)
2.
指尖数据
·
2023-09-14 14:55
大数据
hadoop
20180521早课记录14-Hadoop
1.hadoop是什么狭义:Hadoop软件(HDFS、MapReduce、Yarn)广义:以hadoop为主的生态圈
2.hadoop
三大组件是什么?
K_un
·
2023-09-05 12:27
【运维】hadoop 集群安装(三)hdfs、yarn集群配置、nodemanager健康管理讲解
文章目录一.配置说明1.hadoop各进程环境配置
2.hadoop
各进程配置2.1.etc/hadoop/core-site.xml2.2.etc/hadoop/hdfs-site.xml2.2.1.NameNode2.2.2
roman_日积跬步-终至千里
·
2023-08-31 05:52
#
hadoop运维
hadoop
运维
hdfs
从零开始的Hadoop学习(三)| 集群分发脚本xsync
Hadoop的配置文件lib目录:存放Hadoop的本地库(对数据进行压缩解压缩功能)sbin目录:存放启动或停止Hadoop相关服务的脚本share目录:存放Hadoop的依赖jar包、文档、和官方案例
2.
庭前云落
·
2023-08-29 10:31
Hadoop
hadoop
学习
大数据
从零开始的Hadoop学习(二)| Hadoop介绍、优势、组成、HDFS架构
2.Hadoop
的优势高可靠性:Hadoop底层维护多个数据副本,所以即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失。高扩展性:在集群间分配任务数据,可方便的扩展数以千计的节
庭前云落
·
2023-08-26 11:08
Hadoop
hadoop
学习
hdfs
1 Hadoop入门
(3)广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈
2.Hadoop
的优势3Hadoop组成4HDFS概述5YARN架构概述YetAnotherResourceNegotiator
水无痕simon
·
2023-08-26 11:08
Hadoop
hadoop
大数据
分布式
从零开始的Hadoop学习(二)| Hadoop介绍、优势、组成、HDFS架构
2.Hadoop
的优势高可靠性:Hadoop底层维护多个数据副本,所以即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失。高扩展性:在集群间分配任务数据,可方便的扩展数以千计的节
庭前云落
·
2023-08-26 10:26
hadoop
学习
hdfs
Hadoop知识点总结
1.什么是Hadoop大数据处理的分布式系统
2.Hadoop
****生态圈三大核心:HDFS集群:分布式文件存储系统YARN集群:运算资源调度MapReduce分布式计算模型3.讲一下MapReduceMapReduce
longLiveData
·
2023-08-12 10:40
Hadoop 基础【原理 + 实践】
文章目录学习路线参考文章一、Hadoop概述1.Hadoop介绍
2.Hadoop
组成3.HDFS概述4.YARN概述5.MapReduce概述二、Hadoop安装1.Hadoop运行模式1.1本地单例模式
喵王叭
·
2023-08-10 09:49
大数据
hadoop
大数据
学习
Hadoop中 常用端口说明和相关配置文件
目录1.Hadoop中常用端口说明
2.Hadoop
中常用配置文件说明2.1配置文件分类2.2默认配置文件2.3自定义配置文件core-site.xmlhdfs-site.xmlyarn-site.xmlmapred-site.xml1
广阔天地大有可为
·
2023-08-10 05:01
HDFS
hadoop
hdfs
大数据
Eclipse安装Hadoop插件
2.Hadoop
插件安装和配置在Eclipse配置Hadoop环境之前应该
zerokissingthefire
·
2023-08-02 02:23
hadoop 3.1.3单机版安装教程
参考网站1.大数据开发入门之hadoop单机版部署
2.hadoop
单机安装,小白上手最详细教程-Ali0th3.hadoop3.1.2单机模式安装配置下载地址hadoop-3.1.3正式安装1.java
YukunWen
·
2023-07-22 20:23
善用工具
一如既往地上课,听着来不及消化吸收的内容,到现在我仍然在为内化而做最后的挣扎和努力,是的,昨日重现2.对国庆假期做了计划和安排3.有运动,有冥想,虽然不是原定计划,但好在没有忘记明日青蛙1.时光序做记录
2.
易younger
·
2023-07-20 12:01
2.Hadoop
生态圈及核心组件简介
1.Hadoop生态圈Hadoop是目前应用最为广泛的分布式大数据处理框架,其具备可靠、高效、可伸缩等特点。Hadoop的核心组件是HDFS、MapReduce。随着处理任务不同,各种组件相继出现,丰富Hadoop生态圈,目前生态圈结构大致如图所示:根据服务对象和层次分为:数据来源层、数据传输层、数据存储层、资源管理层、数据计算层、任务调度层、业务模型层。1.1.HDFS(分布式文件系统)HDFS
墨家先生
·
2023-07-20 11:33
Hadoop
hadoop
big
data
spark
hadoop课后题带答案(期末考试复习)
2.Hadoop
三大组件包含HDFS、MapReduce和Yarn。3.Hadoop2.x版本中的HDFS是由NameNode、DataNode和SecondaryNameNod
闫海南
·
2023-07-15 07:42
考试复习资料
hadoop
大数据
hdfs
Hadoop期末复习城科专用
Hadoop期末复习目录Hadoop期末复习一、Hadoop集群概念解释:1.Yarn简答题1.Hadoop集群6个核心配置文件以及它的作用
2.Hadoop
集群部署方式以及各方式使用场景3.Hadoop
今日重到苏澜桥
·
2023-07-15 07:09
笔记
hadoop
hdfs
java
大数据
【大数据之路1】Hadoop 入门
1.Hadoop入门1.大数据概述1.大数据相关说明
2.Hadoop
及大数据生态圈3.Hadoop核心组件4.Hadoop生态圈5.集群安装模式6.Hadoop运行模式7.Hadoop工作流程8.Hadoop
程序员胖五
·
2023-06-13 18:13
大数据
hadoop
分布式
1. Hadoop 入门
计算大数据的特性:容量大、种类多、速度快、价值高大数据部门的一般业务流程:项目经理提出需求,例如统计日活、周活、月活、年度账单等大数据部门的大数据平台或系统,分析一些需求指标数据可视化大数据部门的一般组织架构:
2.
程序员胖五
·
2023-06-08 19:38
hadoop
大数据
分布式
【hadoop基础知识】
Hadoop的优势和应用场景Hadoop的优势主要体现在以下几个方面:Hadoop的应用场景主要包括以下几个方面:Hadoop的核心组件Hadoop由多个核心组件构成,主要包括以下几个:Hadoop的发展趋势
2.
波波的私人笔记
·
2023-06-07 12:56
hadoop
大数据
mapreduce
Hadoop教程第一章之Hadoop简介
2.Hadoop
的三大发行版本Apache版本最原始(最基础)的版本,对于入门学习最好。2006年Cloudera内部集成了很多大数据框架,对应产品CDH,2008年Hortonworks文
爱吃糖的靓仔
·
2023-06-07 02:16
hadoop
大数据
分布式
Centos7下搭建单节点的Hadoop
文章目录1.虚拟机基础配置1)网络配置2)虚拟机主机名配置3)虚拟机ip与主机映射4)关闭防火墙5)做时间同步6)JDK1.8安装
2.Hadoop
搭建1)解压以及配置环境变量2)具体参考官网的搭建单节点的章节
小刘同学要加油呀
·
2023-04-14 08:27
大数据
hadoop
linux
大数据
Hadoop高可用(Hadoop2.x)
Hadoop高可用(Hadoop2.x)目录Hadoop高可用(Hadoop2.x)1.什么是高可用
2.Hadoop
集群存在的问题3.单点故障3.1HDFS的单点故障3.2NameNode的内存受限的问题
m0_67402341
·
2023-04-14 02:40
java
hadoop
大数据
hdfs
搜索引擎
spring
【clickhouse】微信基于Clickhouse的实时数仓
1.概述直播回放:ClickHouseOnlineSummerMeetupChina20222、背景数据分析场景
2.Hadoop
数仓下的困境视频号等推荐系统的对个性化体验强烈诉求,催生了“亚秒级”分析系统的诞生设计目标
九师兄
·
2023-04-09 16:22
clickhouse
clickhouse
大数据
数据库
【学习笔记】尚硅谷Hadoop大数据教程笔记
一、Hadoop入门大数据的特点:Volume(大量)Velocity(高速)Variety(多样)Value(低价值密度)1.Hadoop概念是一个分布式系统基础架构
2.Hadoop
优势高可靠高扩展性高效性高容错性
m0_67403013
·
2023-04-09 07:19
面试
学习路线
阿里巴巴
java
java进阶
后端
大数据开发学习笔记
安装增强设备1.3vim编辑器的使用1.4修改计算机名1.5配置Java1.5.1下载并解压缩安装包1.5.2配置路径1.6安装salve节点1.7网络结构选择1.7.1分组1.7.2单机运行三个虚拟节点
2.
漩涡脆波波
·
2023-04-05 14:23
大数据
学习
spark
scala
hadoop
2.Hadoop
环境配置之虚拟机安装配置
1.VMware1.1VMware安装一台电脑本身是可以装多个操作系统的,但是做不到多个操作系统切换自如,所以我们需要一款软件帮助我们达到这个目的,不然数仓项目搭建不起来。推荐的软件为VMware,VMware可以使用户在一台计算机上同时运行多个操作系统,还可以像Windows应用程序一样来回切换。用户可以如同操作真实安装的系统一样操作虚拟机系统,甚至可以在一台计算机上将几个虚拟机系统连接为一个局
Mr李小四
·
2023-04-04 22:43
Hadoop大数据技术
hadoop
windows
大数据
Hadoop大数据系统架构(深入浅出)
目录1.Hadoop生态体系
2.Hadoop
集群硬件架构3.Hadoop体系分层功能架构参考资料导读:从资源管理角度来看,当前的大数据系统架构主要有两种:一种是MPP数据库架构,另一种是Hadoop体系的分层架构
赵孝正
·
2023-04-03 21:42
big
data
hadoop
大数据
系统架构
Hadoop高可用集群HA的安装
目录1.Hadoop安装
2.Hadoop
的配置文件编写2.1Hadoop-env.sh2.2workers文件2.3core-site.xml文件2.4hdfs-site.xml文件2.5yarn-site.xml2.6mapred-site.xml3
EEEurekaaa!
·
2023-04-03 04:47
Hadoop集群搭建及实例应用
hadoop
大数据
hdfs
分布式
mapreduce
大数据各架构概述
2.Hadoop
优势:(1)高可靠性:Hadoop底层维护多个数据副本;(2)高扩展性:可以动态增加与删除节点(3)高效性:在MapRudece的思想下,Hadoop是并行工作的,以加快任务的处理速度。
误落尘网。
·
2023-04-03 00:26
Hadoop
big
data
架构
hadoop
上一页
1
2
3
4
5
6
7
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他