E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
HDFS联盟
大数据面试系列之——Hadoop
Hadoop的三个核心:
HDFS
(分布式存储系统)MapReduce(分布式计算系统)YARN(分布式资源调度)1.Hadoop集群的几种搭建模式1.单机模式:直接解压安装,不存在分布式存储系统2.伪分布式
潜心_守道
·
2025-03-07 07:17
大数据
面经
面试
大数据
Hadoop
Azkaban其一,介绍、体系架构和安装
比如:想启动hadoop集群先启动zk集群,再启动
hdfs
,再启动yarn,再启动日志系统工作过程中总会遇到多个脚本执行的时候有顺序。任务可以有一个编排的工具
出发行进
·
2025-03-07 00:35
#
Azkaban
Azkaban
linux
【区块链+绿色低碳】数字碳链 | FISCO BCOS应用案例
基于此,深圳职业技术大学采用FISCOBCOS
联盟
链开源技术,推出数字碳链。项目采用了关系型数据库MySQL和高性能的键值对存储系统Redis,并将这两种数据库与FIS
FISCO_BCOS
·
2025-03-06 23:53
FISCO
BCOS产业应用发展报告
区块链
绿色低碳
hdfs
HA 机制, 一台 namenode 宕机了, joualnode , namenode , edit.log fsimage 的 变 化?思维导图 代码示例(java 架构)
HDFS
(HadoopDistributedFileSystem)的高可用性(HA,HighAvailability)机制旨在解决单点故障问题,确保即使在NameNode出现故障的情况下,文件系统仍然可以继续正常工作
用心去追梦
·
2025-03-06 10:00
hdfs
java
架构
hadoop
Hadoop是一个用于分布式存储和处理大规模数据的开源框架,它的架构主要由以下几个核心组件组成:1.Hadoop生态系统核心组件Hadoop的核心架构主要包括
HDFS
(HadoopDistributedFileSystem
百里自来卷
·
2025-03-06 06:00
hadoop
大数据
分布式
【自学笔记】Hadoop基础知识点总览-持续更新
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录Hadoop基础知识点总览1.Hadoop简介2.Hadoop生态系统3.
HDFS
(HadoopDistributedFileSystem
Long_poem
·
2025-03-05 22:24
笔记
hadoop
大数据
spark
hdfs
常用命令
目录lsrmgettext以下按照使用频率和使用先后顺序排序(纯个人习惯)ls列出
hdfs
文件系统路径下的目录和文件
hdfs
dfs-ls列出
hdfs
文件系统路径下所有的目录和文件
hdfs
dfs-ls-Rrmhadoopfs-rm
毛球饲养员
·
2025-03-05 11:19
spark
spark
hdfs
常用spark命令
--spark启动localhost$spark-sql--masteryarn启动主节点yarn模式--查看
hdfs
文件
hdfs
dfs-ls/spark/myDatabase.db查看我们建的表其实是是建立在
会拉小提琴的左脚
·
2025-03-05 11:19
大数据
spark
hadoop
hdfs
Spark详解二
masterlocal[2](local[2]是说,执行Application需要用到CPU的2个核)2、Standalone独立模式:Spark自带的一种集群模式Spark自己管理集群资源,此时只需要将Hadoop的
HDFS
卢子墨
·
2025-03-05 11:13
Spark原理
实战
总结
spark
初学者如何用 Python 写第一个爬虫?
大数据技术:涵盖Hadoop(
HDFS
)、Hive、Spark
ADFVBM
·
2025-03-04 16:19
面试
学习路线
阿里巴巴
python
爬虫
开发语言
W3C标准和ES规范之一文通
ECMAScript)定位Web技术的建筑蓝图JavaScript的语言宪法管辖范围HTML/CSS/DOM/WebAPI等网页技术标准JavaScript语言的语法与核心功能规范制定组织W3C(万维网
联盟
向贤
·
2025-03-04 02:06
技术面试
es
web
避免Hive和Spark生成
HDFS
小文件
HDFS
是为大数据设计的分布式文件系统,对大数据做了存储做了针对性的优化,但却不适合存储海量小文件。
穷目楼
·
2025-03-03 22:36
数据库
大数据
大数据
spark
hive
hadoop
强者
联盟
——Python语言结合Spark框架
引言:Spark由AMPLab实验室开发,其本质是基于内存的快速迭代框架,“迭代”是机器学习最大的特点,因此非常适合做机器学习。得益于在数据科学中强大的表现,Python语言的粉丝遍布天下,如今又遇上强大的分布式内存计算框架Spark,两个领域的强者走到一起,自然能碰出更加强大的火花(Spark可以翻译为火花),因此本文主要讲述了PySpark。本文选自《全栈数据之门》。全栈框架Spark由AMP
博文视点
·
2025-03-03 12:15
全栈工程师
全栈
全栈数据
Spark
Python
PySpark
Spark核心之06:知识点梳理
、spark是什么spark是针对于大规模数据处理的统一分析引擎,它是基于内存计算框架,计算速度非常之快,但是它仅仅只是涉及到计算,并没有涉及到数据的存储,后期需要使用spark对接外部的数据源,比如
hdfs
小技工丨
·
2025-03-03 07:03
大数据技术学习
SparkSQL
spark
大数据
Hadoop基础知识及部署模式
广义上的Hadoop是指Hadoop的整个技术生态圈;狭义上的Hadoop指的是其核心三大组件,包括
HDFS
、YARN及MapReduce.二、Hadoop的发展史Hadoop起源于Lucen
2301_82242502
·
2025-03-03 06:28
hadoop
大数据
分布式
中科大《计算机网络》1.1什么是Internet笔记
网络与互联网的本质区别对比维度网络(Network)互联网(Internet)定义任意互连的计算设备集合(如局域网)由多个网络通过路由器互联形成的全球性网际网络组成单一管理域内的设备(如企业网)跨管理域的网络
联盟
镜中人★
·
2025-03-03 06:56
中科大计算机网络笔记
计算机网络
笔记
网络
大数据技术学习框架(更新中......)
Hadoop相关
HDFS
分布式文件系统MR(MapReduce)离线数据处理MR-图解YARN集群资源管理ZooKeeperZooKeeper分布式协调框架Hive相关Hive-01之数仓、架构、数据类型
小技工丨
·
2025-03-03 04:05
大数据技术学习
大数据
学习
什么是 WPS(Wi-Fi Protected Setup)
什么是WPS(Wi-FiProtectedSetup)WPS(Wi-FiProtectedSetup,Wi-Fi保护设置)是由Wi-Fi
联盟
(http://www.wi-fi.org/)组织实施的认证项目
magod
·
2025-03-03 01:12
WIFI
网络
产品
路由器
工作
windows
破解
Ubuntu从零创建Hadoop集群
查看虚拟机IP及检查网络3.Ubuntu相关配置镜像源配置下载vim编辑器4.设置静态IP和SSH免密(可选)设置静态IPSSH免密5.JDK环境部署6.Hadoop环境部署7.配置Hadoop配置文件
HDFS
爱编程的王小美
·
2025-03-02 12:57
大数据专业知识系列
ubuntu
hadoop
linux
计算机网络基础:网络标准相关知识介绍
1、常见的制定网络标准的机构国际标准化组织、国际电信
联盟
、电子工业协会、电气和电子工程协会、因特网活动委员会2、常见的网络标准2.1电信标准国际电信
联盟
(ITU)1947年成为联合国的一个组织,包括ITU-R
IT技术分享社区
·
2025-03-02 08:22
电脑技巧
数据库软考
网络
大数据
人工智能
java
编程语言
DPU:数据中心与计算架构的革新引擎
你好,这里是网络技术
联盟
站,我是瑞哥。随着计算领域的蓬勃发展,数据处理单元(DPU)正崭露头角,成为重新定义数据中心和计算架构未来的关键元素。
wljslmz
·
2025-03-02 03:46
网络技术
DPU
Kafka系列之:记录一次源头数据库刷数据,造成数据丢失的原因
Kafka系列之:记录一次源头数据库刷数据,造成数据丢失的原因一、背景二、查看topic日志信息三、结论四、解决方法一、背景源头数据库在很短的时间内刷了大量的数据,部分数据在
hdfs
丢失了理论上debezium
快乐骑行^_^
·
2025-03-01 18:12
Kafka
Kafka系列
记录一次源头数据库刷数据
造成数据丢失的原因
Python酷库之旅-第三方库Pandas(011)
目录一、用法精讲25、pandas.
HDFS
tore.get函数25-1、语法25-2、参数25-3、功能25-4、返回值25-5、说明25-6、用法25-6-1、数据准备25-6-2、代码示例25-6
神奇夜光杯
·
2025-03-01 05:38
python
pandas
开发语言
标准库及第三方库
基础知识
学习与成长
HIVE 面试题总结
Hive依赖于
HDFS
存储数据,Hive将HQL转换成MapReduce执行,所以说Hive是基于Hadoop的一个数据仓库工具,实质就是一款基于
HDFS
的MapReduce计算框架,对存储在
HDFS
中的数据进行分析和管理
小余真旺财
·
2025-02-28 11:00
Hive
hive
电竞赛事数据分析:LNG vs BLG的胜利背后
引言电子竞技(Esports)已经成为全球范围内的一项重要娱乐活动,而《英雄
联盟
》(LeagueofLegends,LoL)作
烧瓶里的西瓜皮
·
2025-02-28 08:02
python
自动驾驶
人工智能
数据可视化
机器学习
Hive基本操作
Hive基本操作1.Hive常用命令1.1Hive启动1.2Hive退出1.3Hive查看历史命令1.4Hive常用交互命令2.数据库基本操作2.1创建数据库2.2创建数据库并指定
hdfs
存储位置2.3
小肥柴呀
·
2025-02-28 04:01
Apache
Hive
hive
数据库
如何处理报错"UDT column batch insert" has not been implemented yet
问题现象YashanDB中的ST_GEOMETRY类型是数据库内置的一种自定义类型,用于存储和访问符合开放地理空间信息
联盟
(OpenGeospatialConsortium,简称OGC)制定的SFASQL
·
2025-02-27 13:25
数据库
Hive SQL 使用及进阶详解
一、Hive简介Hive是建立在Hadoop之上的数据仓库基础架构,它提供了类似于SQL的查询语言HiveSQL(也称为HQL),用于对存储在Hadoop分布式文件系统(
HDFS
)中的大规模数据进行数据查询和分析
小四的快乐生活
·
2025-02-27 03:37
hive
sql
hadoop
html5代码_HTML5篇(一)
html5是html最新的修订版本,2014年10月由万维网
联盟
(W3C)完成标准制定。其设计目的是为了在移动设备上支持多媒体,当前大部分现代浏览器已经具备了某些HTML5支持。
weixin_39713317
·
2025-02-27 03:36
html5代码
html5标签属性大全
HDFS
是如何存储和管理大数据
HDFS
(HadoopDistributedFileSystem,Hadoop分布式文件系统)是专为大数据处理而设计的分布式文件系统,具有高吞吐量、高容错性等特点,适用于大规模数据存储和管理。
python资深爱好者
·
2025-02-26 11:38
大数据
hdfs
hadoop
Hadoop 基础原理
Hadoop基础原理基本介绍Hadoop的必要性Hadoop核心组件Hadoop生态系统中的附加组件
HDFS
HDFS
集群架构
HDFS
读写流程
HDFS
写流程
HDFS
读流程NameNode持久化机制MapReduce
disgare
·
2025-02-26 11:38
数据库
hadoop
大数据
分布式
Vulkan:Vulkan基础架构与环境搭建_2024-07-20_13-37-15.Tex
KhronosGroup是一个由多家公司组成的非营利性行业
联盟
,负责制定和维护多种开放标准,包括Vulkan、OpenGL、OpenCL等。
chenjj4003
·
2025-02-26 01:58
游戏开发
网络
服务器
linux
前端
数据结构
android
java
Spark Standalone集群架构
spark学习笔记SparkStandalone集群架构SparkStandalone集群集群管理器,clustermanager:Master进程,工作节点:Worker进程搭建了一套Hadoop集群(
HDFS
htfenght
·
2025-02-25 20:22
spark
spark
SQL注入天书 - ASP注入漏洞全接触
SQL注入天书-ASP注入漏洞全接触作者:NB
联盟
-小竹(QQ:48814)引言随着B/S模式应用开发的发展,使用这种模式编写应用程序的程序员也越来越多。
HappyQQ
·
2025-02-25 19:14
黑客技术
asp
sql
sqlserver
vbscript
数据库
iis
Hadoop--NameSpace(名称空间)
1.名称空间的定义
HDFS
的名称空间是一个逻辑上的文件系统目录树,类似于传统文件系统的目录结构。组成目录:用于组织文件的逻辑容器。文件:存储在
HDFS
中的实际数据单元。
Cynthiaaaaalxy
·
2025-02-25 18:42
hadoop
大数据
分布式
【YashanDB 知识库】如何处理报错"UDT column batch insert"
问题现象YashanDB中的ST_GEOMETRY类型是数据库内置的一种自定义类型,用于存储和访问符合开放地理空间信息
联盟
(OpenGeospatialConsortium,简称OGC)制定的SFASQL
·
2025-02-25 03:22
数据库运维
学习PostgreSQL专家认证
认证途径:由PostgreSQL
联盟
分会授权机构提供的认证考试,出的相关认证。这些认证考试通常具有较高的权威性和认可度,能够证明考生在PostgreSQL领域的专业能力。
leegong23111
·
2025-02-25 02:16
postgresql
学习
数据库
CSA GCR 2024 | 百度安全DDoS防护服务荣获安全磐石奖等多项殊荣
11月15日,第八届云安全
联盟
大中华区大会上,CSA大中华区对本年度在数字安全领域做出杰出贡献与创新的企业与个人进行了表彰。
·
2025-02-24 19:09
安全
Hadoop
HDFS
基准测试
一、测试写入速度确保
HDFS
集群和YARN集群成功启动hadoopjar/export/server/hadoop-3.1.4/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient
Yvonne978
·
2025-02-24 14:22
大数据
hadoop
hdfs
大数据
jmeter 与大数据生态圈中的服务进行集成
以下为你详细介绍JMeter与大数据生态圈中几种常见服务(Hadoop
HDFS
、Spark、Kafka、Elasticsearch)集成的方法:与Hadoop
HDFS
集成实现思路
HDFS
是Hadoop的分布式文件系统
小赖同学啊
·
2025-02-24 13:40
jmeter专栏
jmeter
大数据
Hadoop常用操作命令
在NameNode节点格式化集群初始化集群
hdfs
namenode-format启动
HDFS
sbin/start-dfs.sh启动yarnsbin/start-yarn.sh启动NodeManageryarn-daemon.shstartnodemanager
hzw0510
·
2025-02-24 07:02
hadoop
大数据
分布式
HDFS
分布式文件系统的架构及特点
一、
HDFS
架构
HDFS
采用的是主从(Master/Slave)架构,即一个
HDFS
通常是由一个Master和多个Slave组成。
互联网上的猪
·
2025-02-24 04:40
Hadoop
hdfs
架构
hadoop
Hadoop~
HDFS
的Block块
一、
HDFS
的block块1.介绍block块是
HDFS
的最小存储单位,每个256MB(可以修改)2.文件在
HDFS
中的存储方式文件分成多个block块,block块分三份存入对应服务器,每个block
飞Link
·
2025-02-23 11:37
Hadoop框架
hadoop
hdfs
大数据
深入HBase——核心组件
核心组件首先,需要提到的就是HBase架构中会依赖到的Zookeeper和
HDFS
。
黄雪超
·
2025-02-23 01:26
大数据基础
#
深入HBase
hbase
数据库
数据结构
大数据-257 离线数仓 - 数据质量监控 监控方法 Griffin架构
目前已经更新到了:Hadoop(已更完)
HDFS
(已更完)MapReduce(已更完)Hive(已更完)Flume(已更完)Sqoop(已更完)Zookeeper(已更完)HBase(已更完)Redis
m0_74823705
·
2025-02-22 21:50
面试
学习路线
阿里巴巴
大数据
架构
强烈推荐的3款低代码爬虫,程序员必备
爬虫使用场景也很多,比如:搜索引擎机器人爬行网站,分析其内容,然后对其进行排名,比如百度、谷歌价格比较网站,部署机器人自动获取
联盟
卖家网站上的价格和产品描述,比如什么值得买市场研究公司,使用爬虫从论坛和社交媒体
朱卫军 AI
·
2025-02-22 10:27
低代码
爬虫
网络爬虫
Python 的 WebSocket 实现详解
大数据技术:涵盖Hadoop(
HDFS
)、Hive、Spark、Fli
王子良.
·
2025-02-22 03:23
经验分享
python
websocket
网络协议
网络
【Hadoop】使用Docker容器搭建伪分布式集群
docker-compose.yaml文件配置集群version:"3"services:namenode:image:apache/hadoop:3.3.6hostname:namenodecommand:["
hdfs
慕青Voyager
·
2025-02-21 09:14
分布式
hadoop
docker
HDFS
分布文件系统(Hadoop Distributed File System)
目录一.
HDFS
的本质二.
HDFS
的架构与原理三、
HDFS
特性四.
HDFS
的常用命令1.显示
HDFS
指定路径下的所有文件2.在
HDFS
上创建文件夹3.上传本地文件到
HDFS
4.查看文件5.删除
HDFS
上的文件或者目录
柿子小头
·
2025-02-21 08:38
hdfs
hadoop
大数据
org.apache.hadoop.
hdfs
.server.datanode.DataNode: Block pool ID needed, but service not yet registere
启动hadoop集群,发现datanode没有启动,查看日志报错,如图://日志文件2020-03-2416:40:55,608WARNorg.apache.hadoop.
hdfs
.server.common.Storage
@菜鸟进阶记@
·
2025-02-21 01:19
hadoop
hadoop
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他