E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop大数据框架知识总结
网络编程基础
知识总结
1、网络编程的基础
知识总结
网络编程说的是在不同计算机之间进行数据传输和通信。本文主要是一些基础知识的总结:本文的“计算机”包含电脑、手机、平板、手表、汽车等可以联网的设备。
老梁学Android&HarmonyOS
·
2025-03-12 06:24
网络编程
网络
mySQL和Hive的区别
SQL和HQL的区别整体1、存储位置:Hive在
Hadoop
上;Mysql将数据存储在设备或本地系统中;2、数据更新:Hive不支持数据的改写和添加,是在加载的时候就已经确定好了;数据库可以CRUD;3
iijik55
·
2025-03-12 00:41
面试
学习路线
阿里巴巴
hive
mysql
大数据
tomcat
面试
flink-cdc实时增量同步mysql数据到elasticsearch
1.环境准备mysqlelasticsearchflinkonyarn说明:如果没有安装
hadoop
,那么可以不用yarn,直
大数据技术派
·
2025-03-11 19:51
#
Flink
elasticsearch
flink
mysql
搭建分布式Hive集群
title:搭建分布式Hive集群date:2024-11-2923:39:00categories:-服务器tags:-Hive-大数据搭建分布式Hive集群本次实验环境:Centos7-2009、
Hadoop
逸曦玥泱
·
2025-03-11 18:17
大数据运维
分布式
hive
hadoop
Hadoop
、Spark和 Hive 的详细关系
Hadoop
、Spark和Hive的详细关系1.Apache
Hadoop
Hadoop
是一个开源框架,用于分布式存储和处理大规模数据集。
夜行容忍
·
2025-03-11 18:46
hadoop
spark
hive
Windows系统下解压".tar"文件出错,提示:无法创建符号链接,可能需要以管理器身份运行winrar
1、解压文件出错,如下信息:D:\tools\
hadoop
-3.1.2.tar.gz:无法创建符号链接D:\tools\
hadoop
-3.1.2\
hadoop
-3.1.2\lib\native\lib
hadoop
.so
ruangaoyan
·
2025-03-11 18:45
大数据技术生态圈:
Hadoop
、Hive、Spark的区别和关系
大数据技术生态圈:
Hadoop
、Hive、Spark的区别和关系在大数据领域中,
Hadoop
、Hive和Spark是三个常用的开源技术,它们在大数据处理和分析方面发挥着重要作用。
雨中徜徉的思绪漫溢
·
2025-03-11 17:07
大数据
hadoop
hive
ZooKeeper学习总结(1)——ZooKeeper入门介绍
1.概述Zookeeper是
Hadoop
的一个子项目,它是分布式系统中的协调系统,可提供的服务主要有:配置服务、名字服务、分布式同步、组服务等。
一杯甜酒
·
2025-03-11 17:03
ZooKeeper学习总结
Zookeeper
Zookeeper+kafka学习笔记
Zookeeper是Apache的一个java项目,属于
Hadoop
系统,扮演管理员的角色。
CHR_YTU
·
2025-03-11 16:01
Zookeeper
麒麟arm架构系统_安装nginx-1.27.0_访问500 internal server error nginx解决_13: Permission denied---Linux工作笔记072
[root@
hadoop
173nginx1.27.0]#wget-chttp://nginx.org/download/nginx-1.27.0.tar.gz--2024-07-0509:47:00--
添柴程序猿
·
2025-03-11 16:54
java
nginx-1.27.0
nginx最新版安装
麒麟v10
arm架构
麒麟v10
安装nginx
Zookeeper与Kafka学习笔记
一、Zookeeper核心要点1.核心特性分布式协调服务,用于维护配置/命名/同步等元数据采用层次化数据模型(Znode树结构),每个节点可存储<1MB数据典型应用场景:
Hadoop
NameNode高可用
上海研博数据
·
2025-03-11 15:51
zookeeper
kafka
学习
【护网行动】最新版护网
知识总结
,零基础入门到精通,收藏这篇就够了
一、基础知识1.SQL注入:一种攻击手段,通过在数据库查询中注入恶意SQL代码,获取、篡改或删除数据库数据。(1)危害:数据库增删改查、敏感数据窃取、提权/写入shell。(2)类型:按注入点(字符型、数字型、搜索型)、提交方式(get、post、cookie)、执行效果(联合、报错、布尔、时间)分类。(3)注入方式:包括information_schema注入、基于函数报错注入(如updatex
网络安全小宇哥
·
2025-03-11 11:49
oracle
数据库
安全
web安全
计算机网络
网络安全
网络
做了6年的Java,mysql去重查询方法
这篇文章总结了许多关于MySQL方面的
知识总结
,以及面试多家总结出来的常问面试题,希望
m0_57768082
·
2025-03-11 11:17
程序员
java
经验分享
面试
phoenix无法连接hbase shell创建表失败_报错_PleaseHoldException: Master is initializing---记录020_大数据工作笔记0180
今天发现,我的phoenix,去连接hbase集群,怎么也连不上了,奇怪了...弄了一晚上org.apache.
hadoop
.hbase.PleaseHoldException:Masterisinitializing
添柴程序猿
·
2025-03-11 00:52
hbase连接报错
phoenix连接hbase
phoenix
PleaseHoldExcep
PostgreSQL的学习心得和
知识总结
(一百二十四)|深入理解PostgreSQL数据库开源扩展pgreplay的安装说明和使用场景
目录结构注:提前言明本文借鉴了以下博主、书籍或网站的内容,其列表如下:1、参考书籍:《PostgreSQL数据库内核分析》2、参考书籍:《数据库事务处理的艺术:事务管理与并发控制》3、PostgreSQL数据库仓库链接,点击前往4、日本著名PostgreSQL数据库专家铃木启修网站主页,点击前往5、参考书籍:《PostgreSQL中文手册》6、参考书籍:《PostgreSQL指南:内幕探索》,点击
孤傲小二~阿沐
·
2025-03-10 18:05
数据库
postgresql
开源
Hadoop
的运行模式
Hadoop
的运行模式1、本地运行模式2、伪分布式运行模式3、完全分布式运行模式4、区别与总结
Hadoop
有三种可以运行的模式:本地运行模式、伪分布式运行模式和完全分布式运行模式1、本地运行模式本地运行模式无需任何守护进程
对许
·
2025-03-10 09:35
#
Hadoop
hadoop
大数据
分布式
Hadoop
的mapreduce的执行过程
一、map阶段的执行过程第一阶段:把输入目录下文件按照一定的标准逐个进行逻辑切片,形成切片规划。默认Splitsize=Blocksize(128M),每一个切片由一个MapTask处理。(getSplits)第二阶段:对切片中的数据按照一定的规则读取解析返回对。默认是按行读取数据。key是每一行的起始位置偏移量,value是本行的文本内容。(TextInputFormat)第三阶段:调用Mapp
画纸仁
·
2025-03-10 01:34
大数据
hadoop
mapreduce
大数据
Hadoop
:分布式计算平台初探
Hadoop
是一个开发和运行处理大规模数据的软件平台,是Apache的一个用java语言实现开源软件框架,实现在大量计算机组成的集群中对海量数据进行分布式计算。
dccrtbn6261333
·
2025-03-10 01:32
大数据
运维
java
【
Hadoop
】如何理解MapReduce?
MapReduce是一种用于处理大规模数据集的编程模型和计算框架。它的核心思想是将复杂的计算任务分解为两个简单的阶段:Map(映射)和Reduce(归约)。通过这种方式,MapReduce可以高效地并行处理海量数据。一.MapReduce的核心概念1.Map(映射):将输入数据分割成小块,并对每个小块进行初步处理。输出键值对(key-valuepairs),例如。2.Shuffle和Sort(洗牌
2302_79952574
·
2025-03-10 00:30
hadoop
mapreduce
数据库
Hadoop
:全面深入解析
Hadoop
是一个用于大规模数据处理的开源框架,其设计旨在通过集群的方式进行分布式存储和计算。
CloudJourney
·
2025-03-09 21:29
hadoop
大数据
分布式
Hadoop
介绍:什么是
Hadoop
?了解
Hadoop
的应用
一、认识
Hadoop
框架
Hadoop
是一个提供分布式存储和计算的开源软件框架,使用Java语言编写,具有高扩展性、高容错性、无共享和高可用(HA)等特点,非常适合处理海量数据。
Zzzxt007
·
2025-03-09 21:55
hadoop
大数据
分布式
Unity 基础
知识总结
(持续更新中...)
引擎基础Unity有哪几个主要窗口?Scene窗口用于场景搭建和UI界面拼接Game窗口游戏运行预览Hierarchy窗口查看和调整场景对象层级结构Project窗口游戏工程资源Inspector创建属性查看器,属性设置、脚本组件挂载Unity提供了几种光源,分别是什么一共有四种DirectionalLight平行光PointLight点光源SpotLight聚光灯AreaLight区域光Imag
程序猿多布
·
2025-03-09 15:08
unity
游戏引擎
Hbase在hdfs上的archive目录占用空间过大
hbase版本:1.1.2
hadoop
版本:2.7.3Hbase在hdfs上的目录/apps/hbase/data/archive占用空间过大,导致不停地发出hdfs空间使用率告警。
宝罗Paul
·
2025-03-09 13:50
大数据
hbase
Hadoop
、Spark、Flink Shuffle对比
一、
Hadoop
的shuffle前置知识:Map任务的数量由
Hadoop
框架自动计算,等于分片数量,等于输入文件总大小/分片大小,分片大小为HDFS默认值128M,可调Reduce任务数由用户在作业提交时通过
逆袭的小学生
·
2025-03-09 10:55
hadoop
spark
flink
【
Hadoop
】什么是Zookeeper?如何理解Zookeeper?
ZooKeeper是一个开源的分布式应用程序协调服务,可以为分布式应用提供一致性的服务,功能包括:配置维护、名字服务、分布式同步、组服务等等。ZooKeeper的目标是封装好复杂易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。1.Zookeeper的特点最终一致性:Client不论连接到哪个Server,展示给它的都是同一个视图。可靠性:如果某个消息被一台服务器接受,那么它
2302_79952574
·
2025-03-09 09:46
hadoop
zookeeper
大数据
【
Hadoop
】详解HDFS
Hadoop
分布式文件系统(HDFS)被设计成适合运行在通用硬件上的分布式文件系统,它是一个高度容错性的系统,适合部署在廉价的机器上,能够提供高吞吐量的数据访问,非常适合大规模数据集上的应用。
2302_79952574
·
2025-03-09 09:13
hadoop
hdfs
大数据
HDFS的设计架构
HDFS是
Hadoop
生态系统中的分布式文件系统,设计用于存储和处理超大规模数据集。它具有高可靠性、高扩展性和高吞吐量的特点,适合运行在廉价硬件上。
F_0125
·
2025-03-09 05:21
Hadoop
hdfs
hbase
hadoop
大数据Flink(六十四):Flink运行时架构介绍_flink中涉及到的大数据组件
从以Greenplum为代表的MPP(MassivelyParallelProcessing,大规模并行处理)架构,到
Hadoop
、Spark为代表的批处理架构,再到Storm、Flink为代表的流处理架构
2401_84181942
·
2025-03-09 03:39
程序员
大数据
flink
架构
大数据运维实战指南:零基础入门与核心技术解析(第一篇)
大数据运维实战指南:零基础入门与核心技术解析(第一篇)系列文章目录第一篇:大数据运维概述与核心技能体系第二篇:
Hadoop
生态体系与集群部署实战第三篇:分布式存储系统运维与优化第四篇:资源调度框架YARN
emmm形成中
·
2025-03-09 01:19
大数据
运维
hadoop
框架与核心组件刨析(四)MapReduce
MapReduce是一种用于大规模数据处理的编程模型和计算框架,最初由Google提出,后来由Apache
Hadoop
实现并广泛应用。
小刘爱喇石( ˝ᗢ̈˝ )
·
2025-03-09 00:42
hadoop
mapreduce
大数据
框架基本
知识总结
Day16
登录注意点前台接受到loginUser对象,前台后续的操作都需要依靠这个对象后台可以存在redis数据库中,前台可以存在vuex和Sessionstorage中vuex在刷新页面后数据会消失,需要使用浏览器的Sessionstorage和Loacalstorage来配合存储,Sessionstorage不能持久化存储,关了页面就没了,Localstorage不手动清理会一直在拦截器注意点如果tok
小斌的Debug日记
·
2025-03-08 17:33
框架学习日记
spring
redis
hadoop
运行java程序_原生态在
Hadoop
上运行Java程序
第一种:原生态运行jar包1,利用eclipse编写Map-Reduce方法,一般引入
Hadoop
-core-1.1.2.jar。
淇水煮汤
·
2025-03-08 09:23
hadoop
运行java程序
hadoop
运行java程序命令_使用命令行编译打包运行自己的MapReduce程序
Hadoop
2.6.0
网上的MapReduceWordCount教程对于如何编译WordCount.java几乎是一笔带过…而有写到的,大多又是0.20等旧版本版本的做法,即javac-classpath/usr/local/
hadoop
emi0wb
·
2025-03-08 09:53
大数据
Hadoop
集群运行程序
目录1运行自带的MapReduce程序2常见错误1运行自带的MapReduce程序下面我们在
Hadoop
集群上运行一个MapReduce程序,以帮助读者对分布式计算有个基本印象。
赵广陆
·
2025-03-08 08:37
hadoop
hadoop
big
data
mapreduce
hadoop
框架与核心组件刨析(三)YARN
一、负载均衡的概念负载均衡(LoadBalancing)是一种将工作负载(如网络流量、计算任务或数据请求)分配到多个资源(如服务器、计算节点或存储设备)的技术,目的是优化资源使用、最大化吞吐量、最小化响应时间,并避免单个资源过载。负载均衡广泛应用于计算机网络、分布式系统、云计算等领域。负载均衡的核心目标提高性能:通过将负载分配到多个资源,避免单个资源成为瓶颈,从而提高系统的整体性能。提高可用性:如
小刘爱喇石( ˝ᗢ̈˝ )
·
2025-03-08 04:46
hadoop
大数据
分布式
计算机网络篇:基础
知识总结
与基于长期主义的内容更新
基础
知识总结
和MySQL类似,我同样花了一周左右的时间根据csview对计算机网络部分的八股文进行了整理,主要的内容包括:概述、TCP与UDP、IP、HTTP,其中我个人认为最重要的是TCP这部分的内容
YGGP
·
2025-03-07 20:45
计算机网络
计算机网络
Doris 数据集成 Kafka
这是我们Doris数据集成篇的第二篇,前面我们介绍过通过Catalog进行集成的例子Doris基础篇—数据集成Catalog目前公司的很多数据服务都开始使用Doris了,目前使用下来感觉还是很方便的,比起
Hadoop
不二人生
·
2025-03-07 16:29
Doris
实战
doris
数据仓库
大数据面试系列之——
Hadoop
Hadoop
的三个核心:HDFS(分布式存储系统)MapReduce(分布式计算系统)YARN(分布式资源调度)1.
Hadoop
集群的几种搭建模式1.单机模式:直接解压安装,不存在分布式存储系统2.伪分布式
潜心_守道
·
2025-03-07 07:17
大数据
面经
面试
大数据
Hadoop
框架基本
知识总结
Day15
前后端大整合1.新建一个文件夹,在终端中打开输入vuecreate项目名(前提是安装了vue脚手架)2.安装路由npmaddvue-router,新建一个router文件夹,router相关都会在这里配置,创建一个router实例,然后在mian.js引入并且挂载3.安装vuex,命令npmaddvuex,新建文件夹store,这是vuex的实例,同样引入挂载4.新建api文件夹,这里用来存放和后
小斌的Debug日记
·
2025-03-07 01:47
框架学习日记
java
数据库
RBAC
Azkaban其一,介绍、体系架构和安装
比如:想启动
hadoop
集群先启动zk集群,再启动hdfs,再启动yarn,再启动日志系统工作过程中总会遇到多个脚本执行的时候有顺序。任务可以有一个编排的工具
出发行进
·
2025-03-07 00:35
#
Azkaban
Azkaban
linux
hdfs HA 机制, 一台 namenode 宕机了, joualnode , namenode , edit.log fsimage 的 变 化?思维导图 代码示例(java 架构)
HDFS(
Hadoop
DistributedFileSystem)的高可用性(HA,HighAvailability)机制旨在解决单点故障问题,确保即使在NameNode出现故障的情况下,文件系统仍然可以继续正常工作
用心去追梦
·
2025-03-06 10:00
hdfs
java
架构
IntelliJ IDEA + Maven环境编写第一个
hadoop
程序
1.新建IntelliJ下的maven项目点击File->New->Project,在弹出的对话框中选择Maven,JDK选择你自己安装的版本,点击Next2.填写Maven的GroupId和ArtifactId你可以根据自己的项目随便填,点击Next这样就新建好了一个空的项目这里程序名填写WordCount,我们的程序是一个通用的网上的范例,用来计算文件中单词出现的次数3.设置程序的编译版本打开
IT独白者
·
2025-03-06 06:00
hadoop
hadoop
hadoop
Hadoop
是一个用于分布式存储和处理大规模数据的开源框架,它的架构主要由以下几个核心组件组成:1.
Hadoop
生态系统核心组件
Hadoop
的核心架构主要包括HDFS(
Hadoop
DistributedFileSystem
百里自来卷
·
2025-03-06 06:00
hadoop
大数据
分布式
第一个
Hadoop
程序
编写和运行第一个
Hadoop
程序是学习
Hadoop
的重要步骤。以下是一个经典的“WordCount”程序示例,它统计文本文件中每个单词出现的次数。
lqlj2233
·
2025-03-06 05:53
hadoop
大数据
分布式
在虚拟机上安装
Hadoop
全攻略
在虚拟机上安装
Hadoop
是进入大数据处理和分析领域的重要一步。
麻芝汤圆
·
2025-03-06 05:22
spark大数据分析
hadoop
大数据
分布式
windows
linux
服务器
MySQL篇:基础
知识总结
与基于长期主义的内容更新
基础
知识总结
前前后后花了一周左右的时间,我根据csview当中的八股文以及DeepSeek对MySQL部分的基础知识进行了总结,主要包括:概述、事务、索引、锁、存储引擎、日志以及优化部分的内容。
YGGP
·
2025-03-06 02:26
数据库
mysql
数据库
【自学笔记】
Hadoop
基础知识点总览-持续更新
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录
Hadoop
基础知识点总览1.
Hadoop
简介2.
Hadoop
生态系统3.HDFS(
Hadoop
DistributedFileSystem
Long_poem
·
2025-03-05 22:24
笔记
hadoop
大数据
spark hdfs 常用命令
lsrmgettext以下按照使用频率和使用先后顺序排序(纯个人习惯)ls列出hdfs文件系统路径下的目录和文件hdfsdfs-ls列出hdfs文件系统路径下所有的目录和文件hdfsdfs-ls-Rrm
hadoop
fs-rm
毛球饲养员
·
2025-03-05 11:19
spark
spark
hdfs
Spark详解二
masterlocal[2](local[2]是说,执行Application需要用到CPU的2个核)2、Standalone独立模式:Spark自带的一种集群模式Spark自己管理集群资源,此时只需要将
Hadoop
卢子墨
·
2025-03-05 11:13
Spark原理
实战
总结
spark
Spark基本命令
一、spark所在目录cdusr/local/spark二、启动spark/usr/local/spark/sbin/start-all.sh启动
Hadoop
以及Spark:bash.
chenworeng5605
·
2025-03-05 10:42
大数据
scala
shell
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他