E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop随笔
hadoop
-HDFS操作
1.使用的是
hadoop
的用户登录到系统,那么cd~是跳转到/home/
hadoop
下。2.在操作hdfs时,需要在
hadoop
用户下的/usr/local/
hadoop
,此时是在根目录下。
wenying_44323744
·
2025-03-24 19:02
hadoop
hdfs
eclipse
Hadoop
安装
Hadoop
的安装方式有三种,分别是单机模式,伪分布式模式,分布式模式。单机模式:单机模式:
Hadoop
默认模式为非分布式模式(本地模式),无需进行其他配置即可运行。
Cindy_0124
·
2025-03-24 19:59
hadoop
大数据
分布式
数据权限访问控制(Apache Sentry)
ApacheSentry最初由Cloudera公司内部开发,针对
Hadoop
系统中的数据(主要是HDFS、Hive的数据)进行细粒度控制,对HDFS、Hive以及Impala有着良好的支持性。
deepdata_cn
·
2025-03-24 14:56
权限管理
apache
sentry
hbase表无法删除,命令行卡住问题处理
问题现象hbase表无法删除,命令行卡住1.activemaster日志出现超时WARNorg.apache.
hadoop
.hbase.master.procedure.TruncateTableProcedure
spring208208
·
2025-03-24 11:59
大数据组件线上问题分析
hbase
数据库
大数据
【Linux 下的 bash 无法正常解析, Windows 的 CRLF 换行符问题导致的】
hadoop
@
hadoop
:~/anaconda3$bashwait_for_gpu.sh:invalidopt
待磨的钝刨
·
2025-03-23 18:53
linux
bash
windows
大数据技术实战---项目中遇到的问题及项目经验
项目中遇到过哪些问题7.1
Hadoop
宕机(1)如果MR造成系统宕机。此时要控制Yarn同时运行的任务数,和每个任务申请的最大内存。
一个“不专业”的阿凡
·
2025-03-23 16:05
大数据
Apache大数据旭哥优选大数据选题
售后态度和技术都很重要定制按需求做要求不高就实惠一点定制需提前沟通好怎么做,这样才能避免不必要的麻烦python、flask、Django、mapreduce、mysqljava、springboot、vue、echarts、
hadoop
Apache大数据旭
·
2025-03-23 13:12
大数据定制选题
java
hadoop
spark
开发语言
idea
hive
数据库架构
【Hive】-- hive 3.1.3 伪分布式部署(单节点)
1、环境准备1.1、版本选择apachehive3.1.3apache
hadoop
3.1.0oraclejdk1.8mysql8.0.15操作系统:Macos10.151.2、软件下载https://archive.apache.org
oo寻梦in记
·
2025-03-23 12:08
Apache
Paimon
大数据服务部署
hive
分布式
hadoop
【Linux】
Hadoop
-3.4.1的伪分布式集群的初步配置
配置步骤一、检查环境JDK#目前还是JDK8最适合
Hadoop
java-versionecho$JAVA_HOME
Hadoop
hadoop
versionecho$
HADOOP
_HOME二、配置SSH免密登录
孤独打铁匠Julian
·
2025-03-23 11:04
Linux
linux
hadoop
ubuntu
Hadoop
集群规划与部署最佳实践
作者:禅与计算机程序设计艺术1.简介2009年2月2日,Apache
Hadoop
项目诞生。它是一个开源的分布式系统基础架构,用于存储、处理和分析海量的数据。
AI天才研究院
·
2025-03-23 03:47
Python实战
DeepSeek
R1
&
大数据AI人工智能大模型
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
MySQL 到
Hadoop
:Sqoop 数据迁移 ETL
文章目录ETL:Extract-Transform-Load数据迁移过程一、Extract数据抽取1.ODS:OperationalDataStore-可操作数据存储2.DW:DataWarehouse-数据仓库3.DM:DataMart-数据集市二、Transform数据清洗和转换1.数据清洗2.数据转换三、Load数据加载四、数据迁移方法1.Sqoop1.1MySQL->Hive1.1.1im
Ice星空
·
2025-03-23 03:45
ETL
HBase安装
需要用Java和
Hadoop
来处理HBase,所以必须下载java和
Hadoop
并安装系统中。安装前设置安装
Hadoop
在Linux环境下之前,需要建立和使用LinuxSSH(安全Shell)。
lianhedaxue
·
2025-03-23 01:01
Hadoop
hbase
HBase的架构介绍,安装及简单操作
Hadoop
环境:HBase依赖于
Hadoop
,需要先安装并配置好
Hadoop
集群。确保
Hadoop
的相关服务(如HDFS、YARN等)已经正常启动。
pk_xz123456
·
2025-03-23 01:00
大数据
hbase
架构
数据库
HDFS相关的面试题
•HDFS是
Hadoop
分布式文件系统,设计目标是实现对大规模数据的高吞吐量访问,适用于一次
努力的搬砖人.
·
2025-03-22 18:16
java
面试
hdfs
hadoop
3.x--搭建
hadoop
高可用集群(HA模式)
hadoop
高可用集群(HA模式)一、安装前1.集群规划2.安装前配置3.安装jdk与
hadoop
4.克隆虚拟机与互信配置5.搭建zookeeper集群二、HDFS1.配置hdfs2.初始化启动hdfs
运维小菜
·
2025-03-22 14:17
hadoop
hadoop
hdfs
在虚拟机上安装
Hadoop
基本步骤与安装java一致:先用finalshell将
hadoop
-3.1.3.tar.gz导入到opt目录下面的software文件夹下面,然后解压,最后配置环境变量。
杜清卿
·
2025-03-22 07:58
hadoop
hadoop
集群配置-scp拓展使用
任务1:在
hadoop
102上,将
hadoop
101中/opt/module/
hadoop
-3.1.3目录拷贝到
hadoop
102上。
杜清卿
·
2025-03-22 06:28
hadoop
服务器
大数据
大数据学习(75)-大数据组件总结
如果觉得博主的文章还不错的话,请点赞+收藏⭐️+留言支持一下博主哦一、CDHCDH(ClouderaDistributionIncludingApache
Hadoop
)是由Cloudera公司提供的一个集成了
viperrrrrrr
·
2025-03-21 22:42
大数据
impala
yarn
hdfs
hive
CDH
mapreduce
Sqoop安装部署
ApacheSqoop简介Sqoop(SQL-to-
Hadoop
)是Apache开源项目,主要用于:将关系型数据库中的数据导入
Hadoop
分布式文件系统(HDFS)或相关组件(如Hive、HBase)。
愿与狸花过一生
·
2025-03-21 22:10
大数据
sqoop
hadoop
hive
ssh命令
命令无需密码也可登录要先关闭防火墙,命令如下:systemctlstopfirewalldsystemctldisablefirewalldsystemctlstatusfirewalldeg:目标:
hadoop
100
满分对我强制爱
·
2025-03-21 18:32
linux
服务器
运维
spark
Hive面试题
HiveCLI/Beeline和WebUI2.HiveQL3.HiveDriver(驱动)4.Metastore5.Compiler(编译器)6.Optimizer(优化器)7.Executor(执行器)8.
Hadoop
CoreComponents
御风行云天
·
2025-03-21 13:24
面试题大全
hive
hadoop
数据仓库
面试
#
Hadoop
全分布式安装 #mysql安装 #hive安装
分布式(多台机器部署不同组件)与集群(多台机器部署相同组件)概念。Linux基础命令linux具有文件数:目录、文件,从根目录开始,路径具有唯一性。pwd:显示当前路径特殊符号:/:根目录.:隐藏文件,如果路径以.开始,表示当前目录下..:当前目录下的上一级~:当前目录的home目录--help:帮助命令使用linux常用操作命令tab键:自动补全ls:显示指定目录内容默认:当前路径-a:显示所有
砸吧砸吧
·
2025-03-21 09:14
hadoop
hive
yarn
mysql
Hadoop
(在Linux中安装jdk)
安装之前需准备:1.需要远程连接软件2.需要jdk3.需要准备两个文件夹01/export/software安装包02/export/servers解压文件夹现在正式开始安装1.将压缩包存放在/export/software目录下2.进入到software目录进行解压cd/export/software(切换目录)tar-zxvfjdk-8u202-linux-x64.tar.gz-C/expor
錠诗味
·
2025-03-21 03:34
linux
hadoop
运维
数据仓库和非结构化数据。
存储影响性能如果是
hadoop
无所谓影响不大,但是从使用者的角度非结构化数据只能转换关系使用建一张元数据表存储非结构化存储位置
weixin_30631587
·
2025-03-21 03:33
数据库
CentOS 7系统中
hadoop
的安装和环境配置
1.创建
Hadoop
安装解压路径:mkdir-p/usr/
hadoop
2.进入路径:cd/usr/
hadoop
3.下载安装包(我这里用的是阿里云镜像压缩包):wgethttps://mirrors.aliyun.com
代码小张z
·
2025-03-21 01:15
centos
hadoop
linux
尚硅谷电商数仓6.0,hive on spark,spark启动不了
42000][40000]Errorwhilecompilingstatement:FAILED:SemanticExceptionFailedtogetasparksession:org.apache.
hadoop
.hive.ql.metadata.HiveException
新时代赚钱战士
·
2025-03-20 20:57
hive
spark
hadoop
【Leetcode刷题
随笔
】59 螺旋矩阵
1.题目描述给定一个正整数n,生成一个包含1到n2所有元素,且元素按顺时针顺序螺旋排列的nxn正方形矩阵matrix。可结合以下原题链接阅读。原题链接:59螺旋矩阵2.解题思路本题为模拟矩阵填充过程,不需要设计算法,只要完成正确的填充过程即可。首先初始化一个nxn的二维矩阵(涉及到动态内存分配),从矩阵左上角开始往顺时针填充,关键在于填充的转角处不要重复填充,所以对于每条边都要遵循严格的统一规则,
Poor_DayDreamer
·
2025-03-20 16:58
leetcode数组篇
Medium
Tag
leetcode
矩阵
算法
【Leetcode刷题
随笔
】203移除链表元素
1.题目描述题意:删除链表中等于给定值val的所有节点。示例1:输入:head=[1,2,6,3,4,5,6],val=6输出:[1,2,3,4,5]示例2:输入:head=[],val=1输出:[]示例3:输入:head=[7,7,7,7],val=7输出:[]原题链接:203移除链表元素2.解题思路由于链表本身的性质,移除链表的某个节点a,只需要将前一个节点的next指针指向a的下一个节点即可
Poor_DayDreamer
·
2025-03-20 16:58
leetcode链表篇
leetcode
链表
算法
【Leetcode刷题
随笔
】844 比较含退格的字符串
1.题目描述给定s和t两个字符串,比较s和t是否在删除所有由#字符表示的退格操作后相等。退格操作会删除其前面(不包括#本身)的一个字符,如果前面没有字符则忽略该#。如果字符串的末尾有多个退格符,它们会相互抵消,直到没有退格符剩余或者所有字符都被删除。示例1:输入:s=“ab#c”,t=“ad#c”输出:true解释:s和t都会变成“ac”,因为#前面的b和d都被删除。示例2:输入:s=“ab##”
Poor_DayDreamer
·
2025-03-20 16:27
移除元素篇
字符串篇
leetcode
算法
职场和发展
【Leetcode刷题
随笔
】2765最长交替子数组
1.题目描述:该题目标是在一个整数数组nums中寻找最长的“交替子数组”。这种交替子数组的特点是:其元素按照“递增1,递减1,递增1…”的模式循环排列,且子数组的长度必须大于1,例如数组nums=[2,3,4,3,4],交替子数组有[2,3],[3,4],[3,4,3]和[3,4,3,4]。最长的子数组为[3,4,3,4],长度为4。详细题目描述见原题:原题。2.1解题思路一(双层循环):这道题有
Poor_DayDreamer
·
2025-03-20 16:57
leetcode数组篇
leetcode
算法
职场和发展
LeetCode刷题笔记
leetcode_01两数之和斐波那契数列三个数最大乘积反转链表x的平方根环形列表LeetCode
随笔
两数之和给定一个整数数组nums和一个整数目标值target,请你在该数组中找出和为目标值target
小李李李李腊八
·
2025-03-20 16:27
leetcode
算法
java
Hadoop
相关面试题
以下是150道
Hadoop
面试题及其详细回答,涵盖了
Hadoop
的基础知识、HDFS、MapReduce、YARN、HBase、Hive、Sqoop、Flume、ZooKeeper等多个方面,每道题目都尽量详细且简单易懂
努力的搬砖人.
·
2025-03-20 01:53
java
面试
hadoop
Flink读取kafka数据并写入HDFS
硬刚大数据系列文章链接:2021年从零到大数据专家的学习指南(全面升级版)2021年从零到大数据专家面试篇之
Hadoop
/HDFS/Yarn篇2021年从零到大数据专家面试篇之SparkSQL篇2021
王知无(import_bigdata)
·
2025-03-19 22:59
Flink系统性学习专栏
hdfs
kafka
flink
3月19日
随笔
本周的任务1.班级故事两篇八百字(这个压力)2.收集本月的团日材料3.周日去食堂收集五四述职材料4.学计算机二级(这么多天了还没行动)今天下午上完英语课之后和同学们去了海边,本来说的是为了班级风采视频拍一些素材,但是Max的无人机在海滩上被禁飞了,好像这一片都是禁飞的区域,最终决定,来都来了,吃顿好的再回去上晚自习。我们去茂业吃了好像是东北菜,然后买了DQ,这是我第一次吃这么贵的冰激凌,19.9,
Kamui_0us
·
2025-03-19 20:18
笔记
Apache storm
基本上
Hadoop
和Storm框架用于分析大数据。两者互补,在某些方面有所不同。ApacheStorm执行除持久性之外的所有
赵世炎
·
2025-03-19 19:09
storm
hadoop
什么是Apache Avro?
它由Apache
Hadoop
项目开发,广泛应用于大数据生态系统中(如
Hadoop
、Kafka等)。Avro提供了一种紧凑、快速的二进制数据格式,同时支持丰富的数据结构和模式演化。
maozexijr
·
2025-03-19 19:32
apache
计算机毕业设计之基于
Hadoop
的热点新闻分析系统的设计与实现
本文拟采用PyCharm开发工具,django框架、Python语言、
Hadoop
大数据处理技术进行开发,后台使用MySQL数据库进行信息管理,设计开发的热点新闻分析系统。
微信bishe69
·
2025-03-19 18:31
课程设计
python
django
mysql
Hadoop
实战笔记(二)-- HDFS 常用 shell 命令总结
一、HDFS命令显示当前目录结构#显示当前目录结构
hadoop
fs-ls#递归显示当前目录结构
hadoop
fs-ls-R#显示根目录下内容
hadoop
fs-ls/创建目录#创建目录
hadoop
fs-mkdir
dazhong2012
·
2025-03-19 17:48
Hadoop
hdfs
hadoop
近期生活
随笔
因为开店的原因,一直觉得没什么能和大家去分享的,但是最近听到了之前同事的情况,比较之下,还是准备写点什么。因为每天跟不同的客户打交道,所以现在会不会购买东西,也大概心里有数了,说话少,问的少的,往往比各种问的购买可能性会更高,因为可能一个产品有很多种,比如数据线,有三合一的,有1米的,有1.5米的,有2米的,本身在没有想好的情况下,让我去推荐,我也不知道需求点在哪,当我推荐了一圈之后,往往得到的答
飞天kuma
·
2025-03-19 13:51
生活杂谈
创业人生
生活
How Spark Read Sftp Files from
Hadoop
SFTP FileSystem
3.5.3'){excludegroup:"org.apache.logging.log4j",module:"log4j-slf4j2-impl"}implementation('org.apache.
hadoop
IT•轩辕
·
2025-03-19 13:18
Cloudy
Computation
spark
hadoop
大数据
中电金信25/3/18面前笔试(需求分析岗+数据开发岗)
一、需求分析第1题,单选题,
Hadoop
的核心组件包括HDFS和以下哪个?
苍曦
·
2025-03-19 12:43
需求分析
前端
javascript
Spark集群启动与关闭
Hadoop
集群和Spark的启动与关闭
Hadoop
集群开启三台虚拟机均启动ZookeeperzkServer.shstartMaster1上面执行启动HDFSstart-dfs.shslave1上面执行开启
陈沐
·
2025-03-18 23:17
spark
spark
hadoop
big
data
Hive函数大全:从核心内置函数到自定义UDF实战指南(附详细案例与总结)
用户自定义函数(UDF)分类二、常用函数详解与实战案例1.数学函数2.字符串函数3.窗口函数4.自定义UDF实战三、总结与优化建议1.核心总结2.性能优化建议3.常问问题背景Hive作为
Hadoop
一个天蝎座 白勺 程序猿
·
2025-03-18 23:45
大数据开发从入门到实战合集
hive
hadoop
数据仓库
Hadoop
MapReduce 词频统计(WordCount)代码解析教程
一、概述这是一个基于
Hadoop
MapReduce框架实现的经典词频统计程序。程序会统计输入文本中每个单词出现的次数,并将结果输出到HDFS文件系统。
我不是少爷.
·
2025-03-18 17:07
Java基础
hadoop
mapreduce
大数据
从“笨重大象”到“敏捷火花”:
Hadoop
与Spark的大数据技术进化之路
从“笨重大象”到“敏捷火花”:
Hadoop
与Spark的大数据技术进化之路说起大数据技术,
Hadoop
和Spark可以说是这个领域的两座里程碑。
Echo_Wish
·
2025-03-18 12:57
大数据
大数据
hadoop
spark
hadoop
集群关闭命令顺序_启动和关闭
Hadoop
集群命令步骤
启动和关闭
Hadoop
集群命令步骤总结:1.在master上启动
hadoop
-daemon.shstartnamenode.2.在slave上启动
hadoop
-daemon.shstartdatanode
氪老师
·
2025-03-18 12:55
hadoop集群关闭命令顺序
在kali linux中配置
hadoop
伪分布式
目录一.配置静态网络二.配置主机名与IP地址映射三.配置SSH免密登录四.配置Java和
Hadoop
环境五.配置
Hadoop
伪分布式六.启动与验证一.配置静态网络原因:
Hadoop
集群依赖稳定的网络通信
we19a0sen
·
2025-03-18 11:47
三
数据分析
分布式
linux
hadoop
【Leetcode刷题
随笔
】34 在排序数组中查找元素的第一个和最后一个位置
1.题目描述:给你一个按照非递减顺序排列的整数数组nums和一个目标值target,请你找出给定目标值在数组中的开始位置和结束位置。如果数组中不存在目标值target,则返回[-1,-1]。题目要求设计时间复杂度为0(logn)的算法来实现。原题链接:34。2.解题思路复杂度为0(logn)的算法,大家比较熟知的就是二分查找算法,二分查找对于寻找数组中的目标元素也是比较高效,因此这题优先考虑二分查
Poor_DayDreamer
·
2025-03-18 07:07
leetcode数组篇
leetcode
算法
职场和发展
Spark任务读取hive表数据导入es
使用elasticsearch-
hadoop
将hive表数据导入es,超级简单1.引入pomorg.elasticsearchelasticsearch-
hadoop
9.0.0-SNAPSHOT2.创建
小小小小小小小小小小码农
·
2025-03-17 18:25
hive
elasticsearch
spark
java
hive-进阶版-1
第6章hive内部表与外部表的区别Hive是一个基于
Hadoop
的数据仓库工具,用于对大规模数据集进行数据存储、查询和分析。
数据牧马人
·
2025-03-17 10:59
hive
hadoop
数据仓库
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他