E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop;Spark
hadoop
-HDFS操作
1.使用的是
hadoop
的用户登录到系统,那么cd~是跳转到/home/
hadoop
下。2.在操作hdfs时,需要在
hadoop
用户下的/usr/local/
hadoop
,此时是在根目录下。
wenying_44323744
·
2025-03-24 19:02
hadoop
hdfs
eclipse
Hadoop
安装
Hadoop
的安装方式有三种,分别是单机模式,伪分布式模式,分布式模式。单机模式:单机模式:
Hadoop
默认模式为非分布式模式(本地模式),无需进行其他配置即可运行。
Cindy_0124
·
2025-03-24 19:59
hadoop
大数据
分布式
数据权限访问控制(Apache Sentry)
ApacheSentry最初由Cloudera公司内部开发,针对
Hadoop
系统中的数据(主要是HDFS、Hive的数据)进行细粒度控制,对HDFS、Hive以及Impala有着良好的支持性。
deepdata_cn
·
2025-03-24 14:56
权限管理
apache
sentry
【Python系列】高效Parquet数据处理策略:合并与分析实践
Parquet作为一种高效的列存储格式,被广泛应用于大数据处理框架中,如Apache
Spark
、ApacheHive等。
小团团0
·
2025-03-24 12:41
python
开发语言
hbase表无法删除,命令行卡住问题处理
问题现象hbase表无法删除,命令行卡住1.activemaster日志出现超时WARNorg.apache.
hadoop
.hbase.master.procedure.TruncateTableProcedure
spring208208
·
2025-03-24 11:59
大数据组件线上问题分析
hbase
数据库
大数据
spark
explain如何使用
在
Spark
中,explain是分析SQL或DataFrame执行计划的核心工具,通过不同模式可展示查询优化和执行的详细信息,默认情况下,这个语句只提供关于物理计划的信息。
fzip
·
2025-03-24 00:14
Spark
spark
执行计划
【
Spark
】查询优化中分区(Partitioning)和分桶(Bucketing)是什么关系?什么时候应当分区,什么时候应当分桶?
在学习
Spark
的过程中,分区和分桶乍一看很像,都能为了计算加速,但是仔细一想,一查还是有些差异的,甚至说差异很大。那么具体有什么差异点,有什么相同点。我做出了如下的整理,供大家参考,欢迎指正。
petrel2015
·
2025-03-23 23:37
spark
大数据
分布式
数据库
py
spark
学习rdd处理数据方法——学习记录
python黑马程序员"""文件,按JSON字符串存储1.城市按销售额排名2.全部城市有哪些商品类别在售卖3.上海市有哪些商品类别在售卖"""frompy
spark
import
Spark
Conf,
Spark
Contextimportosimportjsonos.environ
亭午
·
2025-03-23 20:12
学习
【Linux 下的 bash 无法正常解析, Windows 的 CRLF 换行符问题导致的】
hadoop
@
hadoop
:~/anaconda3$bashwait_for_gpu.sh:invalidopt
待磨的钝刨
·
2025-03-23 18:53
linux
bash
windows
数据湖Iceberg、Hudi和Paimon比较_数据湖框架对比(1)
ApacheIcebergApacheHudiApachePaimonSchemaEvolutionALLback-compatibleback-compatibleSelf-definedschemaobjectYESNO(
spark
-schema
2301_79098963
·
2025-03-23 17:45
程序员
知识图谱
人工智能
大数据技术实战---项目中遇到的问题及项目经验
项目中遇到过哪些问题7.1
Hadoop
宕机(1)如果MR造成系统宕机。此时要控制Yarn同时运行的任务数,和每个任务申请的最大内存。
一个“不专业”的阿凡
·
2025-03-23 16:05
大数据
Apache大数据旭哥优选大数据选题
售后态度和技术都很重要定制按需求做要求不高就实惠一点定制需提前沟通好怎么做,这样才能避免不必要的麻烦python、flask、Django、mapreduce、mysqljava、springboot、vue、echarts、
hadoop
Apache大数据旭
·
2025-03-23 13:12
大数据定制选题
java
hadoop
spark
开发语言
idea
hive
数据库架构
【Hive】-- hive 3.1.3 伪分布式部署(单节点)
1、环境准备1.1、版本选择apachehive3.1.3apache
hadoop
3.1.0oraclejdk1.8mysql8.0.15操作系统:Macos10.151.2、软件下载https://archive.apache.org
oo寻梦in记
·
2025-03-23 12:08
Apache
Paimon
大数据服务部署
hive
分布式
hadoop
【Linux】
Hadoop
-3.4.1的伪分布式集群的初步配置
配置步骤一、检查环境JDK#目前还是JDK8最适合
Hadoop
java-versionecho$JAVA_HOME
Hadoop
hadoop
versionecho$
HADOOP
_HOME二、配置SSH免密登录
孤独打铁匠Julian
·
2025-03-23 11:04
Linux
linux
hadoop
ubuntu
Hadoop
集群规划与部署最佳实践
作者:禅与计算机程序设计艺术1.简介2009年2月2日,Apache
Hadoop
项目诞生。它是一个开源的分布式系统基础架构,用于存储、处理和分析海量的数据。
AI天才研究院
·
2025-03-23 03:47
Python实战
DeepSeek
R1
&
大数据AI人工智能大模型
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
MySQL 到
Hadoop
:Sqoop 数据迁移 ETL
文章目录ETL:Extract-Transform-Load数据迁移过程一、Extract数据抽取1.ODS:OperationalDataStore-可操作数据存储2.DW:DataWarehouse-数据仓库3.DM:DataMart-数据集市二、Transform数据清洗和转换1.数据清洗2.数据转换三、Load数据加载四、数据迁移方法1.Sqoop1.1MySQL->Hive1.1.1im
Ice星空
·
2025-03-23 03:45
ETL
Azure Delta Lake、Databricks和Event Hubs实现实时欺诈检测
AzureEventHubs/Kafka摄入实时数据,通过DeltaLake实现Exactly-Once语义,实时欺诈检测(流数据写入DeltaLake,批处理模型实时更新),以及具体实现的详细步骤和关键Py
Spark
weixin_30777913
·
2025-03-23 03:12
azure
云计算
HBase安装
需要用Java和
Hadoop
来处理HBase,所以必须下载java和
Hadoop
并安装系统中。安装前设置安装
Hadoop
在Linux环境下之前,需要建立和使用LinuxSSH(安全Shell)。
lianhedaxue
·
2025-03-23 01:01
Hadoop
hbase
HBase的架构介绍,安装及简单操作
Hadoop
环境:HBase依赖于
Hadoop
,需要先安装并配置好
Hadoop
集群。确保
Hadoop
的相关服务(如HDFS、YARN等)已经正常启动。
pk_xz123456
·
2025-03-23 01:00
大数据
hbase
架构
数据库
探索数据安全新境界:Apache
Spark
SQL Ranger Security插件深度揭秘
探索数据安全新境界:Apache
Spark
SQLRangerSecurity插件深度揭秘项目地址:https://gitcode.com/gh_mirrors/sp/
spark
-ranger随着大数据的爆炸性增长
乌昱有Melanie
·
2025-03-22 23:44
HDFS相关的面试题
•HDFS是
Hadoop
分布式文件系统,设计目标是实现对大规模数据的高吞吐量访问,适用于一次
努力的搬砖人.
·
2025-03-22 18:16
java
面试
hdfs
基于Azure云平台构建实时数据仓库
设计Azure云架构方案实现AzureDeltaLake和AzureDatabricks,结合电商网站的流数据,构建实时数据仓库,支持T+0报表(如电商订单分析),具以及具体实现的详细步骤和关键Py
Spark
weixin_30777913
·
2025-03-22 18:15
云计算
azure
开发语言
spark
python
hadoop
3.x--搭建
hadoop
高可用集群(HA模式)
hadoop
高可用集群(HA模式)一、安装前1.集群规划2.安装前配置3.安装jdk与
hadoop
4.克隆虚拟机与互信配置5.搭建zookeeper集群二、HDFS1.配置hdfs2.初始化启动hdfs
运维小菜
·
2025-03-22 14:17
hadoop
hadoop
hdfs
在虚拟机上安装
Hadoop
基本步骤与安装java一致:先用finalshell将
hadoop
-3.1.3.tar.gz导入到opt目录下面的software文件夹下面,然后解压,最后配置环境变量。
杜清卿
·
2025-03-22 07:58
hadoop
hadoop
集群配置-scp拓展使用
任务1:在
hadoop
102上,将
hadoop
101中/opt/module/
hadoop
-3.1.3目录拷贝到
hadoop
102上。
杜清卿
·
2025-03-22 06:28
hadoop
服务器
大数据
大数据学习(75)-大数据组件总结
如果觉得博主的文章还不错的话,请点赞+收藏⭐️+留言支持一下博主哦一、CDHCDH(ClouderaDistributionIncludingApache
Hadoop
)是由Cloudera公司提供的一个集成了
viperrrrrrr
·
2025-03-21 22:42
大数据
impala
yarn
hdfs
hive
CDH
mapreduce
Sqoop安装部署
ApacheSqoop简介Sqoop(SQL-to-
Hadoop
)是Apache开源项目,主要用于:将关系型数据库中的数据导入
Hadoop
分布式文件系统(HDFS)或相关组件(如Hive、HBase)。
愿与狸花过一生
·
2025-03-21 22:10
大数据
sqoop
hadoop
hive
ssh命令
命令无需密码也可登录要先关闭防火墙,命令如下:systemctlstopfirewalldsystemctldisablefirewalldsystemctlstatusfirewalldeg:目标:
hadoop
100
满分对我强制爱
·
2025-03-21 18:32
linux
服务器
运维
spark
优化Apache
Spark
性能之JVM参数配置指南
Apache
Spark
运行在JVM之上,JVM的垃圾回收(GC)、内存管理以及堆外内存使用情况,会直接对
Spark
任务的执行效率产生影响。
weixin_30777913
·
2025-03-21 13:58
jvm
spark
大数据
开发语言
性能优化
GraphCube、
Spark
和深度学习技术赋能快消行业关键运营环节
GraphCube图多维数据集技术、
Spark
大数据分析处理技术和深度学习技术的结合,为这些环节提供了智能化、动态化和实时化的解决方案,显著提升业务运营效率和企业利润。一、技术
weixin_30777913
·
2025-03-21 13:28
开发语言
大数据
深度学习
人工智能
spark
Hive面试题
HiveCLI/Beeline和WebUI2.HiveQL3.HiveDriver(驱动)4.Metastore5.Compiler(编译器)6.Optimizer(优化器)7.Executor(执行器)8.
Hadoop
CoreComponents
御风行云天
·
2025-03-21 13:24
面试题大全
hive
hadoop
数据仓库
面试
【新品发售】NVIDIA 发布全球最小个人 AI 超级计算机 DGX
Spark
GTC2025大会上,NVIDIA正式推出了搭载NVIDIAGraceBlackwell平台的个人AI超级计算机——DGX
Spark
。赞奇可接受预订,直接私信后台即刻预订!
·
2025-03-21 12:09
segmentfault
Kafka Connect Node.js Connector 指南
KafkaConnectNode.jsConnector指南kafka-connectequivalenttokafka-connect:wrench:fornodejs:
spark
les::turtle
丁操余
·
2025-03-21 12:39
#
Hadoop
全分布式安装 #mysql安装 #hive安装
分布式(多台机器部署不同组件)与集群(多台机器部署相同组件)概念。Linux基础命令linux具有文件数:目录、文件,从根目录开始,路径具有唯一性。pwd:显示当前路径特殊符号:/:根目录.:隐藏文件,如果路径以.开始,表示当前目录下..:当前目录下的上一级~:当前目录的home目录--help:帮助命令使用linux常用操作命令tab键:自动补全ls:显示指定目录内容默认:当前路径-a:显示所有
砸吧砸吧
·
2025-03-21 09:14
hadoop
hive
yarn
mysql
JAVA学习-练习试用Java实现“对大数据集中的网络日志进行解析和异常行为筛查”
问题:编写一个
Spark
程序,对大数据集中的网络日志进行解析和异常行为筛查。解答思路:下面是一个简单的
Spark
程序示例,用于解析网络日志并筛查异常行为。
守护者170
·
2025-03-21 07:30
java学习
java
学习
JAVA学习-练习试用Java实现“实现一个
Spark
应用,对大数据集中的文本数据进行情感分析和关键词筛选”
问题:实现一个
Spark
应用,对大数据集中的文本数据进行情感分析和关键词筛选。
守护者170
·
2025-03-21 07:30
java学习
java
学习
Hadoop
(在Linux中安装jdk)
安装之前需准备:1.需要远程连接软件2.需要jdk3.需要准备两个文件夹01/export/software安装包02/export/servers解压文件夹现在正式开始安装1.将压缩包存放在/export/software目录下2.进入到software目录进行解压cd/export/software(切换目录)tar-zxvfjdk-8u202-linux-x64.tar.gz-C/expor
錠诗味
·
2025-03-21 03:34
linux
hadoop
运维
数据仓库和非结构化数据。
存储影响性能如果是
hadoop
无所谓影响不大,但是从使用者的角度非结构化数据只能转换关系使用建一张元数据表存储非结构化存储位置
weixin_30631587
·
2025-03-21 03:33
数据库
CentOS 7系统中
hadoop
的安装和环境配置
1.创建
Hadoop
安装解压路径:mkdir-p/usr/
hadoop
2.进入路径:cd/usr/
hadoop
3.下载安装包(我这里用的是阿里云镜像压缩包):wgethttps://mirrors.aliyun.com
代码小张z
·
2025-03-21 01:15
centos
hadoop
linux
Hive与
Spark
的UDF:数据处理利器的对比与实践
文章目录Hive与
Spark
的UDF:数据处理利器的对比与实践一、UDF概述二、HiveUDF解析实现原理代码示例业务应用三、
Spark
UDF剖析-JDBC方式使用
Spark
ThriftServer设置通过
窝窝和牛牛
·
2025-03-20 23:22
hive
spark
hadoop
尚硅谷电商数仓6.0,hive on
spark
,
spark
启动不了
在datagrip执行分区插入语句时报错[42000][40000]Errorwhilecompilingstatement:FAILED:SemanticExceptionFailedtogeta
spark
session
新时代赚钱战士
·
2025-03-20 20:57
hive
spark
hadoop
数据中台(二)数据中台相关技术栈
1.平台搭建1.1.Amabari+HDP1.2.CM+CDH2.相关的技术栈数据存储:HDFS,HBase,Kudu等数据计算:MapReduce,
Spark
,Flink交互式查询:Impala,Presto
Yuan_CSDF
·
2025-03-20 05:25
#
数据中台
一文搞懂大数据神器
Spark
,真的太牛了!
Spark
是什么在如今这个大数据时代,数据量呈爆炸式增长,传统的数据处理方式已经难以满足需求。就拿电商平台来说,每天产生的交易数据、用户浏览数据、评论数据等,数量巨大且种类繁多。
qq_23519469
·
2025-03-20 04:19
大数据
spark
分布式
Hadoop
相关面试题
以下是150道
Hadoop
面试题及其详细回答,涵盖了
Hadoop
的基础知识、HDFS、MapReduce、YARN、HBase、Hive、Sqoop、Flume、ZooKeeper等多个方面,每道题目都尽量详细且简单易懂
努力的搬砖人.
·
2025-03-20 01:53
java
面试
hadoop
Flink读取kafka数据并写入HDFS
硬刚大数据系列文章链接:2021年从零到大数据专家的学习指南(全面升级版)2021年从零到大数据专家面试篇之
Hadoop
/HDFS/Yarn篇2021年从零到大数据专家面试篇之
Spark
SQL篇2021
王知无(import_bigdata)
·
2025-03-19 22:59
Flink系统性学习专栏
hdfs
kafka
flink
Apache storm
基本上
Hadoop
和Storm框架用于分析大数据。两者互补,在某些方面有所不同。ApacheStorm执行除持久性之外的所有
赵世炎
·
2025-03-19 19:09
storm
hadoop
什么是Apache Avro?
它由Apache
Hadoop
项目开发,广泛应用于大数据生态系统中(如
Hadoop
、Kafka等)。Avro提供了一种紧凑、快速的二进制数据格式,同时支持丰富的数据结构和模式演化。
maozexijr
·
2025-03-19 19:32
apache
计算机毕业设计之基于
Hadoop
的热点新闻分析系统的设计与实现
本文拟采用PyCharm开发工具,django框架、Python语言、
Hadoop
大数据处理技术进行开发,后台使用MySQL数据库进行信息管理,设计开发的热点新闻分析系统。
微信bishe69
·
2025-03-19 18:31
课程设计
python
django
mysql
Hadoop
实战笔记(二)-- HDFS 常用 shell 命令总结
一、HDFS命令显示当前目录结构#显示当前目录结构
hadoop
fs-ls#递归显示当前目录结构
hadoop
fs-ls-R#显示根目录下内容
hadoop
fs-ls/创建目录#创建目录
hadoop
fs-mkdir
dazhong2012
·
2025-03-19 17:48
Hadoop
hdfs
hadoop
元戎启行最新战略RoadAGI:所有移动智能体都将被AI驱动
会上,公司CEO周光发表了技术主题演讲,展示了公司的最新战略布局RoadAGI,并发布道路通用人工智能平台——AI
Spark
(以下简称”
Spark
平台”)。
·
2025-03-19 16:16
量子位
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他