E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop发行版
【虚拟化平台】选对虚拟化引擎:ESXi, Hyper-V, KVM, VirtualBox优劣全览
VMwareMicrosoftHyper-V:PagenotfoundKVM(Kernel-basedVirtualMachine):KVM作为Linux内核的一部分,并没有单一的商业网站,但可以参考Linux内核文档或者使用KVM的
发行版
如
何遇mirror
·
2024-08-21 21:01
Docker
大数据
运维
大数据
HiveSQL常见函数及使用方法(含代码示例)
HiveSQL(HiveSQL)是ApacheHive所使用的SQL方言,专门用于在
Hadoop
上进行大规模数据处理。以下是一些常见的HiveSQL函数及其使用方法:1.聚合函数COUNT统计记录数。
会飞的岛格酱
·
2024-08-21 21:31
SQL代码练习
hive
sql
数据分析
2024-07-12 - 基于 sealos 部署高可用 K8S 管理系统
摘要Sealos是一款以Kubernetes为内核的云操作系统
发行版
。它以云原生的方式,抛弃了传统的云计算架构,转向以Kubernetes为云内核的新架构,使企业能够像使用个人电脑一样简单地使用云。
流雨声
·
2024-08-21 21:30
kubernetes
容器
云原生
Azkaban各种类型的Job编写
一、概述原生的Azkaban支持的plugin类型有以下这些:command:Linuxshell命令行任务gobblin:通用数据采集工具
hadoop
Java:运行
hadoop
MR任务java:原生java
__元昊__
·
2024-03-28 21:00
Linux(centos7)部署hive
前提环境:已部署完
hadoop
(HDFS、MapReduce、YARN)1、安装元数据服务MySQL切换root用户#更新密钥rpm--importhttps://repo.mysql.com/RPM-GPG-KEY-mysqL
灯下夜无眠
·
2024-03-28 12:44
Linux
linux
hive
运维
dbeaver
hive客户端
在 Linux/Ubuntu/Debian 上安装 SQL Server 2019
Microsoft为Linux
发行版
(包括Ubuntu)提供SQLServer。
理工男老K
·
2024-03-26 16:06
ubuntu
linux
运维
debian
sqlserver
关于HDP的20道高级运维面试题
HDP(HortonworksDataPlatform)的主要组件包括
Hadoop
框架、HDFS、MapReduce、YARN以及
Hadoop
生态系统中的其他关键工具,如Spark、Flink、Hive
编织幻境的妖
·
2024-03-26 15:34
运维
【
Hadoop
】使用Scala与Spark连接ClickHouse进行数据处理
风不懂不懂得叶的梦月不听不听闻窗里琴声意难穷水不见不曾见绿消红霜不知不知晓将别人怎道珍重落叶有风才敢做一个会飞的梦孤窗有月才敢登高在夜里从容桃花有水才怕身是客身是客此景不能久TieYann(铁阳)、薄彩生《不知晓》在大数据分析和处理领域,ApacheSpark是一个广泛使用的高性能、通用的计算框架,而ClickHouse作为一个高性能的列式数据库,特别适合在线分析处理(OLAP)。结合Scala语
音乐学家方大刚
·
2024-03-26 09:56
Scala
Hadoop
hadoop
scala
spark
centos7安装jdk17
AmazonCorretto是亚马逊提供的一个免费的、兼容OpenJDK的JDK
发行版
。
小丛的知识窝
·
2024-03-25 13:30
java
Linux mkswap命令教程:如何设置Linux交换区(附实例详解和注意事项)
Linuxmkswap命令适用的Linux版本mkswap命令适用于所有主流的Linux
发行版
,包括Debian、Ubuntu、Alpine、
我要下东西噢
·
2024-03-24 07:55
linux
linux
运维
服务器
hadoop
配置免密登录
1.生成密钥ssh-keygen-trsa所有节点都要执行2.所有节点执行ssh-copy-id-i~/.ssh/id_rsa.pub用户名1@主机名1ssh-copy-id-i~/.ssh/id_rsa.pub用户名2@主机名2ssh-copy-id-i~/.ssh/id_rsa.pub用户名3@主机名33.目录授权chmod700~/.sshchmod600~/.ssh/authorized_
我干开发那十年
·
2024-03-24 07:25
ssh
服务器
linux
【笔记】HDFS基础笔记
启动
hadoop
命令(未配环境变量):进入
hadoop
安装目录输入.
哇咔咔哇咔
·
2024-03-20 04:12
Hadoop
hdfs
笔记
hadoop
大数据
ubuntu
【笔记】Linux常用命令
命令含义cd/home/
hadoop
#把/home/
hadoop
设置为当前目录cd..#返回上一级目录cd~#进入到当前Linux系统登录用户的主目录(或主文件夹)。
哇咔咔哇咔
·
2024-03-20 03:11
Linux
笔记
linux
运维
ubuntu
考试总结
2.不从/开始相对于当前目录的路径1.3简述进程、守护进程、程序之间的区别(6分)1.存放在磁盘满中的文件2.内存中运行中的程序3.为了提供某种服务持续运行的程序1.4写出你所知道的主流Linux系统
发行版
本
chloepang
·
2024-03-19 02:57
第3章 基本的bash shell命令
大多数Linux
发行版
的默认shell都是GNUbashshell。
coder_guoxd
·
2024-03-18 01:37
bash
linux
开发语言
linux安装单机版spark3.5.0
一、spark介绍是一种通用的大数据计算框架,正如传统大数据技术
Hadoop
的MapReduce、Hive引擎,以及Storm流式实时计算引擎等.Spark主要用于大数据的计算二、spark下载spark3.5.0
爱上雪茄
·
2024-03-17 18:57
大数据
JAVA知识
spark
大数据
分布式
Hadoop
简介
简介大数据简介概述大数据的说法从出现到现在,也经历了十多年时间的发展。而在这十几年的发展过程中,非常多的机构、组织都试图对大数据做出过定义,例如:研究机构Gartner给出了这样的定义:"大数据"是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。再例如根据维基百科的定义,大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。
程序员小郭同学
·
2024-03-16 07:10
hadoop
Hive中的NVL函数与COALESCE函数
ReturnsdefaultvalueifvalueisnullelsereturnsvalueExample:>SELECTnvl(null,'bla')FROMsrcLIMIT1;blaFunctionclass:org.apache.
hadoop
.hive.ql.udf.generic.GenericUDFNv
独影月下酌酒
·
2024-03-15 13:13
Hadoop
大数据
hive
hadoop
数据仓库
hive库表占用空间大小的命令
hdfsdfs-du-h/user/hive/warehouse2、按占用空间大小降序排列hdfsdfs-du/user/hive/warehouse/ipms.db|sort-nr3、查某一个分区占用空间大小(单位G)
hadoop
fs-ls
刀鋒偏冷
·
2024-03-15 13:13
hive
hadoop
数据仓库
03hive数仓安装与基础使用
hiveHive概述Hive是基于
Hadoop
的一个数据仓库工具。
daydayup9527
·
2024-03-14 13:39
hadoop_hive
运维
hadoop
HDFS
(一)HDFS简介及其基本概念 HDFS(
Hadoop
DistributedFileSystem)是
hadoop
生态系统的一个重要组成部分,是
hadoop
中的的存储组件,在整个
Hadoop
中的地位非同一般
weixin_51987187
·
2024-03-12 14:32
笔记
大数据
如果您用的是 unstable
发行版
,这也许是 因为系统无法达到您要求的状态造成的。
使用sudoapt-getinstall安装东西的时候,出现各种依赖问题,能装上也就算了,装不上就巨坑!还是aptitude大法好!sudoapt-getinstallaptitudeaptitude可以比apt-get更加智能地解决依赖问题,然后sudoaptitudeinstall对应安装包
CLM_Only
·
2024-03-12 11:57
ubuntu
常见Linux系统的优劣对比(Ubuntu、RHEL、CentOS)
Ubuntu、RHEL(RedHatEnterpriseLinux)和CentOS都是流行的Linux
发行版
,它们各自具有独特的特点和适用场景。
more_is_different
·
2024-03-12 10:56
linux
运维
服务器
大数据开发(
Hadoop
面试真题-卷二)
大数据开发(
Hadoop
面试真题)1、在大规模数据处理过程中使用编写MapReduce程序存在什么缺点?如何解决这些问题?
Key-Key
·
2024-03-12 02:15
大数据
hadoop
面试
zookeeper 使用
zookeeper介绍zookeeper是一个为分布式应用提供一致性服务的软件,它是开源的
Hadoop
项目中的一个子项目,并且根据google发表的论文来实现的,接下来我们首先来安装使用下这个软件,然后再来探索下其中比较重要一致性算法
SkTj
·
2024-03-10 02:15
Hive SQL 开发指南(三)优化及常见异常
在大数据领域,HiveSQL是一种常用的查询语言,用于在
Hadoop
上进行数据分析和处理。为了确保代码的可读性、维护性和性能,制定一套规范化的HiveSQL开发规范至关重要。
大数据_苡~
·
2024-03-09 14:13
003-数据开发
hive
Hive优化
数据倾斜
Hive常见异常
hive
join
大数据开发(
Hadoop
面试真题-卷九)
大数据开发(
Hadoop
面试真题)1、Hivecount(distinct)有几个reduce,海量数据会有什么问题?
Key-Key
·
2024-03-09 10:06
大数据
hadoop
面试
大数据开源框架技术汇总
目录系统平台(
Hadoop
、CDH、HDP)监控管理(CM、Hue、Ambari、Dr.Elephant、Ganglia、Zabbix、Eagle)文件系统(HDFS、GPFS、Ceph、Gluster
浪尖聊大数据-浪尖
·
2024-03-08 20:48
数据仓库
hive
flume
分布式
scipy
makefile
crm
lighttpd
linux大版本之间的区别和特性
1.描述Linux内核版本和
发行版
之间的关系。Linux内核版本指的是Linux操作系统核心的特定版本,而Linux
发行版
则是基于该内核并集成了其他软件和工具的完整操作系统。
编织幻境的妖
·
2024-03-07 17:12
linux
运维
服务器
Linux skill命令教程:如何发送信号或报告进程状态(附实例详解和注意事项)
Linuxskill命令适用的Linux版本skill命令在大多数Linux
发行版
中都可以使用,包括Debian、Ubuntu、Alpine、ArchLinux、KaliL
我要下东西噢
·
2024-03-07 12:05
linux
linux
运维
服务器
Linux中systemctl命令骨灰级详解
在现代的Linux
发行版
中,systemctl是一个非常强大和重要的命令,它用于管理系统服务。无论是启动、停止、重启服务,还是查看服务状态、启用或禁用服务,systemctl都是必不可少的工具。
安语未
·
2024-03-07 12:04
linux
运维
服务器
Linux gitps命令教程:简化Git操作的利器(附实例详解和注意事项)
您可以在任何支持Bash的Linux
发行版
上使用它。如果您遇到问题,可以检查您的系统是否已正确安装Git。Linuxgitps命令的基本语法g
我要下东西噢
·
2024-03-04 15:38
linux
linux
git
运维
使用 kind 集群安装运行极狐GitLab Runner【上】
极狐GitLab是GitLab在中国的
发行版
,专门为中国程序员服务。可以一键式部署极狐GitLab。
极小狐
·
2024-03-03 07:54
kind
gitlab
云原生
runner
【
Hadoop
】在spark读取clickhouse中数据
读取clickhouse数据库数据importscala.collection.mutable.ArrayBufferimportjava.util.Propertiesimportorg.apache.spark.sql.SaveModeimportorg.apache.spark.sql.SparkSessiondefgetCKJdbcProperties(batchSize:String="
方大刚233
·
2024-03-03 06:54
Hadoop
Scala
hadoop
spark
clickhouse
【
Hadoop
】使用Metorikku框架读取hive数据统计分析写入mysql
一、定义作业文件作业文件该文件将包括输入源、输出目标和要执行的配置文件的位置,具体内容如下metrics:-/user/xrx/qdb.yaml#此位置为hdfs文件系统目录inputs:output:jdbc:connectionUrl:"jdbc:mysql://233.233.233.233:3306/sjjc"user:"root"password:"123456"driver:"com.
方大刚233
·
2024-03-03 06:23
Hadoop
Scala
hadoop
hive
mysql
Spark-sql Adaptive Execution动态调整分区数量,调整输出文件数
看看这个参数如何运用:我们的spark-sql版本:[
hadoop
@666~]$spark-sql--versionWelcometo______/__
不想起的昵称
·
2024-03-02 15:03
hive
spark
hive
数据仓库
hadoop
里需要的lib
hadoop
.so版本不一致导致问题及解决办法
$
HADOOP
_HOME/lib/native/Linux-amd64-64(64位操作系统)$
HADOOP
_HOME/lib/native/Linux-i386-32(32位操作系统)文件夹中的lib
hadoop
.so
weixin_34304013
·
2024-03-02 09:23
大数据
操作系统
嵌入式
hadoop
启动报错处理
1.
hadoop
启动报错1.1.问题1util.NativeCodeLoader:Unabletoloadnative-
hadoop
libraryforyourplatform...usingbuiltin-javaclasseswhereapplicable
akuibpt23191
·
2024-03-02 08:51
大数据
操作系统
eBPF实践篇之环境搭建
本次我们学习一下eBPF,我们基于libbpf-bootstrap来进行我们的eBPF程序开发实验环境一台Debian12操作系统的计算机,我使用的是Debian12.2.0-amd64其它Linux
发行版
的环境也可以
醉墨居士
·
2024-03-01 22:38
eBPF
linux
网络
c语言
Spark整合hive(保姆级教程)
准备工作:1、需要安装配置好hive,如果不会安装可以跳转到Linux下编写脚本自动安装hive2、需要安装配置好spark,如果不会安装可以跳转到Spark安装与配置(单机版)3、需要安装配置好
Hadoop
万家林
·
2024-02-29 09:47
spark
hive
spark
hadoop
Hadoop
-Yarn-NodeManager是如何监控容器的
一、源码下载下面是
hadoop
官方源码下载地址,我下载的是
hadoop
-3.2.4,那就一起来看下吧Indexof/dist/
hadoop
/core二、上下文在我的博客中的ContainerLaunchprepareForLaunch
隔着天花板看星星
·
2024-02-28 06:15
hadoop
大数据
yarn
linux 面试题
tar-z解亚压缩-c打包-x解包-v显示过程-f指定文件名文本编辑:vivim查找:find查找文件grep查找文件内容2.你们服务器用的linux操作系统是哪个版本的redhat3.什么是内核版和
发行版
it优质男
·
2024-02-27 01:40
java
后端
面试
linux
运维
服务器
Zookeeper实现分布式锁
首先需要确保有
hadoop
102,
hadoop
103,
hadoop
104三台虚拟机并且都安装成功且配置成功了zookeeper。
正在绘制中
·
2024-02-25 23:35
分布式
zookeeper
云原生
Linux操作系统中软件安装
在Linux操作系统中,因为存在很多发生版本,所以往往会出现在一种Linux
发行版
本中的软件应用,转换到另一种的
发行版
本就不能正常使
·
2024-02-24 21:31
程序员
docker搭建
hadoop
hdfs完全分布式集群
1制作
hadoop
镜像参见https://www.cnblogs.com/rmxd/p/12051866.html该博客中只参考制作镜像部分,固定IP及启动集群的部分应该跳过。
shangcunshanfu
·
2024-02-20 22:08
hadoop
docker
big
data
基于docker安装HDFS
1.docker一键安装见docker一键安装2.拉取镜像sudodockerpullkiwenlau/
hadoop
:1.03.下载启动脚本gitclonehttps://github.com/kiwenlau
core512
·
2024-02-20 22:02
大数据
虚拟机&容器
docker
hdfs
maven 仓库分类
snapshot快照仓库用于保存开发过程中的不稳定版本,release正式仓库则是用来保存稳定的
发行版
本。
nai598455803
·
2024-02-20 21:19
hive 的map数和reduce如何确定
的文件大小,集群设置的文件块大小(目前为128M,可在hive中通过setdfs.block.size;命令查看到,该参数不能自定义修改);2.举例:a)假设input目录下有1个文件a,大小为780M,那么
hadoop
Super乐
·
2024-02-20 20:38
hive
hive
(17)Hive ——MR任务的map与reduce个数由什么决定?
MapTask的数量由以下参数决定文件个数文件大小blocksize一般而言,对于每一个输入的文件会有一个mapsplit,每一个分片会开启一个map任务,很容易导致小文件问题(如果不进行小文件合并,极可能导致
Hadoop
爱吃辣条byte
·
2024-02-20 20:27
#
Hive
hive
数据仓库
Hadoop
生态圈
是数据分析数据引擎,也是MapReduce模型,支持SQL4.Pig也是一个数据分析引擎,不支持SQL,有自己的PigLatin数据5.Sqoop是数据采集工具,针对关系数据库6.Flume是针对文件等数据的采集7.
Hadoop
陈超Terry的技术屋
·
2024-02-20 19:47
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他