E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfs扩容
Hive效率优化记录
Hive是工作中常用的数据仓库工具,提供存储在
HDFS
文件系统,将结构化数据映射为一张张表以及提供查询和分析功能。
Forge_ahead
·
2023-11-20 03:26
work_efficiency
Study
hive
hadoop
数据仓库
数据结构(四)哈希表入门
关键码值(key,vale)也可以当成是key的hash值,这个映射函数叫做散列函数存放记录的数组叫做散列表特点数组(顺序表):寻址容易链表:插入与删除容易哈希表:寻址容易,插入删除也容易的数据结构,缺点:
扩容
会消耗大量的空间和性能
YangDxg
·
2023-11-20 03:17
大数据基础——
HDFS
(分布式文件系统)
分布式文件系统——
HDFS
文章目录分布式文件系统——
HDFS
HDFS
概述
HDFS
发展历史
HDFS
的设计目标HDSF应用场景适合的应用场景不适合的应用场景
HDFS
架构
HDFS
的基本原理NameNode概念
我菜的要死
·
2023-11-20 02:49
大数据
hdfs
big
data
hadoop
大数据学长面试之华为面试题
2)外包总部d1区:(1)namenode内存满了,如何进行
扩容
,调什么参数。(2)linux命令怎么查看mr任务的jobid(3)kafka消费者消费数据的流程,细节到进程和线程这一层。
大数据小理
·
2023-11-20 01:15
大数据
大数据1
大数据
面试
华为
大数据研发工程师面试
9.
HDFS
的理解?10.hadoop对put一个文件
ChlinRei
·
2023-11-20 01:43
面试
大数据
面试
职场和发展
大数据开发面试(一)
适用于需要将大量数据发送到
HDFS
、HBase等存储系统的场景。具有较强的可靠性、可扩
ChlinRei
·
2023-11-20 01:41
面试
大数据
面试
etl工程师
Prometheus扩展思想
不足Prometheus本身只支持单机部署,没有自带支持集群部署,也就不支持高可用以及水平
扩容
,在大规模场景下,最让人关心的问题是它的存储空间也受限于单机磁盘容量,磁盘容量决定了单个Prometheus
萌兰三太子
·
2023-11-20 01:38
prometheus
无需百度网盘SVIP提速不限速满速下载方法,2种方法都亲自实测有效
看了这个视频2种百度网盘不限速方法就能解决问题,快用起来吧百度网盘
扩容
2T和2种不限速方法都打包了https://pan.quark.cn/s/0766dd427b66
文库超市
·
2023-11-20 01:37
百度
百度云
linux
扩容
根目录空间_Linux系统
扩容
根目录磁盘空间
Linux系统
扩容
根目录磁盘空间使用背景发现虚拟机磁盘空间不够用了,于是准备给根分区进行
扩容
,控制台
扩容
或者添加磁盘后为发现没有生效,原因在于没有格式化。
weixin_39975810
·
2023-11-19 23:11
linux扩容根目录空间
linux给根目录
扩容
,Linux给根目录
扩容
时,为什么执行lvextend之后
扩容
的大小并不是100%?...
因为1k是1024[root@xxxx-centos7-template~]#lvcreate-L99G-ndatacentosLogicalvolume"data"created.[root@xxxx-centos7-template~]#lvdisplay---Logicalvolume---LVPath/dev/centos/swapLVNameswapVGNamecentosLVUUIDv
咪马3213 m~~
·
2023-11-19 23:41
linux给根目录扩容
9
HDFS
架构剖析
HDFS
集群有两类节点:一个namenode(管理节点)和多个datanode(工作节点)。namenode管理文件系统的命名空间。它维
水无痕simon
·
2023-11-19 23:41
Hadoop
hdfs
架构
hadoop
C++ vector容器-43-vector构造函数和赋值操作
vector有点类似数组,但是一个最懂
扩容
和支持尾部插入和删除的类似数组的容器。vector数据结构和数组非常相似,也称为单端数组,不同之处在于数组是静态空间,而vector可以动态
扩容
。
Anthony_tester
·
2023-11-19 23:40
C++学习笔记
vector容器
构造函数
赋值
resize
c++
Linux根目录分区
扩容
Linux磁盘跟目录分区
扩容
对磁盘操作要做好备份,以防意外根据此博客实战1、查看磁盘信息,确认是否有空间进行
扩容
上图可见,我根目录有98G的空间,挂载的磁盘是/dev/xvda1的磁盘。
reallywish
·
2023-11-19 23:28
Linux
磁盘
linux
linux系统根目录
扩容
一、将home目录容量
扩容
到“/”根目录1.将home目录备份到其他大磁盘,确保你可以复制回来的。
上上758
·
2023-11-19 23:26
linux
运维
服务器
linux根目录
扩容
方法
CentOS7根目录
扩容
方法最近公司测试服务器根目录满了,便有同事网上找了教程进行
扩容
,但是由于找的教程不够严谨导致
扩容
失败,还丢失了一部分文件,所以这里详细说明一下方法。
Dyson_Huang
·
2023-11-19 23:56
Linux
部署
linux
Linux给根目录
扩容
需求:Linux系统挂载到根目录的磁盘空间满了,如何
扩容
?
睡不醒的猪儿
·
2023-11-19 23:55
linux
lvm
大数据安全 测试
测试1、用户hive/
[email protected]
和nn/1.common2.hadoop.fql.com分别对Hive进行查询(1)
HDFS
配置vim/usr/
bigdata-余建新
·
2023-11-19 22:50
大数据
大数据安全
手贱,把分区
扩容
,导致分区损坏,变为RAW,最终恢复好数据
手贱,把分区
扩容
,导致分区损坏,变为RAW。DG这个软件确实可以,能扫到文件。但是恢复大文件。需要激活,网上pj版本的根本行不通。无奈只能多款软件对比。最终从某鱼上找了一款替换软件。
珊瑚贝
·
2023-11-19 22:50
编程开发
安全
Python大数据之linux学习总结——day10_hadoop原理
Hadoop原理Hadoop基础分布式和集群Hadoop框架概述生态圈版本更新hadoop架构[重点]官方示例圆周率练习词频统计[重点]需求:步骤:Hadoop-
HDFS
特点
hdfs
架构块和副本shell
笨小孩124
·
2023-11-19 20:38
Hadoop
学习总结
大数据
python
linux
k8s资源管理操作——陈述式管理方式
查看版本信息2)查看资源对象简写3)查看集群信息4)配置kubectl自动补全5)node节点查看日志2、资源管理命令1)创建资源2)查看资源3)删除资源4)进入Pod中的容器5)查看Pod容器的日志6)
扩容
或缩容
hei-tui
·
2023-11-19 19:25
linux
docker
kubernetes
Golang知识总结
10Map11Map
扩容
12Map中的Key为什么无序?13Map是线程安全的吗?14Map中的元素为什么不能取地址?1
lcy~
·
2023-11-19 19:43
Golang笔记
golang
jvm
java
ClickHouse基础知识(个人总结)
本文为我的个人复习总结,并非那种从零基础开始普及知识内容详细全面,言辞官方的文章2.由于是个人总结,所以用最精简的话语来写文章3.若有错误不当之处,请指出特点:列式存储,使用LSMTree结构,OLAP分析引擎,不依赖于
HDFS
hellosrc | forward
·
2023-11-19 18:28
ClickHouse
大数据
大数据
spark 数据倾斜优化
数据倾斜优化数据倾斜产生的原因数据倾斜七种解决方案使用HiveETL预处理数据过滤少数导致倾斜的key提高shuffle操作的并行度双重聚合将reducejoin转为mapjoin采样倾斜key并分拆join操作使用随机前缀和
扩容
赤兔胭脂小吕布
·
2023-11-19 17:15
spark
大数据
hive
hadoop
分布式
Spark数据倾斜解决思路
1.避免数据源倾斜-
HDFS
Spark通过textFile(path,minPartitions)方法读取文件时,使用TextInputFormat。
小小大数据
·
2023-11-19 17:13
Spark
spark
大数据
kafka
4️⃣Hive
(Hive没有存储数据的能力,只有使用数据的能力)2.Hive本质将HQL转化成MapReduce程序Hive处理的数据存储在
HDFS
Hive分析数据底层的实现是MapReduce执行程序运行在Yarn
WovJf
·
2023-11-19 17:39
hive
数据仓库
Hadoop词频统计
这里写自定义目录标题前提制作JAR包启动Hadoop将wordfile1.txt上传到
HDFS
重新上传文件进行词频统计和注意事项
HDFS
常用命令前提1.安装了Linux系统,并且安装了Hadoop下的两个组件
weixin_49670340
·
2023-11-19 16:29
hadoop
HDFS
使用Hadoop 中自带的词频统计程序,对数据集进行词频统计
实验题目:词频统计假设
HDFS
上有两个文件wordfile1.txt和wordfile2.txt(其他文件也行),运行Hadoop中自带的词频统计程序,对数据集进行词频统计。
码猿小菜鸡
·
2023-11-19 16:28
大数据
人工智能
hadoop
big
data
词频统计
hdfs
Hadoop调用MapReduce进行词频统计
.前置准备1.传输文本文件2.环境搭建(1)使用VirtualBox虚拟机软件安装Ubuntu(2)在Ubuntu中安装Hadoop和Eclipse三.具体步骤1.下载保存文本文件2.将文本文件传输至
HDFS
3
MidnightFancy
·
2023-11-19 16:17
大数据
hadoop
ubuntu
mapreduce
eclipse
hdfs
HIVE与
HDFS
映射关系
问题1:Hive一条Select语句,底层是如何读取
HDFS
文件的?
Eqo
·
2023-11-19 15:40
day02-14map
初始化的时候要估算好map容量,避免在程序运行是再动态
扩容
m1["理想"]=18m1["jiwuming"]=35fmt.Println(m1)//输出无顺序//map[jiwuming:35理想:18
李超_2292
·
2023-11-19 15:36
复杂类型,查询--学习笔记
namestring,city_arrayarray)rowformatdelimitedfieldsterminatedby"\t"collectionitemsterminatedby",";--2.上传数据到
hdfs
祈愿lucky
·
2023-11-19 15:29
大数据
学习
笔记
大数据
Python大数据之linux学习总结——day06_hive02
知识点:示例:查看/修改表示例:默认分隔符示例:快速映射表[练习]知识点:示例:数据导入和导出文件数据加载导入1.直接上传文件window页面上传linux本地put上传2.load加载文件:load移动
HDFS
笨小孩124
·
2023-11-19 15:58
hive
学习任务
python
大数据
linux
Java阶段复习
Java基础数组一组连续空间,存储多个相同类型的值特点数据类型相同长度固定数组的
扩容
创建一个新数组,使用For循环将元素逐一赋值System.arraycopy(原数组名,原数组起始下标,新数组名,新数组起始下标
帝兮小哥哥
·
2023-11-19 15:46
sqoop
hdfs
入mysql_sqoop将
hdfs
下的数据导入到mysql如何去重?
sqoop执行的脚本我是这样写的sqoopexport–connectjdbc:mysql://localhost:3306/movie–usernameroot–passwordwelcome1–tablemovieRecommend–fields-terminated-by‘,’–export-dir/recommendoutrecommendout是我mapreduce程序处理后的输出目录,
唉唉唉哒
·
2023-11-19 14:05
sqoop
hdfs入mysql
elasticsearch 备份与恢复
本地备份一创建仓库首先需要创建一个仓库,仓库的类型支持Sharedfilesystem,AmazonS3,
HDFS
和AzureCloud,暂时只掌握了文件系统备份方式一:通过命令方式创建备份仓库a.修改
不会写诗的程序猿
·
2023-11-19 14:13
elk
备份与恢复
elasticdump
nfs远程挂载
2023-Hive调优最全指南
性能优化之数据倾斜专题五、HiveSQL优化十二板斧六、Hive面试题(一)七、Hive/Hadoop高频面试点集合(二)01-基于Hadoop的数据仓库Hive基础知识Hive是基于Hadoop的数据仓库工具,可对存储在
HDFS
000X000
·
2023-11-19 13:43
数据仓库
性能测试和优化
HIVE
hive
hadoop
大数据
Hive调优最全指南
大数据之hadoop-
hdfs
知识通俗详解
目录疑问存储模型(重要)架构设计角色功能NameNodeDataNode元数据持久化安全模式
HDFS
中的SNNSecondaryNameNode(SNN)Block的副本放置策略
HDFS
写流程
HDFS
读流程总结疑问分布式文件系统那么多
shw12357
·
2023-11-19 10:27
hadoop
05-Hadoop01之
HDFS
一、Hadoop介绍Hadoop分为三部分:Common、
HDFS
、Yarn、MapReduce(有点过时了)Hadoop生态圈:除了hadoop技术以外,还有hive、zookeeper、flume、
YuPangZa
·
2023-11-19 10:54
大数据
hdfs
hadoop
大数据
(珍藏版)Redis经典面试题32道,吊打面试官。
04、Redis持久化数据和缓存怎么做
扩容
?05、Twemproxy是什么?06、Redis为何没有直接使用C字符串?07、使用过Redis分布式锁么,它是什么回事?使用Java
普修罗双战士
·
2023-11-19 10:47
Redis专栏
redis
数据库
面试
职场和发展
缓存
开发语言
大数据基础设施搭建 - Hadoop
案例5.2.1创建wordcount输入文本信息5.2.2执行程序5.2.3查看结果六、分发压缩包到集群中其他机器6.1分发压缩包6.2解压压缩包6.3配置环境变量七、配置集群7.1核心配置文件7.2
HDFS
m0_46218511
·
2023-11-19 10:33
大数据基础设施搭建
大数据
hadoop
Golang 进阶训练营
需指明长度,长度为常量且不可改变array长度为其类型中的组成部分(给参数为长度100的数组的方法传长度为101的会报错)array在作为函数参数时会产生copygolang所有函数参数都是值传递array
扩容
ChaunhewieTian
·
2023-11-19 10:26
hdfs
多用户读写权限设置
多个用户都能对文件有操作(读写)权限.1》在
hdfs
中设置umask为002,则新目录的权限为775,新文件的权限为664,只要都是supergroup组的用户都有权限进行读写2》在namenode上创建
飞有飞言
·
2023-11-19 09:35
大数据实战平台环境搭建
大数据实战平台环境搭建一、创建Hadoop用户二、更新apt和安装Vim编辑器三、安装SSH和配置SSH无密码登录四、安装Java五、安装单机Hadoop六、Hadoop伪分布式安装七、
HDFS
常用命令八
ZShiJ
·
2023-11-19 08:13
虚拟机
hadoop
java
大数据
2023.11.17 hadoop之
HDFS
进阶
目录
HDFS
的机制元数据简介元数据存储流程:namenode生成了多个edits文件和一个fsimage文件edits和fsimage文件SecondaryNameNode辅助NameNode的方式:
HDFS
白白的wj
·
2023-11-19 08:35
hdfs
hadoop
大数据
sql
database
hive
[C/C++]数据结构 链表(单向链表,双向链表)
前言:上一文中我们介绍了顺序表的特点及实现,但是顺序表由于每次
扩容
都是呈二倍增长(
扩容
大小是自己定义的),可能会造成空间的大量浪费,但是链表却可以解决这个问题.概念及结构:链表是一种物理存储结构上非连续
不烦下雨c
·
2023-11-19 04:27
数据结构
数据结构
c语言
c++
哈希
unordered系列关联式容器unordered_mapunordered_set哈希概念哈希函数哈希冲突哈希冲突解决方法闭散列线性探测哈希闭散列模拟实现哈希数据和哈希状态返回哈希值的key哈希插入(含
扩容
和线性探测
cefler
·
2023-11-19 04:40
C++
哈希算法
散列表
HDFS
的文件写入和文件读取流程
这是
HDFS
在上传⽂件写数据过程时采⽤的⼀种数据传输⽅式。客户端将数据块写⼊第⼀个数据节点,第⼀个数据节点保存数据之后再将块复制到第⼆个数据节点,后者保存后将其复制到第三个数据节点。
cx330上的猫
·
2023-11-19 04:36
hdfs
hadoop
大数据
HDFS
架构
目录一,
HDFS
简介二、
HDFS
架构三、
HDFS
的工作机制一,
HDFS
简介①
HDFS
概念:HadoopDistributedFileSystem,是Hadoop项⽬的核⼼⼦项⽬,是分布式计算中数据存储管理的基础
cx330上的猫
·
2023-11-19 04:29
hdfs
hadoop
架构
大数据之数据迁移sqoop的安装
Sqoop具有命令行界面,可用于从关系型数据库中导入数据到Hadoop分布式文件系统(
HDFS
)中,或从
HDFS
导出数据到关系型数据库中。
bigdata从入门到放弃
·
2023-11-19 03:09
数据仓库
sqoop
hadoop
大数据
sqoop
hadoop
hive
数据库
数据仓库
数据分析
linux中hadoop伪分布搭建
主要有以下三个组件:Hadoop分布式文件系统(
HDFS
):这是一种可扩展的、容错的文件系统,专门设计用于在大规模集群中存储和访问数据。
bigdata从入门到放弃
·
2023-11-19 03:38
hadoop
linux
hadoop
运维
大数据
big
data
上一页
46
47
48
49
50
51
52
53
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他