E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfs扩容
扩展更目录
思路:添加硬盘->分区->将分区转换为物理卷(pv)->将pv卷添加到逻辑卷组中(vg)->将vg中的可分配空间挂载到指定目录(/)->
扩容
文件系统1.虚拟机给一个硬盘扩空间、添加硬盘并挂载2.使用lsblk
墨夕晨
·
2023-12-28 09:43
Hive
Hive概述由于MapReduce开发难度大,学习成本高,
Hdfs
文件没有字段名、没有数据类型,不方便进行数据的有效管理。因此使用MapReduce框架开发,项目周期长,成本高。
之古
·
2023-12-28 02:58
Hadoop集成对象存储和
HDFS
磁盘文件存储
1.1版本说明组件版本是否必须其他事项Hadoop3.3.0+是hadoop3.3.0之后原生支持国内主要对象存储Hive3.1.3否实测没有Hive也可以使用sparksql,使用hive更好的管理
HDFS
tuoluzhe8521
·
2023-12-28 02:38
Hadoop
hadoop
hdfs
大数据
阿里云
EMR集群迁移自建Hadoop(元数据及
HDFS
数据)
1.背景老集群采用的腾讯emr集群,使用过程中磁盘
扩容
成本费用高且开源组件兼容性存在问题,因此决定采用自建hadoop集群,需要将emr的元数据和
hdfs
基础数据迁移过来。
tuoluzhe8521
·
2023-12-28 02:37
Hadoop
hadoop
hdfs
大数据
HDFS
_DELEGATION_TOKEN 还原及解决方案
HDFS
_DELEGATION_TOKEN这个BUG在很多文章中都出现着,讲了很多原理,但是只给出了官方引用地扯,完全没有给出如何解决,我们线上的业务就有着这样的问题,7天一到马上出现这问题了,官方明明说这个
大猪大猪
·
2023-12-28 00:39
Hive 部署
Hive构建在ApacheHadoop之上,并通过
hdfs
支持S3,adls,gs等存储。Hive允许用户使用SQL读取、写入和管理PB级数据。官网地址二、架构Hive中主要包
有人看我吗
·
2023-12-27 23:54
hive
hadoop
数据仓库
Hive实战:词频统计
文章目录一、实战概述二、提出任务三、完成任务(一)准备数据文件1、在虚拟机上创建文本文件2、将文本文件上传到
HDFS
指定目录(二)实现步骤1、启动HiveMetastore服务2、启动Hive客户端3、
howard2005
·
2023-12-27 23:24
数仓技术Hive入门
hive
hadoop
群晖RAID1在线
扩容
实验及步骤
来源:http://www.gebi1.com/forum.php?mod=viewthread&tid=79548&page=1#pid528741很多坛友遇到这样的问题:比如原来在DSM中用两个1T的硬盘组了RAID1,现在放满了,能否在不拷出内容的情况下用两块更大的硬盘,比如两块2T的硬盘来代替。设想中的做法是将其中一块1T的硬盘拔出,装上2T的硬盘恢复RAID1;然后再将另一块1T的硬盘拔
Zszen
·
2023-12-27 22:00
Hadoop集群shell常用命令
sbin/start-dfs.shsbin/start-yarn.sh3.常用命令3.1查看指定目录下内容
hdfs
dfs–ls[文件目录]
hdfs
dfs-ls-R///显式目录结构hado
Youngmon
·
2023-12-27 21:10
大数据库分析
ElasticSearch和impala首先,对于两个数据库作出说明,有hive查询比较慢,hbase会针对于列的查询不太友好,所以CDH推出了impala搜索引擎,都是基于
HDFS
的。
靈08_1024
·
2023-12-27 19:00
大数据面试题-1
一、map-reduce原理map过程:1.1读取
HDFS
中的文件。每一行解析成一个。每一个键值对调用一次map函数。1.2覆盖map(),接收1.1产生的,进行处理,转换为新的输出。
edwin1993
·
2023-12-27 19:29
【hive】hive的调优经验
一、hive自己进行优化对union这样的命令进行了优化二、数据本地化率
hdfs
数据本地化率对hive性能产生影响在数据大小一定的情况下,500个128M的文件和2个30G的文件跑hive任务,性能是有差异的
kiraraLou
·
2023-12-27 18:49
hive
hive
hadoop
big
data
VirtualBox 给Ubuntu镜像
扩容
1.先给要
扩容
的虚拟机关机。2.File->VirtualMediaManager拖动滑块增大至合适的大小。3.点击Apply后点击Close,然后启动虚拟机。
__BOOM__
·
2023-12-27 15:56
VirtualBox
ubuntu
HBase基础知识(六):HBase 对接 Hive
1.HBase与Hive的对比1.Hive(1)数据仓库Hive的本质其实就相当于将
HDFS
中已经存储的文件在Mysql中做了一个双射关系,以方便使用HQL去管理查询。
依晴无旧
·
2023-12-27 14:49
大数据
hbase
hive
数据库
Spark与Hadoop的关系和区别
它包括两个核心组件:Hadoop分布式文件系统(
HDFS
):用于存储大规模数据的分布式文件系统。H
晓之以理的喵~~
·
2023-12-27 12:13
Spark
spark
hadoop
大数据
Hadoop生产集群各种维护命令
1.
HDFS
运维1.1
HDFS
集群操作命令#
HDFS
集群启停start-dfs.shstop-dfs.sh#获取
HDFS
集群信息
hdfs
dfsadmin-report#namenode和datanode
tuoluzhe8521
·
2023-12-27 12:12
hadoop相关
hadoop
大数据
分布式
HDFS
shell 快查
HDFS
设计的主要目的是对海量数据进行处理,也就是说在其上能够储存很大量文件,
HDFS
提供多种的访问的策略,首先我们来认识其通过shell接口的访问方式。
hdfs
shell与linux命令基本相同。
Tim在路上
·
2023-12-27 12:16
k8s集群之ClusterIP网络
扩容
本篇目录链接背景现象原因分析step1:通过终端报错,显然提示svc的网络已经用尽,无法分配ipstep2:查看apiserver中定义的svc网络(--service-cluster-ip-range)结论处理方法温馨提示背景在t环境上的不同namespace(t1-t10)复制相同的服务(20+),由于前期在进行集群容量规划时,未考虑到svc所消耗的clusterip的数量,仅仅对其网络的ip
最美dee时光
·
2023-12-27 11:03
k8s
k8s
cri
k8s
ClusterIP
学以致用~知识如何变为生产力?
创新知识:通过
扩容
、借鉴、跨界和反思迭代知识,
冬梅姐自我管理
·
2023-12-27 11:26
Spark生产集群各种使用
环境配置1.1版本说明要求版本是否必须其他事项Hadoop3.3.4是hadoop3.3.0之后原生支持国内主要对象存储Hive3.1.3否实测没有Hive也可以使用sparksql,使用hive更好的管理
HDFS
tuoluzhe8521
·
2023-12-27 10:15
hive相关
spark
大数据
分布式
七牛云存储
datax 同步mongodb数据库到hive(
hdfs
)和elasticserch(es)
(有点老了,后来发现flinkcdc都只能监控一张表,多张表无法监控)2.datax版本:自己编译的DataX-datax_v2022103.
hdfs
版本:3.1.34.hive版本:3.1.2二、同步思路
tuoluzhe8521
·
2023-12-27 10:14
数据同步
mongodb
hive
数据库
json
hadoop
ArrayList与顺序表(带完整实例)
【本节目标】1.线性表2.顺序表3.ArrayList的简介4.ArrayList使用5.ArrayList的
扩容
机制6.扑克牌1.线性表线性表(linearlist)是n个具有相同特性的数据元素的有限序列
手撕代码
·
2023-12-27 09:30
java
开发语言
Kubernetes (二) Pod应用及管理
一.应用部署实验环境:下载测试镜像并上传到仓库即可二.pod的基础命令使用1.创建自主式pod2.查看pod详情3.删除pod三.deployment(控制器)2.在远程pod中执行命令3.pod的
扩容
与缩容
BJZX_OL
·
2023-12-27 07:40
kubernetes
容器
云原生
运维
linux
[spark] 存储到
hdfs
时指定分区
在SparkSQL中指定多个分区字段进行数据存储:类似hive分区存储文章目录代码示例代码importorg.apache.spark.sql.SparkSessionvalspark=SparkSession.builder().appName("MultiPartitionedWriteExample").getOrCreate()//假设你有一个DataFrame叫做data,包含了需要存储
言之。
·
2023-12-27 06:33
spark
hdfs
大数据
[spark] DataFrame 的 checkpoint
具体来说,checkpoint方法执行以下操作:将DataFrame的物理计划执行,并将结果存储到指定的分布式文件系统(例如
HDFS
)上的检查点目录中。用新的DataFrame代替原始的Da
言之。
·
2023-12-27 06:29
spark
大数据
分布式
No.359 公链之争——
扩容
方案(一)
2018年区块链世界是公有链的战场。而对于公有链来说,Scalibility又是所有团队都在反复强调的关键。因为,一项技术若想得到实现并大范围应用,就一定要支持庞大的用户群体,满足各种需求。互联网世界已经做到了,并从八九十年代到今天,不断的迭代发展了二十余年。从2008年到今天比特币技术已经横空出世了10年之久,在伴随着去年市场行情的急剧暴涨,和随之产生的财富效应夺人眼球之外,区块链技术也越来越多
金笛Jindi
·
2023-12-27 06:39
hive学习笔记
一、Hive基本概念1.1hive是什么hive是基于hadoop的一个数仓分析工具,hive可以将
hdfs
上存储的结构化的数据,映射成一张表,然后让用户写HQL(类SQL)来分析数据telupdown138383843813451567138383843953451567138383844012411657713838384413453157571383838434353551567567
不爱吃鱼的馋猫
·
2023-12-27 06:05
hive
大数据
hadoop
[使用Python操作Hadoop,Python-MapReduce
环境环境使用:hadoop3.1,Python3.6,ubuntu18.04Hadoop是使用Java开发的,推荐使用Java操作
HDFS
。有时候也需要我们使用Python操作
HDFS
。
叫我老村长
·
2023-12-27 05:35
探秘 Go 语言:切片
扩容
机制全面指南
探秘Go语言:切片
扩容
机制全面指南引言切片基础什么是切片?
walkskyer
·
2023-12-27 05:46
Golang前行
golang
开发语言
后端
ArrayList和顺序表
目录线性表顺序表实现顺序表:1,添加元素的时候我们要判断是否需要
扩容
2,写异常3,数组清空ArrayList:ArrayList的构造方法:ArrayList的add方法:ArrayList的subList
枪兵自古幸运e
·
2023-12-27 03:31
数据结构与算法
java
开发语言
数据结构
夸克网盘拉新:怎么推广夸克以及申请夸克
①:有渠道资源的可以申请渠道补贴;②:赠送夸克会员;③:无限
扩容
,即不限制容量;④:用户额外开通会员分成30%;⑤:基础拉新佣金在4.8-7元/单;⑥:独立后台,快速结算。
林哥超酷
·
2023-12-27 01:13
orc小文件合并趣谈
之前做到存储和计算的管理,后续做了简单
hdfs
画像(其中,就有小文件趋势监控)。最近,集群中namenode压力有所显现。于是,针对小文件多的目录进行了排查和治理。
艾伦_alan
·
2023-12-27 01:02
分布式系统面试连环炮
他们有共同的一个问题,就是都没怎么搞过分布式系统,现在互联网公司,一般都是做分布式的系统,大家都不是做底层的分布式系统、分布式存储系统hadoop
hdfs
、分布式计算系统hadoopmapreduce/
Java机械师
·
2023-12-26 23:13
YARN知识点总结
如果把大数据Hadoop集群当作一台计算机,那么
HDFS
=磁盘YARN=任务调度器+资源管理器所有任务都是运行在Yarn上Yarn分为两个大的模块:ResourceManagerNodeManagerResourceManager
飞有飞言
·
2023-12-26 23:16
Hadoop大数据实战系列文章之
HDFS
文件系统
Hadoop附带了一个名为
HDFS
(Hadoop分布式文件系统)的分布式文件系统,专门存储超大数据文件,为整个Hadoop生态圈提供了基础的存储服务。
测试帮日记
·
2023-12-26 21:39
借助 KMS (Hadoop Key Management Server) 实现
HDFS
数据加密
对
HDFS
的读写性能会有一定的降低,但应该不会太严重(未测试),
HDFS
优先使用native的libcrypto.so完成加解密(默认算法AES-CTR,支持128位AES加密),新版本的
xudong1991
·
2023-12-26 18:55
如何进行块存储管理
目录块存储概念块存储(云盘)
扩容
方式一:直接
扩容
现有云盘方式二:创建一块新数据盘方式三:在更换操作系统时,同时更换系统盘块存储(云盘)变配云盘变配操作步骤块存储概念块存储(云盘)
扩容
随着业务发展和应用数据增长
久绊A
·
2023-12-26 17:46
阿里云
服务器
阿里云
ECS
云服务器
运维
【Spark-
HDFS
小文件合并】使用 Spark 实现
HDFS
小文件合并
【Spark-
HDFS
小文件合并】使用Spark实现
HDFS
小文件合并1)导入依赖2)代码实现2.1.
HDFS
Utils2.2.MergeFilesApplication需求描述:1、使用Spark做小文件合并压缩处理
bmyyyyyy
·
2023-12-26 17:15
Spark
spark
hdfs
大数据
#HDFS小文件合并
【大厂面试】之绿盟
cookies和sessionspring的核心hashmap不安全体现在哪,
扩容
机制事务的acid隔离级别MVCCInnoDB引擎的锁机制行级锁高并发的安全性多线程并发会带来的问题redis中间件的相关知识同时对数据库表进行更新删除带来的问题
大龄烤红薯
·
2023-12-26 17:02
大厂面试合集
面试
职场和发展
datasophon组件安装时踩坑记录
*to'root'@'%'identifiedby'xxxx';1.安装
hdfs
后有一个namenode进程未启动解决:在那个未启动的节点上执行
hdfs
namenode-bootstrapStandby
州周
·
2023-12-26 17:56
hadoop
hdfs
大数据
【HBase】——简介
1HBase定义 ApacheHBase™是以
hdfs
为数据存储的,一种分布式、可扩展的NoSQL数据库。
那时的样子_
·
2023-12-26 15:42
hbase
数据库
大数据
CentOS虚拟机
扩容
问题【已解决】
黑马点评秒杀项目中因为windows数据库版本低所以要用虚拟机的数据库,但是出现了黑屏问题,因为硬盘空间占满
扩容
中遇到的问题:一般Ubuntu的/dev/sda1分区是挂在根目录(“/”)上的,因此无法用常规的
99WOODYXIN
·
2023-12-26 14:44
mistake
java
Socket与Server通讯
ByteArrayOutputStream对byte类型数据进行写入的类,自动
扩容
,相当于一个中间缓冲层,将类写入到文件等其他outputStream。
趋势大仙
·
2023-12-26 13:03
java
java
开发语言
Hadoop集群部署
模板虚拟机安装JDK3模板虚拟机安装Hadoop4克隆虚拟机5虚拟机配置主机名称映射6集群分发脚本7SSH无密登陆配置8Hadoop集群配置8.1集群部署规划8.2修改配置文件8.2.1核心配置文件配置8.2.2
HDFS
程序员储物箱
·
2023-12-26 12:23
安装教程
hadoop
linux
顺序表的基本操作(必学)
目录线性表:顺序表:概念和结构:动态顺序表常用操作实现:头文件(数组顺序表的声明):各种基本操作总的声明:顺序表的初始化:顺序表的销毁顺序表的打印检查是否需要
扩容
尾插头插头删尾删顺序表的查找顺序表的插入顺序表的删除顺序表的问题线性表
秦jh_
·
2023-12-26 11:06
数据结构
c语言
数据结构
顺序表
Windows搭建
HDFS
2.6.0(附加搭建Hadoop)
1.环境操作系统:Windows7JDK版本:1.8.0_221Hadoop版本:2.6.02.下载Hadoop官网下载image.pngimage.png3.前期准备3.1.配置JAVA环境变量image.pngimage.png4.安装部署4.1.解压,提示报有错误发生不影响image.png4.2.更改配置文件hadoop-env.cmd-添加JAVA_HOME环境变量排坑:Windows环
夹胡碰
·
2023-12-26 11:20
Hadoop基础操作(学习笔记二)
本笔记按照以下四步进行:1、查看hadoop集群的基本信息http://master:50070/
HDFS
监控服务http://master:8088/cluster/nodes集群的计算资源信息http
Mecury_
·
2023-12-26 10:32
学习笔记
hadoop
大数据
hadoop3.0x 后要比spark快10倍!
Apachehadoop项目组最新消息,hadoop3.x以后将会调整方案架构,将Mapreduce基于内存+io+磁盘,共同处理数据其实最大改变的是
hdfs
,
hdfs
通过最近black块计算,根据最近计算原则
smileyboy2009
·
2023-12-26 10:56
hadoop
spark
内存
mapreduce
spark
hdfs
hadoop
【重磅发布】让一让,我要进化了!揭秘2019CBE最大创新变化
扩容
30000平方米,助力产业增长中国化妆品市场正在以年复增长率超过13.5%的速度快速发展,产业的快速增长,同样也推动了CBE这几年的快速发展。应市场需求,2019年,CBE携手上海新国际博览
会展365
·
2023-12-26 09:24
Hive04_DDL操作
HiveDDL操作1DDL数据定义1.1创建数据库CREATEDATABASE[IFNOTEXISTS]database_name[COMMENTdatabase_comment][LOCATION
hdfs
_path
程序喵猴
·
2023-12-26 08:39
hive
hive
大数据
上一页
26
27
28
29
30
31
32
33
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他