E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfs导出数据
YARN知识点总结
如果把大数据Hadoop集群当作一台计算机,那么
HDFS
=磁盘YARN=任务调度器+资源管理器所有任务都是运行在Yarn上Yarn分为两个大的模块:ResourceManagerNodeManagerResourceManager
飞有飞言
·
2023-12-26 23:16
Hadoop大数据实战系列文章之
HDFS
文件系统
Hadoop附带了一个名为
HDFS
(Hadoop分布式文件系统)的分布式文件系统,专门存储超大数据文件,为整个Hadoop生态圈提供了基础的存储服务。
测试帮日记
·
2023-12-26 21:39
借助 KMS (Hadoop Key Management Server) 实现
HDFS
数据加密
对
HDFS
的读写性能会有一定的降低,但应该不会太严重(未测试),
HDFS
优先使用native的libcrypto.so完成加解密(默认算法AES-CTR,支持128位AES加密),新版本的
xudong1991
·
2023-12-26 18:55
【Spark-
HDFS
小文件合并】使用 Spark 实现
HDFS
小文件合并
【Spark-
HDFS
小文件合并】使用Spark实现
HDFS
小文件合并1)导入依赖2)代码实现2.1.
HDFS
Utils2.2.MergeFilesApplication需求描述:1、使用Spark做小文件合并压缩处理
bmyyyyyy
·
2023-12-26 17:15
Spark
spark
hdfs
大数据
#HDFS小文件合并
datasophon组件安装时踩坑记录
*to'root'@'%'identifiedby'xxxx';1.安装
hdfs
后有一个namenode进程未启动解决:在那个未启动的节点上执行
hdfs
namenode-bootstrapStandby
州周
·
2023-12-26 17:56
hadoop
hdfs
大数据
【HBase】——简介
1HBase定义 ApacheHBase™是以
hdfs
为数据存储的,一种分布式、可扩展的NoSQL数据库。
那时的样子_
·
2023-12-26 15:42
hbase
数据库
大数据
Hadoop集群部署
模板虚拟机安装JDK3模板虚拟机安装Hadoop4克隆虚拟机5虚拟机配置主机名称映射6集群分发脚本7SSH无密登陆配置8Hadoop集群配置8.1集群部署规划8.2修改配置文件8.2.1核心配置文件配置8.2.2
HDFS
程序员储物箱
·
2023-12-26 12:23
安装教程
hadoop
linux
Windows搭建
HDFS
2.6.0(附加搭建Hadoop)
1.环境操作系统:Windows7JDK版本:1.8.0_221Hadoop版本:2.6.02.下载Hadoop官网下载image.pngimage.png3.前期准备3.1.配置JAVA环境变量image.pngimage.png4.安装部署4.1.解压,提示报有错误发生不影响image.png4.2.更改配置文件hadoop-env.cmd-添加JAVA_HOME环境变量排坑:Windows环
夹胡碰
·
2023-12-26 11:20
Hadoop基础操作(学习笔记二)
本笔记按照以下四步进行:1、查看hadoop集群的基本信息http://master:50070/
HDFS
监控服务http://master:8088/cluster/nodes集群的计算资源信息http
Mecury_
·
2023-12-26 10:32
学习笔记
hadoop
大数据
hadoop3.0x 后要比spark快10倍!
Apachehadoop项目组最新消息,hadoop3.x以后将会调整方案架构,将Mapreduce基于内存+io+磁盘,共同处理数据其实最大改变的是
hdfs
,
hdfs
通过最近black块计算,根据最近计算原则
smileyboy2009
·
2023-12-26 10:56
hadoop
spark
内存
mapreduce
spark
hdfs
hadoop
DMB8 导出SQL脚本再导入SQL脚本
DMDatabaseServer64V8软件:达梦管理工具、达梦数据迁移工具需求:测试环境数据库迁移到生产环境方案:使用达梦数据迁移工具导出SQL脚本后,在达梦管理工具创建数据库后,再使用达梦数据迁移工具导入新创建的数据库一、
导出数据
库使用达梦数据迁移工具创建迁移任务
ZCF1024
·
2023-12-26 09:47
数据库
数据库
达梦
DMDB
Hive04_DDL操作
HiveDDL操作1DDL数据定义1.1创建数据库CREATEDATABASE[IFNOTEXISTS]database_name[COMMENTdatabase_comment][LOCATION
hdfs
_path
程序喵猴
·
2023-12-26 08:39
hive
hive
大数据
Hive05_DML 操作
overwrite]intotablestudent[partition(partcol1=val1,…)];(1)loaddata:表示加载数据(2)local:表示从本地加载数据到hive表;否则从
HDFS
程序喵猴
·
2023-12-26 08:02
hive
hive
大数据
在Linux上使用mysqldump备份MySQL数据库的详细步骤
在Linux系统上,使用`mysqldump`工具是一种常见、可靠的方法,它能够
导出数据
库的结构和数据,以便在需要时进行还原。
迎风斯黄
·
2023-12-26 08:15
数据库
linux
mysql
Linux下配置伪分布式的Hadoop
安装jdk1.8,注意,jdk版本太高会导致hadoop无法正常启动和运行2下载hadoop3.1.3,并上传至服务器解压3编辑etc/hadoop/core-site.xmlfs.defaultFS
hdfs
qq_34324703
·
2023-12-26 05:49
分布式
linux
hadoop
Flume采集日志存储到
HDFS
1日志服务器上配置Flume,采集本地日志文件,发送到172.19.115.96的flume上进行聚合,如日志服务器有多组,则在多台服务器上配置相同的配置#Namethecomponentsonthisagenta1.sources=r1a1.sinks=k1a1.channels=c1#Describe/configurethesourcea1.sources.r1.type=TAILDIRa1
qq_34324703
·
2023-12-26 05:46
flume
hdfs
大数据
大数据技术——处理架构Hadoop
软件基金会旗下的一个开源分布式计算平台,为用户提供了系统底层细节透明的分布式基础架构•Hadoop是基于Java语言开发的,具有很好的跨平台特性,并且可以部署在廉价的计算机集群中•Hadoop的核心是分布式文件系统
HDFS
Imrea
·
2023-12-26 01:55
大数据
架构
hadoop
大数据——手把手教你
HDFS
搭建
第一步:在虚拟机上安装hadoop环境使用XFTP工具,将hadoop的linux版本压缩包导进linux系统的/opt文件夹下。第二步:解压hadoop命令:cd/opttar-zxvfhadoop*******-C/usr/local/解压hadoop压缩包到/usr/local/路径下解压成功以后看一下local下面的所有文件第三步:删除解压包里面的doc文档安装包在local文件夹下,需要
安安DE爸爸
·
2023-12-25 23:31
大数据
LINUX
HDFS
HDFS
hadoop
LINUX
04_hadoop_读取
hdfs
在本地统计单词并将结果放回
hdfs
1文件目录image.png2wordConfig.properties配置文件CLASS_BUSINESS=com.looc.D04
HDFS
单词计数.WordCountRealize
HDFS
_URL=
会摄影的程序员
·
2023-12-25 22:10
c#
导出数据
库信息到excel表格
前言`最近在帮学弟学妹弄c#课程设计,在此分享一下封装好的模块程序!一、添加引用NPOL很多时候,我们在进行数据导出到Excel文件时,在windows平台需要使用到office组件才可以成功导出,也就是说电脑很多时候都必须安装office才可以。今天分享的这个组件,可以在目标主机不安装office的情况下,对Word或Excel进行读写操作。NPOI的优势:开源,可以完全免费使用包含大部分EXC
小张Tt
·
2023-12-25 19:51
c#
数据库
c#
database
Hadoop学习笔记[6]-MapReduce与Yarn安装部署流程
NodeManager和DataNode一般都是1:1,主要是为了计算向数据移动,如果NM和DN分开,就得用网路拷贝数据,在Yarn的体系里NM也是从节点,既然其和DN是1:1的关系,所以配置中和
HDFS
kinglinch
·
2023-12-25 19:09
大数据
mapreduce
yarn
hadoop
大数据
flume 中sink用
hdfs
sink报拒绝连接错误
hdfs
-io
项目场景:提示:这里简述项目相关背景:使用flume,用
hdfs
sink问题描述提示:这里描述项目中遇到的问题:报错:WARN-org.apache.flume.sink.
hdfs
.
HDFS
EventSink.process
m0_58310854
·
2023-12-25 16:38
flume
hdfs
hadoop
flume
云计算与大数据之间的羁绊(期末不挂科版):云计算 | 大数据 | Hadoop |
HDFS
| MapReduce | Hive | Spark
文章目录前言:一、云计算1.1云计算的基本思想1.2云计算概述——什么是云计算?1.3云计算的基本特征1.4云计算的部署模式1.5云服务1.6云计算的关键技术——虚拟化技术1.6.1虚拟化的好处1.6.2虚拟化技术的应用——12306使用阿里云避免了高峰期的崩溃1.6.3虚拟化的关键特征1.6.4虚拟化的HA指的是什么?1.6.5服务器虚拟化1.6.6虚拟机迁移1.6.6.1虚拟机实时迁移对云计算
春人.
·
2023-12-25 14:59
春人闲谈
大数据
hadoop
云计算
HDFS
MapReduce
Nive
Hive
spark log4j日志配置
1.spark启动参数先把log4j配置文件放到
hdfs
:
hdfs
://R2/projects/log4j-debug.properties--confspark.yarn.dist.files=
hdfs
Mint6
·
2023-12-25 12:33
spark
spark
log4j
大数据
日志
debug
【美团大数据面试】大数据面试题附答案
目录1.
hdfs
读写流程解析2.
hdfs
副本机制,三副本原因,副本存放策略3.
hdfs
容错机制原理4.MapReduce执行流程详解5.spark和mr的区别6.TopN求法,大数据量无法完全写入内存解决方案
话数Science
·
2023-12-25 11:19
大数据
面试
大数据
面试
Kafka下沉到
HDFS
报错
错误信息24十二月202312:38:25,127INFO[SinkRunner-PollingRunner-DefaultSinkProcessor](org.apache.flume.sink.
hdfs
.
HDFS
CompressedDataStream.configure
Stephen6Yang
·
2023-12-25 07:12
hadoop
kafka
hdfs
安装Hadoop 3.3.5
常识科普:Kafka的存储与安装不依赖于
hdfs
/spark,从下边安装过程你可以得知这个信息。备注:
IT WorryFree
·
2023-12-25 06:03
hadoop
大数据
分布式
spring boot整合Easy Excel(导入
导出数据
)
1、在pom.xml文件里,添加依赖com.alibabaeasyexcel3.1.3org.apache.tomcat.embedtomcat-embed-core9.0.63compiletrue2、创建工具类packagecom.ynkbny.config.easyExcel;importcom.alibaba.excel.EasyExcel;importcom.alibaba.excel.
小小橘子皮
·
2023-12-25 06:50
spring
boot
excel
firefox
YARN Hadoop2.0 区别
Hadoop2.0与HAdoop1.0的区别:Hadoop1.0主要由
HDFS
和MapReduce两个系统够长,但在Hadoop2.0中主要由HadoopCommon、
HDFS
、HadoopYARN和HadoopMapReduce2.0
omygodvv
·
2023-12-24 23:01
java
【Hadoop学习笔记】(二)——Hive的原理及使用
Hive数据仓库工具能为
HDFS
上的数据提供类似SQL的查询语言(HiveQL),并将SQL语句转变成MapReduce任务来执行。Hive明显降低了Hadoop的使用门槛,任何熟悉SQL的用
wanger61
·
2023-12-24 23:25
大数据开发
hadoop
hive
大数据
四、Hadoop学习笔记————各种工具用法
Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如:MySQL,Oracle,Postgres等)中的数据导进到Hadoop的
HDFS
weixin_30528371
·
2023-12-24 23:25
大数据
数据库
Hive学习笔记(1)——Hive原理初探
文章目录前言一、hive的特点二、hive体系架构及基本原理三、Hive的存储四、总结前言相信大家通过学习MapReduce,已经认识到hadoop利用多台廉价机器集群进行并行计算的优势,了解了
HDFS
Zhou.Y.M
·
2023-12-24 23:55
Hadoop
hive
hadoop
大数据
mapreduce
【Hive笔记】1——Hive入门
本质:将HQL转化为Mapreduce程序Hive处理的数据存储在
HDFS
,HIve分析数据底层的实现是Mapreduce,执行程序运行在Yarn上2.Hive的优缺点优点:操作接口采用类sql语法,提供快速开发能
sdut菜鸟
·
2023-12-24 23:55
hive
hive
hadoop
大数据
hadoop集群坏块处理
hadoop之
hdfs
数据块修复方法:1、手动修复#检查集群的健康状态
hdfs
fsck/#修复指定的
hdfs
数据块。也就是关闭打开的文件。
运维仙人
·
2023-12-24 21:39
hadoop
eclipse
大数据
mysql的数据备份与恢复语句_MySQL数据备份与恢复
1.数据库备份与恢复的概述数据库备份是指通过
导出数据
或者复制表文件的方式来制作数据库的副本。
吃瓜少年藤井水
·
2023-12-24 19:42
mysql的数据备份与恢复语句
【Hadoop】
HDFS
shell操作与管理工具
HDFS
shell操作
HDFS
管理工具dfsadminfsck均衡器
HDFS
shell操作
HDFS
是存取数据的分布式文件系统,对
HDFS
的操作就是文件系统的基本操作,如文件的创建、修改、删除、修改权限,
不怕娜
·
2023-12-24 18:41
hadoop
hdfs
npm
【Hadoop】YARN简介(YARN产生的技术需求/YARN的基本架构)
YARN产生的技术需求YARN的基本架构ResourceManagerNodeManagerApplicationMasterContainer
HDFS
与YARNYARN产生的技术需求YARN是Hadoopv2.0
不怕娜
·
2023-12-24 18:41
hadoop
架构
大数据
【Hadoop】
HDFS
简介——是什么/优缺点/适用场景
HDFS
是什么
HDFS
的优点/特性
HDFS
适用场景
HDFS
的缺点与不足
HDFS
不适用场景
HDFS
是什么源自Google的GFS论文Google于2003年10月发表
HDFS
是GFS的一个克隆版
HDFS
(
不怕娜
·
2023-12-24 18:11
hadoop
hdfs
大数据
WARNING: HADOOP_SECURE_DN_USER has been replaced by
HDFS
_DATANODE_SECURE_USER.
Hadoop启动时警告,但不影响使用,强迫症的我还是决定寻找解决办法WARNING:HADOOP_SECURE_DN_USERhasbeenreplacedby
HDFS
_DATANODE_SECURE_USER.UsingvalueofHADOOP_SECURE_DN_USER
玖玖1704
·
2023-12-24 12:59
hadoop
hdfs
大数据
hdfs
.DataStreamer: Exception in createBlockOutputStream XXXXX
java.io.IOException:Goterror,status=ERROR,statusmessage,ackwithfirstBadLinkas192.168.100.13:9866atorg.apache.hadoop.
hdfs
.protocol.datatransfer.DataTransferProtoUtil.checkBlockOpStatus
玖玖1704
·
2023-12-24 12:28
hdfs
hadoop
大数据
HBase基础知识(三):HBase架构进阶、读写流程、MemStoreFlush、StoreFile Compaction、Region Split
1.架构原理1)StoreFile保存实际数据的物理文件,StoreFile以HFile的形式存储在
HDFS
上。
依晴无旧
·
2023-12-24 11:59
大数据
hbase
数据库
大数据
【Hadoop篇08】Hadoop数据压缩
简洁而不简单Hadoop数据压缩数据压缩优点和缺点压缩技术能够有效减少底层存储系统(
HDFS
)读写字节数。压缩提高了网络带宽和磁盘空间的效率。
focusbigdata
·
2023-12-24 10:00
mysql(49) : 大数据按分区
导出数据
代码importcom.alibaba.gts.flm.base.util.Mysql8Instance;importjava.io.BufferedWriter;importjava.io.File;importjava.io.FileWriter;importjava.math.BigDecimal;importjava.util.ArrayList;importjava.util.Itera
Lxinccode
·
2023-12-24 10:03
mysql
mysql
大数据
数据库
mysql数据导出
大数据导出
EasyExcel之动态字段导出
需要根据传入的字段,动态
导出数据
,且这个顺序是无序的,传入的字段范围是固定的。当时乍一看这个需求,感觉还好,除了要排序麻烦点,其他都还好。
梁潇一
·
2023-12-24 09:00
笔记
java
学习
Hadoop学习笔记(一)分布式文件存储系统 ——
HDFS
概念
HDFS
(HadoopDistributedFileSystem),Hadoop分布式文件系统,用来存超大文件的。
zhang35
·
2023-12-24 08:54
大数据技术栈
大数据
分布式
Hadoop
入门
hdfs
大数据高级开发工程师——Hadoop学习笔记(1)
hadoop用户设置免密登录三台虚拟机安装jdkhadoop集群安装环境部署规划安装包下载查看hadoop支持的压缩方式以及本地库修改配置文件修改hadoop-env.sh修改core-site.xml修改
hdfs
-site.xml
讲文明的喜羊羊拒绝pua
·
2023-12-24 08:53
大数据
大数据
hadoop
hdfs
集群
zookeeper
Hadoop入门学习笔记——二、在虚拟机里部署
HDFS
集群
pwd=5ay8Hadoop入门学习笔记(汇总)目录二、在虚拟机里部署
HDFS
集群2.1.部署node1虚拟机2.2.部署node2和node3虚拟机2.3.初始化并启动Hadoop集群(格
faith瑞诚
·
2023-12-24 08:23
大数据
学习笔记
hadoop
学习
笔记
hadoop大数据学习笔记
或者说将多台计算机组织成了一台计算机,让他们做同一件事,在这其中
HDFS
就相当于这台计算机的硬盘,而MapReduce就是这台计算机的CPU控制器。
驰宇爱吃鱼
·
2023-12-24 08:53
学习笔记
大数据
hadoop
学习
Hadoop学习之
HDFS
——小白入门笔记
(此处的计算机为普通计算机)3.分布式文件系统的多个节点分为两类:名称节点(主节点):文件、目录的操作(创建、删除、重命名等),数据节点与文件块的映射关系数据节点(从节点):数据的读取与存储二、
HDFS
cainiao22222
·
2023-12-24 08:52
hadoop
hdfs
hadoop
hdfs
hive企业级调优策略之CBO,谓词下推等优化
在Hive中,计算成本模型考虑到了:数据的行数、CPU、本地IO、
HDFS
IO、网络IO
Appreciate(欣赏)
·
2023-12-24 07:26
hive
hive
hadoop
数据仓库
上一页
15
16
17
18
19
20
21
22
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他