E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfs导出数据
Flume采集日志存储到
HDFS
1日志服务器上配置Flume,采集本地日志文件,发送到172.19.115.96的flume上进行聚合,如日志服务器有多组,则在多台服务器上配置相同的配置#Namethecomponentsonthisagenta1.sources=r1a1.sinks=k1a1.channels=c1#Describe/configurethesourcea1.sources.r1.type=TAILDIRa1
qq_34324703
·
2023-12-26 05:46
flume
hdfs
大数据
大数据技术——处理架构Hadoop
软件基金会旗下的一个开源分布式计算平台,为用户提供了系统底层细节透明的分布式基础架构•Hadoop是基于Java语言开发的,具有很好的跨平台特性,并且可以部署在廉价的计算机集群中•Hadoop的核心是分布式文件系统
HDFS
Imrea
·
2023-12-26 01:55
大数据
架构
hadoop
大数据——手把手教你
HDFS
搭建
第一步:在虚拟机上安装hadoop环境使用XFTP工具,将hadoop的linux版本压缩包导进linux系统的/opt文件夹下。第二步:解压hadoop命令:cd/opttar-zxvfhadoop*******-C/usr/local/解压hadoop压缩包到/usr/local/路径下解压成功以后看一下local下面的所有文件第三步:删除解压包里面的doc文档安装包在local文件夹下,需要
安安DE爸爸
·
2023-12-25 23:31
大数据
LINUX
HDFS
HDFS
hadoop
LINUX
04_hadoop_读取
hdfs
在本地统计单词并将结果放回
hdfs
1文件目录image.png2wordConfig.properties配置文件CLASS_BUSINESS=com.looc.D04
HDFS
单词计数.WordCountRealize
HDFS
_URL=
会摄影的程序员
·
2023-12-25 22:10
c#
导出数据
库信息到excel表格
前言`最近在帮学弟学妹弄c#课程设计,在此分享一下封装好的模块程序!一、添加引用NPOL很多时候,我们在进行数据导出到Excel文件时,在windows平台需要使用到office组件才可以成功导出,也就是说电脑很多时候都必须安装office才可以。今天分享的这个组件,可以在目标主机不安装office的情况下,对Word或Excel进行读写操作。NPOI的优势:开源,可以完全免费使用包含大部分EXC
小张Tt
·
2023-12-25 19:51
c#
数据库
c#
database
Hadoop学习笔记[6]-MapReduce与Yarn安装部署流程
NodeManager和DataNode一般都是1:1,主要是为了计算向数据移动,如果NM和DN分开,就得用网路拷贝数据,在Yarn的体系里NM也是从节点,既然其和DN是1:1的关系,所以配置中和
HDFS
kinglinch
·
2023-12-25 19:09
大数据
mapreduce
yarn
hadoop
大数据
flume 中sink用
hdfs
sink报拒绝连接错误
hdfs
-io
项目场景:提示:这里简述项目相关背景:使用flume,用
hdfs
sink问题描述提示:这里描述项目中遇到的问题:报错:WARN-org.apache.flume.sink.
hdfs
.
HDFS
EventSink.process
m0_58310854
·
2023-12-25 16:38
flume
hdfs
hadoop
flume
云计算与大数据之间的羁绊(期末不挂科版):云计算 | 大数据 | Hadoop |
HDFS
| MapReduce | Hive | Spark
文章目录前言:一、云计算1.1云计算的基本思想1.2云计算概述——什么是云计算?1.3云计算的基本特征1.4云计算的部署模式1.5云服务1.6云计算的关键技术——虚拟化技术1.6.1虚拟化的好处1.6.2虚拟化技术的应用——12306使用阿里云避免了高峰期的崩溃1.6.3虚拟化的关键特征1.6.4虚拟化的HA指的是什么?1.6.5服务器虚拟化1.6.6虚拟机迁移1.6.6.1虚拟机实时迁移对云计算
春人.
·
2023-12-25 14:59
春人闲谈
大数据
hadoop
云计算
HDFS
MapReduce
Nive
Hive
spark log4j日志配置
1.spark启动参数先把log4j配置文件放到
hdfs
:
hdfs
://R2/projects/log4j-debug.properties--confspark.yarn.dist.files=
hdfs
Mint6
·
2023-12-25 12:33
spark
spark
log4j
大数据
日志
debug
【美团大数据面试】大数据面试题附答案
目录1.
hdfs
读写流程解析2.
hdfs
副本机制,三副本原因,副本存放策略3.
hdfs
容错机制原理4.MapReduce执行流程详解5.spark和mr的区别6.TopN求法,大数据量无法完全写入内存解决方案
话数Science
·
2023-12-25 11:19
大数据
面试
大数据
面试
Kafka下沉到
HDFS
报错
错误信息24十二月202312:38:25,127INFO[SinkRunner-PollingRunner-DefaultSinkProcessor](org.apache.flume.sink.
hdfs
.
HDFS
CompressedDataStream.configure
Stephen6Yang
·
2023-12-25 07:12
hadoop
kafka
hdfs
安装Hadoop 3.3.5
常识科普:Kafka的存储与安装不依赖于
hdfs
/spark,从下边安装过程你可以得知这个信息。备注:
IT WorryFree
·
2023-12-25 06:03
hadoop
大数据
分布式
spring boot整合Easy Excel(导入
导出数据
)
1、在pom.xml文件里,添加依赖com.alibabaeasyexcel3.1.3org.apache.tomcat.embedtomcat-embed-core9.0.63compiletrue2、创建工具类packagecom.ynkbny.config.easyExcel;importcom.alibaba.excel.EasyExcel;importcom.alibaba.excel.
小小橘子皮
·
2023-12-25 06:50
spring
boot
excel
firefox
YARN Hadoop2.0 区别
Hadoop2.0与HAdoop1.0的区别:Hadoop1.0主要由
HDFS
和MapReduce两个系统够长,但在Hadoop2.0中主要由HadoopCommon、
HDFS
、HadoopYARN和HadoopMapReduce2.0
omygodvv
·
2023-12-24 23:01
java
【Hadoop学习笔记】(二)——Hive的原理及使用
Hive数据仓库工具能为
HDFS
上的数据提供类似SQL的查询语言(HiveQL),并将SQL语句转变成MapReduce任务来执行。Hive明显降低了Hadoop的使用门槛,任何熟悉SQL的用
wanger61
·
2023-12-24 23:25
大数据开发
hadoop
hive
大数据
四、Hadoop学习笔记————各种工具用法
Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如:MySQL,Oracle,Postgres等)中的数据导进到Hadoop的
HDFS
weixin_30528371
·
2023-12-24 23:25
大数据
数据库
Hive学习笔记(1)——Hive原理初探
文章目录前言一、hive的特点二、hive体系架构及基本原理三、Hive的存储四、总结前言相信大家通过学习MapReduce,已经认识到hadoop利用多台廉价机器集群进行并行计算的优势,了解了
HDFS
Zhou.Y.M
·
2023-12-24 23:55
Hadoop
hive
hadoop
大数据
mapreduce
【Hive笔记】1——Hive入门
本质:将HQL转化为Mapreduce程序Hive处理的数据存储在
HDFS
,HIve分析数据底层的实现是Mapreduce,执行程序运行在Yarn上2.Hive的优缺点优点:操作接口采用类sql语法,提供快速开发能
sdut菜鸟
·
2023-12-24 23:55
hive
hive
hadoop
大数据
hadoop集群坏块处理
hadoop之
hdfs
数据块修复方法:1、手动修复#检查集群的健康状态
hdfs
fsck/#修复指定的
hdfs
数据块。也就是关闭打开的文件。
运维仙人
·
2023-12-24 21:39
hadoop
eclipse
大数据
mysql的数据备份与恢复语句_MySQL数据备份与恢复
1.数据库备份与恢复的概述数据库备份是指通过
导出数据
或者复制表文件的方式来制作数据库的副本。
吃瓜少年藤井水
·
2023-12-24 19:42
mysql的数据备份与恢复语句
【Hadoop】
HDFS
shell操作与管理工具
HDFS
shell操作
HDFS
管理工具dfsadminfsck均衡器
HDFS
shell操作
HDFS
是存取数据的分布式文件系统,对
HDFS
的操作就是文件系统的基本操作,如文件的创建、修改、删除、修改权限,
不怕娜
·
2023-12-24 18:41
hadoop
hdfs
npm
【Hadoop】YARN简介(YARN产生的技术需求/YARN的基本架构)
YARN产生的技术需求YARN的基本架构ResourceManagerNodeManagerApplicationMasterContainer
HDFS
与YARNYARN产生的技术需求YARN是Hadoopv2.0
不怕娜
·
2023-12-24 18:41
hadoop
架构
大数据
【Hadoop】
HDFS
简介——是什么/优缺点/适用场景
HDFS
是什么
HDFS
的优点/特性
HDFS
适用场景
HDFS
的缺点与不足
HDFS
不适用场景
HDFS
是什么源自Google的GFS论文Google于2003年10月发表
HDFS
是GFS的一个克隆版
HDFS
(
不怕娜
·
2023-12-24 18:11
hadoop
hdfs
大数据
WARNING: HADOOP_SECURE_DN_USER has been replaced by
HDFS
_DATANODE_SECURE_USER.
Hadoop启动时警告,但不影响使用,强迫症的我还是决定寻找解决办法WARNING:HADOOP_SECURE_DN_USERhasbeenreplacedby
HDFS
_DATANODE_SECURE_USER.UsingvalueofHADOOP_SECURE_DN_USER
玖玖1704
·
2023-12-24 12:59
hadoop
hdfs
大数据
hdfs
.DataStreamer: Exception in createBlockOutputStream XXXXX
java.io.IOException:Goterror,status=ERROR,statusmessage,ackwithfirstBadLinkas192.168.100.13:9866atorg.apache.hadoop.
hdfs
.protocol.datatransfer.DataTransferProtoUtil.checkBlockOpStatus
玖玖1704
·
2023-12-24 12:28
hdfs
hadoop
大数据
HBase基础知识(三):HBase架构进阶、读写流程、MemStoreFlush、StoreFile Compaction、Region Split
1.架构原理1)StoreFile保存实际数据的物理文件,StoreFile以HFile的形式存储在
HDFS
上。
依晴无旧
·
2023-12-24 11:59
大数据
hbase
数据库
大数据
【Hadoop篇08】Hadoop数据压缩
简洁而不简单Hadoop数据压缩数据压缩优点和缺点压缩技术能够有效减少底层存储系统(
HDFS
)读写字节数。压缩提高了网络带宽和磁盘空间的效率。
focusbigdata
·
2023-12-24 10:00
mysql(49) : 大数据按分区
导出数据
代码importcom.alibaba.gts.flm.base.util.Mysql8Instance;importjava.io.BufferedWriter;importjava.io.File;importjava.io.FileWriter;importjava.math.BigDecimal;importjava.util.ArrayList;importjava.util.Itera
Lxinccode
·
2023-12-24 10:03
mysql
mysql
大数据
数据库
mysql数据导出
大数据导出
EasyExcel之动态字段导出
需要根据传入的字段,动态
导出数据
,且这个顺序是无序的,传入的字段范围是固定的。当时乍一看这个需求,感觉还好,除了要排序麻烦点,其他都还好。
梁潇一
·
2023-12-24 09:00
笔记
java
学习
Hadoop学习笔记(一)分布式文件存储系统 ——
HDFS
概念
HDFS
(HadoopDistributedFileSystem),Hadoop分布式文件系统,用来存超大文件的。
zhang35
·
2023-12-24 08:54
大数据技术栈
大数据
分布式
Hadoop
入门
hdfs
大数据高级开发工程师——Hadoop学习笔记(1)
hadoop用户设置免密登录三台虚拟机安装jdkhadoop集群安装环境部署规划安装包下载查看hadoop支持的压缩方式以及本地库修改配置文件修改hadoop-env.sh修改core-site.xml修改
hdfs
-site.xml
讲文明的喜羊羊拒绝pua
·
2023-12-24 08:53
大数据
大数据
hadoop
hdfs
集群
zookeeper
Hadoop入门学习笔记——二、在虚拟机里部署
HDFS
集群
pwd=5ay8Hadoop入门学习笔记(汇总)目录二、在虚拟机里部署
HDFS
集群2.1.部署node1虚拟机2.2.部署node2和node3虚拟机2.3.初始化并启动Hadoop集群(格
faith瑞诚
·
2023-12-24 08:23
大数据
学习笔记
hadoop
学习
笔记
hadoop大数据学习笔记
或者说将多台计算机组织成了一台计算机,让他们做同一件事,在这其中
HDFS
就相当于这台计算机的硬盘,而MapReduce就是这台计算机的CPU控制器。
驰宇爱吃鱼
·
2023-12-24 08:53
学习笔记
大数据
hadoop
学习
Hadoop学习之
HDFS
——小白入门笔记
(此处的计算机为普通计算机)3.分布式文件系统的多个节点分为两类:名称节点(主节点):文件、目录的操作(创建、删除、重命名等),数据节点与文件块的映射关系数据节点(从节点):数据的读取与存储二、
HDFS
cainiao22222
·
2023-12-24 08:52
hadoop
hdfs
hadoop
hdfs
hive企业级调优策略之CBO,谓词下推等优化
在Hive中,计算成本模型考虑到了:数据的行数、CPU、本地IO、
HDFS
IO、网络IO
Appreciate(欣赏)
·
2023-12-24 07:26
hive
hive
hadoop
数据仓库
Hadoop入门学习笔记——三、使用
HDFS
文件系统
pwd=5ay8Hadoop入门学习笔记(汇总)目录三、使用
HDFS
文件系统3.1.使用命令操作
HDFS
文件系统3.1.1.
HDFS
文件系统基本信息3.1.2.
HDFS
文件系统的2套命令体系
faith瑞诚
·
2023-12-24 07:39
大数据
学习笔记
hadoop
学习
笔记
Navicat入门简介及下载安装教程
在安装完成后,你可以使用Navicat轻松地连接数据库,执行SQL语句,导入
导出数据
等。在本文中,我们将详细介绍Navicat的安装教程和使用方法,希望能够对你学
靓仔波
·
2023-12-24 07:05
sql
7000字超详细讲解Hadoop、Spark、Storm、YARN,建议收藏!
核心内容包含
hdfs
和mapreduce。hadoop2.0以后引入yarn.
hdfs
是提供数据存储的,mapreduce是方便数据计算的。
套马杆的程序员
·
2023-12-24 04:49
Hive优化
Hive优化Hive的存储层依托于
HDFS
,Hive的计算层依托于MapReduce,一般Hive的执行效率主要取决于SQL语句的执行效率,因此,Hive的优化的核心思想是MapReduce的优化。
新鲜氧气
·
2023-12-23 22:26
大数据
#
hive
#
hadoop
hive
hadoop
数据仓库
ClickHouse(19)ClickHouse集成Hive表引擎详细解析
文章目录Hive集成表引擎创建表使用示例如何使用
HDFS
文件系统的本地缓存查询ORC输入格式的Hive表在Hive中建表在ClickHouse中建表查询Parquest输入格式的Hive表在Hive中建表在
张飞的猪大数据
·
2023-12-23 20:37
ClickHouse入门与实战
clickhouse
hive
数据仓库
大数据
数据库
浅谈Hadoop容错机制
简单介绍一下Hadoop中数据存储的可靠性和完整性,其中包括
HDFS
的容错机制、NameNode(元数据结点)的单点失效解决机制、Block数据块的多副本存储机制、NameNode与DataNode之间的心跳检测机制
小小少年Boy
·
2023-12-23 15:19
MINIO在java中的使用
对象存储可以充当主存储层,以处理Spark、Presto、TensorFlow、H2O.ai等各种复杂工作负载以及成为Hadoop
HDFS
的替代品--------引自官网的话。
IT小学僧
·
2023-12-23 14:48
MinIo
Java
java
spring
boot
通过
HDFS
API进行
HDFS
操作
HDFS
JavaAPI位于org.apache.hadoop.fs包中,这些API能够支持的操作包括打开文件、读写文件、删除文件等。Hadoop类库中最终面向用户提供的接口类是FileSystem。
CDHong.it
·
2023-12-23 14:30
Hadoop大数据
Java基础
hadoop
hdfs
大数据
Hadoop _
HDFS
_API 创建文件夹
在项目中src/main/java目录下,新建一个文件,命名为com.atguigu.
hdfs
创建文件夹在文件夹里输入代码,创建文件夹客户端代码常用套路1、获取一个客户端对象2、执行相关的操作指令3、关闭资源代码如下
笨鸟先-森
·
2023-12-23 14:29
hadoop
hdfs
java
Hadoop之
HDFS
的API操作
1、环境准备1.1、下载window版本的hadoop-3.1.01.2、配置HADOOP_HOME环境变量1.2、配置Path环境变量2、代码演示2.1、创建maven项目,导入pom坐标org.apache.hadoophadoop-client3.1.3junitjunit4.12org.slf4jslf4j-log4j121.7.302.2、日志配置log4j.rootLogger=INF
后端技术那点事
·
2023-12-23 14:28
大数据系列
hadoop
hdfs
big
data
Hadoop学习之
HDFS
(
HDFS
客户端及API操作)心得
HDFS
客户端及API操作:一、准备条件:1.配置环境变量HADOOP_HOME(路径要求非中文)2.验证环境变量,双击winutils.exe(报错可能是缺少微软运行库MSVCR120.dll)3.在
顺其自然的济帅哈
·
2023-12-23 14:58
Hadoop
hadoop
hdfs
大数据—Hadoop(四)_
HDFS
_03、客户端API
文章目录1、客户端环境准备1.1idea1.2window依赖2、
HDFS
的API案例实操2.1
HDFS
文件上传(测试参数优先级)2.1.1客户端代码常用套路2.1.2普通版2.1.3优化后2.1.4上传文件
大数据之负
·
2023-12-23 14:58
Hadoop
hadoop
hdfs
大数据
HDFS
的API操作
的环境变量(1)设置MAVEN_HOME为maven文件夹的路径(2)在path中添加“%MAVEN_HOME%\bin”(3)在idea中创建maven项目(注意在编写代码前应修改“pom.xml”,
hdfs
七玥a
·
2023-12-23 14:58
maven
idea
hadoop
hdfs
Hadoop中
HDFS
的API操作、客户端环境准备、配置HADOOP_HOME环境变量
文章目录7.
HDFS
的API操作7.1客户端环境准备7.1.1下载下面的Windows依赖文件夹,拷贝hadoop-3.1.0到非中文路径(比如d:\)7.1.2配置HADOOP_HOME环境变量7.1.3
Redamancy_06
·
2023-12-23 14:27
#
Hadoop
hadoop
hdfs
大数据
hadoop02_
HDFS
的API操作
HDFS
的API操作1
HDFS
核心类简介Configuration类:处理
HDFS
配置的核心类。
程序喵猴
·
2023-12-23 14:57
hadoop
hdfs
hadoop
大数据
上一页
16
17
18
19
20
21
22
23
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他