E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
********HDFS
MapReduce详细工作流程
源码链接1.文本job提交------Job源码链接2.FileInputFormat按照块大小(128m)进行切片------切片源码链接3.切片信息,jar包(Job提交到集群运行时),配置信息上传到
HDFS
水花一直飞
·
2023-11-06 09:56
mapreduce
大数据
hadoop
mapreduce
hadoop
大数据
2021-02-21
13面试问题(2)是否存在i+1{(line.split(",")(3),1)}).reduceByKey(_+_).foreach(println)B、
HDFS
中有两个文件a.text与b.text,
saluch
·
2023-11-06 05:43
Hadoopo-MapReduce(数据处理)
以Hadoop分布式文件系统(HadoopDistrributedFileSystem,
HDFS
)和MapReduce(GoogleMapReduce的开源实现)为核心的Hadoop,为用户提供了系统底层细节透明的分布式基
qq_42601983
·
2023-11-06 05:53
WARNING: HADOOP_SECURE_DN_USER has been replaced by
HDFS
_DATANODE_SECURE_USER. Using value of HADOOP
hadoop启动时报错:WARNING:HADOOP_SECURE_DN_USERhasbeenreplacedby
HDFS
_DATANODE_SECURE_USER.UsingvalueofHADOOP_SECURE_DN_USER
D老歪
·
2023-11-06 05:23
微服务专题
hadoop
hdfs
大数据
【基础篇】大数据学习笔记(4)相关名词解释
GFS:GoogleFileSystemGoogle文件系统
HDFS
:HadoopDsitributedFileSystemHadoop分布式文件系统Zookeeper:分布式应用程序协调服务,是Hadoop
风也醉
·
2023-11-06 02:54
Apache Doris整体架构、FE元数据管理及数据组织
目录1.Doris整体架构2.FE元数据管理3.Doris数据组织1.Doris整体架构Doris主要分为FE和BE两个组件,FE主要负责查询的编译,分发和元数据管理(基于内存,类似
HDFS
NN);BE
国林哥
·
2023-11-06 02:47
Doris
架构
database
大数据
数据仓库
etl
2020-04-21
通过命令-setrep设置
HDFS
中文件的副本数量[
[email protected]
]$hadoopfs-setrep10/sanguo/shuguo/kongming.txt这里设置的副本数只是记录在
Map_Reduce
·
2023-11-06 02:57
windows 平台上使用 pyarrow 连接
hdfs
详细教程
Indexwindows平台上使用pyarrow连接
hdfs
详细教程连接教程踩坑记录进入支线:编译
hdfs
.dll进入支线的支线:编译OpenSSL多个OpenSSL的设置问题意想不到的大坑回到支线,编译
Loasn
·
2023-11-06 00:24
hadoop
大数据
hdfs
python
pyarrow读写
hdfs
官方API文档:https://arrow.apache.org/docs/python/index.html1、测试服务器能够正确连接
hdfs
:>hadoopfs-ls/Found5itemsdrwxrwxrwx-hbasesupergroup02021
影子飞扬
·
2023-11-06 00:19
python基础教程
hdfs
hadoop
big
data
python
pyarrow 实现
hdfs
和本地文件传输
目录pyarrow实现
hdfs
和本地文件传输1.安装pyarrow2.相关代码2.1.
hdfs
->本地2.2.本地->
hdfs
2.3.一个简单的例子参考文章pyarrow实现
hdfs
和本地文件传输python
Solarzhou
·
2023-11-06 00:17
大数据
程序人生
hdfs
hadoop
大数据
python
Spark系列—spark简介
具有如下特性:1、高效性体现在内存存储中间计算结果,基于DAG图执行引擎的优化,减少多次中间结果写
HDFS
开销。
数据小白的进阶之路
·
2023-11-05 23:19
Spark
spark
大数据
Centos8中Hadoop3.3.1安装详细过程(含图文)
版本五、安装Hadoop3六、配置hadoop环境变量七、Hadoop伪分布式配置1、Hadoop环境变量设置2、Hadoop配置文件的修改(1)修改配置文件core-site.xml(2)修改配置文件
hdfs
-site.xml
wat-999
·
2023-11-05 23:17
开发语言
hadoop
分布式
关于出现hadoop102拒绝连接
自己通过使用jps查看到hadoop102上没有namenode服务启动然后自己通过使用myhadoop.shstop停止
hdfs
和yarn(myhadoop.sh是自己编写启动和关闭
hdfs
和yarn
总会有天明
·
2023-11-05 22:28
问题报错
hadoop
big
data
MapReduce开发笔记(使用Eclipse编写执行Hadoop)
这里我们直接在浏览器打开:http://192.168.2.144:50070,如果能访问到
HDFS
的Web端界面,就可以了。
眼君
·
2023-11-05 20:08
hbase 数据迁移
在源集群所有机器的hosts中配置目标集群的hostname与ip快照方式hbasesnapshot数据迁移问题不需要提前建表,分区也会自动同步HBase自身也提供了ExportSnapshot的方法可以从
HDFS
邵红晓
·
2023-11-05 20:08
FlinkSQL源码解析(二)Java SPI机制
现在想更深入的了解,我们书写的sql语句是如何通过connecter属性连接kafka、
hdfs
等,为修改源码新增connector做铺垫。在这里我们先了解下JavaSPI机制。
Yuan_CSDF
·
2023-11-05 19:19
#
Flink源码解析
大数据
flink
大数据入门:Hadoop
HDFS
存储原理
在Hadoop生态当中,解决大数据存储,主要依靠就是
HDFS
,再配合数据库去完成。今天的大数据入门分享,我们就来讲讲Hadoop
HDFS
存储原理。1、什么是
HDFS
?
成都加米谷大数据
·
2023-11-05 16:35
大数据-Hive相关知识点介绍
基于一个统一的查询分析层,通过SQL语句的方式对
HDFS
上的数据进行查询、统计和分析。Hive本质是将HQL转化成MapReduce程序Hive的表本质就是Hadoop的目录/文件Hive默认表存放
ziania_cumt
·
2023-11-05 16:12
hive
大数据
【
HDFS
】Client写三副本数据pipeline恢复的一些总结
通过本文可以了解:
HDFS
Client写三副本的pipeline模型pipeline里有节点错误,如何进行恢复?
叹了口丶气
·
2023-11-05 16:42
HDFS全方位实战
hdfs
hadoop
【
HDFS
】客户端写数据时,dataQueue的几处wait方法的调用场景
dataQueue.wait的几处调用点如下:1、DataStreamer#run方法一开始,判断dataQueue如果为空,或者doSleep==true,那么就dataQueue.wait(timeout);2、waitForAllAcks方法里,会dataQueue.wait(sendHeartbeat());waitForAllAcks的作用是等待所有的datapackets都成功地收到a
叹了口丶气
·
2023-11-05 16:12
HDFS全方位实战
hdfs
hadoop
hive3.1.2 笔记 知识点详解(三)导出数据方式 分区表
1导出数据方式1.1exporttb_nameto
HDFS
_PATH1.2如果数据是普通的文本数据在shell客户端使用get下载数据
hdfs
dfs-get/tb_name/filehive端:hive
z小丑八怪r
·
2023-11-05 16:41
hive
大数据
分区表
hive
数据库
大数据
大数据开发笔记(四):Hive分区详解
✨大数据开发笔记推荐:大数据开发面试知识点总结_GoAI的博客-CSDN博客_大数据开发面试本文详细介绍大数据hadoop生态圈各部分知识,包括不限于
hdfs
、yarn、mapreduce、hive、sqoop
GoAI
·
2023-11-05 16:08
#
Hive
大数据笔记
分区表
大数据
hive
Hive知识点(五) --内/外/分区表
内部表和外部表1.内外部表区别2.分区表2.1一级分区表2.2二级分区表3.手动在
HDFS
中创建分区目录的修复2.产看分区表1.内外部表区别Hive里面有两种数据:1.data(表数据):存储在
HDFS
2
小维_
·
2023-11-05 16:08
Hive
Hive知识点:索引、分区表、分桶表、抽样查询
索引在指定列上建立索引,会产生一张索引表(Hive的一张物理表),里面的字段包括,索引列的值、该值对应的
HDFS
文件路径、该值在文件中的偏移量;分区表PARTITIONEBY将表中的数据,分散到表目录下的多个子目录
得过且过1223
·
2023-11-05 16:04
#
Hive
2021-02-08a
29.hive/impala/
hdfs
/kudu的区别hive和impala则更偏向于查询分析,需要基于
hdfs
或kuduImpala即可操作
hdfs
上的数据,又可操作kudu上的数据Hive只可操作
hdfs
saluch
·
2023-11-05 11:10
Hadoop
HDFS
体系结构.JPG
HDFS
体系结构2.JPG创建目录hadoopfs-mkdir在
HDFS
中创建"/user"目录hadoopfs-mkdir/user在
HDFS
中创建"/user/hadoop"
寻找灯下黑
·
2023-11-05 10:49
使用 Spark 跨集群同步
HDFS
数据
importorg.apache.log4j.{Level,Logger}importorg.apache.spark.{SparkConf,SparkContext}importorg.apache.spark.rdd.RDDimportorg.apache.spark.sql.SparkSessionobjectTestFileCopy{defmain(args:Array[String]):
lei_charles
·
2023-11-05 09:09
2019-02-20
tHiveConnectiontJava:自己写代码tHiveInputtRowGeneratort
HDFS
OutputtHiveRow查看文件列表!
FlyingPeter
·
2023-11-05 06:27
The root scratch dir: /tmp/hive on
HDFS
should be writable.(已解决)
因为修正完毕,没有进行完整错误展示,仅展示部分错误内容:Therootscratchdir:/tmp/hiveon
HDFS
shouldbewritable.解决方案:进入到/tmp目录下,使用chmod-R777
Han_Lin_
·
2023-11-05 03:21
pyspark
Spark
Hive
大数据
java.lang.IllegalArgumentException: java.net.UnknownHostException:XXX 已解决
在
HDFS
和Hive在安装过程中出现这样的问题,主要是在
HDFS
的
hdfs
-site.xml中添加相应的参数:dfs.client.failover.proxy.provider.nsorg.apache.hadoop.
hdfs
.server.namenode.ha.ConfiguredFailoverProxyProvider
Han_Lin_
·
2023-11-05 03:21
java
hive
hadoop
Hadoop Hive Spark 之间的关系
HDFS
(HadoopDistributedFileSystem)的设计本质上是为
Jarkata
·
2023-11-05 02:32
【大数据】搭建Hadoop集群,超级详细
目录搭建完全分布式运行模式(开发重点)1.1Hadoop部署1.2配置集群1.3配置历史服务器1.4配置日志的聚集1.5分发Hadoop1.6群起集群1.7Hadoop群起脚本第2章调优2.2.1项目经验之
HDFS
小 源
·
2023-11-05 00:29
hadoop
hdfs
大数据
Hadoop集群搭建(超级详细)
tar.gz(提取码:6k1i)、hadoop-3.1.3.tar.gz(提取码:07p6)1集群规划安装VMware,使用三台Ubuntu18.04虚拟机进行集群搭建,下面是每台虚拟机的规划:主机名IP用户
HDFS
YARNhadoopMaster
阮哈哈哈哈哈
·
2023-11-05 00:26
hadoop
搭建hadoop集群
免登录将公钥复制到其他机器中2,安装环节进入文件夹存放安装包解压更改环境变量更新环境变量验证安装修改配置文件修改core-site.xml文件修改hadoop-env.sh文件修改yarn-env.sh文件修改
hdfs
-site.xml
陆卿之
·
2023-11-05 00:54
服务器
大数据
hadoop
大数据
hdfs
hdfs
小文件使用fsimage分析实例
hdfs
小文件使用fsimage分析实例1小文件来源分析1.1数据主要来源:2处理方案2.1实时计算任务2.2hive做优化,小文件做合并:2.2.1已有数据2.2.2新接入数据做数据合并后在load进
Direction_Wind
·
2023-11-05 00:18
集群分析优化与开发工具
hdfs
性能优化
Hadoop学习总结(Shell操作)
HDFS
Shell参数命令参数功能描述-ls查看指定路径的目录结构-du统计目录下所有文件大小-mv移动文件-cp复制文件-rm删除文件/空白文件夹-put上传文件-cat查看内容文件-text将源文件输出文本格式
Qinqin.J
·
2023-11-04 18:31
hadoop
学习
大数据
HDFS
Yarn HA架构图及架构区别
HDFS
HA架构图
HDFS
HA架构图.jpg1.各组件说明activenn(NameNode)接收client的rpc请求并处理,同时自己editlog写一份,也向JN的共享存储上的editlog写一份
cllblogs
·
2023-11-04 18:36
9.17 hive高级语法01
hive高级语法数据库(Database)表的集合,
HDFS
中表现为一个文件夹默认在hive.metastore.warehouse.dir属性目录下如果没有指定数据库,默认使用default数据库createdatabaseifnotexistsmyhivebook
伱来打硪啊
·
2023-11-04 15:43
hadoop
hive
大数据
hdfs
sqoop数据迁移
导入数据:MySQL,Oracle导入数据到Hadoop的
HDFS
、HIVE、HBASE等数据存储系统;导出数据:从Hadoop的文件系统中导出数据到关系数据库mysql等工作机制:是将导入和导出的命令翻译成
lsy107816
·
2023-11-04 14:04
大数据
sqoop
sqoop
数据迁移
表导入导出
hadoop集群搭建之运行环境准备以及群启
HDFS
,YARN集群
hadoop入门-运行环境的搭建前期准备工作:制作了一模拟机hadoop101,然后在hadoop101的基础上,进行克隆,制作了一台hadoop102的服务器,配置好了jdk1.8以及hadoop3的环境变量hadoop安装目录介绍[
[email protected]
]$lldrwxr-xr-x.2atguiguatguigu40969月122019bindrwxr-xr
倔强的耗子
·
2023-11-04 11:26
hadoop
big
data
hdfs
yarn
【Hadoop】一、Apache Hadoop、
HDFS
一、ApacheHadoop、
HDFS
md笔记1、ApacheHadoop概述Hadoop介绍狭义上Hadoop指的是Apache软件基金会的一款开源软件。
陌上人如玉এ
·
2023-11-04 11:55
大数据
hadoop
hdfs
apache
hadoop进程启停管理(看这一篇就足够了!)
一、一键启停脚本Hadoop
HDFS
组件内置了
HDFS
集群的一键启停脚本$HADOP_HOME/sbin/start-all.sh,一键启动
HDFS
集群执行原理:在执行此脚本的机器上,启动SecondaryNameNode
syst1m'
·
2023-11-04 11:54
大数据
hadoop
大数据
分布式
Hdoop入门之Flume
Channel组件提供临时的存储,保存Source组件发送过来的信息,Sink负责读取Channel中临时存储的信息,保存到
HDFS
等,并删除Channel中的临时信息。
lurenjia
·
2023-11-04 10:01
Ubuntu18安装Hadoop,zookeeper,hbase--记录
三台电脑都需要统一安装首先安装hadoop下载:Indexof/dist/hadoop/common/hadoop-2.7.7上传文件,并解压cd到haddop目标,创建目录Haddop配置:保存退出:fs.defaultFS
hdfs
嘟嘟Listing
·
2023-11-04 09:33
解决问题
hbase
hadoop
java-zookeeper
大数据之非常详细Sqoop安装和基本操作
安装和基本操作目录大数据Sqoop1、上传解压2、配置环境变量配置sqoop环境变量配置sqoop-env.sh3、加入mysql的jdbc驱动包4、验证验证是否安装成功验证启动5、导入mysql表数据到
HDFS
6
派大星子fff
·
2023-11-04 09:33
大数据
大数据
sqoop
hadoop
mysql
sql
Sqoop-day03_export-从
hdfs
中到出数据到MySQL中_小总结
export-从
hdfs
中到出数据到MySQL中
HDFS
ToMySQL编写脚本,并保存为
HDFS
ToMySQL.conf在往关系型数据库中导出的时候我们要先在关系型数据库中创建好库以及表,这些sqoop
a-tao必须奥利给
·
2023-11-04 09:33
mysql
sqoop
hdfs
数据库
hive
数据转换工具sqoop安装和使用
一、Sqoop概述Sqoop是Apache一款开源工具,主要用于在
HDFS
、Hive、HBase等数据存储系统与关系性数据库之间传输数据。
七羽319
·
2023-11-04 09:03
大数据
sqoop
hive
mysql
hadoop
CentOS7 Sqoop 安装和使用
核心的功能有两个:导入、迁入导出、迁出导入数据:MySQL,Oracle导入数据到Hadoop的
HDFS
、HIVE、HBASE等数据存储系统导出数据:从Hadoop的文件系统中导出数据到关系数据库mysql
fangwei1234
·
2023-11-04 09:01
sqoop
Sqoop的安装和使用
目录一.安装二.导入1.全量导入一.MySQL导入
HDFS
二.MySQL导入Hive2.增量导入一.过滤导入
hdfs
/hive二.导出一.安装1.下载地址:sqoop下载地址2.解压tar-zxvf.
小辉懂编程
·
2023-11-04 09:31
sqoop
sqoop
hadoop
hive
Impala 入门
Cloudera公司推出,提供对
HDFS
、Hbase数据的高性能、低延迟的交互式SQL查询功能。基于Hive,使用内存计算,兼顾数据仓库、具有实时、批处理、多并发等优点。
djm猿
·
2023-11-04 09:26
上一页
26
27
28
29
30
31
32
33
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他