E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop大数据学习
hadoop
win11安装
hadoop
环境 winutils.exe获取,windows安装大数据运行环境 winutils文件获取,winutils文件
hadoop
(十四)
1.github地址:GitHub-cdarlint/winutils:winutils.exe
hadoop
.dllandhdfs.dllbinariesfor
hadoop
windows2.从上述链接,
不努力就种地~
·
2023-11-23 13:11
大数据
大数据
hadoop
分布式
hadoop
HDFS常用文件操作命令
文章目录
hadoop
HDFS常用文件操作命令显示目录下文件ls查看文件内容cat建目录mkdir拉hdfs上的文件到本地get合并文件到本地getmerge上传本地文件到hdfsput查文件数量count
pingzishinee
·
2023-11-23 13:11
大数据
hdfs
hadoop
常用命令
get
put
HADOOP
_HOME and
hadoop
.home.dir are unset. hdfs client 代码上传文件失败报错
hadoop
api上传报错 win11
hadoop
环境错误
1.win环境安装
hadoop
依赖,配置环境变量,重启即可2.按照我上篇文章配置:
hadoop
win11安装
hadoop
环境winutils.exe获取,windows安装大数据运行环境winutils
不努力就种地~
·
2023-11-23 13:40
大数据
hadoop
hdfs
大数据
hdfs命令
文档地址:http://
hadoop
.apache.org/docs/r1.0.4/cn/hdfs_shell.htmlFSShell调用文件系统(FS)Shell命令应使用bin/
hadoop
fs的形式
chongxiting3307
·
2023-11-23 13:09
大数据
shell
Hadoop
学习笔记:运行wordcount对文件字符串进行统计案例
文/朱季谦我最近使用四台Centos虚拟机搭建了一套分布式
hadoop
环境,简单模拟了线上上的
hadoop
真实分布式集群,主要用于业余学习大数据相关体系。
朱季谦
·
2023-11-23 13:38
大数据
hadoop
学习
笔记
hadoop
shell操作 hdfs处理文件命令 hdfs上传命令
hadoop
fs -put命令
hadoop
fs相关命令
hadoop
(十三)
hadoop
fs-helprm查看rm命令作用
hadoop
fs查看命令1.创建文件夹:#hdfs前缀也是可以的。
不努力就种地~
·
2023-11-23 13:07
大数据
hadoop
hdfs
大数据
Windows安装
Hadoop
运行环境
1、下载
Hadoop
2、解压
Hadoop
tarzxvf
hadoop
-3.1.1.tar.gz3、设置
Hadoop
环境变量3.1.1、系统环境变量#
HADOOP
_HOME=D:\software\
hadoop
docsz
·
2023-11-23 13:37
hadoop
windows
hadoop
大数据
20.大数据---Hive基础介绍
Hive是基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
学无止境的大象
·
2023-11-23 12:07
#
大数据
hive
big
data
hadoop
大数据开发之Hive优化篇6-Hive on spark
备注:Hive版本2.1.1一.HiveonSpark介绍Hive是基于
Hadoop
平台的数据仓库,最初由Facebook开发,在经过多年发展之后,已经成为
Hadoop
事实上的SQL引擎标准。
只是甲
·
2023-11-23 12:06
大数据和数据仓库
#
Hive
hive
on
spark
hadoop
hive
spark
大数据最佳实践-hive on spark
目录HiveonSpark与SparkSQLSpark内存配置spark动态分配HiveHiveonSpark与SparkSQLHive是
Hadoop
中的标准SQL引擎,也是最古老的引擎之一。
WakeUpCcc
·
2023-11-23 12:33
大数据
hive
spark
hadoop
数据仓库
大数据学习
(23)-hive on mapreduce对比hive on spark
&&
大数据学习
&&系列专栏:哲学语录:承认自己的无知,乃是开启智慧的大门如果觉得博主的文章还不错的话,请点赞+收藏⭐️+留言支持一下博主哦HiveonSpark和HiveonMapReduce是两种不同的
viperrrrrrr
·
2023-11-23 11:23
hive
spark
大数据
Kafka shell使用及Java简单实现Kafka生产者和消费者
创建topicsh/usr/hdp/3.1.0.0-78/kafka/bin/kafka-topics.sh--create--zookeepercluster1.
hadoop
:2181--replication-factor1
Eternal_Date
·
2023-11-23 09:26
kafka
java
分布式
基于kafka模拟生产者和消费者
hosts="
hadoop
0300
hadoop
0301
hadoop
0302"forhostin$hostsdossh$host"source/etc/profile;/root/app/zookeeper
lv_yishi
·
2023-11-23 09:22
大数据之spark一些例子
Flink实时数仓完结
GitHub地址:https://github.com/GTyingzi/Flink_DemoGitee地址:https://gitee.com/gtcs/Flink-Demo主要框架版本选型框架版本
Hadoop
3.13Zookeeper3.5.7Kafka2.4.1HB
未来影子
·
2023-11-23 07:09
Flink
大数据项目
flink
kafka
大数据
利用JAVA代码将本地文件传入HDFS中
目录一、环境配置1.1配置
hadoop
和java的环境变量1.2修改本地host文件二、编写JAVA代码2.1导入
hadoop
_lib包2.2读取本地文件2.3使用copyBytes方法将本地文件传入hdfs
db_cxy_2061
·
2023-11-23 06:57
java
hdfs
开发语言
Hadoop
集群间文件拷贝
Hadoop
集群间文件拷贝distcp使用DistCpVersion2(分布式copy)是用于集群间/集群内的文件copy工具,使用MapReduce实现分布式、错误处理、恢复和报告。
Yampery
·
2023-11-23 06:27
hadoop
大数据
hdfs
hadoop
重命名文件_
hadoop
HDFS常用文件操作命令
命令基本格式:
hadoop
fs-cmd1.ls
hadoop
fs-ls/列出hdfs文件系统根目录下的目录和文件
hadoop
fs-ls-R/列出hdfs文件系统所有的目录和文件2.put
hadoop
fs-puthdfsfile
weixin_39907850
·
2023-11-23 06:24
hadoop重命名文件
到另一个文件夹 复制hdfs上的文件_HDFS——如何将文件从HDFS复制到本地
get使用方法:
hadoop
fs-get[-ignorecrc][-crc]复制文件到本地文件系统。可用-ignorecrc选项复制CRC校验失败的文件。使用-crc选项复制文件以及CRC信息。
666齐乐家园
·
2023-11-23 06:54
到另一个文件夹
复制hdfs上的文件
hdfs 多个文件合并_
hadoop
本地多压缩文件上传hdfs hdfs上多文件合并压缩到本地
importjava.io.FileOutputStream;importjava.io.IOException;importjava.io.InputStream;importorg.apache.
hadoop
.conf.Configuration
weixin_39585378
·
2023-11-23 06:54
hdfs
多个文件合并
hdfs文件如何导出到服务器,[
Hadoop
] 如何将 HDFS 文件导出到 Windows文件系统
介绍如何在Windows环境中,将保存在HDFS上的文件导出到本机上数据导入到HDFS后当然也要有方法将数据从HDFS导出到本机系统上在
HADOOP
JAVAAPI所提供的FileSystem类就提供copyToLocalFile
weixin_39850981
·
2023-11-23 06:54
hdfs文件如何导出到服务器
hdfs 拷贝文件 java_
hadoop
集群间的hdfs文件拷贝
1、背景部门有个需求,在网络互通的情况下,把现有的
hadoop
集群(未做Kerberos认证,集群名为:bd-stg-
hadoop
)的一些hdfs文件拷贝到新的
hadoop
集群(做了Kerberos认证
每天喝王老吉
·
2023-11-23 06:24
hdfs
拷贝文件
java
Hadoop
中HDFS文件管理系统的使用
1概述HDFS(
Hadoop
DistributedFileSystem)是一个文件系统,用于存储文件,通过目录树来定位文件;随着数据量激增,单个操作系统无法对海量数据进行存储,因此将数据分散到多个系统中
Vic·Tory
·
2023-11-23 06:54
大数据
hdfs
hadoop
使用HDFS Shell和HDFS 的Java访问接口进行文件操作,完成从本地文件hello.txt拷贝至HDFS系统/test目录下操作。
使用HDFSShell完成本地文件hello1.txt拷贝至HDFS系统/test目录下操作1.1创建test目录创建hdfs文件虚拟目录;创建/user/
hadoop
/test目录;并使用,.
风,风,风
·
2023-11-23 06:23
hadoop
hdfs
大数据
It looks like you are making an HTTP request to a
Hadoop
IPC port. This is not the correct port for
虚拟机:Ubuntu18.04
hadoop
:
hadoop
3.1.3jdk:openjdk8在虚拟机浏览器输入localhost:9000报错如图:具体:ItlookslikeyouaremakinganHTTPrequesttoa
Hadoop
IPCport.Thisisnotthecorrectportforthewebinterfaceonthisdaemon
北辰Charih
·
2023-11-23 06:48
大数据挖掘
hadoop
大数据
分布式
基于VM虚拟机下Ubuntu18.04系统,
Hadoop
的安装与详细配置
参考博客:https://blog.csdn.net/duchenlong/article/details/114597944与上面这个博客几乎差不多,就是java环境配置以及后面的
hadoop
的hdfs-site.xml
北辰Charih
·
2023-11-23 06:48
大数据挖掘
linux
服务器
hadoop
大数据
在使用
Hadoop
上传本地文件到HDFS时出现 java.io.FileNotFoundException File /xxx/xxx.txt does not exist问题
问题描述今天笔者在使用
Hadoop
时,调用copyFromLocalFile方法上传本地文件到HDFS时java.io.FileNotFoundExceptionFile/xxx/xxx.txtdoesnotexist
啃饼思录
·
2023-11-23 06:18
大数据
大数据
hadoop
hdfs
win安装部署
hadoop
3.0.0并启动上传文件到HDFS
1.下载工具包(下载不方便的留邮箱)
hadoop
-3.0.0.tar.gzwinutils-master.zip2.正式上手1.解压文件
hadoop
-3.0.0.tar.gzwinutils-master.zip2
向阳赤子心
·
2023-11-23 06:17
日常问题记录
hadoop
hdfs
hadoop
在本地创建文件,然后将文件拷贝/上传到HDFS
1.要$cd{对应目录}进入到对应目录,一般为cd/usr/local/
hadoop
/2.创建文件,$sudogedit{文件名},例sudogedittest.txt然后在弹出的txt文件输入内容,点击右上角的保存之后
北辰Charih
·
2023-11-23 06:44
大数据挖掘
hadoop
hdfs
大数据
VMware导入ova/ovf虚拟机文件
VMware导入ova/ovf虚拟机文件按图片步骤导入完成点击开启此虚拟机,就可以使用了自己制作的一个ova虚拟机文件百度网盘提取码:ptfw这个ova文件是基于UbuntuKylin安装了
hadoop
坤坤不爱吃鱼
·
2023-11-23 05:33
Linux
虚拟机
vm
HBase启动成功,但不能访问Web页面
HBase启动成功,但不能访问Web页面
Hadoop
,Zookeeper,Hbase启动成功如下HbaseShell启动成功Zookeeper启动成功Hbase安装目录下的conf文件下的hbase-site.xml
坤坤不爱吃鱼
·
2023-11-23 05:33
大数据
hbase
大数据
java电影推荐系统_基于Mahout的电影推荐系统
经典算法包括聚类、分类、协同过滤、进化编程等等,并且,在Mahout的最近版本中还加入了对Apache
Hadoop
的支持,使这些算法可以更高效的运行在云计算环境中。2.Taste简介T
语文乌托邦
·
2023-11-23 05:02
java电影推荐系统
flink sqlClient提交hiveIceberg
flinksqlClient提交hiveIceberg环境准备sqlclient启动前准备启动sqlclientinit.sqlinsert.sql环境准备组件名版本flink客户端1.14.4-2.12
hadoop
sxau_zhangtao
·
2023-11-23 05:55
flink
大数据
iceberg
通过NFS将HDFS映射到本地文件系统
hdfs是分布式文件系统,要想访问hdfs上的文件,可以用javaapi或者
hadoop
shell等工具,如果想操作hdfs文件系统就像操作本地文件系统一样的便捷,可以将hdfs文件系统挂载到本地的一个目录上
鹅鹅鹅_
·
2023-11-23 03:06
Hadoop
学习笔记
HDFS、YARN、MapReduce概述及三者之间的关系一、
Hadoop
组成(面试重点)1.1
Hadoop
1.x、2.x、3.x区别在
Hadoop
1.x时代,
Hadoop
中的MapReduce同时处理业务逻辑运算和资源的调度
怕被各位卷死
·
2023-11-23 03:16
大数据学习笔记
hadoop
学习
大数据
Spark常用命令
启动Spark命令首先启动
Hadoop
:start-all.sh启动master:进入spark安装目录:./sbin/start-master.sh启动slaves:进入spark安装目录:.
在努力的Jie
·
2023-11-23 02:27
Hadoop
Mapreduce 中的FileInputFormat类的文件切分算法和host选择算法
文件切分算法文件切分算法主要用于确定InputSplit的个数以及每个InputSplit对应的数据段。FileInputFormat以文件为单位切分成InputSplit。对于每个文件,由以下三个属性值确定其对应的InputSplit的个数。goalSize:根据用户期望的InputSplit数据计算,即totalSize/numSplit。totalSize为文件总大小;numSplit为用户
wgyang_gz
·
2023-11-23 02:33
hadoop
【Python大数据笔记_day11_
Hadoop
进阶之MR和YARN&ZooKeeper】
MR单词统计流程已知文件内容:
hadoop
hive
hadoop
sparkhive flinkhivelinuxhivemysqlinput结果: k1(行偏移量) v1(每行文本内容) 0
LKL1026
·
2023-11-22 21:37
Python大数据学习笔记
hadoop
大数据
笔记
Hbase2.1 集群搭建
>Hbase在大数据的体系中扮演着DB角色,不得不说是重要的一员,在上一篇,大猪已经给大家演示了[
Hadoop
3.2集群搭建](https://www.jianshu.com/p/3182aaff918d
kikiki5
·
2023-11-22 18:30
Hadoop
-hdfs的读写请求
1、HDFS写数据(宏观):1、首先,客户端发送一个写数据的请求,通过rpc与NN建立连接,NN会做一些简单的校验,文件是否存在,是否有空间存储数据等。2、NN就会将校验的结果发送给客户端,客户端就会向NN发送请求,第一个block存储在哪个DN中。3、NN接受客户端请求,就会根据block块以及副本的数量来分配DN,并将对应的DN的地址返回给客户端。4、客户端会向第一个DN发送请求,上传数据,第
新手小农
·
2023-11-22 17:03
Hadoop
3.1.1
hadoop
hdfs
大数据
云计算与大数据第16章 分布式内存计算平台Spark习题
第16章分布式内存计算平台Spark习题16.1选择题1、Spark是
Hadoop
生态(B)组件的替代方案。
高校知识店铺合集汇总
·
2023-11-22 16:24
spark
分布式
大数据
Impala VS Hive
与Hive的关系Impala与Hive都是构建在
Hadoop
之上的数据查询工具各有不同的侧重适应面,但从客户端使用
AII派森
·
2023-11-22 16:36
hive
hadoop
数据仓库
数仓问答篇(一)
数仓架构(即席查询)总体来说,
Hadoop
架构在数据量较低的情况下,运行速度远不及MPP架构,但数据量一旦超过某个量级,
Hadoop
架构在吞吐量方面将非常有优势。
AII派森
·
2023-11-22 16:36
大数据
Hadoop
的批处理框架MapReduce
MapReduce是
Hadoop
的批处理框架。MapReduce参与者客户端(client):编写mapreduce程序,配置本地数据。
_小许_
·
2023-11-22 16:15
大数据
hadoop
hdfs
dfs
mapreduce
在Ubuntu18.04安装适合jdk8的eclipse
直接在Ubuntu软件那里下载的eclipse不能用,下载后启动会报错:EclipseAnerrorhasoccurred.Seethelogfile/home/
hadoop
/.eclipse/org.eclipse.platform
北辰Charih
·
2023-11-22 15:39
大数据挖掘
eclipse
java
ide
hadoop
@bigdate-VirtualBox:/mnt/shared$ tar -xzvf
hadoop
-2.10.2.tar.gz tar (child):
hadoop
-2.10.2.tar
在virtualbox的ubuntu虚拟机上使用共享文件夹安装
hadoop
大数据软件在在virtualbox的ubuntu虚拟机上设置共享文件夹步骤:1.设置共享文件夹自行设定共享文件夹路径以及名称,记得勾选自动挂载
北辰Charih
·
2023-11-22 15:09
大数据挖掘
hadoop
大数据
分布式
格式化名称节点,启动
Hadoop
1.循环删除
hadoop
目录下的tmp文件,记住在
hadoop
目录下进行rmtmp-rf使用上述命令,
hadoop
目录下为:2.格式化名称节点#格式化名称节点.
北辰Charih
·
2023-11-22 14:04
大数据挖掘
hadoop
大数据
分布式
HDFS 常用命令
HDFS命令格式:
hadoop
fs-cmdExample:
hadoop
fs-ls///列出hdfs文件系统根目录下的目录和文件
hadoop
fs-ls-R/列出hdfs文件系统所有的目录和文件PUT
hadoop
fs-puthdfsfile
索伦x
·
2023-11-22 14:21
数据仓库工具之Hive的架构原理
1.Hive的本质Hive是基于
Hadoop
的一个数据仓库工具,它的本质是将HQL语句转化成MapReduce程序.在它的底层,HDFS负责存储数据,YARN负责进行资源管理,MapReduce负责数据处理
GuangHui
·
2023-11-22 13:05
大数据处理技术Spark
内容有虚拟机配置,ubuntu安装,创建项目,
hadoop
部署,python使用spark库等等,也附上所有用到的软件的网盘下载链接,算是提供一个完整的思路。
我叫桃小夭
·
2023-11-22 13:54
大数据
hadoop
分布式
python
spark
[
hadoop
]shell脚本执行jps时:-bash: jps: command not found
问题描述我构建了
hadoop
集群。我们一定会写一个shell脚本去每一个节点上去jps,查看每个节点的进程情况。(这是改正之后的脚本)#!
酸甜lemon
·
2023-11-22 13:40
linux
linux
hadoop
脚本语言
上一页
47
48
49
50
51
52
53
54
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他