E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop学习积累
hdfs文件如何导出到服务器,[
Hadoop
] 如何将 HDFS 文件导出到 Windows文件系统
介绍如何在Windows环境中,将保存在HDFS上的文件导出到本机上数据导入到HDFS后当然也要有方法将数据从HDFS导出到本机系统上在
HADOOP
JAVAAPI所提供的FileSystem类就提供copyToLocalFile
weixin_39850981
·
2023-11-23 06:54
hdfs文件如何导出到服务器
hdfs 拷贝文件 java_
hadoop
集群间的hdfs文件拷贝
1、背景部门有个需求,在网络互通的情况下,把现有的
hadoop
集群(未做Kerberos认证,集群名为:bd-stg-
hadoop
)的一些hdfs文件拷贝到新的
hadoop
集群(做了Kerberos认证
每天喝王老吉
·
2023-11-23 06:24
hdfs
拷贝文件
java
Hadoop
中HDFS文件管理系统的使用
1概述HDFS(
Hadoop
DistributedFileSystem)是一个文件系统,用于存储文件,通过目录树来定位文件;随着数据量激增,单个操作系统无法对海量数据进行存储,因此将数据分散到多个系统中
Vic·Tory
·
2023-11-23 06:54
大数据
hdfs
hadoop
使用HDFS Shell和HDFS 的Java访问接口进行文件操作,完成从本地文件hello.txt拷贝至HDFS系统/test目录下操作。
使用HDFSShell完成本地文件hello1.txt拷贝至HDFS系统/test目录下操作1.1创建test目录创建hdfs文件虚拟目录;创建/user/
hadoop
/test目录;并使用,.
风,风,风
·
2023-11-23 06:23
hadoop
hdfs
大数据
It looks like you are making an HTTP request to a
Hadoop
IPC port. This is not the correct port for
虚拟机:Ubuntu18.04
hadoop
:
hadoop
3.1.3jdk:openjdk8在虚拟机浏览器输入localhost:9000报错如图:具体:ItlookslikeyouaremakinganHTTPrequesttoa
Hadoop
IPCport.Thisisnotthecorrectportforthewebinterfaceonthisdaemon
北辰Charih
·
2023-11-23 06:48
大数据挖掘
hadoop
大数据
分布式
基于VM虚拟机下Ubuntu18.04系统,
Hadoop
的安装与详细配置
参考博客:https://blog.csdn.net/duchenlong/article/details/114597944与上面这个博客几乎差不多,就是java环境配置以及后面的
hadoop
的hdfs-site.xml
北辰Charih
·
2023-11-23 06:48
大数据挖掘
linux
服务器
hadoop
大数据
在使用
Hadoop
上传本地文件到HDFS时出现 java.io.FileNotFoundException File /xxx/xxx.txt does not exist问题
问题描述今天笔者在使用
Hadoop
时,调用copyFromLocalFile方法上传本地文件到HDFS时java.io.FileNotFoundExceptionFile/xxx/xxx.txtdoesnotexist
啃饼思录
·
2023-11-23 06:18
大数据
大数据
hadoop
hdfs
win安装部署
hadoop
3.0.0并启动上传文件到HDFS
1.下载工具包(下载不方便的留邮箱)
hadoop
-3.0.0.tar.gzwinutils-master.zip2.正式上手1.解压文件
hadoop
-3.0.0.tar.gzwinutils-master.zip2
向阳赤子心
·
2023-11-23 06:17
日常问题记录
hadoop
hdfs
hadoop
在本地创建文件,然后将文件拷贝/上传到HDFS
1.要$cd{对应目录}进入到对应目录,一般为cd/usr/local/
hadoop
/2.创建文件,$sudogedit{文件名},例sudogedittest.txt然后在弹出的txt文件输入内容,点击右上角的保存之后
北辰Charih
·
2023-11-23 06:44
大数据挖掘
hadoop
hdfs
大数据
VMware导入ova/ovf虚拟机文件
VMware导入ova/ovf虚拟机文件按图片步骤导入完成点击开启此虚拟机,就可以使用了自己制作的一个ova虚拟机文件百度网盘提取码:ptfw这个ova文件是基于UbuntuKylin安装了
hadoop
坤坤不爱吃鱼
·
2023-11-23 05:33
Linux
虚拟机
vm
HBase启动成功,但不能访问Web页面
HBase启动成功,但不能访问Web页面
Hadoop
,Zookeeper,Hbase启动成功如下HbaseShell启动成功Zookeeper启动成功Hbase安装目录下的conf文件下的hbase-site.xml
坤坤不爱吃鱼
·
2023-11-23 05:33
大数据
hbase
大数据
java电影推荐系统_基于Mahout的电影推荐系统
经典算法包括聚类、分类、协同过滤、进化编程等等,并且,在Mahout的最近版本中还加入了对Apache
Hadoop
的支持,使这些算法可以更高效的运行在云计算环境中。2.Taste简介T
语文乌托邦
·
2023-11-23 05:02
java电影推荐系统
flink sqlClient提交hiveIceberg
flinksqlClient提交hiveIceberg环境准备sqlclient启动前准备启动sqlclientinit.sqlinsert.sql环境准备组件名版本flink客户端1.14.4-2.12
hadoop
sxau_zhangtao
·
2023-11-23 05:55
flink
大数据
iceberg
第一次向公众号投稿,被拒稿了
拒稿了期望越大,失望就越大,还是比较难过的,没想到第一次投稿就这样了,我还是需要提高一下自我认知,多
学习积累
一下,争取下次能过吧。
净白
·
2023-11-23 05:42
通过NFS将HDFS映射到本地文件系统
hdfs是分布式文件系统,要想访问hdfs上的文件,可以用javaapi或者
hadoop
shell等工具,如果想操作hdfs文件系统就像操作本地文件系统一样的便捷,可以将hdfs文件系统挂载到本地的一个目录上
鹅鹅鹅_
·
2023-11-23 03:06
Hadoop
学习笔记
HDFS、YARN、MapReduce概述及三者之间的关系一、
Hadoop
组成(面试重点)1.1
Hadoop
1.x、2.x、3.x区别在
Hadoop
1.x时代,
Hadoop
中的MapReduce同时处理业务逻辑运算和资源的调度
怕被各位卷死
·
2023-11-23 03:16
大数据学习笔记
hadoop
学习
大数据
Spark常用命令
启动Spark命令首先启动
Hadoop
:start-all.sh启动master:进入spark安装目录:./sbin/start-master.sh启动slaves:进入spark安装目录:.
在努力的Jie
·
2023-11-23 02:27
Hadoop
Mapreduce 中的FileInputFormat类的文件切分算法和host选择算法
文件切分算法文件切分算法主要用于确定InputSplit的个数以及每个InputSplit对应的数据段。FileInputFormat以文件为单位切分成InputSplit。对于每个文件,由以下三个属性值确定其对应的InputSplit的个数。goalSize:根据用户期望的InputSplit数据计算,即totalSize/numSplit。totalSize为文件总大小;numSplit为用户
wgyang_gz
·
2023-11-23 02:33
hadoop
【Python大数据笔记_day11_
Hadoop
进阶之MR和YARN&ZooKeeper】
MR单词统计流程已知文件内容:
hadoop
hive
hadoop
sparkhive flinkhivelinuxhivemysqlinput结果: k1(行偏移量) v1(每行文本内容) 0
LKL1026
·
2023-11-22 21:37
Python大数据学习笔记
hadoop
大数据
笔记
Hbase2.1 集群搭建
>Hbase在大数据的体系中扮演着DB角色,不得不说是重要的一员,在上一篇,大猪已经给大家演示了[
Hadoop
3.2集群搭建](https://www.jianshu.com/p/3182aaff918d
kikiki5
·
2023-11-22 18:30
Hadoop
-hdfs的读写请求
1、HDFS写数据(宏观):1、首先,客户端发送一个写数据的请求,通过rpc与NN建立连接,NN会做一些简单的校验,文件是否存在,是否有空间存储数据等。2、NN就会将校验的结果发送给客户端,客户端就会向NN发送请求,第一个block存储在哪个DN中。3、NN接受客户端请求,就会根据block块以及副本的数量来分配DN,并将对应的DN的地址返回给客户端。4、客户端会向第一个DN发送请求,上传数据,第
新手小农
·
2023-11-22 17:03
Hadoop
3.1.1
hadoop
hdfs
大数据
云计算与大数据第16章 分布式内存计算平台Spark习题
第16章分布式内存计算平台Spark习题16.1选择题1、Spark是
Hadoop
生态(B)组件的替代方案。
高校知识店铺合集汇总
·
2023-11-22 16:24
spark
分布式
大数据
Impala VS Hive
与Hive的关系Impala与Hive都是构建在
Hadoop
之上的数据查询工具各有不同的侧重适应面,但从客户端使用
AII派森
·
2023-11-22 16:36
hive
hadoop
数据仓库
数仓问答篇(一)
数仓架构(即席查询)总体来说,
Hadoop
架构在数据量较低的情况下,运行速度远不及MPP架构,但数据量一旦超过某个量级,
Hadoop
架构在吞吐量方面将非常有优势。
AII派森
·
2023-11-22 16:36
大数据
Hadoop
的批处理框架MapReduce
MapReduce是
Hadoop
的批处理框架。MapReduce参与者客户端(client):编写mapreduce程序,配置本地数据。
_小许_
·
2023-11-22 16:15
大数据
hadoop
hdfs
dfs
mapreduce
在Ubuntu18.04安装适合jdk8的eclipse
直接在Ubuntu软件那里下载的eclipse不能用,下载后启动会报错:EclipseAnerrorhasoccurred.Seethelogfile/home/
hadoop
/.eclipse/org.eclipse.platform
北辰Charih
·
2023-11-22 15:39
大数据挖掘
eclipse
java
ide
hadoop
@bigdate-VirtualBox:/mnt/shared$ tar -xzvf
hadoop
-2.10.2.tar.gz tar (child):
hadoop
-2.10.2.tar
在virtualbox的ubuntu虚拟机上使用共享文件夹安装
hadoop
大数据软件在在virtualbox的ubuntu虚拟机上设置共享文件夹步骤:1.设置共享文件夹自行设定共享文件夹路径以及名称,记得勾选自动挂载
北辰Charih
·
2023-11-22 15:09
大数据挖掘
hadoop
大数据
分布式
格式化名称节点,启动
Hadoop
1.循环删除
hadoop
目录下的tmp文件,记住在
hadoop
目录下进行rmtmp-rf使用上述命令,
hadoop
目录下为:2.格式化名称节点#格式化名称节点.
北辰Charih
·
2023-11-22 14:04
大数据挖掘
hadoop
大数据
分布式
HDFS 常用命令
HDFS命令格式:
hadoop
fs-cmdExample:
hadoop
fs-ls///列出hdfs文件系统根目录下的目录和文件
hadoop
fs-ls-R/列出hdfs文件系统所有的目录和文件PUT
hadoop
fs-puthdfsfile
索伦x
·
2023-11-22 14:21
数据仓库工具之Hive的架构原理
1.Hive的本质Hive是基于
Hadoop
的一个数据仓库工具,它的本质是将HQL语句转化成MapReduce程序.在它的底层,HDFS负责存储数据,YARN负责进行资源管理,MapReduce负责数据处理
GuangHui
·
2023-11-22 13:05
大数据处理技术Spark
内容有虚拟机配置,ubuntu安装,创建项目,
hadoop
部署,python使用spark库等等,也附上所有用到的软件的网盘下载链接,算是提供一个完整的思路。
我叫桃小夭
·
2023-11-22 13:54
大数据
hadoop
分布式
python
spark
[
hadoop
]shell脚本执行jps时:-bash: jps: command not found
问题描述我构建了
hadoop
集群。我们一定会写一个shell脚本去每一个节点上去jps,查看每个节点的进程情况。(这是改正之后的脚本)#!
酸甜lemon
·
2023-11-22 13:40
linux
linux
hadoop
脚本语言
-bash:jps:command not found
今天配置
hadoop
集群时,将master主机上的etc/profile文件拷贝到slaves主机上后,slaves主机上的jps命令不能用呢,最后确定是由于slaves主机上的jdk有问题。
weixin_34274029
·
2023-11-22 13:39
git
大数据
java
花式玩转Linux集群免密登录
大数据集群往往需要多台机器构成一个集群,而集群内的这些机器往往需要能够互相免密登录,这里就总结下设置免密登录的常见做法; 重点: 1)需要集群内部的集群都有这个相同的用户; 2)免密登录是绑定用户的,当你设置了用户
hadoop
╭⌒若隐_RowYet——大数据
·
2023-11-22 09:51
linux
ssh
known_hosts
免密登录
Linux应用参数配置和调优,
Hadoop
性能调优 重要参数设置技巧
这里主要针对Mapreduce的性能调优。这一两个月在做mapreduce的性能调优,有些心得,还是要记下来的,以郷后人~这里主要涉及的参数包括:HDFS:dfs.block.sizeMapredure:io.sort.mbio.sort.spill.percentmapred.local.dirmapred.map.tasks&mapred.tasktracker.map.tasks.maxim
花猹猹
·
2023-11-22 09:13
Linux应用参数配置和调优
hadoop
常用端口号
1,namenodehttp端口:500702,datanodehttp端口:500753,secondaryNameNode节点http端口号:500904,datanode后端访问端口号:500105,fs端口号:90006,yarnhttp端口号:80887,历史服务器web访问端口号:1988
wangxiaowu_001
·
2023-11-22 09:43
hadoop
hadoop
big
data
Hadoop
性能调优
Hadoop
性能调优1.简介
Hadoop
性能调优不仅涉及
Hadoop
本身的性能调优,还涉及更底层的硬件、操作系统和Java虚拟机等系统的调优。
回忆美好
·
2023-11-22 09:42
hadoop
性能调优
一、禁止文件系统记录时间Linux文件系统会记录文件创建、修改和访问操作的时间信息,这在读写操作频繁的应用中将带来不小的性能损失。在挂载文件系统时设置noatime和nodiratime可禁止文件系统记录文件和目录的访问时间,这对HDFS这种读取操作频繁的系统来说,可以节约一笔可观的开销。可以修改/etc/fstab文件中noatime和nodiratime来实现这个设置。如对/mnt/disk1
挑战不可能,努力
·
2023-11-22 09:12
大数据
hadoop
常用的端口号
dfs.namenode.http-address(namenodehttp端口):50070dfs.datanode.http-address(datanodehttp端口):50075SecondaryNamenode(secondaryNameNode节点http端口号):50090dfs.datanode.address:50010fs.defaultFS:8020或者9000yarn.r
星空下的那个人影
·
2023-11-22 09:42
大数据面试
hadoop
hadoop
hadoop
性能调优之参数调优
本文转载自:http://blog.csdn.net/fp196391196391/article/details/8302121这里主要针对Mapreduce的性能调优。这一两个月在做mapreduce的性能调优,有些心得,还是要记下来的,以郷后人~这里主要涉及的参数包括:HDFS:dfs.block.sizeMapredure:io.sort.mbio.sort.spill.percentma
我是机智的鱼油
·
2023-11-22 09:12
Hadoop
之常用端口号
hadoop
3.xHDFSNameNode内部通常端口:8020、9000、9820HDFSNameNode对用户的查询端口:9870Yarn查看任务运行情况的端口:8088历史服务器:19888HDFSNameNode
m0_67393828
·
2023-11-22 09:41
java
hadoop
大数据
hdfs
linux
爬虫
Hadoop
Yarn性能调优
文章目录
Hadoop
Yarn性能调优1环境2yarn-site.xml配置
Hadoop
Yarn性能调优版本:
hadoop
-3.1.31环境内存vCode线程数
hadoop
1018G4核CPU4
hadoop
1028G4
老鼠扛刀满街找猫@
·
2023-11-22 09:41
hadhoop
hadoop
big
data
hadoop
3.x系列完全分布式集群部署(集群各节点设置与端口号的设置)
前言:
hadoop
集群为了满足高可用性与集群的高可靠性,选择对不同节点设置相应的权限与能力。用于达成平台的使用。准备工作:三台部署好
hadoop
与java的虚拟机。
杂乱无章的我
·
2023-11-22 09:10
分布式
大数据
hadoop
Hadoop
常见端口号及配置文件
1
Hadoop
2.x版本端口号1.1访问HDFS端口号:500701.2NN内部通信端口:90001.3访问MR执行任务情况端口:80881.4Yarn内部通信端口:80321.5访问历史服务器端口:198881.6
曹称象
·
2023-11-22 09:10
离线
hadoop
大数据
数据库
转载:
Hadoop
性能调优
blog.csdn.net/dxl342/article/details/52840455https://blog.csdn.net/u014156013/article/details/81347670
Hadoop
DT鸽子
·
2023-11-22 09:09
Hadoop
hadoop调优
Hadoop
常用端口号及配置文件
端口号
Hadoop
3.xHDFSNameNode内部通常端口号:8020/9000/9820HDFSNameNode对用户的查询端口:9870Yarn查看任务的运行情况:8088历史服务器:90080
Hadoop
2
LydiaaLi
·
2023-11-22 09:09
Hadoop
hadoop
大数据
hadoop
常用端口号与配置文件
常用端口号
hadoop
3.xHDFSNameNode内部通常端口:8020/9000/9820HDFSNameNode对用户的查询端口:9870Yarn查看任务运行情况:8088历史服务器:19888
hadoop
2
UserOrz
·
2023-11-22 09:39
大数据学习
hadoop
big
data
Hadoop
3.X 和 2.X 的常用端口号和配置文件
Hadoop
常用端口号
Hadoop
3.XHDFSNameNode内部通信端口:8020/9000/9820HDFSNameNodeHTTPUI:9870HDFSDataNodeHTTPUI:9864Yarn
hmyqwe
·
2023-11-22 09:38
hadoop
Hadoop
性能调优概要说明
Hadoop
容易遇到的问题有:Namenode/jobtracker单点故障、HDFS小文件问题、数据处理性能等。为此“
Hadoop
PerformanceOptimization”(HPO)是必要的。
fjssharpsword
·
2023-11-22 09:07
Big
data
Hadoop专栏
Hadoop
常用端口号和配置文件
Hadoop
常用端口号dfs.namenode.http-address:50070dfs.datanode.http-address:50075SecondaryNameNode辅助名称节点端口号
cipay666
·
2023-11-22 09:37
大数据
hadoop
上一页
47
48
49
50
51
52
53
54
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他