E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop学习篇
VMware导入ova/ovf虚拟机文件
VMware导入ova/ovf虚拟机文件按图片步骤导入完成点击开启此虚拟机,就可以使用了自己制作的一个ova虚拟机文件百度网盘提取码:ptfw这个ova文件是基于UbuntuKylin安装了
hadoop
坤坤不爱吃鱼
·
2023-11-23 05:33
Linux
虚拟机
vm
HBase启动成功,但不能访问Web页面
HBase启动成功,但不能访问Web页面
Hadoop
,Zookeeper,Hbase启动成功如下HbaseShell启动成功Zookeeper启动成功Hbase安装目录下的conf文件下的hbase-site.xml
坤坤不爱吃鱼
·
2023-11-23 05:33
大数据
hbase
大数据
java电影推荐系统_基于Mahout的电影推荐系统
经典算法包括聚类、分类、协同过滤、进化编程等等,并且,在Mahout的最近版本中还加入了对Apache
Hadoop
的支持,使这些算法可以更高效的运行在云计算环境中。2.Taste简介T
语文乌托邦
·
2023-11-23 05:02
java电影推荐系统
flink sqlClient提交hiveIceberg
flinksqlClient提交hiveIceberg环境准备sqlclient启动前准备启动sqlclientinit.sqlinsert.sql环境准备组件名版本flink客户端1.14.4-2.12
hadoop
sxau_zhangtao
·
2023-11-23 05:55
flink
大数据
iceberg
通过NFS将HDFS映射到本地文件系统
hdfs是分布式文件系统,要想访问hdfs上的文件,可以用javaapi或者
hadoop
shell等工具,如果想操作hdfs文件系统就像操作本地文件系统一样的便捷,可以将hdfs文件系统挂载到本地的一个目录上
鹅鹅鹅_
·
2023-11-23 03:06
Hadoop
学习笔记
HDFS、YARN、MapReduce概述及三者之间的关系一、
Hadoop
组成(面试重点)1.1
Hadoop
1.x、2.x、3.x区别在
Hadoop
1.x时代,
Hadoop
中的MapReduce同时处理业务逻辑运算和资源的调度
怕被各位卷死
·
2023-11-23 03:16
大数据学习笔记
hadoop
学习
大数据
Spark常用命令
启动Spark命令首先启动
Hadoop
:start-all.sh启动master:进入spark安装目录:./sbin/start-master.sh启动slaves:进入spark安装目录:.
在努力的Jie
·
2023-11-23 02:27
Hadoop
Mapreduce 中的FileInputFormat类的文件切分算法和host选择算法
文件切分算法文件切分算法主要用于确定InputSplit的个数以及每个InputSplit对应的数据段。FileInputFormat以文件为单位切分成InputSplit。对于每个文件,由以下三个属性值确定其对应的InputSplit的个数。goalSize:根据用户期望的InputSplit数据计算,即totalSize/numSplit。totalSize为文件总大小;numSplit为用户
wgyang_gz
·
2023-11-23 02:33
hadoop
【Python大数据笔记_day11_
Hadoop
进阶之MR和YARN&ZooKeeper】
MR单词统计流程已知文件内容:
hadoop
hive
hadoop
sparkhive flinkhivelinuxhivemysqlinput结果: k1(行偏移量) v1(每行文本内容) 0
LKL1026
·
2023-11-22 21:37
Python大数据学习笔记
hadoop
大数据
笔记
币圈小白
学习篇
:在牛市,只要是币就会涨?
时间的年轮飞速的流转花开花落季度秋。区块链的世界没有地图我们一路走一路被辜负一路点燃希望一路寻找答案,我是四季,本文属于个人见解不构成投资建议,切勿随意操作。今日闲谈:在牛市,你会看到各路大V们都开始出来营业了,咱家摊子的币种各个是精品,买一个未来价值不菲。然而一到熊市,大V们就销声匿迹了,偶尔几个大V开着合约摊子,门面装饰的光鲜亮丽,里面却流淌着韭菜的鲜血。所以千万不要痴迷一个币,一个币会涨主要
四季区块链
·
2023-11-22 19:12
Hbase2.1 集群搭建
>Hbase在大数据的体系中扮演着DB角色,不得不说是重要的一员,在上一篇,大猪已经给大家演示了[
Hadoop
3.2集群搭建](https://www.jianshu.com/p/3182aaff918d
kikiki5
·
2023-11-22 18:30
大二学期总结(我的机器人开发之路)
目录概述自我介绍项目开发流程学科竞赛网站推荐B站博主推荐软件
学习篇
这么多东西我应该从哪里开始学?硬件篇视频推荐PCB设计焊接技术订购材料应该注意的点建模篇视频推荐项目中建模同学做什么?
仰望星空的鑫
·
2023-11-22 18:06
创客培训
人工智能
大数据
Hadoop
-hdfs的读写请求
1、HDFS写数据(宏观):1、首先,客户端发送一个写数据的请求,通过rpc与NN建立连接,NN会做一些简单的校验,文件是否存在,是否有空间存储数据等。2、NN就会将校验的结果发送给客户端,客户端就会向NN发送请求,第一个block存储在哪个DN中。3、NN接受客户端请求,就会根据block块以及副本的数量来分配DN,并将对应的DN的地址返回给客户端。4、客户端会向第一个DN发送请求,上传数据,第
新手小农
·
2023-11-22 17:03
Hadoop
3.1.1
hadoop
hdfs
大数据
云计算与大数据第16章 分布式内存计算平台Spark习题
第16章分布式内存计算平台Spark习题16.1选择题1、Spark是
Hadoop
生态(B)组件的替代方案。
高校知识店铺合集汇总
·
2023-11-22 16:24
spark
分布式
大数据
Impala VS Hive
与Hive的关系Impala与Hive都是构建在
Hadoop
之上的数据查询工具各有不同的侧重适应面,但从客户端使用
AII派森
·
2023-11-22 16:36
hive
hadoop
数据仓库
数仓问答篇(一)
数仓架构(即席查询)总体来说,
Hadoop
架构在数据量较低的情况下,运行速度远不及MPP架构,但数据量一旦超过某个量级,
Hadoop
架构在吞吐量方面将非常有优势。
AII派森
·
2023-11-22 16:36
大数据
Hadoop
的批处理框架MapReduce
MapReduce是
Hadoop
的批处理框架。MapReduce参与者客户端(client):编写mapreduce程序,配置本地数据。
_小许_
·
2023-11-22 16:15
大数据
hadoop
hdfs
dfs
mapreduce
【
学习篇
】Linux中grep、sed、awk
Linux文本处理三剑客–awk,sed,grepgrep过滤文本https://zhuanlan.zhihu.com/p/561445240grep是Linux/Unix系统中的一个命令行工具,用于从文件中搜索文本或字符串。grep代表全局正则表达式打印。当我们使用指定字符串运行grep命令时,如果匹配,则它将显示包含该字符串的所在行,而不修改现有文件的内容。sed修改文本参考链接:https:
Logintern09
·
2023-11-22 15:52
学习
linux
运维
在Ubuntu18.04安装适合jdk8的eclipse
直接在Ubuntu软件那里下载的eclipse不能用,下载后启动会报错:EclipseAnerrorhasoccurred.Seethelogfile/home/
hadoop
/.eclipse/org.eclipse.platform
北辰Charih
·
2023-11-22 15:39
大数据挖掘
eclipse
java
ide
hadoop
@bigdate-VirtualBox:/mnt/shared$ tar -xzvf
hadoop
-2.10.2.tar.gz tar (child):
hadoop
-2.10.2.tar
在virtualbox的ubuntu虚拟机上使用共享文件夹安装
hadoop
大数据软件在在virtualbox的ubuntu虚拟机上设置共享文件夹步骤:1.设置共享文件夹自行设定共享文件夹路径以及名称,记得勾选自动挂载
北辰Charih
·
2023-11-22 15:09
大数据挖掘
hadoop
大数据
分布式
格式化名称节点,启动
Hadoop
1.循环删除
hadoop
目录下的tmp文件,记住在
hadoop
目录下进行rmtmp-rf使用上述命令,
hadoop
目录下为:2.格式化名称节点#格式化名称节点.
北辰Charih
·
2023-11-22 14:04
大数据挖掘
hadoop
大数据
分布式
HDFS 常用命令
HDFS命令格式:
hadoop
fs-cmdExample:
hadoop
fs-ls///列出hdfs文件系统根目录下的目录和文件
hadoop
fs-ls-R/列出hdfs文件系统所有的目录和文件PUT
hadoop
fs-puthdfsfile
索伦x
·
2023-11-22 14:21
数据仓库工具之Hive的架构原理
1.Hive的本质Hive是基于
Hadoop
的一个数据仓库工具,它的本质是将HQL语句转化成MapReduce程序.在它的底层,HDFS负责存储数据,YARN负责进行资源管理,MapReduce负责数据处理
GuangHui
·
2023-11-22 13:05
大数据处理技术Spark
内容有虚拟机配置,ubuntu安装,创建项目,
hadoop
部署,python使用spark库等等,也附上所有用到的软件的网盘下载链接,算是提供一个完整的思路。
我叫桃小夭
·
2023-11-22 13:54
大数据
hadoop
分布式
python
spark
[
hadoop
]shell脚本执行jps时:-bash: jps: command not found
问题描述我构建了
hadoop
集群。我们一定会写一个shell脚本去每一个节点上去jps,查看每个节点的进程情况。(这是改正之后的脚本)#!
酸甜lemon
·
2023-11-22 13:40
linux
linux
hadoop
脚本语言
-bash:jps:command not found
今天配置
hadoop
集群时,将master主机上的etc/profile文件拷贝到slaves主机上后,slaves主机上的jps命令不能用呢,最后确定是由于slaves主机上的jdk有问题。
weixin_34274029
·
2023-11-22 13:39
git
大数据
java
学习篇
-《解决问题的七步法》学习笔记
分享麦肯锡咨询公司经常帮助客户解决各种各样的复杂问题的统一方法论—七步问题解决法。第一步:定义问题。明确要解决的是什么问题。第二步:分解问题。问题都包括哪些方面,应该从什么样的角度来理解、拆解这个问题。第三步:划分优先级。当这个问题被拆解成一个一个的小问题之后,决定先解决哪一个,后解决哪一个,有哪一些我甚至可以不花时间去看。第四步:制定一个详细的工作计划。在什么样的时间,解决什么样的子问题,解决到
谭一谭
·
2023-11-22 10:47
花式玩转Linux集群免密登录
大数据集群往往需要多台机器构成一个集群,而集群内的这些机器往往需要能够互相免密登录,这里就总结下设置免密登录的常见做法; 重点: 1)需要集群内部的集群都有这个相同的用户; 2)免密登录是绑定用户的,当你设置了用户
hadoop
╭⌒若隐_RowYet——大数据
·
2023-11-22 09:51
linux
ssh
known_hosts
免密登录
Linux应用参数配置和调优,
Hadoop
性能调优 重要参数设置技巧
这里主要针对Mapreduce的性能调优。这一两个月在做mapreduce的性能调优,有些心得,还是要记下来的,以郷后人~这里主要涉及的参数包括:HDFS:dfs.block.sizeMapredure:io.sort.mbio.sort.spill.percentmapred.local.dirmapred.map.tasks&mapred.tasktracker.map.tasks.maxim
花猹猹
·
2023-11-22 09:13
Linux应用参数配置和调优
hadoop
常用端口号
1,namenodehttp端口:500702,datanodehttp端口:500753,secondaryNameNode节点http端口号:500904,datanode后端访问端口号:500105,fs端口号:90006,yarnhttp端口号:80887,历史服务器web访问端口号:1988
wangxiaowu_001
·
2023-11-22 09:43
hadoop
hadoop
big
data
Hadoop
性能调优
Hadoop
性能调优1.简介
Hadoop
性能调优不仅涉及
Hadoop
本身的性能调优,还涉及更底层的硬件、操作系统和Java虚拟机等系统的调优。
回忆美好
·
2023-11-22 09:42
hadoop
性能调优
一、禁止文件系统记录时间Linux文件系统会记录文件创建、修改和访问操作的时间信息,这在读写操作频繁的应用中将带来不小的性能损失。在挂载文件系统时设置noatime和nodiratime可禁止文件系统记录文件和目录的访问时间,这对HDFS这种读取操作频繁的系统来说,可以节约一笔可观的开销。可以修改/etc/fstab文件中noatime和nodiratime来实现这个设置。如对/mnt/disk1
挑战不可能,努力
·
2023-11-22 09:12
大数据
hadoop
常用的端口号
dfs.namenode.http-address(namenodehttp端口):50070dfs.datanode.http-address(datanodehttp端口):50075SecondaryNamenode(secondaryNameNode节点http端口号):50090dfs.datanode.address:50010fs.defaultFS:8020或者9000yarn.r
星空下的那个人影
·
2023-11-22 09:42
大数据面试
hadoop
hadoop
hadoop
性能调优之参数调优
本文转载自:http://blog.csdn.net/fp196391196391/article/details/8302121这里主要针对Mapreduce的性能调优。这一两个月在做mapreduce的性能调优,有些心得,还是要记下来的,以郷后人~这里主要涉及的参数包括:HDFS:dfs.block.sizeMapredure:io.sort.mbio.sort.spill.percentma
我是机智的鱼油
·
2023-11-22 09:12
Hadoop
之常用端口号
hadoop
3.xHDFSNameNode内部通常端口:8020、9000、9820HDFSNameNode对用户的查询端口:9870Yarn查看任务运行情况的端口:8088历史服务器:19888HDFSNameNode
m0_67393828
·
2023-11-22 09:41
java
hadoop
大数据
hdfs
linux
爬虫
Hadoop
Yarn性能调优
文章目录
Hadoop
Yarn性能调优1环境2yarn-site.xml配置
Hadoop
Yarn性能调优版本:
hadoop
-3.1.31环境内存vCode线程数
hadoop
1018G4核CPU4
hadoop
1028G4
老鼠扛刀满街找猫@
·
2023-11-22 09:41
hadhoop
hadoop
big
data
hadoop
3.x系列完全分布式集群部署(集群各节点设置与端口号的设置)
前言:
hadoop
集群为了满足高可用性与集群的高可靠性,选择对不同节点设置相应的权限与能力。用于达成平台的使用。准备工作:三台部署好
hadoop
与java的虚拟机。
杂乱无章的我
·
2023-11-22 09:10
分布式
大数据
hadoop
Hadoop
常见端口号及配置文件
1
Hadoop
2.x版本端口号1.1访问HDFS端口号:500701.2NN内部通信端口:90001.3访问MR执行任务情况端口:80881.4Yarn内部通信端口:80321.5访问历史服务器端口:198881.6
曹称象
·
2023-11-22 09:10
离线
hadoop
大数据
数据库
转载:
Hadoop
性能调优
blog.csdn.net/dxl342/article/details/52840455https://blog.csdn.net/u014156013/article/details/81347670
Hadoop
DT鸽子
·
2023-11-22 09:09
Hadoop
hadoop调优
Hadoop
常用端口号及配置文件
端口号
Hadoop
3.xHDFSNameNode内部通常端口号:8020/9000/9820HDFSNameNode对用户的查询端口:9870Yarn查看任务的运行情况:8088历史服务器:90080
Hadoop
2
LydiaaLi
·
2023-11-22 09:09
Hadoop
hadoop
大数据
hadoop
常用端口号与配置文件
常用端口号
hadoop
3.xHDFSNameNode内部通常端口:8020/9000/9820HDFSNameNode对用户的查询端口:9870Yarn查看任务运行情况:8088历史服务器:19888
hadoop
2
UserOrz
·
2023-11-22 09:39
大数据学习
hadoop
big
data
Hadoop
3.X 和 2.X 的常用端口号和配置文件
Hadoop
常用端口号
Hadoop
3.XHDFSNameNode内部通信端口:8020/9000/9820HDFSNameNodeHTTPUI:9870HDFSDataNodeHTTPUI:9864Yarn
hmyqwe
·
2023-11-22 09:38
hadoop
Hadoop
性能调优概要说明
Hadoop
容易遇到的问题有:Namenode/jobtracker单点故障、HDFS小文件问题、数据处理性能等。为此“
Hadoop
PerformanceOptimization”(HPO)是必要的。
fjssharpsword
·
2023-11-22 09:07
Big
data
Hadoop专栏
Hadoop
常用端口号和配置文件
Hadoop
常用端口号dfs.namenode.http-address:50070dfs.datanode.http-address:50075SecondaryNameNode辅助名称节点端口号
cipay666
·
2023-11-22 09:37
大数据
hadoop
hadoop
——常用端口号——常用的配置文件,3.x与2.x区别
常用端口号
hadoop
3.xHDFSNameNode内部通常端口:8020/9000/9820HDFSNameNode对用户的查询端口:9870Yarn查看任务运行情况:8088历史服务器:19888
hadoop
2
小魏___
·
2023-11-22 09:37
hadoop
hdfs
big
data
hadoop
调优
Hadoop
调优:一、操作系统级别优化:1、优化文件系统:推荐使用EXT4和XFS文件系统,相比较而言,更推荐后者,因为XFS已经帮我们做了大量的优化。
alongwaywith
·
2023-11-22 09:36
hadoop
hadoop
常用端口号/常用配置文件
常用端口号
hadoop
3.xHDFSNameNode内部通常端口:8020/9000/9820HDFSNameNode对用户的查询端口:9870yarn查看任务允许情况的:8088历史服务器:19888
hadoop
2
asd623444055
·
2023-11-22 09:06
hadoop
服务器
big
data
Hadoop
参数调优
Hadoop
参数调优性能调优涉及4个方面:CPU利用率、内存占用情况、磁盘I/O和网络流量。有很多因素会对
Hadoop
MapReduce性能产生影响。
MrZhangBaby
·
2023-11-22 09:05
谈笑间学会HDFS
Hadoop
谈笑间学会大数据
hadoop
mapreduce
hdfs
Hadoop
学习-常用端口和配置文件
一、常用端口号
hadoop
3.xHDFSNameNode内部通常端口:8020/9000/9820HDFSNameNode对用户的查询端口:9870Yarn查看任务运行情况:8088历史服务器:19888
hadoop
2
HaveAGoodDay.
·
2023-11-22 09:34
Hadoop
学习
hadoop
hadoop
常用端口号,常用配置文件都有哪些?
hadoop
3.x端口号
hadoop
(十二)
1.
hadoop
3.x系列常用端口号:类型desc端口hdfsNameNode内部通常端口号8020/9000/9820hdfsNameNode对用户的查询端口9870yarn查看历史任务运行情况8088
不努力就种地~
·
2023-11-22 09:34
大数据
hadoop
java
大数据
上一页
50
51
52
53
54
55
56
57
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他