E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop学习积累
hadoop
——常用端口号——常用的配置文件,3.x与2.x区别
常用端口号
hadoop
3.xHDFSNameNode内部通常端口:8020/9000/9820HDFSNameNode对用户的查询端口:9870Yarn查看任务运行情况:8088历史服务器:19888
hadoop
2
小魏___
·
2023-11-22 09:37
hadoop
hdfs
big
data
hadoop
调优
Hadoop
调优:一、操作系统级别优化:1、优化文件系统:推荐使用EXT4和XFS文件系统,相比较而言,更推荐后者,因为XFS已经帮我们做了大量的优化。
alongwaywith
·
2023-11-22 09:36
hadoop
hadoop
常用端口号/常用配置文件
常用端口号
hadoop
3.xHDFSNameNode内部通常端口:8020/9000/9820HDFSNameNode对用户的查询端口:9870yarn查看任务允许情况的:8088历史服务器:19888
hadoop
2
asd623444055
·
2023-11-22 09:06
hadoop
服务器
big
data
Hadoop
参数调优
Hadoop
参数调优性能调优涉及4个方面:CPU利用率、内存占用情况、磁盘I/O和网络流量。有很多因素会对
Hadoop
MapReduce性能产生影响。
MrZhangBaby
·
2023-11-22 09:05
谈笑间学会HDFS
Hadoop
谈笑间学会大数据
hadoop
mapreduce
hdfs
Hadoop
学习-常用端口和配置文件
一、常用端口号
hadoop
3.xHDFSNameNode内部通常端口:8020/9000/9820HDFSNameNode对用户的查询端口:9870Yarn查看任务运行情况:8088历史服务器:19888
hadoop
2
HaveAGoodDay.
·
2023-11-22 09:34
Hadoop
学习
hadoop
hadoop
常用端口号,常用配置文件都有哪些?
hadoop
3.x端口号
hadoop
(十二)
1.
hadoop
3.x系列常用端口号:类型desc端口hdfsNameNode内部通常端口号8020/9000/9820hdfsNameNode对用户的查询端口9870yarn查看历史任务运行情况8088
不努力就种地~
·
2023-11-22 09:34
大数据
hadoop
java
大数据
Hadoop
性能调优建议
一、服务器配置1.BIOS配置:关闭smmu/关闭cpu预取/performance策略2.硬盘优化raid0打卡cache/jbodscheduler/sector_size/read_ahead_kb3.网卡优化rx_buff/ring_buffer/lro/中断绑核/驱动升级4.内存插法:要用均衡插法,内存配对插。5.占用通道:先把每个通道都插满,再去插对应通道。(内存通道分布请查看机箱背板
shining_yyds
·
2023-11-22 09:33
hadoop
运维
linux
【无标题】
121.1.4Shell中单引号和双引号区别121.2
Hadoop
131.2.1
Hadoop
SKY_WU95
·
2023-11-22 09:47
大数据
Doris DDL和DML
1创建用户和数据库1)创建test用户mysql-h
hadoop
1-P9030-uroot-pcreateuser'test'identifiedby'test';2)创建数据库createdatabasetest_db
shangjg3
·
2023-11-22 05:26
Doris
doris
大数据
数据仓库
sql
Docker-13:Docker安装Hbase
就像Bigtable利用了Google文件系统(FileSystem)所提供的分布式数据存储一样,HBase在
Hadoop
之上提供了类似于Bigtable的能力。
王老邪
·
2023-11-22 04:30
容器化
hbase
docker
数据库
springcloud整合seata我踩过的坑
registrydockerrun-d-p8091:8091-p7091:7091--networknewlead--nameseata-serve-eSEATA_IP=192.168.249.132-v/home/
hadoop
蓝胖子不是胖子
·
2023-11-22 04:29
spring
cloud
spring
后端
【生产级实践】Docker部署配置
Hadoop
3.x + HBase2.x实现真正分布式集群环境
网上找了很多资料,但能够实现Docker安装
Hadoop
3.X和Hbase2.X真正分布式集群的教程很零散,坑很多,把经验做了整理,避免趟坑。
麦神-mirson
·
2023-11-22 04:56
生产级实践
大数据
分布式存储
docker
分布式
运维
使用Docker部署HBase并使用Java-API连接
HBase的原型是Google的BigTable论文,受到了该论文思想的启发,目前作为
Hadoop
的子项目来开发维护,用于支持结构化的数据存储。
当一艘船沉入海底8
·
2023-11-22 04:56
HBase
docker
hbase
Java入门教程!docker服务启动命令
第一个分布式:限流1.1ZooKeeper+Nginx面试常备题(附答案)ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是
Hadoop
和
cxy小刚.
·
2023-11-22 04:26
程序员
面试
后端
java
hadoop
、hive、DBeaver的环境搭建及使用
本文主要介绍
hadoop
、hive的结构及使用,具体的操作步骤见最后的附件;
hadoop
提供大数据的存储、资源调度、计算,分为三个模块:HDFS、YRAN、MapReduceHDFS提供数据的分布式存储
骑士999111
·
2023-11-22 03:14
hadoop
hive
大数据
超详细的
hadoop
完全分布式安装及xsync等各个脚本
1.主机名修改在完成虚拟机的创建后,进行主机名称修改:#修改配置文件,将内容改为master,保存退出vi/etc/hostname#将里面localhost删除进行改名[root@host~]$vi/etc/sysconfig/network编辑,i键插入NETWORKING=yesHOSTNAME=master修改为新名:wqESC退出插入退出并保存[root@bogon~]$reboot2
动心の瓦狗狗
·
2023-11-22 00:20
分布式
hadoop
大数据
超详细的hive和mysql的安装与配置以及hive服务启动脚本
目录一、说明二、Hive安装与配置1.上传文件并解压2.修改目录名称3.配置hive环境变量4.删除冲突jar包5.启动
hadoop
集群6.初始化元数据库并启动三、MySQL安装与配置1.检查和上传文件并解压四
动心の瓦狗狗
·
2023-11-22 00:20
hive
mysql
hadoop
大数据
big
data
超详细的zookeeper和hbase安装教程以及启动脚本zk.sh等
数据存储路径)6.创建文件夹7.在zkData下创建myid文件(文件名不可更换)8.分发zookeeper并修改zkData配置9.编写zookeeper的启动、关闭、状态脚本hbase安装1.启动
hadoop
动心の瓦狗狗
·
2023-11-22 00:37
运维
zookeeper
hbase
分布式
大数据
本机idea连接虚拟机中的Hbase
相关环境:虚拟机:Centos7
hadoop
版本:3.1.3hbase版本:2.4.11zookeeper版本:3.5.7JavaIDE:IDEAJDK:8步骤步骤一:在idea创建一个maven项目步骤二
mendianyu
·
2023-11-22 00:16
intellij-idea
hbase
java
hadoop
查看文件夹大小java,
hadoop
fs:du统计hdfs文件(目录下文件)大小的用法
hadoop
fs更多用法,请参考官网:http://
hadoop
.apache.org/docs/r1.0.4/cn/hdfs_shell.html以下是我的使用
hadoop
fs-du统计文件时使用的记录
上海Josh哥
·
2023-11-21 23:54
iceberg学习笔记(2)—— 与Hive集成
前置知识:1.了解
hadoop
基础知识,并能够搭建
hadoop
集群2.了解hive基础知识3.Iceberg学习笔记(1)——基础知识-CSDN博客可以参考:
Hadoop
基础入门(1):框架概述及集群环境搭建
THE WHY
·
2023-11-21 22:59
数据湖
大数据
学习
笔记
hive
数据仓库
大数据
什么是数据倾斜 数据倾斜的表现 发生数据倾斜的原因 如何解决数据倾斜
distinct),先用group去重再count子查询,特殊值分开处理法大表join大表不同数据类型关联产生数据倾斜多表unionall会优化成一个job优化in/exists语句排序选择什么是数据倾斜
Hadoop
jialun0116
·
2023-11-21 22:26
数据仓库
面经
数据库
大数据
hdfsClient_java对hdfs进行上传、下载、删除、移动、打印文件信息尚硅谷大海哥
Java可以通过
Hadoop
提供的HDFSJavaAPI来控制HDFS。通过HDFSJavaAPI,可以实现对HDFS的文件操作,包括文件的创建、读取、写入、删除等操作。
hys_guff
·
2023-11-21 21:28
java
hdfs
开发语言
Hadoop
——快速入门
大数据不得不提到最有用的利器
Hadoop
,本文最快的方式让你上手
Hadoop
,
hadoop
快速入门,并且有一个感性的认识,也可以当做步骤的快速索引,本文解决以下问题:理解
Hadoop
是什么
Hadoop
用于做什么以及怎么用
wondream322
·
2023-11-21 18:47
大数据学习
hadoop
大数据
分布式
MapReduce执行流程和Shuffle过程
Hadoop
MapReduce作业执行流程整个
Hadoop
MapReduce的作业执行流程如图1所示,共分为10步。
一粒米_394c
·
2023-11-21 18:41
大数据与
Hadoop
,
Hadoop
核心组件之MapReduce
大数据大数据,不仅仅具备大的特征,只有外行人才会天真的以为大数据,就是数据,量大!量大只是大数据其中的一个特征,除了这个特征之外,它还和另外三个特征合起来组成了大数据必不可少的四个特征:Volume大量的海量的数据Variety多种多样的数据的类型多种多样,比如数据来源多样,企业内部的日志,互联网和物联网等,数据的类型多样,有结构化数据,有非结构化数据,如视频,文档,音频,有的数据关联性不大,有的
Python大数据工程师
·
2023-11-21 18:14
生产环境的
Hadoop
版本比较
一、背景介绍Apache
Hadoop
:Apache
Hadoop
是一款支持数据密集型分布式应用并以Apache2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。
三名狂客
·
2023-11-21 15:49
大数据与云计算
mapreduce
分布式应用
hadoop
集群
框架
Mac上搭建
Hadoop
环境(3) — Hive下载及安装
前言之前已经完成了
hadoop
集群的安装,测试了HDFS的使用,现在准备在此基础上,继续安装Hive。
LestatZ
·
2023-11-21 13:54
Spark---介绍及安装
Spark是UCBerkeleyAMPlab(加州大学伯克利分校的AMP实验室)所开源的类
Hadoop
MapReduce的通用并行计算框架,Spark拥有
Hadoop
MapReduce所具有的优点;但不同于
30岁老阿姨
·
2023-11-21 13:26
Spark
spark
大数据
分布式
黑猴子的家:Centos 7.x 安装 BT 宝塔
1、概述BT宝塔Linux面板是提升运维效率的服务器管理软件,支持一键构建LAMP/LNMP/集群/监控/网站/FTP/数据库/JAVA等多项服务器管理功能2、安装[alex@
hadoop
102~]$sudoyuminstall-ywget
黑猴子的家
·
2023-11-21 12:00
运维
linux
数据库
centos
java
hadoop
配置历史服务器 开启历史服务器查看
hadoop
(十)
1.配置了三台服务器,
hadoop
22,
hadoop
23,
hadoop
242.
hadoop
文件路径:/opt/module/
hadoop
-3.3.43.
hadoop
22机器配置历史服务器的配置文件:文件路径
不努力就种地~
·
2023-11-21 11:43
大数据
hadoop
服务器
大数据
hadoop
日志聚集功能配置
hadoop
(十一)
图更加直观1.首先需要配置历史服务器配置,才可以配置日志聚集功能:
hadoop
配置历史服务器开启历史服务器查看
hadoop
(十)-CSDN博客2.配置了三台服务器,
hadoop
22,
hadoop
23,
hadoop
243
不努力就种地~
·
2023-11-21 11:43
大数据
hadoop
eclipse
大数据
Hadoop
-- hdfs
1、HDFS中的三个进程:NameNode(NN)、DataNode(DN)、SecondNameNode(SNN)2、NameNode(NN)1、作用:1、接收客户端的一个读、写的服务,在namenode上存储了数据文件和datanode的映射的关系。2、存储元数据信息,会将文件的一些属性、文件的大小、文件的权限都存储在namenode上面,和存储block的位置信息,在每次开启集群的时候dat
新手小农
·
2023-11-21 11:11
Hadoop
3.1.1
hadoop
hdfs
大数据
hadoop
编写开启关闭集群脚本,
hadoop
hdfs,yarn开启关闭脚本。傻瓜式
hadoop
脚本
hadoop
(九)
1.三台机器:
hadoop
22,
hadoop
23,
hadoop
242.hdfs在22机器启动,yarn在
hadoop
23机器3.脚本需要
hadoop
用户启动才可以4.脚本必须在
hadoop
22机器运行。
不努力就种地~
·
2023-11-21 11:30
大数据
hadoop
hdfs
大数据
解决:
hadoop
-client和netty-all的jar包冲突
问题:java.lang.NoSuchMethodError:io.netty.util.AttributeKey.newInstance(Ljava/lang/String;)Lio/netty/util/AttributeKey;解决:可能是版本不同的问题,然后导入netty-all依赖版本分别使用了4.1.17和4.1.18两个版本,但还是报上面的错误,后来百度了下面的地址,换成4.1.13
Sam_L
·
2023-11-21 10:07
Spark读取mysql数据插入Hive表中
避免待会找不到hive数据库修改spark的配置文件,conf目录下的spark-env.shexportJAVA_HOME=/opt/soft/jdkexportSPARK_MASTER_HOST=
hadoop
1exportSPARK_MASTER_PORT
JAVA百练成神
·
2023-11-21 10:01
大数据
hive
spark
mysql
maven打包插件配置模板
org.apache.maven.pluginsmaven-shade-plugin3.2.4packageshadecom.google.code.findbugs:jsr305org.slf4j:*log4j:*org.apache.
hadoop
诗风雅韵
·
2023-11-21 08:45
maven
java
学习积累
sda
零、GDB调试选项GDB调试选项启动程序调试:使用gdb命令启动GDB调试器,并在后面加上要调试的可执行文件名称,如:gdbmy_program。设置断点:使用break或b命令设置断点。例如,breakmain在程序的main函数处设置断点。运行程序:使用run或r命令来运行程序。可以在run命令后加上程序的参数。单步调试:使用step或s命令进行单步调试。step命令进入函数,next或n命令
weixin_45834236
·
2023-11-21 04:42
笔记
Hadoop
伪分布式集群搭建
一、切换到root用户su-root二、关闭selinux:vim/etc/selinux/configSELINUX=disabled三、切换到
hadoop
用户,配置免密登陆。
皮卡丘要进化
·
2023-11-21 02:13
[YARN] 2.2 GB of 2.1 GB virtual memory used. Killing container.
在etc/
Hadoop
/yarn-site.xml文件中,修改检查虚拟内存的属性为false,如下:yarn.nodemanager.vmem-check-enabledfalse
白纸糊
·
2023-11-21 00:29
MapReduce-WritableComparable排序 (From 尚硅谷)
该操作属于
Hadoop
的默认行为。任何应用程序中的数据会被排序,而不管逻辑上是
lavineeeen
·
2023-11-21 00:04
Hadoop
mapreduce
hadoop
big
data
学习篇-
Hadoop
-MapReduce-流量统计
文章目录一、
Hadoop
-MapReduce-流量统计-需求分析二、
Hadoop
-MapReduce-流量统计-代码实现三、
Hadoop
-MapReduce-流量统计-Partitioner一、
Hadoop
-MapReduce
东东爱编码
·
2023-11-21 00:03
hadoop
hadoop
mapreduce
hadoop
-MapReduce案例流量统计
MapReduce案例-流量统计需求一:统计求和统计每个手机号的上行数据包总和,下行数据包总和,上行总流量之和,下行总流量之和分析:以手机号码作为key值,上行流量,下行流量,上行总流量,下行总流量四个字段作为value值,然后以这个key,和value作为map阶段的输出,reduce阶段的输入Step1:自定义map的输出value对象FlowBeanpackageflow_count_dem
Xiaoweidumpb
·
2023-11-21 00:02
大数据技术
MapReduce-流量统计求和-排序-Mapper和Reducer编写
定义FlowMapperpackagecn.learn.mapreduce_sort;importorg.apache.
hadoop
.io.LongWritable;importorg.apache.
hadoop
.io.Text
Leon_Jinhai_Sun
·
2023-11-21 00:58
mapreduce--流量统计
FlowBeanpackagecom.atguigu.mr.flow;importorg.apache.
hadoop
.io.Writable;importjava.io.DataInput;importjava.io.DataOutput
芝士小熊饼干
·
2023-11-21 00:57
mapreduce
大数据
Flink 源码解析 —— 深度解析 Flink 是如何管理好内存的?
最着名的例子是Apache
Hadoop
,还有较新的框架,如ApacheSpark、ApacheDrill、ApacheFlink。
zhisheng_blog
·
2023-11-20 23:03
java
Flink
大数据
流式计算
Java
Flink
第四章 Ambari二次开发之自定义Flink服务源码剖析
1、Ambari架构剖析1.1、Ambari概述(1)Ambari目标①核心目标:解决
Hadoop
生态系统部署问题②实现方式:默认配置写入stack中,在开启时将stack总各个版本的config文件读入
随缘清风殇
·
2023-11-20 23:31
#
Ambari二次开发
ambari
hadoop
java
win10下编译Apache版本
hadoop
2.10.0,附资源
今天是三月尾巴了,然后博文还没打卡,今天临时编译了一下
hadoop
在window上的环境包,至于版本就不要纠结了,比如问为啥不用
hadoop
2.6或者
hadoop
3版本而用2.10.0版本。
辅猪之王
·
2023-11-20 23:19
安装
笔记
错误干扰
windows
hadoop
大数据
Spark 之 format
hive表,走的是这里'defgetDefaultStorage(conf:SQLConf):CatalogStorageFormat={//Torespecthive-site.xml,itpeeks
Hadoop
configurationfromexistingSparksession
zhixingheyi_tian
·
2023-11-20 21:08
spark
spark
大数据
分布式
【博学谷学习记录】超强总结,用心分享|Hive调优-本地模式
文章目录本地模式用案例测试本地模式的效果创建普通表加载数据到普通表创建分桶表查询普通表数据插入分桶表记录关闭本地模式的插入数据用时记录开启本地模式的插入数据用时记录关闭本地模式的查询数据用时记录开启本地模式的查询数据用时总结本地模式当数据量很大时,
Hadoop
Job
熊猫同学呀
·
2023-11-20 20:29
Hive
博学谷学习记录
hive
学习
大数据
上一页
48
49
50
51
52
53
54
55
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他