E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop;hdfs
No.2大数据入门 | 环境搭建:jdk1.8安装及环境配置
上一篇文章我们安装了虚拟机以及linux操作系统,接下来就要安装在操作系统上运作的大数据核心
hadoop
分布式系统基础架构!
滚滚红尘_8133
·
2024-02-08 11:43
Hadoop
多次格式化后如何解决
产生原因我们在配置
hadoop
中的
hdfs
时,会设置元数据的存储位置,如图所示要想解决此问题,先停止所有启动的服务stop-all.sh然后删除上图画出来的配置文件,这里三台机器都要删,最后进入
hadoop
(((φ(◎ロ◎;)φ)))牵丝戏安
·
2024-02-08 11:50
笔记
Hadoop
云计算
hadoop
hdfs
CentOS 7搭建
Hadoop
伪分布模式
配置文件:链接:https://pan.baidu.com/s/1rYvnxbyqXOG1DjI63dxbAw提取码:6e1l复制这段内容后打开百度网盘手机App,操作更方便哦1.1修改IP地址在虚拟机的命令行中输入下面的命令,修改网卡的配置文件vi/etc/sysconfig/network-scripts/ifcfg-ens33配置以下信息TYPE=Ethernet#类型为以太网BOOTPRO
clevercondy
·
2024-02-08 09:52
hadoop
linux
centos
2018-07-14
复制/etc/skel目录为/home/tuser1改权限2、编辑/etc/group文件,添加组
hadoop
。
啊鑫007
·
2024-02-08 08:56
Hadoop
生态漏洞修复记录
Hadoop
常用端口介绍
HDFS
NameNode50070dfs.namenode.http-addresshttp服务的端口50470dfs.namenode.https-addresshttps服务的端口
不会吐丝的蜘蛛侠。
·
2024-02-08 08:30
hadoop
大数据
分布式
Hadoop
2.7配置
core-site.xmlfs.defaultFS
hdfs
://bigdata/ha.zookeeper.quorum192.168.56.70:2181,192.168.56.71:2181,192.168.56.72
不会吐丝的蜘蛛侠。
·
2024-02-08 08:59
Hadoop
hadoop
大数据
hdfs
hive2.3.2配置(带kerberos)
hive-env.shexport
HADOOP
_HEAPSIZE=2048export
HADOOP
_CLIENT_OPTS="-Xmx2g-Xms2g-Djava.net.preferIPv4Stack
不会吐丝的蜘蛛侠。
·
2024-02-08 08:59
Hadoop
hive
hadoop
大数据
高性能hbase配置
hbase-env.shexport
HADOOP
_HOME=/export/
hadoop
export
HADOOP
_CONF_DIR=/export/common/
hadoop
/confexportJAVA_HOME
不会吐丝的蜘蛛侠。
·
2024-02-08 08:59
Hadoop
hbase
数据库
大数据
HDFS
执行balance报错:
hdfs
balance java.io.IOException: Another Balancer is running.. Exiting
现象:1、大数据
Hadoop
集群,
HDFS
扩容后,为了使各节点数据均衡,执行balance操作。2、启动
hdfs
balance时,一直出现其他的balance在执行中,其实并没有执行。
不会吐丝的蜘蛛侠。
·
2024-02-08 08:29
Hadoop
hdfs
hadoop
java
大数据问题:
Hadoop
的web页面无法访问logs
HTTPERROR403Problemaccessing/logs/.Reason:Useryarnisunauthorizedtoaccessthispage.PoweredbyJetty://分析:1、有的说是权限问题,但是并没有用yarn用户启动
Hadoop
不会吐丝的蜘蛛侠。
·
2024-02-08 08:28
Hadoop
hadoop
hadoop
调优-
hdfs
配置优化
配置文件
hdfs
-site.xml生产环境建议优化:dfs.permissions.enabledtruedfs.namenode.handler.count90dfs.ha.automatic-failover.enabledtrue
不会吐丝的蜘蛛侠。
·
2024-02-08 08:28
Hadoop
hadoop
hdfs
big
data
hive自定义UDF依赖第三方jar包
上传jar包到
HDFS
上
hdfs
dfs-putxxxx.jar/tmp/hive/创建永久函数:createfunctionmy_funas'com.test.TestUDF'usingjar'
hdfs
不会吐丝的蜘蛛侠。
·
2024-02-08 08:28
hive
hive
jar
hadoop
spark运行失败The directory item limit of /spark_dir/spark_eventLogs is exceeded: limit=1048576 items=104
报错:org.apache.
hadoop
.ipc.RemoteException(org.apache.
hadoop
.
hdfs
.protocol.FSLimitException$MaxDirectoryItemsExceededException
不会吐丝的蜘蛛侠。
·
2024-02-08 08:58
Hadoop
spark
hadoop
hdfs
grafana+prometheus+hiveserver2(jmx_exporter+metrics)
文件开启metricshive.server2.metrics.enabledtruehive.service.metrics.codahale.reporter.classesorg.apache.
hadoop
.hive.common.metrics.metrics2
不会吐丝的蜘蛛侠。
·
2024-02-08 08:24
hive
Hadoop
grafana
prometheus
hive监控
jmx_exporter
hive_metrics
hadoop
学习笔记
下载安装伪分布式:1.国内源下载地址:https://mirrors.tuna.tsinghua.edu.cn/apache/
hadoop
/common/Indexof/apache/
hadoop
/commonhttps
草琳情
·
2024-02-08 08:54
hadoop
学习
笔记
删除和清空Hive外部表数据
外部表和内部表区别未被external修饰的是内部表(managedtable),被external修饰的为外部表(externaltable);区别:内部表数据由Hive自身管理,外部表数据由
HDFS
SunnyRivers
·
2024-02-08 08:53
Hive
hive
drop
truncate
外部表
删除外部表
flink on yarn
Per-JobCluster模式flinkrunflinkrunapplication-tyarn-application配置任务退出时保留Checkpoint从外部checkpoint恢复应用资料使用安装完
hadoop
3.3.4
枪枪枪
·
2024-02-08 07:46
flink
大数据
hadoop
Mac 安装多版本 protoc / protobuf
)brew安装brewinstallprotobuf#查看安装目录$whichprotoc/opt/homebrew/bin/protoc#2)配置环境变量vim~/.zshrc#protoc(for
hadoop
大数据王小皮
·
2024-02-08 07:26
操作配置
macos
sqoop导入数据到
hdfs
Sqoop是apache旗下的一款”
Hadoop
和关系数据库之间传输数据”的工具导入数据:将MySQL,Oracle导入数据到
Hadoop
的
HDFS
、HIVE、HBASE等数据存储系统导出数据:从
Hadoop
鲲鹏猿
·
2024-02-08 06:40
hdfs
sqoop
hadoop
Hadoop
之环境配置
1.安装环境ubuntu2.安装jdk3.安装
Hadoop
1.在安装ubuntu时需要注意安装ubuntu创建用户,等待时间比较长,大家需要有点耐心。
鲲鹏猿
·
2024-02-08 06:39
big
data
数据库
数据库架构
2024-02-07(Sqoop,Flume)
1.Sqoop的增量导入实际工作中,数据的导入很多时候只需要导入增量的数据,并不需要将表中的数据每次都全部导入到hive或者
hdfs
中,因为这样会造成数据重复问题。
陈xr
·
2024-02-08 06:35
随记日志
sqoop
flume
数据采集工具Sqoop、Datax、Flume、Canal
libcpmysql-connector-java-5.1.10.jar/sqoop-install-path/lib重命名文件并配置文件mvsqoop-env-template.shsqoop-env.sh#添加环境变量export
HADOOP
_COMMON_HOME
yue-verdure
·
2024-02-08 06:08
大数据
sqoop
flume
大数据
阿里云
大数据系列—数据迁移(Sqoop,Flume,DataX)对比学习(stage3)
个人大数据技术栈:DataX,Sqoop,
Hadoop
,Hive,Spark,Flink,Hbase,Kafka,Kettle,Azkaban,Airflow,Tableau…个人在学习领域:Python
道-闇影
·
2024-02-08 06:07
big
data
大数据
sqoop
flume
Zookeeper搭建集群步骤
[
hadoop
@note1~]$cat/etc/hosts127.0.0.1localhostlocalhost.localdomainlocalhost4localhost4.localdomain4
qq_22019789
·
2024-02-08 06:37
zookeeper
java
MapReduce的类型与格式
MapReduce的类型
Hadoop
的MapReduce中,map函数和reduce函数遵循如下格式:map:(k1,v1)--->list(k2,v2)combiner:(k2,list(v2))--
Vechace
·
2024-02-08 05:31
2023大数据必看面试题
1、请讲述
HDFS
输入文件的具体步骤?
东方同学
·
2024-02-08 05:38
大数据
面试题
大数据
hadoop
java
Spark安装(Yarn模式)
一、解压链接:https://pan.baidu.com/s/1O8u1SEuLOQv2Yietea_Uxg提取码:mb4htar-zxvf/opt/software/spark-3.0.3-bin-
hadoop
3.2
莫噶
·
2024-02-08 04:44
搭建
spark
大数据
分布式
Hadoop
搭建(完全分布式)
bigdata-masterbigdata-slave1bigdata-salve2NameNodeNodeManagerNodeManagerSecondaryNameNodeDataNodeDataNodeResourceManagerNodeManagerDataNode目录一、jdk安装:二、
hadoop
莫噶
·
2024-02-08 04:14
搭建
分布式
hadoop
大数据
现成
Hadoop
安装和配置,图文手把手交你
为了可以更加快速的可以使用
Hadoop
,便写了这篇文章,想尝试自己配置一下的可以参考从零开始配置
Hadoop
,图文手把手教你,定位错误资源1.两台已经配置好的
hadoop
2.xshell+Vmware链接
叫我小唐就好了
·
2024-02-08 03:56
一些好玩的事
hadoop
大数据
分布式
课程设计
运维
Spark Standalone 集群配置
ApacheMesos-一个通用的集群管理器,也可以运行
Hadoop
MapReduce和服务应用程序。(已弃用)
Hadoop
YARN-Hado
董可伦
·
2024-02-07 23:01
Spark
spark
大数据
分布式
Hadoop
系统应用之Zookeeper分布式集群部署
一、Zoopkeeper安装包下载安装【Zookeeper版本型号为3.4.10】1.下载Zookeeper安装包(地址)https://archive.apache.org/dist/zookeeper/zookeeper-3.4.10/2.上传安装包(SecureCRT&FX)通过软件FX将安装包上传到linux系统的/export/software/目录下3.解压Zookeeper安装包执行
-牧心-
·
2024-02-07 22:31
分布式
hadoop
java-zookeeper
Hadoop
| 集群配置(一)使用Shell脚本解决完全分布式集群节点之间的文件传输问题 | scp命令 | rsync命令
文章目录参考资料一、前言二、rsync远程同步工具三、使用shell编写分发脚本四、总结参考资料视频链接Linuxscp命令一、前言在
Hadoop
完全分布式集群环境下,里面的各个节点都是通过SSH免密登陆连接的
「已注销」
·
2024-02-07 21:20
#
大数据原理与应用
hadoop
分布式
linux
hive之DDl数据定义
1.Hive在
HDFS
上的默认存储路径Hive的数据都是存储在
HDFS
上的,默认有一个根目录,在hive-site.xml中,由参数hive.metastore.warehouse.dir指定。
嚄825
·
2024-02-07 19:32
hive
hadoop
大数据
【
hadoop
】集群搭建之部署mysql并远程访问(连接)
的roo账号密码并连接mysql(四)更改默认密码并创建testdb数据库(五)将mysqljdbc驱动引入ider中的java项目里(六)通过jdbc连接(访问)mysql(使用ider)(七)创建
hadoop
db_lcz_2014
·
2024-02-07 18:32
hadoop
mysql
大数据
HDFS
之 数据管理(namespace 和 slaves)
1、namespaceNamespace在
HDFS
中是一个非常重要的概念,也是有效管理数据的方法。Namespace有很多优点:可伸缩性。使
HDFS
集群存储能力可以轻松进行水平拓展;系统性能。
Studying!!!
·
2024-02-07 17:57
中间件
hdfs
hadoop
大数据
HDFS
架构 之 服务视图
1、简介为实现以上特性,
HDFS
包含的各个服务模块都是经过精心设计的,
HDFS
的服务视图如图。
HDFS
的服务视图包含三大部分:核心服务、公共服务和拓展服务。2、核心服务1)Namenode。
Studying!!!
·
2024-02-07 17:27
中间件
hdfs
hadoop
大数据
HDFS
架构 之 元数据架构解析
1.1namenode启动流程1.1.1启动流程1、加载fsimage文件FsImage是一种持久化到磁盘上的文件,里面包含了集群大部分的meta数据,持久化的目的主要是为了防止meta数据丢失,也就是在
HDFS
Studying!!!
·
2024-02-07 17:23
中间件
hdfs
架构
hadoop
学习大数据需要掌握哪些知识?
而且不论是学习
hadoop
,还
大数据学习01
·
2024-02-07 15:16
DataX概述
1.概述DataX是阿里开源的的一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、
HDFS
、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能
大数据开发工程师-宋权
·
2024-02-07 14:01
DataX
hadoop
阿里云datax工具使用详解
datax介绍特征安装前准备工作-系统需求快速开始补充datax介绍DataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括MySQL、SQLServer、Oracle、PostgreSQL、
HDFS
王春星
·
2024-02-07 14:01
数据高效导入工具
大数据数据迁移工具选择
快速导数据工具
异构数据源导入工具
大数据工具
datax安装与使用详解
一、dataX概览1.1DataXDataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括MySQL、SQLServer、Oracle、PostgreSQL、
HDFS
、Hive、HBase
jhchengxuyuan
·
2024-02-07 14:00
hadoop
大数据
datax
大数据
CentOS7集群配置免密登录
准备工作提前开启三台虚拟机
hadoop
102、
hadoop
103,
hadoop
104,关于三台虚拟机的安装可以参考:https://mp.csdn.net/mp_blog/creation/editor
在下区区俗物
·
2024-02-07 12:00
Hadoop集群安装部署
linux
运维
大数据
CentOS7搭建
Hadoop
集群
集群环境搭建(3台)-CSDN博客2、配置虚拟机之间免密登录,参考:CentOS7集群配置免密登录-CSDN博客3、虚拟机分别安装jdk,参考:CentOS7集群安装JDK1.8-CSDN博客4、下载
Hadoop
在下区区俗物
·
2024-02-07 12:57
Hadoop集群安装部署
hadoop
eclipse
java
请问半吊子 C++选手该如何深入学习 C++?
java是典型的后台语言,能和netty、
hadoop
、hbase-、elastics
枪哥玩转嵌入式
·
2024-02-07 11:21
51单片机
智能小车
嵌入式
单片机
51单片机
单例模式
hadoop
集群搭建踩坑实录
由于不可控以及不可知的原因我搭建的
hadoop
集群突然显示虚拟机出现了问题导致某一个DataNode数据丢失并且无法通过Xshell远程访问其他的DataNode主机和虚拟机无法互相ping通网上能找的解决办法基本都找了依然无法解决因此我能想到的是只能删除虚拟机重新克隆一台机器然而还是无法通过远程连接无奈之下我重启电脑发现又可以通过
温文尔雅的流氓
·
2024-02-07 10:39
Hadoop
Hadoop
分布式计算实验踩坑实录及小结
目录
Hadoop
分布式计算实验踩坑实录及小结踩坑实录
Hadoop
学习
Hadoop
简介
HDFS
SomeconceptsMapReduce主要配置文件集群搭建来源与引用
Hadoop
分布式计算实验踩坑实录及小结踩坑实录单机
小童同学_
·
2024-02-07 10:08
HIT
hadoop
分布式
ubuntu
java
大数据命令,一文在手,全部都有(送纯净版文档)
比如linux,kafka命令就比较多,
hdfs
操作也多。但是对于HBase.....这类框架命令比较少,就不再本篇展示。望周知。其中内容包含以下,具体命令会一一介绍。
大数据左右手
·
2024-02-07 09:35
大数据
大数据
zookeeper
hadoop
flink
linux
kyuubi 接入starrocks | doris
kyuubi接入starrocks一、环境
Hadoop
集群组件版本
Hadoop
3.1.1spark3.Xzookeeper3.XHive3.Xkyuubi版本1.7.1starrocks2.X 已将kyuubi
甜甜的巧克力阿
·
2024-02-07 09:48
大数据相关
大数据
kyuubi
starrocks
doris
原来还可以使用 DataX 进行数据同步
DataX实现了包括MySQL、Oracle、SqlServer、Postgre、
HDFS
、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、Hologres
lytao123
·
2024-02-07 06:16
➤
数据库
big
data
hive
java
DataX
Clickhouse
Clickhouse到HBase(Phoenix)数据导入 DataX
DataXDataX是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、
HDFS
、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。
布尔科技技术团队
·
2024-02-07 06:44
hbase
oracle
postgresql
数据仓库
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他