E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop大数据学习
hive更改表结构的时候报错
48cannotrecognizeinputnear'ADD''COLUMN''compete_company_id'inaltertablestatement23/11/1417:59:27ERRORorg.apache.
hadoop
.hive.ql.Driver
五月天的小迷弟
·
2023-11-15 11:26
一些小坑
大数据
hive
hadoop
数据仓库
Hive安装与配置
archive.apache.org/dist/hive/文档网址:https://cwiki.apache.org/confluence/display/Hive/LanguageManual安装前提:3台虚拟机,安装了
Hadoop
悠然予夏
·
2023-11-15 11:16
Hadoop生态圈技术
hive
大数据
hadoop
Spark DataFrame的创建
目录1.环境准备2.从txt文件创建DataFrame3.从RDD中创建DataFrame4.一些错误1.环境准备开启虚拟机、开启
hadoop
集群、开启spark集群、开启spark-shell、在spark-shell
连胜是我偶像
·
2023-11-15 09:56
spark
spark
scala
hadoop
大数据环境配置 同步时间 centos服务器时间同步 linux 安装ntp服务更新时间
hadoop
(六)
1.安装ntp软件yuminstall-yntp2.创建软连接#删除之前得时间sudorm-rf/etc/localtime;#更新时区sudoln-s/usr/share/zoneinfo/Asia/Shanghai/etc/localtime3.更新时间#root权限运行sudontpdate-untp.aliyun.com4.开机自启,更新时间#开机启动sudosystemctlstartn
不努力就种地~
·
2023-11-15 06:46
大数据
大数据
hadoop
linux
centOS 7下
Hadoop
伪分布式搭建
记录笔记,尝试在centOS下安装
Hadoop
伪分布式(之前是在Ubuntu下安装的),查漏补缺。
wicjwnx
·
2023-11-15 05:20
hadoop
分布式
centos
CentOS7
Hadoop
3.3.4 集群安装(1 NameNode,3 DataNode)
集群网络配置:准备三台CentOS7的服务器:IP服务器名称192.168.21.25Master192.168.21.26Slave01192.168.21.27Slave02修改hosts#Master服务器vi/etc/hosts192.168.21.26Slave01192.168.21.27Slave02192.168.21.25Master#Slave01服务器vi/etc/hosts
YuG丶
·
2023-11-15 05:48
大数据
hadoop
大数据
分布式
Ubuntu22.04
Hadoop
3.3.4 jdk18.02 安装配置
Hadoop
安装阅读推荐(105条消息)大数据安装之
hadoop
-3.3.4_x_y_z423的博客-CSDN博客(112条消息)
hadoop
3.3.4集群安装部署_hwbays的博客-CSDN博客加倍推荐
落非
·
2023-11-15 05:15
hadoop
大数据
分布式
hadoop
3 伪分布式安装
1.环境准备最低硬件要求:CPU2核、内存:4G、硬盘:100GCentOS7最小安装JDK1.8
HADOOP
3.3.41.1.主机名和IP地址#编辑下方文件,修改内容为自己想要的主机名,如mitchell
被遗忘的优雅
·
2023-11-15 05:44
linux
hadoop
大数据
搭建
Hadoop
伪分布式集群
2.在Linux环境下完成伪分布式环境的搭建,并运行
Hadoop
自带的WordCount实例检测是否运行正常。【实验目的】1.掌握Linux虚拟机安装方法。
m0_58540923
·
2023-11-15 05:13
分布式
hadoop
大数据
大数据技术栈-
Hadoop
3.3.4-完全分布式集群搭建部署-centos7(完全超详细-小白注释版)虚拟机安装+平台部署
目录环境条件:1、安装虚拟机(已安装好虚拟机的可跳转至二、安装JDK与
Hadoop
)(1)直接新建一台虚拟机(2)首次启用虚拟机,进行安装一、集群前置环境搭建(三台机器分别设置hostname、网卡(ip
Hao.715
·
2023-11-15 05:43
大数据技术栈
大数据
分布式
java
hadoop
运维
Hadoop
伪分布式搭建
Hadoop
伪分布式搭建目的准备支持的平台需要的软件下载伪分布式配置设置SSH免密登录启动
hadoop
验证文件分块查看上传后的文件目的本文档介绍如何设置和配置单节点
Hadoop
安装,以便您可以使用
Hadoop
MapReduce
best program
·
2023-11-15 05:13
hadoop
分布式
hdfs
Hadoop
完全分布式安装
Hadoop
完全分布式安装前言之前有搭建过一次
Hadoop
完全分布式集群但是没有记录,最近开始着手自己搭个模拟数仓需要搭建集群,趁此机会记录一下搭建的过程。
薇安娜
·
2023-11-15 05:43
Hadoop
hadoop
大数据
Centos7搭建
hadoop
3.3.4分布式集群
1、背景最近在学习
hadoop
,本文记录一下,怎样在Centos7系统上搭建一个3个节点的
hadoop
集群。2、集群规划
hadoop
集群是由2个集群构成的,分别是hdfs集群和yarn集群。
JAVA序码
·
2023-11-15 04:10
java
Hadoop
3.3.4分布式安装
安装前提:已经配置好java环境,所有机器之间ssh的免密登录。注意:下文中的flinkv1、flinkv2、flinkv3是三台服务器的别名1.集群部署规划注意:NameNode和SecondaryNameNode不要安装在同一台服务器注意:ResourceManager也很消耗内存,不要和NameNode、SecondaryNameNode配置在同一台机器上。2.上传安装包到linux系统上3
Appreciate(欣赏)
·
2023-11-15 04:39
分布式
【Spark学习笔记】- 1Spark和
Hadoop
的区别
目录标题Spark是什么Sparkand
Hadoop
首先从时间节点上来看:功能上来看:Sparkor
Hadoop
Spark是什么Spark是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。
拉格朗日(Lagrange)
·
2023-11-15 03:11
#
Spark
学习笔记
spark
学习
笔记
Spark学习笔记【基础概念】
文章目录前言Spark基础Spark是什么spark和
hadoop
区别Spark核心模块Spark运行模式Spark运行架构运行架构Executor与Core(核)并行度(Parallelism)有向无环图
java路飞
·
2023-11-15 03:40
大数据
Spark
spark
大数据
java
配置好hivemetastore后使用show databases命令报错FAILED: SemanticException org.apache.
hadoop
.hive.ql.metadata.Hi
!!!!注意:本篇帖子并不适合初始化未初始化hive的解决方案,在报这个错误之前,我已经配置好了hive的metastore为mysql并正常使用了一段时间。我的hive版本为2.3.9,mysql为5.7问题描述:首先,我是前面已经使用配置了mysql为hive的metastore并正常使用了一段时间,但是因为业务需要,在使用spark.sql操作hive时,我将jdbc的编码格式指定为了utf
倾斜的二叉树
·
2023-11-15 03:12
hive
hive
big
data
main ERROR Unable to invoke factory method in class class org.apache.
hadoop
.hive.ql.log.HushableRand
报错信息mainERRORUnabletoinvokefactorymethodinclassclassorg.apache.
hadoop
.hive.ql.log.HushableRandomAccessFileAppenderforelementHushableMutableRandomAccess.java.lang.reflect.InvocationTargetExceptionatsun
scdn_bcs
·
2023-11-15 03:11
hive
spark
sql
APACHE-ATLAS-2.1.0 - 安装HIVE HOOK用于实时接收HIVE元数据的变化(五)
请提前安装好
HADOOP
和HIVE的环境,用于测试。
cloneme01
·
2023-11-15 03:39
ATLAS相关
大数据
atlas
zookeeper实践(搭建篇)
前言ZooKeeper是
Hadoop
家族的一款高性能的分布式协作的产品。在单机中,系统协作大都是进程级的操作。分布式系统中,服务协作都是跨服务器才能完成的。
Java蜗牛
·
2023-11-15 02:49
zookeeper
zookeeper
HADOOP
学习_熟悉linux命令+启动
hadoop
hadoop
学习linux命令mkdirrmdircpmvrm查看文档内容新建文件找文件brew和tree的安装方法findlocategrep匹配字符串启动
hadoop
linux命令可以用man查看命令的详细用法
kkkAloha
·
2023-11-14 23:16
hadoop
linux
hadoop
学习
HADOOP
学习_grep和wordcount的例子
两个小例子目录操作文件操作追加文件目录操作首先检查一下自己的hdfs是不是有/user路径http://localhost:50070/explorer.html#/没有就新建一个mac@kkkMac
hadoop
kkkAloha
·
2023-11-14 23:16
hadoop
hadoop
学习
hdfs
mapreduce--单词分析
WCDriverpackagecom.atguigu.mr.wordcount;importorg.apache.
hadoop
.conf.Configuration;importorg.apache.
hadoop
.fs.Path
芝士小熊饼干
·
2023-11-14 23:44
mapreduce
大数据
hadoop
之mapreduce详解
流程介绍:①②③InputFormatInputFormat接口决定了输入文件如何被
Hadoop
分块。InputFormat能够从一个
陈大豆
·
2023-11-14 21:10
hadoop
hadoop
Hadoop
11:MapReduce介绍
一、
Hadoop
之MapReduce详解前面我们学习了
Hadoop
中的HDFS,HDFS主要是负责存储海量数据的,如果只是把数据存储起来,除了浪费磁盘空间,是没有任何意义的,我们把数据存储起来之后是希望能从这些海量数据中分析出来一些有价值的内容
做一个有趣的人Zz
·
2023-11-14 21:40
hadoop
hadoop
hdfs
mr
Hadoop
MapReduce详解(一)
一、MapReduce简介之前我们我们讲解了
Hadoop
的分布式文件储存系统HDFS,曾把它比作一个工厂的仓库。
杨老七
·
2023-11-14 21:40
hadoopnode
mapreduce
hadoop
big
data
Hadoop
学习--MapReduce流程详解
详细流程图(from:尚硅谷)大致流程注:在mapper类被调用之前的活动都是由InputFormat的类型来决定具体的执行策略的!1.InputSplit切片阶段InputSplit是MapReduce对文件进行处理和运算的输入单位,只是一个逻辑概念,每个InputSplit并没有对文件实际的切割,只是记录了要处理的数据的位置(包括文件的path和hosts)和长度(由start和length决
是渣渣呀
·
2023-11-14 21:34
大数据
大数据
java
hadoop
【
Hadoop
】MapReduce详解
个人主页——开着拖拉机回家_大数据运维-CSDN博客✨感谢点赞和关注,每天进步一点点!加油!目录一、MapReduce概述1.1MapReduce介绍1.2MapReduce定义1.3MapReduce优缺点1.2.1.优点1.2.2.缺点1.4MapReduce框架结构二、WordCount案例三、MapReduce的运行机制详解3.1MapTask工作机制3.2ReduceTask工作机制3.
阿龙先生啊
·
2023-11-14 21:56
#
【====
HDFS&YARN
====】
hadoop
mapreduce
MapTask
ReduceTask
WordCount
Shuffle过程
MapReduce运行机制
hadoop
大数据集群环境配置 配置
hadoop
配置文件
hadoop
(七)
1.虚拟机的三台机器分别以hdfs存储,mapreduce计算,yarn调度三个方面进行集群配置
hadoop
版本3.3.4官网:
Hadoop
–Apache
Hadoop
3.3.6jdk1.8三台机器尾号为
不努力就种地~
·
2023-11-14 21:42
大数据
大数据
hadoop
分布式
hadoop
如何关闭集群
hadoop
使用脚本关闭集群
hadoop
(八)
1.
hadoop
22,
hadoop
23,
hadoop
24三台机器2.namenode所在
hadoop
22关闭hdfs:#找到/etc/
hadoop
位置cd/opt/module/
hadoop
-3.3.4
不努力就种地~
·
2023-11-14 21:39
大数据
hadoop
java
eclipse
Postgresql 查看表数据存储
可参看,http://blog.chinaunix.net/uid-24774106-id-3757916.htmlhttp://blog.csdn.net/james
hadoop
/article/details
SmallBirds911
·
2023-11-14 19:03
postgres
SQL
postgresql
数据存储
数据库
sparkSQL读取Excel表格
转自:https://www.cnblogs.com/shenyuchong/p/10291604.html编码初始化SparkSessionstatic{System.setProperty("
hadoop
.home.dir
风是外衣衣衣
·
2023-11-14 18:52
scala
小知识点
技术
sparkSQL读取excel
excel
Spark读取excle、xlsx数据(Session读取)
读取xlsx版本:IntelliJIDEACommunityEdition2019.2.4apache-maven-3.6.2Spark2.0.2
hadoop
2.6_Win_x64-master话不多说
阿朱__
·
2023-11-14 18:51
spark
scala
Spark
Scala
hadoop
安装网址
Hadoop
是什么1)
Hadoop
是一个有Apache基金会所开发的分布式系统基础架构。2)主要解决海量数据的存储和海量数据的分析计算问题。
北辰Charih
·
2023-11-14 17:24
hadoop
大数据
深入理解Kafka3.6.0的核心概念,搭建与使用
Linkedin公司开发,是一个分布式、支持分区的(partition)、多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于
hadoop
Mumunu-
·
2023-11-14 16:44
ELK
hadoop
kafka
hadoop
kafka
ELK
[WSL] 安装hive3.1.2成功后, 使用datagrip连接失败
org.apache.
hadoop
.ipc.RemoteException:User:xxxisnotallowedtoimpersonateanonymous下载driver-hive-jdbc-3.1.2
言之。
·
2023-11-14 15:56
java
ide
WSL
hive
大数据环境通信不稳定
hbaseregionserver无法启动一例尤其是装hbase的时候指定了回环地址3,尤其是删除引起的全表扫描会容易出现业务服务日志Causedby:java.net.ConnectException:Callto
hadoop
01
yuhui66666688gfbfdy
·
2023-11-14 12:10
geomesa
hadoop
大数据环境配置 rsync命令
hadoop
(三)
1.rsync:意思remotesync.rsync被用在UNIX/Linux执行备份操作操作.rsync用来从一个位置到另一个位置高效地同步文件和文件夹.rsync可以实现在同一台机器的不同文件直接备份,也可以跨服务器备份.2.rsync特点:速度快安全:rsync可以使用ssh协议加密传输占用带宽少:rsync在发送时会压缩数据块,接收后再解压缩数据块.所以和其他文件传输协议比起来,rsync
不努力就种地~
·
2023-11-14 10:23
大数据
hadoop
大数据
分布式
hadoop
大数据环境配置 ssh免密登录 centos配置免密登录
hadoop
(四)
1.找到.ssh文件夹cd~2.生成私钥公钥命令:ssh-keygen-trsa3.发送到需要免密机器:#
hadoop
23是我做了配置。
不努力就种地~
·
2023-11-14 10:39
大数据
大数据
hadoop
ssh
基于
hadoop
+hive的图书大数据分析平台
【24届大数据分析毕设之基于
hadoop
+hive的图书大数据分析平台】https://www.bilibili.com/video/BV1f8411r7wJ/?
源码空间站11
·
2023-11-14 10:21
hadoop
hive
数据分析
毕设分享 基于
hadoop
大数据教育可视化系统(源码+论文)
0简介今天学长向大家介绍一个机器视觉的毕设项目毕设分享基于
hadoop
大数据教育可视化系统(源码+论文)项目获取:https://gitee.com/sinonfin/algorithm-sharing
毕设算法家
·
2023-11-14 10:21
大数据
hadoop
python
毕业设计
数据分析
【大数据实训】基于当当网图书信息的数据分析与可视化(八)
温馨提示:文末有CSDN平台官方提供的博主的联系方式,有偿帮忙部署基于当当网图书信息的数据分析与可视化一、实验环境(1)Linux:Ubuntu16.04(2)Python:3.5(3)
Hadoop
:3.1.3
大模型Maynor
·
2023-11-14 10:18
大数据
数据分析
数据挖掘
大数据分析案例
大数据分析案例客户:医疗保健协会(HealthcareAssociation,U.S.)解决方案目标“我们需要一个可靠、快速且经济高效的
Hadoop
解决方案来应对我们的新数据计划。
小信瑞
·
2023-11-14 08:55
数据管理
数据安全
数据存储
数据分析
数据挖掘
数据安全
数据存储
数据管理
NetApp
企业存储
Hdoop安装配置学习笔记(HDP)
一、关于HDP1.AmbariAmbari是一种基于Web的工具,支持Apache
Hadoop
集群的创建、管理和监控。
glisten0317
·
2023-11-14 08:50
运维
hadoop
Hive 实现ACID
之后可以支持对表数据的UPDATE和DELETE:具体操作如下:--环境参数设置sethive.support.concurrency=true;sethive.txn.manager=org.apache.
hadoop
.hive.ql.lockmgr.DbTxnManager
柏舟飞流
·
2023-11-14 01:44
hive
hadoop
数据仓库
大数据
一、
Hadoop
3.1.3集群搭建
一、集群规划
hadoop
01(209.2)
hadoop
02(209.3)
hadoop
03(209.4)HDFSNameNodeDataNodeDataNodeSecondaryNameNodeDataNodeYARNNodeManagerResourceManagerNodeManagerNodeManagerNameNode
Dream答案
·
2023-11-14 00:18
Hadoop
hadoop
大数据
hdfs
yarn
mapreduce
linux ssh免密登录配置
在
hadoop
集群搭建的过程中,通常会对集群服务进行群启/群停的操作,而集群中的主机执行启动命令通常需要通过ssh登录到其它主机,为了解决ssh时不输入用密码的问题,在这里研究了下ssh免密登录,操作步骤记录如下
ths512
·
2023-11-13 22:56
大数据(big
data)
ssh
服务器
linux
Linux SSH免密登录
但是大数据集群(主要指的是
Hadoop
集群,可用
Hadoop
代指)使用SSH主要不是用
necessary653
·
2023-11-13 22:52
linux
ssh
eclipse
【大数据技术】爆肝3天 7个章节 Hive 3.1.3详解
大数据技术之Hive01hive入门1.1什么是Hive1)Hive简介Hive是由Facebook开源,基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
左美美  ̄
·
2023-11-13 21:10
大数据
大数据
1.搭建
hadoop
集群步骤(1)准备工作:上传并解压
hadoop
安装包,配置环境变量,ssh免密登录(2)修改配置文件:
hadoop
-env.sh,core-site.xml,hdfs-site.xml
叫我小王
·
2023-11-13 21:06
上一页
53
54
55
56
57
58
59
60
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他