E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop大数据学习
flume 中sink用hdfs sink报拒绝连接错误hdfs-io
WARN-org.apache.flume.sink.hdfs.HDFSEventSink.process(HDFSEventSink.java:454)]HDFSIOerrorjava.net.ConnectException:CallFrom
hadoop
102
m0_58310854
·
2023-12-25 16:38
flume
hdfs
hadoop
flume
Hadoop
2.x安全:
hadoop
集群之kerberos认证(三、常用命令、有效期)
微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读概述:开启了Kerberos认证集群之后,集群不再像以前一样随意操作,需要证书进行登录,这里就讲一下我们日常用的的一些kerberos相关的一些操作,包括票据的创建、删除、有效期更改等。常用操作:1
大数据开发运维架构
·
2023-12-25 15:34
云计算与大数据之间的羁绊(期末不挂科版):云计算 | 大数据 |
Hadoop
| HDFS | MapReduce | Hive | Spark
文章目录前言:一、云计算1.1云计算的基本思想1.2云计算概述——什么是云计算?1.3云计算的基本特征1.4云计算的部署模式1.5云服务1.6云计算的关键技术——虚拟化技术1.6.1虚拟化的好处1.6.2虚拟化技术的应用——12306使用阿里云避免了高峰期的崩溃1.6.3虚拟化的关键特征1.6.4虚拟化的HA指的是什么?1.6.5服务器虚拟化1.6.6虚拟机迁移1.6.6.1虚拟机实时迁移对云计算
春人.
·
2023-12-25 14:59
春人闲谈
大数据
hadoop
云计算
HDFS
MapReduce
Nive
Hive
【
大数据学习
笔记】最全Python连接各种数据库及对应的CRUD操作
本文将详细探讨如何在Python中连接全种类数据库以及实现相应的CRUD(创建,读取,更新,删除)操作。我们将逐一解析连接MySQL,SQLServer,Oracle,PostgreSQL,MongoDB,SQLite,DB2,Redis,Cassandra,MicrosoftAccess,ElasticSearch,Neo4j,InfluxDB,Snowflake,AmazonDynamoDB,
伊达
·
2023-12-25 14:54
大数据
Python
python
mysql
database
sql
【
大数据学习
笔记】新手学习路线图
第1阶段-数据仓库基1.MysQL关系型数据库(MySQL介绍、MySQL安装、MySQL基础语法、MySQL高级语法、MySQL系统架构、MySQL存储引擎、MySQL索引、MySQL备份恢复、MySQL主从、主主复制、MySQL存储过程、MySQL分库分表、MySQL综合案例、MySQL性能优化)2.Python编程技术(Python基础语法、Python循环、Python集合、Python函
伊达
·
2023-12-25 14:54
大数据
大数据
学习
笔记
hive 配置metastore hiveserver2服务开启
安装mysqlcreatedatabasemetastore;配置hivehive-site.xml:javax.jdo.option.ConnectionURLjdbc:mysql://
hadoop
102
赤土 炙焱
·
2023-12-25 12:50
hive
hadoop
数据仓库
用户没有权限操作
hadoop
User: wu is not allowed to impersonate wu (state=08S01,code=0)
CouldnotopenclienttransportwithJDBCUri:jdbc:hive2://ubuntu:10000:Failedtoopennewsession:java.lang.RuntimeException:org.apache.
hadoop
.ipc.RemoteException
赤土 炙焱
·
2023-12-25 12:50
hadoop
分布式
hive日常报错 | 处理步骤
java.net.ConnectException:Yourendpointconfigurationiswrong;Formoredetailssee:http://wiki.apache.org/
hadoop
赤土 炙焱
·
2023-12-25 12:50
hive
hadoop
Hadoop
(2):常见的MapReduce[在Ubuntu中运行!]
1以词频统计为例子介绍mapreduce怎么写出来的弄清楚MapReduce的各个过程:将文件输入后,返回的代表的含义是:k1表示偏移量,即v1的第一个字母在文件中的索引(从0开始数的);v1表示对应的一整行的值map阶段:将每一行的内容按照空格进行分割后作为k2,将v2的值写为1后输出reduce阶段:将相同的k2合并后,输出1.1创建Mapper、Reducer、Driver类创建这三种类用的
Oasis of the World
·
2023-12-25 12:05
hadoop
mapreduce
c#
[
HADOOP
]数据倾斜的避免和处理
预处理数据:在数据加载到
Hadoop
之前进行预处理,以减少倾斜。使用抽样或统计方法来了解数据分布特征,并据此调整。
wātɔ:h
·
2023-12-25 12:02
hadoop
大数据
分布式
hadoop
3.3大数据集群搭建系列2-安装zookeeper
一.下载并解压cd/home/softwarewgethttps://mirrors.tuna.tsinghua.edu.cn/apache/zookeeper/zookeeper-3.6.3/apache-zookeeper-3.6.3-bin.tar.gz--no-check-certificatetar-xvfapache-zookeeper-3.6.3-bin.tar.gz-C/home二
只是甲
·
2023-12-25 11:04
Spark 学习笔记——001【spark-mysql+spark-hive】
/spark-sql--masterlocal[4]--jars/home/
hadoop
/software/mysql-connector-java-5.1.27-bin.jar\--driver-class-path
冰冷热带鱼
·
2023-12-25 11:01
spark
spark
hive
mysql
数据处理演进:EtLT崛起,ELT正在告别历史舞台
虽然
Hadoop
时代主要依赖ELT(Extract、Load、Transform)方法,但实时数据仓库和数据湖的兴起使得ELT变得过时。EtLT已成为将数据实时加载到数据湖和实时数据仓库的标准架构。
涤生大数据
·
2023-12-25 10:00
扯淡分享/职业职场/交流
大数据
Hadoop
开发环境搭建
0、修改hostname1)修改/etc/hosts:192.168.184.130luozheng.bigdata2)修改/etc/hostnameluozheng.bigdata3)添加或是修改/etc/sysconfig/network#CreatedbyanacondaNETWORKING=yesHOSTNAME=luozheng.bigdata重启查看是否修改OKimage.png4)修
紫苓
·
2023-12-25 08:36
安装
Hadoop
3.3.5
Hadoop
架构设计论述kafka依赖Zookeeper管理自身集群(Broker、Offset、Producer、Consumer等),所以先要安装Zookeeper。
IT WorryFree
·
2023-12-25 06:03
hadoop
大数据
分布式
基于
Hadoop
大数据的物资数据可视化分析系统
大家可以帮忙点赞、收藏、关注、评论啦精彩专栏推荐订阅:在下方专栏JAVA实战项目文章目录JAVA实战项目一、项目介绍二、开发环境三、项目展示-基于
Hadoop
大数据的物资数据可视化分析系统四、代码展示五
晨曦编程
·
2023-12-25 05:11
python实战项目
大数据
hadoop
分布式
1024程序员节
spark
课程设计
python
Windows上运行第一个wordCount的时候报错Exception in thread “main“ 0: No such file or directory
水善利万物而不争,处众人之所恶,故几于道文章目录完整报错如下:解决方案:原因分析:完整报错如下:2023-12-2210:51:50,402WARN[org.apache.
hadoop
.metrics2
阿年、嗯啊
·
2023-12-25 00:03
Hadoop
MapReduce
WordCount
找不到文件或目录
YARN
Hadoop
2.0 区别
Hadoop
2.0与
HAdoop
1.0的区别:
Hadoop
1.0主要由HDFS和MapReduce两个系统够长,但在
Hadoop
2.0中主要由
Hadoop
Common、HDFS、
Hadoop
YARN和
Hadoop
MapReduce2.0
omygodvv
·
2023-12-24 23:01
java
Java技术专题-Lombok插件开发实践必知必会操作!
前言在目前众多编程语言中,Java语言的表现还是抢眼,不论是企业级服务端开发,还是Andorid客户端开发,都是作为开发语言的首选,甚至在大数据开发领域,Java语言也能占有一席之地,如
Hadoop
,Spark
洛神灬殇
·
2023-12-24 23:17
大数据学习
笔记——数据仓库hive重要的总结
1、外部表和内部表Hive表分为两类,即内部表和外部表。所谓内部表,即Hive管理的表,Hive内部表的管理既包含逻辑以及语法上的,也包含实际物理意义上的,即创建Hive内部表时,数据将真实存在于表所在的目录内,删除内部表时,物理数据和文件也一并删除。外部表(externaltable)则不然,其管理仅仅是在逻辑和语法意义上的,即新建表仅仅是指向一个外部目录而已。同样,删除时也并不物理删除外部目录
新宿一次狼
·
2023-12-24 23:27
大数据
大数据
【
Hadoop
学习笔记】(二)——Hive的原理及使用
一、Hive概述Hive是一个在
Hadoop
中用来处理结构化数据的数据仓库基础工具。
wanger61
·
2023-12-24 23:25
大数据开发
hadoop
hive
大数据
四、
Hadoop
学习笔记————各种工具用法
hive基本hql语法Sqoop(发音:skup)是一款开源的工具,主要用于在
Hadoop
(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如
weixin_30528371
·
2023-12-24 23:25
大数据
数据库
Hive学习笔记(1)——Hive原理初探
文章目录前言一、hive的特点二、hive体系架构及基本原理三、Hive的存储四、总结前言相信大家通过学习MapReduce,已经认识到
hadoop
利用多台廉价机器集群进行并行计算的优势,了解了HDFS
Zhou.Y.M
·
2023-12-24 23:55
Hadoop
hive
hadoop
大数据
mapreduce
Hadoop
基础学习十一(hive语法)
文章目录1.map阶段2.reduce阶段3.where2.join3.groupby4.orderby5.sortby6.if(判断条件,成立的返回值,否则的返回值)7.casewhenxxthenyyelsezzend8、函数1)split2)concat_ws3)datediff4)concat5)向下取整函数floor6)日期增加函数date_add7)类型转换函数cast8)explod
一只小呆呆
·
2023-12-24 23:55
Hadoop
字符串
hive
大数据
hadoop
【Hive笔记】1——Hive入门
1.什么是Hivehive是由Facebook开源用于解决海量结构化日志的数据统计Hive是基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供sql查询功能。
sdut菜鸟
·
2023-12-24 23:55
hive
hive
hadoop
大数据
Hadoop
学习笔记(17)Hive的数据类型和文件编码
一、Hive的常用内部命令1、有好几种方式可以与Hive进行交互。此处主要是命令行界面(CLI)。2、$HIVE_HOME/bin目录下包含了可以执行各种各样Hive服务的可执行文件,包括hive命令行界面(CLI是使用Hive的最常用方式)。[admin@master~]$cdapache-hive-1.2.2-bin/bin[admin@masterbin]$lsbeelineexthiveh
柏冉看世界
·
2023-12-24 23:24
hadoop
大数据从入门到精通(超详细版)之Hive的分区表,带你理解Hive当中的高阶玩法!!!
各位小伙伴,恭喜大家学习到这里,不知道关于大数据前面的知识遗忘程度怎么样了,又或者是对大数据后面的知识是否感兴趣,本文是《大数据从入门到精通(超详细版)》的一部分,小伙伴们如果对此感谢兴趣的话,推荐大家按照
大数据学习
路径开始学习哦
木 木 水.
·
2023-12-24 23:52
大数据从入门到精通(超详细版)
大数据
hive
hadoop
Flink知识点
Flink1.简单介绍一下Flink2.Flink的运行必须依赖
Hadoop
组件吗3.Flink集群运行时角色4.Flink相比SparkStreaming的区别4.1、什么是两阶段提交协议?
芝麻仗剑走天涯
·
2023-12-24 22:26
大数据
flink
Apache Spark简介与历史发展
与传统的大数据处理框架相比,Spark具有很多优势,其中包括:高性能Spark通过内存计算来提高性能,比
Hadoop
MapR
晓之以理的喵~~
·
2023-12-24 22:55
Spark
apache
spark
大数据
阿里巴巴内部:全技术栈PPT分享(架构篇+算法篇+大数据)
大数据:Spark、
Hadoop
添加图片注释,不
写代码的珏秒秒
·
2023-12-24 22:48
架构
大数据
hadoop
集群坏块处理
hadoop
之hdfs数据块修复方法:1、手动修复#检查集群的健康状态hdfsfsck/#修复指定的hdfs数据块。也就是关闭打开的文件。
运维仙人
·
2023-12-24 21:39
hadoop
eclipse
大数据
docker搭建
hadoop
集群、hbase、postgresql
docker搭建
hadoop
集群、hbase、postgresql镜像包内容:1、安装包下载:2、创建镜像:dockerbuild-t
hadoop
.3、查看镜像:dockerimages4、docker
Run不动了
·
2023-12-24 21:38
部署安装
docker
hadoop
centos
hbase
Linux 查看当前目录及子目录文件及文件夹占用存储大小
/
hadoop
-bin/data395M./had
承诺一时的华丽
·
2023-12-24 21:48
3.使用xshell进行配置
Hadoop
systemctlstopfirewalld.service关闭防火墙的开机自启systemctldisablefirewalld.service2.新建文件夹(放置安装好的文件)mkdir-p/opt/apps/opt/3.解压文件输入命令解压java和
Hadoop
tar-zxvf
唐-import-某人
·
2023-12-24 20:01
大数据平台搭建
Linux环境安装JDK
[root@
hadoop
100~]#rpm-qa|grep-ijava|xargs-n1rpm-e--nodeps命令说明:rpm-qa:查询所安装的所有rpm软件包grep-i:忽略大小写xargs-n1
程序员储物箱
·
2023-12-24 19:27
安装教程
linux
java
运维
【
Hadoop
】HDFS shell操作与管理工具
HDFSshell操作HDFS管理工具dfsadminfsck均衡器HDFSshell操作HDFS是存取数据的分布式文件系统,对HDFS的操作就是文件系统的基本操作,如文件的创建、修改、删除、修改权限,目录的创建、删除、重命名等。对HDFS的操作命令类似于Linux的shell对文件的操作,如ls、mkdir、rm等。所有的FSshell命令使用URI路径作为参数,URI格式是scheme://a
不怕娜
·
2023-12-24 18:41
hadoop
hdfs
npm
【
Hadoop
】YARN简介(YARN产生的技术需求/YARN的基本架构)
YARN产生的技术需求YARN的基本架构ResourceManagerNodeManagerApplicationMasterContainerHDFS与YARNYARN产生的技术需求YARN是
Hadoop
v2.0
不怕娜
·
2023-12-24 18:41
hadoop
架构
大数据
【
Hadoop
】 YARN 运行过程/YARN设计目标
YARN运行过程剖析YARN设计目标YARN运行过程剖析一个Job在YARN中的处理过程:客户端向RM提交一个job,进入RM中的调度器队列以供调度RM中的AppManager与NM协商协商好一个容器,以启动一个AppMaster实例AppMaster启动之后向RM注册并根据Job的task情况来请求容器NM启动容器运行task,运行过程中向AppMaster回报进度状态信息,同时NM也会定时地向
不怕娜
·
2023-12-24 18:41
hadoop
大数据
分布式
【
Hadoop
】Zookeeper是什么?怎么理解它的工作机制?
Zookeeper是什么Zookeeper工作机制Zookeeper是什么Zookeeper是一个开源的分布式的,为别的分布式矿建提供协调服务的Apache项目。分布式简单地理解就是多台机器共同完成一个任务。Zookeeper工作机制从设计模式的角度来理解,是一个基于观察者模式设计的分布式服务管理框架。它扶着存储和管理大家都关心的数据,然后接受观察者的注册。一旦这些数据的状态发生变化,Zookee
不怕娜
·
2023-12-24 18:11
hadoop
zookeeper
大数据
【
Hadoop
】HDFS简介——是什么/优缺点/适用场景
HDFS是什么HDFS的优点/特性HDFS适用场景HDFS的缺点与不足HDFS不适用场景HDFS是什么源自Google的GFS论文Google于2003年10月发表HDFS是GFS的一个克隆版HDFS(
Hadoop
DistributedFileSystem
不怕娜
·
2023-12-24 18:11
hadoop
hdfs
大数据
hive tez出现java堆内存溢出进行调优
运行hive任务的时候出现了错误,日志如下:ERROR:FAILED:ExecutionError,returncode2fromorg.apache.
hadoop
.hive.ql.exec.tez.TezTask.Vertexfailed
旺旺_865f
·
2023-12-24 17:36
【Hive_04】分区分桶表以及文件格式
1、分区表1.1分区表基本语法(1)创建分区表(2)分区表读写数据(3)分区表基本操作1.2二级分区1.3动态分区2、分桶表2.1分桶表的基本语法2.2分桶排序表3、文件格式与压缩3.1
Hadoop
压缩概述
温欣2030
·
2023-12-24 16:41
hive
hadoop
数据仓库
大数据开发都要学习什么?什么是大数据平台?
大数据平台知识:是大数据开发的基础,在学习期间,往往以搭建
Hadoop
、Spark平台为主,一方面
Hadoop
对机器的硬件要求不高,另一方面Hadoo
金光闪闪耶
·
2023-12-24 14:49
WARNING:
HADOOP
_SECURE_DN_USER has been replaced by HDFS_DATANODE_SECURE_USER.
Hadoop
启动时警告,但不影响使用,强迫症的我还是决定寻找解决办法WARNING:
HADOOP
_SECURE_DN_USERhasbeenreplacedbyHDFS_DATANODE_SECURE_USER.Usingvalueof
HADOOP
_SECURE_DN_USER
玖玖1704
·
2023-12-24 12:59
hadoop
hdfs
大数据
hdfs.DataStreamer: Exception in createBlockOutputStream XXXXX
java.io.IOException:Goterror,status=ERROR,statusmessage,ackwithfirstBadLinkas192.168.100.13:9866atorg.apache.
hadoop
.hdfs.protocol.datatransfer.DataTransferProtoUtil.checkBlockOpStatus
玖玖1704
·
2023-12-24 12:28
hdfs
hadoop
大数据
【
Hadoop
篇08】
Hadoop
数据压缩
简洁而不简单
Hadoop
数据压缩数据压缩优点和缺点压缩技术能够有效减少底层存储系统(HDFS)读写字节数。压缩提高了网络带宽和磁盘空间的效率。
focusbigdata
·
2023-12-24 10:00
《PySpark大数据分析实战》-04.了解Spark
对大数据技术栈
Hadoop
、Hive、Spark、Kafka等有深入研究,对Data
wux_labs
·
2023-12-24 10:32
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
《PySpark大数据分析实战》-06.安装环境准备
对大数据技术栈
Hadoop
、Hive、Spark、Kafka等有深入研究,对Data
wux_labs
·
2023-12-24 10:32
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
《PySpark大数据分析实战》-17.云服务模式Databricks介绍运行作业
对大数据技术栈
Hadoop
、Hive、Spark、Kafka等有深入研究,对Data
wux_labs
·
2023-12-24 10:32
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
《PySpark大数据分析实战》-02.了解
Hadoop
对大数据技术栈
Hadoop
、Hive、Spark、Kafka等有深入研究,对Data
wux_labs
·
2023-12-24 10:02
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
上一页
28
29
30
31
32
33
34
35
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他