E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
研磨hadoop
Hive----基本概念
2、Hive是基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
Hi杯酒故人
·
2023-12-02 21:21
HBase安装配置:一键自动安装配置
/bin/bash#安装之前确保安装目录有写入权限,若没有,自行增加#安装版本zk_version="2.4.8"#安装目录zk_installDir="/opt/module"install_
hadoop
大数据魔法师
·
2023-12-02 20:21
大数据
hbase
数据库
大数据
Hadoop
进阶学习---MapReduce分布式计算架构
1.单词统计流程(文字简单描述)已知文件内容:
hadoop
hive
hadoop
sparkhiveflinkhivelinuxhivemysql计算每个单词出现的次数2.MR底层计算原理[重点]MAP阶段第一阶段是把输入目录下文件按照一定的标准逐个进行逻辑切片
Yan_bigdata
·
2023-12-02 19:30
hadoop
学习
mapreduce
Hadoop
架构---HDFS补充知识点---三个模式/机制
1.安全模式在安全模式下不允许HDFS客户端进行任何修改文件的操作,包括上传文件,删除文件等操作。#查看安全模式状态:[root@node1/]#hdfsdfsadmin-safemodegetSafemodeisOFF#开启安全模式:[root@node1/]#hdfsdfsadmin-safemodeenterSafemodeisON#退出安全模式:[root@node1/]#hdfsdfsa
Yan_bigdata
·
2023-12-02 19:29
hadoop
架构
hdfs
学习
Hive环境准备[重点学习]
1.前提启动
hadoop
集群
hadoop
在统一虚拟机中已经配置了环境变量启动hdfs和yarn集群命令:start-all.sh[root@node1/]#start-all.sh启动mr历史服务命令:
Yan_bigdata
·
2023-12-02 19:59
hive
学习
hadoop
Hadoop
进阶学习---HDFS分布式文件存储系统
1.hdfs分布式文件存储的特点分布式存储:一次写入,多次读取HDFS文件系统可存储超大文件,时效性较差.HDFS基友硬件故障检测和自动快速恢复功能.HDFS为数据存储提供很强的扩展能力.HDFS存储一般为一次写入,多次读取,只支持追加写入,不支持随机修改.HDFS可以在普通廉价的机器上运行.2.HDFS架构1、Client发请求就是客户端。文件切分。文件上传HDFS的时候,Client将文件切分
Yan_bigdata
·
2023-12-02 19:59
hadoop
分布式
学习
hdfs
Hadoop
进阶学习---Yarn资源调度架构
1.Yarn执行MR流程1.客户端提交一个MR程序给ResourceManager(校验请求是否合法…)2.如果请求合法,ResourceManager随机选择一个NodeManager用于生成appmaster(应用程序控制者,每个应用程序都单独有一个appmaster)3.appmaster会主动向ResourceManager的应用管理器(applicationmanager)注册自己,告知
Yan_bigdata
·
2023-12-02 19:28
yarn
hadoop
大数据
架构
学习
Hadoop
入门|
Hadoop
简介及安装
一、大数据简介1.大数据的定义⼤数据是指⽆法在⼀定时间范围内⽤常规软件⼯具进⾏捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策⼒、洞察发现⼒和流程优化能⼒的海量、⾼增⻓率和多样化的信息资产。2.大数据的特点⼤数据的特点可以⽤IBM曾经提出的“5V”来描述,如下:大量采集、存储和计算的数据量都⾮常⼤。大数据领域数据量基本上以PB为最小单位,而PB级数据量有多⼤?是怎样的⼀个概念?假如⼿
大数据学习宝典
·
2023-12-02 19:22
Hadoop
hadoop
大数据
推荐系统lambda架构学习笔记之
Hadoop
、HDFS、YARN&MapReduce(三)
Hadoop
Hadoop
介绍
Hadoop
名字的由来作者:Dougcutting
Hadoop
项目作者的孩子给一个棕黄色的大象样子的填充玩具的命名
Hadoop
的概念:Apache™
Hadoop
®是一个开源的
吃一口桃酥
·
2023-12-02 19:50
笔记
hadoop
hdfs
mapreduce
Hadoop
之MapReduce学习笔记(一)
主要内容:mapreduce整体工作机制介绍;wordcont的编写(map逻辑和reduce逻辑)与提交集群运行;调度平台yarn的快速理解以及yarn集群的安装与启动。1、mapreduce整体工作机制介绍回顾第HDFS第一天单词统计实例(HDFS版wordcount):统计HDFS的/wordcount/input/a.txt文件中的每个单词出现的次数——wordcount但是,进一步思考:
weixin_30752377
·
2023-12-02 19:50
大数据
操作系统
java
大数据技术学习笔记之hive框架基础3-sqoop工具的使用及具体业务分析
一、CDH版本的介绍及环境部署-》
Hadoop
的三大发行版本-》Apache
Hadoop
-》cloudera
Hadoop
:CDH-》Hortonworks:HDP-》选用CDH版本的好处-》解决每个框架之间的兼容性问题
黄剑锋1996
·
2023-12-02 19:50
技术学习笔记
hadoop
学习笔记——NO.4_
HADOOP
集群搭建与使用初步
HADOOP
集群搭建与使用初步
HADOOP
集群搭建集群简介
HADOOP
集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起HDFS集群:负责海量数据的存储,集群中的角色主要有
蔡茂昌
·
2023-12-02 19:20
hadoop学习笔记
Hadoop
Core - HDFS, MapReduce, YARN
Hadoop
Core-HDFS,MapReduce,YARN参加拉勾教育大数据训练营课程笔记引用:《
Hadoop
-TheDefinitiveGuide,4thEdition》,《拉勾导师笔记》简介大数据特性
DataPeak
·
2023-12-02 19:13
大数据
hadoop
big
data
java
hadoop
rpc基础
同其他RPC框架一样,
Hadoop
分为四个部分:序列化层:支持多种框架实现序列化与反序列化函数调用层:利用java反射与动态代理实现网络传输层:基于TCP/IP的Socket机制服务的处理框架:基于Reactor
安静平和
·
2023-12-02 17:09
Hadoop
hadoop
rpc
基础
HDFS JAVA API的应用
首先把
hadoop
服务起来1.
星星失眠️
·
2023-12-02 16:28
大数据开发技术
hdfs
java
hadoop
大数据:
Hadoop
刷题
大数据:
Hadoop
刷题2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,像很多金融企业
冰露可乐
·
2023-12-02 12:02
国考
数据挖掘
软件工程
大数据
hadoop
分布式
数据库
网警
尚硅谷
hadoop
3.x课程部分资料文件下载,jdk,
hadoop
jar包
jdk文件百度云下载:链接:https://pan.baidu.com/s/1MCiGRzOZY8rAFpRJwA3tdw提取码:kphl
hadoop
的jar包:最新版官网链接:Indexof/dist
大数据SQLboy
·
2023-12-02 12:59
hadoop
开发语言
hadoop
hbase thrift2 jar包冲突导致启动失败问题排查记录
hbase-root-thrift2-hdfs-test07.yingzi.com.out异常日志:Exceptioninthread"main"java.lang.AbstractMethodError:org.apache.
hadoop
.metrics2
Java小田
·
2023-12-02 12:53
hbase
大数据
jar冲突
java: 通过URL读取
hadoop
HDFS
packagetju;importorg.apache.
hadoop
.fs.FsUrlStreamHandlerFactory;importorg.apache.
hadoop
.io.IOUtils;importjava.io.InputStream
amadeus_liu2
·
2023-12-02 11:28
Hadoop
hadoop
java
hdfs
hadoop
:通过Configuration读取hdfs
packagetju;importorg.apache.
hadoop
.conf.Configuration;importorg.apache.
hadoop
.fs.FSDataInputStream;importorg.apache.
hadoop
.fs.FSDataOutputStream
amadeus_liu2
·
2023-12-02 11:28
Hadoop
hadoop
hdfs
大数据
hadoop
-3.3.5安装过程
准备资源三台虚拟机:1)准备3台服务器(关闭防火墙、静态IP、主机名称)2)安装JDK3)配置环境变量4)安装
Hadoop
5)配置环境变量安装虚拟机(略)--1台即可,执行完毕下述内容,再克隆2台。
Snower_2022
·
2023-12-02 11:57
hadoop
hadoop
大数据
分布式
SparkSQL-MR、RDD、DataFrame三个编程模型演进
2011的时候,Hive可以说是SQLOn
Hadoop
的唯一选择,负责将SQL解析成MR任务运行在大数据上,实现交互
扎克begod
·
2023-12-02 10:12
Spark
spark
SparkSQL
Linux查看进程的pid和port
[root@
Hadoop
001~]#ps-ef|grepsshroot14831007:29?00:00:00/usr/sbin/sshdroot18481483007:31?
吃货大米饭
·
2023-12-02 09:42
程序猿 集群与分布式
集群与分布式1、什么是ZookeeperZoKeperp是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby的一个开源的实现,是
Hadoop
和Hbase的重要组件。
落魄的佩奇
·
2023-12-02 09:33
面试题
C#
c#
Hadoop
--
hadoop
介绍
Hadoop
hadoop
介绍
hadoop
核心组件
hadoop
特性优点
hadoop
发展
hadoop
介绍
hadoop
底层是Java语言实现是Apache软件基金会的一款开源软件允许用户使用简单的编程模型实现跨机器集群对海量数据进行分布式计算处理
小陈菜奈-
·
2023-12-02 07:07
Hadoop
hadoop
大数据
Hadoop
-- UserLogin Statistical data
userlogin.javapackageuserlogin;importorg.apache.
hadoop
.conf.Configuration;importorg.apache.
hadoop
.fs.Path
轻览月
·
2023-12-02 05:28
hadoop
大数据
分布式
学习方法
Django-Redis
NoSQL:(不支持sql语句)RedisMongoDBHbase
hadoop
Cassandra
hadoop
key-value数据库(非关系性数据库)redis优势性能高,读取速度快,存在内存中Redis
*伤^情*
·
2023-12-02 05:40
django
redis
数据库
hadoop
的几个接口
8088接口:MapReduce50070接口:HDFS19888接口:jobhistoryseverjob历史服务器端口9000:namenode50090:secondarynamenode
Stephen6Yang
·
2023-12-02 04:03
hadoop
hadoop
最小化安装 Neokylin7.0 用于搭建
Hadoop
集群
文章目录环境搭建背景虚拟机创建和环境配置安装过程注意事项虚拟机设置软件选择KOUMP系统分区网络和主机名打开以太网,并记录信息配置IPv4修改主机名创建用户
hadoop
完全分布式搭建-CSDN博客环境搭建背景为什么不从
撕得失败的标签
·
2023-12-02 02:28
Hadoop
hadoop
服务器
大数据
虚拟机
Neokylin7.0
中标麒麟
Hadoop
2.7.2 安装配置
王某某2016年9月官网地址:http://
hadoop
.apache.org/各个版本文档地址:http://
hadoop
.apache.org/docs/1、环境版本信息CentOSLinuxrelease7.2.1511
冬瓜baba的笔记
·
2023-12-02 02:37
4.
hadoop
集群扩容与hive异常处理
异常处理当我们使用sqoop同步数据时候,出现了异常。Errorwritingfile‘/tmp/MYYEBa32’(Errcode:28-NospaceleftondeviceINFOmapreduce.Job:Theurltotrackthejob:http://node3:8088/proxy/application_1681182527108_0002/INFOmapreduce.Job:
想成为数据分析师的开发工程师
·
2023-12-02 00:10
Hadoop大数据分析项目
hadoop
hive
大数据
数据分析
2.Spark运行模式
Yarn
Hadoop
生态圈里面的一个资源调度框架,Spark也是可以基于Yarn来计算的。Windows模式云服务模式(运行在云平台上)Kubernetes(K8S)容器模式S
想成为数据分析师的开发工程师
·
2023-12-02 00:10
Spark框架
spark
大数据
分布式
在Linux下配置
Hadoop
出现localhost: Error: JAVA_HOME is not set and could not be found.
Startingnamenodeson[]localhost:Error:JAVA_HOMEisnotsetandcouldnotbefound.localhost:Error:JAVA_HOMEisnotsetandcouldnotbefound....startingyarndaemonsstartingresourcemanager,loggingto/home/lihanhui/open-
Summer_1981
·
2023-12-02 00:03
主要分布式文件系统架构对比分析:GFS vs. Tectonic vs. JuiceFS
GFS开创了商品硬件的使用,并影响了大数据领域的
Hadoop
分布式文件系统(HDFS)等系统。Tectoni
沃趣数据库管理平台
·
2023-12-02 00:34
技术专栏
架构
分布式
云原生
数据库
大数据开发:Hbase集群安装配置入门
作为
Hadoop
大数据生态的重要组件,Hbase的学习是非常重要的一块,Hbase作为
Hadoop
生态原生支持的数据库,基于列式存储,能够承载规模庞大的数据存储需求任务。
成都加米谷大数据
·
2023-12-01 22:39
[
Hadoop
]在CentOS7上使用Docker部署
Hadoop
[
Hadoop
]在CentOS7上使用Docker部署
Hadoop
〇、先决条件1、Linux操作系统2、阅读本文的注意事项3、本文相关连接4、本文说明5、用户设置Command1:添加用户到组6、图解安装步骤一
DannisTang
·
2023-12-01 19:40
HADOOP
大数据基础设施搭建 - Sqoop
修改配置文件五、拷贝MySQL驱动六、测试能否连接数据库七、importMySQLtoHDFS一、上传压缩包官网:http://mirrors.hust.edu.cn/apache/sqoop/1.4.6/简介:
Hadoop
m0_46218511
·
2023-12-01 19:52
大数据基础设施搭建
大数据
sqoop
Java核心知识点整理大全25-笔记
目录25.
Hadoop
25.1.1.概念25.1.2.HDFS25.1.2.1.Client25.1.2.2.NameNode25.1.2.3.SecondaryNameNode25.1.2.4.DataNode25.1.3
希斯奎
·
2023-12-01 17:31
Java
java
开发语言
笔记
Spark on hdp yarn cluster踩坑记
集群环境ambari:HDP-2.6.5.0spark-2.1.0-bin-
hadoop
2.7踩坑一:NoClassDefFoundError:org/glassfish/jersey/server/spi
spark大数据玩家
·
2023-12-01 16:19
spark
spark
hadoop
ClassNotFoundException: org.apache.hive.spark.client.Job
hive使用的是3.13版本,spark是3.3.3支持
hadoop
3.xhive将engine从mr改成spark,通过beeline执行insert、delete时一直报错,sparkTaskrpc
青春不流名
·
2023-12-01 16:43
hadoop
玩转大数据:3-
Hadoop
家族的力量与挑战
引言
Hadoop
作为一个强大的大数据处理框架,以其分布式计算和存储能力在业界备受关注。然而,
Hadoop
在应用场景、适用范围、社区支持以及后续持续发展等方面也面临着一些挑战。
沛沛老爹
·
2023-12-01 13:56
数字化转型
BigData
人工智能
大数据
hadoop
分布式
在HBase中创建‘sutdent’表
启动
hadoop
:start-all.sh启动hbase:start-hbase.sh启动hbaseshell客户端,进入创表:1.在HBase中创建‘sutdent’表,如图所示:创建命名空间,建立一个
墨染盛夏呀
·
2023-12-01 12:10
网络
算法
hadoop
完全分布式搭建
文章目录集群部署规划服务器准备Mobaxterm远程登录实验前准备安装软件工具关闭防火墙安装JDK和
Hadoop
创建软件包目录解压软件包配置环境变量集群搭建先创建HDFS工作目录和LOG目录配置集群配置环境配置
撕得失败的标签
·
2023-12-01 12:24
Hadoop
分布式
hadoop
大数据
搭建部署
Hadoop
2.x和3.x的区别
文章目录Java最小支持版本常用的端口号配置文件Classpath隔离NodeManager重连Java最小支持版本
Hadoop
2.x最低要求Java7。
撕得失败的标签
·
2023-12-01 12:54
Hadoop
hadoop
大数据
Java
Hadoop
运行模式及目录结构
文章目录
Hadoop
运行模式本地模式伪分布式模式完全分布式模式
Hadoop
目录结构配置文件说明默认配置文件:自定义配置文件:
Hadoop
运行模式本地模式这种模式在一台单机上运行,没有分布式文件系统,而是直接读写本地操作系统的文件系统
撕得失败的标签
·
2023-12-01 12:23
Hadoop
hadoop
大数据
分布式
搭建
Hadoop
集群过程中常见错误的解决方案
cannotcreatdirectory或cannotcreatfile类型如下报错信息:cannotcreatedirectoryPermissiondenied如果使用的是user用户,多数情况下是因为文件权限问题,
hadoop
3.3.1
撕得失败的标签
·
2023-12-01 12:18
Hadoop
hadoop
大数据
Java
集群
CentOS 6.10 执行yum命令报错,尝试各种办法未解决
在CentOS6.10执行yum命令报错,尝试各种办法最终解决错误如下:[zjl@
hadoop
102~]$sudoyumupdate已加载插件:fastestmirror,refresh-packagekit
yisuoyanyv
·
2023-12-01 11:56
linux
yum
centos
shell
她在上海开了一家买手店,被很多人说是梦想中的小店。
开一间咖啡馆,三五种咖啡配上几种小甜点,豆子都是自己慢慢
研磨
出来的。开一家服装店,里面都是自己喜欢的衣服,有一个超大的试衣间可以在里面尽情的试衣服,也会给每个来的客人推荐合适的衣服和她们成为好朋友。
漫选
·
2023-12-01 11:23
Hive参数详解
1.SerDesandI/Ohive.input.format默认org.apache.
hadoop
.hive.ql.io.CombineHiveInputFormat默认的inputformat。
Chin_qf
·
2023-12-01 10:12
Hadoop
运行原理之shuffle
hadoop
的核心思想是MapReduce,但shuffle又是MapReduce的核心。shuffle的主要工作是从Map结束到Reduce开始之间的过程。
Summer_1981
·
2023-12-01 10:00
上一页
41
42
43
44
45
46
47
48
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他