E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop学习积累
Hadoop
学习--MapReduce流程详解
详细流程图(from:尚硅谷)大致流程注:在mapper类被调用之前的活动都是由InputFormat的类型来决定具体的执行策略的!1.InputSplit切片阶段InputSplit是MapReduce对文件进行处理和运算的输入单位,只是一个逻辑概念,每个InputSplit并没有对文件实际的切割,只是记录了要处理的数据的位置(包括文件的path和hosts)和长度(由start和length决
是渣渣呀
·
2023-11-14 21:34
大数据
大数据
java
hadoop
【
Hadoop
】MapReduce详解
个人主页——开着拖拉机回家_大数据运维-CSDN博客✨感谢点赞和关注,每天进步一点点!加油!目录一、MapReduce概述1.1MapReduce介绍1.2MapReduce定义1.3MapReduce优缺点1.2.1.优点1.2.2.缺点1.4MapReduce框架结构二、WordCount案例三、MapReduce的运行机制详解3.1MapTask工作机制3.2ReduceTask工作机制3.
阿龙先生啊
·
2023-11-14 21:56
#
【====
HDFS&YARN
====】
hadoop
mapreduce
MapTask
ReduceTask
WordCount
Shuffle过程
MapReduce运行机制
hadoop
大数据集群环境配置 配置
hadoop
配置文件
hadoop
(七)
1.虚拟机的三台机器分别以hdfs存储,mapreduce计算,yarn调度三个方面进行集群配置
hadoop
版本3.3.4官网:
Hadoop
–Apache
Hadoop
3.3.6jdk1.8三台机器尾号为
不努力就种地~
·
2023-11-14 21:42
大数据
大数据
hadoop
分布式
hadoop
如何关闭集群
hadoop
使用脚本关闭集群
hadoop
(八)
1.
hadoop
22,
hadoop
23,
hadoop
24三台机器2.namenode所在
hadoop
22关闭hdfs:#找到/etc/
hadoop
位置cd/opt/module/
hadoop
-3.3.4
不努力就种地~
·
2023-11-14 21:39
大数据
hadoop
java
eclipse
Postgresql 查看表数据存储
可参看,http://blog.chinaunix.net/uid-24774106-id-3757916.htmlhttp://blog.csdn.net/james
hadoop
/article/details
SmallBirds911
·
2023-11-14 19:03
postgres
SQL
postgresql
数据存储
数据库
sparkSQL读取Excel表格
转自:https://www.cnblogs.com/shenyuchong/p/10291604.html编码初始化SparkSessionstatic{System.setProperty("
hadoop
.home.dir
风是外衣衣衣
·
2023-11-14 18:52
scala
小知识点
技术
sparkSQL读取excel
excel
Spark读取excle、xlsx数据(Session读取)
读取xlsx版本:IntelliJIDEACommunityEdition2019.2.4apache-maven-3.6.2Spark2.0.2
hadoop
2.6_Win_x64-master话不多说
阿朱__
·
2023-11-14 18:51
spark
scala
Spark
Scala
hadoop
安装网址
Hadoop
是什么1)
Hadoop
是一个有Apache基金会所开发的分布式系统基础架构。2)主要解决海量数据的存储和海量数据的分析计算问题。
北辰Charih
·
2023-11-14 17:24
hadoop
大数据
深入理解Kafka3.6.0的核心概念,搭建与使用
Linkedin公司开发,是一个分布式、支持分区的(partition)、多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于
hadoop
Mumunu-
·
2023-11-14 16:44
ELK
hadoop
kafka
hadoop
kafka
ELK
[WSL] 安装hive3.1.2成功后, 使用datagrip连接失败
org.apache.
hadoop
.ipc.RemoteException:User:xxxisnotallowedtoimpersonateanonymous下载driver-hive-jdbc-3.1.2
言之。
·
2023-11-14 15:56
java
ide
WSL
hive
大数据环境通信不稳定
hbaseregionserver无法启动一例尤其是装hbase的时候指定了回环地址3,尤其是删除引起的全表扫描会容易出现业务服务日志Causedby:java.net.ConnectException:Callto
hadoop
01
yuhui66666688gfbfdy
·
2023-11-14 12:10
geomesa
hadoop
大数据环境配置 rsync命令
hadoop
(三)
1.rsync:意思remotesync.rsync被用在UNIX/Linux执行备份操作操作.rsync用来从一个位置到另一个位置高效地同步文件和文件夹.rsync可以实现在同一台机器的不同文件直接备份,也可以跨服务器备份.2.rsync特点:速度快安全:rsync可以使用ssh协议加密传输占用带宽少:rsync在发送时会压缩数据块,接收后再解压缩数据块.所以和其他文件传输协议比起来,rsync
不努力就种地~
·
2023-11-14 10:23
大数据
hadoop
大数据
分布式
hadoop
大数据环境配置 ssh免密登录 centos配置免密登录
hadoop
(四)
1.找到.ssh文件夹cd~2.生成私钥公钥命令:ssh-keygen-trsa3.发送到需要免密机器:#
hadoop
23是我做了配置。
不努力就种地~
·
2023-11-14 10:39
大数据
大数据
hadoop
ssh
基于
hadoop
+hive的图书大数据分析平台
【24届大数据分析毕设之基于
hadoop
+hive的图书大数据分析平台】https://www.bilibili.com/video/BV1f8411r7wJ/?
源码空间站11
·
2023-11-14 10:21
hadoop
hive
数据分析
毕设分享 基于
hadoop
大数据教育可视化系统(源码+论文)
0简介今天学长向大家介绍一个机器视觉的毕设项目毕设分享基于
hadoop
大数据教育可视化系统(源码+论文)项目获取:https://gitee.com/sinonfin/algorithm-sharing
毕设算法家
·
2023-11-14 10:21
大数据
hadoop
python
毕业设计
数据分析
【大数据实训】基于当当网图书信息的数据分析与可视化(八)
温馨提示:文末有CSDN平台官方提供的博主的联系方式,有偿帮忙部署基于当当网图书信息的数据分析与可视化一、实验环境(1)Linux:Ubuntu16.04(2)Python:3.5(3)
Hadoop
:3.1.3
大模型Maynor
·
2023-11-14 10:18
大数据
数据分析
数据挖掘
大数据分析案例
大数据分析案例客户:医疗保健协会(HealthcareAssociation,U.S.)解决方案目标“我们需要一个可靠、快速且经济高效的
Hadoop
解决方案来应对我们的新数据计划。
小信瑞
·
2023-11-14 08:55
数据管理
数据安全
数据存储
数据分析
数据挖掘
数据安全
数据存储
数据管理
NetApp
企业存储
Hdoop安装配置学习笔记(HDP)
一、关于HDP1.AmbariAmbari是一种基于Web的工具,支持Apache
Hadoop
集群的创建、管理和监控。
glisten0317
·
2023-11-14 08:50
运维
hadoop
Hive 实现ACID
之后可以支持对表数据的UPDATE和DELETE:具体操作如下:--环境参数设置sethive.support.concurrency=true;sethive.txn.manager=org.apache.
hadoop
.hive.ql.lockmgr.DbTxnManager
柏舟飞流
·
2023-11-14 01:44
hive
hadoop
数据仓库
大数据
一、
Hadoop
3.1.3集群搭建
一、集群规划
hadoop
01(209.2)
hadoop
02(209.3)
hadoop
03(209.4)HDFSNameNodeDataNodeDataNodeSecondaryNameNodeDataNodeYARNNodeManagerResourceManagerNodeManagerNodeManagerNameNode
Dream答案
·
2023-11-14 00:18
Hadoop
hadoop
大数据
hdfs
yarn
mapreduce
linux ssh免密登录配置
在
hadoop
集群搭建的过程中,通常会对集群服务进行群启/群停的操作,而集群中的主机执行启动命令通常需要通过ssh登录到其它主机,为了解决ssh时不输入用密码的问题,在这里研究了下ssh免密登录,操作步骤记录如下
ths512
·
2023-11-13 22:56
大数据(big
data)
ssh
服务器
linux
Linux SSH免密登录
但是大数据集群(主要指的是
Hadoop
集群,可用
Hadoop
代指)使用SSH主要不是用
necessary653
·
2023-11-13 22:52
linux
ssh
eclipse
【大数据技术】爆肝3天 7个章节 Hive 3.1.3详解
大数据技术之Hive01hive入门1.1什么是Hive1)Hive简介Hive是由Facebook开源,基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
左美美  ̄
·
2023-11-13 21:10
大数据
大数据
1.搭建
hadoop
集群步骤(1)准备工作:上传并解压
hadoop
安装包,配置环境变量,ssh免密登录(2)修改配置文件:
hadoop
-env.sh,core-site.xml,hdfs-site.xml
叫我小王
·
2023-11-13 21:06
大数据技术之Hive
文章目录大数据之Hive学习第1章Hive入门1.1什么是Hive1)Hive简介2)Hive本质1.2Hive架构原理1)用户接口:Client2)元数据:Metastore3)驱动器:Driver4)
Hadoop
夜玫瑰
·
2023-11-13 21:05
大数据
hive
hadoop
07-hive--高级部分1
2、MapReduce:
Hadoop
抛弃了Java的序列化方式,自己创建了一套序列化,implementsWritable,原因:Java序列化出来的文件太大了,包含了太多信息。
YuPangZa
·
2023-11-13 21:35
大数据
hadoop
hive
Hive建表语法和参数记录
Hive是一个基于
Hadoop
的数据仓库工具,可以将结构化数据映射到HDFS存储(建表对应在HDFS建了一个文件夹),并提供类SQL查询语言-HiveQL,Hive可以将HQL语句转换为MR任务执行。
Forge_ahead
·
2023-11-13 20:11
work_efficiency
Study
hive
hadoop
数据仓库
vmware 修改主机名称
hadoop
服务器环境配置(一)
追加映射关系:#关系ip地址名称192.168.164.20
hadoop
202.保存后,重启reboot即可
不努力就种地~
·
2023-11-13 16:45
大数据
服务器
hadoop
运维
hadoop
虚拟机配置大数据环境
hadoop
(二)
1.安装epel-release注:ExtraPackagesforEnterpriseLinux是为“红帽系”的操作系统提供额外的软件包,适用于RHEL、CentOS和ScientificLiux。相当于是一个软件仓库,大多数rpm包在官方repository中是找不到的)命令:yuminstall-yepel-release2.更新yum源yumupdate3.安装ifconfig命令:yum
不努力就种地~
·
2023-11-13 16:38
大数据
大数据
hadoop
分布式
大数据开发学习脑图+学习路线清晰的告诉你!月薪30K很轻松
想学习好大数据可以加我vx号(VIP452141)有视频资源分享一起学习第一阶段linux+搜索+
hadoop
体系Linux基础→shell编程→高并发架构→lucene,sol
juan777
·
2023-11-13 15:28
大数据开发
大数据分析
Hadoop
大数据开发
大数据分析
编程语言
程序员
Hadoop
windows下安装
hadoop
3.1.3(详细)
windows下安装
hadoop
3.1.3(详细)最近公司有个采集日志到oss的任务,需要用到hdfs的环境做个透传,因为我们的要采集的日志分布在好几十个单独的服务器其中有linux,又有windows
潘小磊
·
2023-11-13 14:01
工具
hadoop
hive里因为列名用了关键字导致建表失败
4cannotrecognizeinputnear'percent''String''COMMENT'incolumnnameorprimarykeyorforeignkey23/11/1311:52:57ERRORorg.apache.
hadoop
.hive.ql.Driver
五月天的小迷弟
·
2023-11-13 13:20
一些小坑
大数据
hive
hadoop
数据仓库
【大数据之Hive】
一、Hive基本概念Hive是基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
JMFFFFF
·
2023-11-13 12:37
hive
大数据
hadoop
大数据笔记29—
Hadoop
基础篇12(Hive特殊使用与函数)
Hive特殊使用与函数知识点01:Hive回顾知识点02:本篇目标知识点03:Hive表结构:普通表结构知识点04:Hive表结构:分区表设计知识点05:Hive表结构:分区表实现知识点06:Hive表结构:分桶表设计及实现知识点07:Hive中的Join:Join逻辑知识点08:Hive中的Join:Join实现知识点09:Select语法:orderby与sortby知识点10:Select语
了不起的我阿
·
2023-11-13 12:05
hadoop
hive
数据库
数据仓库
大数据
python
hive
【数据仓库-Hive】笔记(未完)
文章目录PART1数据仓库-PART2Hive的基本概念一.Hive简介二.Hive架构三.Hive与
Hadoop
的关系四.Hive与传统数据库对比五.Hive的安装六.Hive的交互方式PART3Hive
Mercy92
·
2023-11-13 08:45
大数据
实验5 MapReduce初级编程实践(Python实现)
二、实验平台操作系统:Ubuntu18.04(或Ubuntu16.04)
Hadoop
版本:3.2.2三、实验内容和要求1.编程实现文件合并和去重操作问题如下:对于两个输入文件,即文件A和文件B,请编写MapReduce
Z.Q.Feng
·
2023-11-13 03:52
实验报告
大数据技术与原理
apache
ubuntu
mapreduce
大数据实践(四)MapReduce编程实践(Ubuntu)
大数据实验(四)MapReduce编程实践(Ubuntu)前置工具及环境Ubuntu16.4VirtualBox
Hadoop
2.7.3jdk1.8一、MapReduce简介MapReduce是
Hadoop
cgl_dong
·
2023-11-13 03:22
Hadoop
实验三:MapReduce初级编程实践
二、实验平台操作系统:Kubuntu
Hadoop
版本:3.2.2三、实验步骤(一)编程实现文件合并和去重操作对于两个输入文件,即文件A和文件B,请编写MapReduce程序,对两个文件进行合并,并剔除其中重复的内容
余诚诚诚诚
·
2023-11-13 03:51
mapreduce
hadoop
《大数据系统与编程》MapReduce程序实现词频统计实验报告
MapReduce程序实现词频统计实验目的1)理解
Hadoop
中MapReduce模块的处理逻辑;2)熟悉MapReduce编程;实验平台操作系统:Linux工具:Eclipse或者IntellijIdea
学习使我哈皮!
·
2023-11-13 03:51
大数据
hadoop
mapreduce
hdfs
【大数据实验五】 MapReduce初级编程实践
2实验平台已经配置完成的
Hadoop
伪分布式环境。
almostspring
·
2023-11-13 03:50
软件工程本科实验
Linux操作系统
大数据
mapreduce
hadoop
实验5MapReduce初级编程实践
2.实验平台(1)操作系统:Linux(建议Ubuntu16.04或Ubuntu18.04)(2)
Hadoop
版本:3.1.33.实验步骤(一)编程实现文件合并和去重操作对于两个输入文件,即文件A和文件
小李今天工地加班
·
2023-11-13 03:48
mapreduce
hadoop
大数据
大数据技术与原理实验报告(MapReduce 初级编程实践)
MapReduce初级编程实践验环境:操作系统:Linux(建议Ubuntu16.04);
Hadoop
版本:3.2.2;(一)编程实现文件合并和去重操作对于两个输入文件,即文件A和文件B,请编写MapReduce
麦与陌生人
·
2023-11-13 03:18
大数据技术原理与应用
java
大数据
mapreduce
2023.11.13 hive数据仓库之分区表与分桶表操作,与复杂类型的运用
目录0.
hadoop
hive的文档1.一级分区表2.一级分区表练习23.创建多级分区表4.分区表操作5.分桶表6.分桶表进行排序7.分桶的原理8.hive的复杂类型9.array类型:又叫数组类型,存储同类型的单数据的集合
白白的wj
·
2023-11-13 02:01
数据仓库
hive
hadoop
Flink部署--入门
Flink安装部署standalone模式在/opt/module/Flink目录下上传flink-1.7.0-bin-
hadoop
27-scala_2.11.tgz压缩包并解压[root@node01Flink
hykDatabases
·
2023-11-12 22:32
大数据搭建集群
大数据学习
Hadoop
集群搭建(完全分布式版本)
一、准备工作三台虚拟机:master、node1、node2时间同步ntpdatentp.aliyun.com调整时区cp/usr/share/zoneinfo/Asia/Shanghai/etc/localtimejdk1.8(三台都要配置)java-version修改主机名三台分别执行vim/etc/hostname并将内容指定为对应的主机名关闭防火墙:systemctlstopfirewal
大数据CV工程师
·
2023-11-12 21:28
hadoop
分布式
linux
hive和spark-sql中 日期和时间相关函数 测试对比
测试版本:hive2.3.4spark3.1.1
hadoop
2.7.71、增加月份add_months(timestampdate,intmonths)add_months(timestampdate,
Data_IT_Farmer
·
2023-11-12 21:26
hive
hive
数据仓库
日期函数
时间函数
hadoop
完全分布式集群搭建(超详细)-大数据集群搭建
hadoop
完全分布式集群搭建本次搭建完全分布式集群用到的环境有:jdk1.8.0
hadoop
-2.7.7本次搭建集群所需环境也给大家准备了,下载链接地址:https://share.weiyun.com
beixi@
·
2023-11-12 21:56
大数据技术学习
hadoop
大数据
分布式
hdfs
搭建完全分布式
Hadoop
文章目录一、
Hadoop
集群规划二、在主节点上配置
Hadoop
(一)登录虚拟机(二)设置主机名(三)主机名与IP地址映射(四)关闭与禁用防火墙(五)配置免密登录(六)配置JDK(七)配置
Hadoop
1、
howard2005
·
2023-11-12 21:55
数据清洗和预处理
大数据离线分析
分布式
hadoop
大数据
mysql8安装和驱动jar包下载
方式一:基于docker安装下拉镜像dockerpullmysql:8.0.21启动镜像dockerrun-p3307:3306--namemysql-eMYSQL_ROOT_PASSWORD=
hadoop
-dmysql
潇潇说测试
·
2023-11-12 20:30
软件测试
软件测试工程师
自动化测试
jar
java
职场和发展
软件测试
功能测试
自动化测试
程序人生
Cannot initialize Cluster. Please check your configuration for mapreduce.framework .name and the cor
环境采用ambari2.7.1+spark2.3.1+
hadoop
3.1.1+hive3.1
汐朔
·
2023-11-12 16:47
hadoop
Spark
spark
大数据
hadoop
hive
hive3.0
上一页
53
54
55
56
57
58
59
60
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他