E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop源代码分析
大数据框架介绍
大数据学习必备三个框架
Hadoop
,Spark,Storm大数据的主要特点为数据量大(Volume),数据类别复杂(Variety),数据处理速度快(Velocity)和数据真实性高(Veracity)
mikecg
·
2023-12-29 23:06
执行
hadoop
jar 或者是yarn jar 报Exception in thread “main“ java.lang.NoClassDefFoundError:XXX
找到上传的目录,执行yarnjar或者
hadoop
jar报一下的错。报错的原因可能是:在idea打包的过程中没有相关的类,那你在打包的时候,没有把相关依赖都打进去。
爱吃肉的白熊
·
2023-12-29 22:36
笔记
hadoop
mapreduce
java
给linux(centos)操作系统设置主机名的几种方式
镜像下载、域名解析、时间同步请点击阿里云开源镜像站一、前言就是我们需要集群部署
hadoop
,Flink时,写ip地址太长了,然后大家想的就是能不能用比如:node1,node2,node3去代替IP地址
萌褚
·
2023-12-29 21:13
HDFS常用命令
1.hdfsdfs与
hadoop
fs命令的形式:hdfsdfs-linux命令这与linux中命令操作是一样的。
langzitianya
·
2023-12-29 21:15
大数据
hdfs
hadoop
大数据
HBASE的应用场景
2018/08/31HBase是如何与
Hadoop
嵌入在一起的,那么他的作用又是什么。这显然跟我原来理解的那些个数据库不太一样,就比如mango这种。现在比较关注的就是他的数据导入,是怎么样的。
VChao
·
2023-12-29 16:49
Kafka 初识
kafka是由LinkedIn公司开发的,是一个分布式、支持分区的、多副本的,基于zookeeper协调的分布式消息系统,它的最大特点就是可以实时的处理大量数据以满足各种需求场景:比如基于
Hadoop
的批处理系统
Advancer-lbh
·
2023-12-29 14:56
消息中间件
kafka
分布式
消息中间件
Spark集群- 连接
hadoop
、hive集群
目的使spark代码提交到集群运行时,能够操作hdfs、hive等保证所有spark机器都能解析
hadoop
集群的机器名称如果spark和
hadoop
部署在同样的集群,则可以省略这一步如果spark和
hadoop
heichong
·
2023-12-29 13:59
简单的 MapReduce 程序的示例代码,用于统计 HBase 中的成绩表中的单科排名和总分排名,并将结果上传到 HDFS 中。...
MapReduce程序的示例代码,用于统计HBase中的成绩表中的单科排名和总分排名,并将结果上传到HDFS中:```importjava.io.IOException;importorg.apache.
hadoop
.conf.Configuration
weixin_42601702
·
2023-12-29 10:19
hbase
hdfs
mapreduce
hadoop
大数据
利用hbase来两张表的联立,求出一个班学生的总分并把结果写到hbase(java 代码实现)
importorg.apache.
hadoop
.conf.Configuration;importorg.apache.
hadoop
.hbase.HColumnDescriptor;importorg.apache.
hadoop
.hbase.HTableDescriptor
CC072615
·
2023-12-29 10:14
hbase
java
hadoop
大数据
big
data
MR实战:分科汇总求月考平均分
Maven项目2、添加相关依赖3、创建日志属性文件4、创建学生实体类5、创建科目平均分映射器类6、创建科目平均分归并器类7、创建科目平均分驱动器类8、启动应用,查看结果一、实战概述在本次实战中,我们将利用
Hadoop
MapReduce
howard2005
·
2023-12-29 10:42
Hadoop分布式入门
mr
分科汇总求月考平均分
Spark相关
3、Yarn:采用
Hadoop
的资源调度器。国内大量使用。
大数据点滴
·
2023-12-29 09:29
#
Spark相关
spark
大数据
分布式
Hadoop
用户权限管理及hdfs权限管理
1.创建用户student1,所属分组为studentschown-Rstudent1:students/home/
hadoop
/
hadoop
-2.7.6root用户将
hadoop
的相关操作权限授予student12
临界爵迹
·
2023-12-29 09:35
大数据
hadoop
【2023】通过docker安装
hadoop
以及常见报错
目录1、准备2、安装镜像2.1、创建centos-ssh的镜像2.2、创建
hadoop
的镜像3、配置ssh网络3.1、搭建同一网段的网络3.2、配置host实现互相之间可以免密登陆3.3、查看是否成功4
方渐鸿
·
2023-12-29 07:08
数据分析
docker
hadoop
容器
数据分析
python
elasticsearch-
hadoop
.jar 6.8版本编译异常
##背景重新编译elasticsearch-
hadoop
包;GitHub-elastic/elasticsearch-
hadoop
at6.8编译7.17版本时很正常,注意设置下环境变量就好,JAVA8_
zmc@
·
2023-12-29 07:31
elasticsearch
hadoop
Hadoop
YARN CGroup 实践
文章目录
Hadoop
YARNCgroups实践什么是cgroupscgroups概念YARN使用cgroups背景cgroups在YARN中的工作原理cgroups在YARN中的实践步骤参考
Hadoop
YARNCgroups
Shyllin
·
2023-12-29 06:26
Hadoop
hadoop
网络
大数据
Hadoop
之MapReduce 详细教程
MapReduce仅作了解,生产上很少使用该计算程序1、MapReduce介绍MapReduce思想在生活中处处可见。或多或少都曾接触过这种思想。MapReduce的思想核心是“分而治之”,适用于大量复杂的任务处理场景(大规模数据处理场景)。即使是发布过论文实现分布式计算的谷歌也只是实现了这种思想,而不是自己原创。1、Map负责“分”,即把复杂的任务分解为若干个“简单的任务”来并行处理。可以进行拆
白鸽呀
·
2023-12-29 06:50
大数据
hadoop
mapreduce
大数据
Zookeeper-Zookeeper特性与节点数据类型详解
1.Zookeeper介绍ZooKeeper是一个开源的分布式协调框架,是Apache
Hadoop
的一个子项目,主要用来解决分布式集群中应用系统的一致性问题。
长情知热爱
·
2023-12-29 03:57
zookeeper
分布式
云原生
Hadoop
安装笔记2单机/伪分布式配置_
Hadoop
3.1.3——备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项——任务2:离线数据处理
紧接着上一篇博客:
Hadoop
安装笔记1:
Hadoop
安装笔记1单机/伪分布式配置_
Hadoop
3.1.3——备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项——任务2:离线数据处理-CSDN
Stitch .
·
2023-12-29 02:00
我的大学笔记
Hadoop
linux
hadoop
jvm
Spark 集群搭建
yarn-site.xmlspark-env.sh官网求π(PI)案例启动spark-shell通过浏览器查看显示查看Spark的网页信息展示搭建前准备下载地址:Indexof/dist/spark(apache.org)配置好
hadoop
撕得失败的标签
·
2023-12-29 00:42
大数据技术
spark
大数据
分布式
hadoop
yarn
hdfs
[BUG]
Hadoop
-3.3.4集群yarn管理页面子队列不显示任务
1.问题描述使用yarn调度任务时,在CapacityScheduler页面上单击叶队列(或子队列)时,不会显示应用程序任务信息,root队列可以显示任务。此外,FairScheduler页面是正常的。Nomatchingrecordsfound2.原因分析CapacitySchedulerPage中使用的$(‘#apps’).dataTable().fnFilter基于索引值为4的列进行筛选(索
tuoluzhe8521
·
2023-12-29 00:00
Hadoop
bug
hadoop
大数据
yarn
最全
Hadoop
实际生产集群高可用搭建
1.环境准备1.1集群规划序号bigdata-001bigdata-002bigdata-003bigdata-004bigdata-005IPxxxxxxxxxxxxxxx组件
hadoop
1
hadoop
2
hadoop
3
hadoop
4
hadoop
5
tuoluzhe8521
·
2023-12-29 00:30
Hadoop
hadoop
大数据
hdfs
yarn
spark
大数据技术之
Hadoop
入门一
1.从
Hadoop
框架讨论大数据生态名字起源该项目的创建者,DougCutting解释
Hadoop
的得名:“这个名字是我孩子给一个棕黄色的大象玩具命名的项目起源
Hadoop
由ApacheSoftwareFoundation
在远方的你等我
·
2023-12-28 19:54
How to solve gzip: stdin: not in gzip format error
目录一.问题说明二.问题解决三.命令复习一.问题说明当执行tar-xzf/tmp/
hadoop
-3.3.5.tar.gz-C/home/taiyi/yarn命令时出现:gzip:stdin:notingzipformattar
roman_日积跬步-终至千里
·
2023-12-28 19:11
linux
linux
服务器
运维
ClickHouse基础知识(二):ClickHouse 安装教程
1.准备工作1.1确定防火墙处于关闭状态1.2CentOS取消打开文件数限制(1)在
hadoop
101的/etc/security/limits.conf文件的末尾加入以下内容sudovim/etc/security
依晴无旧
·
2023-12-28 18:30
大数据
clickhouse
大数据
三台CentOS7.6虚拟机搭建
Hadoop
完全分布式集群(一)
1.安装CentOS7.6虚拟机1.1安装完虚拟机发现没有sudo命令和
hadoop
用户执行命令失败我在安装CentOS7.6虚拟机后,我发现不能执行sudo命令,同时
hadoop
用户执行命令失败。
666-LBJ-666
·
2023-12-28 18:55
大数据
分布式
hadoop
大数据
数据仓库架构以及数据模型的设计
分别是:数据仓库技术、
Hadoop
。当数据为
添柴少年yyds
·
2023-12-28 18:24
数据仓库
架构
数据库
linux服务网卡速率查看,linux 下查看网卡工作速率
[root@
hadoop
058~]#mii-tooleth0:negotiated100baseTx-FD,linkok100Mlinux下查看网卡工作速率Ethtool是用于查询及设置网卡参数的命令。
Reset12138
·
2023-12-28 18:22
linux服务网卡速率查看
(赠源码)java+mysql
hadoop
高校固定资产管理系统74965-计算机毕业设计项目选题推荐
摘要在信息飞速发展的今天,网络已成为人们重要的信息交流平台。高校部门每天都有大量的信息需要通过网络发布,为此,高校固定资产管理系统开发的必然性,所以本人开发了一个基于Tomcat(服务器)模式的高校固定资产管理系统,该系统以B/S/Java语言、MySql数据库等为开发技术,实现了添加、修改、查看、删除系统数据。本系统采取组件化的方式对系统进行拆分,并对数据库中各个表的增删查改、表与表之间的约束关
bysjlw985
·
2023-12-28 17:57
java
mysql
hadoop
python
小程序
spring
php
macOS
hadoop
+spark+scala安装教程
macOS
hadoop
+spark+scala安装教程环境搭建操作系统:macOS10.13.6JDK:1.8.0_201
hadoop
:2.8.5Spark:2.4.3Scala:2.13.0一、文件准备
飞翔客栈
·
2023-12-28 15:43
Flink开发利器StreamX
背景
Hadoop
体系虽然在目前应用非常广泛,但架构繁琐、运维复杂度过高、版本升级困难,且由于部门原因,数据中台需求排期较长,我们急需探索敏捷性开发的数据平台模式。
Apache StreamPark
·
2023-12-28 15:34
StreamX
Flink
flink
大数据
big
data
Hadoop
:Flink on Yarn服务配置与设置
于是打算单独配置服务下载两个文件文件flink-1.10.1文件:https://archive.apache.org/dist/flink/flink-1.10.1/flink-1.10.1-bin-scala_2.11.tgz
Hadoop
william_cheng666
·
2023-12-28 13:14
Hadoop
hadoop
flink
Apache Flink 1.14.4 on yarn ha环境搭建
本地单机模式,学习测试时使用Standalone—独立集群模式,Flink自带集群,开发测试环境使用StandaloneHA—独立集群高可用模式,Flink自带集群,开发测试环境使用OnYarn—计算资源统一由
Hadoop
YARN
一位搬砖工
·
2023-12-28 13:14
flink
flink
Flink1.8 on yarn 环境搭建及使用
tgz,然后解压下载地址https://flink.apache.org/downloads.html或https://www.apache.org/dyn/closer.lua/flink/二、下载
hadoop
magic_kid_2010
·
2023-12-28 13:42
Flink
flink1.8
yarn
HDFS 短路读的实现(全网最全面深入讲解)
文章目录前言1.知识准备1.1关于域套接字(DomainSocket)什么是DomainSocketDomainSocket通信在ShortCircuitRead中做了什么DomainSocket在
Hadoop
小昌昌的博客
·
2023-12-28 13:38
大数据架构
实现
hadoop
java
短路读
hdfs
ShortCircuit
hadoop
域套接字
Domain
Socket
mmap
Hadoop
2.4 完全分布式环境安装与配置
依赖项Java1.从http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.html下载tar.gz格式的,32位和64位机器对应下载,这里下的是64位的wgethttp://download.oracle.com/otn-pub/java/jdk/7u51-b13/jdk-7u51-linux-
王下邀月熊-WxChevalier
·
2023-12-28 13:06
hadoop
2.4
yarn
hdfs
mapreduce
springboot远程连接HDFS-
hadoop
3.0
一.
hadoop
前置环境:
hadoop
3.0+CDH6.1这里默认已经在linux环境配置好;如何安装hodoop不在本次范围内;注意:此时集群没有开启Kerberos认证我的环境:win10+IDEA2019.3
尚云峰
·
2023-12-28 13:33
spring
boot
springboot
hadoop
HDFS
java.net.UnknownHostException:
hadoop
搭建完成
hadoop
使用zookeeper作为群集管理器的HA后。用eclipse客户端连接
hadoop
。
綠竹清水之福荫
·
2023-12-28 13:33
hadoop
mycluster
hadoopha
hadoopclu
Hadoop
源码分析---Namenode和Datanode
一、
Hadoop
RPC框架1.
hadoop
ipc框架代码位于org.apache.
hadoop
.ipc包内,有一个抽象类Server,实现监听服务的功能。
编程小王子啊
·
2023-12-28 13:33
CSDN大数据专栏
java
hadoop
大数据
hdfs
hadoop
面试问题
1当前你们公司使用的
Hadoop
版本是什么
Hadoop
cdh-5.7.6/
hadoop
-2.6.02HDFS常见的数据压缩格式有哪些,介绍其中一种详细的实现方式Gzip优点是压缩率高,速度快。
code学习社
·
2023-12-28 13:31
【
Hadoop
】RPC在client端的源码解析
最近在看《
Hadoop
2.XHDFS源码剖析》这本书(其实看了挺久的,但是进度比较慢),要看懂
hadoop
源码真的是需要一定的代码和框架的基础,用到的东西还真是蛮多的,真的厉害,哎,我太菜了~我们会用
hadoop
lsr40
·
2023-12-28 13:01
hadoop
2.X版本的一个通病问题
【概述】对于配置了HA模式的RM或者NN,客户端如果向standby的节点发送请求,会因为不可连接或standby拒绝提供服务导致请求失败,转而向Active的节点发送请求,这个转换是
hadoop
客户端内部自动完成的
陈猿解码
·
2023-12-28 13:29
hadoop
hdfs
java
分布式
zookeeper
spring
hadoop
HDFS2.x之RPC流程分析
HDFS2.x之RPC流程分析1概述
Hadoop
提供了一个统一的RPC机制来处理client-namenode,namenode-dataname,client-dataname之间的通信。
can007
·
2023-12-28 13:59
Hadoop
Java大杂烩
hadoop2.0
HDFS
Hadoop
RPC
探究Presto SQL引擎(1)-巧用Antlr
从
Hadoop
生态的Hive,Spark,Presto,Kylin,Druid到非
Hadoop
生态的Clic
vivo互联网技术
·
2023-12-28 12:14
Hadoop
安装笔记_单机/伪分布式配置_
Hadoop
3.1.3——备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项——任务2:离线数据处理
将下发的ds_db01.sql数据库文件放置mysql中12、编写Scala代码,使用Spark将MySQL的ds_db01库中表user_info的全量数据抽取到Hive的ods库中表user_info。字段名称、类型不变,同时添加静态分区,分区字段为etl_date,类型为String,且值为当前日期的前一天日期(分区字段格式为yyyyMMdd)。使用hivecli执行showpartitio
Stitch .
·
2023-12-28 12:32
我的大学笔记
Hadoop
分布式
大数据
hadoop
笔记
「Kafka」入门篇
「Kafka」入门篇基础架构Kafka快速入门集群规划集群部署官方下载地址:http://kafka.apache.org/downloads.html解压安装包:[atguigu@
hadoop
102software
小成同学_
·
2023-12-28 12:30
Kafka
kafka
中间件
分布式
后端
Hadoop
之HDFS 详细教程
1、HDFS概述
Hadoop
分布式系统框架中,首要的基础功能就是文件系统,在
Hadoop
中使用FileSystem这个抽象类来表示我们的文件系统,这个抽象类下面有很多子实现类,究竟使用哪一种,需要看我们具体的实现类
白鸽呀
·
2023-12-28 11:29
大数据
hadoop
hdfs
大数据
hadoop
hive spark flink 安装
下载地址Indexof/distubuntu安装
hadoop
集群准备IP地址主机名称192.168.1.21node1192.168.1.22node2192.168.1.23node3上传
hadoop
nsa65223
·
2023-12-28 11:59
hadoop
hive
spark
Spark从入门到精通23:Spark SQL简介
我们知道Hive是
Hadoop
生态中的一个数据分析引擎,它可以将HiveSQL转换成MapReduce任务提交到
Hadoop
集群中执行,大大简化了编写MapReduce程序的
金字塔下的小蜗牛
·
2023-12-28 09:20
构建高效数据中台:集群规划与搭建的最佳实践指南
然而,
Hadoop
也支持通过调整队列的权重和使用抢占策略来优化资源的使用。例如&
数据与后端架构提升之路
·
2023-12-28 04:20
#
数据中台
大数据
win7配置
hadoop
-2.7.7详细教程
Date:2019/09/27Version:
hadoop
2.7.7;java1.8.0_221;流程安装java下载并解压
hadoop
压缩包修改配置文件下载winutil,并覆盖启动
hadoop
0.安装
pluo1717
·
2023-12-28 04:02
上一页
25
26
27
28
29
30
31
32
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他