E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop大数据相关
CentOS 7.6搭建
Hadoop
2.9.2完全分布式集群,狠详细!
一、概述本文基于宿主机Win10笔记本(8G+256固态,连接无线wifi)+三台虚拟机进行搭建。以下为搭建的详细过程,接近于现场直播Live。二、软件环境准备使用到具体软件及版本如下:虚拟机VMwareVMware-workstation-full-12.5.7-5813279.exe下载地址https://my.vmware.com/web/vmware/details?productId=5
cichu1740
·
2023-12-30 07:26
大数据
java
运维
三台CentOS7.6虚拟机搭建
Hadoop
完全分布式集群(二)
这个是笔者大学时期的大数据课程使用三台CentOS7.6虚拟机搭建完全分布式集群的案例,已成功搭建完全分布式集群,并测试跑实例。6.安装JDK以下操作现在master上操作,然后远程复制到slave01、slave02即可。6.1将压缩包发送到master节点机器上,并解压利用WinSCP,将JDK压缩包从windows系统传至master主节点机器上,并将其放于/opt/software目录注意
666-LBJ-666
·
2023-12-30 07:54
大数据
分布式
hadoop
大数据
Hadoop
架构概述
HDFS架构概述HDFS(
Hadoop
DistributedFileSystem)的架构概述NameNode(nn):存储文件的元数据,如文件名、文件目录结构、文件属性(生成时间、副本数、文件权限),以及每个文件的块列表和块所在的
青涩的芒果汁
·
2023-12-30 06:31
技术分享
Ambari入门及安装
Ambari简述什么是AmbariApacheAmbari项目旨在通过开发用于配置,管理和监控Apache
Hadoop
集群的软件来简化
Hadoop
管理。
青涩的芒果汁
·
2023-12-30 06:30
技术分享
Spark Streaming
批量计算和实时计算(三)流计算概念(四)流计算框架(五)流计算处理流程二、SparkStreaming(一)SparkStreaming设计(二)SparkStreaming与Storm的对比(三)从“
Hadoop
Francek Chen
·
2023-12-30 06:54
Spark编程基础
spark
大数据
分布式
Spark
Streaming
配置log4j和slf4j爬过的坑
现在将错误记录一下[WARNING]failedorg.mortbay.jetty.plugin.Jetty6PluginWebAppContext@3fd05b3e{/adgame_ms,/home/
hadoop
zerone-f
·
2023-12-30 06:18
log4j
slf4j
java
log4j
slf4j
测试:如何查看节点进程?
对于
Hadoop
集群在
Hadoop
集群中,您可以使用`jps`命令来查看正在运行的Java进程。
AnyaPapa
·
2023-12-30 05:58
测试
运维
虚拟机上进行
Hadoop
伪分布式部署并进行大数据处理
本文章基于的大数据文件:https://download.csdn.net/download/qq_60567426/87940872?spm=1001.2014.3001.5503引言:虚拟机经常卡死,卡死就按这个重新启动VMware虚拟机下载:1:首先安装VMware,官网链接:VMware-DeliveringaDigitalFoundationForBusinesses2:点击Produc
软件开发技术局
·
2023-12-30 03:38
分布式
linux
大数据
ubuntu
python
java
spark
Hadoop
和大数据:60款顶级开源工具
说到处理大数据的工具,普通的开源解决方案(尤其是Apache
Hadoop
)堪称中流砥柱。
weixin_33905756
·
2023-12-30 01:25
大数据
操作系统
java
大数据框架介绍
大数据学习必备三个框架
Hadoop
,Spark,Storm大数据的主要特点为数据量大(Volume),数据类别复杂(Variety),数据处理速度快(Velocity)和数据真实性高(Veracity)
mikecg
·
2023-12-29 23:06
执行
hadoop
jar 或者是yarn jar 报Exception in thread “main“ java.lang.NoClassDefFoundError:XXX
找到上传的目录,执行yarnjar或者
hadoop
jar报一下的错。报错的原因可能是:在idea打包的过程中没有相关的类,那你在打包的时候,没有把相关依赖都打进去。
爱吃肉的白熊
·
2023-12-29 22:36
笔记
hadoop
mapreduce
java
给linux(centos)操作系统设置主机名的几种方式
镜像下载、域名解析、时间同步请点击阿里云开源镜像站一、前言就是我们需要集群部署
hadoop
,Flink时,写ip地址太长了,然后大家想的就是能不能用比如:node1,node2,node3去代替IP地址
萌褚
·
2023-12-29 21:13
HDFS常用命令
1.hdfsdfs与
hadoop
fs命令的形式:hdfsdfs-linux命令这与linux中命令操作是一样的。
langzitianya
·
2023-12-29 21:15
大数据
hdfs
hadoop
大数据
HBASE的应用场景
2018/08/31HBase是如何与
Hadoop
嵌入在一起的,那么他的作用又是什么。这显然跟我原来理解的那些个数据库不太一样,就比如mango这种。现在比较关注的就是他的数据导入,是怎么样的。
VChao
·
2023-12-29 16:49
Kafka 初识
kafka是由LinkedIn公司开发的,是一个分布式、支持分区的、多副本的,基于zookeeper协调的分布式消息系统,它的最大特点就是可以实时的处理大量数据以满足各种需求场景:比如基于
Hadoop
的批处理系统
Advancer-lbh
·
2023-12-29 14:56
消息中间件
kafka
分布式
消息中间件
Spark集群- 连接
hadoop
、hive集群
目的使spark代码提交到集群运行时,能够操作hdfs、hive等保证所有spark机器都能解析
hadoop
集群的机器名称如果spark和
hadoop
部署在同样的集群,则可以省略这一步如果spark和
hadoop
heichong
·
2023-12-29 13:59
简单的 MapReduce 程序的示例代码,用于统计 HBase 中的成绩表中的单科排名和总分排名,并将结果上传到 HDFS 中。...
MapReduce程序的示例代码,用于统计HBase中的成绩表中的单科排名和总分排名,并将结果上传到HDFS中:```importjava.io.IOException;importorg.apache.
hadoop
.conf.Configuration
weixin_42601702
·
2023-12-29 10:19
hbase
hdfs
mapreduce
hadoop
大数据
利用hbase来两张表的联立,求出一个班学生的总分并把结果写到hbase(java 代码实现)
importorg.apache.
hadoop
.conf.Configuration;importorg.apache.
hadoop
.hbase.HColumnDescriptor;importorg.apache.
hadoop
.hbase.HTableDescriptor
CC072615
·
2023-12-29 10:14
hbase
java
hadoop
大数据
big
data
MR实战:分科汇总求月考平均分
Maven项目2、添加相关依赖3、创建日志属性文件4、创建学生实体类5、创建科目平均分映射器类6、创建科目平均分归并器类7、创建科目平均分驱动器类8、启动应用,查看结果一、实战概述在本次实战中,我们将利用
Hadoop
MapReduce
howard2005
·
2023-12-29 10:42
Hadoop分布式入门
mr
分科汇总求月考平均分
Spark相关
3、Yarn:采用
Hadoop
的资源调度器。国内大量使用。
大数据点滴
·
2023-12-29 09:29
#
Spark相关
spark
大数据
分布式
数据仓库-数仓优化小厂实践
一、背景由于公司规模较小,
大数据相关
没有实现平台化,相关的架构都是原生的Apache组件,所以集群的维护和优化都需要人工的参与。根据自己的实践整理一些数仓相关的优化。
大数据点滴
·
2023-12-29 09:25
#
数据仓库
数据仓库
Hadoop
用户权限管理及hdfs权限管理
1.创建用户student1,所属分组为studentschown-Rstudent1:students/home/
hadoop
/
hadoop
-2.7.6root用户将
hadoop
的相关操作权限授予student12
临界爵迹
·
2023-12-29 09:35
大数据
hadoop
【2023】通过docker安装
hadoop
以及常见报错
目录1、准备2、安装镜像2.1、创建centos-ssh的镜像2.2、创建
hadoop
的镜像3、配置ssh网络3.1、搭建同一网段的网络3.2、配置host实现互相之间可以免密登陆3.3、查看是否成功4
方渐鸿
·
2023-12-29 07:08
数据分析
docker
hadoop
容器
数据分析
python
elasticsearch-
hadoop
.jar 6.8版本编译异常
##背景重新编译elasticsearch-
hadoop
包;GitHub-elastic/elasticsearch-
hadoop
at6.8编译7.17版本时很正常,注意设置下环境变量就好,JAVA8_
zmc@
·
2023-12-29 07:31
elasticsearch
hadoop
Hadoop
YARN CGroup 实践
文章目录
Hadoop
YARNCgroups实践什么是cgroupscgroups概念YARN使用cgroups背景cgroups在YARN中的工作原理cgroups在YARN中的实践步骤参考
Hadoop
YARNCgroups
Shyllin
·
2023-12-29 06:26
Hadoop
hadoop
网络
大数据
Hadoop
之MapReduce 详细教程
MapReduce仅作了解,生产上很少使用该计算程序1、MapReduce介绍MapReduce思想在生活中处处可见。或多或少都曾接触过这种思想。MapReduce的思想核心是“分而治之”,适用于大量复杂的任务处理场景(大规模数据处理场景)。即使是发布过论文实现分布式计算的谷歌也只是实现了这种思想,而不是自己原创。1、Map负责“分”,即把复杂的任务分解为若干个“简单的任务”来并行处理。可以进行拆
白鸽呀
·
2023-12-29 06:50
大数据
hadoop
mapreduce
大数据
Zookeeper-Zookeeper特性与节点数据类型详解
1.Zookeeper介绍ZooKeeper是一个开源的分布式协调框架,是Apache
Hadoop
的一个子项目,主要用来解决分布式集群中应用系统的一致性问题。
长情知热爱
·
2023-12-29 03:57
zookeeper
分布式
云原生
Hadoop
安装笔记2单机/伪分布式配置_
Hadoop
3.1.3——备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项——任务2:离线数据处理
紧接着上一篇博客:
Hadoop
安装笔记1:
Hadoop
安装笔记1单机/伪分布式配置_
Hadoop
3.1.3——备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项——任务2:离线数据处理-CSDN
Stitch .
·
2023-12-29 02:00
我的大学笔记
Hadoop
linux
hadoop
jvm
Spark 集群搭建
yarn-site.xmlspark-env.sh官网求π(PI)案例启动spark-shell通过浏览器查看显示查看Spark的网页信息展示搭建前准备下载地址:Indexof/dist/spark(apache.org)配置好
hadoop
撕得失败的标签
·
2023-12-29 00:42
大数据技术
spark
大数据
分布式
hadoop
yarn
hdfs
[BUG]
Hadoop
-3.3.4集群yarn管理页面子队列不显示任务
1.问题描述使用yarn调度任务时,在CapacityScheduler页面上单击叶队列(或子队列)时,不会显示应用程序任务信息,root队列可以显示任务。此外,FairScheduler页面是正常的。Nomatchingrecordsfound2.原因分析CapacitySchedulerPage中使用的$(‘#apps’).dataTable().fnFilter基于索引值为4的列进行筛选(索
tuoluzhe8521
·
2023-12-29 00:00
Hadoop
bug
hadoop
大数据
yarn
最全
Hadoop
实际生产集群高可用搭建
1.环境准备1.1集群规划序号bigdata-001bigdata-002bigdata-003bigdata-004bigdata-005IPxxxxxxxxxxxxxxx组件
hadoop
1
hadoop
2
hadoop
3
hadoop
4
hadoop
5
tuoluzhe8521
·
2023-12-29 00:30
Hadoop
hadoop
大数据
hdfs
yarn
spark
大数据技术之
Hadoop
入门一
1.从
Hadoop
框架讨论大数据生态名字起源该项目的创建者,DougCutting解释
Hadoop
的得名:“这个名字是我孩子给一个棕黄色的大象玩具命名的项目起源
Hadoop
由ApacheSoftwareFoundation
在远方的你等我
·
2023-12-28 19:54
How to solve gzip: stdin: not in gzip format error
目录一.问题说明二.问题解决三.命令复习一.问题说明当执行tar-xzf/tmp/
hadoop
-3.3.5.tar.gz-C/home/taiyi/yarn命令时出现:gzip:stdin:notingzipformattar
roman_日积跬步-终至千里
·
2023-12-28 19:11
linux
linux
服务器
运维
ClickHouse基础知识(二):ClickHouse 安装教程
1.准备工作1.1确定防火墙处于关闭状态1.2CentOS取消打开文件数限制(1)在
hadoop
101的/etc/security/limits.conf文件的末尾加入以下内容sudovim/etc/security
依晴无旧
·
2023-12-28 18:30
大数据
clickhouse
大数据
三台CentOS7.6虚拟机搭建
Hadoop
完全分布式集群(一)
1.安装CentOS7.6虚拟机1.1安装完虚拟机发现没有sudo命令和
hadoop
用户执行命令失败我在安装CentOS7.6虚拟机后,我发现不能执行sudo命令,同时
hadoop
用户执行命令失败。
666-LBJ-666
·
2023-12-28 18:55
大数据
分布式
hadoop
大数据
数据仓库架构以及数据模型的设计
分别是:数据仓库技术、
Hadoop
。当数据为
添柴少年yyds
·
2023-12-28 18:24
数据仓库
架构
数据库
linux服务网卡速率查看,linux 下查看网卡工作速率
[root@
hadoop
058~]#mii-tooleth0:negotiated100baseTx-FD,linkok100Mlinux下查看网卡工作速率Ethtool是用于查询及设置网卡参数的命令。
Reset12138
·
2023-12-28 18:22
linux服务网卡速率查看
(赠源码)java+mysql
hadoop
高校固定资产管理系统74965-计算机毕业设计项目选题推荐
摘要在信息飞速发展的今天,网络已成为人们重要的信息交流平台。高校部门每天都有大量的信息需要通过网络发布,为此,高校固定资产管理系统开发的必然性,所以本人开发了一个基于Tomcat(服务器)模式的高校固定资产管理系统,该系统以B/S/Java语言、MySql数据库等为开发技术,实现了添加、修改、查看、删除系统数据。本系统采取组件化的方式对系统进行拆分,并对数据库中各个表的增删查改、表与表之间的约束关
bysjlw985
·
2023-12-28 17:57
java
mysql
hadoop
python
小程序
spring
php
macOS
hadoop
+spark+scala安装教程
macOS
hadoop
+spark+scala安装教程环境搭建操作系统:macOS10.13.6JDK:1.8.0_201
hadoop
:2.8.5Spark:2.4.3Scala:2.13.0一、文件准备
飞翔客栈
·
2023-12-28 15:43
Flink开发利器StreamX
背景
Hadoop
体系虽然在目前应用非常广泛,但架构繁琐、运维复杂度过高、版本升级困难,且由于部门原因,数据中台需求排期较长,我们急需探索敏捷性开发的数据平台模式。
Apache StreamPark
·
2023-12-28 15:34
StreamX
Flink
flink
大数据
big
data
Hadoop
:Flink on Yarn服务配置与设置
于是打算单独配置服务下载两个文件文件flink-1.10.1文件:https://archive.apache.org/dist/flink/flink-1.10.1/flink-1.10.1-bin-scala_2.11.tgz
Hadoop
william_cheng666
·
2023-12-28 13:14
Hadoop
hadoop
flink
Apache Flink 1.14.4 on yarn ha环境搭建
本地单机模式,学习测试时使用Standalone—独立集群模式,Flink自带集群,开发测试环境使用StandaloneHA—独立集群高可用模式,Flink自带集群,开发测试环境使用OnYarn—计算资源统一由
Hadoop
YARN
一位搬砖工
·
2023-12-28 13:14
flink
flink
Flink1.8 on yarn 环境搭建及使用
tgz,然后解压下载地址https://flink.apache.org/downloads.html或https://www.apache.org/dyn/closer.lua/flink/二、下载
hadoop
magic_kid_2010
·
2023-12-28 13:42
Flink
flink1.8
yarn
HDFS 短路读的实现(全网最全面深入讲解)
文章目录前言1.知识准备1.1关于域套接字(DomainSocket)什么是DomainSocketDomainSocket通信在ShortCircuitRead中做了什么DomainSocket在
Hadoop
小昌昌的博客
·
2023-12-28 13:38
大数据架构
实现
hadoop
java
短路读
hdfs
ShortCircuit
hadoop
域套接字
Domain
Socket
mmap
Hadoop
2.4 完全分布式环境安装与配置
依赖项Java1.从http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.html下载tar.gz格式的,32位和64位机器对应下载,这里下的是64位的wgethttp://download.oracle.com/otn-pub/java/jdk/7u51-b13/jdk-7u51-linux-
王下邀月熊-WxChevalier
·
2023-12-28 13:06
hadoop
2.4
yarn
hdfs
mapreduce
springboot远程连接HDFS-
hadoop
3.0
一.
hadoop
前置环境:
hadoop
3.0+CDH6.1这里默认已经在linux环境配置好;如何安装hodoop不在本次范围内;注意:此时集群没有开启Kerberos认证我的环境:win10+IDEA2019.3
尚云峰
·
2023-12-28 13:33
spring
boot
springboot
hadoop
HDFS
java.net.UnknownHostException:
hadoop
搭建完成
hadoop
使用zookeeper作为群集管理器的HA后。用eclipse客户端连接
hadoop
。
綠竹清水之福荫
·
2023-12-28 13:33
hadoop
mycluster
hadoopha
hadoopclu
Hadoop
源码分析---Namenode和Datanode
一、
Hadoop
RPC框架1.
hadoop
ipc框架代码位于org.apache.
hadoop
.ipc包内,有一个抽象类Server,实现监听服务的功能。
编程小王子啊
·
2023-12-28 13:33
CSDN大数据专栏
java
hadoop
大数据
hdfs
hadoop
面试问题
1当前你们公司使用的
Hadoop
版本是什么
Hadoop
cdh-5.7.6/
hadoop
-2.6.02HDFS常见的数据压缩格式有哪些,介绍其中一种详细的实现方式Gzip优点是压缩率高,速度快。
code学习社
·
2023-12-28 13:31
【
Hadoop
】RPC在client端的源码解析
最近在看《
Hadoop
2.XHDFS源码剖析》这本书(其实看了挺久的,但是进度比较慢),要看懂
hadoop
源码真的是需要一定的代码和框架的基础,用到的东西还真是蛮多的,真的厉害,哎,我太菜了~我们会用
hadoop
lsr40
·
2023-12-28 13:01
hadoop
上一页
25
26
27
28
29
30
31
32
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他