Hadoop大数据相关第29页

CentOS 7.6搭建Hadoop2.9.2完全分布式集群，狠详细！

一、概述本文基于宿主机Win10笔记本（8G+256固态，连接无线wifi）+三台虚拟机进行搭建。以下为搭建的详细过程，接近于现场直播Live。二、软件环境准备使用到具体软件及版本如下：虚拟机VMwareVMware-workstation-full-12.5.7-5813279.exe下载地址https://my.vmware.com/web/vmware/details?productId=5

cichu1740·2023-12-30 07:26

三台CentOS7.6虚拟机搭建Hadoop完全分布式集群（二）

这个是笔者大学时期的大数据课程使用三台CentOS7.6虚拟机搭建完全分布式集群的案例，已成功搭建完全分布式集群，并测试跑实例。6.安装JDK以下操作现在master上操作，然后远程复制到slave01、slave02即可。6.1将压缩包发送到master节点机器上，并解压利用WinSCP，将JDK压缩包从windows系统传至master主节点机器上，并将其放于/opt/software目录注意

666-LBJ-666·2023-12-30 07:54

Hadoop架构概述

HDFS架构概述HDFS（HadoopDistributedFileSystem）的架构概述NameNode(nn)：存储文件的元数据，如文件名、文件目录结构、文件属性(生成时间、副本数、文件权限)，以及每个文件的块列表和块所在的

青涩的芒果汁·2023-12-30 06:31

Ambari入门及安装

Ambari简述什么是AmbariApacheAmbari项目旨在通过开发用于配置，管理和监控ApacheHadoop集群的软件来简化Hadoop管理。

青涩的芒果汁·2023-12-30 06:30

Spark Streaming

批量计算和实时计算（三）流计算概念（四）流计算框架（五）流计算处理流程二、SparkStreaming（一）SparkStreaming设计（二）SparkStreaming与Storm的对比（三）从“Hadoop

Francek Chen·2023-12-30 06:54

配置log4j和slf4j爬过的坑

现在将错误记录一下[WARNING]failedorg.mortbay.jetty.plugin.Jetty6PluginWebAppContext@3fd05b3e{/adgame_ms,/home/hadoop

zerone-f·2023-12-30 06:18

测试：如何查看节点进程？

对于Hadoop集群在Hadoop集群中，您可以使用`jps`命令来查看正在运行的Java进程。

AnyaPapa·2023-12-30 05:58

虚拟机上进行Hadoop伪分布式部署并进行大数据处理

本文章基于的大数据文件：https://download.csdn.net/download/qq_60567426/87940872?spm=1001.2014.3001.5503引言：虚拟机经常卡死，卡死就按这个重新启动VMware虚拟机下载：1：首先安装VMware，官网链接：VMware-DeliveringaDigitalFoundationForBusinesses2：点击Produc

软件开发技术局·2023-12-30 03:38

Hadoop和大数据：60款顶级开源工具

说到处理大数据的工具，普通的开源解决方案（尤其是ApacheHadoop）堪称中流砥柱。

weixin_33905756·2023-12-30 01:25

大数据框架介绍

大数据学习必备三个框架Hadoop，Spark，Storm大数据的主要特点为数据量大(Volume)，数据类别复杂(Variety)，数据处理速度快(Velocity)和数据真实性高(Veracity)

mikecg·2023-12-29 23:06

执行hadoop jar 或者是yarn jar 报Exception in thread “main“ java.lang.NoClassDefFoundError：XXX

找到上传的目录，执行yarnjar或者hadoopjar报一下的错。报错的原因可能是：在idea打包的过程中没有相关的类，那你在打包的时候，没有把相关依赖都打进去。

爱吃肉的白熊·2023-12-29 22:36

给linux(centos)操作系统设置主机名的几种方式

镜像下载、域名解析、时间同步请点击阿里云开源镜像站一、前言就是我们需要集群部署hadoop,Flink时，写ip地址太长了，然后大家想的就是能不能用比如：node1,node2,node3去代替IP地址

萌褚·2023-12-29 21:13

HDFS常用命令

1.hdfsdfs与hadoopfs命令的形式：hdfsdfs-linux命令这与linux中命令操作是一样的。

langzitianya·2023-12-29 21:15

HBASE的应用场景

2018/08/31HBase是如何与Hadoop嵌入在一起的，那么他的作用又是什么。这显然跟我原来理解的那些个数据库不太一样，就比如mango这种。现在比较关注的就是他的数据导入，是怎么样的。

VChao·2023-12-29 16:49

Kafka 初识

kafka是由LinkedIn公司开发的，是一个分布式、支持分区的、多副本的，基于zookeeper协调的分布式消息系统，它的最大特点就是可以实时的处理大量数据以满足各种需求场景：比如基于Hadoop的批处理系统

Advancer-lbh·2023-12-29 14:56

Spark集群- 连接hadoop、hive集群

目的使spark代码提交到集群运行时，能够操作hdfs、hive等保证所有spark机器都能解析hadoop集群的机器名称如果spark和hadoop部署在同样的集群，则可以省略这一步如果spark和hadoop

heichong·2023-12-29 13:59

简单的 MapReduce 程序的示例代码，用于统计 HBase 中的成绩表中的单科排名和总分排名，并将结果上传到 HDFS 中。...

MapReduce程序的示例代码，用于统计HBase中的成绩表中的单科排名和总分排名，并将结果上传到HDFS中：```importjava.io.IOException;importorg.apache.hadoop.conf.Configuration

weixin_42601702·2023-12-29 10:19

利用hbase来两张表的联立，求出一个班学生的总分并把结果写到hbase（java 代码实现）

importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HColumnDescriptor;importorg.apache.hadoop.hbase.HTableDescriptor

CC072615·2023-12-29 10:14

MR实战：分科汇总求月考平均分

howard2005·2023-12-29 10:42

Spark相关

3、Yarn：采用Hadoop的资源调度器。国内大量使用。

大数据点滴·2023-12-29 09:29

数据仓库-数仓优化小厂实践

大数据点滴·2023-12-29 09:25

Hadoop用户权限管理及hdfs权限管理

1.创建用户student1，所属分组为studentschown-Rstudent1:students/home/hadoop/hadoop-2.7.6root用户将hadoop的相关操作权限授予student12

临界爵迹·2023-12-29 09:35

【2023】通过docker安装hadoop以及常见报错

目录1、准备2、安装镜像2.1、创建centos-ssh的镜像2.2、创建hadoop的镜像3、配置ssh网络3.1、搭建同一网段的网络3.2、配置host实现互相之间可以免密登陆3.3、查看是否成功4

方渐鸿·2023-12-29 07:08

elasticsearch-hadoop.jar 6.8版本编译异常

##背景重新编译elasticsearch-hadoop包；GitHub-elastic/elasticsearch-hadoopat6.8编译7.17版本时很正常，注意设置下环境变量就好，JAVA8_

zmc@·2023-12-29 07:31

Hadoop YARN CGroup 实践

文章目录HadoopYARNCgroups实践什么是cgroupscgroups概念YARN使用cgroups背景cgroups在YARN中的工作原理cgroups在YARN中的实践步骤参考HadoopYARNCgroups

Shyllin·2023-12-29 06:26

Hadoop之MapReduce 详细教程

MapReduce仅作了解，生产上很少使用该计算程序1、MapReduce介绍MapReduce思想在生活中处处可见。或多或少都曾接触过这种思想。MapReduce的思想核心是“分而治之”，适用于大量复杂的任务处理场景（大规模数据处理场景）。即使是发布过论文实现分布式计算的谷歌也只是实现了这种思想，而不是自己原创。1、Map负责“分”，即把复杂的任务分解为若干个“简单的任务”来并行处理。可以进行拆

白鸽呀·2023-12-29 06:50

Zookeeper-Zookeeper特性与节点数据类型详解

1.Zookeeper介绍ZooKeeper是一个开源的分布式协调框架，是ApacheHadoop的一个子项目，主要用来解决分布式集群中应用系统的一致性问题。

长情知热爱·2023-12-29 03:57

Hadoop安装笔记2单机/伪分布式配置_Hadoop3.1.3——备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项——任务2：离线数据处理

紧接着上一篇博客：Hadoop安装笔记1：Hadoop安装笔记1单机/伪分布式配置_Hadoop3.1.3——备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项——任务2：离线数据处理-CSDN

Stitch .·2023-12-29 02:00

Spark 集群搭建

yarn-site.xmlspark-env.sh官网求π(PI)案例启动spark-shell通过浏览器查看显示查看Spark的网页信息展示搭建前准备下载地址：Indexof/dist/spark(apache.org)配置好hadoop

撕得失败的标签·2023-12-29 00:42

[BUG] Hadoop-3.3.4集群yarn管理页面子队列不显示任务

1.问题描述使用yarn调度任务时，在CapacityScheduler页面上单击叶队列（或子队列）时，不会显示应用程序任务信息，root队列可以显示任务。此外，FairScheduler页面是正常的。Nomatchingrecordsfound2.原因分析CapacitySchedulerPage中使用的$（‘#apps’）.dataTable（）.fnFilter基于索引值为4的列进行筛选（索

tuoluzhe8521·2023-12-29 00:00

最全Hadoop实际生产集群高可用搭建

1.环境准备1.1集群规划序号bigdata-001bigdata-002bigdata-003bigdata-004bigdata-005IPxxxxxxxxxxxxxxx组件hadoop1hadoop2hadoop3hadoop4hadoop5

tuoluzhe8521·2023-12-29 00:30

大数据技术之Hadoop入门一

1.从Hadoop框架讨论大数据生态名字起源该项目的创建者，DougCutting解释Hadoop的得名：“这个名字是我孩子给一个棕黄色的大象玩具命名的项目起源Hadoop由ApacheSoftwareFoundation

在远方的你等我·2023-12-28 19:54

How to solve gzip: stdin: not in gzip format error

目录一.问题说明二.问题解决三.命令复习一.问题说明当执行tar-xzf/tmp/hadoop-3.3.5.tar.gz-C/home/taiyi/yarn命令时出现：gzip:stdin:notingzipformattar

roman_日积跬步-终至千里·2023-12-28 19:11

ClickHouse基础知识（二）：ClickHouse 安装教程

1.准备工作1.1确定防火墙处于关闭状态1.2CentOS取消打开文件数限制（1）在hadoop101的/etc/security/limits.conf文件的末尾加入以下内容sudovim/etc/security

依晴无旧·2023-12-28 18:30

三台CentOS7.6虚拟机搭建Hadoop完全分布式集群（一）

1.安装CentOS7.6虚拟机1.1安装完虚拟机发现没有sudo命令和hadoop用户执行命令失败我在安装CentOS7.6虚拟机后，我发现不能执行sudo命令，同时hadoop用户执行命令失败。

666-LBJ-666·2023-12-28 18:55

数据仓库架构以及数据模型的设计

分别是：数据仓库技术、Hadoop。当数据为

添柴少年yyds·2023-12-28 18:24

linux服务网卡速率查看,linux 下查看网卡工作速率

[root@hadoop058~]#mii-tooleth0:negotiated100baseTx-FD,linkok100Mlinux下查看网卡工作速率Ethtool是用于查询及设置网卡参数的命令。

Reset12138·2023-12-28 18:22

(赠源码）java+mysql hadoop高校固定资产管理系统74965-计算机毕业设计项目选题推荐

摘要在信息飞速发展的今天，网络已成为人们重要的信息交流平台。高校部门每天都有大量的信息需要通过网络发布，为此，高校固定资产管理系统开发的必然性，所以本人开发了一个基于Tomcat（服务器）模式的高校固定资产管理系统，该系统以B/S/Java语言、MySql数据库等为开发技术，实现了添加、修改、查看、删除系统数据。本系统采取组件化的方式对系统进行拆分，并对数据库中各个表的增删查改、表与表之间的约束关

bysjlw985·2023-12-28 17:57

macOS hadoop+spark+scala安装教程

macOShadoop+spark+scala安装教程环境搭建操作系统：macOS10.13.6JDK:1.8.0_201hadoop:2.8.5Spark:2.4.3Scala:2.13.0一、文件准备

飞翔客栈·2023-12-28 15:43

Flink开发利器StreamX

背景Hadoop体系虽然在目前应用非常广泛，但架构繁琐、运维复杂度过高、版本升级困难，且由于部门原因，数据中台需求排期较长，我们急需探索敏捷性开发的数据平台模式。

Apache StreamPark·2023-12-28 15:34

Hadoop：Flink on Yarn服务配置与设置

于是打算单独配置服务下载两个文件文件flink-1.10.1文件：https://archive.apache.org/dist/flink/flink-1.10.1/flink-1.10.1-bin-scala_2.11.tgzHadoop

william_cheng666·2023-12-28 13:14

Apache Flink 1.14.4 on yarn ha环境搭建

本地单机模式，学习测试时使用Standalone—独立集群模式，Flink自带集群，开发测试环境使用StandaloneHA—独立集群高可用模式，Flink自带集群，开发测试环境使用OnYarn—计算资源统一由HadoopYARN

一位搬砖工·2023-12-28 13:14

Flink1.8 on yarn 环境搭建及使用

tgz，然后解压下载地址https://flink.apache.org/downloads.html或https://www.apache.org/dyn/closer.lua/flink/二、下载hadoop

magic_kid_2010·2023-12-28 13:42

HDFS 短路读的实现(全网最全面深入讲解)

文章目录前言1.知识准备1.1关于域套接字(DomainSocket)什么是DomainSocketDomainSocket通信在ShortCircuitRead中做了什么DomainSocket在Hadoop

小昌昌的博客·2023-12-28 13:38

Hadoop 2.4 完全分布式环境安装与配置

依赖项Java1.从http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.html下载tar.gz格式的，32位和64位机器对应下载，这里下的是64位的wgethttp://download.oracle.com/otn-pub/java/jdk/7u51-b13/jdk-7u51-linux-

王下邀月熊-WxChevalier·2023-12-28 13:06

springboot远程连接HDFS-hadoop3.0

一.hadoop前置环境:hadoop3.0+CDH6.1这里默认已经在linux环境配置好;如何安装hodoop不在本次范围内;注意：此时集群没有开启Kerberos认证我的环境:win10+IDEA2019.3

尚云峰·2023-12-28 13:33

java.net.UnknownHostException: hadoop

搭建完成hadoop使用zookeeper作为群集管理器的HA后。用eclipse客户端连接hadoop。

綠竹清水之福荫·2023-12-28 13:33

Hadoop源码分析---Namenode和Datanode

一、HadoopRPC框架1.hadoopipc框架代码位于org.apache.hadoop.ipc包内，有一个抽象类Server，实现监听服务的功能。

编程小王子啊·2023-12-28 13:33

hadoop面试问题

1当前你们公司使用的Hadoop版本是什么Hadoopcdh-5.7.6/hadoop-2.6.02HDFS常见的数据压缩格式有哪些，介绍其中一种详细的实现方式Gzip优点是压缩率高，速度快。

code学习社·2023-12-28 13:31

【Hadoop】RPC在client端的源码解析

最近在看《Hadoop2.XHDFS源码剖析》这本书（其实看了挺久的，但是进度比较慢），要看懂hadoop源码真的是需要一定的代码和框架的基础，用到的东西还真是蛮多的，真的厉害，哎，我太菜了~我们会用hadoop

lsr40·2023-12-28 13:01

推荐频道

Hadoop大数据相关