Hadoop大数据技术

hadoop-HDFS操作

1.使用的是hadoop的用户登录到系统，那么cd~是跳转到/home/hadoop下。2.在操作hdfs时，需要在hadoop用户下的/usr/local/hadoop，此时是在根目录下。

wenying_44323744·2025-03-24 19:02

MySQL中处理JSON数据

一、JSON数据类型引入的背景随着大数据技术的迅猛发展和普及，数据量的爆炸性增长对数据处理能力提出了前所未有的挑战。

小村学长毕业设计·2025-03-24 19:32

Hadoop安装

Hadoop的安装方式有三种，分别是单机模式，伪分布式模式，分布式模式。单机模式：单机模式：Hadoop默认模式为非分布式模式（本地模式），无需进行其他配置即可运行。

Cindy_0124·2025-03-24 19:59

数据权限访问控制（Apache Sentry）

ApacheSentry最初由Cloudera公司内部开发，针对Hadoop系统中的数据（主要是HDFS、Hive的数据）进行细粒度控制，对HDFS、Hive以及Impala有着良好的支持性。

deepdata_cn·2025-03-24 14:56

hbase表无法删除，命令行卡住问题处理

问题现象hbase表无法删除，命令行卡住1.activemaster日志出现超时WARNorg.apache.hadoop.hbase.master.procedure.TruncateTableProcedure

spring208208·2025-03-24 11:59

【Linux 下的 bash 无法正常解析, Windows 的 CRLF 换行符问题导致的】

hadoop@hadoop:~/anaconda3$bashwait_for_gpu.sh:invalidopt

待磨的钝刨·2025-03-23 18:53

大数据技术实战---项目中遇到的问题及项目经验

项目中遇到过哪些问题7.1Hadoop宕机（1）如果MR造成系统宕机。此时要控制Yarn同时运行的任务数，和每个任务申请的最大内存。

一个“不专业”的阿凡·2025-03-23 16:05

Apache大数据旭哥优选大数据选题

售后态度和技术都很重要定制按需求做要求不高就实惠一点定制需提前沟通好怎么做，这样才能避免不必要的麻烦python、flask、Django、mapreduce、mysqljava、springboot、vue、echarts、hadoop

Apache大数据旭·2025-03-23 13:12

【Hive】-- hive 3.1.3 伪分布式部署（单节点）

1、环境准备1.1、版本选择apachehive3.1.3apachehadoop3.1.0oraclejdk1.8mysql8.0.15操作系统：Macos10.151.2、软件下载https://archive.apache.org

oo寻梦in记·2025-03-23 12:08

Java后端开发技术详解

随着云计算、微服务架构和大数据技术的兴起，Java后端开发的技术栈也不断演进。本文将详细介绍Java后端开发的核心技术，包括Java基础、常见框架、数据库操作、缓存技术、异步编程等。

小二爱编程··2025-03-23 12:34

【Linux】Hadoop-3.4.1的伪分布式集群的初步配置

配置步骤一、检查环境JDK#目前还是JDK8最适合Hadoopjava-versionecho$JAVA_HOMEHadoophadoopversionecho$HADOOP_HOME二、配置SSH免密登录

孤独打铁匠Julian·2025-03-23 11:04

Hadoop 集群规划与部署最佳实践

作者：禅与计算机程序设计艺术1.简介2009年2月2日，ApacheHadoop项目诞生。它是一个开源的分布式系统基础架构，用于存储、处理和分析海量的数据。

AI天才研究院·2025-03-23 03:47

MySQL 到 Hadoop：Sqoop 数据迁移 ETL

文章目录ETL：Extract-Transform-Load数据迁移过程一、Extract数据抽取1.ODS：OperationalDataStore-可操作数据存储2.DW：DataWarehouse-数据仓库3.DM：DataMart-数据集市二、Transform数据清洗和转换1.数据清洗2.数据转换三、Load数据加载四、数据迁移方法1.Sqoop1.1MySQL->Hive1.1.1im

Ice星空·2025-03-23 03:45

HBase安装

需要用Java和Hadoop来处理HBase，所以必须下载java和Hadoop并安装系统中。安装前设置安装Hadoop在Linux环境下之前，需要建立和使用LinuxSSH(安全Shell)。

lianhedaxue·2025-03-23 01:01

HBase的架构介绍，安装及简单操作

Hadoop环境：HBase依赖于Hadoop，需要先安装并配置好Hadoop集群。确保Hadoop的相关服务（如HDFS、YARN等）已经正常启动。

pk_xz123456·2025-03-23 01:00

努力的搬砖人.·2025-03-22 18:16

hadoop3.x--搭建hadoop高可用集群（HA模式）

hadoop高可用集群（HA模式）一、安装前1.集群规划2.安装前配置3.安装jdk与hadoop4.克隆虚拟机与互信配置5.搭建zookeeper集群二、HDFS1.配置hdfs2.初始化启动hdfs

运维小菜·2025-03-22 14:17

在虚拟机上安装Hadoop

基本步骤与安装java一致:先用finalshell将hadoop-3.1.3.tar.gz导入到opt目录下面的software文件夹下面，然后解压,最后配置环境变量。

杜清卿·2025-03-22 07:58

hadoop集群配置-scp拓展使用

任务1：在hadoop102上，将hadoop101中/opt/module/hadoop-3.1.3目录拷贝到hadoop102上。

杜清卿·2025-03-22 06:28

大数据学习（75）-大数据组件总结

如果觉得博主的文章还不错的话，请点赞+收藏⭐️+留言支持一下博主哦一、CDHCDH（ClouderaDistributionIncludingApacheHadoop)是由Cloudera公司提供的一个集成了

viperrrrrrr·2025-03-21 22:42

Sqoop安装部署

ApacheSqoop简介Sqoop（SQL-to-Hadoop）是Apache开源项目，主要用于：将关系型数据库中的数据导入Hadoop分布式文件系统（HDFS）或相关组件（如Hive、HBase）。

愿与狸花过一生·2025-03-21 22:10

ssh命令

命令无需密码也可登录要先关闭防火墙，命令如下：systemctlstopfirewalldsystemctldisablefirewalldsystemctlstatusfirewalldeg：目标：hadoop100

满分对我强制爱·2025-03-21 18:32

LakeHouse湖仓一体成为下一站灯塔，数仓、数据湖架构即将退出群聊

摘要：当前的大数据技术应用趋势表明，客户对单一的数据湖和数仓架构并不满意。

科杰科技·2025-03-21 17:26

Hive面试题

HiveCLI/Beeline和WebUI2.HiveQL3.HiveDriver（驱动）4.Metastore5.Compiler（编译器）6.Optimizer（优化器）7.Executor（执行器）8.HadoopCoreComponents

御风行云天·2025-03-21 13:24

数智读书笔记系列021《大数据医疗》：探索医疗行业的智能变革

这本书系统且深入地探讨了大数据技术在医疗领域的应用与变革，对推动医疗行业的智能化发展具有重要的理论

Allen_Lyb·2025-03-21 10:55

#Hadoop全分布式安装 #mysql安装 #hive安装

分布式（多台机器部署不同组件）与集群（多台机器部署相同组件）概念。Linux基础命令linux具有文件数：目录、文件，从根目录开始，路径具有唯一性。pwd：显示当前路径特殊符号：/：根目录.：隐藏文件，如果路径以.开始，表示当前目录下..：当前目录下的上一级~：当前目录的home目录--help：帮助命令使用linux常用操作命令tab键：自动补全ls：显示指定目录内容默认：当前路径-a：显示所有

砸吧砸吧·2025-03-21 09:14

Hadoop（在Linux中安装jdk）

安装之前需准备：1.需要远程连接软件2.需要jdk3.需要准备两个文件夹01/export/software安装包02/export/servers解压文件夹现在正式开始安装1.将压缩包存放在/export/software目录下2.进入到software目录进行解压cd/export/software（切换目录）tar-zxvfjdk-8u202-linux-x64.tar.gz-C/expor

錠诗味·2025-03-21 03:34

数据仓库和非结构化数据。

存储影响性能如果是hadoop无所谓影响不大，但是从使用者的角度非结构化数据只能转换关系使用建一张元数据表存储非结构化存储位置

weixin_30631587·2025-03-21 03:33

CentOS 7系统中hadoop的安装和环境配置

1.创建Hadoop安装解压路径：mkdir-p/usr/hadoop2.进入路径：cd/usr/hadoop3.下载安装包（我这里用的是阿里云镜像压缩包）：wgethttps://mirrors.aliyun.com

代码小张z·2025-03-21 01:15

尚硅谷电商数仓6.0，hive on spark,spark启动不了

42000][40000]Errorwhilecompilingstatement:FAILED:SemanticExceptionFailedtogetasparksession:org.apache.hadoop.hive.ql.metadata.HiveException

新时代赚钱战士·2025-03-20 20:57

努力的搬砖人.·2025-03-20 01:53

数据湖：Apache Iceberg在腾讯的探索和实践

本文结合腾讯大数据技术分享内容和2020全球软件开发大会分享内容进行整理，主要内容包括：1、数据湖技术概述2、ApacheIceberg的简介3、腾讯为什么选择ApacheIceberg4、腾讯看点万亿数据下的业务痛点

学而知之@·2025-03-20 00:15

Apache Doris整合Iceberg + Flink CDC构建实时湖仓体的联邦查询分析架构

随着大数据技术的迅猛发展，构建实时湖仓体并进行联邦查询分析成为了许多企业的迫切需求。

MfvShell·2025-03-20 00:10

Flink读取kafka数据并写入HDFS

硬刚大数据系列文章链接：2021年从零到大数据专家的学习指南(全面升级版)2021年从零到大数据专家面试篇之Hadoop/HDFS/Yarn篇2021年从零到大数据专家面试篇之SparkSQL篇2021

王知无(import_bigdata)·2025-03-19 22:59

Apache storm

基本上Hadoop和Storm框架用于分析大数据。两者互补，在某些方面有所不同。ApacheStorm执行除持久性之外的所有

赵世炎·2025-03-19 19:09

什么是Apache Avro？

它由ApacheHadoop项目开发，广泛应用于大数据生态系统中（如Hadoop、Kafka等）。Avro提供了一种紧凑、快速的二进制数据格式，同时支持丰富的数据结构和模式演化。

maozexijr·2025-03-19 19:32

计算机毕业设计之基于Hadoop的热点新闻分析系统的设计与实现

本文拟采用PyCharm开发工具，django框架、Python语言、Hadoop大数据处理技术进行开发，后台使用MySQL数据库进行信息管理，设计开发的热点新闻分析系统。

微信bishe69·2025-03-19 18:31

Hadoop 实战笔记（二）-- HDFS 常用 shell 命令总结

一、HDFS命令显示当前目录结构#显示当前目录结构hadoopfs-ls#递归显示当前目录结构hadoopfs-ls-R#显示根目录下内容hadoopfs-ls/创建目录#创建目录hadoopfs-mkdir

dazhong2012·2025-03-19 17:48

How Spark Read Sftp Files from Hadoop SFTP FileSystem

3.5.3'){excludegroup:"org.apache.logging.log4j",module:"log4j-slf4j2-impl"}implementation('org.apache.hadoop

IT•轩辕·2025-03-19 13:18

中电金信25/3/18面前笔试（需求分析岗+数据开发岗）

一、需求分析第1题，单选题,Hadoop的核心组件包括HDFS和以下哪个？

苍曦·2025-03-19 12:43

Spark集群启动与关闭

Hadoop集群和Spark的启动与关闭Hadoop集群开启三台虚拟机均启动ZookeeperzkServer.shstartMaster1上面执行启动HDFSstart-dfs.shslave1上面执行开启

陈沐·2025-03-18 23:17

Hive函数大全：从核心内置函数到自定义UDF实战指南（附详细案例与总结）

用户自定义函数（UDF）分类二、常用函数详解与实战案例‌1.数学函数‌2.字符串函数‌3.窗口函数‌4.自定义UDF实战‌三、总结与优化建议‌1.核心总结2.性能优化建议‌3.常问问题背景‌Hive作为Hadoop

一个天蝎座白勺程序猿·2025-03-18 23:45

Hadoop MapReduce 词频统计（WordCount）代码解析教程

一、概述这是一个基于HadoopMapReduce框架实现的经典词频统计程序。程序会统计输入文本中每个单词出现的次数，并将结果输出到HDFS文件系统。

我不是少爷.·2025-03-18 17:07

从“笨重大象”到“敏捷火花”：Hadoop与Spark的大数据技术进化之路

从“笨重大象”到“敏捷火花”：Hadoop与Spark的大数据技术进化之路说起大数据技术，Hadoop和Spark可以说是这个领域的两座里程碑。

Echo_Wish·2025-03-18 12:57

hadoop集群关闭命令顺序_启动和关闭Hadoop集群命令步骤

启动和关闭Hadoop集群命令步骤总结：1.在master上启动hadoop-daemon.shstartnamenode.2.在slave上启动hadoop-daemon.shstartdatanode

氪老师·2025-03-18 12:55

在kali linux中配置hadoop伪分布式

目录一.配置静态网络二.配置主机名与IP地址映射三.配置SSH免密登录四.配置Java和Hadoop环境五.配置Hadoop伪分布式六.启动与验证一.配置静态网络原因：Hadoop集群依赖稳定的网络通信

we19a0sen·2025-03-18 11:47

Spark任务读取hive表数据导入es

使用elasticsearch-hadoop将hive表数据导入es，超级简单1.引入pomorg.elasticsearchelasticsearch-hadoop9.0.0-SNAPSHOT2.创建

小小小小小小小小小小码农·2025-03-17 18:25

hive-进阶版-1

第6章hive内部表与外部表的区别Hive是一个基于Hadoop的数据仓库工具，用于对大规模数据集进行数据存储、查询和分析。

数据牧马人·2025-03-17 10:59

204页数字化转型：集团企业信息化规划方案

建立统一共享的信息平台，集团总部能实时监控下属单位的库存、产量、成本、资金流等关键信息，有效利用大数据技术平台为管理层提供全面、及时、准确的决策信息支持。

公众号：智慧方案文库·2025-03-17 03:01

大数据手册(Spark)--Spark安装配置

若安装包下载缓慢，可复制链接到迅雷下载，亲测极速～准备工作Spark的安装过程较为简单，在已安装好Hadoop的前提下，经过简单配置即可使用。

WilenWu·2025-03-16 20:09

推荐频道