E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
HADOOP
计算机毕业设计
Hadoop
+Spark+DeepSeek-R1大模型民宿推荐系统 hive民宿可视化 民宿爬虫 大数据毕业设计(源码+LW文档+PPT+讲解)
一、项目简介本项目基于
Hadoop
、Spark、DeepSeek-R1构建一个高效的大数据民宿推荐系统,涵盖数据爬取、存储、处理、分析、可视化、AI推荐等完整流程,并提供Hive可视化分析及大数据爬虫,
金枝玉叶9
·
2025-06-04 19:51
程序员知识储备1
程序员知识储备2
程序员知识储备3
hadoop
大数据
课程设计
【面试宝典】70道Hive高频题库整理(附答案背诵版)
Hive是一个基于
Hadoop
的数据仓库工具,它可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。
想念@思恋
·
2025-06-04 10:11
数据仓库
面试宝典
面试
hive
职场和发展
面试专区|【68道Hbase高频题整理(附答案背诵版)】
换句话说,Hbase是Apache
Hadoop
生态系统中的一部分,可以为大数据应用提供快速的随机读写访问。
尺小闹
·
2025-06-04 10:40
面试专区
面试
hbase
职场和发展
70道Hive高频题整理(附答案背诵版)
Hive是一个基于
Hadoop
的数据仓库工具,它可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。
编程大全
·
2025-06-04 09:08
面试题
Hive
Hive面试题
hive的数据库操作
前言基于
hadoop
集群搭建hive仓库,
hadoop
集群搭建和hive数据仓库搭建。关于hive的表和数据库详细操作。一、数据库操作1.创建数据库语法格式如下。
Supplant
·
2025-06-03 15:24
hive
数据库
hadoop
Hadoop
学习笔记
(1)
Hadoop
概述
Hadoop
是一个开源的分布式计算和存储框架,用于处理大规模数据集(大数据)的并行处理。
wyn20001128
·
2025-06-03 12:06
hadoop
学习
笔记
HDFS 读写流程代码级深度解析
HDFS读写流程代码级深度解析基于
Hadoop
3.3.4源码,聚焦关键类与方法实现一、HDFS写入流程核心代码解析1.客户端初始化写入流//客户端创建文件输出流FileSystemfs=FileSystem.get
北漂老男人
·
2025-06-03 12:35
HDFS
hdfs
hadoop
大数据
python 大数据框架-马士兵python大数据和java架构
hadoop
-大数据启蒙-初识HDFS【回放】
hadoop
-大数据启蒙-初识HDFS(6月11日20:00-22:00)免费试学02
hadoop
-HDFS理论基础读写流程【回放】
hadoop
-HDFS理论基础读写流程
weixin_39938724
·
2025-06-03 12:35
通过一个对数据的存储和分析的简单实例初识
Hadoop
对于一个刚刚接触
Hadoop
的菜鸟来说,
Hadoop
的概念还是挺抽象的,而且这个技术刚刚兴起,除了阿里巴巴,腾讯、中国移动这些技术实力非常强而且需要对数据进行海量存储的公司对
Hadoop
技术有一些初步应用以外
weixin_34377065
·
2025-06-03 12:35
大数据
Hadoop
大数据启蒙:初识 HDFS
Hadoop
大数据启蒙:初识HDFS(含命令与架构详解)关键词:
Hadoop
、HDFS、分布式存储、NameNode、DataNode、大数据入门一、什么是HDFS?
北漂老男人
·
2025-06-03 12:01
HDFS
hadoop
大数据
hdfs
Hbase
HBASEhbase是一个分布式的基于列式存储Nosql数据库,基于
Hadoop
的hdfs存储,zookeeper进行管理;适合存储半结构化或者非结构话数据,1.hbase的原理?
蓝色的猴子
·
2025-06-02 19:27
hbase
数据库
大数据
MapReduce分布式计算框架简介
Hadoop
d分布式计算框架——MapReduce一、MapReduce简介1.概念MapReduce是基于
Hadoop
的分布式计算框架。
我玩的很开心
·
2025-06-02 15:59
mapreduce
hadoop
【爆肝整理】Hive 压缩性能优化全攻略!从 MapReduce 底层逻辑到企业级实战(附 Snappy/LZO/Gzip 选型对比 + 避坑指南)
在大数据处理领域,Hive作为
Hadoop
生态中重要的数据仓库工具,其性能优化一直是工程实践中的核心课题。
线条1
·
2025-06-01 20:46
hive
wxml报错原因_hive启动报错:Caused by: java.lang.IllegalArgumentException: java.net.UnknownHostException: ns1...
目录报错内容Exceptioninthread"main"java.lang.RuntimeException:org.apache.
hadoop
.hive.ql.metadata.HiveException
weixin_39582569
·
2025-06-01 13:54
wxml报错原因
实时数仓flick+clickhouse启动命令
FlinkCDC环境部署启动flink-yarn模式1、启动zookeeperzk.shstart2、启动DFS,
Hadoop
集群start-dfs.sh3、启动yarnstart-yarn.sh4、启动
遥遥领先zzl
·
2025-06-01 06:06
服务器
数据库
运维
Spark基础笔记之启动命令顺序
系统环境(三台虚拟机)node1192.168.32.101(主)node2192.168.32.102node3192.168.32.1031、启动hdfs、yarn、historyserver(
hadoop
java刘先生
·
2025-06-01 05:56
spark
笔记
大数据
浅谈Hive SQL的优化
目前团队的数据处理都在
Hadoop
集群上,一是因为需要处理的数据量都是亿级的,这种规模的数据适合用
Hadoop
集群并行处理;二是免除了分库分表给查询处理上带来的麻烦。
CodeZhuxh
·
2025-06-01 04:54
大数据
sparksql
hive
sql
hadoop
kettle mysql hdfs_kettle 将mysql 导入到hive(借助
Hadoop
File Output组件)
所以想了一个其他的办法,通过kettle提供的
Hadoop
FileOutput组件将数据以数据文件的方式导入到
hadoop
的hdfs。
hzzonline
·
2025-05-31 19:50
kettle
mysql
hdfs
Java在大数据处理中的应用:
Hadoop
与Spark
Java在大数据处理中的应用:
Hadoop
与Spark大家好,我是微赚淘客系统3.0的小编,是个冬天不穿秋裤,天冷也要风度的程序猿!
微赚淘客机器人开发者联盟@聚娃科技
·
2025-05-31 19:19
java
hadoop
spark
Hadoop
MapReduce:大数据处理利器
Hadoop
的MapReduce是一种用于处理大规模数据集的分布式计算框架,基于“分而治之”思想设计。
不辉放弃
·
2025-05-31 12:27
hadoop
大数据
Hadoop
复习(一)
初识
Hadoop
分别从选择题、大题和复习Linux命令来复习选择题问题1单项选择难度级别32分下面哪一个不属于Google的三驾马车?
丸卜
·
2025-05-31 07:26
hadoop
大数据
Hadoop
端口号及常用配置文件
一、常用端口号
hadoop
3.x:HDFSNameNode内部通常端口:8020/9000/9820HDFSNameNode对用户的查询端口:9870Yarn查看任务运行情况的端口:8088历史服务器:
m0_63648117
·
2025-05-31 01:07
hadoop
hadoop
大数据
分布式
Hadoop
常用端口及配置文件
Hadoop
常用端口号
Hadoop
常用端口号
Hadoop
2.X
Hadoop
3.XHDFSNameNode内部通信端口8020/90008020/9000/9820HDFSNameNodeweb端口500709870HDFSDataNodeweb
耐码
·
2025-05-31 01:07
hadoop
大数据
Hadoop
常用端口号和配置文件
常用端口号有:
hadoop
2.x
Hadoop
3.x访问HDFS端口500709870访问MR执行情况端口80888088历史服务器1988819888客户端访问集群端口90008020常用配置文件
hadoop
2
jiedaodezhuti
·
2025-05-31 00:05
hadoop
大数据
分布式
大数据作业优化:资源调度、并行度、数据倾斜处理实战
一、资源调度概览:YARN/K8s/FlinkResourceManager调度框架优势特点适用场景YARN队列资源隔离,
Hadoop
兼容性好大量离线批处理作业Kubernetes容器调度弹性强,支持资源
晴天彩虹雨
·
2025-05-30 13:13
Flink
+
Kafka
实时数仓实战
大数据
数据仓库
flink
kafka
big
data
zookeeper相关
它由Apache开发,是Apache
Hadoop
生态系统的一部分,但也被许多其他分布式系统使用。
初学者杰克
·
2025-05-30 08:36
zookeeper
分布式
一文看懂
Hadoop
生态:原理、组件对比、技术选型与典型应用
一文看懂
Hadoop
生态:原理、组件对比、技术选型与典型应用前言随着互联网和物联网的发展,数据量呈爆炸式增长。传统数据库已经无法高效处理海量数据存储与分析问题。
北漂老男人
·
2025-05-30 08:05
Hadoop
hadoop
大数据
分布式
学习方法
Spark、
Hadoop
对比
目录Spark和
Hadoop
的对比总结1.架构对比
Hadoop
Spark2.性能对比
Hadoop
Spark3.数据处理模式
Hadoop
Spark4.易用性
Hadoop
Spark5.生态系统
Hadoop
*
大数据知识搬运工
·
2025-05-30 05:41
spark学习
spark
hadoop
spark-shell 启动 以及 例子
[root@cdh1
hadoop
]#spark-shellbash:spark-shell:commandnotfound[root@cdh1
hadoop
]#source/etc/profile[root
5icode.top
·
2025-05-30 05:09
spark
spark
《基于
Hadoop
的青岛市旅游景点游客行为分析系统设计与实现》开题报告
目录一、选题依据1.选题背景2.国内外研究现状(1)国内研究现状(2)国外研究现状3.发展趋势4.应用价值二、研究内容1.学术构想与思路2.拟解决的关键问题3.拟采取的研究方法4.技术路线(1)旅游前准备阶段(2)旅游中的实际体验阶段(3)旅游后的反馈阶段(4)数据采集指标(5)数据分析指标(5)分析方法(6)系统实现5.实施方案(1)需求调研阶段(2)数据处理阶段(3)模型处理阶段(4)系统设计
大数据蟒行探索者
·
2025-05-30 05:35
hadoop
大数据
分布式
课程设计
python
大数据处理框架:从
Hadoop
到 Spark 的深度对比与实战
Hadoop
和Spark作为两个经典的大数据处理框架,各自有着独特的优势和应用场景。深入了解它们的差异,并通过实战掌握其使用方法,对于大数据开发者和分析师至关重要。
数字魔方操控师
·
2025-05-29 05:51
hadoop
spark
大数据
hive运行报错Error during job, obtaining debugging information..FAILED: Execution Error, return code 2
问题:Errorduringjob,obtainingdebugginginformation..FAILED:ExecutionError,returncode2fromorg.apache,
hadoop
.hive.ql.exec.mr.MapRedTaskMapReduceJobsLaunched
lina_999
·
2025-05-28 17:53
大数据集群环境搭建
hive
hive
hadoop
大数据
大数据毕业设计选题推荐-图书数据分析系统-图书推荐系统-Python数据可视化-Hive-
Hadoop
-Spark
✨作者主页:IT毕设梦工厂✨个人简介:曾从事计算机专业培训教学,擅长Java、Python、PHP、.NET、Node.js、GO、微信小程序、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。☑文末获取源码☑精彩专栏推荐⬇⬇⬇Java项目Python项目安卓项目微信小程序项目文章目录一、前言二、开发环境三、系统界面展示四、部分代码设计五、论文参考六、系统视频结语
IT毕设梦工厂
·
2025-05-28 11:40
大数据项目
大数据
hadoop
课程设计
毕业设计
python
数据分析
hive
【Hive基础】01.数据模型、存储格式、排序方式
五种数据模型各数据模型之间的区别1.1分区表与分桶表的区别2、五种常用存储格式2.1Hive存储结构的比较2.2Hive常用的存储格式3、四种主要排序方式学习笔记参考:Hive基础知识Hive是一个构建在
Hadoop
TU不秃头
·
2025-05-28 09:58
#
大数据理论知识库
hive
hadoop
数据仓库
Hadoop
MapReduce计算框架原理与代码实例讲解
Hadoop
MapReduce计算框架原理与代码实例讲解1.背景介绍1.1大数据处理的挑战随着互联网、物联网等技术的发展,数据呈现爆炸式增长。如何高效处理海量数据成为了一大挑战。
AI天才研究院
·
2025-05-28 03:40
AI大模型企业级应用开发实战
AI大模型应用入门实战与进阶
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
HADOOP
+HBASE存储Azure中storage
Hdfs+hbase持久化到azurestorageHbase版本:hbase-2.5.10-
hadoop
3-bin.tar.gz
Hadoop
版本:
hadoop
-3.3.6.tar.gz环境变量配置:
CaHi
·
2025-05-28 03:39
hadoop
hbase
azure
大数据
ubuntu
linux
sqoop mysql导入hive报错_使用sqoop从mysql导入数据到hive
环境:系统:Centos6.5
Hadoop
:Apache,2.7.3Mysql:5.1.73JDK:1.8Sqoop:1.4.7
Hadoop
以伪分布式模式运行。
weixin_39866881
·
2025-05-28 03:38
sqoop
mysql导入hive报错
数据仓库基础知识总结
分别是:数据仓库技术、
Hadoop
。当数据为
数字天下
·
2025-05-27 09:40
数据仓库
大数据技术全景解析:HDFS、HBase、MapReduce 与 Chukwa
于是,以
Hadoop
生态系统为代表的大数据技术应运而生。本文将带你走进大数据的世界,重点介
coding随想
·
2025-05-27 08:04
大数据
大数据
hdfs
hbase
Hadoop
生态系统中的大数据基础知识教程
作者:禅与计算机程序设计艺术1.简介“
Hadoop
”是一个开源的分布式计算框架,基于云计算平台构建,提供海量数据的存储、分析处理和计算能力,广泛应用于金融、电信、互联网、移动通信等领域。
AI天才研究院
·
2025-05-26 22:39
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
Hive实战讲解-1
Hive是基于
Hadoop
的一个数据仓库工具,它构建在HDFS(
Hadoop
分布式文件系统)之上,提供了类SQL的查询语言HiveQL,允许用户以类似操作关系型数据库的方式处理和分析大规模数据集,将结构化的数据文件映射为一张数据库表
数字化与智能化
·
2025-05-26 11:04
Hive数据仓库
hive
使用MapReduce统计TopN数据
二、实验内容使用
Hadoop
生态组件(文件系统HDFS,处理引擎MapReduce),基于机票销售记录数据集,完成特定数据分析任务。
PhoneMeWhenNecessary
·
2025-05-26 09:20
hadoop
大数据
mapreduce
数据结构
《
Hadoop
大数据技术原理与应用》(第2版)黑马程序员的课后习题答案
《
Hadoop
大数据技术原理与应用(第2版)》课后习题答案第1章初始
Hadoop
一、填空题1.半结构化数据、非结构化数据2.多样、低价值密度、高速3.Nutch4.高容错性、高效率、高扩展性二、判断题1
一只破豆豆
·
2025-05-25 14:15
大数据
hadoop
分布式
[
Hadoop
学习笔记 1]
Hadoop
伪分布式环境部署(OpenSUSE 15.6 + Oracle JDK 8)
一、安装JDK本文所搭建
Hadoop
伪分布式环境将使用OracleJDK8,将从OracleJavaSE8ArchiveDownloads页面中下载Linux版本的JDK,下载地址如下:JavaArchiveDownloads-JavaSE8u211andlater
狼鸭-使银狼永远伟大
·
2025-05-24 21:26
Hadoop学习笔记
分布式
hadoop
学习
java
大数据
hdfs
yarn
Flink基于Yarn多种启动方式详解
Flink与Yarn深度集成后,不仅充分利用
Hadoop
生态资源,还能灵活应对各种作业调度和资源隔离需求。本文将系统介绍FlinkonYarn的多种启动方式、适用场景、配置方法及常见问题。
北漂老男人
·
2025-05-24 19:42
Flink
flink
java
大数据
HDFS&Hive介绍
HDFSHDFS:
Hadoop
分布式文件存储系统HDFS架构包含Client、NameNode和DataNode。可以简单的认为有一个NameNode和多个DataNode。
正则化
·
2025-05-24 17:32
数据存储
Hadoop
中HDFS、Hive 和 HBase三者之间的关系
HDFS(
Hadoop
DistributedFileSystem)、Hive和HBase是
Hadoop
生态系统中三个重要的组件,它们各自解决了大数据存储和处理的不同层面的问题。
[听得时光枕水眠]
·
2025-05-24 17:02
hadoop
hdfs
hive
centOS7系统虚拟机节点的搭建
配置node02和node03环境7.配置映射8.关闭防火墙9.关闭SElinux10.Xshell连接linux11.免密登录总结前言随着计算机的发展,越来越多的人认识到大数据的优点,这时就不得不提
Hadoop
在山海相见
·
2025-05-24 15:50
大数据
centos
linux
Hadoop
系列二
写在前面生产上,集群的机器,总内存的75%,25%留给系统、Linux机制、以及防止OOM-killer。oom-killer机制当LInux服务器某个进程使用内存超标,Linux机器为了保护自己,主动杀死你的进程,释放内存。tmp目录30天机制数据本地化生产上部署一般遵循存储技术一体,就是计算时发现本节点有数据不需要网络传输,这种一般叫做数据本地化。2.1container容器container
qiyong7578
·
2025-05-23 12:38
hadoop
hadoop
资源管理器yarn的简单介绍
一.什么是yarnApache
Hadoop
YARN(YetAnotherResourceNegotiator,另一种资源协调者)是一种新的
Hadoop
资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度
永远不要矫情
·
2025-05-23 12:37
yarn
hadoop
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他