E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop学习日记
浅谈MapReduce
从今天开始,本人将会开始对另一项技术的学习,就是当下炙手可热的
Hadoop
分布式就算技术。目前国内外的诸多公司因为业务发展的需要,都纷纷用了此平台。
Android路上的人
·
2024-09-16 04:40
Hadoop
分布式计算
mapreduce
分布式
框架
hadoop
Hadoop
Apache
Hadoop
是一个开源的分布式计算框架,主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。
傲雪凌霜,松柏长青
·
2024-09-16 00:16
后端
大数据
hadoop
大数据
分布式
Hadoop
架构
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代,数以万计用户的互联网服务时时刻刻都在产生大量的交互,要处理的数据量实在是太大了,以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现,在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合,
henan程序媛
·
2024-09-16 00:14
hadoop
大数据
分布式
分享一个基于python的电子书数据采集与可视化分析
hadoop
电子书数据分析与推荐系统 spark大数据毕设项目(源码、调试、LW、开题、PPT)
作者:计算机源码社个人简介:本人八年开发经验,擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等,大家有这一块的问题可以一起交流!学习资料、程序开发、技术解答、文档报告如需要源码,可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
计算机源码社
·
2024-09-15 20:02
Python项目
大数据
大数据
python
hadoop
计算机毕业设计选题
计算机毕业设计源码
数据分析
spark毕设
hbase介绍
hbase是一个分布式的、多版本的、面向列的开源数据库hbase利用
hadoop
hdfs作为其文件存储系统,提供高可靠性、高性能、列存储、可伸缩、实时读写、适用于非结构化数据存储的数据库系统hbase利用
CrazyL-
·
2024-09-15 13:06
云计算+大数据
hbase
大数据毕业设计
hadoop
+spark+hive知识图谱租房数据分析可视化大屏 租房推荐系统 58同城租房爬虫 房源推荐系统 房价预测系统 计算机毕业设计 机器学习 深度学习 人工智能
做了那么多年开发,自学了很多门编程语言,我很明白学习资源对于学一门新语言的重要性,这些年也收藏了不少的Python干货,对我来说这些东西确实已经用不到了,但对于准备自学Python的人来说,或许它就是一个宝藏,可以给你省去很多的时间和精力。别在网上瞎学了,我最近也做了一些资源的更新,只要你是我的粉丝,这期福利你都可拿走。我先来介绍一下这些东西怎么用,文末抱走。(1)Python所有方向的学习路线(
2401_84572577
·
2024-09-15 10:20
程序员
大数据
hadoop
人工智能
Spark集群的三种模式
文章目录1、Spark的由来1.1
Hadoop
的发展1.2MapReduce与Spark对比2、Spark内置模块3、Spark运行模式3.1Standalone模式部署配置历史服务器配置高可用运行模式
MelodyYN
·
2024-09-15 01:16
#
Spark
spark
hadoop
big
data
月度总结 | 2022年03月 | 考研与就业的抉择 | 确定未来走大数据开发路线
申请到了校图书馆的考研专座,决定暂时放弃就业,先准备考研,买了数学和408的资料书3月9日-3月13日,因疫情原因,宿舍区暂封,这段时间在准备考研,发现内容特别多3月13日-3月19日,大部分时间在刷
Hadoop
「已注销」
·
2024-09-14 23:30
个人总结
hadoop
HBase介绍
HBase是GoogleBigtable的开源实现,它利用
Hadoop
HDFS作为其文件存储系统,利用
Hadoop
MapReduce来处理HBase中的海量数据,利用Zookeeper作为协同服务。
mingyu1016
·
2024-09-14 21:47
数据库
Java中的大数据处理框架对比分析
本文将重点介绍Apache
Hadoop
、ApacheSpark、ApacheFlink和ApacheStorm这四种流行的
省赚客app开发者
·
2024-09-14 20:41
java
开发语言
Hadoop
windows intelij 跑 MR WordCount
一、软件环境我使用的软件版本如下:IntellijIdea2017.1Maven3.3.9
Hadoop
分布式环境二、创建maven工程打开Idea,file->new->Project,左侧面板选择maven
piziyang12138
·
2024-09-14 12:33
Hadoop
学习第三课(HDFS架构--读、写流程)
1010ml,瓶子的规格200ml=>需要6个瓶子装完块的大小规格,只要是需要存储,哪怕一点点,也是要占用一个块的块大小的参数:dfs.blocksize官方默认的大小为128M官网:https://
hadoop
.apache.org
小小程序员呀~
·
2024-09-14 03:53
数据库
hadoop
架构
big
data
hadoop
启动HDFS命令
启动命令:/
hadoop
/sbin/start-dfs.sh停止命令:/
hadoop
/sbin/stop-dfs.sh
m0_67401228
·
2024-09-14 03:49
java
搜索引擎
linux
后端
【计算机毕设-大数据方向】基于
Hadoop
的电商交易数据分析可视化系统的设计与实现
博主介绍:✌全平台粉丝5W+,高级大厂开发程序员,博客之星、掘金/知乎/华为云/阿里云等平台优质作者。【源码获取】关注并且私信我【联系方式】最下边感兴趣的可以先收藏起来,同学门有不懂的毕设选题,项目以及论文编写等相关问题都可以和学长沟通,希望帮助更多同学解决问题前言随着电子商务行业的迅猛发展,电商平台积累了海量的数据资源,这些数据不仅包括用户的基本信息、购物记录,还包括用户的浏览行为、评价反馈等多
程序员-石头山
·
2024-09-13 13:19
大数据实战案例
大数据
hadoop
毕业设计
毕设
分布式离线计算—Spark—基础介绍
原文作者:饥渴的小苹果原文地址:【Spark】Spark基础教程目录Spark特点Spark相对于
Hadoop
的优势Spark生态系统Spark基本概念Spark结构设计Spark各种概念之间的关系Executor
测试开发abbey
·
2024-09-13 11:11
人工智能—大数据
spark常用命令
hadoop
@wyy:/app/
hadoop
/spark100$bin/spark-submit--
我是浣熊的微笑
·
2024-09-13 10:38
spark
spark启动命令
hadoop
启动:cd/root/toolssstart-dfs.sh,只需在
hadoop
01上启动stop-dfs.sh日志查看:cat/root/toolss/
hadoop
/logs/
hadoop
-root-datanode-
hadoop
03
学不会又听不懂
·
2024-09-13 10:36
spark
大数据
分布式
编程常用命令总结
编程命令大全1.软件环境变量的配置JavaScalaSpark
Hadoop
Hive2.大数据软件常用命令Spark基本命令Spark-SQL命令Hive命令HDFS命令YARN命令Zookeeper命令
Yellow0523
·
2024-09-13 02:42
Linux
BigData
大数据
Hadoop
常见面试题整理及解答
Hadoop
常见面试题整理及解答一、基础知识篇:1.把数据仓库从传统关系型数据库转到
hadoop
有什么优势?答:(1)关系型数据库成本高,且存储空间有限。
叶青舟
·
2024-09-12 19:24
Linux
hdfs
大数据
hadoop
linux
2025毕业设计指南:如何用
Hadoop
构建超市进货推荐系统?大数据分析助力精准采购
⚡⚡Java实战|SpringBoot/SSMPython实战项目|Django微信小程序/安卓实战项目大数据实战项目⚡⚡文末获取源码文章目录⚡⚡文末获取源码基于
hadoop
的超市进货推荐系
计算机编程指导师
·
2024-09-11 18:08
Java实战集
Python实战集
大数据实战集
课程设计
hadoop
数据分析
spring
boot
java
进货
python
Hadoop
Common 之序列化机制小解
这不过此种序列化虽然跨病态兼容性强,但是因为存储过多的信息,但是传输效率比较低,所以
hadoop
弃用它。
猫君之上
·
2024-09-11 08:59
#
Apache
Hadoop
深入理解
hadoop
(一)----Common的实现----Configuration
一,
hadoop
的配置管理a,
hadoop
通过独有的Configuration处理配置信息Configurationconf=newConfiguration();conf.addResource("core-default.xml
maoxiao_jsd
·
2024-09-11 08:59
深入理解----hadoop
hadoop
0.22.0 部署笔记
hbase是部署在
hadoop
平台上的NOSql数据库,因此在部署hbase之前需要先部署
hadoop
。
weixin_33701564
·
2024-09-10 17:41
大数据
java
运维
解决Windows环境下
hadoop
集群的运行_window运行
hadoop
,unknown
hadoop
01(4)
org.apache.
hadoop
hadoop
-com
2401_84160087
·
2024-09-10 16:34
大数据
面试
学习
解决Windows环境下
hadoop
集群的运行_window运行
hadoop
,unknown
hadoop
01(3)
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。需要这份系统化资料的朋友,可以戳这里获取一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!xmlns:xsi="http://www.w3.or
2401_84160087
·
2024-09-10 16:04
大数据
面试
学习
深入解析HDFS:定义、架构、原理、应用场景及常用命令
引言
Hadoop
分布式文件系统(HDFS,
Hadoop
DistributedFileSystem)是
Hadoop
框架的核心组件之一,它提供了高可靠性、高可用性和高吞吐量的大规模数据存储和管理能力。
CloudJourney
·
2024-09-10 12:39
hdfs
架构
hadoop
Hadoop
的搭建流程
文章目录一、配置IP二、配置主机名三、配置主机映射四、关闭防火墙五、配置免密六、安装jdk1、第一步:2、第二步:3、第三步:4、第四步:5、第五步:七、安装
hadoop
1、上传2、解压3、重命名4、开始配置环境变量
lzhlizihang
·
2024-09-10 07:06
hadoop
大数据
分布式
hive搭建 -----内嵌模式和本地模式
文章目录一、内嵌模式(使用较少)1、上传、解压、重命名2、配置环境变量3、配置conf下的hive-env.sh4、修改conf下的hive-site.xml5、启动
hadoop
集群6、给hdfs创建文件夹
lzhlizihang
·
2024-09-10 07:06
hive
hadoop
Hadoop
之mapreduce -- WrodCount案例以及各种概念
文章目录一、MapReduce的优缺点二、MapReduce案例--WordCount1、导包2、Mapper方法3、Partitioner方法(自定义分区器)4、reducer方法5、driver(main方法)6、Writable(手机流量统计案例的实体类)三、关于片和块1、什么是片,什么是块?2、mapreduce启动多少个MapTask任务?四、MapReduce的原理五、Shuffle过
lzhlizihang
·
2024-09-10 07:06
hadoop
mapreduce
大数据
IAAS: IT公司去IOE-Alibaba系统构架解读
从
Hadoop
到自主研发,技术解读阿里去IOE后的系统架构原地址:......................云计算阿里飞天摘要:从IOE时代,到
Hadoop
与飞天并行,再到飞天单集群5000节点的实现
wishchin
·
2024-09-10 04:18
心理学/职业
BigDataMini
Spark
PaaS
Python爬虫基础总结
学习日记
目录
学习日记
一、关于爬虫1、爬虫的概念2、爬虫的优点3、爬虫的分类4、重要提醒5、反爬和反反爬机制6、协议7、常用请求头和常用的请求方法8、常见的响应状态码9、url的详解二、爬虫基本流程三、可能需要的库四
醉蕤
·
2024-09-10 03:07
Python
python
爬虫
Hadoop
HDFS中的NameNode、SecondaryNameNode和DataNode
Hadoop
HDFS中的NameNode、SecondaryNameNode和DataNode目录1.定义2.主要作用3.官方链接1.定义在
Hadoop
HDFS(
Hadoop
分布式文件系统)中,有三个关键的组件
BigDataMLApplication
·
2024-09-10 00:38
大数据
hadoop
hadoop
hdfs
大数据
【
Hadoop
|HDFS篇】NameNode和SecondaryNameNode
1.NN和2NN的工作机制思考:NameNode中的元数据是存储在哪里的?首先,我们做个假设,如果存储在NameNode节点的磁盘中,因为经常需要进行随机访问,还有响应客户请求,必然是效率过低。因此,元数据需要存放在内存中。但如果只存在内存中,一旦断电,元数据丢失,整个集群就无法工作了。因此产生在磁盘中备份元数据的Fslmage。这样又会带来新的问题,当在内存中的元数据更新时,如果同时更新FsIm
Vez'nan的幸福生活
·
2024-09-09 23:00
hadoop
hdfs
大数据
Yarn介绍 - 大数据框架
YARN的概述YARN是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台,而MapReduce等运算程序则相当于运行于操作系统之上的应用程序YARN是
Hadoop
2.x
why do not
·
2024-09-09 23:58
大数据
hadoop
浅析大数据
Hadoop
之YARN架构
YARN提供了资源管理和资源调度等机制1.1原
Hadoop
MapReduce框架对于业界的大数据存储及分布式处理系统来说,
Hadoop
是耳熟能详的卓越开源分布式文件存储及处理框架,对于
Hadoop
框架的介绍在此不再累述
haotian1685
·
2024-09-09 22:26
python
数据清洗
人工智能
大数据
大数据学习
深度学习
大数据
大数据学习
YARN
hadoop
Hadoop
YARN【一】
YARN概念YARN是一种新的
Hadoop
资源管理器,它是一个通用的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。内部组件Client:负责提交应用程序。
冷雨夜下的星空
·
2024-09-09 22:26
Hadoop生态圈
hadoop
yarn
大数据知识总结(三):
Hadoop
之Yarn重点架构原理
文章目录
Hadoop
之Yarn重点架构原理一、Yarn介绍二、Yarn架构三、Yarn任务运行流程四、Yarn三种资源调度器特点及使用场景
Hadoop
之Yarn重点架构原理一、Yarn介绍Apache
Hadoop
Yarn
Lansonli
·
2024-09-09 22:22
大数据
大数据
hadoop
架构
Yarn
starrocks和clickhouse数据库比较
支持多种数据源的集成,并且可以与其他大数据技术(如
Hadoop
、Spark)协同工作。C
CodeMaster_37714848
·
2024-09-09 16:12
clickhouse
数据库
大数据(Hbase简单示例)
importorg.apache.
hadoop
.conf.Configuration;importorg.apache.
hadoop
.hbase.HBaseConfiguration;importorg.apache.
hadoop
.hbase.TableName
BL小二
·
2024-09-09 13:18
hbase
大数据
hadoop
Hbase的简单使用示例
HBase是基于
Hadoop
HDFS构建的分布式、列式存储的NoSQL数据库,适用于存储和检索超大规模的非结构化数据。它支持随机读写,并且能够处理PB级数据。
傲雪凌霜,松柏长青
·
2024-09-09 11:40
后端
大数据
hbase
数据库
大数据
听书稿 day27
学习日记
【你的昵称】清卿【最核心的一个问题】听书稿的思维导图如何构建【谈谈你的感想】大多数书都是围绕一个关键问题来写的,我们写听书稿的时候也要围绕这个关键问题来构建文章的大纲。常见的书籍有以下四类,分别有比较成功的听书稿案例。第一类是传授方法类书籍,这类书籍包括两种:一种是直接传授方法,通常采用并列结构写作,在传授方法的同时也可以适当讲述原因和道理。第二种是原理和方法一起讲,这类书籍一般采用“先说原因,后
恰逢秋风起
·
2024-09-09 04:40
Hbase、hive以及ClickHouse的介绍和区别?
一、Hbase介绍:HBase是一个分布式的、面向列的开源数据库,由ApacheSoftwareFoundation开发,是
Hadoop
生态系统中的一个重要组件。
damokelisijian866
·
2024-09-08 23:43
hbase
hive
clickhouse
Flink - CEP
Hadoop
3.2集群新版本的搭建详细讲解过程,从下面第一张官方的图来看,最新版是3.2,所以大猪将使用3.2的版本来演示,过程中遇到的坑留给自己,把路留给你们,IT之路还有大猪。
kikiki1
·
2024-09-08 21:46
chapter01 Java语言概述 知识点Note
JavaSEJavaEEJavaME大数据Java基础常用技术栈mysqlJDBCSSMspring+springmvc+mybatisLinuxnacos
Hadoop
FlinkJAVAEE消息队列rabbitMQdocker
月下绯烟
·
2024-09-08 18:42
Java
java
开发语言
Hive和Hbase的区别
Hive和HBase都是
Hadoop
生态系统中的重要组件,它们都能处理大规模数据,但各自有不同的适用场景和设计理念。
傲雪凌霜,松柏长青
·
2024-09-08 17:37
大数据
后端
hive
hbase
hadoop
HBase
ApacheHBase是一个基于
Hadoop
分布式文件系统(HDFS)构建的分布式、面向列的NoSQL数据库,主要用于处理大规模、稀疏的表结构数据。
傲雪凌霜,松柏长青
·
2024-09-08 17:07
大数据
后端
hbase
数据库
大数据
Hive的优势与使用场景
Hive的优势Hive作为一个构建在
Hadoop
上的数据仓库工具,具有许多优势,特别是在处理大规模数据分析任务时。
傲雪凌霜,松柏长青
·
2024-09-08 17:07
后端
大数据
hive
hadoop
数据仓库
大数据技术之
Hadoop
(一)
Hadoop
概述1.1
Hadoop
是什么
Hadoop
是什么1)
Hadoop
是一个由Apache基金会所开发的分布式系统基础架构。2)主要解决,海量数据的存储和海量数据的分析计算问题。
pauls
·
2024-09-08 16:30
大数据面试题:说下为什么要使用Hive?Hive的优缺点?Hive的作用是什么?
Hive是
Hadoop
生态系统中比不可少的一个工具,它提供了一种SQL(结构化查询语言)方言,可以查询存储在
Hadoop
分布式文件系统(HDFS)中的数据或其他和
Hadoop
集成的文件系统,如MapR-FS
蓦然_
·
2024-09-08 15:50
大数据面试题
hive
大数据开发面试题
大数据面试
ERROR:master启动报错: Attempting to operate on hdfs namenode as root
[root@master
hadoop
]#sbin/start-all.shStartingnamenodeson[master]ERROR:AttemptingtooperateonhdfsnamenodeasrootERROR
CourageLee
·
2024-09-08 07:55
Docker
hadoop
linux
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他