E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
HADOOP学习之路
Spark运行原理
无论是性能,还是方案的统一性,对比传统的
Hadoop
,优势都非常明显。
hellozhxy
·
2024-01-28 23:41
spark
spark
数仓治理-小文件治理
希望对大家有所帮助https://mp.weixin.qq.com/s/HDxAGhGIPvXF38wPiXZ7xg[离线计算-Spark|Hive]HDFS小文件处理-腾讯云开发者社区-腾讯云HDFS小文件过多会对
hadoop
爱吃辣条byte
·
2024-01-28 23:40
数据治理
大数据
数据仓库
2021-08-10 HDFS Web报错Couldn‘t preview the file.
添加配置信息dfs.webhdfs.enabledtrue第二步:配置浏览器所在系统的hosts文件windows:在C:\Windows\System32\drivers\etc\hosts末尾增加内容(
Hadoop
学习是一种信仰_zdy
·
2024-01-28 21:28
大数据
hadoop
大数据
hdfs
HDFS文件系统的根目录和用户主目录解析
HDFS文件系统的根目录是/,用户主目录是/user/[
hadoop
用户名]根据上面的截图,所有的文件都放在根目录及其子目录下。
问君何能尔?心远地自偏
·
2024-01-28 21:57
大数据
Name node is in safe mode
相信
hadoop
用户经常为安全模式头痛,但是又是难以避免的。安全模式开启通常是由于hdfs文件系统数据完整性缺失造成。所以核心就是想办法让hdfs文件系统数据变得完整,相对没有损坏。
大数据东哥(Aidon)
·
2024-01-28 21:27
大数据
hadoop
safemode
safemode
hadoop
safe
mode
Name
node
is
in
safe
记一次HDFS Web报错Couldn‘t preview the file. NetworkError: Failed to execute ‘send‘ on ‘XMLHttpRequest‘
tpreviewthefile.NetworkError:Failedtoexecute‘send’on‘XMLHttpRequest’:Failedtoload‘http://slave1:9864/webhdfs/v1/Hello
Hadoop
.txt
一花一世界~
·
2024-01-28 21:55
Linux-Centos
x.x
Hadoop
大数据
hadoop
hdfs
大数据
经验分享
centos
Java技术栈 ——
Hadoop
入门(二)
Java技术栈——
Hadoop
入门(二)一、用MapReduce对统计单词个数1.1项目流程1.2可能遇到的问题1.3代码勘误1.4总结一、用MapReduce对统计单词个数1.1项目流程(1)上传jar
键盘国治理专家
·
2024-01-28 21:51
Java技术栈
java
hadoop
开发语言
flink架构
它集成了使用所有常见的群集资源管理器,例如
Hadoop
YARN和Kubernetes,但也可以设置为作为独立集群,甚至作为库。
m0_66520412
·
2024-01-28 20:29
flink
架构
大数据
数据湖技术之发展现状篇
首先是随着
Hadoop
生态相关技术的大量应用,批处理架构应运而生,借助离线计算引擎的能力很好的满足了业务对大规模数据分析处理场景的需求。
风筝Lee
·
2024-01-28 18:56
数据湖
hive
hadoop
spark
【CTWVRP】遗传算法求解带软时间窗+容量约束+成本(固定+运输+制冷+惩罚)车辆路径规划【含Matlab源码 3836期】
个人主页:海神之光代码获取方式:海神之光Matlab王者
学习之路
—代码获取方式⛳️座右铭:行百里者,半于九十。
Matlab领域
·
2024-01-28 15:28
Matlab路径规划(高阶版)
matlab
大数据处理系统的架构
Lambda架构的主要组成部分包括:批处理层(BatchLayer):存储:使用分布式存储系统(如Apache
Hadoop
HDFS)
demo123567
·
2024-01-28 14:58
大数据
架构
面包小白的
学习之路
——与娃共成长
我不是完美妈妈,我会发脾气,我会骂人,但我会改,今早与小朋友和解,并向他道歉,立刻就得到原谅,我们约定,以后遇到问题,尽量不发脾气,而是找到解决问题的办法,我们相互监督。小朋友说:嗯!每天进步一点点,坚持带来大改变!这句话是我之前听剽悍晨读,他听着学来的,并真正理解了,加油,我的孩子,加油,我自己!我要成为与孩子共同成长的妈妈!………………………………………………………………今日还是出差,回来晚饭
好七家美食
·
2024-01-28 13:42
[SparkSQL] Rdd转化DataFrame 通过StructType为字段添加Schema
1、开发环境spark-2.1.0-bin-
hadoop
2.62、Rdd转换成DataFrame,为字段添加列信息参数nullable说明:Indicatesifvaluesofthisfieldcanbenullvaluesvalschema
林沐之森
·
2024-01-28 13:51
一起走的
学习之路
(八十)
选择的重要性曾经的我在两件大事做过选择,那个时候可能还不懂得选择的技巧,但却发现那些基于自己最渴望的因素而做出的选择是自己最需要的。第一个选择是我在大学毕业考公务员的时候,那时候突然得到一个消息,我们本科班的考生和其他专科考试一起通过填写资源的方式以成绩的优劣来选人。很显然那个时候永川是最好的选择,但是由于永川招的人很少,而且在第一天预报名的时候填报的人特别多,这样一来综合考虑各个因素之后觉得把握
小米雨路
·
2024-01-28 13:42
Presto源码阅读——如何获取Hive中的Metadata(HMS+HDFS)
Presto源码阅读——如何获取Hive中的Metadata(HMS+HDFS)本文的Metadata定义SQLon
Hadoop
系统在执行一个query时所需要的Metadata主要有两部分Hive中的
stiga-huang
·
2024-01-28 12:38
Presto
Impala元数据简介
Impala元数据简介背景Impala是一个高性能的OLAP查询引擎,与其它SQL-on-
Hadoop
的ROLAP解决方案如Presto、SparkSQL等不同的是,Impala对元数据(Metadata
stiga-huang
·
2024-01-28 12:05
Impala
Hadoop
的基础操作
Hadoop
的基础操作HDFS是
Hadoop
的分布式文件框架,它的实际目标是能够在普通的硬件上运行,并且能够处理大量的数据。
陆卿之
·
2024-01-28 12:27
大数据
hadoop
大数据
hdfs
浅谈Hive和HBase有哪些区别与联系及适用场景
Hive是运行在
Hadoop
上的一个工具,准确地讲是一个搜索工具。当对海量数据进行搜索时,
Hadoop
的计算引擎是MapReduce。但是对Map
尚学先生
·
2024-01-28 11:19
Hive常见问题汇总
Hive和
Hadoop
的关系Hive构建在
Hadoop
之上,HQL中对查询语句的解释、优化、生成查询计划是由Hive完成的所有的数据都是存储在
Hadoop
中查询计划被转化为MapReduce任务,在
Hadoop
不加班程序员
·
2024-01-28 09:37
Hadoop相关
ETL
hive
hive
hadoop
数据仓库
mac上搭建hbase伪集群
/blog.csdn.net/a15835774652/article/details/135569456)但是为了模拟一把集群环境我们还是尝试搭建一个伪集群版2.环境准备jdk环境1.8+hdfs(
hadoop
寂夜了无痕
·
2024-01-28 08:15
大数据
macos
hbase
Hive面试题*精选*!附答案!!!
HIVE面试一、Hive的基本概念1.什么是hiveHive是一款开源的基于
hadoop
的用于统计海量结构化数据的一个数据仓库,它定义了简单的类似SQL的查询语言,称为HQL,允许熟悉SQL的用户查询数据
yhy_only
·
2024-01-28 07:36
hive
学习
大数据
hive面试题总结(大数据面试)
Hive概述Hive是基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射成为一张数据库表,并提供类SQL的查询功能。可以将sql语句转化为MapReduce任务进行运行。
404个问号
·
2024-01-28 07:02
大数据
大数据
hive
java
【BugFix】java.lang.NoSuchMethodError: java.nio.ByteBuffer.position(I)Ljava/nio/ByteBuffer;
2022-10-2010:43:59,633ERRORorg.apache.
hadoop
.hdfs.server.namenode.FSEditLog:Error:startinglogsegment946759failedfor
叹了口丶气
·
2024-01-28 06:02
HDFS全方位实战
Java语言积累
java
nio
jvm
FastAPI
学习之路
(三十)中间件
什么是中间件呢?“中间件”是一个函数,它在每个请求被特定的路径操作处理之前,以及在每个响应返回之前工作。1.它接受你的应用程序的每一个请求2.它可以对这个请求做一些事情或者执行任何需要的代码3.它将请求传递给应用程序的其他部分(通过某种路径操作)4.它获取应用程序生产的响应(通过某种路径操作)5.它可以对响应做些什么或者执行任何需要的代码6.它返回这个响应那么看下如何创建中间件?要创建中间件你可以
一起学python吧
·
2024-01-28 06:17
fastapi
fastapi
Ubuntu22.04三台虚拟机
Hadoop
集群安装和搭建(全面详细的过程)
虚拟机Ubuntu22.04
Hadoop
集群安装和搭建(全面详细的过程)环境配置安装安装JDK安装
Hadoop
三台虚拟机设置克隆三台虚拟机设置静态IP修改虚拟机hostssh免密登录关闭防火墙
Hadoop
WuRobb
·
2024-01-28 06:41
hadoop
大数据
分布式
java
面试整理
数据分析/
hadoop
/机器学习面试题集锦,可能是最全的了…发表于:2017-09-2115:17阅读:178评论:0无论你是想从事大数据相关职位的职场小白,还是准备往高处走的牛牛。
qq_20962187
·
2024-01-28 06:09
Hadoop
集群部署流程
前置要求需要3台虚拟机,系统为Centos7,分别host命名为node1,node2,node3,密码均为root请确保这三台虚拟机已经完成了JDK、SSH免密、关闭防火墙、配置主机名映射等前置操作在3台虚拟机的/etc/hosts文件中,填入如下内容:(同时这也是三台虚拟机的ip地址)192.168.88.131node1192.168.88.132node2192.168.88.133nod
正在绘制中
·
2024-01-28 02:09
hadoop
大数据
分布式
20190824 课堂笔记
20190824课堂笔记设置快捷键设置编译创建项目选择quickstartGAV设置项目设置修改添加
hadoop
-version,repositoryUTF-81.81.82.6.4clouderahttps
赛尔木
·
2024-01-27 23:37
Hadoop
-分布式
分布式分步+并行处理+汇总结果
Hadoop
分布式一台计算机存储不了了,也计算不了了
Hadoop
把多台计算机资源(存储资源:硬盘;计算资源:CPU,内存)连接在一起,形成集群输入文件,拆分成块,多个节点存储计算任务
日月交辉
·
2024-01-27 23:48
Hadoop
分布式
hadoop
大数据
用户行为数据采集
Flume——
Hadoop
——VMVM环境准备安装JDK安装
Hadoop
Hadoop
运行模式本地模式伪分布式完全分布式集群启动组件逐一启动。模块启动
日月交辉
·
2024-01-27 23:18
数仓DW
hive
大数据
ClickHouse(22)ClickHouse集成HDFS表引擎详细解析
用法实施细节配置可选配置选项及其默认值的列表libhdfs3支持的ClickHouse额外的配置限制Kerberos支持虚拟列资料分享系列文章clickhouse系列文章知乎系列文章HDFS这个引擎提供了与Apache
Hadoop
张飞的猪大数据
·
2024-01-27 17:35
clickhouse
hdfs
大数据
hadoop
数据仓库
数据库
apache 前30个开源项目
个具有代表性的项目序号项目名称功能描述业务范围活跃度(参考性描述)1ApacheHTTPServer高性能Web服务器提供HTTP服务支持非常活跃2ApacheTomcatJava应用服务器部署JavaWeb应用程序非常活跃3Apache
Hadoop
临水逸
·
2024-01-27 17:35
apache
开源
HBase基础知识与架构概述
1.背景介绍HBase是一个分布式、可扩展、高性能的列式存储系统,基于Google的Bigtable论文设计,并作为
Hadoop
生态系统的一部分。
OpenChat
·
2024-01-27 17:31
hbase
架构
数据库
大数据
分布式
【云原生进阶之PaaS中间件】第三章Kafka-2-安装部署
1安装部署1.1kafka的分布式kafka是依靠zookeeper来实现分布式的,所以再启动前需要先启动zookeeper,如下图1.2集群部署官方下载地址:ApacheKafka(1)安装和
Hadoop
江中散人
·
2024-01-27 16:16
云原生进阶-PaaS专栏
云原生
paas
中间件
kafka
zookeeper
【云原生进阶之PaaS中间件】第三章Kafka-3-命令操作
1命令操作1.1主题命令操作查看操作主题命令参数:[atguigu@
hadoop
102kafka]$bin/kafka-topics.sh参数描述--bootstrap-server,连接的KafkaBroker
江中散人
·
2024-01-27 16:16
云原生进阶-PaaS专栏
云原生
paas
中间件
Kafka
消息队列
Linux静态ip配置重启后 ip 恢复的问题(CentOS 6.7)
Linux静态ip配置重启后ip恢复的问题(CentOS6.7)文章目录Linux静态ip配置重启后ip恢复的问题(CentOS6.7)一、配置静态IP二、重启后IP恢复解决方案一、配置静态IP在学习
Hadoop
Travis_del
·
2024-01-27 16:50
linux学习
linux
centos
【数据可视化技术】数据可视化概述&工具
在
Hadoop
生态群中,核心部件(如
Francek Chen
·
2024-01-27 16:39
大数据技术基础
信息可视化
数据可视化
大数据
数据分析
产品经理
学习之路
(2)-方法论:需求
零、概述方法论是产品经理进阶的必然要求,好的PM可以一法通万法,一力降十会。主要的方法论涉及到需求分析、需求管理、市场分析、竞品分析、用户调研、产品规划、产品设计、产品文档、项目管理、运营理论、产品迭代、用户体验等方面。这里只是以大纲提要的形式,综合总结了我在日常工作中的实践、思考和学习成果,略显粗浅,还有更多更深入更详尽的方法论、细节需要完善。方法论:需求,主要包括需求分析和需求管理两个方面。一
anchord
·
2024-01-27 13:40
YARN 工作原理
1、
Hadoop
2新增了YARN,YARN的引入主要有两个方面的变更:其一、HDFS的NameNode可以以集群的方式部署,增强了NameNode的水平扩展能力和高可靠性,水平扩展能力对应HDFSFederation
无羡爱诗诗
·
2024-01-27 13:43
一台虚拟机上的文件怎么复制给另一台虚拟机
1.想要将zookeeper文件复制给另一台虚拟机2.使用终端命令压缩该文件3.压缩完毕4.将压缩文件传至另一台虚拟机的
hadoop
账户上5.显示传送完毕6.文件已传送到另一台虚拟机上7.使用终端命令将压缩文件解压缩文件复制完毕
白嫖叫上我
·
2024-01-27 11:44
工具技巧
vmware
大数据
zookeeper
hadoop
深入浅出hdfs源码
1、
hadoop
基本介绍2、周边生态图3、hdfs读源码解析4、hdfs写源码解析5、hdfs副本机制解读6、hdfs常见管理源码解析7、hdfs高可用源码解析-ha8、hdfs监控源码解析-dnmetrics-nnmetrics
大数据之家
·
2024-01-27 10:39
hdfs
hadoop
大数据
2021-03-07
解决存储问题·MapReduce=====>解决计算问题·Yarn=====>资源协调者·Zookeeper=====>分布式应用程序协调服务·Flume=====>日志收集系统·Hive=====>基于
Hadoop
残月冷无声
·
2024-01-27 10:39
深入浅出hdfs-
hadoop
基本介绍
一、
Hadoop
基本介绍
hadoop
最开始是起源于ApacheNutch项目,这个是由DougCutting开发的开源网络搜索引擎,这个项目刚开始的目标是为了更好的做搜索引擎,后来Google发表了三篇未来持续影响大数据领域的三架马车论文
大数据之家
·
2024-01-27 10:03
hdfs
hadoop
大数据
大一学习对C语言的认识
本人是软件工程专业的大一学子,上大学之前没有碰过电脑,没有真正的了解过编程,在我印象里C语言是一个高深而又神秘的编程语言,第一学期马上就要结束了,来总结一下我的C语言
学习之路
。
阑梦清川
·
2024-01-27 10:25
##感悟
c语言
开发语言
Hadoop
三大核心组件,
hadoop
原理
Hadoop
的三大核心组件分别是:HDFS(
Hadoop
DistributeFileSystem):
hadoop
的数据存储工具。
你敢和我比剑吗
·
2024-01-27 09:03
hadoop
大数据
mapreduce
Hadoop
2.0架构及其运行机制,HA原理
文章目录一、
Hadoop
2.0架构1.架构图2.HA1)NameNode主备切换2)watcher监听3)脑裂问题3.组件1.HDFS2.MapReduce3.Yarn1.组件2.调度流程一、
Hadoop
2.0
Toner_唐纳
·
2024-01-27 09:30
大数据
Hadoop
原理及架构详解
###README本文是基于黑马程序员的
Hadoop
网课的前半部分整理的笔记,主要介绍了相关操作与组件架构。
Should·L
·
2024-01-27 09:25
大数据
hadoop
架构
大数据
Hadoop
与Spark横向比较【大数据扫盲】
大数据场景下的数据库有很多种,每种数据库根据其数据模型、查询语言、一致性模型和分布式架构等特性,都有其特定的使用场景。以下是一些常见的大数据数据库:1.**NoSQL数据库**:这类数据库通常用于处理大规模、非结构化的数据。它们通常提供简单的查询语言,并强调水平扩展和高可用性。例如:-**键值存储**:如Redis,AmazonDynamoDB-**列式存储**:如ApacheCassandra,
super_journey
·
2024-01-27 07:51
大数据
hadoop
spark
Hadoop
增加新节点环境配置(自用)
完成
Hadoop
集群增添一个新的节点配置(文中命名为)
Hadoop
106,没有进行继续为该节点分配身份职能的步骤1.在VMware中安装CentOS7新建虚拟机1.
革斤要加油
·
2024-01-27 07:50
专业课
hadoop
大数据
分布式
Hadoop
-MapReduce-MRAppMaster启动篇
一、源码下载下面是
hadoop
官方源码下载地址,我下载的是
hadoop
-3.2.4,那就一起来看下吧Indexof/dist/
hadoop
/core二、上下文在上一篇中已经将到:作业提交到ResourceManager
隔着天花板看星星
·
2024-01-27 07:20
hadoop
mapreduce
eclipse
上一页
12
13
14
15
16
17
18
19
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他