E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop大数据分析
Elasticsearch集群部署及Head插件安装
由于ES比较吃内存,所以每台服务器的配置要求为:CPU:2核内存:2G我的三个节点分别是
Hadoop
Node01、
Hadoop
Node02、
Hadoop
Node03,以下操作全部基于
Hadoop
Node01
景鹏虎晓
·
2024-01-29 11:54
elasticsearch
es
spark快速入门java_Spark 快速入门
既然本教程中我们不使用HDFS,你可以随便下载一个适配任何
Hadoop
的版本的Spark。
陈兰香
·
2024-01-29 11:54
spark快速入门java
基于大数据平台的kylin安装部署手册
目录一.单例Kylin部署1.环境准备1.1软件要求1.2硬件要求1.3
Hadoop
环境1.4安装前环境检查1.4.1开启时钟同步1.4.2安装net-tools1.4.3检查hbase是否可用1.4.4
猿来孺词
·
2024-01-29 10:26
部署安装
大数据
kylin
分布式
数据仓库
数据分析
MR和Spark的比较
二、
hadoop
和spark的shuffle相同和差异?三、Spark与
Hadoop
差异一、Spark为什么比MR快?
猿来孺词
·
2024-01-29 10:55
mr
spark
大数据
分布式
hadoop
Elk运维-Elastic7.6.1集群安装部署
集群安装结果说明实例配置安装软件安装账号
hadoop
12C4G磁盘:50G云服务器elasticsearchkibanard
hadoop
22C4G磁盘:50G云服务器elasticsearchrd
hadoop
32C4G
消逝的bug
·
2024-01-29 10:11
运维
elk
数据库
Hadoop
学习之路(七) MapReduce框架Partitioner分区
Partitioner分区的作用是什么?在进行MapReduce计算时,有时候需要把最终输出数据分到不同的文件中,比如按照省份划分的话,需要把同一省份的数据放到一个文件中;按照性别划分的话,需要把同一性别的数据放到一个文件中。我们知道最终的输出数据是来自于Reducer任务。那么如果要得到多个文件,意味着有相同数量的Reducer任务在运行。Reducer任务的数据来自于Mapper任务,也就是M
shine_rainbow
·
2024-01-29 10:26
HDFS
HDFS入门1.1.HDFS介绍HDFS是
Hadoop
DistributeFileSystem的简称,意为:
Hadoop
分布式文件系统。是
Hadoop
核心组件之一,作为最底层的分布式存储服务而存在。
VincentLeon
·
2024-01-29 08:44
Hadoop
, HIve, Spark关系简述
大数据∈数据管理系统的范畴数据管理系统:数据怎么存?数据怎么算?单机数据管理时代下,数据处理的任务:IO密集型;数据存不下?HDFS用于存放多机器的数据并提供相关Api接口。HDFS中引入了一个模块:MapReduce(基于磁盘计算)。MapReduce:提供了一个任务并行的框架,通过它的Api抽象让用户把这个并行程序分成两个阶段,即Map阶段(分工),Reduce阶段(汇总)。Hive:在Had
小白兔奶糖ovo
·
2024-01-29 07:22
hadoop
hive
spark
记一次Flink自带jar包与第三方jar包依赖冲突解决
flink版本1.14.5
hadoop
2.6.0为了实现flink读取hive数据写入第三方的数据库,写入数据库需要调用数据库的SDK,当前SDK依赖的protobuf-java-3.11.0.jar,
一枚小刺猬
·
2024-01-29 06:10
flink
flink
jar
hadoop
Hadoop
面试题及参考答案
目录1、什么是
Hadoop
及其组件2、
Hadoop
的守护进程3、
Hadoop
的YARN/HDFS/MapReduce分别包含哪些组件,每个组件的职能是什么?
zuolixiangfisher
·
2024-01-29 06:02
Hadoop
hadoop
hdfs
大数据
hadoop
面试题
0.思维导图1.HDFS1.HDFS的架构♥♥ HDFS主要包括三个部分,namenode,datanode以及secondarynamenode。这里主要讲一下他们的作用:namenode主要负责存储数据的元数据信息,不存储实际的数据块,而datanode就是存储实际的数据块,secondarynamenode主要是定期合并FsImage和edits文件(这里可以进行扩展,讲一下为什么有他们的
韩顺平的小迷弟
·
2024-01-29 06:27
大数据面试题
hadoop
大数据
分布式
“大数据”能够对人力资源企业提供什么帮助?
事实上,人力资源
大数据分析
领域的专家吉恩·皮斯发现,大数据融入人力资源工作是必然
41099802
·
2024-01-29 04:32
大数据
大数据之
Hadoop
-MapReduce(1)
第1章MapReduce概述1.1MapReduce定义MapReduce是一个分布式运算程序的编程框架,是用户开发“基于
Hadoop
的数据分析应用”的核心框架。
jackyan163
·
2024-01-29 04:18
Hive初体验
首先,确保启动了Metastore服务{runjar就是metastore;
hadoop
要先启动}可以执行:bin/hive进入到HiveShell环境中,可以直接执行SQL的语句;·创建表(hive里面的字符串就是
%HelloWorld%
·
2024-01-29 03:09
hive
hadoop
数据仓库
[m1pro ] ssh: connect to host localhost port 22: Connection refused
在学习
Hadoop
的时候,使用sshlocalhost遇到以下问题原因:本地没有打开远程登录解决办法:打开远程登录成功结果
程序员三木
·
2024-01-29 03:33
大后端
ssh
服务器
数据库
spark shuffle
这个就是spark和
hadoop
的主要区别,基于内存进行运算。
流砂月歌
·
2024-01-29 01:13
Spark运行原理
无论是性能,还是方案的统一性,对比传统的
Hadoop
,优势都非常明显。
hellozhxy
·
2024-01-28 23:41
spark
spark
数仓治理-小文件治理
希望对大家有所帮助https://mp.weixin.qq.com/s/HDxAGhGIPvXF38wPiXZ7xg[离线计算-Spark|Hive]HDFS小文件处理-腾讯云开发者社区-腾讯云HDFS小文件过多会对
hadoop
爱吃辣条byte
·
2024-01-28 23:40
数据治理
大数据
数据仓库
2021-08-10 HDFS Web报错Couldn‘t preview the file.
添加配置信息dfs.webhdfs.enabledtrue第二步:配置浏览器所在系统的hosts文件windows:在C:\Windows\System32\drivers\etc\hosts末尾增加内容(
Hadoop
学习是一种信仰_zdy
·
2024-01-28 21:28
大数据
hadoop
大数据
hdfs
HDFS文件系统的根目录和用户主目录解析
HDFS文件系统的根目录是/,用户主目录是/user/[
hadoop
用户名]根据上面的截图,所有的文件都放在根目录及其子目录下。
问君何能尔?心远地自偏
·
2024-01-28 21:57
大数据
Name node is in safe mode
相信
hadoop
用户经常为安全模式头痛,但是又是难以避免的。安全模式开启通常是由于hdfs文件系统数据完整性缺失造成。所以核心就是想办法让hdfs文件系统数据变得完整,相对没有损坏。
大数据东哥(Aidon)
·
2024-01-28 21:27
大数据
hadoop
safemode
safemode
hadoop
safe
mode
Name
node
is
in
safe
记一次HDFS Web报错Couldn‘t preview the file. NetworkError: Failed to execute ‘send‘ on ‘XMLHttpRequest‘
tpreviewthefile.NetworkError:Failedtoexecute‘send’on‘XMLHttpRequest’:Failedtoload‘http://slave1:9864/webhdfs/v1/Hello
Hadoop
.txt
一花一世界~
·
2024-01-28 21:55
Linux-Centos
x.x
Hadoop
大数据
hadoop
hdfs
大数据
经验分享
centos
Java技术栈 ——
Hadoop
入门(二)
Java技术栈——
Hadoop
入门(二)一、用MapReduce对统计单词个数1.1项目流程1.2可能遇到的问题1.3代码勘误1.4总结一、用MapReduce对统计单词个数1.1项目流程(1)上传jar
键盘国治理专家
·
2024-01-28 21:51
Java技术栈
java
hadoop
开发语言
flink架构
它集成了使用所有常见的群集资源管理器,例如
Hadoop
YARN和Kubernetes,但也可以设置为作为独立集群,甚至作为库。
m0_66520412
·
2024-01-28 20:29
flink
架构
大数据
数据湖技术之发展现状篇
首先是随着
Hadoop
生态相关技术的大量应用,批处理架构应运而生,借助离线计算引擎的能力很好的满足了业务对大规模数据分析处理场景的需求。
风筝Lee
·
2024-01-28 18:56
数据湖
hive
hadoop
spark
2022-10-14
“不少家境贫困的学生碍于面子,不愿申请贫困助学金,公开评审又会伤害学生自尊心,南京理工大学用上
大数据分析
把每月在食堂吃饭超过60次,月饭费不超过420的学生列为贫困生,悄悄列为了受资助对象,不用审核不用公示
夷则十六诶
·
2024-01-28 15:02
大数据处理系统的架构
Lambda架构的主要组成部分包括:批处理层(BatchLayer):存储:使用分布式存储系统(如Apache
Hadoop
HDFS)
demo123567
·
2024-01-28 14:58
大数据
架构
[SparkSQL] Rdd转化DataFrame 通过StructType为字段添加Schema
1、开发环境spark-2.1.0-bin-
hadoop
2.62、Rdd转换成DataFrame,为字段添加列信息参数nullable说明:Indicatesifvaluesofthisfieldcanbenullvaluesvalschema
林沐之森
·
2024-01-28 13:51
Presto源码阅读——如何获取Hive中的Metadata(HMS+HDFS)
Presto源码阅读——如何获取Hive中的Metadata(HMS+HDFS)本文的Metadata定义SQLon
Hadoop
系统在执行一个query时所需要的Metadata主要有两部分Hive中的
stiga-huang
·
2024-01-28 12:38
Presto
Impala元数据简介
Impala元数据简介背景Impala是一个高性能的OLAP查询引擎,与其它SQL-on-
Hadoop
的ROLAP解决方案如Presto、SparkSQL等不同的是,Impala对元数据(Metadata
stiga-huang
·
2024-01-28 12:05
Impala
Hadoop
的基础操作
Hadoop
的基础操作HDFS是
Hadoop
的分布式文件框架,它的实际目标是能够在普通的硬件上运行,并且能够处理大量的数据。
陆卿之
·
2024-01-28 12:27
大数据
hadoop
大数据
hdfs
浅谈Hive和HBase有哪些区别与联系及适用场景
在学
大数据分析
的过程中,Hive和HBase是两个非常重要的内容,对于初学者而言容易混淆。所以比较两者的联系与差别,能够帮助我们对这两个组件有一个清晰的认识和定位。
尚学先生
·
2024-01-28 11:19
2021-09-25
CellRepMet|算法设计探针定位、检测和分离病原体原创图灵基因图灵基因今天收录于话题#前沿生物
大数据分析
麦克马斯特大学(McMasterUniversity)的研究人员开发了一种先进的新工具,可以帮助提供环境中罕见和未知病毒的早期预警
图灵基因
·
2024-01-28 09:32
2021-10-02
NatMachIntell|基于深度学习的T细胞受体-抗原结合特异性预测原创huacishu图灵基因今天收录于话题#前沿生物
大数据分析
撰文:huacishuIF=15.501推荐度:⭐⭐⭐⭐⭐亮点:1、
图灵基因
·
2024-01-28 09:43
Hive常见问题汇总
Hive和
Hadoop
的关系Hive构建在
Hadoop
之上,HQL中对查询语句的解释、优化、生成查询计划是由Hive完成的所有的数据都是存储在
Hadoop
中查询计划被转化为MapReduce任务,在
Hadoop
不加班程序员
·
2024-01-28 09:37
Hadoop相关
ETL
hive
hive
hadoop
数据仓库
Axure数据可视化BI大屏看板原型 FUI动态
大数据分析
后台
入职新公司半年,经手的两个项目和已经立项的下一个项目都是与数据掘金、数字孪生相关,销售部为银行客户讲解项目时用的是高保真可交互的Axure原型,这就要求我设计出符合演示需求的原型,但由于涉及的可视化图表较多、交互效果较复杂、远程沟通效率低等原因,也为了更快就出图,用现成的可视化组件库/元件库来复用就成了我的基本需求。所以我找到了一套符合数据产品经理/B端交互设计师(BI方向)快速出图的可视化Axu
m0_54853420
·
2024-01-28 08:18
前端
html
面试
axure
数据分析
ui
mac上搭建hbase伪集群
/blog.csdn.net/a15835774652/article/details/135569456)但是为了模拟一把集群环境我们还是尝试搭建一个伪集群版2.环境准备jdk环境1.8+hdfs(
hadoop
寂夜了无痕
·
2024-01-28 08:15
大数据
macos
hbase
宋绪杰:我的大数据成长之旅 | 提升之路系列(三)
项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生
大数据分析
能力和创新
数据派THU
·
2024-01-28 08:14
大数据
Hive面试题*精选*!附答案!!!
HIVE面试一、Hive的基本概念1.什么是hiveHive是一款开源的基于
hadoop
的用于统计海量结构化数据的一个数据仓库,它定义了简单的类似SQL的查询语言,称为HQL,允许熟悉SQL的用户查询数据
yhy_only
·
2024-01-28 07:36
hive
学习
大数据
hive面试题总结(大数据面试)
Hive概述Hive是基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射成为一张数据库表,并提供类SQL的查询功能。可以将sql语句转化为MapReduce任务进行运行。
404个问号
·
2024-01-28 07:02
大数据
大数据
hive
java
【BugFix】java.lang.NoSuchMethodError: java.nio.ByteBuffer.position(I)Ljava/nio/ByteBuffer;
2022-10-2010:43:59,633ERRORorg.apache.
hadoop
.hdfs.server.namenode.FSEditLog:Error:startinglogsegment946759failedfor
叹了口丶气
·
2024-01-28 06:02
HDFS全方位实战
Java语言积累
java
nio
jvm
Ubuntu22.04三台虚拟机
Hadoop
集群安装和搭建(全面详细的过程)
虚拟机Ubuntu22.04
Hadoop
集群安装和搭建(全面详细的过程)环境配置安装安装JDK安装
Hadoop
三台虚拟机设置克隆三台虚拟机设置静态IP修改虚拟机hostssh免密登录关闭防火墙
Hadoop
WuRobb
·
2024-01-28 06:41
hadoop
大数据
分布式
java
面试整理
数据分析/
hadoop
/机器学习面试题集锦,可能是最全的了…发表于:2017-09-2115:17阅读:178评论:0无论你是想从事大数据相关职位的职场小白,还是准备往高处走的牛牛。
qq_20962187
·
2024-01-28 06:09
Hadoop
集群部署流程
前置要求需要3台虚拟机,系统为Centos7,分别host命名为node1,node2,node3,密码均为root请确保这三台虚拟机已经完成了JDK、SSH免密、关闭防火墙、配置主机名映射等前置操作在3台虚拟机的/etc/hosts文件中,填入如下内容:(同时这也是三台虚拟机的ip地址)192.168.88.131node1192.168.88.132node2192.168.88.133nod
正在绘制中
·
2024-01-28 02:09
hadoop
大数据
分布式
2谈高考作文的背后
但是当
大数据分析
了你的阅读喜好后,只会给你推你感兴趣的东西,从而形成了信息闭塞,可以说几乎是连筛选的机会都没有了,剩下的只有评价。而狭窄的知识面,浅薄的现象,到底能评价出什么呢?
suze01t
·
2024-01-28 00:39
20190824 课堂笔记
20190824课堂笔记设置快捷键设置编译创建项目选择quickstartGAV设置项目设置修改添加
hadoop
-version,repositoryUTF-81.81.82.6.4clouderahttps
赛尔木
·
2024-01-27 23:37
在网购的冲击下,实体店如何借助人工智能加快店铺转型?
在互联网飞速发展的今天,人工智能和云计算、
大数据分析
等各种互联网技术应运而生,今天小编就带大家来了解一下真正的人工智能(ArtificialIntelligence,简称AI),距离我们很远的人工智能如何为我们实体零售业的商家所用
小熊敬礼
·
2024-01-27 23:06
Hadoop
-分布式
分布式分步+并行处理+汇总结果
Hadoop
分布式一台计算机存储不了了,也计算不了了
Hadoop
把多台计算机资源(存储资源:硬盘;计算资源:CPU,内存)连接在一起,形成集群输入文件,拆分成块,多个节点存储计算任务
日月交辉
·
2024-01-27 23:48
Hadoop
分布式
hadoop
大数据
用户行为数据采集
Flume——
Hadoop
——VMVM环境准备安装JDK安装
Hadoop
Hadoop
运行模式本地模式伪分布式完全分布式集群启动组件逐一启动。模块启动
日月交辉
·
2024-01-27 23:18
数仓DW
hive
大数据
Spark-core
什么是SparkSpark是基于内存的快速,通用,可扩展的
大数据分析
引擎Spark的内置模块SparkCore是Spark可以离线处理的部分,实现了spark的基本功能,包含任务调度,错误恢复,与存储系统交互等模块
luckboy0000
·
2024-01-27 23:12
学习笔记
上一页
11
12
13
14
15
16
17
18
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他