E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
研磨hadoop
hadoop
知识点总结(一)
hadoop
架构以及mapreduce工作机制
1,为什么需要
hadoop
数据分析者面临的问题数据日趋庞大,读写都出现性能瓶颈;用户的应用和分析结果,对实时性和响应时间要求越来越高;使用的模型越来越复杂,计算量指数级上升。
junzhou134
·
2023-11-10 02:25
hadoop
hadoop
学习笔记
python大数据运维工程师_【大数据科普系列之二】大数据运维工程师
大数据系列岗位要求,大数据运维可能是“技术含量最高”的职位之一,这里说的大数据运维主要是指
hadoop
生态体系方面的运维,在一些小公司或者传统行业的大公司也会使用oracle、db2等技术栈,在互联网行业数据量稍微大点的公司基本都是使用
weixin_39707693
·
2023-11-10 01:26
python大数据运维工程师
python大数据运维常用脚本_大数据岗位要求之大数据运维
继续介绍大数据系列岗位要求,大数据运维可能是“技术含量最高”的职位之一,这里说的大数据运维主要是指
hadoop
生态体系方面的运维,在一些小公司或者传统行业的大公司也会使用oracle、db2等技术栈,在互联网行业数据量稍微大点的公司基本都是使用
weixin_39968490
·
2023-11-10 01:26
python大数据运维常用脚本
Hadoop
原理,HDFS架构,MapReduce原理
Hadoop
原理,HDFS架构,MapReduce原理2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开测开的话,你就得学数据库,sql,oracle
冰露可乐
·
2023-11-10 00:27
国考
数据挖掘
hadoop
hdfs
架构
MapReduce
国考网警
Hadoop
常见问题
报错1:isgroup-writable,andthegroupisnotroot.Itspermissionsare0775,datanode启动时,日志报错1.“xxxx”isgroup-writable,andthegroupisnotroot.Itspermissionsare0775,anditisownedbygid3245.Pleasefixthisorselectadifferen
楠奕
·
2023-11-09 23:06
bigData
hadoop
大数据
分布式
【Python大数据笔记_day04_
Hadoop
】
集群:多台服务器联合起来独立做相同的任务(多个服务器分担客户发来的请求)注意:集群如果客户端请求量(任务量)多,多个服务器同时处理不同请求(不同任务),如果请求量少,一台服务器干活,其他服务器备份使用
Hadoop
LKL1026
·
2023-11-09 23:35
Python大数据学习笔记
大数据
笔记
hadoop
分布式
Hadoop
相关
hdfsgetconf-confKeydfs.namenode.http-address查看
Hadoop
工作端口的信息hdfsgetconf-confKeydfs.datanode.http.address
小美美大白蛋
·
2023-11-09 23:56
hadoop
大数据
分布式
Spark的启动部分源码解析(org.apache.spark.deploy.master.Master,org.apache.spark.deploy.master.Worker)
Master的入口函数defmain(argStrings:Array[String]){Utils.initDaemon(log)valconf=newSparkConf//构建用于参数解析的实例--host
hadoop
102
Vincer_DB
·
2023-11-09 20:46
大数据
Spark
spark
Spark-deploy
在前文Spark源码分析之-scheduler模块中提到了Spark在资源管理和调度上采用了
Hadoop
YARN的方式:外层的资源管理器和应用内的任务调度器;并且分析了Spark应用内的任务调度模块。
blesslyy
·
2023-11-09 20:15
spark
deploy
spark 配置historyserver进程 报错 org.apache.spark.deploy.history.HistoryServer
报错查看日志文件发现原因是因为我们这里配置的存储目录和
hadoop
的core-site.xml的defaultFS配置不匹配造成的,修改成相同就可以了
生于忧患丶
·
2023-11-09 20:12
spark
60款顶级大数据开源工具
一、
Hadoop
相关工具1.
Hadoop
Apache的
Hadoop
项目已几乎与大数据划上了等号。它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算。
weixin_34006965
·
2023-11-09 16:21
大数据
操作系统
java
java spark 保存_spark 数据的读取与保存
格式名称结构化备注文本文件否普通的文本文件,每行一条记录JSON半结构化常见的基于文本的格式;大多数库都要求每行一条记录CSV是基于文本,通常在电子表格中使用SequenceFiles是用于键值对数据的常见
Hadoop
郴桕
·
2023-11-09 14:57
java
spark
保存
spark读取其他服务器文件,spark(三):spark的数据读取和保存
方法将RDD保存为一个文件2、JSON格式文件,大多是每行一条记录这里需要注意是每一行是一个JSON记录还是跨行的,如果是跨行的那么就要解析整个文件3、CSV文件4、SequenceFile基于键值对的
hadoop
冯一之
·
2023-11-09 14:57
spark读取其他服务器文件
大数据毕业设计选题推荐-市天气预警实时监控平台-
Hadoop
-Spark-Hive
✨作者主页:IT研究室✨个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。☑文末获取源码☑精彩专栏推荐⬇⬇⬇Java项目Python项目安卓项目微信小程序项目文章目录一、前言二、开发环境三、系统界面展示四、代码参考五、论文参考六、系统视频结语一、前言随着社会经济的发展和科技的
IT研究室
·
2023-11-09 13:52
大数据项目
大数据
hadoop
spark
hive
VM虚拟机
【
Hadoop
】
Hadoop
体系知识点梳理(目录)
Hadoop
体系知识点梳理(目录)核心点第一章:
Hadoop
背景知识与起源第二章:搭建
Hadoop
环境第三章:HDFS体系架构第四章:HDFS第五章:MapReduce第六章:Hbase第七章:Hive
lys_828
·
2023-11-09 11:49
大数据开发工程师
大数据
hadoop
java
目录
大数据学习之错误——FAILED: SemanticException org.apache.
hadoop
.hive.ql.metadata.HiveException:
错误:FAILED:SemanticExceptionorg.apache.
hadoop
.hive.ql.metadata.HiveException:java.lang.RuntimeException
人生无重来
·
2023-11-09 10:11
大数据学习
hadoop
大数据
mysql
Java版Flink(二)部署模式
一、standalone部署模式1、下载安装包下载安装包地址有两种安装包类型:第一种是带
Hadoop
依赖的(整合YARN)第二种是不带
Hadoop
依赖的(Standalone模式)本次部署选择1.10.1
qq_41311979
·
2023-11-09 10:07
flink
【Flink】Flink的部署模式
启动成功后,访问http://
hadoop
102:8081,可以对flink集群和任务进行监控管理2、集群启动:如果我们想要扩展成集群,其实启动命令是不变的,主要是需要指定节点之间的主从关系。
不断学习的克里斯
·
2023-11-09 10:05
Flink
flink
大数据
Flink on yarn模式部署
目录1.基于docker部署cdh2.遇到的异常2.1flink下缺少
hadoop
相关依赖2.2jdk7造成的错误3.启动flinkonyarn模式<
fragrans
·
2023-11-09 10:03
CDH和大数据组件
Flink
flink
yarn
java
1.docker linux离线环境安装 20.1.0.12
目录概述下载解压docker卸载docker安装检查安装环境常用命令结束概述docker离线环境安装20.1.0.12,centos7.x下载安装包下载解压[root@
hadoop
01soft]#unzipdocker
流月up
·
2023-11-09 10:59
k8s
docker
容器
离线安装
20.x版本
linux
大数据毕业设计选题推荐-消防监控平台-
Hadoop
-Spark-Hive
✨作者主页:IT毕设梦工厂✨个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。☑文末获取源码☑精彩专栏推荐⬇⬇⬇Java项目Python项目安卓项目微信小程序项目文章目录一、前言二、开发环境三、系统界面展示四、部分代码设计五、论文参考六、系统视频结语一、前言随着城市化进程的加
IT毕设梦工厂
·
2023-11-09 10:07
大数据项目
大数据
hadoop
spark
hive
VM虚拟机
2020-11-10
大数据的核心是
Hadoop
生态系统。我们通常可能会根据特定的用特来描述软件工具,比如:Oracle是数据库、ApacheTomcat是Web服务器。
吴浩.
·
2023-11-09 10:32
笔记
Docker - 概述
传统的项目部署,环境配置是十分麻烦,第一个机器都要部署环境(集群Redis,ES,
Hadoop
…)费时费力发布一个项目(jar+(Re
Am98
·
2023-11-09 09:25
docker
容器
运维
在window10上安装apache-hive-3.1.3
一、hive介绍hive是什么:hive是基于
Hadoop
的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在
Hadoop
中的大规模数据的机制。
爱上雪茄
·
2023-11-09 09:22
大数据
JAVA知识
apache
hive
hadoop
Zookeeper特性与节点数据类型详解
1.Zookeeper介绍ZooKeeper是一个开源的分布式协调框架,是Apache
Hadoop
的一个子项目,主要用来解决分布式集群中应用系统的一致性问题。
will.tsang
·
2023-11-09 09:50
zookeeper
分布式
云原生
Hadoop
学习笔记(持续更新中)
文章目录
Hadoop
Hadoop
的组成HDFS特点NameNode和DataNode文件系统命名空间数据块块缓存MapReducejob、task、inputsplitcombiner其他示例
Hadoop
Hadoop
东河西
·
2023-11-09 09:19
大数据
hadoop
SpringBoot整合 MinIO 分布式对象存储
对象存储可以充当主存储层,以处理Spark、Presto、TensorFlow、H2O.ai等各种复杂工作负载以及成为
Hadoop
HDFS的替代品。可扩展性:
码小呆~
·
2023-11-09 09:36
Springboot
java
docker
spring
boot
minio
HBASE2.5.3集群安装-大数据学习系列(五)
IP106.15.186.55139.196.15.2847.101.63.122内网IP172.25.73.65172.25.73.64172.25.73.66HBASE数据库HBASEYYYPS:这是基于之前
hadoop
zhenwudi
·
2023-11-09 08:47
大数据
学习
hbase
5,Hbase的安装部署
用chown命令赋予
hadoop
用户使用当前目录的权限。但是因为当前用户是guan所以后面发生权限不够的问题。文件夹
沐风797
·
2023-11-09 08:17
大数据平台技术
hbase
hbase2.5.5安装
hadoop
3.3.5
1.hbase-env.shexportHBASE_DISABLE_
HADOOP
_CLASSPATH_LOOKUP="true"exportHBASE_MANAGES_ZK=false2.hbase-site.shhbase.tmp.dir
weixin_54735428
·
2023-11-09 08:16
hbase
HBase单机模式安装示例
一、准备环境Hbase的运行需要jdk、zookeeper和
Hadoop
环境,这里jdk和
Hadoop
的安装之前文章已经描述,这里只对zookeeper和Hbase的安装进行示例,这里因为组件的下载apache
qz1060306014034
·
2023-11-09 08:43
java
Linux
hbase
hadoop
大数据
linux安装
Hadoop
、hbase
目录一、创建
hadoop
用户(1)首先按ctrl+alt+t打开终端窗口,输入如下命令创建新用户:(2)切换账户,使用
Hadoop
账户登录登录以后需要更新一下apt(3)安装好ssh服务二、安装java1
被爱情锁住的锁王
·
2023-11-09 08:13
hbase
hadoop
linux
Centos Linux 单机安装 HBase 、使用 HBase
HBase是Apache
Hadoop
项目的子项目,适合存储非结构化数据,基于列而不是基于行。HBase的名字的来源是Hadoo
寒水馨
·
2023-11-09 08:40
大数据组件安装(单机)
hbase
linux
centos
大数据
非关系型数据库
安装配置Hbase
目录安装配置Hbase一,测试
Hadoop
安装1、测试免密登录masterslave1slave2都要配置输入命令sshlocalhost没有好的是这个样子需要输密码输入命令ssh-keygen-trsa
气质&末雨
·
2023-11-09 08:39
大数据
hadoop
大数据
hdfs
big
data
hbase
Hadoop
——实验五:HBASE单机部署、伪分布部署
文章目录一.实验目的二.实验内容三.实验步骤及结果分析 1.基于ubuntukylin14.04(5)版本,完成HBASE单机式配置部署 1.1下载安装HBase 1.2配置HBase环境变量 1.3检查HBase 1.4HBase单机模式配置 1.5启动HBase 2.基于ubuntukylin14.04(6)版本,完成HBASE伪分布式配置部署 2.1配置hbase-env.sh文件 2.2配
诗卿°
·
2023-11-09 08:09
Hadoop
大数据
hadoop
hbase
ubuntu
hdfs
win10搭建
Hadoop
3.2.2和HBase2.3.5单机版
1.
Hadoop
与HBase版本对应关系在安装
Hadoop
和HBase时需要适配合适的版本,根据HBase的版本选择相应的
Hadoop
版本。
渝州居士
·
2023-11-09 08:39
大数据
hbase
hadoop
在Windows 10上安装单机版的
hadoop
-3.3.5
1、
Hadoop
是一个由Apache基金会所开发的分布式系统基础架构。用户可以不需要了解分布式底层细节的情况下,开发分布式程序。充分利用集群进行高速运算和存储。
爱上雪茄
·
2023-11-09 08:38
数据库知识
大数据
hadoop
大数据
分布式
最新的
Hadoop
与HBase版本兼容性
HBase的版本一定要和
Hadoop
的版本保持兼容,不能随意选择如HBase2.2.2和
Hadoop
3.1.3兼容最新的
Hadoop
与HBase版本兼容性如下表截图来自http://hbase.apache.org
iijik55
·
2023-11-09 08:07
java
java
后端
window10单机部署hbase-2.5.5-
hadoop
3
一、介绍hbase是什么,Hbase是一个分布式,可扩展,支持海量数据存储的noSQL数据库二、下载hbasehttps://mirrors.tuna.tsinghua.edu.cn/apache/hbase/2.5.6/三、配置hbase环境变量三、修改hbase配置文件在hbase-env.cmd添加如下配置@remJDK6onWindowshasaknownbugforIPv6,usepre
爱上雪茄
·
2023-11-09 08:00
JAVA知识
大数据
hbase
数据库
大数据
flink per-job模式启动命令参数详解
//提示:有的集群会报类似
HADOOP
_CLASSPATHnotfind的异常,此时需要在Linux上提前执行此命令export
HADOOP
_CLASSPATH=`
hadoop
classpath`.
沧海还一笑
·
2023-11-09 05:31
flink
java.lang.IllegalArgumentException: Wrong FS://expected: file:///
使用
hadoop
-2.6.0(因为我用的是apache-
hadoop
-2.6.0版本)的core-site.xml(/
HADOOP
_HOME/etc/
hadoop
/)的fs.defa
ZL小屁孩
·
2023-11-09 05:16
hadoop生态
hdfs
数仓面经大框架
1.计算机及编程基础:操作系统:进程、线程等数据结构:算法题计算机网络:分层等Linux:常用的指令MySQL(重点)Java/Python基础排序算法(快排、归并等)2.大数据组件
Hadoop
:HDFS
Young_IT
·
2023-11-09 02:03
大数据开发
大数据
数据仓库
数据分析
Flink集群的搭建
1、Flink独立集群模式1、首先Flink的独立集群模式是不依赖于
Hadoop
集群。
新手小农
·
2023-11-09 01:48
Flink
1.15.2
flink
大数据
启动hive时报: Call From
hadoop
/192.168.1.128 to
hadoop
:9000 failed on connection
修改后,重启
hadoop
后,执行命令报错。
M_y_y
·
2023-11-08 23:58
linux
异常解决
hive报错File does not exist: /tmp/
hadoop
-yarn/staging/root/.staging/job_1699234747075_0001/job_.jhist
一、报错信息Causedby:org.apache.
hadoop
.ipc.RemoteException(java.io.FileNotFoundException):Filedoesnotexist:
胖胖学编程
·
2023-11-08 20:15
hive
报错
hadoop
hive
数据仓库
[yarn]yarn异常
一、运行一下算圆周率的测试代码,看下报错cd/home/data_warehouse/module/
hadoop
-3.1.3/share/
hadoop
/mapreduce
hadoop
jar
hadoop
-mapreduce-examples
胖胖学编程
·
2023-11-08 19:41
hadoop
hive
mapreduce
hadoop
大数据毕业设计选题推荐-超级英雄运营数据监控平台-
Hadoop
-Spark-Hive
✨作者主页:IT研究室✨个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。☑文末获取源码☑精彩专栏推荐⬇⬇⬇Java项目Python项目安卓项目微信小程序项目文章目录一、前言二、开发环境三、系统界面展示四、代码参考五、论文参考六、系统视频结语一、前言随着信息技术的快速发展,尤
IT研究室
·
2023-11-08 19:23
大数据项目
大数据
hadoop
spark
hive
毕业设计
VM虚拟机
华为大数据战略_华为大数据开源战略部部长陈亮 - Apache CarbonData,实现大数据即席查询秒级响应...
陈亮华为大数据开源开发部LeaderApacheCarbonDataPMC&CommitterEmail:
[email protected]
多年大数据和BI项目开发和实践经验,对大数据开源技术(
Hadoop
weixin_39954674
·
2023-11-08 16:47
华为大数据战略
华为的Carbondata
Carbondata的目标是创建一种新的
Hadoop
文件格式,只用一份数据,满足多样化的数据查询需求,包括顺序读,OLAP查询,随机读。
空中飞鸟lanse
·
2023-11-08 16:16
Apache开源项目
大数据
CarbonData 华为开源项目
CarbonData是一个为了更快的交互查询而生的新的
Hadoop
原生文件格式,用于大数据的快速分析和多维度查询
hadoop
本地数据存储设计。
tangkuo9
·
2023-11-08 16:46
BigData
CarbonData
华为开源项目
上一页
58
59
60
61
62
63
64
65
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他