E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop体系结构
pyspark on yarn 配置
1yarn模式出错pysparkonyarn在pycharm上执行出现以下问题:解决方案:在程序最前面添加如下程序importosos.environ["
HADOOP
_CONF_DIR"]="/opt/
强强0007
·
2025-05-13 12:40
pyspark
hadoop
大数据
分布式
Spark基础介绍
Hadoop
是一个分布式系统基础架构。
小白的白是白痴的白
·
2025-05-13 12:35
spark
大数据
分布式
安装
Hadoop
并运行WordCount程序
(一)asdfghjklx在虚拟机上安装java来,我们先给虚拟机上安装javaJDK。注意,后面我们会按照如下步骤来操作有:1.把javaJDK文件上传到服务器上。2.解压文件。3.配置环境变量。来,分别操作如下:1.上传文件到虚拟机。用FinalShell传输工具将JDK导入到opt目录下面的software文件夹下面(opt/software文件夹是我们自己创建的)2.解压文件。把刚才创建的
2401_84653595
·
2025-05-13 09:19
hadoop
linux
大数据
系统架构(基于
体系结构
的开发方法ABSD):智能物联网监控系统案例
系统架构(基于
体系结构
的开发方法ABSD):智能物联网监控系统知识点:[1]基于
体系结构
的开发方法(ABSD)的思想[2]基于
体系结构
的开发方法(ABSD)特点[3]
体系结构
4+1的视图[4]ABSD开发模型
数字化与智能化
·
2025-05-13 08:41
软考系统架构设计师案例分析
系统架构
软考系统架构设计师
系统架构设计师案例分析
ssh免密 linux 极简教程
解决
hadoop
集群ssh免密登录通信问题1、家目录/home/xxx/.ssh文件夹下[xxx@
hadoop
201~]$cd/home/xxx/.ssh2、生成公钥和私钥:[xxx@
hadoop
201
青瓜先生
·
2025-05-13 07:37
大数据
hadoop
ssh
大数据
linux
Hadoop
初始化不成功,Start-all报错
使用root配置的
hadoop
并启动会出现报错解决方法:在
Hadoop
安装目录下找到sbin文件夹在里面修改四个文件1、对于start-dfs.sh和stop-dfs.sh文件,添加下列参数:#!
Swingzzz
·
2025-05-13 04:14
日常学习
大数据
hadoop
Hadoop
运行模式介绍
Hadoop
运行模式主要有三种:本地运行模式(Local/Stand-aloneMode)在单机上模拟分布式环境,所有程序都在一个JVM进程中执行。
转身成为了码农
·
2025-05-12 22:41
hadoop
大数据
分布式
配置
Hadoop
集群-配置历史和日志服务
我们这把它配置在nn节点(
hadoop
100)上。具体配置步骤如下:1.配置mapred-site.xml在
hadoop
的安装目录下,打开mapred-site.xml,并在该文件里
心碎土豆块
·
2025-05-12 22:41
spark中的问题分析
hadoop
大数据
分布式
hadoop
的运行模式
(一)
Hadoop
的运行模式
hadoop
一共有如下三种运行方式:1.本地运行。数据存储在linux本地,测试偶尔用一下。我们上一节课使用的就是本地运行模式
hadoop
100。2.伪分布式。
心碎土豆块
·
2025-05-12 22:40
spark中的问题分析
hadoop
大数据
分布式
【
Hadoop
】核心组件深度剖析:HDFS、YARN与MapReduce的奥秘
明明跟你说过:个人主页个人专栏:《大数据前沿:技术与应用并进》行路有良友,便是天堂目录一、引言1、
Hadoop
简介2、
Hadoop
生态系统概览二、
Hadoop
DistributedFileSystem(
明明跟你说过
·
2025-05-12 10:12
大数据前沿:技术与应用并进
database
大数据
数据分析
hadoop
spark
hdfs
big
data
Hadoop
环境配置
Hadoop
完全分布式集群配置样板机配置一、安装系统这里使用的虚拟机是VMware,在安装好虚拟机之后利用UbuntuISO镜像文件安装Ubuntu操作系统。
木子_先生
·
2025-05-12 10:12
hadoop
linux
ubuntu
假期数仓项目笔记
数仓项目笔记sqoop(将数据从传统关系型数据库导出到大数据平台上)测试Sqoop是否能够成功连接数据库bin/sqooplist-databases--connectjdbc:mysql://
hadoop
102
s_yellowfish
·
2025-05-12 10:12
笔记
big
data
数据库
数据仓库
Hadoop
集群配置(二)免密登录和集群配置
写在开头:难难难道德玄,不对知音不可谈,对了知音谈几句,不对知音枉费舌尖~~咱们书接上回,上一篇写完了基础环境的配置,这篇就来说硕同样重要的免密登录,当然还有
Hadoop
集群的配置。
学而知之@
·
2025-05-12 09:41
大数据
Hadoop
Zookeeper
大数据
hadoop
hadoop
的dfs.replication
可以再上传文件的同时指定创建的副本数
hadoop
dfs-Ddfs.replication=1-put70Mlogs/2可
weixin_34302798
·
2025-05-12 09:11
大数据
Spark集群搭建(
Hadoop
+Spark+Zookeeper+HBase)
目录硬件准备与软件版本说明配置基础环境安装Java安装
Hadoop
安装Spark安装Python安装Scala安装SBT安装Zookeeper安装HBase安装Pycharm编写集群启动与关闭脚本用户管理界面补充硬件准备与软件版本说明
wahoo0301
·
2025-05-12 09:11
大数据平台
spark
大数据
hadoop
hbase
linux
配置
Hadoop
环境变量
1.添加
HADOOP
_HOME:2.PATH中添加:3.暴露
HADOOP
_HOME(不暴露配置不生效):
程序小人生
·
2025-05-12 09:40
Hadoop
基于Linux—
Hadoop
大数据集群搭建(100%成功版!!!)
文章目录
Hadoop
大数据集群搭建一、前置准备二、
Hadoop
配置
Hadoop
大数据集群搭建基础条件:VMware+CentOS7(操作简单,在此省略)完成基础条件下打开虚拟机,进行以下操作必读预告:关于复制粘贴功能
my_realmy
·
2025-05-12 09:09
系统安装指南
大数据
linux
hadoop
Hadoop
----- Kafka集群
Kafka是一个分布式的消息系统,是一种消息中间件Kafka作用解耦、冗余、提高性能、缓冲保证顺序、灵活、削峰填谷异步通信Kafka角色与集群结构Producer:生产者,负责发布消息consumer:消费者,负责读取处理消息topic:消息的类别parition:每个Topic包含一个parition或者多个paritionBroker:kafka集群包含一个或多个服务器kafka通过Zooke
受益于开源 回馈于开源
·
2025-05-12 09:09
kafka
Windows下
Hadoop
的环境变量的配置以及
Hadoop
的配置文件修改
Hadoop
的环境变量的配置1.进入系统变量,右键单击我的电脑–>属性–>高级环境变量配置–>高级选项卡–>环境变量–>单击新建
HADOOP
_HOME2.在系统变量path里面添加%
HADOOP
_HOME
drhrht
·
2025-05-12 09:39
java
java
后端
Hadoop
新手学习指导之入门需知
首先我们要了解
hadoop
是什么?
Hadoop
能够做什么?
Hadoop
的使用场景是什么?
Hadoop
和大数据、云计算的关系是什么?如何使用
hadoop
?
大数据和云计算
·
2025-05-12 09:08
大数据
数据分析
python
it资讯
前端
java
大数据
程序员
编程语言
hadoop
hadoop
+hive+spark+zookeeper+hbase大数据环境搭建
master172.16.34.101CentOSLinuxrelease7.3.1611slave01172.16.34.102CentOSLinuxrelease7.3.1611slave03172.16.34.103CentOSLinuxrelease7.3.16112.软件版本软件名称版本
hadoop
2.7.7hive1.2.2spark2.3.4zook
fengwuxichen
·
2025-05-12 09:08
大数据
hadoop
spark
hbase
大数据生态守护:
Hadoop
的深度保护策略
PART1从
Hadoop
运行原理透视数据保护需求1、
Hadoop
的定义与范畴
Hadoop
,狭义而言,是一个专为大数据设计的分布式存储与计算平台,其核心组件包括HDFS(
Hadoop
分布式文件系统)、MapReduce
云祺vinchin
·
2025-05-12 08:06
1024程序员节
【
Hadoop
】
hadoop
的路径分不清?HDFS路径与本地文件系统路径的区别
/usr/local/
hadoop
/user/
hadoop
/home/
hadoop
/这里有些路径名很相似,帮我区分?在
Hadoop
生态系统中,理解文件存储的位置对于有效管理数据至关重要。
Kkkika
·
2025-05-12 08:06
概念
hadoop
hdfs
大数据
Hadoop
HDFS DataNode存储高性能,高可用和高并发设计
胡弦,视频号2023年度优秀创作者,互联网大厂P8技术专家,SpringCloudAlibaba微服务架构实战派(上下册)和RocketMQ消息中间件实战派(上下册)的作者,资深架构师,技术负责人,极客时间训练营讲师,四维口袋KVP最具价值技术专家,技术领域专家团成员,2021电子工业出版社年度优秀作者,获得2023电子工业出版技术成长领路人称号,荣获2024年电子工业出版社博文视点20周年荣誉专
架构随笔录
·
2025-05-12 08:36
大数据
hadoop
hdfs
java
Java—— 集合 Collection
单列集合
体系结构
注意:List系列集合添加的元素是有序(存取数据的顺序相同),可重复,有索引的Set系列集合添加的元素是无序,不能重复,无索引的Collection介绍Collection是单列集合的祖宗接口
举一个梨子zz
·
2025-05-12 06:19
java
开发语言
【西电9031考研复试】操作系统-学习笔记
【操作系统】学习笔记操作系统概念与功能特征发展与分类运行机制中断系统调用
体系结构
操作系统结构虚拟机进程与线程PCB进程的状态与转换进程控制进程通信线程线程的实现方式进程的转换进程调度调度算法进程互斥死锁的解除预防死锁内存管理内存保护覆盖与交换动态分区分配分页存储管理基本地址变换机构快表基本分段存储管理方式内存映射文件文件管理文件逻辑结构文件目录文件分配方式连续分配链接分配索引分配文件存储空间管理文
chaser&upper
·
2025-05-12 03:27
OS
一研为定
学习
笔记
RDD 三种创建方式
读取本地文件创建RDDscala>valtest=sc.testFile("file:///export/data/test.txt")二.从HDFS加载数据创建RDD1.需要在HDFS上创建目录data
hadoop
fs-mkdir
古月皮皮
·
2025-05-12 02:50
hadoop
hdfs
大数据
RDD的几种创建方式
(分布式的特性)RDD通常通过
Hadoop
上的文件,即HDFS文件,来进行创建;有时也可以通过Spar
itcats_cn
·
2025-05-12 01:48
大数据
RDD
RDD创建的几种方式
Hadoop
架构再探讨
文章目录1.
Hadoop
的优化与发展1.1
Hadoop
的局限与不足1.2针对
Hadoop
的改进与提升2.HDFS2.0新特性2.1HDFSHA1.HDFS1.0组件及功能回顾2.HDFS1.0的单点故障问题
身形似鹤形
·
2025-05-11 22:58
hadoop
架构
大数据
java读写hdfs文件操作_HDFS文件系统简单的Java读写操作
packagecom.cn.
hadoop
.hdfs;importjava.io.FileInputStream;importjava.io.FileOutputStream;importjava.io.IOException
weixin_39979159
·
2025-05-11 18:01
java读写hdfs文件操作
hdfs遍历文件方法
importorg.apache.commons.lang.StringUtils;importorg.apache.
hadoop
.conf.Configuration;importorg.apache.
hadoop
.fs
weixin_30325793
·
2025-05-11 18:31
大数据
java
shell
hadoop
和hive的客户端安装与配置
1文件列表:
hadoop
_client.tar.gz(
hadoop
和hive的client环境)
hadoop
_java.tar.gz(java的环境)
hadoop
_python.tar.gz(python
yccn214
·
2025-05-11 17:57
tech
Hadoop
的客户端配置
1.下载eclipse2.下载与集群上版本号相同的
hadoop
压缩包解压然后配置环境变量
HADOOP
_HOME解压目录Path中添加%
HADOOP
_HOME%\bin3.在eclipse中建立Maven
奋斗的憨憨小S
·
2025-05-11 17:56
maven
hadoop
Hadoop
生态系统:如何高效处理大规模数据集?
Hadoop
生态系统:如何高效处理大规模数据集?大家好,我是Echo_Wish,今天我们聊聊大数据处理的核心技术——
Hadoop
生态系统。
Echo_Wish
·
2025-05-11 17:56
大数据高阶实战秘籍
hadoop
大数据
分布式
hadoop
客户端该如何配置
Hadoop
集群主要是由三部分组成的:主节点、从节点和客户端,即master、slave和client。我们在搭建
hadoop
集群的时候通常只考虑了主节点和从节点的搭建,却忽略了客户端。
huanbia
·
2025-05-11 17:24
hadoop笔记
hadoop
客户端
Hadoop
中的集群配置规划
对普通用户来说,
Hadoop
就是一个东西,一个整体,它能给我们提供无限的磁盘用来保存文件,可以使用提供强大的计算能力。但是,我们要把它搭建起起来,就必须要了解它的基本组成,知道它的内部分工。
End928
·
2025-05-11 17:22
hadoop
大数据
分布式
冯·诺依曼
体系结构
信息来自网站:从冯•诺依曼结构视计算机科学的发展史现代数字计算机奠基开拓者:冯诺依曼1.冯·诺依曼
体系结构
图1-12.冯·诺依曼理论的要点数字计算机的数制采用二进制;计算机应该按照顺序执行程序。
hm4518
·
2025-05-11 16:48
冯诺依曼结构
内存、磁盘、CPU区别,
Hadoop
/Spark与哪个联系密切
在
Hadoop
/Spark中的表现:内存不足时,任务可能会频繁使用磁盘(即“溢写
大数据知识搬运工
·
2025-05-11 10:43
spark学习
hadoop
spark
hive分桶表join_Hive:JOIN及JOIN优化 2015.10.25
1.Join的基本原理大家都知道,Hive会将所有的SQL查询转化为Map/Reduce作业运行于
Hadoop
集群之上。
贺叔
·
2025-05-11 09:07
hive分桶表join
TCP/IP协议简要介绍
本文介绍TCP/IP协议的组成、协议
体系结构
、TCP/IP的核心协议及应用程序接口。1TCP/IP协议
体系结构
TCP/IP协议映射到一个称为DARPA模型的四层概念模型
icysmile131
·
2025-05-11 03:25
网络协议
网络
Spark集群搭建之Yarn模式
简介SparkonYARN(YetAnotherResourceNegotiator)是Spark框架在
Hadoop
集群中运行的一种部署模式,它借助
Hadoop
YARN来管理资源和调度任务模式分类Client
悻运
·
2025-05-10 17:21
spark
大数据
分布式
Flink 实时计算引擎:构建大数据流水线
本文将介绍Flink的
体系结构
,并通过实例演示如何构建一个简单的大数据流水线。1.Flink简介ApacheFlink是一个开源的流式处理引擎,可以处理无限数量的事件流。它以其高效、可靠和
抱紧大佬大腿不松开
·
2025-05-10 15:37
大数据
flink
《云计算》第三版总结
《云计算》第三版总结云计算
体系结构
云计算成本优势开源云计算架构
Hadoop
2.0
Hadoop
体系架构
Hadoop
访问接口
Hadoop
编程接口
Hadoop
大家族分布式组件概述ZooKeeperHbasePigHiveOozieFlumeMahout
冰菓Neko
·
2025-05-10 10:34
书籍
云计算
yarn的概述
1.Yarn的定义2.Yarn的三大组件3.Yarn的调度策略1.YARN的定义YARN(YetAnotherResourceNegotiator)是
Hadoop
生态系统中的一个资源管理框架,用于管理和调度集群中的计算资源
洋芋爱吃芋头
·
2025-05-10 08:22
java
大数据
开发语言
大数据领域数据架构的分布式系统设计
大数据领域数据架构的分布式系统设计关键词:大数据、分布式系统、数据架构、
Hadoop
、Spark、数据分区、容错机制摘要:本文深入探讨大数据领域中的数据架构和分布式系统设计。
AI天才研究院
·
2025-05-10 05:00
大数据
架构
ai
启动hdfs报错:Attempting to operate on hdfs namenode as root but there is no HDFS NAMENODE USER defined.
问题:配置好了
hadoop
的文件一启动就发现报错造成原因:这个问题呢,其实还是你的配置文件配错了,有两个配置文件的问题:core-site.xml文件
hadoop
-env.sh文件这两个文件都是在
hadoop
鸡哥爱技术
·
2025-05-10 02:12
hadoop
Yarn-tool接口
Tool接口定义org.apache.
hadoop
.util.Tool是Apache
Hadoop
框架里的一个接口,其用途是协助开发可通过命令行运行的
Hadoop
应用程序。
夏天吃哈密瓜
·
2025-05-10 00:30
hadoop
大数据
【
hadoop
】
hadoop
-daemon.sh
开启:
hadoop
-daemon.shstartnamenode关闭:
hadoop
-daemon.shstopnamenode
火龙谷
·
2025-05-09 10:56
hadoop
hadoop
java
《spark》
这是一篇关于Spark概述的文章,主要介绍了Spark的基本概念、与
Hadoop
的关系、核心模块以及运行模式。
快乐的蛋挞
·
2025-05-09 09:11
spark
hadoop
的序列化
Hadoop
中的序列化是指将数据转换为字节流的过程,以便在网络上传输或存储。
Hadoop
使用自定义的序列化和反序列化机制来处理大量的数据,这有助于在分布式环境中高效地进行数据传输和处理。
嘟嘟嘟嘟嘟嘟嘟.
·
2025-05-09 05:18
hadoop
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他