E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
研磨hadoop
Hadoop
伪分布式搭建Linux版 超详细(喂饭教程 强烈推荐)
Hadoop
是大数据处理主流框架,如果要学习大数据处理与存储,
hadoop
是必须掌握的一种框架技术。
Starry-sky(jing)
·
2023-10-23 23:44
[linux操作系统笔记]
nosql
大数据
数据挖掘
linux
python
作为精密仪器,清洗是
研磨
器必不可少的一项维护
研磨
器是一种特殊的、快速的、高效率的、多试管的一致系统。具有体积小,重量轻,操作简便,无污染等特点,非常适合实验室各类土壤
研磨
的使用。
mtheliang123
·
2023-10-23 23:15
心想事成
深度学习
ubuntu中redis客户端与服务端命令、redis数据类型、字符串string、哈希hash、列表list、集合set、有序集合zset操作命令
notonlySQL):泛指非关系型数据库,是一类新出现的数据库,不支持SQL语法,其存储的数据都是kv形式,存储结构与关系型数据库中的关系表完全不同NoSQL产品种类:主要有Redis、MongoDB、HBASE
Hadoop
learning-striving
·
2023-10-23 21:06
redis
redis
数据库
mysql
ubuntu
数据类型
hadoop
CDHStart
/bin/bashforiin
hadoop
101
hadoop
102doif[$i="
hadoop
101"]thenecho------------$iisstartinghdfs------------
白纸糊
·
2023-10-23 21:23
大数据分析引擎之presto简介
大数据分析引擎之presto简介简介:presto是一个大数据分析引擎,不属于
hadoop
体系,他是基于内存的。他的集群模式是主从式的。
枣泥馅
·
2023-10-23 21:21
大数据hadoop
presto
hadoop
[jmx]zookeeper/kafka/hive/
hadoop
/presto/presto等组件的jmx监控汇集
文章目录背景注意事项——本文必读zookeeper的jmx监控配置
hadoop
的jmx监控kafka的jmx监控hive的jmx监控hiveserver2的jmx监控metastore的jmx监控kylin
王一1995
·
2023-10-23 20:19
运维
#
linux
大数据
大数据
java
kafka
hadoop
及其组件安装
一、
hadoop
安装所需环境操作系统集群配置搭建3节点完全分布式集群,即1个nameNode,2个dataNode,分别如下:主机名IP描述master10.221.101.1NameNodeslave110.221.101.2DataNameslave210.221.101.3DataNode
ZX_JS
·
2023-10-23 20:22
ZooKeeper安装与配置集群
简介:ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是
Hadoop
和Hbase的重要组件。
你才是臭弟弟
·
2023-10-23 20:11
ZooKeeper
zookeeper
分布式
hadoop
和zookeeper的安装与配置
文章目录
hadoop
和zookeeper的安装与配置一.安装好linux虚拟机、Xshell、Xftp二.解压安装jdk、
hadoop
、zookeeper的压缩包三.配置linux主机设置与环境四.编写并添加
奋斗的小G佩奇
·
2023-10-23 20:39
大数据
hadoop
linux
zookeeper
【无标题】
Spark和
Hadoop
的MapReduce对比spark和mapreduce对比速度:Spark的设计目标是比MapReduce更快,这要归功于它的内存处理能力。
浩海紫冰
·
2023-10-23 19:54
mapreduce
spark
hadoop
Docker 学习笔记 -- kuangshen Docker 视频学习笔记
环境配置是十分的麻烦,每一个机器都要部署环境(集群Redis、ES、
Hadoop
…)!费时费力。发布一个项目(jar+(RedisMySQLjdkES))。项目能不能都带上环境安装打包!
Tiimmi丶
·
2023-10-23 17:53
docker
centos
虚拟机
linux
Flink1.9编译
环境准备gitmavenjdk8u51及以上flink1.9源码gitclonehttps://github.com/apache/flink.git编译Flink针对不同
Hadoop
版本编译方法不一样
官先生Y
·
2023-10-23 17:09
Hadoop
-HA高可用集群QJM搭建
1.此教程默认已经搭建好完全分布式2.Zookeeper集群搭建配置完全分布式zk集群---------------------1.挑选3台主机cs1~cs32.每台机器都安装zktar环境变量3.配置zk配置文件cs1~cs3[/home/ap/apps/zk/conf/zoo.cfg]...dataDir=/home/ap/zookeeper4.在每台主机的/home/centos/zooke
airpoet
·
2023-10-23 16:38
Spark 简介
spark特点spark是基于内存计算的大数据并行计算框架具有如下特点:运行速度快Spark使用先进的DAG执行引擎,基于内存的执行速度可比
Hadoop
MapReduce快上百倍,基于磁盘的执行速度也能快十倍容易使用支持使用
博弈史密斯
·
2023-10-23 16:22
【
Hadoop
】创建
Hadoop
集群(3个节点)—— 安装部署一个3个节点构成的hbase集群
前言此实验搭建3个虚拟节点,一个mater,一个slave1,一个slave2集群简介
HADOOP
集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但在物理上常在一起。
db_lxm_2072
·
2023-10-23 14:22
hadoop
hdfs
大数据
Spark RDD&算子 基本操作
(2)由外部存储系统的数据集创建,包括本地的文件系统,还有所有
Hadoop
支持的数据集,比如HDFS、Cassandra、HBase等。
傍ྂ离ྂ
·
2023-10-23 14:40
Scala
Spark
spark
scala
搭建
Hadoop
的环境
安装
Hadoop
环境之前需要做一些准备工作,比如:安装Linux、JDK、关闭防火墙、配置主机名、配置免密码登录、了解
Hadoop
目录结构等。
猿分享
·
2023-10-23 14:09
基于
Hadoop
开发的大数据实战项目——电商日志分享系统
项目介绍大数据电商日志平台项目以某电商网站真实的业务数据架构为基础,将数据从收集到使用通过前端应用程序,后端程序,数据分析,平台部署等多方位的闭环的业务实现。形成了一套符合教学体系的电商日志分析项目。bf_dataapi项目的主要目标有两个:第一个就是我们需要提供一个提供json数据的RestAPI;另外一个目标就是提供一个展示结果的demo页面。bf_dataapi使用spring+mybati
搞程序的菇凉
·
2023-10-23 13:57
big
data
大数据
database
hadoop
数据库
大数据
Hadoop
(三)API操作
第03章
Hadoop
API操作HDFS操作Maven配置进行haddopHDFS相关开发首先需要引入下面两个开发依赖,当然需要根据开发环境中的
Hadoop
版本选择相关依赖的版本号。
傅二毛
·
2023-10-23 12:16
小迪安全_服务攻防 数据库,中间件安全
55、数据库安全&Redis&
Hadoop
&Mysql&未授权访问&RCE#知识点:1、服务攻防-数据库类型安全2、Redis&
Hadoop
&Mysql安全3、ysq1-CVE-2012-2122漏洞4
飞辽个飞
·
2023-10-23 09:33
数据库
安全
中间件
yarn 异常: Error when storing the finish data of container
yarnresourcemanager异常分析:org.apache.
hadoop
.yarn.server.resourcemanager.ahs.RMApplicationHistoryWriter:
phospherus
·
2023-10-23 08:12
Redis学习笔记——NoSQL
商品的图片:采用分布式文件系统,如淘宝的TFS、
Hadoop
的HDFS、Google的GFS等。商品的关键字(搜索引擎):淘宝内用ISearch。商品的波段性的热点高频信息:内存数据库
从程序猿到程序员
·
2023-10-23 06:51
Redis
数据库基础学习笔记——NoSQL介绍、NoSQL和SQL数据库的比较
中存储的数据都是key-value形式;NoSQL的世界中没有一种通用的语言,每种nosql数据库都有自己的API和语法,以及擅长的业务场景;NoSQL中的产品种类很多,如MongoDB、Redis、Hbase
hadoop
鬼义II虎神
·
2023-10-23 06:20
学习笔记
数据库
流量回放原理
来筛选数据传输通过kafka等消息队列将获取的日志数据传输进行下一步处理数据处理从消息队列中消费日志数据,通过storm数据处理系统从日志信息中获取到想要的数据,比如从日志中获取接口的req数据转存通过
hadoop
尝试热爱这个世界
·
2023-10-23 06:38
spark-core-转载
Hadoop
的MapReduce是一种基于数据集的工作模式,面向数据,这种工作模式一般是从存储上加载数据集,然后操作数据集,最后写入物理存储设备。数据更多面临的是一次性处理。 MR
zuoseve01
·
2023-10-23 05:28
spark
基于Spark Streaming的实时日志分析系统实践 Spark Streaming 在数据平台日志解析功能的应用
前言目前业界基于
Hadoop
技术栈的底层计算平台越发稳定成熟,计算能力不再成为主要瓶颈。多样化的数据、复杂的业务分析需求、系统稳定性、数据可靠性,这些软性要求,逐渐成为日志分析系统面对的主要问题。
bcdk1188
·
2023-10-23 05:56
大数据
分布式
数据库
hadoop
spark
Hadoop
集群环境配置及安装配置(详细过程包含安装包)
IP从主节点依次排序,node1为30,node2则为31,以此类推)3.主机映射4.ssh免密登录三、JDK安装部署(三台虚拟机都要安装)四.关闭防火墙和SElinux五、修改时区并配置自动时间同步
Hadoop
菜鸟一千零八十六号
·
2023-10-23 05:25
大数据
hadoop
linux
大数据
Hadoop
HDFS分布式文件系统(介绍以及基础操作命令)
目录一、为什么需要分布式存储?二、分布式的基础架构分析三、HDFS基础架构1.HDFS简介四、HDFS集群启停命令1.一键启停脚本2.单进程启停五、HDFS基本操作命令1.创建文件夹2.查看指定目录下内容3.上传文件到HDFS指定目录下4.查看HDFS文件内容5.下载HDFS文件6.拷贝HDFS文件7.追加数据到HDFS文件中8.HDFS数据移动操作9.HDFS数据删除操作六、HDFS权限不足解决
菜鸟一千零八十六号
·
2023-10-23 05:25
大数据
hadoop
hdfs
大数据
Hadoop
之HDFS
目录1.HDFS概述1.1HDFS产出背景及定义1.2HDFS优缺点1.3HDFS组成架构1.4HDFS文件块大小2.HDFS的Shell操作2.1基本语法2.2命令大全2.3常用命令实操2.3.1准备工作2.3.2上传2.3.3下载2.3.4HDFS直接操作3.HDFS的API操作3.1客户端环境准备3.2HDFS的API案例实操3.2.1HDFS文件上传(测试参数优先级)3.2.2HDFS文件
基础不牢,地动山摇...
·
2023-10-23 05:14
大数据
hadoop
hdfs
hadoop
01 - 大数据启蒙、初识HDFS
分治思想:需求:1.我有一万个元素(比如数字或者单词)需要存储?2.如果查找某一个元素,最简单的遍历方式复杂度是多少3.如果我期望复杂度是O(4),怎么处理1.使用链表的方式储存数据使用链表的方式储存数据2.使用遍历的方式寻找X,时间复杂度O(n)3.使用数据分治的思想,把数据放到若干链表中(用分为2500个小链表举例,简单举例,不考虑数据倾斜等其他问题)4.分治的思想很多,比如redis集群,e
Doit_0e7c
·
2023-10-23 05:59
我的灵魂流光溢彩
我流光溢彩的灵魂里偏爱着橘色的暖悄悄剪藏一小段三月夕阳坐在琉璃晚灯下慢慢
研磨
明日涂抹娇媚娴静的胭脂妆乘一叶扁舟涉过江去拥抱一朵放在心上的桃花像是知道他会来一样期待我请东风把我写在纸鸢里的纸短情长遥寄远方对君诉说还想吻你万千意绵绵爱你千千万万遍像是知道他不会来一样等候我会满载一船郁郁青青的岸芷汀兰停在落英缤纷的桃花雨江畔安然入眠我在我柔软的梦里依旧藏着一小段温暖夕阳寂寂无声燃亮君朝我缓缓归来的长路绝
何卿卿
·
2023-10-23 04:22
hive初识
1、hive是个啥1)hive主要是对mapreduce任务进行简化操作,方便工作人员快速进行数据分析;2)hive是构建在
hadoop
之上的数据仓库,能够将结构化的数据文件映射成一张表,以HQL作为查询接口
紫苓
·
2023-10-23 02:31
解读大数据与
Hadoop
之间的关系
但是很多人对大数据存在误解,下面就跟着小编来缕一缕大数据与
Hadoop
之间的关系。我们都听过这个预测:到2020年,电子数据存储量将在2009年的基础上增加44
qunqun8889
·
2023-10-23 01:05
大数据
大数据
大数据开发
大数据学习
大数据分析
Hadoop
一步步练习
Hadoop
实操之HDFS和YARN,内附详细测试步骤与图解!
Hadoop
在操作之前我们可以重启一下云主机,使我们的全部配置生效而不是当前生效。启动
Hadoop
启动HDFS:start-dfs.sh会提示你是否继续连接等等,都yes即可!
ZiTalk梓言梓语
·
2023-10-23 01:04
大学
hadoop
大数据
yarn
hadoop
面试题
1.从前到后从你教育背景(学过哪些课)到各个项目你负责的模块,问的很细(本以为他是物理学博士,但是所有的技术都懂)2.
hadoop
的namenode宕机,怎么解决先分析宕机后的损失,宕机后直接导致client
清沐挽曦
·
2023-10-23 01:03
java
大数据
hadoop
hadoop
2万字图解
Hadoop
如果你希望技术交流,可以关注我(或者私信)整理不易,关注一下吧ღ(´・ᴗ・`)比心第一部分:初识
Hadoop
1.
Hadoop
介绍
Hadoop
是一个由Apache基金会所开发的分布式系统基础架构。
Python无霸哥
·
2023-10-23 01:03
hadoop
大数据
分布式
高效存储大规模数据
Hadoop
分布式文件系统(HDFS)是一个常用的分布式文件系统,它基于大规模集群,并通过数据切割和复制来实现高容错性和可靠性。以下是一个使用HDFS存储数据的Python代码示
心之所向,或千或百
·
2023-10-23 01:47
大数据
大数据
Hadoop
3教程(二十六):(生产调优篇)NameNode核心参数配置与回收站的启用
在
Hadoop
2.x里,如何配置NameNode内存?NameNode默认内存2000M。如果你的服务器内存是4G,那一般可以把NN内存设置成3G,留1G给服
经年藏殊
·
2023-10-23 01:01
大数据技术
大数据
hadoop
Sqoop的安装与配置
Sqoop安装准备安装Sqoop的前提是已经具备Java和
Hadoop
、Hive、ZooKeeper、HBase的环境安装步骤上传安装包sqoop-1.4.6-cdh5.14.2.tar.gz到虚拟机中解压
菜鸟也学大数据
·
2023-10-23 00:56
菜鸟也学大数据
sqoop
sqoop
为什么卖咖啡豆的都不给磨粉了?
longlongago卖咖啡豆的店家还把“可磨粉”作为卖点写进商品标题里,以示服务贴心,后来“不磨粉”却成了越来越多卖豆商家的备注,还会温馨提示如果没有
研磨
器具可以买挂耳。
孙奇妙
·
2023-10-23 00:10
linux卸载
hadoop
命令,
hadoop
安装命令简记(ubuntu17.04)
卸载默认openjdk1.卸载ubuntu带有的openjdksudoapt-getremoveopenjdk*2.设置默认jdk(假如有openjdk的话)由于Ubuntu中可能会有默认的jdk,如openjdk。假如有openjdk的话,所以,为了使默认使用的是我们安装的jdk,还要进行如下工作(可以使用该命令安装其他命令,例如eclipse)。执行代码:sudoupdate-alternat
李彼岸
·
2023-10-22 22:08
linux卸载hadoop命令
解决Linux
Hadoop
启动 权限不足
使用命令:sudochown-hRdgj/home/dgj/software/
hadoop
修改群组和用户sudochown-hRgroup:usersfile更改群组名sudochgrpgroup_namefile
夹锌饼干
·
2023-10-22 22:03
Hadoop
hadoop
三种大数据应用架构介绍
本文主要介绍大数据的三类应用架构MapReduce、
Hadoop
、Spark,进行数据处理。
梯度科技
·
2023-10-22 17:14
hadoop
大数据
spark
今日周六 宜吃红豆
它在口中流转交错,经过齿间
研磨
,柔软的红豆变成细腻又不乏质感的豆沙,木糖醇的甜和微凉中和了红豆的干与热,吃起来很有满足感。
王小曼的日记
·
2023-10-22 14:53
Python PySpark 大数据的瑞士军刀
本篇文章主要涉及的知识点有:
Hadoop
及其生态系统:了解
Hadoop
的由来以及
Hadoop
生态系统。Spark的核心概念:掌握Spark的基本概念和架构。
S_zhangmin
·
2023-10-22 10:54
PySpark
big
data
spark
hadoop
Hadoop
3教程(二十九):(生产调优篇)集群扩容及缩容(白名单与黑名单)
文章目录(150)添加白名单(151)服役新服务器(152)服务器间数据均衡(153)黑名单退役服务器参考文献这一章还算是比较重要的。(150)添加白名单白名单:在白名单里的主机IP地址,就可以用来存储数据以及互相之间的通信等。一般企业都会配置集群白名单,防止黑客攻击。相应的,集群里也有黑名单,下几节会讲。配置白名单步骤如下,仅做了解,所以直接复制的教程内容:1)在NameNode节点的/opt/
经年藏殊
·
2023-10-22 10:31
大数据技术
大数据
hadoop
Hadoop
3教程(三十):(生产调优篇)纠删码
于是
Hadoop
3.x引入了纠删码,采用计算的方式来提高数据的可靠性,可以节省50%左右的存储空间。如上图(黄色部分),默认情况下,对于一个300M大小的文件,
经年藏殊
·
2023-10-22 10:31
大数据技术
大数据
hadoop
Hadoop
面试题(HDFS篇)
1.HDFS写流程?以及参与的组件?----------------------流程图---------------------------A(Client)--发送写请求-->B(NameNode)B--返回可用DataNodes列表-->AA--选择主节点-->C(主节点PrimaryDataNode)C--建立连接-->AA--发送数据块-->CC--存储数据块并复制到其他DataNodes
Young_IT
·
2023-10-22 10:57
大数据开发
hadoop
hdfs
大数据
Hadoop
3教程(二十八):(生产调优篇)NN、DN的多目录配置及磁盘间数据均衡
文章目录(148)NN多目录配置(149)DataNode多目录配置及磁盘间数据平衡磁盘间数据均衡参考文献(148)NN多目录配置NN多目录的意思是,本地目录可以配置成多个,且每个目录存放内容相同,这样的目的是增加可靠性。比如说下图这样:但其实生产中不常用哈,生产中要增加NN的可靠性的话,一般会开启NN的高可用,即在不同节点上开启多个NN,靠zookeeper来协调。所以本节就了解一下即可。配置的
经年藏殊
·
2023-10-22 10:56
大数据技术
hadoop
大数据
大数据技术学习笔记(二)——
Hadoop
运行环境的搭建
hosts文件1.3修改IP地址1.3.1查看网络IP和网关1.3.2修改IP地址1.4关闭防火墙1.5创建普通用户1.6创建所需目录1.7卸载虚拟机自带的openJDK1.8重启虚拟机2克隆虚拟机3在
hadoop
101
夏木夕
·
2023-10-22 08:08
大数据
大数据
分布式
hadoop
上一页
72
73
74
75
76
77
78
79
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他