E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop分布式系统
如何保证MySQL和Redis的数据一致性?
图片来自Pexels什么是数据的一致性一致性就是数据保持一致,在
分布式系统
中,可以理解为多个节点中数据的值是一致的。而一致性又可以分为强一致性与弱一致性。
架构师小秘圈
·
2024-02-19 18:50
数据库
队列
分布式
redis
java
第五节 zookeeper集群与分布式锁_2
分布式锁:分布式锁,即
分布式系统
做个专注的工程师
·
2024-02-19 16:01
#
zookeeper
zookeeper
《
分布式系统
原理介绍》要点简记
数据备份机制问题:机器宕机导致数据丢失问题解决:无状态节点则无需读取读取任何信息就可以立刻重新“可用”有状态节点可以通过读取本地存储设备中的信息或通过读取其他节点数据的方式恢复内存信息有状态是指是否是保存数据的节点序列号机制问题:消息乱序解决:给消息排号,按照版本号进行消费校验码机制问题:数据错误消息被抓包篡改解决:使用一定的校验码机制可以较为简单的检查出网络数据的错误,从而丢弃错误的数据序列号机
猫哥灬01
·
2024-02-19 16:52
分布式
面试
分布式
SpringCloud-搭建Nacos配置中心
在微服务架构中,配置管理是至关重要的一环,Nacos提供了可靠、动态的配置管理功能,为
分布式系统
的配置中心提供了便捷的解决方案。
Damon小智
·
2024-02-19 15:45
Java
spring
cloud
java
nacos
配置管理
微服务
分布式
后端
消息中间件管理系统-RabbitMQ及其两类传输模型
MQ,意思为消息队列,
分布式系统
中的重要组件,用它就可以实现应用解耦、异步消息、流量削峰等问题。消息队列产品有很多,企业级应用较广泛的就是RabbitMQ。
sunyunfei1994
·
2024-02-19 14:08
rabbitmq
分布式
什么是RabbitMQ?
一、引言RabbitMQ是一个开源的消息代理软件,用于在
分布式系统
中传递消息。
张万森的救赎
·
2024-02-19 14:35
rabbitmq
分布式
Quick introduction to Apache Spark
Spark使用
Hadoop
的客户端库来
Liam_ml
·
2024-02-19 13:29
Hadoop
Shuffle
Whentherearemultiplereducers,themaptaskspartitiontheiroutput,eachcreatingonepartitionforeachreducetask.Therecanbemanykeys(andtheirassociatedvalues)ineachpartition,buttherecordsforeverykeyareallinasing
SharlotteZZZ
·
2024-02-19 13:22
Flink 细粒度滑动窗口性能优化
大数据技术AIFlink/Spark/
Hadoop
/数仓,数据分析、面试,源码解读等干货学习资料118篇原创内容公众号1、概述1.1细粒度滑动的影响当使用细粒度的滑动窗口(窗口长度远远大于滑动步长)时,
hyunbar
·
2024-02-19 13:39
Flink
大数据
flink
java
数据库
【大数据面试题】006介绍一下Parquet存储格式的优势
同时一般查询使用时不会使用所有列,而是只用到几列,所以查询速度会更快压缩比例高因为是列式存储,所以可以对同一类型的一段做压缩,压缩比例高支持的平台和框架多在
Hadoop
,Spark,Presto,Python
Jiweilai1
·
2024-02-19 13:34
一天一道面试题
大数据
spark
hadoop
Sqoop 入门基础
简介Sqoop(SQLto
Hadoop
)是一个开源工具,用于在关系型数据库和
Hadoop
之间传输数据。
香菜的开发日记
·
2024-02-19 13:17
sqoop
hadoop
hive
hadoop
硬件配置 高可用 datanode namenode硬件配置
每个分布式文件系统分块在NameNode的内存中大小约为250个字节,此外还要加上文件和目录所需的250字节空间。500字节一个块假设我们有5000个平均大小为20GB的文件并且使用默认的分布式文件系统分块大小(64MB)同时副本因子为3,5000*20GB=102400000M=97T那么NameNode需要保存5千万个分块的信息,这些分块的大小加上文件系统的开销总共需要1.5GB的内存。但是一
xcagy
·
2024-02-19 13:07
HADOOP
K8S
hadoop硬件
田尚滨
RabbitMQ:
分布式系统
中的高效消息队列
摘要RabbitMQ是一款开源、高度可靠、灵活性强的消息队列系统,被广泛应用于
分布式系统
中。
张万森的救赎
·
2024-02-19 12:48
rabbitmq
分布式
现阶段适用于 单一架构 还是 分布式架构 ?
劣势:开发和部署比较复杂,需要考虑
分布式系统
的一些问题,如分布式
小Mie不吃饭
·
2024-02-19 12:41
JAVA
架构
分布式
【大数据】
HADOOP
-YARN-ContainerExecutor容器启动器详解
在NodeManager中,有三种运行Container的方式,它们分别是:DefaultContainerExecutorLinuxContainerExecutorDockerContainerExecutor从它们的名字中,我们就能看得出来,默认情况下,一定使用的是DefaultContainerExecutor。而一般情况下,DefaultContainerExecutor也确实能够满足我
笑起来贼好看
·
2024-02-19 11:38
Hadoop
大数据
hadoop
大数据
linux
学习篇-
Hadoop
-YARN-环境搭建
文章目录一、
Hadoop
-YARN-环境搭建一、
Hadoop
-YARN-环境搭建官网参考:https://
hadoop
.apache.org/docs/stable/
hadoop
-project-dist
东东爱编码
·
2024-02-19 11:08
hadoop
大数据
hadoop
【大数据】
HADOOP
-Yarn集群界面UI指标项详解(建议收藏哦)
目录首页(Cluster)节点信息SchedulerMetrics:集群调度信息节点信息详解(Nodes)应用列表信息(applications)队列详情页(Scheduler)指标详细说明(非常重要)首页(Cluster)集群监控信息指标详解AppsSubmitted:已提交的应用AppsCompleted:已完成的应用AppsRunning:正在运行的应用ContainersRunning:正
笑起来贼好看
·
2024-02-19 11:08
Hadoop
大数据
服务运维部署
大数据
hadoop
分布式
yarn
Hadoop
-Yarn-NodeManager都做了什么
一、源码下载下面是
hadoop
官方源码下载地址,我下载的是
hadoop
-3.2.4,那就一起来看下吧Indexof/dist/
hadoop
/core二、上下文在我的博客中已经简要的分析了NodeManager
隔着天花板看星星
·
2024-02-19 11:00
hadoop
大数据
分布式
【2019-04-28】
Hadoop
分布式文件系统
Hadoop
自带HDFS(
hadoop
distributefilesystem)。HDFS默认数据块128M。
BigBigFlower
·
2024-02-19 11:56
Hadoop
搭建之 start-yarn.sh 报错
在搭建伪分布式的
Hadoop
集群环境时,在配置基础环境了并成功开启了HDFS组件后,jps查看已运行的名称节点和数据节点进程,[
hadoop
@master
hadoop
]$jps8994NameNode10396Jps9087DataNode9279SecondaryNameNode
万里长江雪
·
2024-02-19 11:58
java
hadoop
hdfs
大数据
运维
网络
hadoop
-2.7.4-nodemanager无法启动问题解决方案
近期新配了
hadoop
-274版本的集群,发现有一个小问题,DataNode无法顺利启动。
半肉哥
·
2024-02-19 11:27
hadoop
hadoop
-yarn资源分配介绍-以及推荐常用优化参数
如果有什么不正确的欢迎大家一起交流学习~Yarn前言作为
Hadoop
2.x的一部分,YARN采用MapReduce中的资源管理功能并对其进行打包,以便新引擎可以使用它们。
Winhole
·
2024-02-19 11:26
hadoop
Linux
Hadoop
-Yarn-NodeManager如何计算Linux系统上的资源信息
NodeResourceMonitorImpl)时只是提了下SysInfoLinux,下面我们展开讲下SysInfoLinux是用于计算Linux系统上的资源信息的插件二、SysInfoLinux源码packageorg.apache.
hadoop
.util
隔着天花板看星星
·
2024-02-19 11:48
hadoop
大数据
linux
node命令yarn --version指向了java
问题描述本地安装了java、
hadoop
和nodejs,并配置了环境变量,但是
hadoop
的bin目录下存在yarn命令,所以使用nodejs的yarn命令启动项目会出现找不到类,此时键入yarn-version
码学弟
·
2024-02-19 11:43
前端
node.js
yarn
企业级大数据安全架构(一)平台安全隐患
1缺乏统一的访问控制机制大数据平台由
Hadoop
生态体系众多组件组成,而每个组件都会提供相应的WebUI界面和RESTful接口,例如Nam
·
2024-02-19 11:48
大数据企业级安全性
MapReduce
MapReduce定义mapReduce是一个分布式运算程序的编程框架,是用户开发基于
hadoop
的数据分析应用的核心框架。
诺冰1314
·
2024-02-19 10:46
大数据
haoop
MapReduce
hadoop
mapreduce
大数据
golang工程组件篇:高性能RPC框架gRPC之0Auth2认证与拦截器
Golang是一种快速、高效的编程语言,它在云计算和
分布式系统
中广泛使用。随着软件工程越来越复杂,RPC(远程过程调用)框架成为了重要的组件之一。
SMILY12138
·
2024-02-19 10:32
golang
rpc
开发语言
Hive入门,Hive是什么?
它是建立在
Hadoop
生态系统之上的,利用
Hadoop
的分布式存储和计算能力来处理和分析数据。
JayGboy
·
2024-02-19 10:31
hive
hadoop
数据仓库
Raft协议如何解决
分布式系统
一致性问题
先要明确的几个概念Raft协议是基于paxosmulti的,属于全新优化精简版本,更加容易实现和理解。zookeeper用的zab协议跟raft基本一样,就是心跳方向是反的,raft是leader向follower发送心跳,zab是follower向leader发送心跳询问leader健康状况。再有一个就是,raft、paxos、zab这些属于强一致性协议,与之相对的还有弱一致性协议,比如DNS的
肥兔子爱豆畜子
·
2024-02-15 10:56
[AIGC] Kafka 的 Rebalance 机制:保证分区的可靠性和高可用性
在
分布式系统
中,Kafka是一种流处理平台,具有高吞吐量、低延迟和可扩展性等特点。在Kafka中,消费者组是一组消费者的集合,它们共同消费一个topic的所有分区。
程序员三木
·
2024-02-15 10:55
AI
kafka
分布式
Hive on Spark配置
pwd=66663、将Spark安装包通过xftp上传到/opt/software安装部署Spark1、解压spark-3.3.1-bin-without-
hadoop
.tgz进入安装包所在目录cd/opt
在下区区俗物
·
2024-02-15 10:51
hive
spark
hadoop
配置hive on spark
hdfsdfs-mkdir/spark-jarshdfsdfs-put/opt/spark/jars/*/spark-jars2、修改hive-site.xml文件,添加如下配置:spark.yarn.jarshdfs://
hadoop
空白格2519
·
2024-02-15 10:51
数据采集
big
data
hive
spark
hadoop
hive on spark配置经验
常规配置配置完,开启
hadoop
,开启spark(如果在hdfs上上传了纯净版的spark则不需要开启),开启hive注:当前节点一定要是namenode的active节点,因为
hadoop
长时间不用namenode
小五冲冲冲
·
2024-02-15 10:21
Spark
hive
spark
hadoop
Spring
Spring是一款非常优秀而且功能强大的框架,可以简化开发、框架整合一、初识Spring1.Spring能做什么用以开发web、微服务以及
分布式系统
等,光这三块就已经占了JavaEE开发的九成多。
小白在努力~~
·
2024-02-15 10:15
spring
java
后端
Spring Cloud Eureka:服务注册与发现
1.介绍SpringCloudEureka1.1什么是SpringCloudEurekaSpringCloudEureka是SpringCloud生态中的一个服务注册与发现组件,用于构建
分布式系统
中的服务注册中心
星光闪闪k
·
2024-02-15 09:41
Java
Spring
spring
cloud
eureka
spring
后端
架构
docker (一)-简介
无论是单个程序还是多个程序组成的复杂服务,或者
分布式系统
,都可以使用dockerrun或dockercompos
小关暗器
·
2024-02-15 09:56
docker
容器
运维
(三十八)大数据实战——Atlas元数据管理平台的部署安装
本节内容是关于ApacheAtlas的部署安装,在开始安装Atlas之前我们需要提前安装好Atlas需要集成的组件,如
hadoop
、zo
厉害哥哥吖
·
2024-02-15 09:09
大数据
大数据
Hadoop
手把手逐级搭建 第二阶段:
Hadoop
完全分布式(full)
前置步骤:1).第一阶段:
Hadoop
单机伪分布(single)0.步骤概述1).克隆4台虚拟机2).为完全分布式配置ssh免密3).将
hadoop
配置修改为完全分布式4).启动完全分布式集群5).在完全分布式集群上测试
郑大能
·
2024-02-15 04:07
一面数据:
Hadoop
迁移云上架构设计与实践
背景一面数据创立于2014年,是一家领先的数据智能解决方案提供商,通过解读来自电商平台和社交媒体渠道的海量数据,提供实时、全面的数据洞察。长期服务全球快消巨头(宝洁、联合利华、玛氏等),获得行业广泛认可。公司与阿里、京东、字节合作共建多个项目,旗下知乎数据专栏“数据冰山”拥有超30万粉丝。一面所属艾盛集团(Ascential)在伦敦证券交易所上市,在120多个国家为客户提供本地化专业服务。公司在2
JuiceFS
·
2024-02-15 01:48
(免费领源码)Java#MySql#
hadoop
高校固定资产管理系统74965-计算机毕业设计项目选题推荐
摘要在信息飞速发展的今天,网络已成为人们重要的信息交流平台。高校部门每天都有大量的信息需要通过网络发布,为此,高校固定资产管理系统开发的必然性,所以本人开发了一个基于Tomcat(服务器)模式的高校固定资产管理系统,该系统以B/S/Java语言、MySql数据库等为开发技术,实现了添加、修改、查看、删除系统数据。本系统采取组件化的方式对系统进行拆分,并对数据库中各个表的增删查改、表与表之间的约束关
2301_3224142804
·
2024-02-15 00:42
java
mysql
hadoop
spring
boot
django
python
php
大数据集群环境启动总结
hadoop
启动与停止单个节点逐一启动在主节点上使用以下命令启动HDFSNameNode:
hadoop
-daemon.shstartnamenode在每个从节点上使用以下命令启动HDFSDataNode
我还不够强
·
2024-02-14 23:04
Hadoop
-3.0.3 安装
Hadoop
-3.0.3安装一下载安装包二配置
Hadoop
环境变量/etc/profile后面追加export
HADOOP
_HOME=/data/
hadoop
-3.0.3exportPATH=$
HADOOP
_HOME
火星机遇号
·
2024-02-14 23:52
HDFS用户及权限配置
HDFS用户及权限配置使用linux用户bruce,格式化
hadoop
的namenode,那么bruce成为hdfs的超级用户在bruce用户下运行命令:#创建/user/
hadoop
目录
hadoop
fs-mkdir-p
wpheternal
·
2024-02-14 21:42
hadoop笔记
hadoop
hdfs
Hadoop
(HDFS)的超级用户
Hadoop
(HDFS)的超级用户超级用户超级用户即运行namenode进程的用户。宽泛的讲,如果你启动了namenode,你就是超级用户。超级用户干任何事情,因为超级用户能够通过所有的权限检查。
zinger.wang
·
2024-02-14 21:12
大数据
hadoop
hdfs
HDFS的超级用户
一.解释原因HDFS(
Hadoop
DistributedFileSystem)和linux文件系统管理一样,也是存在权限控制的。
重剑DS
·
2024-02-14 21:41
大数据
hdfs
hadoop
大数据
探讨java系统中全局唯一ID实现方案
为什么需要全局唯一ID我们这里引用美团Leaf的场景介绍:在复杂
分布式系统
中,往往需要对大量的数据和消息进行唯一标识。
程序员大为
·
2024-02-14 18:49
java
java实战:Redis分布式锁实现防止用户重复点击
本文将介绍如何使用Redis分布式锁来防止用户在
分布式系统
中重复点击。通过一个基于Redis的分布式锁示例,了解如何在Java应用程序中使用Redis分布式锁来解决用户重复点击的问题。
拥抱AI
·
2024-02-14 12:04
java
redis
分布式
Spring Cloud 路由和消息传递 (消息路由)
SpringCloudBus:一个用于在
分布式系统
中广播事件的工具。消息路由类型消息路由可以根据不同的标准进行分类,包括:目标类型:消息可以路由到特定的
surfirst
·
2024-02-14 11:53
架构
spring
cloud
java
数据库
微服务
基于最终收敛的
分布式系统
设计讨论2
基于最终收敛的
分布式系统
设计讨论2问题描述假如我们有一个service,提供了数据访问和修改的API。比如update()来进行数据的修改,get()来进行数据的访问。
书香门第
·
2024-02-14 07:16
分布式系统设计
AWS
云计算
分布式
云计算
Hadoop
+Spark+MongoDB+MySQL+C#大数据开发项目最佳实践
一、前言随着IT技术的飞速发展,各行各业都已在广泛尝试使用大数据技术提供更稳健和优质的服务。目前,医疗IT系统收集了大量极具价值的数据,但这些历史医疗数据并没有发挥出其应有的价值。为此,本文拟利用医院现有的历史数据,挖掘出有价值的基于统计学的医学规则、知识,并基于这些信息构建专业的临床知识库,提供诊断、处方、用药推荐功能,基于强大的关联推荐能力,极大地提高医疗服务质量,减轻医疗人员的工作强度。二、
yiyidsj
·
2024-02-14 07:08
大数据
人工智能
互联网
spark
Hadoop
MySQL
大数据开发
大数据学习
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他