E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
分布式系统mapreduce
资深P7架构师详解淘宝服务端高并发分布式架构演进之路
2.基本概念在介绍架构之前,为了避免部分读者对架构设计中的一些概念不了解,下面对几个最基础的概念进行介绍:
分布式系统
中的多个模块在不同服务器上部署,即可称为
分布式系统
,如Tomcat和数据库分别部署在不同
小白不想上班
·
2024-02-07 04:53
阿里首席架构师科普RPC框架
目前,主流的平台中都支持各种远程调用技术,以满足
分布式系统
架构中不同的系统之间的远程通信和相互调用。远程调用的应用场景极其广泛,实现的方式也各式各样。
Java架构
·
2024-02-07 04:26
数据仓库-Hive基础(二)Hive 的基本概念
其本质是将SQL转换为
MapReduce
的任务进行运算,底层由HDFS来提供数据的存储,说白了hive可以理解为一个将SQL转换为
MapReduce
的任务的工具,甚至更进一步可以说hive就是一个
MapReduce
做个合格的大厂程序员
·
2024-02-07 03:42
论文阅读-面向公平性的
分布式系统
负载均衡机制
摘要当一组自利的用户在
分布式系统
中共享多个资源时,我们面临资源分配问题,即所谓的负载均衡问题。特别地,负载均衡被定义为将负载分配到
分布式系统
的服务器上,以便最小化作业响应时间并提高服务器的利用率。
向来痴_
·
2024-02-07 02:49
论文阅读
Spark大数据分析与实战笔记(第三章 Spark RDD弹性分布式数据集-01)
第3章SparkRDD弹性分布式数据集章节概要传统的
MapReduce
虽然具有自动容错、平衡负载和可拓展性的优点,但是其最大缺点是采用非循环式的数据流模型,使得在迭代计算式要进行大量的磁盘
想你依然心痛
·
2024-02-07 01:53
分布式
spark
数据分析
GO实现高可用高并发
分布式系统
:gRPC实现客户端与服务端的一对一通讯
分布式系统
的特点是不同的功能模块会以独立服务器程序的方式运行在不同主机上。当服务A想请求位于另一台机器的服务B完成特定请求时,就必须将要处理的数据提交给B。
tyler_download
·
2024-02-07 00:26
golang
rpc
网络
2024-02-06(Sqoop)
Sqoop工作机制是将导入或者导出命令翻译成
MapReduce
程序来实现。在翻译出的
MapReduce
中主要是对inputformat和outputformat进行定制。
陈xr
·
2024-02-06 23:29
随记日志
sqoop
大数据
Apache Kafka: 强大消息队列系统的介绍与使用
二、核心概念:三、架构与工作原理:四、使用实例:五、优势与挑战:六、结论:引言随着互联网技术的飞速发展,
分布式系统
变得越来越复杂,对于大规模数据流的处理需求也愈发迫切。
达芬奇要当程序员
·
2024-02-06 22:53
apache
kafka
分布式
消息队列:
分布式系统
中的重要组件
流量削峰常见的消息队列系统4.1RabbitMQ4.2ApacheKafka4.3ActiveMQ消息队列的挑战与未来发展5.1消息顺序性5.2消息队列的监控和管理5.3未来发展趋势结论摘要消息队列是一种在
分布式系统
中广泛应用的重要组件
达芬奇要当程序员
·
2024-02-06 22:52
java
分布式
kafka
RabbitMQ:
分布式系统
中的高效消息队列
目录摘要RabbitMQ简介1.1背景与起源1.2核心概念RabbitMQ的基本工作原理2.1生产者和消费者2.2队列2.3交换机和绑定RabbitMQ的使用3.1安装与配置3.2生产者示例3.3消费者示例3.4异常处理与监控RabbitMQ在实际应用中的场景4.1消息通知4.2任务队列4.3日志收集RabbitMQ的优势与挑战5.1优势5.2挑战未来展望6.1发展趋势6.2社区和生态系统结论摘要
达芬奇要当程序员
·
2024-02-06 22:22
rabbitmq
分布式
如何基于ELK构建实时告警系统,保障你的系统稳定性
在现代的
分布式系统
中,日志数据是非常重要的。为了监控和分析日志数据,Elasticsearch已经成为了一个非常流行的选择。
coderidea
·
2024-02-06 21:30
elk
elasticsearch
微服务
开源
监控
告警系统
大数据Zookeeper--案例
文章目录服务器动态上下线监听案例需求需求分析具体实现测试Zookeeper分布式锁案例原生Zookeeper实现分布式锁Curator框架实现分布式锁Zookeeper面试重点选举机制生产集群安装多少zk合适zk常用命令服务器动态上下线监听案例需求某
分布式系统
中
泛黄的咖啡店
·
2024-02-06 18:33
大数据
zookeeper
分布式
30道超详细Dubbo面试答案整理!你不知道的这里都有,建议收藏!
就这样为
分布式系统
的服务治理框架就出现了,Dubbo也就这样产生了。2、Dubbo的整体架构设计有哪些分层?接口服务层(
套马杆的程序员
·
2024-02-06 18:53
故障与部分失败
而
分布式系统
则有一点复杂:它很少出现整体崩溃的情况,然而随着系统规模增大,机器增多,总会出现部分组件出现故障的情况(
分布式系统
设计中的一个前提就是假设所有组件任意时刻都有可能出现故障)。
MontyOak
·
2024-02-06 17:03
java sha256算法_区块链主流共识算法的15个开源实现
相关推荐:区块链开发系列教程1、BFT共识开发库BFT共识算法可以应对
分布式系统
中的拜占庭故障(Byzantinefailures),也就是可以在集群中部分节点存在恶意行为时依然保证整个系统的正常工作
weixin_39568889
·
2024-02-06 16:40
java
sha256算法
mysql脑裂原因及解决方法
一、MySQL脑裂的原因MySQL脑裂是由于
分布式系统
中多个MySQL实例之间出现网络分区而导致的。
柯西极限存在准则
·
2024-02-06 16:00
数据库
mysql
数据库
Nervos CKB 加密经济模型
1.代币经济学的设计目标公有非许可链是开放给所有人自由参与的
分布式系统
。
Ashton
·
2024-02-06 16:46
分布式计算概述
分布式计算的概念 一个
分布式系统
是由若干通过网络互联的计算机组成的软硬件系统,且这些计算机互相配合以完成一个共同目标(往往这个共同目标称为“项目”)分布式计算的优缺点优点:1.超大规模2.虚拟化3.高可靠性
CSDNzlx
·
2024-02-06 15:01
分布式计算
分布式计算概述
2024-02-05(Hive)
对这种表一个简单的SELECT*都会非常的慢,哪怕LIMIT10想要看10条数据,也会走
MapReduce
流程,这个时间等待是非常不合适的。
陈xr
·
2024-02-06 14:57
随记日志
hive
Hbase 数据迁移
Hbase数据迁移可选方案对比l已验证方案操作说明:nExport&importu导出命令及示例hbaseorg.apache.hadoop.hbase.
mapreduce
.Export“表名”文件路径导出至本地文件系统
运维那些事儿
·
2024-02-06 14:44
hbase
hbase
hadoop
大数据
Sentinel(理论版)
Sentinel1.什么是SentinelSentinel是一个开源的流量控制组件,它主要用于在
分布式系统
中实现稳定性与可靠性,如流量控制、熔断降级、系统负载保护等功能。
小白不想秃头
·
2024-02-06 11:47
sentinel
15年磨砺,一朝绽放:Spring Boot
分布式系统
实践文档,深入浅出解析核心技术
引言当前,Java后端领域中一个不容忽视的现象是,除了部分老旧项目外,几乎所有的新项目都基于SpringBoot进行开发。这并非偶然,而是因为SpringBoot的易用性和微服务友好的特性使其成为Java后端技术的翘楚。毫不夸张地说,SpringBoot在Java后端领域占据着举足轻重的地位,对于Java程序员来说,掌握它是至关重要的。通过使用SpringBoot开发框架,我们不仅可以提高开发速度
手把手教你学Java
·
2024-02-06 09:07
spring
boot
spring
后端
java
spring
cloud
【Flink入门修炼】1-1 为什么要学习 Flink?
一、批处理和流处理早些年,大数据处理还主要为批处理,一般按天或小时定时处理数据,代表性的框架为
MapReduce
、Hive、Spark等。
大数据王小皮
·
2024-02-06 07:29
Flink
入门修炼
flink
学习
大数据
使用Dubbo实现微服务之间的高效通信
以帮助开发人员快速构建高效的
分布式系统
程序吟游
·
2024-02-06 07:10
分布式
微服务
dubbo
问题排查利器 - 分布式 trace
在
分布式系统
开发中,系统间的调用往往会横跨多个应用之间的接口。
J_HelloWorld
·
2024-02-06 06:26
分布式原理与实战
实战问题汇总
分布式
链路追踪
trace
Apache Hadoop
ApacheHadoop_狭义上说,Hadoop指Apache一款java语言开发的开源框架,它的核心组件有:HDFS(分布式文件系统):解决海量数据存储YARN(作业调度和集群资源管理的框架):解决资源任务调度
MAPREDUCE
VincentLeon
·
2024-02-06 05:28
SpringCloud和SpringCloudAlibaba的核心组件
注册中心,用于服务的注册和发现Ribbon/openFeign:负载均衡/服务调用【轻量级Restful风格的http服务客户端,用于替代已经停更的netflixfeign】Hystrix:断路器,提高
分布式系统
的弹性
Marciaguoguo
·
2024-02-06 04:37
开发框架
spring
cloud
java
spring
PySpark(三)RDD持久化、共享变量、Spark内核制度,Spark Shuffle
Spark为什么比
MapReduce
快?Spark并行度SparkShuffleHashShuffleSortShuffleRDD持久化RDD的数据是过程数据RDD之间进行
独憩
·
2024-02-06 03:43
PySpark
大数据
python
分布式
spark
手写百万并发连接的RPC框架之Netty篇
前言前面我们已经介绍了,使用JDK原生自带的Socket门面模式手写了注册中心、远程客户端、远程服务端三个模块来构成一个RPC框架,但是性能不是很高,远远无法支撑起大型的
分布式系统
之间的调用,于是我们今天来分享下如何用
coffee_babe
·
2024-02-05 20:55
Netty
网络IO
rpc
网络协议
网络
java
设计与部署稳定的
分布式系统
》
英文版原名:ReleaseIt!DesignandDepolyProducation-ReadySoftware不太习惯这本书的翻译,读起来令人略感不适,:(总结:这本书比较全面的介绍了建设稳定系统的反模式与模式,涵盖了软件系统开发的方方面面,当读到一些例子时能让人联想到工作中遇到的一些故障案例。这些模式与反模式往往是我们在进行系统的设计中容易忽略的,我们可能更关注了功能性设计而忽略了一些影响系统
零一间
·
2024-02-05 20:36
所有HDFS磁盘数据存储不均情况的终极处理方案
该值不能设置很大,否则会造成
MapReduce
程序执行缓
二百四十九先森
·
2024-02-05 16:08
Hadoop核心技术
磁盘
存储
不均
wordcount
单词计数
Java代码生成器2.0(重制版)
引言:随着微服务架构的流行和
分布式系统
的发展,JavaSpringBoot应用程序变得越来越复杂。开发者经常寻找能够提高效率、减少重复工作的工具,而代码生成器就是其中的佼佼者。
奇遇少年
·
2024-02-05 16:30
java
项目管理: Maven 让事情变得简单 - IBM - developerWorks 中国
Charles的兴趣包括
分布式系统
、高性能计算、国际化和软件设计模式。在业余时间,他为开放源码社区撰稿。可以通过
[email protected]
与Cha
makunyuan123
·
2024-02-05 16:01
java
Maven
计算机毕业设计hadoop+spark+hive小说数据分析可视化大屏 小说推荐系统 小说爬虫 小说大数据 机器学习 知识图谱 小说网站 大数据毕业设计
流程1.爬取17k的小说数据约5-10万,存入mysql数据库;2.使用
mapreduce
对mysql中的小说数据集进行数据清洗,转为.csv文件上传至hdfs文件系统;3.根据.csv文件结构,使用hive
计算机毕业设计大神
·
2024-02-05 14:48
工作流调度器azkaban(一) 简介与安装部署
为什么需要工作流调度系统一个完整的数据分析系统通常都是由大量任务单元组成:shell脚本程序,java程序,
mapreduce
程序、hive脚本等各任务单元之间存在时间先后及前后依赖关系为了很好地组织起这样的复杂执行计划
做个合格的大厂程序员
·
2024-02-05 13:11
6.0
MapReduce
服务使用教程
在学习了之前的
MapReduce
概念之后,我们应该已经知道什么是Map和Reduce,并了解了他们的工作方式。本章将学习如何使用
MapReduce
。
二当家的素材网
·
2024-02-05 13:29
Hadoop
教程
mapreduce
大数据
2023.1.31 关于 Redis 分布式锁详解
目录引言分布式锁引入分布式锁引入setnx引入过期时间引入校验机制引入lua脚本引入过期时间续约(看门狗)引入redlock算法结语引言在一个
分布式系统
中,可能会涉及到多个节点访问同一个公共资源的情况此时就需要通过锁来进行互斥控制
茂大师
·
2024-02-05 12:05
Redis
redis
分布式
数据库
SpringCloud-消息驱动(Stream、生产者、消费者)
的诞生是为了解决各种消息中间件之间的兼容性问题,学习过消息中间件的同学都知道现在市面上流行的消息中间件有ActiveMQ、RabbitMQ、RocketMQ、Kafka它们之间的部署于使用都有较大的差异,那么若
分布式系统
下同时用到了多种消息中间件
JolyouLu
·
2024-02-05 12:30
SpringCloud
spring
cloud
rabbitmq
kafka
stream
分布式
面试官:分布式事务了解吗?你们是如何解决分布式事务问题的?
面试官心理分析只要聊到你做了
分布式系统
,必问分布式事务,你对分布式事务一无所知的话,确实会很坑,你起码得知道有哪些方案,一般怎么来做,每个方案的优缺点是什么。
Java码农那些事
·
2024-02-05 12:34
在 CDH 中调优 Apache Hive on Spark
Spark上的Hive在提供相同功能的同时提供比
MapReduce
上的Hive更好的性能。在Spark上运行Hive不需要更改用户查询。
海阔天空&沫语
·
2024-02-05 09:27
大数据/架构
hive
hadoop
spark
消息队列三|Kafka 如何做到高可用?
副本是
分布式系统
对数据和服务提供的一种冗余方式。Kafka从0.8版本开始为分区引入了多副本的机制,通过增加副本数量来提升数据容灾的能力。
不落叶的榕树
·
2024-02-05 09:11
消息队列
java
消息队列
高并发
Kafka的高可用机制
ApacheKafka是一个分布式流处理平台,它通过复制数据和
分布式系统
的一系列特性来提供高可用性。以下是Kafka高可用性机制的关键方面,以及它们是如何在源码中实现的。
辞暮尔尔-烟火年年
·
2024-02-05 09:37
微服务
消息中间件
kafka
分布式
RocketMQ之事务消息原理
分布式系统
调用的特点为一个核心业务逻辑的执行,同时需要调用多个下游业务进行处理。因此,如何保证核心业务和多个下游业务的执行结果完全一致,是分布式事务需要解决的主要
倜傥村的少年
·
2024-02-05 08:19
rocketmq
事务消息
【下一代分布式追踪】将Trace扩展到网络设备
为了有效监控、诊断和优化这些
分布式系统
,分布式追踪技术应运而生。传统的分布式追踪,如Zipkin、Jaeger和OpenTelemetry,已经能够很好地追踪应用程序
沐风—云端行者
·
2024-02-05 08:15
云计算架构
分布式
分布式追踪
trace
3.0 Hadoop 概念
Hadoop主要包含HDFS和
MapReduce
两大组件,HDFS负责分布储存数据,MapRed
二当家的素材网
·
2024-02-05 06:38
Hadoop
教程
hadoop
大数据
分布式
日志追踪-Tracing
trace是请求在
分布式系统
中的整个链路视图,span则代表整个链路中不同服务内部的视图,span组合在一起就是整个trace的视图在整个请求的调用链中,请求会一直携带traceid往下游服务传递,每个服务内部也会生成自己的
孤雨蝉鸣
·
2024-02-05 04:34
spring框架
java
spring
cloud
spring
CAP & BASE理论
Consistency):所有节点访问同一份最新的数据副本可用性(Availability):非故障的节点在合理的时间内返回合理的响应(不是错误或者超时的响应)分区容错性(PartitionTolerance):
分布式系统
出现网络分区的时候
孤雨蝉鸣
·
2024-02-05 04:32
spring框架
java
spring
cloud
spring
CDH5.X中使用Sqoop导数据报Cannot run program “mysqldump“: error=2, No such file or director
一、背景CHD5.16环境中,使用sqoop从MySQL中进行ETL导数据到hdfs过程中,报了如下错误:20/12/2213:58:48INFO
mapreduce
.Job:TaskId:attempt
江畔独步
·
2024-02-05 01:49
hadoop
HIVE
--------hive数据仓库hive底层执行引擎有
MapReduce
TezSpark压缩GZIPLZOSnappyBZIP2等存储TextFileSequenceFileRCFileORCParquetUDF
Yagami_
·
2024-02-05 00:23
【读红宝书(一)】背景知识
过去十年引起广泛关注的数据模型是
MapReduce
,但
MapReduce
不是一种具有普适性的架构。相反,
MapReduce
市场已经转变为HDFS市场,并且似乎准备成为关系型SQL市场。
三半俊秀
·
2024-02-04 23:41
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他