E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
分布式系统_spark
面试官:浅谈
分布式系统
中的补偿机制设计问题?
我们知道,应用系统在分布式的情况下,在通信时会有着一个显著的问题,即一个业务流程往往需要组合一组服务,且单单一次通信可能会经过DNS服务,网卡、交换机、路由器、负载均衡等设备,而这些服务于设备都不一定是一直稳定的,在数据传输的整个过程中,只要任意一个环节出错,都会导致问题的产生。这样的事情在微服务下就更为明显了,因为业务需要在一致性上的保证。也就是说,如果一个步骤失败了,要么不断重试保证所有的步骤
Java精选
·
2024-02-19 22:57
运维
网络
数据库
java
开发语言
10分钟带你了解
分布式系统
的补偿机制
我们知道,应用系统在分布式的情况下,在通信时会有着一个显著的问题,即一个业务流程往往需要组合一组服务,且单单一次通信可能会经过DNS服务,网卡、交换机、路由器、负载均衡等设备,而这些服务于设备都不一定是一直稳定的,在数据传输的整个过程中,只要任意一个环节出错,都会导致问题的产生。这样的事情在微服务下就更为明显了,因为业务需要在一致性上的保证。也就是说,如果一个步骤失败了,要么不断重试保证所有的步骤
咖啡加剁椒
·
2024-02-19 22:53
软件测试
软件测试
自动化测试
功能测试
程序人生
职场和发展
分布式学习笔记
1.CAP理论Consistency(一致性):用户访问
分布式系统
中的任意节点,得到的数据必须一致。Availability(可用性):用户访问集群中的任意健康节点,必须得到相应,而不是超时或拒绝。
重生之Java再爱我一次
·
2024-02-19 20:46
分布式
学习
笔记
分布式相关概念
分布式原理1.CAP理论CAP理论是
分布式系统
中的一个基本理论,它由计算机科学家EricBrewer在2000年提出。
重生之Java再爱我一次
·
2024-02-19 20:15
分布式
Docker实用篇
分布式系统
中,依赖的组件非常多,不同组件之间部署时往往会产生一些冲突。
是程序喵呀
·
2024-02-19 18:56
Java
docker
容器
运维
如何保证MySQL和Redis的数据一致性?
图片来自Pexels什么是数据的一致性一致性就是数据保持一致,在
分布式系统
中,可以理解为多个节点中数据的值是一致的。而一致性又可以分为强一致性与弱一致性。
架构师小秘圈
·
2024-02-19 18:50
数据库
队列
分布式
redis
java
第五节 zookeeper集群与分布式锁_2
分布式锁:分布式锁,即
分布式系统
做个专注的工程师
·
2024-02-19 16:01
#
zookeeper
zookeeper
AWS Serverless Py
Spark
指定 Python 版本(qbit)
的最新版本是6.15,自带的Python版本是3.7,尝试上传使用Python3.11Python环境打包技术栈Ubuntu22.04(x86)Linuxversion5.15Python3.11.5py
spark
3.4.1conda23.10.0conda-pack0.7.1
·
2024-02-19 16:05
《
分布式系统
原理介绍》要点简记
数据备份机制问题:机器宕机导致数据丢失问题解决:无状态节点则无需读取读取任何信息就可以立刻重新“可用”有状态节点可以通过读取本地存储设备中的信息或通过读取其他节点数据的方式恢复内存信息有状态是指是否是保存数据的节点序列号机制问题:消息乱序解决:给消息排号,按照版本号进行消费校验码机制问题:数据错误消息被抓包篡改解决:使用一定的校验码机制可以较为简单的检查出网络数据的错误,从而丢弃错误的数据序列号机
猫哥灬01
·
2024-02-19 16:52
分布式
面试
分布式
SpringCloud-搭建Nacos配置中心
在微服务架构中,配置管理是至关重要的一环,Nacos提供了可靠、动态的配置管理功能,为
分布式系统
的配置中心提供了便捷的解决方案。
Damon小智
·
2024-02-19 15:45
Java
spring
cloud
java
nacos
配置管理
微服务
分布式
后端
消息中间件管理系统-RabbitMQ及其两类传输模型
MQ,意思为消息队列,
分布式系统
中的重要组件,用它就可以实现应用解耦、异步消息、流量削峰等问题。消息队列产品有很多,企业级应用较广泛的就是RabbitMQ。
sunyunfei1994
·
2024-02-19 14:08
rabbitmq
分布式
什么是RabbitMQ?
一、引言RabbitMQ是一个开源的消息代理软件,用于在
分布式系统
中传递消息。
张万森的救赎
·
2024-02-19 14:35
rabbitmq
分布式
Quick introduction to Apache
Spark
什么是
Spark
Apache
Spark
是一种快速通用的集群计算系统。它提供Java,Scala,Python和R中的高级API,以及支持通用执行图的优化引擎。
Liam_ml
·
2024-02-19 13:29
Spark
中多分区写文件前可以不排序么
背景
Spark
3.5.0目前
Spark
中的实现中,对于多分区的写入默认会先排序,这是没必要的。
鸿乃江边鸟
·
2024-02-19 13:10
分布式
spark
大数据
spark
大数据
分布式
Flink 细粒度滑动窗口性能优化
大数据技术AIFlink/
Spark
/Hadoop/数仓,数据分析、面试,源码解读等干货学习资料118篇原创内容公众号1、概述1.1细粒度滑动的影响当使用细粒度的滑动窗口(窗口长度远远大于滑动步长)时,
hyunbar
·
2024-02-19 13:39
Flink
大数据
flink
java
数据库
【大数据面试题】006介绍一下Parquet存储格式的优势
同时一般查询使用时不会使用所有列,而是只用到几列,所以查询速度会更快压缩比例高因为是列式存储,所以可以对同一类型的一段做压缩,压缩比例高支持的平台和框架多在Hadoop,
Spark
,Presto,Python
Jiweilai1
·
2024-02-19 13:34
一天一道面试题
大数据
spark
hadoop
七天爆肝flink笔记
一.flink整体介绍及wordcount案例代码1.1整体介绍从上到下包含有界无界流支持状态特点与
spark
对比应用场景架构分层1.2示例代码了解了后就整个demo吧数据源准备这里直接用的文本文件gradle
我才是真的封不觉
·
2024-02-19 13:01
flink
笔记
大数据
RabbitMQ:
分布式系统
中的高效消息队列
摘要RabbitMQ是一款开源、高度可靠、灵活性强的消息队列系统,被广泛应用于
分布式系统
中。
张万森的救赎
·
2024-02-19 12:48
rabbitmq
分布式
现阶段适用于 单一架构 还是 分布式架构 ?
劣势:开发和部署比较复杂,需要考虑
分布式系统
的一些问题,如分布式
小Mie不吃饭
·
2024-02-19 12:41
JAVA
架构
分布式
(15)Hive调优——数据倾斜的解决指南
目录前言一、什么是数据倾斜二、发生数据倾斜的表现2.1MapReduce任务2.2
Spark
任务三、如何定位发生数据倾斜的代码四、发生数据倾斜的原因3.1key分布不均匀3.1.1某些key存在大量相同值
爱吃辣条byte
·
2024-02-19 11:50
#
Hive
大数据
hive
golang工程组件篇:高性能RPC框架gRPC之0Auth2认证与拦截器
Golang是一种快速、高效的编程语言,它在云计算和
分布式系统
中广泛使用。随着软件工程越来越复杂,RPC(远程过程调用)框架成为了重要的组件之一。
SMILY12138
·
2024-02-19 10:32
golang
rpc
开发语言
Raft协议如何解决
分布式系统
一致性问题
先要明确的几个概念Raft协议是基于paxosmulti的,属于全新优化精简版本,更加容易实现和理解。zookeeper用的zab协议跟raft基本一样,就是心跳方向是反的,raft是leader向follower发送心跳,zab是follower向leader发送心跳询问leader健康状况。再有一个就是,raft、paxos、zab这些属于强一致性协议,与之相对的还有弱一致性协议,比如DNS的
肥兔子爱豆畜子
·
2024-02-15 10:56
[AIGC] Kafka 的 Rebalance 机制:保证分区的可靠性和高可用性
在
分布式系统
中,Kafka是一种流处理平台,具有高吞吐量、低延迟和可扩展性等特点。在Kafka中,消费者组是一组消费者的集合,它们共同消费一个topic的所有分区。
程序员三木
·
2024-02-15 10:55
AI
kafka
分布式
Hive on
Spark
配置
前提条件1、安装好Hive,参考:Hive安装部署-CSDN博客2、下载好
Spark
安装包,链接:https://pan.baidu.com/s/1plIBKPUAv79WJxBSbdPODw?
在下区区俗物
·
2024-02-15 10:51
hive
spark
hadoop
配置hive on
spark
配置hiveon
spark
1、上传
Spark
纯净版jar包到HDFS:hdfsdfs-mkdir/
spark
-jarshdfsdfs-put/opt/
spark
/jars/*/
spark
-jars2、修改
空白格2519
·
2024-02-15 10:51
数据采集
big
data
hive
spark
hadoop
hive on
spark
配置经验
常规配置配置完,开启hadoop,开启
spark
(如果在hdfs上上传了纯净版的
spark
则不需要开启),开启hive注:当前节点一定要是namenode的active节点,因为hadoop长时间不用namenode
小五冲冲冲
·
2024-02-15 10:21
Spark
hive
spark
hadoop
Spring
Spring是一款非常优秀而且功能强大的框架,可以简化开发、框架整合一、初识Spring1.Spring能做什么用以开发web、微服务以及
分布式系统
等,光这三块就已经占了JavaEE开发的九成多。
小白在努力~~
·
2024-02-15 10:15
spring
java
后端
Spring Cloud Eureka:服务注册与发现
1.介绍SpringCloudEureka1.1什么是SpringCloudEurekaSpringCloudEureka是SpringCloud生态中的一个服务注册与发现组件,用于构建
分布式系统
中的服务注册中心
星光闪闪k
·
2024-02-15 09:41
Java
Spring
spring
cloud
eureka
spring
后端
架构
docker (一)-简介
无论是单个程序还是多个程序组成的复杂服务,或者
分布式系统
,都可以使用dockerrun或dockercompos
小关暗器
·
2024-02-15 09:56
docker
容器
运维
Hbase - 自定义Rowkey规则
中我们有时候需要分析数据1点到2点的范围,可是经过Region又比较慢,这时候我们就可以定制TableInputFormat来实现我们的需求了,我们还可以采用Flink的DataSet的方式读取,另外下面还有
Spark
kikiki2
·
2024-02-15 06:39
(免费领源码)python+mysql+
spark
手机销售数据的可视化分析系统44127-计算机毕业设计项目选题推荐
摘要信息化社会内需要与之针对性的信息获取途径,但是途径的扩展基本上为人们所努力的方向,由于站在的角度存在偏差,人们经常能够获得不同类型信息,这也是技术最为难以攻克的课题。针对手机销售数据管理等问题,对手机销售数据管理进行研究分析,然后开发设计出手机销售数据可视化系统以解决问题。手机销售数据可视化系统主要功能模块包括系统首页、轮播图、公告信息、资源管理(新闻资讯、新闻分类)交流管理(交流论坛、论坛分
2301_3224142804
·
2024-02-15 00:40
python
mysql
spark
java
spring
boot
php
c#
基于Kafka的实时计算引擎如何选择?
以Flink和
Spark
为首的实时计算引擎,成为实时计算场景的重点考虑对象。那么,今天就来聊一聊基于Kafka的实时计算引擎如何选择?Flinkor
Spark
?2.为何需要实时计算?
java菜
·
2024-02-14 19:37
调用讯飞火星AI大模型WebAPI
getWebsocketUrl(){returnnewPromise((resolve,reject)=>{varapiKey=API_KEYvarapiSecret=API_SECRETvarurl='ws://
spark
-api
雲墨知秋
·
2024-02-14 18:54
javascript
开发语言
ecmascript
探讨java系统中全局唯一ID实现方案
为什么需要全局唯一ID我们这里引用美团Leaf的场景介绍:在复杂
分布式系统
中,往往需要对大量的数据和消息进行唯一标识。
程序员大为
·
2024-02-14 18:49
java
Spark
通过jdbc性能调优--采用分区的方式从oracle读数据
spark
通过jdbc读取Oracle,当数据量很大的时候会出现两个问题:读取数据异常缓慢,甚至卡死大表中进行操作也会出现OOM的问题调优常规的读取数据库的方式如下ods_bdz=
spark
.read.format
korry24
·
2024-02-14 18:08
oracle
spark
mysql
Py
Spark
介绍及其安装教程
一、Py
Spark
是什么PythonPy
Spark
是
Spark
官方提供的一个Python类库,其中内置了完全的
Spark
API,使得Python用户在导入这个类库后,可以使用自己熟悉的Python语言来编写
文景大大
·
2024-02-14 14:58
Spark
(四十二)数据倾斜解决方案之使用随机数以及扩容表进行join
一、背景当采用随机数和扩容表进行join解决数据倾斜的时候,就代表着,你的之前的数据倾斜的解决方案,都没法使用。这个方案是没办法彻底解决数据倾斜的,更多的,是一种对数据倾斜的缓解。原理,其实在上一讲,已经带出来了。扩容表(RDD)步骤:1、选择一个RDD,要用flatMap,进行扩容,将每条数据,映射为多条数据,每个映射出来的数据,都带了一个n以内的随机数,通常来说,会选择10。2、将另外一个RD
文子轩
·
2024-02-14 14:36
Spark
编程实验六:
Spark
机器学习库MLlib编程
目录一、目的与要求二、实验内容三、实验步骤1、数据导入2、进行主成分分析(PCA)3、训练分类模型并预测居民收入4、超参数调优四、结果分析与实验体会一、目的与要求1、通过实验掌握基本的MLLib编程方法;2、掌握用MLLib解决一些常见的数据分析问题,包括数据导入、成分分析和分类和预测等。二、实验内容1.数据导入从文件中导入数据,并转化为DataFrame。2、进行主成分分析(PCA)对6个连续型
Francek Chen
·
2024-02-14 14:48
Spark编程基础
spark
mllib
大数据
机器学习
算法
java实战:Redis分布式锁实现防止用户重复点击
本文将介绍如何使用Redis分布式锁来防止用户在
分布式系统
中重复点击。通过一个基于Redis的分布式锁示例,了解如何在Java应用程序中使用Redis分布式锁来解决用户重复点击的问题。
拥抱AI
·
2024-02-14 12:04
java
redis
分布式
Spring Cloud 路由和消息传递 (消息路由)
SpringCloudBus:一个用于在
分布式系统
中广播事件的工具。消息路由类型消息路由可以根据不同的标准进行分类,包括:目标类型:消息可以路由到特定的
surfirst
·
2024-02-14 11:53
架构
spring
cloud
java
数据库
微服务
ShuffleManager 原理
在
Spark
的源码中,负责shuffle过程的执行、计算、处理的组件主要是ShuffleManager。在
Spark
1.2以前,默认的shuffle计算引擎是HashShuffleManager。
stone_zhu
·
2024-02-14 10:03
基于最终收敛的
分布式系统
设计讨论2
基于最终收敛的
分布式系统
设计讨论2问题描述假如我们有一个service,提供了数据访问和修改的API。比如update()来进行数据的修改,get()来进行数据的访问。
书香门第
·
2024-02-14 07:16
分布式系统设计
AWS
云计算
分布式
云计算
Hadoop+
Spark
+MongoDB+MySQL+C#大数据开发项目最佳实践
一、前言随着IT技术的飞速发展,各行各业都已在广泛尝试使用大数据技术提供更稳健和优质的服务。目前,医疗IT系统收集了大量极具价值的数据,但这些历史医疗数据并没有发挥出其应有的价值。为此,本文拟利用医院现有的历史数据,挖掘出有价值的基于统计学的医学规则、知识,并基于这些信息构建专业的临床知识库,提供诊断、处方、用药推荐功能,基于强大的关联推荐能力,极大地提高医疗服务质量,减轻医疗人员的工作强度。二、
yiyidsj
·
2024-02-14 07:08
大数据
人工智能
互联网
spark
Hadoop
MySQL
大数据开发
大数据学习
基于 C# 的 ETL 大数据并行编程
Apache
Spark
是一个用于Extract(提取),
dotNET跨平台
·
2024-02-14 07:07
c#
数据库
编程语言
java
大数据
Spark
- 动态注册UDF
昨天有位大哥问小弟一个
Spark
问题,他们想在不停
Spark
程序的情况下动态更新UDF的逻辑,他一问我这个问题的时候,本猪心里一惊,
Spark
**还能这么玩?
kikiki2
·
2024-02-14 06:33
高并发系统的设计(1)
简历上写了有大数据、高并发、高可用、
分布式系统
的架构设计以及研发经验。我把经验写一些。系统的并发量高,怎么办?多上几台服务器,搞个集群!为什么要这么干呢?
Fuly1024
·
2024-02-14 05:32
面试刷题
面试
如何确保消息队列中的数据安全无损:深入探索消息队列的持久性策略
如何确保消息队列中的数据安全无损:深入探索消息队列的持久性策略引言在现代的
分布式系统
中,消息队列扮演着至关重要的角色,它不仅能够解耦系统组件,提高整体的处理能力,还能在高并发环境下保证数据的一致性和可靠性
一休哥助手
·
2024-02-14 04:16
分布式系统
消息
SpringCloud入门概述
1.介绍SpringCloud1.1什么是SpringCloudSpringCloud是一个基于SpringBoot的微服务架构开发工具集,它为开发者提供了一系列开箱即用的工具和库,用于构建
分布式系统
中的微服务架构
星光闪闪k
·
2024-02-14 03:21
Java
Spring
spring
cloud
spring
后端
架构
java
什么是分布式,分布式和集群的区别又是什么?
分布式系统
一定是由多个节点组成的系统。其中,节点指的是计算机服务器,而且这些节点一般不是孤立的,而是互通的。这些连通的节点上部署了我们的节点,并且相互的操作会有协同。
DawidZhu
·
2024-02-14 03:51
数据库
服务器
java
Spring Boot 中使用 RabbitMQ 入门
介绍与安装RabbitMQ是由erlang语言开发,基于AMQP(AdvancedMessageQueue高级消息队列协议)协议实现的消息队列,它是一种应用程序之间的通信方法,消息队列在
分布式系统
开发中应用非常广泛
想吃凤梨酥
·
2024-02-14 03:17
java
rabbitmq
spring
boot
分布式
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他