OLAP引擎,离线引擎,大数据分析中间件
缺点:
(1)面试官让重点介绍自己最在行的项目,我真的在自我介绍上扯了一些别的东西…
(2)在面试的时候因为想看简历屏幕在不断的切屏,被面试官提醒说系统会有记录…太频繁了会影响面评
(3)介绍了raft kv和rpc项目,但是做了扩展,但是面试官是让说一下整体的架构的,没有让进行细节处理。
Raft是一种为了管理复制日志而设计的分布式一致性算法,它的目标是提供一个更容易理解和实现的替代方案,用于替换难以理解和正确实现的Paxos算法。Raft算法将复杂的分布式一致性问题分解为几个关键元素,并提供了一种解决这些元素的方法。
gpt4的版本:
Raft的关键元素包括领导人选举、日志复制、安全性和成员变更。以下是这些元素的简述:
领导人选举:Raft算法中的所有节点都是平等的,并可以担任领导者(也称为主节点)或者跟随者(也称为从节点)。当一个领导者节点宕机或与集群失去联系时,会触发领导者选举。所有的节点都会定期发送心跳消息,如果在一段时间内(称为选且超时期)没有接收到领导者的心跳消息,跟随者节点就会开始一轮新的选举。节点会投票选举新的领导者,获得半数以上投票的节点成为新的领导者。
日志复制:日志是分布式系统中重要的一部分,所有的变更都会记录在日志中。在Raft算法中,领导者节点负责管理复制日志。当领导者接收到客户端的请求后,会将请求作为新的日志条目添加到它的日志中,并向其他的跟随者节点复制该日志条目。当领导者收到多数节点的确认后,该日志条目就被认为已经提交,领导者会执行该日志条目,然后将结果返回给客户端。
安全性:Raft算法确保了系统在发生故障或网络分区的情况下仍然能够保持一致性。Raft通过在领导者选举和日志复制过程中实施一些限制来确保系统的安全性,例如,只有拥有最新日志的节点才能被选举为领导者,领导者在复制日志时必须包括其上一个日志条目的索引和任期号等。
持久化存储:在Raft协议中,所有节点都必须持久化存储一些关键的信息,例如当前的任期号(用于领导人选举)、已投票的候选人(用于避免在一个任期中多次投票)、日志条目(用于记录所有的操作和状态变更)等。持久化存储的目的是在发生节点故障和重新启动时,节点可以从持久化存储中恢复数据,继续参与集群的运作。
快照机制:快照是Raft协议用于处理日志可能无限增长的问题的一个机制。当日志的大小增长到一定程度时,可以通过创建一个快照(即对当前系统状态的完整拷贝),并删除早于这个快照的所有日志条目来减少日志的大小。当节点故障并需要恢复时,可以直接使用快照恢复最近一次持久化的数据,能极大的缩短故障恢复时间。
Raft算法的设计目标是易于理解和实现,同时也能满足分布式系统的需求。
1 项目架构:有一个配置中心,实时生成配置,每一个新生成的配置文件都包含了哈希槽到某一个复制组的映射,然后还有若干个复制组,每一个复制组会定期从配置中心拉取配置文件到本地,然后开始将已经不属于自己管理的分片迁移到目标分片,当一个复制组迁移完所有分片并且接收到了所有分片后就会转换配置文件。
2 介绍raft的几个章节:这个项目基于raft共识算法做,能保证读写的强一致性。raft从leader选举、日志复制、持久化上、快照机制上能够保证这些,其中最重要的是leader选举、日志复制和持久化。
3 稍微详细介绍一下raft的各个部分:
3.1 raft的leader选举上,通过设置差异化的选举超时时间,大概率能在前几轮就选举出一个leader,新leader当选后会立即向从节点发送心跳,各个节点收到会改变自己为follower状态并且重置超时选举定时器;
3.2 选举成功后,就会进行日志复制操作,每次来一个新的put,append操作后都会将其转化为一条日志,并且将其传送给其他的节点,确保写的一致性;
3.3 同时,针对每一次的选举任期号、投票号以及日志变更操作,都会进行一次持久化,这样节点宕机重启后仍然能够根据日志进行恢复数据的操作,根据任期号和投票号可以继续加入集群中成为新的follower节点,避免出现两个leader
3.4 针对快照机制,各个节点每当数据达到一定长度的阈值后,就会对数据库中的kvMap进行一次持久化操作,存储完成后会截断一部分日志,故障恢复过程中加载快照能够极大的提高效率。
是的,只要保证日志在多数节点上一致,就可以保证系统的一致性。这是因为在Raft协议中,日志的复制是由领导者节点负责的,领导者节点接收到客户端的请求后,会先将请求记录到自己的日志中,然后复制到其他节点。当领导者收到大多数节点的确认后,这个操作就会被认为已经提交,并被应用到系统状态中。
这种机制确保了所有的节点都看到了相同的操作序列,达到了一致性。即使在领导者节点宕机的情况下,只要有一个新的领导者被选举出来,并且这个新领导者的日志包含了所有已经提交的日志条目,那么系统的一致性就可以得到保证。
但是需要注意的是,只有当日志条目在多数节点上一致,并且这些日志条目已经被提交时,才能保证一致性。如果一个日志条目只是被领导者节点记录,但还没有被复制到大多数节点,或者还没有被提交,那么这个日志条目的状态就是不确定的,不能保证一致性。
可能面试官只想听到简单版本的答案,比如是在没有分开写kv的情况下,客户端和一个raft集群的交互流程:
客户端每次发送put,append请求都会自增seqId,这个id用于raft集群去重,保证操作的幂等性的。客户端会轮询raft的集群节点,当轮询到一个非leader节点时,会收到一个错误,然后再轮询下一个节点,直到这个节点是leader节点,轮询到这正确的leader后,leader会成功收取到这个节点,然后它不会立即执行这个操作,而是先把这个操作放到日志中作为一个日志项,并且leader的日志复制线程会在未来的某一个时间点将这个日志复制到其他的从节点,当大多数从节点接受了并且正确响应后leader节点才会执行这个命令,执行成功后再返回一个响应给客户端。
客户端会通过哈希算法计算出put的key值存储于哪一个复制组,然后会从这个目标复制组中顺序选取一个raft的节点发送put请求,当被轮询的节点发现这个key不归自己管时会返回ErrWrongGroup,如果客户端接收到ErrWrongGroup状态码,它会觉得自己的配置有问题,于是去配置中心拉取最新的配置返回给客户端,客户端发送序列号不变的put请求到新的复制组,新目标复制组的节点可能会返回一些错误响应,比如可能会发现这个put的key正在迁移过程中时会返回ShardNotArrived状态码,此时客户端会等待一段时间重试直到分片到达,当发现自己不是leader时会响应一个ErrWrongLeader状态码给客户端,客户端会轮询该复制组的下一个节点直到找到正确的leader。客户端向正确的leader发送出请求后,leader会先把这个操作放到日志中作为一个日志项,并且leader的日志复制线程会在未来的某一个时间点将这个日志复制到其他的从节点,当大多数从节点接受了并且正确响应后leader节点才会执行这个命令,执行成功后再返回一个响应给客户端。(这也是3.5的答案)
"复制"在这里不是指磁盘写操作(Write I/O,WIO或者WL),而是指日志复制过程。这是Raft协议的核心,通过这种方式,Raft协议确保了分布式系统中的一致性。
答:3.3就是答案
对,我提到了查的时候怎么四种保证一致性读的方案,性能主键提高:一致性读,
可以查看我的这篇博客的第39个问题
答:是这样的,这是最笨的一种方法。
答:因为机器可能发生故障,或者可能发生网络分区,在主分区中,新的leader会产生,但是它还不知道自己的日志提交索引,这个时候需要发送一个no-op entry去确认自己的commitIndex
正确回答:因为机器可能发生故障,或者可能发生网络分区,在主分区中,新的leader会产生,但是它还不知道自己的日志提交索引,如果leader直接读的话,可能会产生不一致,所以我采取的是也将读请求进行日志化操作,这样就一定能保证读请求在之前的写请求后面完成。
答:对的
答:只是为了解决读一致性,我采取了最简单的这种方案
答:第一次获取到了no-op entry的响应后,还可以使用lease read给它一个续期,在这个期间内,我得到的commitIndex都认为是有效的,一般这里的lease read时间和选举超时时间相等,就不需要每次都发送心跳,而是直接返回给客户端
本部分的所有总结都在深度思考rpc框架面经 一文中的第1,第5以及第6部分
答:了解分布式框架
项目架构:大概分为四个模块,服务提供者、消费者、rpc框架以及对消费者暴露出的集成接口模块
系统架构:
Apache Dubbo是一个高性能、轻量级的开源Java RPC框架。Dubbo主要提供了三个关键功能,包括接口级别的远程方法调用,容错与负载均衡,以及自动服务注册与发现。
Dubbo架构的主要流程如下:
启动服务提供者:服务提供者启动后,向注册中心注册其提供的服务。
启动服务消费者:服务消费者启动后,向注册中心查询其需要的服务信息,并建立与服务提供者的连接。
服务调用:服务消费者通过建立的连接调用服务提供者的服务。如果调用失败,Dubbo支持多种容错机制,例如failover(失败后重试其他服务器)。
加载平衡:在有多个服务提供者的情况下,Dubbo支持多种负载均衡策略,例如随机(Random)、轮询(RoundRobin)、最少活跃数(LeastActive)等。
服务监控:Dubbo可以记录服务的调用次数和调用时间等信息,以供开发者分析。
Dubbo的这些特性使其成为一个可靠、高性能的RPC框架,广泛用于服务间的远程方法调用。
一个RPC(远程过程调用)框架的核心目的是允许程序调用另一个地址空间(通常是共享网络的另一台机器上)的程序或服务,就像调用本地的方法或函数一样。以下是一个典型的RPC框架如何处理请求的概述:
服务定义和接口:
服务注册:
服务发现:
远程调用:
请求处理:
响应返回:
容错处理:
监控和日志:
这个过程描述的是一个典型的同步RPC调用。但现代RPC框架也支持异步调用,其中客户端可以在不等待响应的情况下继续其它操作。
服务路由:
在有多个服务提供者提供相同服务的情况下,客户端需要决定调用哪一个服务提供者。这时,路由策略(如轮询、随机、最少活跃调用等)会被应用。负载均衡策略会根据本地缓存的服务提供者地址列表选择一个。
. 起始行的格式:
请求报文的起始行是一个请求行,它的格式为:
。例如:
GET /index.html HTTP/1.1
响应报文的起始行是一个状态行,它的格式为:
。例如:
HTTP/1.1 200 OK
综上,最直接和可靠的方式是查看起始行。请求行和状态行的格式是唯一的,它们可以明确地告诉你报文是请求还是响应。
1 版本1:选择了HTTP协议作为我们的应用层协议,对于发送请求,有请求行、请求头、请求行以及请求体,其中请求头包含了一个content-type字段,这个字段包含了具体的序列化协议,比如常用的web服务器序列化方式application/json,还有一个content-length字段,为了区分包类型,即让服务器知道一个调用请求还是调用响应,我们可以利用http的请求行和状态行做区分。此外利用http请求的空行和content-length字段可以防止粘包和拆包问题。
这几个字段的作用就如图所示,跟HTTP协议一对比,发现有很多相似之处。
客户端会定一个类,叫RpcRequest,这个类定义了需要调用远程方法的所有属性,包括接口名、方法名、方法所需要的参数及其类型,同时还包含了一个请求号(这里的请求号可以不说,因为是旁路,会影响面试官的听到主要答案),然后通过客户端本地存根(也就是代理),会给我们自动创建相应的RpcRequest对象并且进行属性填充,这里的属性是根据我们调用的具体方法、消费者提供的参数进行填充的,
填充完成后,代理类还会帮我们根据选择的序列化器将实际的请求体进行序列化操作,序列化后的rpcRequest数据会放到请求体中,然后再通过网络发给服务提供者。
生产端拿到请求后会先进行反序列化请求体,拿到实际的RpcRequest的数据后会根据接口名、接口方法以及参数列表会进行反射得到一个可执行的方法,然后进行条用就行了。
我用的google的protocol buffer
在服务调用端设置一个超时时间,如果在相应的时间内没有回应,则认为这个服务实例不可用,然后轮询下一个实例。
当服务提供者(Service Provider)想要下线时,为了保证服务的可用性和避免服务调用失败,通常采取以下策略让服务消费者(Service Consumer)或调用端感知:
当服务提供者(Service Provider)想要下线时,为了保证服务的可用性和避免服务调用失败,通常采取以下策略让服务消费者(Service Consumer)或调用端感知:
使用服务注册与发现机制(涉及到注册中心、消费者和提供者三方的交互机制):
优雅关闭(服务提供者):
使用负载均衡器或API网关(利用第三方网关阻断流量):
健康检查(注册中心的机制):
通知和告警(预计的维护或下线):
使用熔断器和重试机制(熔断重试,会造成多余的请求):
结合上述策略,可以确保当服务提供者下线时,服务消费者能够及时感知并作出相应的处理,避免服务中断或大量的请求失败。
如果客户端(用户的设备或应用)在等待服务端响应时突然关机或断开连接,确保用户不看到错误是一项挑战。以下是一些建议的处理方法:
服务端冗余与故障转移:
客户端策略:
使用离线策略:
友好的用户界面:
后台处理与通知:
数据一致性:
使用消息队列或事件驱动模型:
在设计系统时,应该从用户体验的角度出发,尽量减少错误的展示,但同时也要确保系统的稳定性和数据的准确性。
答:对,确实
答:相当于本地缓存,因为远程注册中心可能会宕机,本地注册中心还能正常工作一段时间,毕竟微服务实例变化的不是那么频繁,这段时间足够远程注册中心灾备恢复了
详细的面经和设计可以参考:深度思考线程池面经
我的回答(面试官做出了肯定):可以加一个定时探测机制,探测流量的大小,如果流量大就将允许的最大线程数增加,如果流量小,将最大线程数设置的和核心线程数一样大,cpu核心的两倍就行,但是这样回答其实太简单了
详细的回答:
主要是动态改变maxPoolSize的粒度上的区别,其他的几乎没变:
1 首先需要一个有界队列,同时设置一个corePoolSize和一个maxPoolSize参数,分别表示核心线程数以及支持的最大线程数,corePoolSize设置为OS支持的核心线程数+1,根据内存允许的情况设置maxPoolSize参数;另外会为每一个非核心线程设置一个超时时间,当执行完任务后的一段时间没有被分配新任务就自我注销;
2 主线程一般负责将任务分发给线程池中的线程或者添加任务到阻塞队列,同时我还给主线程一个任务那就是每隔一段时间监测当前的流量情况,如果当前的maxPoolSize设置的比较大,但是发现流量在明显降低,则粗粒度的减少maxPoolSize的值;如果发现当前的流量比较小,但是流量越来越大,则会一次性粗粒度的加大maxPoolSize,直到maxPoolSize达到一个系统内存的临界值,这里的检测机制是不断判断当前的等待队列是否已满,并且总线程数是否快要到达maxPoolSize,如果都是则扩容;如果等待队列都没满甚至为空,则可以慢慢减少maxPoolSize。
3 当maxPoolSize加大到系统的临界值并且阻塞队列已经满时,不会执行拒绝策略,主线程不再分配任务给本地的线程池,而是先放入到消息队列中,等待本地的队列中的任务执行了大部分时才将其从消息队列中预取一部分到本地队列。
思路:先使用trim()函数去除掉两端的空串,然后使用split函数将他们切割成数组,在数组中使用首尾双指针,同时向中间靠拢,同时分别交换它们,直到相遇
改进:可以使用stingBuilder,从字符串尾部开始遍历,每次碰到一个单词就将其顺序加入到stingBuilder中,这样的话就不会立即占用两个g的内存了,而且只需要处理一次
mq,flink都有
亿级的tps,一秒一个亿