施智沂

分布式缓存的面试题7

1、面试题

redis集群模式的工作原理能说一下么？在集群模式下，redis的key是如何寻址的？分布式寻址都有哪些算法？了解一致性hash算法吗？

2、面试官心里分析

在以前，如果前几年的时候，一般来说，redis如果要搞几个节点，每个节点存储一部分的数据，得借助一些中间件来实现，比如说有codis，或者twemproxy，都有。有一些redis中间件，你读写redis中间件，redis中间件负责将你的数据分布式存储在多台机器上的redis实例中。

这两年，redis不断在发展，redis也不断的有新的版本，redis cluster，redis集群模式，你可以做到在多台机器上，部署多个redis实例，每个实例存储一部分的数据，同时每个redis实例可以挂redis从实例，自动确保说，如果redis主实例挂了，会自动切换到redis从实例顶上来。

现在redis的新版本，大家都是用redis cluster的，也就是redis原生支持的redis集群模式，那么面试官肯定会就redis cluster对你来个几连炮。要是你没用过redis cluster，正常，以前很多人用codis之类的客户端来支持集群，但是起码你得研究一下redis cluster吧。

redis如何在保持读写分离+高可用的架构下，还能横向扩容支撑1T+海量数据

1、单机redis在海量数据面前的瓶颈

2、怎么才能够突破单机瓶颈，让redis支撑海量数据？

3、redis的集群架构

redis cluster

支撑N个redis master node，每个master node都可以挂载多个slave node

读写分离的架构，对于每个master来说，写就写到master，然后读就从mater对应的slave去读

高可用，因为每个master都有salve节点，那么如果mater挂掉，redis cluster这套机制，就会自动将某个slave切换成master

redis cluster（多master + 读写分离 + 高可用）

我们只要基于redis cluster去搭建redis集群即可，不需要手工去搭建replication复制+主从架构+读写分离+哨兵集群+高可用

4、redis cluster vs. replication + sentinal

如果你的数据量很少，主要是承载高并发高性能的场景，比如你的缓存一般就几个G，单机足够了

replication，一个mater，多个slave，要几个slave跟你的要求的读吞吐量有关系，然后自己搭建一个sentinal集群，去保证redis主从架构的高可用性，就可以了

redis cluster，主要是针对海量数据+高并发+高可用的场景，海量数据，如果你的数据量很大，那么建议就用redis cluster

数据分布算法：hash+一致性hash+redis cluster的hash slot

讲解分布式数据存储的核心算法，数据分布的算法

hash算法 -> 一致性hash算法（memcached） -> redis cluster，hash slot算法

用不同的算法，就决定了在多个master节点的时候，数据如何分布到这些节点上去，解决这个问题

1、redis cluster介绍

redis cluster

（1）自动将数据进行分片，每个master上放一部分数据
（2）提供内置的高可用支持，部分master不可用时，还是可以继续工作的

在redis cluster架构下，每个redis要放开两个端口号，比如一个是6379，另外一个就是加10000的端口号，比如16379

16379端口号是用来进行节点间通信的，也就是cluster bus的东西，集群总线。cluster bus的通信，用来进行故障检测，配置更新，故障转移授权

cluster bus用了另外一种二进制的协议，主要用于节点间进行高效的数据交换，占用更少的网络带宽和处理时间

2、最老土的hash算法和弊端（大量缓存重建）

3、一致性hash算法（自动缓存迁移）+虚拟节点（自动负载均衡）

4、redis cluster的hash slot算法

redis cluster有固定的16384个hash slot，对每个key计算CRC16值，然后对16384取模，可以获取key对应的hash slot

redis cluster中每个master都会持有部分slot，比如有3个master，那么可能每个master持有5000多个hash slot

hash slot让node的增加和移除很简单，增加一个master，就将其他master的hash slot移动部分过去，减少一个master，就将它的hash slot移动到其他master上去

移动hash slot的成本是非常低的

客户端的api，可以对指定的数据，让他们走同一个hash slot，通过hash tag来实现

redis cluster的核心原理分析：gossip通信、jedis smart定位、主备切换

一、节点间的内部通信机制

1、基础通信原理

（1）redis cluster节点间采取gossip协议进行通信

跟集中式不同，不是将集群元数据（节点信息，故障，等等）集中存储在某个节点上，而是互相之间不断通信，保持整个集群所有节点的数据是完整的

维护集群的元数据用得，集中式，一种叫做gossip

集中式：好处在于，元数据的更新和读取，时效性非常好，一旦元数据出现了变更，立即就更新到集中式的存储中，其他节点读取的时候立即就可以感知到; 不好在于，所有的元数据的跟新压力全部集中在一个地方，可能会导致元数据的存储有压力

gossip：好处在于，元数据的更新比较分散，不是集中在一个地方，更新请求会陆陆续续，打到所有节点上去更新，有一定的延时，降低了压力; 缺点，元数据更新有延时，可能导致集群的一些操作会有一些滞后

我们刚才做reshard，去做另外一个操作，会发现说，configuration error，达成一致

（2）10000端口

每个节点都有一个专门用于节点间通信的端口，就是自己提供服务的端口号+10000，比如7001，那么用于节点间通信的就是17001端口

每隔节点每隔一段时间都会往另外几个节点发送ping消息，同时其他几点接收到ping之后返回pong

（3）交换的信息

故障信息，节点的增加和移除，hash slot信息，等等

2、gossip协议

gossip协议包含多种消息，包括ping，pong，meet，fail，等等

meet: 某个节点发送meet给新加入的节点，让新节点加入集群中，然后新节点就会开始与其他节点进行通信

redis-trib.rb add-node

其实内部就是发送了一个gossip meet消息，给新加入的节点，通知那个节点去加入我们的集群

ping: 每个节点都会频繁给其他节点发送ping，其中包含自己的状态还有自己维护的集群元数据，互相通过ping交换元数据

每个节点每秒都会频繁发送ping给其他的集群，ping，频繁的互相之间交换数据，互相进行元数据的更新

pong: 返回ping和meet，包含自己的状态和其他信息，也可以用于信息广播和更新

fail: 某个节点判断另一个节点fail之后，就发送fail给其他节点，通知其他节点，指定的节点宕机了

3、ping消息深入

ping很频繁，而且要携带一些元数据，所以可能会加重网络负担

每个节点每秒会执行10次ping，每次会选择5个最久没有通信的其他节点

当然如果发现某个节点通信延时达到了cluster_node_timeout / 2，那么立即发送ping，避免数据交换延时过长，落后的时间太长了

比如说，两个节点之间都10分钟没有交换数据了，那么整个集群处于严重的元数据不一致的情况，就会有问题

所以cluster_node_timeout可以调节，如果调节比较大，那么会降低发送的频率

每次ping，一个是带上自己节点的信息，还有就是带上1/10其他节点的信息，发送出去，进行数据交换

至少包含3个其他节点的信息，最多包含总节点-2个其他节点的信息

-------------------------------------------------------------------------------------------------------

二、面向集群的jedis内部实现原理

开发，jedis，redis的java client客户端，redis cluster，jedis cluster api

jedis cluster api与redis cluster集群交互的一些基本原理

1、基于重定向的客户端

redis-cli -c，自动重定向

（1）请求重定向

客户端可能会挑选任意一个redis实例去发送命令，每个redis实例接收到命令，都会计算key对应的hash slot

如果在本地就在本地处理，否则返回moved给客户端，让客户端进行重定向

cluster keyslot mykey，可以查看一个key对应的hash slot是什么

用redis-cli的时候，可以加入-c参数，支持自动的请求重定向，redis-cli接收到moved之后，会自动重定向到对应的节点执行命令

（2）计算hash slot

计算hash slot的算法，就是根据key计算CRC16值，然后对16384取模，拿到对应的hash slot

用hash tag可以手动指定key对应的slot，同一个hash tag下的key，都会在一个hash slot中，比如set mykey1:{100}和set mykey2:{100}

（3）hash slot查找

节点间通过gossip协议进行数据交换，就知道每个hash slot在哪个节点上

2、smart jedis

（1）什么是smart jedis

基于重定向的客户端，很消耗网络IO，因为大部分情况下，可能都会出现一次请求重定向，才能找到正确的节点

所以大部分的客户端，比如java redis客户端，就是jedis，都是smart的

本地维护一份hashslot -> node的映射表，缓存，大部分情况下，直接走本地缓存就可以找到hashslot -> node，不需要通过节点进行moved重定向

（2）JedisCluster的工作原理

在JedisCluster初始化的时候，就会随机选择一个node，初始化hashslot -> node映射表，同时为每个节点创建一个JedisPool连接池

每次基于JedisCluster执行操作，首先JedisCluster都会在本地计算key的hashslot，然后在本地映射表找到对应的节点

如果那个node正好还是持有那个hashslot，那么就ok; 如果说进行了reshard这样的操作，可能hashslot已经不在那个node上了，就会返回moved

如果JedisCluter API发现对应的节点返回moved，那么利用该节点的元数据，更新本地的hashslot -> node映射表缓存

重复上面几个步骤，直到找到对应的节点，如果重试超过5次，那么就报错，JedisClusterMaxRedirectionException

jedis老版本，可能会出现在集群某个节点故障还没完成自动切换恢复时，频繁更新hash slot，频繁ping节点检查活跃，导致大量网络IO开销

jedis最新版本，对于这些过度的hash slot更新和ping，都进行了优化，避免了类似问题

（3）hashslot迁移和ask重定向

如果hash slot正在迁移，那么会返回ask重定向给jedis

jedis接收到ask重定向之后，会重新定位到目标节点去执行，但是因为ask发生在hash slot迁移过程中，所以JedisCluster API收到ask是不会更新hashslot本地缓存

已经可以确定说，hashslot已经迁移完了，moved是会更新本地hashslot->node映射表缓存的

-------------------------------------------------------------------------------------------------------

三、高可用性与主备切换原理

redis cluster的高可用的原理，几乎跟哨兵是类似的

1、判断节点宕机

如果一个节点认为另外一个节点宕机，那么就是pfail，主观宕机

如果多个节点都认为另外一个节点宕机了，那么就是fail，客观宕机，跟哨兵的原理几乎一样，sdown，odown

在cluster-node-timeout内，某个节点一直没有返回pong，那么就被认为pfail

如果一个节点认为某个节点pfail了，那么会在gossip ping消息中，ping给其他节点，如果超过半数的节点都认为pfail了，那么就会变成fail

2、从节点过滤

对宕机的master node，从其所有的slave node中，选择一个切换成master node

检查每个slave node与master node断开连接的时间，如果超过了cluster-node-timeout * cluster-slave-validity-factor，那么就没有资格切换成master

这个也是跟哨兵是一样的，从节点超时过滤的步骤

3、从节点选举

哨兵：对所有从节点进行排序，slave priority，offset，run id

每个从节点，都根据自己对master复制数据的offset，来设置一个选举时间，offset越大（复制数据越多）的从节点，选举时间越靠前，优先进行选举

所有的master node开始slave选举投票，给要进行选举的slave进行投票，如果大部分master node（N/2 + 1）都投票给了某个从节点，那么选举通过，那个从节点可以切换成master

从节点执行主备切换，从节点切换为主节点

4、与哨兵比较

整个流程跟哨兵相比，非常类似，所以说，redis cluster功能强大，直接集成了replication和sentinal的功能

nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
梧桐数据库（WuTongDB）：数据库技术中都有哪些常见的优化器鲁鲁517 梧桐数据库梧桐数据库
以下是一些常见的数据库优化器：1.CBO（Cost-BasedOptimizer）应用场景：广泛应用于关系型数据库中，如Oracle、PostgreSQL、MySQL等。工作原理：通过计算不同执行计划的代价（如CPU、I/O等资源消耗），选择最低代价的执行计划。代表数据库：Oracle、PostgreSQL、MySQL。特点：CBO使用统计信息（如表大小、索引分布）来评估查询的代价。2.RBO（R
斯尔福智慧实验室三阶段详解斯尔福实验室设备大数据
未来二十时间，实验室智能化是各类实验室的发展方向。在这样的时代背景下，斯尔福提出设计建造更安全、舒适、高效、节能的智慧实验室，是整个实验室设计、建设的核心目地。斯尔福将智慧实验室分为3个阶段。如何实现实验室信息数据智能化，LEMS实验室智能环境设施管理系统，以实验室为中心，采用先进的计算机网络技术、数据库技术以及三维仿真技术，将实验室整体环境，包括设备。人员。危险物等数据，结合实验室用户标准化管理
区块链:数据库技术时汝佳
图片发自App0引言对于区块链的解读，有一种观点是数据库。正好手头有本书《计算机是怎样跑起来的》（日文版重印18次，中文版也多达10次印刷），里面有一章介绍数据库，浅显易懂。1基础概念数据库是数据的基地。适合大规模数据存储的是关系型数据库（RelationalDatabase）。现在大多在用的是关系型数据库，数据被拆分到多张表（Table）中，表与表之间的关系可以被记录下来，为了在表之间建立关系，
Python下载中国数据库大会（DTCC2024）PPT全集 2401_86391915 数据库 python oracle
程序下载网盘下载背景==前几天中国数据库大会风风火火的在京举行了，期间干货满满，收获良多。在学大佬们的ppt时，发现只能一篇一篇预览，对于求知欲强烈的小编来说简直太难受了，于是便写了个程序，一键获取所有ppt。2020年12月21日~12月23日，由IT168旗下ITPUB企业社区平台主办的第十一届中国数据库技术大会（DTCC2020），将在北京隆重召开。大会以“架构革新高效可控”为主题，设置2大
分布式数据库架构：从单实例到分布式，开发人员需及早掌握？我爱娃哈哈 MySQL实战分布式数据库架构数据库
现在互联网应用已经普及，数据量不断增大。对淘宝、美团、百度等互联网业务来说，传统单实例数据库很难支撑其性能和存储的要求，所以分布式架构得到了很大发展。而开发人员、项目经理，一定要认识到数据库技术正在经历一场较大的变革，及早掌握好分布式架构设计，帮助公司从古老的单实例架构迁移到分布式架构，对自己在职场的竞争力来说，大有益处。一、什么是分布式数据库？Wiki官方对分布式数据库的定义为：Adistrib
TDsql 大数据- 数据库大数据中间件
TDsql的特点TDengineDistributedSQL（TDsql）是一个基于TDengine时序数据库技术的开源分布式关系型数据库管理系统。作为TDengine团队开发和维护的产品，TDsql已经广泛应用于互联网、电信、金融等领域，为用户提供高效、可靠的数据存储和查询服务。一、TDsql的特点高度优化的查询计划和执行引擎：TDsql可以快速响应大量的查询请求。其查询计划和执行引擎采用了多种
区块链1——区块链基础概念风不归Alkaid 区块链区块链
区块链索引目录一、介绍区块链技术1、什么是区块链区块链是一种基于分布式数据库和加密技术的技术，它的特点包括去中心化、不可篡改、安全可靠等。这些特点使得区块链技术在金融、供应链、医疗等领域都有着广泛的应用前景。当谈到区块链技术时，我们首先需要了解什么是区块链。区块链是一种分布式数据库技术，它以一种特殊的方式存储数据，使得数据无法被篡改，并且可以被多个参与者共享和访问。更详细地解释一下：分布式数据库：
梧桐数据库（WuTongDB）：存算分离和存算一体架构的分布式数据库技术分析鲁鲁517 梧桐数据库数据库架构分布式梧桐数据库
摘要：随着数据量的不断增长和对数据处理性能的要求越来越高，分布式数据库技术成为了数据存储和处理的重要解决方案。存算分离和存算一体是两种常见的分布式数据库架构，它们在数据存储和计算方面有着不同的特点和优势。本文将对存算分离和存算一体架构的分布式数据库技术进行分析，比较它们的优缺点，并探讨它们在不同场景下的应用。一、引言在大数据时代，数据的存储和处理成为了企业面临的重要挑战。传统的单机数据库已经无法满
Oracle数据库高级技术探索与应用我的运维人生 oracle 数据库运维开发技术共享
Oracle数据库高级技术探索与应用在数据库技术领域，Oracle数据库以其强大的性能、可靠性和灵活性，成为众多企业应用的首选。本文将从Oracle数据库的连接、查询优化、常见操作及高级功能四个方面展开，通过具体的代码示例，深入探讨Oracle数据库的高级技术与应用。一、Oracle数据库的连接在进行任何数据库操作之前，首先需要建立与Oracle数据库的连接。Python作为一种流行的编程语言，通
区块链技术寂然如故区块链
区块链技术是一种去中心化的数据库技术，透过分布式账本的方式，记录和验证数据的交易和交流。它具有以下应用场景和优势：金融领域：区块链技术可以用于支付、跨境汇款、众筹等金融交易，提供安全、快速和低成本的交易方式，减少中间环节和降低交易风险。物联网：区块链技术可以用于物联网设备之间的数据交流和认证，确保数据的真实性和完整性，以及设备之间的安全互操作性。供应链管理：区块链技术可以追踪和验证产品的供应链信息
梧桐数据库（WuTongDB）：数据库技术中 MetaData 和 Catalog 的区别和联系鲁鲁517 梧桐数据库梧桐数据库元数据 MetaData Catalog
在数据库技术中，MetaData（元数据）和Catalog（目录）都是描述和管理数据的重要概念，但它们有不同的侧重点和用途。以下是它们的区别和具体说明：MetaData（元数据）定义：MetaData是描述数据的数据，它提供了关于数据的结构、内容、格式和管理的信息。作用和用途：描述数据结构：元数据包含表、列、数据类型、约束条件等信息，帮助用户和数据库管理员理解数据的结构。数据管理：元数据帮助管理数
iOS 数据库 iOS_愛OS
数据库coredatahttps://www.jianshu.com/p/4c059a05441cCoreData简单查询查询大全https://www.jianshu.com/p/217a769f184eiOS数据库技术进阶https://www.jianshu.com/p/50e0efb66bdfRealm数据库从入门到“放弃”https://www.jianshu.com/p/7986ce3
【SQL数据库技术开发】第8课时-数据库SQL INSERT INTO 语句青少年编程作品集【SQL数据库技术文档】SQL 脚本研究数据库 sql javascript es6 linux
SQLINSERTINTO语句INSERTINTO语句用于向表中插入新记录。SQLINSERTINTO语句INSERTINTO语句用于向表中插入新记录。SQLINSERTINTO语法INSERTINTO语句可以有两种编写形式。第一种形式无需指定要插入数据的列名，只需提供被插入的值即可：INSERTINTOtable_nameVALUES(value1,value2,value3,...);第二种形
深入理解数据库：从基础到高级应用魏时还数据库
引言在当今这个数据洪流汹涌的时代，数据库技术已蜕变成为企业数字化转型与智能决策不可或缺的基石。它不再仅仅是数据的简单堆砌之地，而是驱动业务洞察、支撑复杂分析、加速创新决策的强大引擎。从金融、医疗到零售、科技，各行各业都在借助数据库技术挖掘数据价值，推动行业进步。本文将引领您踏上一场深入数据库世界的探索之旅。从基础概念的扎实构建，到架构设计的精妙布局，再到性能优化的极致追求，我们将一一揭开数据库技术
《区块链：重塑经济与世界》 simple涯
《区块链：重塑经济与世界》：我们生活在一个奔腾的年代，苹果重塑手机，谷歌战胜李世石，特斯拉重新定义汽车。科技不断重塑着我们的经济、生活和世界。一种全新的金融网络、分布式数据库技术从底层蓬勃而出，将重塑整个金融和经济，可能会让比尔•盖茨的预言“你们传统银行如果不改变，就是21世纪要灭绝的恐龙”应验。这个技术就是区块链。区块链的诞生颇具传奇色彩，而它引发的一系列产物：数字货币、智能合约、分布式治理等更
数据库集群技术分析和比较(一) Allen----Liu 数据库服务器集群
一、引言数据库是用来保存计算的最终结果的，所以是整个信息系统的最重要组成部分。在许多人看来，当前的数据库技术已经可以说是非常地成熟了。然而，在满足不断增长的联机事务处理应用方面，当前的数据库技术其实还存在不少急迫需要解决的技术问题。对于所有的数据库而言，除了记录正确的处理结果之外，它们都面临着四方面的挑战：如何提高处理速度，数据可用性、数据安全性和数据集可扩性，也就是说，如何使当前的数据库具有这四
《C++与新兴数据库技术的完美交互：开启高效数据处理新时代》程序猿阿伟 c++数据库开发语言
在当今快速发展的科技领域，数据库技术不断推陈出新，为数据的存储、管理和检索带来了更高效、更灵活的解决方案。而C++作为一种强大的编程语言，如何更好地与新兴的数据库技术进行交互，成为了众多开发者关注的热点问题。一、新兴数据库技术的崛起随着大数据、云计算和人工智能等技术的飞速发展，传统的关系型数据库在某些场景下已经难以满足日益增长的需求。新兴的数据库技术，如NoSQL数据库、NewSQL数据库、分布式
MYSQL 消失的年轮 java学习 java mysql 开发语言
文章目录数据库数据库的基本组成部分包括数据库的类型包括数据库技术的发展史SQL的发展史MySQLMySQL的特点包括：RDBMS关系数据库管理系统的特点RDBMS关系数据库管理系统的相关术语MySQL安装Navicat安装MySQL创建数据库的语法MySQL创建表的语法MySQL删除表的语法MySQL插入数据的语法MySQLSELECT子句的语法--查询MySQLWHERE子句的语法--条件查询M
为什么搜索引擎可以检索到网站？程序员T哥搜索引擎爬虫网络安全网络爬虫网络协议 java python
搜索引擎和爬虫，基于百度举例为什么搜索引擎可以快速检索到所有对应页面？搜索引擎能够快速检索到所有对应页面，主要归功于以下几个方面：爬虫技术：自动遍历互联网上的网页。索引：将爬取的网页内容转换成数据结构存储。关键词匹配：检索包含用户输入关键词的网页。页面排名：使用复杂算法对搜索结果排序。数据库技术：处理和存储大量数据。分布式计算：提高处理速度。缓存机制：快速返回热门查询结果。用户行为分析：优化搜索结
数据库 SQLite3 军胜a 数据库 linux
一、数据库综述数据库（DataBase，简记为DB）就是一个有结构的、集成的、可共享的统一管理的数据集合。它不仅包括数据本身，而且包括相关数据之间的联系。数据库技术主要研究如何存储、使用和管理数据；所谓有结构的，指的是数据是按一定的模型组织起来的。数据模型可用数据结构来描述。数据模型决定数据的组织方式、操作方法。理解数据库的前提是理解数据模型。现在的数据库多数是以关系模型来组织数据的。可以简单地把
区块链技术的应用场景和优势田木木区块链区块链
区块链技术是一种去中心化、安全、透明的分布式数据库技术，被广泛应用于各个行业。以下是区块链技术的一些应用场景和优势：1.金融领域：区块链可以用于构建安全的、可追溯的支付系统，提高发起支付和清算效率，减少中间商的参与，降低交易成本。2.物联网：区块链可以建立可信、安全的物联网网络，用于设备之间的身份验证、数据传输和交易记录，确保物联网数据的真实性和可靠性。3.供应链管理：区块链技术可以追踪产品的整个
基于HBase和Spark构建企业级数据处理平台 weixin_34071713 大数据数据库爬虫
摘要：在中国HBase技术社区第十届Meetup杭州站上，阿里云数据库技术专家李伟为大家分享了如何基于当下流行的HBase和Spark体系构建企业级数据处理平台，并且针对于一些具体落地场景进行了介绍。演讲嘉宾简介：李伟（花名：沐远），阿里云数据库技术专家。专注于大数据分布式计算和数据库领域，具有6年分布式开发经验，先后研发Spark及自主研发内存计算，目前为广大公有云用户提供专业的云HBase数据
万字带你走过数据库的这激荡的三年数据库
本文收集了卡内基梅隆大学计算机科学系数据库学副教授AndyPavlo从2021到2023连续三年对数据库领域的回顾，希望通过连续三年的回顾让你对数据库领域的技术发展有所了解。关于AndyPavlo：卡内基梅隆大学计算机科学系数据库学副教授，数据库调优公司OtterTune的CEO兼联合创始人。为了聚焦于数据库技术趋势演变，本文未对原文“寒暄式”开头和注释性语句作翻译。此外，为了节约部分读者的时间，
Oracle大型数据库技术曹博Blog 数据库数据库 oracle ffmpeg
实验环境sqlplus记录实验过程的方法：spool带有绝对路径的文件名[append]--SQL语句spooloff开启相关服务oracleserviceORCL控制面板–管理–服务–找到后开启命令行方法：cmd–netstart|stoporacleserviceorcl常用操作显示当前用户名showuser常用的用户名和口令：dba用户，默认口令：change_on_install,Orac
区块链技术和Hyperledger Fabric介绍 dnice 区块链区块链
1区块链介绍1.1区块链技术形成1.1.1起源在比特币诞生之时，技术专家们开始研究比特币的底层技术，并抽象提取出来，形成区块链技术，或者称分布式账本技术。1.1.2定义简称BT（Blockchaintechnology），也称为分布式账本技术，是一种互联网数据库技术，其特点是去中心化、公开透明，让每个人均可参与数据库记录，同时数据不可篡改。1.1.3理解把数据库比喻为一个账本，一次记账的行为就是一
黄东旭：“向量数据库”还是“向量搜索插件 + SQL 数据库”？丨我对 2024 年数据库发展趋势的思考 TiDB_PingCAP tidb 分布式云原生数据库
本文由PingCAP黄东旭撰写，讨论了数据库技术在2023年的快速变革，并对2024年的数据库发展趋势进行了预测。文章重点关注了GenAI时代对数据库的影响，提出了在数据库选择上的两种路径：“向量数据库”和“向量搜索插件+SQL数据库”。文章强调了个性化数据服务的重要性，以及数据库在实时交互和弹性方面所起到的关键作用。如果我们用一个词来总结2023年的数据技术领域，那个词无疑是“急速变革”。我们见
Oracle数据库编织幻境的妖数据库 oracle
1.请解释什么是分区表（PartitionedTable）以及它的优点。分区表是一种数据库技术，它将一个大表分成多个小的、更易于管理的部分，每个部分称为一个分区。以下是Oracle分区表的一些优点：提高查询性能：通过对数据进行分区，可以只针对特定分区执行查询操作，从而减少需要扫描的数据量，提高查询效率。便于数据维护：分区表允许对单个分区进行操作，如删除、备份或恢复，而不会影响到整个表，这简化了数据
黄东旭：“向量数据库”还是“向量搜索插件 + SQL 数据库”？丨我对 2024 年数据库发展趋势的思考
本文由PingCAP黄东旭撰写，讨论了数据库技术在2023年的快速变革，并对2024年的数据库发展趋势进行了预测。文章重点关注了GenAI时代对数据库的影响，提出了在数据库选择上的两种路径：“向量数据库”和“向量搜索插件+SQL数据库”。文章强调了个性化数据服务的重要性，以及数据库在实时交互和弹性方面所起到的关键作用。如果我们用一个词来总结2023年的数据技术领域，那个词无疑是“急速变革”。我们见
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts

分布式缓存的面试题7

分布式缓存的面试题7

你可能感兴趣的:(数据库技术)