ZkvIA

Redis slots迁移丢key问题排查

最近在公司wiki写了几篇还不错的wiki，感觉有分享的必要，所以贴出来和大家分享。
这个是redis的一个critical级别的bug,在目前的3.2.6的小版本都没有修复，只有在4.0rc2里面修了。就是说即使你们用12月发布的3.2.6都是有问题的。

1.问题

redis slots迁移的时候，在迁移之后key数量会变少.

2.排查

2.1思考

redis 3.x也是比较成熟的产品了，为什么会丢key?别人有没有遇到同样的问题？
假设丢key了，如果key是因为expire丢失，那应该是正常，如果没有expire丢失，就是问题了，首先复现问题。

2.2复现问题

0.准备集群

造了两个节点的集群：10.0.0.10:20003和10.0.0.10:20004，最大可使用内存200M，并保证在测试过程中不会导致内存满等其他问题

10.0.0.10:20004> cluster nodes
2aed426536067077179a3d23875b93b223802dea 10.0.0.10:20003 master - 0 1482132098352 6 connected
03a53320815d8b5f774810f2d41329007d60ebf4 10.0.0.10:20004 myself,master - 0 0 7 connected 0-16383

key格式：{test}_i, 保证所有的key使用同一个slot。{test}_i的slot为6918，并且测试前slot里面没有key.

10.0.0.10:20004> cluster keyslot {test}_i
(integer) 6918
10.0.0.10:20004> cluster countkeysinslot 6918
(integer) 0
10.0.0.10:20003> cluster countkeysinslot 6918
(integer) 0

# 迁移函数，配合redis-trib fix迁移
def migrate_from_4_to_3(slot):
    cmd="cluster setslot %s migrating 2aed426536067077179a3d23875b93b223802dea" % (slot,)
    cli4.execute_command(cmd)
    cmd="cluster setslot %s importing 03a53320815d8b5f774810f2d41329007d60ebf4" % (slot,)
    cli3.execute_command(cmd)

def migrate_from_3_to_4(slot):
    cmd="cluster setslot %s migrating 03a53320815d8b5f774810f2d41329007d60ebf4" % (slot,)
    cli3.execute_command(cmd)
    cmd="cluster setslot %s importing 2aed426536067077179a3d23875b93b223802dea" % (slot,)
    cli4.execute_command(cmd)

1.非过期key测试

10.0.0.10:20003> cluster countkeysinslot 6918
(integer) 0
10.0.0.10:20004> cluster countkeysinslot 6918
(integer) 0

# 向10.0.0.10:20004写入20000个不带过期时间的key
for i in range(20000):
    cmd="set {test}_%s %s" % (i, i)
    print cmd, cli4.execute_command(cmd)

10.0.0.10:20004> cluster countkeysinslot 6918
(integer) 20000

# 迁移slot 6918
migrate_from_4_to_3(6918)
redis-trib fix 10.0.0.10:20004

#check
10.0.0.10:20003> cluster countkeysinslot 6918
(integer) 20000
10.0.0.10:20004> cluster countkeysinslot 6918
(integer) 0

结论: 20000个key全部迁移，没有问题。

2.部分带过期时间的key测试

使用和上面相同的方法，测试{20000个不过期的key，20000个带过期时间的key}的情况。使用了{test}_i的slot=6918和{bug}_i的slot=7910这两个slot进行了测试。

如果迁移的过程中没有key正在过期，发现迁移后key的数量也会减少

如果有迁移的过程中有key正在过期，那么迁移完成后key的数量少于20000，并且多次实验测试少的key的数量不同，有的时候少几百个，有的时候少2000多个。

说明，如果在迁移slot的过程中，如果有key过期，那么会对那么没有过期时间的key造成影响，导致丢失一些不过期的key.

3.是不是redis-trib的问题？

redis-trib在判断是不是迁移完成时，只判断了getkeysinslot，当getkeysinslot返回空时就直接认为迁移完成了，直接退出。
所以在代码里面添加了countkeysinslot，当两者同时为0时，在尝试判断10次在退出试一下。

# 修改后的redis-trib.rb
...
# Migrate all the keys from source to target using the MIGRATE command
zerocounttime = 0
while true
    keys = source.r.cluster("getkeysinslot",slot,o[:pipeline])
    cntkeysinslot = source.r.cluster("countkeysinslot",slot)
    if keys.length == 0 && cntkeysinslot == 0
        while true
            keys = source.r.cluster("getkeysinslot",slot,o[:pipeline])
            cntkeysinslot = source.r.cluster("countkeysinslot",slot)
            if keys.length == 0 && cntkeysinslot == 0
                zerocounttime = zerocounttime + 1
                print "try #{zerocounttime}\n"
            end
            if zerocounttime > 10
                break
            end
        end
    end
    break if zerocounttime > 10
    zerocounttime = 0
    #do migrate keys
    ...

结论:问题同样复现，不是这里的问题。

4.redis新版本如何？

我们用的redis版本为3.2.1，新版本是不是也存在这个问题？

在github上clone了最新的代码

3.x的最新版本3.2.6, 问题可以复现。

4.0, 问题没有复现。并且在测试中发现，4.0的redis-server和当前3.2的无法兼容。

例如10.0.0.10:20003是3.2.1，10.0.0.10:20004是4.0，cluster nodes如下：

10.0.0.10:20003> cluster nodes
2aed426536067077179a3d23875b93b223802dea 10.0.0.10:20003 myself,master - 0 0 14 connected 5638
03a53320815d8b5f774810f2d41329007d60ebf4 10.0.0.10:20004 master,fail? - 1482152712981 1482152711815 13 disconnected 0-5637 5639-16383
10.0.0.10:20004> cluster nodes
03a53320815d8b5f774810f2d41329007d60ebf4 10.0.0.10:20004@30004 myself,master - 0 0 13 connected 0-5637 5639-16383
2aed426536067077179a3d23875b93b223802dea 10.0.0.10:20003@30003 master,fail? - 1482152711827 1482152711026 14 connected 5638

全部是4.0时，cluster nodes如下：

10.0.0.10:20003> cluster nodes
03a53320815d8b5f774810f2d41329007d60ebf4 10.0.0.10:20004@30004 master - 0 1482152867134 13 connected 0-5637 5639-16383
2aed426536067077179a3d23875b93b223802dea 10.0.0.10:20003@30003 myself,master - 0 0 14 connected 5638
10.0.0.10:20004> cluster nodes
03a53320815d8b5f774810f2d41329007d60ebf4 10.0.0.10:20004@30004 myself,master - 0 0 13 connected 0-5637 5639-16383
2aed426536067077179a3d23875b93b223802dea 10.0.0.10:20003@30003 master - 0 1482152864189 14 connected 5638

所以继续使用3.2.6的排查。

5.问题在哪？

修改redis-trib代码添加迁移的key 的log,修改redis 3.2.6的代码，在源节点的log里面打印处理的key

...
# Migrate all the keys from source to target using the MIGRATE command
while true
    keys = source.r.cluster("getkeysinslot",slot,o[:pipeline])
    break if keys.length == 0
    print "\nmigrating keys: #{keys}"  # debug log
    begin
        source.r.client.call(["migrate",target.info[:host],target.info[:port],"",0,@timeout,:keys,*keys])
    end
    ...
    print "."*keys.length if o[:dots]
    STDOUT.flush
end
...

redis 3.2.6

//add log for restoreCommand
    ...
    /* Create the key and set the TTL if any */
    dbAdd(c->db,c->argv[1],obj);
    if (ttl) setExpire(c->db,c->argv[1],mstime()+ttl);
    signalModifiedKey(c->db,c->argv[1]);
    addReply(c,shared.ok);
    server.dirty++;
    if (sdslen(c->argv[1]->ptr) < 12){ // debug log
        serverLog(LL_WARNING,"store key ok, key:%s, ttl:%lld", c->argv[1]->ptr, ttl);
    }
}


// add log for migrateCommand
...
/* Create RESTORE payload and generate the protocol to call the command. */
for (j = 0; j < num_keys; j++) {
    expireat = getExpire(c->db,kv[j]);
    if (expireat != -1) {
        ttl = expireat-mstime();
        if (ttl < 1) ttl = 1;
    }
    serverAssertWithInfo(c,NULL,rioWriteBulkCount(&cmd,'*',replace ? 5 : 4));
    if (server.cluster_enabled)
        serverAssertWithInfo(c,NULL,
            rioWriteBulkString(&cmd,"RESTORE-ASKING",14));
    else
        serverAssertWithInfo(c,NULL,rioWriteBulkString(&cmd,"RESTORE",7));
    serverAssertWithInfo(c,NULL,sdsEncodedObject(kv[j]));
    serverAssertWithInfo(c,NULL,rioWriteBulkString(&cmd,kv[j]->ptr,
            sdslen(kv[j]->ptr)));
    serverAssertWithInfo(c,NULL,rioWriteBulkLongLong(&cmd,ttl));
    serverLog(LL_WARNING,"prepare cmd, key:%s, ttl:%lld", kv[j]->ptr, ttl);//debug log
    /* Emit the payload argument, that is the serialized object using
     * the DUMP format. */
    createDumpPayload(&payload,ov[j]);
    serverAssertWithInfo(c,NULL,
        rioWriteBulkString(&cmd,payload.io.buffer.ptr,
                           sdslen(payload.io.buffer.ptr)));
    sdsfree(payload.io.buffer.ptr);

    /* Add the REPLACE option to the RESTORE command if it was specified
     * as a MIGRATE option. */
    if (replace)
        serverAssertWithInfo(c,NULL,rioWriteBulkString(&cmd,"REPLACE",7));
}
...
...
/* Create RESTORE payload and generate the protocol to call the command. */
for (j = 0; j < num_keys; j++) {
    serverLog(LL_WARNING,"key:%s", kv[j]->ptr);  // debug log
    expireat = getExpire(c->db,kv[j]);
    if (expireat != -1) {
        ttl = expireat-mstime();
        if (ttl < 1) ttl = 1;
    }
    ...
}
...

问题复现,这次丢失的key为:

>>> len(notfound)
7
>>>
>>> notfound
[4, 3994, 3995, 3996, 3997, 3998, 3999]

在redis-trib和source节点都能看到缺少的key的日志，很明显的看到key被迁移了。

在target的节点看到日志是这样的：

125838:M 21 Dec 11:40:36.390 # store key ok, key:{haha}_399, ttl:0
125838:M 21 Dec 11:40:36.390 # store key ok, key:{haha}_3990, ttl:0
125838:M 21 Dec 11:40:36.426 # store key ok, key:{haha}_3991, ttl:0
125838:M 21 Dec 11:40:36.445 # store key ok, key:{haha}_3992, ttl:0
125838:M 21 Dec 11:40:36.467 # store key ok, key:{haha}_3993, ttl:0
125838:M 21 Dec 11:40:36.486 # store key ok, key:{haha}_3994, ttl:1
125838:M 21 Dec 11:40:36.505 # store key ok, key:{haha}_3995, ttl:14
125838:M 21 Dec 11:40:36.524 # store key ok, key:{haha}_3996, ttl:22
125838:M 21 Dec 11:40:36.544 # store key ok, key:{haha}_3997, ttl:25
125838:M 21 Dec 11:40:36.561 # store key ok, key:{haha}_3998, ttl:30
125838:M 21 Dec 11:40:36.580 # store key ok, key:{haha}_3999, ttl:32
125838:M 21 Dec 11:40:36.599 # store key ok, key:{haha}_4, ttl:35
125838:M 21 Dec 11:40:36.632 # store key ok, key:{haha}_40, ttl:0
125838:M 21 Dec 11:40:36.632 # store key ok, key:{haha}_400, ttl:0
125838:M 21 Dec 11:40:36.632 # store key ok, key:{haha}_4000, ttl:0
125838:M 21 Dec 11:40:36.632 # store key ok, key:{haha}_4001, ttl:0

所有丢失的key的ttl都不对！

去源节点看一下ttl是啥？

126113:M 21 Dec 11:40:36.561 # key:{haha}_39979
126113:M 21 Dec 11:40:36.561 # prepare cmd, key:{haha}_39979, ttl:30
126113:M 21 Dec 11:40:36.561 # key:{haha}_3998
126113:M 21 Dec 11:40:36.561 # prepare cmd, key:{haha}_3998, ttl:30
126113:M 21 Dec 11:40:36.561 # key:{haha}_39980
126113:M 21 Dec 11:40:36.561 # prepare cmd, key:{haha}_39980, ttl:32
126113:M 21 Dec 11:40:36.580 # key:{haha}_39988
126113:M 21 Dec 11:40:36.580 # prepare cmd, key:{haha}_39988, ttl:30
126113:M 21 Dec 11:40:36.580 # key:{haha}_39989
126113:M 21 Dec 11:40:36.580 # prepare cmd, key:{haha}_39989, ttl:32
126113:M 21 Dec 11:40:36.580 # key:{haha}_3999
126113:M 21 Dec 11:40:36.580 # prepare cmd, key:{haha}_3999, ttl:32
126113:M 21 Dec 11:40:36.580 # key:{haha}_39990
126113:M 21 Dec 11:40:36.580 # prepare cmd, key:{haha}_39990, ttl:35

说明所有丢失key的ttl因为没有处理而使用了前一个key的ttl！

问题出在下面代码的for循环，对于不过期的key,ttl应该是0，但是如果前面有过期的key,ttl>0.那么在下一个处理不过期key时，expireat=-1，不会进入if，ttl还是使用前一个ttl，导致一个永不过期的key因为ttl>0而过期。

/* MIGRATE host port key dbid timeout [COPY | REPLACE]
 *
 * On in the multiple keys form:
 *
 * MIGRATE host port "" dbid timeout [COPY | REPLACE] KEYS key1 key2 ... keyN */
void migrateCommand(client *c) {
    long long ttl, expireat;
    ttl = 0;
    ...

    /* Create RESTORE payload and generate the protocol to call the command. */
    /*
        问题出在这个for循环，对于不过期的key,ttl应该是0，但是如果前面有过期的key,ttl>0.在处理不过期key时，expireat=-1，导致ttl还是使用前一个ttl.
        导致一个永不过期的key因为ttl>0而过期。
    */
    for (j = 0; j < num_keys; j++) {
        /
        expireat = getExpire(c->db,kv[j]);
        if (expireat != -1) {
            ttl = expireat-mstime();
            if (ttl < 1) ttl = 1;
        }
        serverAssertWithInfo(c,NULL,rioWriteBulkCount(&cmd,'*',replace ? 5 : 4));
        if (server.cluster_enabled)
            serverAssertWithInfo(c,NULL,
                rioWriteBulkString(&cmd,"RESTORE-ASKING",14));
        else
            serverAssertWithInfo(c,NULL,rioWriteBulkString(&cmd,"RESTORE",7));
        serverAssertWithInfo(c,NULL,sdsEncodedObject(kv[j]));
        serverAssertWithInfo(c,NULL,rioWriteBulkString(&cmd,kv[j]->ptr,
                sdslen(kv[j]->ptr)));
        serverAssertWithInfo(c,NULL,rioWriteBulkLongLong(&cmd,ttl));

        /* Emit the payload argument, that is the serialized object using
         * the DUMP format. */
        createDumpPayload(&payload,ov[j]);
        serverAssertWithInfo(c,NULL,
            rioWriteBulkString(&cmd,payload.io.buffer.ptr,
                               sdslen(payload.io.buffer.ptr)));
        sdsfree(payload.io.buffer.ptr);

        /* Add the REPLACE option to the RESTORE command if it was specified
         * as a MIGRATE option. */
        if (replace)
            serverAssertWithInfo(c,NULL,rioWriteBulkString(&cmd,"REPLACE",7));
    }

6.提PR?

去github看一眼最新的代码,发现就在几天前的12.14号被一个@badboy发现并fix了，好悲伤~

https://github.com/antirez/redis/pull/3673/files

分布式微服务技术，模拟面试与解答。RabbitMQ（五） zxb11c rabbitmq 分布式
分布式微服务技术，模拟面试与解答。Consul（一）分布式微服务技术，模拟面试与解答。Ocelot（二）分布式微服务技术，模拟面试与解答。Redis（三）分布式微服务技术，模拟面试与解答。MongoDB（四）分布式微服务技术，模拟面试与解答。RabbitMQ（五）分布式微服务技术，模拟面试与解答。Nacos（六）分布式微服务技术，模拟面试与解答。ELK（七）分布式微服务技术，模拟面试与解答。Sky
面试官：Redis中大Key怎么删除？后端go面试问题
首先来看一下该岗位的职责和要求：岗位职责负责公司旗下产品的全新需求开发负责公司中台系统管理系统开发开发临时性工具和数据处理工作设计开发可复用模块，提高开发效率节省维护成本保质保量的完成上级领导安排的技术相关工作任职要求本科以上学历，计算机相关专业优先，3年左右Golang开发经验，有PHP转Go项目经验者优先熟练掌握Golang/PHP语言，熟悉至少一种Golang框架熟练掌握关系型数据库Mysq
SAP FSM 学习笔记(一) : 使用API消费FSM的数据
在SAP项目实施中，Brownfield场景是一种迁移策略，尤其用于从SAPERP系统升级到SAPS/4HANA的过程中。Brownfield方法可以理解为“系统转换”模式，它是指在现有系统基础上进行优化和转换，而不是从头开始构建一个全新系统。这种策略可以让企业保留现有的业务流程和系统配置，最大程度地降低业务中断风险，同时利用S/4HANA提供的新功能来实现企业数字化转型。
分布式微服务搭建 Xi-Tong 微服务架构云原生 linux centos bash jdk
分布式微服务架构搭建（举出一个项目搭建的例子，其他项目可参考本文档）基于Nginx作为web服务器、JDK作为Java运行环境、MySQL作为关系型数据库、Nacos作为服务发现和配置中心、Maven作为项目管理工具、Redis作为缓存和消息中间件（视具体需求而定）、Node.js与npm作为某些微服务（如前端服务或特定业务逻辑服务）的开发和依赖管理工具，可以搭建一个完整的分布式微服务架构项目。以
为什么redis会开小差？Redis 频繁异常的深度剖析与解决方案磐基Stack专业服务团队 redis 数据库缓存
文章目录导读为什么redis会开小差？1.连接数过多2.bigkey3.慢命令操作4.内存策略不合理5.外部数据双写一致性6.保护机制未开启7.数据集中过期8.CPU饱和9.持久化阻塞10.网络问题结论导读提起分布式缓存，想必大多数同学脑海中都会浮出redis这个名字来……但是，对于它，你真的玩转了吗？为什么你的redis会慢，会卡顿，会崩溃？现在带你一探究竟。为什么redis会开小差？本文主要简
缓存-Redis-数据结构-redis哪些数据结构是跳表实现的? 看个人简介有交流群(付费) Redis 缓存 redis 数据结构
在Redis中，跳表（SkipList）被用于实现有序集合（SortedSet）数据结构。以下是对此实现的详细解释：Redis中的有序集合（SortedSet）有序集合（SortedSet），简称ZSET，是一种将成员与分数（score）关联的集合，成员按照分数的升序或降序排列。与普通集合不同，有序集合中的每个成员都是唯一的，并且可以通过分数进行高效的排序和范围查询。内部实现Redis中的有序集合
Kubernetes网络 qichengzong_right linux kubernetes 云原生 linux 云原生 kubernetes
Kubernetes网络Kubernetes网络模型相关概念链接Kubernetes网络模型Kubernetes网络模型由多个关键部分构建而成：在Kubernetes集群中，每个Pod都会被分配一个独一无二的、在集群范围内有效的IP地址。Pod拥有自己独立的私有网络命名空间，该命名空间由Pod内的所有容器共享。这意味着，在同一Pod中运行的不同容器进程能够通过localhost进行便捷的相互通信。
Spring集成Redis｜通用Redis工具类里昂(Leon) 工具类目 spring redis spring boot
一、基础使用概述在SpringBoot中一般使用RedisTemplate提供的方法来操作Redis。那么使用SpringBoot整合Redis需要那些步骤呢。1、JedisPoolConfig(这个是配置连接池)2、RedisConnectionFactory这个是配置连接信息，这里的RedisConnectionFactory是一个接口，我们需要使用它的实现类。3、RedisTemplate基
[4-3-2].Redis笔记 1.01^1000 七中间件 redis 数据库
后端学习大纲第1步：Redis初识[0401].第01节：Redis初识[0402].第02节：Redis配置文件第2步：搭建单点环境[0403].第03节：在Linux环境中搭建Redis6.2.8环境[0404].第04节：在Linux环境中搭建Redis7.0.0环境(与6.2.8过程类似)第3步：Redis开发操作：3.1.数据类型介绍：[0409].第09节：Redis中的键（KEY）常
y98.第六章微服务、服务网格及Envoy实战 -- 集群管理(九) Raymond运维云原生-微服务治理企业实战 (已完结)microservices envoy 运维云计算云原生
8.集群管理8.0本节话题集群管理器与服务发现机制主动健康状态检测与异常点探测负载均衡策略分布式负载均衡负载均衡算法：加权轮询、加权最少连接、环哈希、磁悬浮和随机等；区域感知路由全局负载均衡位置优先级位置权重均衡器子集熔断和连接池8.1集群管理器（ClusterManager）Envoy支持同时配置任意数量的上游集群，并基于ClusterManager管理它们；ClusterManager负责为集
【前端js】 indexedDB Nosql的使用方法 Loong_DQX 前端 javascript nosql indexedDB
一、背景Redis的数据存储位置是在服务器内存中，它的目的是是获取数据更快；indexedDB是在客户端的本地存储中，它想要解决的问题是存储更多的数据，相较于localStorage、sessionStorage。这篇文章想讲的是indexedDB，用于将网页中所要用到的数据存储在本地中，使用索引实现对数据的高性能搜索。二、indexedDB数据库2.1indexedDB的特点非关系型数据库：数据
自动驾驶中的虚实迁移学习:降低对真实世界数据的依赖 AI架构设计之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
自动驾驶,迁移学习,虚实环境,数据效率,深度学习,强化学习1.背景介绍自动驾驶技术作为人工智能领域的重要应用之一，其发展离不开海量真实世界驾驶数据。然而，收集和标注真实世界驾驶数据成本高昂，且存在安全隐患。因此，如何降低对真实世界数据的依赖，提高自动驾驶系统的训练效率和安全性，成为一个亟待解决的关键问题。虚实迁移学习(Virtual-to-RealTransferLearning)作为一种新兴的机
TiDB架构特性 #TiDB TiDB
文章目录TiDB整体架构TiDBServerPDServerTiKVServerTiSparkTiDBOperatorTiDB核心特性水平扩展高可用TiDB存储和计算能力存储能力-TiKV-LSM计算能力-TiDBServer总结TiDB整体架构 TiDB集群主要包括三个核心组件：TiDBServer，PDServer和TiKVServer。此外，还有用于解决用户复杂OLAP需求的TiSpark
TiDB分布式数据库架构与核心原理 AI天才研究院 Python实战深度学习实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介TiDB是PingCAP公司2017年开源的分布式HTAP（HybridTransactional/AnalyticalProcessing）数据库产品，其目标是在强一致性、高性能和易用性之间找到平衡点。TiDB的特点是融合了传统的RDBMS和NoSQL的最佳特性，具备水平扩展能力、高可用特性、强一致性和实时HTAP查询功能等优秀特性。本文从整体架构、集群设计、
大数据学习（七）Python3操作livy（使用pylivy模块）猪笨是念来过倒大数据大数据 python
Livy是一个用于与Spark交互的开源REST接口。pylivy是Livy的Python客户端，可以在Spark集群上轻松实现远程代码执行。安装$pipinstall-Ulivy请注意，pylivy需要Python3.6或更高版本。用法所述LivySession类的主界面提供由pylivy：from
Kubectl常用命令操作 _Eden_ linux 运维服务器
kubectl命令格式：kubectlcommandtypenamecommand:表示子命令，用于操作kubernetes的集群资源对象，如：createdeletedescribegetapplytype:资源对象的类型name:资源对象的名称1.创建资源对象kubectlcreate-fmy-service.yaml表示根据yaml配置文件创建service2.查看资源对象kubectlge
Zookeeper（23）Zookeeper的选举机制是什么？辞暮尔尔-烟火年年微服务 zookeeper 分布式云原生
Zookeeper的选举机制是确保在集群中始终有一个唯一的Leader。Leader负责处理所有的写请求和协调事务的提交，而Follower负责处理读请求和转发写请求给Leader。选举机制的核心是ZookeeperAtomicBroadcast(Zab)协议，它确保在发生节点故障或网络分区时，能够快速而可靠地选出新的Leader。Zookeeper选举机制详细介绍初始选举：当Zookeeper集
第二章 SpringBoot快速开发框架 - Mysql数据源配置暗夜91 Spring Boot快速开发基础框架 mysql spring boot java
作者简介：作者：暗夜91个人主页：暗夜91的主页如果感觉文章写的还有点帮助，请帮忙点个关注，我会持续输出高质量技术博文。专栏文章:1、集成Swagger，生成API文档2、Mysql数据源配置3、集成Redis4、SpringSecurity+JWT实现登录权限认证5、跨域配置专栏源码：针对该专栏功能，对源码进行整理，可以直接下载运行。源码下载请移步：SpringBoot快速开发框架一、数据源配置
在K8S中，如果后端NFS存储的IP发送变化如何解决？ Dusk_橙子 K8S kubernetes tcp/ip 容器
在Kubernetes中，如果后端NFS存储的IP地址发生了变化，您需要更新与之相关的PeristentVolume(PV)或PersistentVolumeClaim(PVC)以及StorageClass中关于NFS服务器IP的配置信息，确保K8S集群内的Pod能够正确连接到新的NFS存储位置。解决方案如下：更新PersistentVolume(PV)：如果你直接在PV中指定了NFS服务器的IP
cascading 入门（一） zhumin726
1cascading是什么cascading是一个架构在Hadoop上的API，用来创建复杂和容错数据处理工作流。它抽象了集群拓扑结构和配置来快速开发复杂分布式的应用，而不用考虑背后的MapReduce。Cascading目前依赖于Hadoop提供存储和执行架构，但是CascadingAPI为开发者隔离了Hadoop的技术细节，提供了不需要改变初始流程工作流定义就可以在不同的计算框架内运行的能力。
Redisson 实现分布式锁程序员jin 编程开发数据库分布式数据库 redis
文章目录一.锁介绍二.什么是分布式锁三.为什么需要分布式锁四.分布式锁实现五.分布式锁注意事项六.看门狗机制七.Redisson实现分布式锁一.锁介绍单机锁：用于一台服务器的同步执行。分布式锁：用于多台服务器之间的同步执行。有限资源的情况下，控制同一时间（段）只有某些线程（用户/服务器）能访问到资源。Java实现锁：synchronized关键字、并发包的类。Javasynchronized实现锁
tensorflow-迁移学习使用Resnet残差网络实现猫狗分类问题浮夸 tensorflow python
遇到的bug都放在之前的文章里了importosimportpandasaspdimportwarningsimporttensorflowastffromtensorflow.pythonimportkerasfromkeras.preprocessing.imageimportImageDataGeneratorimportkeras.optimizersasopfromtensorflow.
滚雪球学Redis[4.1讲]：Redis的高可用性与集群架构 bug菌¹ #滚雪球学Redis redis 架构数据库
全文目录：前言1.Redis主从复制主从复制的概念与原理设置主从复制的步骤主从复制中的常见问题与解决方法2.RedisSentinelSentinel的工作原理Sentinel的配置与使用高可用架构下的故障转移3.RedisClusterCluster模式的架构与原理Cluster的配置与使用分片与槽位的管理集群管理中的常见问题与优化小结下期预告前言在上一期内容【第三章：Redis的持久化机制】中
架构学习第四周--高可用与NoSQL数据库 Mr.王835 nosql linux
目录一、HAProxy介绍二、HAProxy基本使用2.1，HAProxy调度算法2.2，HAProxy高级用法三、高可用Keepalived介绍3.1，Keepalived介绍3.2，Keepalived单主架构实现3.3，脑裂四、Keepalived实例--实现单主架构的LVS-DR模型五、实例--通过Keepalived实现HAProxy高可用六、NoSQL数据库Redis6.1，Redis
GPU 集群和分布式计算 AI天才研究院计算 AI大模型企业级应用开发实战大数据AI人工智能 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
《GPU集群和分布式计算》关键词：GPU集群、分布式计算、CUDA、OpenACC、OpenMP、性能优化、故障处理、案例分析摘要：本文详细探讨了GPU集群和分布式计算的基本概念、架构、编程模型以及应用场景。通过剖析GPU集群在多个领域的实际应用，探讨了性能优化和故障处理的方法，并提供了若干案例以加深理解。文章旨在为读者提供一个全面而深入的GPU集群和分布式计算的知识框架。《GPU集群和分布式计算
360智算中心万卡GPU集群架构分析科技互联人生科技数码人工智能硬件架构系统架构人工智能
360智算中心：万卡GPU集群落地实践 360智算中心是一个融合了人工智能、异构计算、大数据、高性能网络、AI平台等多种技术的综合计算设施，旨在为各类复杂的AI计算任务提供高效、智能化的算力支持。360智算中心不仅具备强大的计算和数据处理能力，还结合了AI开发平台，使得计算资源的使用更加高效和智能化。360内部对于智算中心的核心诉求是性能和稳定性，本文将深入探讨3
K8S中ingress详解元气满满的热码式 kubernetes 容器云原生
Ingress介绍Kubernetes集群中，服务（Service）是一种抽象，它定义了一种访问Pod的方式，无论这些Pod如何变化，服务都保持不变。服务可以被映射到一个静态的IP地址（ClusterIP）、一个NodePort（在集群的每个节点上的特定端口）、一个LoadBalancer（通过云服务提供商的负载均衡器）或一个外部IP。Service的两种服务暴露方式，NodePort和LoadB
Linux 时间同步服务不想起昵称929 linux
时间同步:多主机协作工作时，各个主机的时间同步很重要，时间不一致会造成很多重要应用的故障，如:加密协议，日志，集群等，利用NTP(NetworkTimeProtocol)协议使网络中的各个计算机时间达到同步。目前NTP协议属于运维基础架构中必备的基本服务之一时间同步实现:ntp，chrony//关闭系统同步时间服务timedatectlstopchronyd.servicentp:将系统时钟和世界
【Redis】golang操作Redis基础入门 m0_74825360 面试学习路线阿里巴巴 redis golang 数据库
【Redis】golang操作Redis基础入门大家好我是寸铁??总结了一篇【Redis】golang操作Redis基础入门sparkles:喜欢的小伙伴可以点点关注??Redis的作用Redis（RemoteDictionaryServer）是一个开源的内存数据库，它主要用于存储键值对，并提供多种数据结构的支持。Redis的主要作用包括：1.缓存:Redis可以作为缓存系统，将常用的数据缓存在内
HAProxy集群与常见的Web集群软件调度器对比 EsDeath_99 java 服务器 linux
一、Web集群调度器1.常见的Web集群调度器常用的Web集群调度器分为软件和硬件,负载均衡性能（硬件负载均衡器F5>LVS>Haproxy>Nginx）软件调度器（开源）1.LVS：性能最好，搭建复杂2.Nginx：性能较好，但集群节点健康检查功能不强，高并发性能较弱3.Haproxy：高并发性能好硬件调度器1.F52.梭子鱼、绿盟、F5、Array等2.常见集群调度器的优缺点（LVS、Ngin
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f