美码师

MongoDB-系统时钟跳变引发的风波

背景
一、对 oplog 的影响
- oplog 原理
二、主备倒换
小结

声明：本文同步发表于 MongoDB 中文社区，传送门：
http://www.mongoing.com/archives/26201

背景

在生产环境的部署中，由于各种不确定因素的存在(比如机器掉电、网络延迟等)，各节点上的系统时间很可能会出现不一致的情况。
对于MongoDB来说，时间不一致会对数据库的运行带来一些不可预估的风险，比如主从复制、定时调度都或多或少依赖于时间的取值及判断。

因此，在MongoDB集群中保持节点间的时间同步是一项重要的任务，这通常会使用一些NTP协调服务来实现。
通过人工执行的时间设定操作，或是NTP同步触发的校准，都会使当前的系统时间发生变化，这称之为时间跳变。
时间跳变对于正在运作的流程是存在影响的，尤其是副本集的复制、心跳机制。

接下来，将针对这些影响做一些分析。

一、对 oplog 的影响

oplog 原理

oplog 是主从数据复制的纽带，主节点负责将写入数据变更记录写入到 oplog 集合，备节点则负责从oplog 中拉取增量的记录进行回放。

一个典型的 oplog如下所示：

{
        "ts" : Timestamp(1560861342, 2),
        "t" : NumberLong(12),
        "h" : NumberLong("7983167552279045735"),
        "v" : 2,
        "op" : "d",
        "ns" : "app.T_AppInfo",
        "o" : {
                "_id" : ObjectId("5d08da9ebe3cb8c01ea48a25")
        }
}

字段说明

字段名	字段描述
ts	记录时间
h	记录的全局唯一标识
v	版本信息
op	操作类型(增删改查等)
ns	操作的集合
o	操作内容
o2	待更新的文档，仅 update 操作包含

关于 oplog 的结构可以参考这篇文章

其中，ts字段 实现日志拉取的关键，这个字段保证了 oplog是节点有序的，它的构成如下：

当前的系统时间，即UNIX时间至现在的秒数，32位
整数计时器，不同时间值会将计数器进行重置，32位

ts字段属于Bson的Timestamp类型，这种类型一般在 MongoDB内部使用。
既然 oplog 保证了节点有序，备节点便可以通过轮询的方式进行拉取，我们通过 db.currentOp()命令可以看到具体的实现：

db.currentOp({"ns" : "local.oplog.rs"})
>
{
    "desc" : "conn611866",
    "client" : "192.168.138.77:51842",
    "clientMetadata" : {
            "driver" : {
                    "name" : "NetworkInterfaceASIO-RS",
                    "version" : "3.4.10"
            }
    },
    "active" : true,
    "opid" : 20648187,
    "secs_running" : 0,
    "microsecs_running" : NumberLong(519601),
    "op" : "getmore",
    "ns" : "local.oplog.rs",
    "query" : {
            "getMore" : NumberLong("16712800432"),
            "collection" : "oplog.rs",
            "maxTimeMS" : NumberLong(5000),
            "term" : NumberLong(2),
            "lastKnownCommittedOpTime" : {
                    "ts" : Timestamp(1560842637, 2),
                    "t" : NumberLong(2)
            }
    },
    "originatingCommand" : {
            "find" : "oplog.rs",
            "filter" : {
                    "ts" : {
                            "$gte" : Timestamp(1560406790, 2)
                    }
            },
            "tailable" : true,
            "oplogReplay" : true,
            "awaitData" : true,
            "maxTimeMS" : NumberLong(60000),
            "term" : NumberLong(2),
            "readConcern" : {
                    "afterOpTime" : {
                            "ts" : Timestamp(1560406790, 2),
                            "t" : NumberLong(1)
                    }
            }
    },
    "planSummary" : "COLLSCAN",
}

可见，副本集的备节点是通过 ts字段不断进行增量拉取，来达到同步的目的。

图-oplog 拉取

接下来，看一下oplog与系统时间的对应关系，先通过mongo shell 写入一条数据，查看生成的oplog

shard0:PRIMARY> db.test.insert({"justForTest": true})
shard0:PRIMARY> db.getSiblingDB("local").oplog.rs.find({ns: "test.test"}).sort({$natural: -1}).limit(1).pretty()
{
        "ts" : Timestamp(1560842490, 2),
        "t" : NumberLong(2),
        "h" : NumberLong("-1966048951433407860"),
        "v" : 2,
        "op" : "i",
        "ns" : "test.test",
        "o" : {
                "_id" : ObjectId("5d088723b0a0777f7326df57"),
                "justForTest" : true
        }
}

此时的 ts=Timestamp(1560842490, 2)，将它转换为可读的时间格式：

shard0:PRIMARY> new Date(1560842490*1000)
ISODate("2019-06-18T07:21:30Z")

同时，我们查看系统当前的时间，可以确定 oplog的时间戳与系统时间一致。

# date '+%Y-%m-%d %H:%M:%S'
2019-06-18 07:21:26

接下来，测试时间跳变对于oplog的影响

由于 oplog 是主节点产生的，下面的测试都基于主节点进行

A. 时间向后跳变

在主节点上将时间往后调整到 9:00，如下：

# date -s 09:00:00
Tue Jun 18 09:00:00 UTC 2019

写入一条测试数据，检查oplog的时间戳：

shard0:PRIMARY> db.test.insert({"justForTest": true})
shard0:PRIMARY> db.getSiblingDB("local").oplog.rs.find({ns: "test.test"}).sort({$natural: -1}).limit(1).pretty()
{
        "ts" : Timestamp(1560848723, 1),
        "t" : NumberLong(4),
        "h" : NumberLong("-6994951573635880200"),
        "v" : 2,
        "op" : "i",
        "ns" : "test.test",
        "o" : {
                "_id" : ObjectId("5d08a953b9963dbc8476d6b7"),
                "justForTest" : true
        }
}

shard0:PRIMARY> new Date(1560848723*1000)
ISODate("2019-06-18T09:05:23Z")

可以发现，随着系统时间往后调整之后，oplog的时间戳也发生了同样的变化。

B. 时间向前跳变

继续这个测试，这次在主节点上将时间往前调整到 7:00，如下：

host-192-168-138-148:~ # date -s 07:00:00
Tue Jun 18 07:00:00 UTC 2019

写入一条测试数据，检查oplog的时间戳：

shard0:PRIMARY> db.test.insert({"justForTest": true})
shard0:PRIMARY> db.getSiblingDB("local").oplog.rs.find({ns: "test.test"}).sort({$natural: -1}).limit(1).pretty()
{
        "ts" : Timestamp(1560848864, 92),
        "t" : NumberLong(4),
        "h" : NumberLong("3290816976088149103"),
        "v" : 2,
        "op" : "i",
        "ns" : "test.test",
        "o" : {
                "_id" : ObjectId("5d088c1eb9963dbc8476d6b8"),
                "justForTest" : true
        }
}
shard0:PRIMARY> new Date(1560848864*1000)
ISODate("2019-06-18T09:07:44Z")

问题出现了，当时间向前跳变的时候，新产生的oplog时间戳并没有如预期一样和系统时间保持一致，而是停留在了时间跳变前的时刻！
这是为什么呢？

我们在前面提到过，oplog需要保证节点有序性，这分别是通过Unix时间戳(秒)和计数器来保证的。
因此，当系统时间值突然变小，就必须将当前时刻冻结住，通过计数器(Term)自增来保证顺序。

这样就解释了oplog时间戳停顿的问题，然而，新问题又来了：

计数器是有上限的，如果时间向前跳变太多，或者是一直向前跳变，导致计数器溢出怎么办呢？

从保证有序的角度上看，这是不被允许的，也就是当计数器(Term)溢出后将再也无法保证有序了。
从MongoDB 3.4的源码中，可以看到对应的实现如下：

global_timestamp.cpp


//获取下一个时间戳
Timestamp getNextGlobalTimestamp(unsigned count) {

    //系统时间值
    const unsigned now = durationCount(
        getGlobalServiceContext()->getFastClockSource()->now().toDurationSinceEpoch());
    ...
    // 对当前上下文的Timestamp 自增计数
    auto first = globalTimestamp.fetchAndAdd(count);
    auto currentTimestamp = first + count;  // What we just set it to.
    unsigned globalSecs = Timestamp(currentTimestamp).getSecs();

    // 若上下文时间大于系统时间，且同一时刻的计数器 超过2^31-1(2147483647)时，进行报错
    if (MONGO_unlikely(globalSecs > now) && Timestamp(currentTimestamp).getInc() >= 1U << 31) {
        mongo::severe() << "clock skew detected, prev: " << globalSecs << " now: " << now;
        fassertFailed(17449);
    }

从代码上看，计数器在超过21亿后会发生溢出，该时间窗口的计算参考如下：

假设数据库吞吐量是1W/s，不考虑数据均衡等其他因素的影响，每秒钟将需要产生1W次oplog，那么窗口值为：

(math.pow(2,31)-1)/10000/3600 = 59h

也就是说，我们得保证系统时间能在59个小时内追赶上最后一条oplog的时间。

二、主备倒换

在副本集的高可用架构中，提供了一种自动Failover机制，如下：

图-Failover

简单说就是节点之间通过心跳感知彼此的存在，一旦是备节点感知不到主节点，就会重新选举。
在实现上，备节点会以一定间隔(大约2s)向其他节点发送心跳，同时会启动一个选举定时器，这个定时器是实现故障转移的关键：

选举定时器的预设时间被设为10s(实际值为10-12s之间)，
在定时器时间到达时会触发一个回调函数，这个函数中备节点会主动发起选举，并接管主节点的角色。
每次向主节点心跳成功后都会取消选举定时器的执行，并重新发起新的选举定时器

因此，在正常情况下主节点一直是可用的，选举定时器回调会被一次次的取消，而只有在异常的情况下，备节点才会主动进行"夺权"，进而发生主备切换。

那么，接着上面的问题，系统时间的跳变是否会影响这个机制呢？我们来做一下测试：

自动Failover的逻辑由备节点主导，因此下面的测试都基于备节点进行

A. 时间向前跳变

我们在备节点上将时间调前一个小时，如下：

# date
Tue Jun 18 09:00:12 UTC 2019
# date -s 08:00:00
Tue Jun 18 08:00:00 UTC 2019

然后通过db.isMaster()检查主备的关系：

shard0:SECONDARY> db.isMaster()
{
        "hosts" : [
                "192.168.138.77:30071",
                "192.168.138.148:30071",
                "192.168.138.55:30071"
        ],
        "setName" : "shard0",
        "setVersion" : 1,
        "ismaster" : false,
        "secondary" : true,
        "primary" : "192.168.138.148:30071",
        "me" : "192.168.138.55:30071",
        ...
        "readOnly" : false,
        "ok" : 1
}

=== 没有发生变化，仍然是备节点

shard0:SECONDARY>

结果是在时间往前调整后，主备关系并没有发生变化，从日志上也没有发现任何异常。

B. 时间向后跳变

接下来，在这个备节点上将时间往后调一个小时，如下：

# date
Tue Jun 18 08:02:45 UTC 2019
# date -s 09:00:00
Tue Jun 18 09:00:00 UTC 2019

这时候进行检查则发现了变化，当前的备节点成为了主节点！


shard0:SECONDARY> db.isMaster()
{
        "hosts" : [
                "192.168.138.77:30071",
                "192.168.138.148:30071",
                "192.168.138.55:30071"
        ],
        "setName" : "shard0",
        "setVersion" : 1,
        "ismaster" : true,
        "secondary" : false,
        "primary" : "192.168.138.55:30071",
        "me" : "192.168.138.55:30071",
        "electionId" : ObjectId("7fffffff0000000000000008"),
        ...
        "readOnly" : false,
        "ok" : 1
}

=== 发生变化，切换为主节点

shard0:PRIMARY>

在数据库日志中，同样发现了发起选举的行为，如下：

I REPL     [ReplicationExecutor] Starting an election, since we've seen no PRIMARY in the past 10000ms
I REPL     [ReplicationExecutor] conducting a dry run election to see if we could be elected
I REPL     [ReplicationExecutor] VoteRequester(term 7 dry run) received a yes vote from 192.168.138.77:30071; response message: { term: 7, voteGranted: true, reason: "", ok: 1.0 }
I REPL     [ReplicationExecutor] dry election run succeeded, running for election
I REPL     [ReplicationExecutor] VoteRequester(term 8) received a yes vote from 192.168.138.77:30071; response message: { term: 8, voteGranted: true, reason: "", ok: 1.0 }
I REPL     [ReplicationExecutor] election succeeded, assuming primary role in term 8
I REPL     [ReplicationExecutor] transition to PRIMARY
I REPL     [ReplicationExecutor] Entering primary catch-up mode.
I REPL     [ReplicationExecutor] Caught up to the latest optime known via heartbeats after becoming primary.
I REPL     [ReplicationExecutor] Exited primary catch-up mode.
I REPL     [rsBackgroundSync] Replication producer stopped after oplog fetcher finished returning a batch from our sync source.  Abandoning this batch of oplog entries and re-evaluating our sync source.
I REPL     [SyncSourceFeedback] SyncSourceFeedback error sending update to 192.168.138.148:30071: InvalidSyncSource: Sync source was cleared. Was 192.168.138.148:30071
I REPL     [rsSync] transition to primary complete; database writes are now permitted
I REPL     [ReplicationExecutor] Member 192.168.138.148:30071 is now in state SECONDARY

确实，在备节点的系统时间往后跳变时，发生了主备切换！
那么问题出在哪里？是不是只要是时间往后调整就一定会切换呢？

下面，我们尝试从3.4的源代码中寻求答案：

选举定时器是由 ReplicationCoordinatorImpl这个类实现的，看下面这个方法：

代码位置：db/repl/replication_coordinator_impl_heartbeat.cpp***

void ReplicationCoordinatorImpl::_cancelAndRescheduleElectionTimeout_inlock() {

    //如果上一个定时器回调存在，则直接取消
    if (_handleElectionTimeoutCbh.isValid()) {
        _replExecutor.cancel(_handleElectionTimeoutCbh);
        ..
    }
    ...

    //触发调度，when时间点为 now + electionTimeout + randomOffset
    //到了时间就执行_startElectSelfIfEligibleV1函数，发起选举
    _handleElectionTimeoutCbh =
        _scheduleWorkAt(when,
             stdx::bind(&ReplicationCoordinatorImpl::_startElectSelfIfEligibleV1,this,
                  StartElectionV1Reason::kElectionTimeout));
}

ReplicationExecutor::_scheduleWorkAt 是定时器调度的入口，负责将定时器回调任务写入队列，如下：

代码位置：db/repl/replication_executor.cpp

StatusWith ReplicationExecutor::scheduleWorkAt(
    Date_t when, const CallbackFn& work) {
    stdx::lock_guard lk(_mutex);
    WorkQueue temp;
    StatusWith cbHandle = enqueueWork_inlock(&temp, work);
    ...

    WorkQueue::iterator insertBefore = _sleepersQueue.begin();
    //根据调度时间找到插入位置
    while (insertBefore != _sleepersQueue.end() && insertBefore->readyDate <= when)
        ++insertBefore;
    //将任务置入_sleepersQueue队列
    _sleepersQueue.splice(insertBefore, temp, temp.begin());
    ...
    return cbHandle;
}

对于队列任务的处理是在主线程实现的，通过getWork方法循环获取任务后执行：

//运行线程 -- 持续获取队列任务
void ReplicationExecutor::run() {
    ...
    //循环获取任务执行
    while ((work = getWork()).first.callback.isValid()) {
            //发起任务..
    }
}

//获取可用的任务
ReplicationExecutor::getWork() {
    stdx::unique_lock lk(_mutex);
    while (true) {
        //取当前时间
        const Date_t now = _networkInterface->now();
        //将_sleepersQueue队列中到时间的任务置入_readyQueue队列(唤醒)
        Date_t nextWakeupDate = scheduleReadySleepers_inlock(now);
        //存在任务执行，跳出循环
        if (!_readyQueue.empty()) {
            break;
        } else if (_inShutdown) {
            return std::make_pair(WorkItem(), CallbackHandle());
        }
        lk.unlock();
        //没有合适的任务，继续等待
        if (nextWakeupDate == Date_t::max()) {
            _networkInterface->waitForWork();
        } else {
            _networkInterface->waitForWorkUntil(nextWakeupDate);
        }
        lk.lock();
    }
    //返回待执行任务
    const WorkItem work = *_readyQueue.begin();
    return std::make_pair(work, cbHandle);
}

//将到时间的任务唤醒，写入_readyQueue队列
Date_t ReplicationExecutor::scheduleReadySleepers_inlock(const Date_t now) {
    WorkQueue::iterator iter = _sleepersQueue.begin();
    //从头部开始，找到最后一个调度时间小于等于当前时间(需要执行)的任务
    while ((iter != _sleepersQueue.end()) && (iter->readyDate <= now)) {
        auto callback = ReplicationExecutor::_getCallbackFromHandle(iter->callback);
        callback->_isSleeper = false;
        ++iter;
    }
    //转移队列
    _readyQueue.splice(_readyQueue.end(), _sleepersQueue, _sleepersQueue.begin(), iter);
    if (iter == _sleepersQueue.end()) {
        // indicate no sleeper to wait for
        return Date_t::max();
    }
    return iter->readyDate;
}

从上面的代码中，可以看到 scheduleReadySleepers_inlock 方法是关于任务执行时机判断的关键，在它的实现逻辑中，会根据任务调度时间与当前时间(now)的比对来决定是否执行。
关于当前时间(now)的获取则来自于AsyncTimerFactoryASIO的一个方法，当中则是利用 asio库的system_timer获取了系统时钟。

至此，我们基本可以确定了这个情况：
由于系统时间向后跳变，会导致定时器的调度出现误判，其中选举定时器被提前执行了！

更合理的一个实现应该是采用硬件时钟的周期而不是系统时间。

那么，剩下的一个问题是，系统时间是不是一旦向后跳就会出现切换呢？
根据前面的分析，每次心跳成功后都会启用这个选举定时器，触发的时间被设定在10-12s之后，而心跳的间隔是2s，
于是我们可以估算如下：

如果系统时间往后跳的步长能控制在 8s以内则是安全的，而一旦超过12s则一定会触发切换。

下面是针对步长测试的一组结果：

//往后切2s
date -s `date -d "2 second" +"%H:%M:%S"`
>> 结果：主备不切换

//往后切5s
date -s `date -d "5 second" +"%H:%M:%S"`
>> 结果：主备不切换

//往后切7s
date -s `date -d "7 second" +"%H:%M:%S"`
>> 结果：主备不切换

//往后切10s
date -s `date -d "10 second" +"%H:%M:%S"`
>> 结果：主备偶尔切换

//往后切13s
date -s `date -d "13 second" +"%H:%M:%S"`
>> 结果：主备切换

//往后切20s
date -s `date -d "20 second" +"%H:%M:%S"`
>> 结果：主备切换

小结

经过上面的一些测试和分析，我们知道了时间跳变对于副本集确实会造成一些问题：

对于oplog复制的影响，时间向前跳变会导致出现"计时器堆积"，如果未及时处理，将导致溢出从而引发错误；
对于自动Failover的影响，时间向后跳变则会造成干扰，很可能导致主备切换及业务的抖动。
尤其是第二点，MongoDB 3.4及以下版本都会存在该问题，而3.6/4.0 版本经验证已经解决。

那么，为了最大限度降低影响，提供几点建议：

分布式集群中务必采用可靠的NTP服务保证各节点上的时间同步，对于时间同步做好告警检测并保证能及时解决异常；
重大的时间校准，采用小步长(比如1分钟内3-5s)的方式逐步渐渐达到最终同步，这样可以避免主备切换产生的业务影响。
升级到3.6/4.0 或更新的版本来规避时间跳变导致选举的问题。

操作系统必备定义2.2 勤勉螺丝钉学习
2.2CPU调度CPU调度：是对CPU进行分配，即从就绪队列中按照一定的算法（公平高效的原则）选择一个进程，并将CPU分配给它运行，以实现进程并发的执行。CPU调度是多道程序操作系统的基础，是操作系统设计的核心问题。调度的层次：①高级调度（作业调度了）：按照某种规则，从外存上处于后备队列中的作业中挑选一个（或多个），给他（们）分配内存、I/O设备等必要的资源，并建立相应的进程，使他们获得竞争CPU
我的创作纪念日勤勉螺丝钉学习
手指轻敲键盘，一下又一下，思绪如潮水般涌来。我写了很多字，又反复斟酌，最终一个个删除。不是无话可说，而是想表达的太多，怕言语不够真挚，怕文字不够动人。官方提供的模板固然规范，但总觉得少了些属于自己的温度与风格。于是，我选择放下模板，回归内心，用最真诚的方式写下这段话。从开始创作至今，已经整整512天了。这五百多个日夜，有过迷茫、有过坚持、也有过收获。一路走来，我在CSDN这个知识平台上不断学习、不
php数据导出pdf文件 Z单单 pdf
一.导出pdf文件，首先要安装相关的类库文件，我用的是dompdf类库。1.安装类库文件：composerrequiredompdf/dompdf2.引入类库文件到你的控制器中，创建方法：publicfunctiongeneratePdf(){//你需要打印的查询内容$data=['name'=>'烦烦烦','content'=>'哈哈哈计划经济','img'=>'https:://www.tup
LangServer 与 Langgraph 融合架构：构建智能语言服务系统小赖同学啊人工智能架构
LangServer与Langgraph融合架构：构建智能语言服务系统LangServer（语言服务器协议）与Langgraph（语言图模型）的结合将创造新一代智能语言处理平台，实现从底层语言理解到高层应用服务的全链路增强。以下是深度技术方案：一、核心融合价值Langgraph语义理解知识图谱构建LangServer接口服务开发工具链业务系统实时反馈关键增强点：语义深度：Langgraph提供上下
[特殊字符] 分享裂变新姿势：用 UniApp + Vue3 玩转小程序页面分享跳转！ nbsaas-boot notepad++uniapp 小程序
在如今流量成本日益攀升的移动互联网时代，"用户分享拉新"成为了增长的重要策略。而微信小程序作为天然具备社交传播力的平台，提供了较完善的分享机制支持。本文将从实战角度出发，手把手教你如何使用uni-app+Vue3构建一个支持「页面级分享跳转」的微信小程序。无论你是做营销活动、邀请有奖，还是积分商城，掌握这套技能，都将助你轻松实现「分享裂变+定向跳转+追踪来源」。一、你将实现什么？在任意页面中添加“
ONLYOFFICE二次开发文档架构、集成和部署史剑咪Nessa
ONLYOFFICE二次开发文档架构、集成和部署【下载地址】ONLYOFFICE二次开发文档架构集成和部署ONLYOFFICE二次开发文档为开发者提供了全面的架构解析、集成指南和部署方案。通过深入剖析ONLYOFFICE的底层设计，开发者能够更好地理解其工作原理，为后续开发奠定坚实基础。集成篇详细介绍了如何将ONLYOFFICE无缝融入现有项目，涵盖接口调用和数据交互等关键步骤，确保功能顺利对接。
软件测试复习之单元测试雁于飞单元测试 log4j 功能测试课程设计笔记经验分享其他
一、单元测试基础概念1.定义与核心目标定义：对软件中的最小可测试单元（如函数、类方法）进行正确性验证的测试活动。核心目标：确保单元功能符合设计要求，发现代码逻辑错误、边界条件缺陷等。2.单元划分原则（作业手册单元4简答题）划分依据：程序模块的独立性（如单个函数、类的方法）。详细设计说明书中的模块划分。示例：函数intadd(inta,intb)可作为一个单元。类Calculator中的sqrt(d
数据结构学习之栈楼田莉子数据结构学习笔记算法数据结构 c语言
本篇博客我们将深入学习数据结构中栈与队列相关的内容作者的个人gitee：楼田莉子(riko-lou-tian)-Gitee.com目录概念栈的实现初始化销毁入栈判空出栈获取栈顶元素栈的有效元素个数源代码与栈相关的算法题（力扣）有效的括号编辑概念栈是一种特殊的线性表，只允许在固定的一端进行插入删除元素的操作。进行数据插入和删除操作的一端叫栈顶，另一端叫栈底。遵循“后进先出”的原则。下图就是对栈后进先
使用 Kafka 优化物流系统的实践与思考 nlog3n Java学习 kafka 分布式
使用Kafka优化物流系统的实践与思考在现代物流系统中，订单处理、仓储管理、运输调度等环节复杂且实时性要求高。为了满足异步解耦、高吞吐、高可用、事件驱动和数据可靠性等需求，Kafka作为分布式消息队列和流处理平台，成为了我们的首选。本文将分享我们在物流系统中使用Kafka的设计方案、优化实践以及遇到的问题和解决方案。一、系统背景和需求物流系统涉及多个业务模块，如订单处理、仓储管理、运输调度和状态跟
基于PLC的楼宇自动化监控系统方案大雨淅淅物联网大数据人工智能
目录一、系统概述二、系统组成三、功能模块四、系统优势五、系统实施步骤六、系统安全性与隐私保护七、结语一、系统概述本系统采用先进的PLC（可编程逻辑控制器）作为核心控制单元，旨在实现对楼宇内各项设施的自动化监控与管理。通过智能化的手段，提高楼宇的运行效率，确保环境的舒适性与安全性，同时达到节能减排的目的。二、系统组成PLC控制器：作为系统的大脑，负责接收传感器信号，处理数据，并发出控制指令给执行器。
Kafka 核心机制面试题--自问自答亲爱的非洲野猪 kafka 分布式
基础篇Q1:Kafka为什么能这么快？A:Kafka的高性能主要来自三大核心技术：零拷贝(Zero-Copy)：通过sendfile()系统调用，数据直接从磁盘到网卡，避免了内核态和用户态之间的多次拷贝页缓存(PageCache)：消息直接写入操作系统页缓存而非JVM内存，减少GC影响并利用OS缓存机制内存映射(mmap)：索引文件通过内存映射实现，操作内存即操作文件Q2:Kafka的存储结构是怎
python类的定义与使用菜鸟驿站2020 python
class01.py代码如下classTicket():#类的名称首字母大写#在类里定义的变量称为属性,第一个属性必须是selfdef__init__(self,checi,fstation,tstation,fdate,ftime,ttime,notes):self.checi=checiself.fstation=fstationself.tstation=tstationself.fdate
LangSmith 深度解析：构建企业级LLM应用的全生命周期平台小赖同学啊人工智能人工智能
LangSmith深度解析：构建企业级LLM应用的全生命周期平台LangSmith是LangChain生态系统中的核心组件，为LLM应用提供从开发到生产的全链路支持。以下是全面技术解析：一、核心架构设计应用层LangSmithSDK采集层处理引擎存储层分析层控制台监控告警1.分层架构详解层级组件功能技术栈应用层LLM应用业务逻辑执行LangChain,LangGraph采集层Tracer数据收集O
基于STM32的智能农业灌溉系统设计与实现 STM32发烧友 stm32 嵌入式硬件单片机
目录引言环境准备2.1硬件准备2.2软件准备系统架构与基础3.1控制系统架构3.2功能描述代码实现：实现智能农业灌溉系统4.1环境监测模块4.2灌溉控制模块4.3通信与远程监控实现4.4用户界面与数据可视化应用场景：农业灌溉与节水控制问题解决方案与优化收尾与总结1.引言随着农业现代化进程的推进，传统的灌溉方式逐渐无法满足节水、高效的需求。智能农业灌溉系统通过集成传感器、嵌入式控制技术和无线通信模块
基于STM32开发的智能花园灌溉系统 STM32发烧友 stm32 嵌入式硬件单片机
目录引言环境准备工作硬件准备软件安装与配置系统设计系统架构硬件连接代码实现系统初始化土壤湿度监测与处理灌溉控制与状态指示Wi-Fi通信与远程监控应用场景家庭花园智能灌溉农业田地的智能灌溉管理常见问题及解决方案常见问题解决方案结论1.引言随着智能家居技术的发展，智能花园灌溉系统逐渐成为家庭园艺和农业生产中提高水资源利用效率的重要工具。该系统通过集成土壤湿度传感器、雨滴传感器、Wi-Fi模块等硬件，实
Tensorflow 回归模型 FLASK + DOCKER 部署至 Ubuntu 虚拟机
准备工作：安装虚拟机，安装ubuntu，安装python3.x、pip和对应版本的tensorflow和其他库文件,安装docker。注意事项：1.windows系统运行的模型文件不能直接运行到虚拟机上，需在虚拟机上重新运行并生成模型文件2.虚拟机网络状态改为桥接Flask代码如下：fromflaskimportFlask,request,jsonifyimportpickleimportnump
基于PLC的智能楼宇控制系统设计（源码+万字报告+部署讲解等) 炳烛之明科技 PLC
目录摘要2第一章绪论51.1引言51.2智能楼宇的课题背景51.3智能楼宇的功能和优势6第二章智能楼宇系统总体方案确定72.1智能楼宇系统总体方案的设计72.1.1智能楼宇概述72.1.2智能楼宇的分类71、建筑设备自动化系统(BA)72、通讯自动化系统（CA）73、办公自动化系统（OA）74、火灾报警于消防联动自动化系统（FA）85、安全保卫自动化系统（SA）82.1.2总体控制方案的设计82.
Instrct-GPT 强化学习奖励模型 Reward modeling 的训练过程原理实例化详解 John_今天务必休息一天 2_大语言模型基础 #2.2 生成式预训练语言模型GPT gpt log4j 语言模型人工智能自然语言处理算法
Instrct-GPT强化学习奖励模型Rewardmodeling的训练过程原理实例化详解一、批次处理的本质：共享上下文的比较对捆绑（1）为什么同一prompt的比较对必须捆绑？（2）InstructGPT的优化方案二、输入输出与损失函数的具体构造（1）输入输出示例（2）人工标注数据的处理（3）损失函数的计算过程（4）反向传播的核心逻辑三、为什么不需要人工标注分值？（1）排序数据的天然属性（2）避
AI Agent开发第81课-企业AI落地15大陷阱与破局之道 TGITCIC AI Agent开发大全人工智能 AI落地企业AI落地大模型落地企业大模型落地
1.技术至上：忽视业务融合1.1业务需求驱动的本质AI项目的核心价值在于解决业务痛点，而非技术炫技。某银行通过成熟的人脸识别技术将坏账率降低15%，其成功源于对业务场景的精准把握。技术选择必须基于业务需求的优先级排序，而非单纯追求算法复杂度。当零售企业用AI优化供应链时，其目标是提升库存周转率0.5个百分点，而非发表顶会论文。1.2技术与业务的错位某科技公司投入千万研发智能客服系统，最终因响应准确
Kafka 核心原理篇：深入理解分布式消息系统的内核机制真实的菜 kafka 分布式 kafka linq
Kafka核心原理篇：深入理解分布式消息系统的内核机制文章目录Kafka核心原理篇：深入理解分布式消息系统的内核机制消息存储与持久化机制日志分段存储策略️**分段文件结构****索引机制详解**高效的磁盘读写与数据压缩算法**零拷贝技术（Zero-Copy）****数据压缩策略****页缓存优化**数据过期与清理策略⏰**基于时间的清理****基于大小的清理**️**日志压缩（LogCompact
STM32 驱动矩阵键盘详解与完整示例深入黑暗单片机开发 stm32 矩阵嵌入式硬件单片机驱动开发
STM32驱动矩阵键盘详解与完整示例矩阵键盘在嵌入式开发中是一种常见的输入设备，广泛应用于工业控制、人机界面、消费电子等领域。本文将详细介绍如何在STM32平台上驱动一个4x4矩阵键盘，涵盖原理分析、硬件连接、软件编程、防抖处理、问题排查与优化技巧等，适合初学者和进阶用户参考。一、矩阵键盘基本原理1.1什么是矩阵键盘？矩阵键盘是将按键按行列排布形成网格状结构的键盘，通过行线（Row）和列线（Col
基于土壤湿度信息的智能农田灌溉系统设计
自己淋过雨，想为你撑把伞之所以会把自己三年前的本科毕业设计发布至平台上，其主要原因是对自己以前的过往再做个总结。人生嘛，只有一路走来回头再看的时候，才会感慨万千，触目良多，时不时会想，到底什么样的结局才配得上我这二十几年的颠沛流离（狗头^_^）。个人强烈建议高中学弟学妹们一定要好好学习，考上一个都是传道授业()的好大学（表达的可能有些不妥，但懂得都懂……）。本文为2021年本人本科毕业设计。时间跨
Java面试题100道及答案编程大全面试题 java 开发语言
一、Java基础Java17中的sealed类和record类的作用和区别？答案：sealed类：限制继承关系，通过permits指定允许的子类。示例代码：publicsealedclassShapepermitsCircle,Square{...}；record类：不可变数据类，自动生成equals()、hashCode()和toString()。示例代码：publicrecordUser(St
为什么要使用消息队列？编程大全后端 rabbitmq rocketmq kafka 消息队列
总结一下，主要三点原因：解耦、异步、削峰。1、解耦。比如，用户下单后，订单系统需要通知库存系统，假如库存系统无法访问，则订单减库存将失败，从而导致订单操作失败。订单系统与库存系统耦合，这个时候如果使用消息队列，可以返回给用户成功，先把消息持久化，等库存系统恢复后，就可以正常消费减去库存了。2、异步。将消息写入消息队列，非必要的业务逻辑以异步的方式运行，不影响主流程业务。3、削峰。消费端慢慢的按照数
基于SpringBoot的餐厅点餐系统的设计与实现毕设小助手 spring boot 后端 java
收藏关注不迷路//项目拿到就可以直接使用，但是用于作业或者毕设需要自己懂代码之后进行自行修改//支持毕设定制//远程支持//可联系博主----------同类型文章可以联系博主----------争取每天三篇，有需要的用户可以关注查看哦~今日第三篇-发布的文章皆有源码，私信联系可获取源码~本项目设计与实施了一个基于SpringBoot的餐厅点餐系统，探讨了该系统在提高点餐效率、优化订单管理和提升顾
比斯特自动点焊机批发厂商概览
自动点焊机批发厂商主要集中于珠三角、长三角等制造业发达地区，如广东东莞、深圳及江苏无锡等地。这些厂商通过直销或供应链合作模式，为电子、汽车、电池等行业提供高性价比的自动化焊接设备，满足大规模生产需求。产品与技术特点批发厂商的产品涵盖多类点焊设备：精密电子点焊机：适用于微电子元件、漆包线、线路板焊接，强调高精度与无损伤加工。动力电池专用设备：如锂电池双面点焊机，支持18650/21700等电芯的高速
动力电池PACK线标配：18650电池自动点焊机的规模化应用 b***2511 人工智能大数据制造
在新能源汽车产业高速发展的背景下，动力电池作为核心部件，其生产效率与质量直接关系到整车的性能与市场竞争力。动力电池PACK线作为电池模组组装的关键环节，正经历着从手工操作向自动化、智能化转型的深刻变革。在这一进程中，18650电池自动点焊机凭借其高效、精准的特性，已成为动力电池PACK线的标配设备，推动着行业规模化应用的深入发展。在传统的动力电池组装过程中，电池极耳的焊接主要依赖手工操作，不仅效率
圆柱电池自动分选机：电池生产线的智能守护者 b***2511 大数据人工智能
在新能源产业的浪潮中，圆柱电池作为电动汽车、储能系统及各类便携式电子设备的核心能量单元，其性能与质量的优化成为了行业发展的关键。随着技术的不断进步和市场的日益成熟，圆柱电池的生产效率与品质要求也越来越高。而圆柱电池自动分选机，作为电池生产线上的关键设备，正以其高效、精准、智能的特点，成为提升电池生产效率与品质的重要力量。一、圆柱电池自动分选机的工作原理圆柱电池自动分选机主要利用先进的机器视觉技术和
AI掌柜失守记：AI Agent商业自动化边界实验 TGITCIC AI-大模型的落地之道 AI零售零售大模型 AI Agent AI大模型大模型AI AI落地 AI智能体
1.实验设计：数字掌柜接管实体货架1.1硬件载体与虚拟人格构建位于旧金山的实验场地被改造成微型零售生态系统：智能冰箱搭配商品篮构成实体货架，iPad自助结账系统连接Venmo支付接口，Slack通讯平台成为人机交互窗口。ClaudeSonnet3.7被赋予独立法人身份——Claudius，拥有电子邮箱、仓库地址和初始运营资金，其认知边界被限定在"自动售货机经营者"角色。1.2决策工具链的完整配置实
本地部署OpenHands AI助手，自动化编程提升开发效率
文章目录前言1、关于OpenHands2、部署OpenHands步骤3、简单使用openhands4、安装cpolar内网穿透5、配置公网地址6、配置固定二级子域名公网地址总结前言亲爱的朋友，是否曾在深夜面对层层叠叠的代码逻辑感到力不从心？每当调试器不断报错时，是否幻想过能有个智能伙伴分担压力？现在，一款颠覆传统开发模式的智能工具——OpenHands正式登场！这款专为开发者打造的AI助手，不仅具
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul