bd_zengxinxin

Mongodb源码分析--Replication之主从模式--Master

mongodb中提供了复制(Replication)机制，通过该机制可以帮助我们很容易实现读写分离方案，并支持灾难恢复（服务器断电）等意外情况下的数据安全。

      在老版本(1.6)中，Mongo提供了两种方式的复制：master-slave及replica pair模式（注:mongodb最新支持的replset复制集方式可看成是pair的升级版，它解决pair只能在两个结点间同步的限制，支持多个结点同步且支持主从宕机时的自动切换, 在1.6版以后提供）。


      利用前者，我们可以实现读写分离（主从复制模式），后者则支持当主服务器断电情况下的集群中其它slave自动接管，并升级为主服务器。并且如果后来的也出错了，那么master状态将会转回给第一个服务器（之前宕机但后来又恢复运行的服务器）。

同时mongodb支持使用安全认证（enable）。不管哪种replicate方式，只要在master/slave中创建一个能为各个database认识的用户名/密码即可。其认证过程如下：

 
       slave先在local.system.users里查找一个名为"repl"的用户，找到后用它去认证master。如果"repl"用户没有找到，则使用local.system.users中的第一个用户去认证。local数据库和admin数据库一样，local中的用户可以访问整个db server。 
  

   下面介绍分别介绍一下这两种复制的配置方式：

    Master-Slave(主从)模式:
   一个server可以同时为master和slave。一个slave可以有多个master（不推荐，可能会产生不可预期的结果）。

     配置选项：
   -- master  以主服务器方式启动
   -- slave   以从服务器方式启动
     -- autoresync：自动重新sync，因为该操作会copy 主服务器上的所有document，比较耗时，在10分钟内最多只会进行一次。
   -- oplogSize：指定master上用于存放更改的数据量，如果不指定，在32位机上最少为50M，在64位机上最少为 1G，最大为磁盘空间的5%。
   -- source  主服务器地址（与--slave组合使用）
   -- only    仅限于同步指定数据库（下面示例为test库）
   -- slavedelay  同步延时

      下面是本人在本地为了测试方便所使用的配置参数
        Master: IP->10.0.1.103

 
   mongod --dbpath=d:\mongodb\db --master --oplogSize 64 
  

Slave: IP->10.0.4.210

 
   mongod --dbpath=d:\mongodb\db --slave --source 10.0.1.103:27017 --only test --slavedelay 100 
  

 
       补充：受限的master-master复制，这种模式对插入、查询及根据_id进行的删除操作都是安全的。但对同一对象的并发更新无法进行。Mongo 不支持完全的master-master复制，通常情况下不推荐使用master-master模式，但在一些特定的情况下master-master也可用。master-master也只支持最终一致性。配置master-master只需运行mongod时同时加上--master选项和 --slave选项。如下：
      mongod --dbpath=d:\mongodb\db --port 27017 --master --slave --source localhost:27018
      mongod --dbpath=d:\mongodb\db --port 27018 --master --slave --source localhost:27017 
  

     Replica pairs模式
     以这种方式启动后，数据库会自动协商谁是master谁是slave。一旦一个数据库服务器断电，另一个会自动接管，并从那一刻起起为master。万一另一个将来也出错了，那么master状态将会转回给第一个服务器。以这种复制方式启动mongod的命令如下：
     配置选项：
      mongod --pairwith <remoteserver> --arbiter <arbiterserver>
      -- pairwith: remoteserver是pair里的另一个server
      -- arbiter: arbiterserver是一个起仲裁作用的Mongo数据库，用来协商pair中哪一个是master。arbiter运行在第三个机器上，利用“平分决胜制”决定在pair中的两台机器不能联系上对方时让哪一个做master，一般是能同arbiter通话的那台机器做master。如果不加--arbiter选项，出现网络问题时两台机器都作为master。
      注：可使用db.$cmd.findOne({ismaster:1})可以检查当前哪一个database是master。

     另外这种模式下的两台机器只能满足最终一致性。当replica pair中的一台机器完全挂掉时，需要用一台新的来代替。如(n1, n2)中的n2挂掉，这时用n3来代替n2。步骤如下：
      1. 告诉n1用n3来代替n2：db.$cmd.findOne({replacepeer:1});
      2. 重启n1让它同n3对话：mongod --pairwith n3 --arbiter <arbiterserver>
      3. 启动n3：mongod --pairwith n1 --arbiter <arbiterserver>。
     在n3的数据没有同步到n1前n3还不能做master，这个过程长短由数据量的多少决定。


     了解了复制模式之后，还有一个问题需要介绍一下，不是就是本文中mongodb使用cap collection来存储操作日志，并进而使用日志来复制(同步)结点间的数据，其中由主结点保存的操作的记录叫做oplog(operation log的简称)。

   Oplog存在一个叫local的特殊数据库中，在oplog.$main集合。Oplog中的每一个文档表示一个在主结点上执行的操作。文档主要包括4块内容，如下：

 
    Ts:操作的时间戳。时间戳类型是一个用来跟踪操作是何时执行的一种内部类型。它由4字节的时间戳和四字节的增量计数器组成。
  Op:执行的操作的类型，大小为1字节。（例如，“i”代表insert,"u":update, "d":delete, "n":none无操作等）
  Ns：执行操作的命名空间（集合名）
  O：执行操作的文档。对于插入，这是将要插入的文档。 
  

     另外这种日志只保存会“改变数据库状态”的操作。查询操作不会记录在oplog中。

   好了，了解这些知识之后，我们就来开始看一下如何调试master-slave模式的源码，首先要在vs2010中打开mongod项目，并将启动参数中设置如下：
      --master --oplogSize 64   （ master IP为10.0.1.103）

     如下图:

Mongodb源码分析--Replication之主从模式--Master_第1张图片

     之后编译该项目，启动该主服务结点，如下：



     接着我们可以在本地或另外一台机器上启动一个slave结点：

 
     mongod --dbpath=d:\mongodb\db --slave --source 10.0.1.103:27017 --only test --slavedelay 100 
  

下面介绍一下master（主服务端）的代码执行流程。首先我们打开instance.cpp文件，找到下面方法：

 
     
   
 
      
       // 
    instance.cpp
      
    // 
     Returns false when request includes 'end' 
    
  
         
    void 
     assembleResponse( Message  
    & 
    m, DbResponse  
    & 
    dbresponse,  
    const 
     SockAddr  
    & 
    client ) {
     ......
         
    if 
     ( op  
    == 
     dbQuery ) {
              
    if 
     ( handlePossibleShardedMessage( m ,  
    & 
    dbresponse ) )
                  
    return 
    ;
             receivedQuery(c , dbresponse, m );
         }
          
    // 
    服务端(master) 收到message执行相关查询操作 
    
  
             
    else 
      
    if 
     ( op  
    == 
     dbGetMore ) {
              
    if 
     (  
    ! 
     receivedGetMore(dbresponse, m, currentOp) )
                 log  
    = 
      
    true 
    ;
         }
     .....
     } 
   
 
     
   

   看过本系列开头那几篇BLOG的朋友，会看出上面方法其实在mongodb的crud操作中都会执行到，更多内容可以参见这篇BLOG，这里不再赘述。

   当slave 从结点发送同步复制请求时，master会执行上面的dbGetMore操作，从主库中的oplog中获取相应日志并返回给slave结点，下面是receivedGetMore()方法的具体实现：

 
     
   
 
         // 
    instance.cpp 
    
  
          
    bool 
     receivedGetMore(DbResponse 
    & 
     dbresponse, Message 
    & 
     m, CurOp 
    & 
     curop ) {
         StringBuilder 
    & 
     ss  
    = 
     curop.debug().str;
          
    bool 
     ok  
    = 
      
    true 
    ;
 
          
    // 
    参见：Mongodb源码分析--消息(message)中的 查询更多(document)消息结构相关内容
          
    // 
    http://www.cnblogs.com/daizhj/archive/2011/04/02/2003335.html 
    
  
            DbMessage d(m);
          
    // 
    完整的集合名称，形如:"dbname.collectionname" 
    
  
             
    const 
      
    char 
      
    * 
    ns  
    = 
     d.getns();
          
    // 
    返回的document数 
    
  
             
    int 
     ntoreturn  
    = 
     d.pullInt();
          
    // 
    在REPLY消息中的Cursor标识符，其必须来自于数据库 
    
  
             
    long 
      
    long 
     cursorid  
    = 
     d.pullInt64();
 
         ss  
    << 
     ns  
    << 
      
    " 
     cid: 
    " 
      
    << 
     cursorid;
          
    if 
    ( ntoreturn )
             ss  
    << 
      
    " 
     ntoreturn: 
    " 
      
    << 
     ntoreturn;
 
         time_t start  
    = 
      
    0 
    ;
          
    int 
     pass  
    = 
      
    0 
    ;
          
    bool 
     exhaust  
    = 
      
    false 
    ;
         QueryResult 
    * 
     msgdata; 
    // 
    查询结果 
    
  
             
    while 
    (  
    1 
     ) {
              
    try 
     {
                 readlock lk;
                 Client::Context ctx(ns);
                  
    // 
    执行GetMore查询 
    
  
                    msgdata  
    = 
     processGetMore(ns, ntoreturn, cursorid, curop, pass, exhaust);
             }
              
    catch 
     ( GetMoreWaitException 
    & 
     ) {
                 exhaust  
    = 
      
    false 
    ;
                 massert( 
    13073 
    ,  
    " 
    shutting down 
    " 
    ,  
    ! 
    inShutdown() );
                  
    if 
    ( pass  
    == 
      
    0 
     ) {
                     start  
    = 
     time( 
    0 
    );
                 }
                  
    else 
     {
                      
    if 
    ( time( 
    0 
    )  
    - 
     start  
    >= 
      
    4 
     ) {
                          
    // 
     after about 4 seconds, return.  this is a sanity check.  pass stops at 1000 normally
                          
    // 
     for DEV this helps and also if sleep is highly inaccurate on a platform.  we want to
                          
    // 
     return occasionally so slave can checkpoint. 
    
  
                            pass  
    = 
      
    10000 
    ;
                     }
                 }
                 pass 
    ++ 
    ;
                 DEV
                 sleepmillis( 
    20 
    );
                  
    else 
    
                     sleepmillis( 
    2 
    );
                  
    continue 
    ;
             }
              
    catch 
     ( AssertionException 
    & 
     e ) {
                 exhaust  
    = 
      
    false 
    ;
                 ss  
    << 
      
    " 
     exception  
    " 
      
    << 
     e.toString();
                 msgdata  
    = 
     emptyMoreResult(cursorid);
                 ok  
    = 
      
    false 
    ;
             }
              
    break 
    ;
         };
          
    // 
    将查询结果集绑定到message对象 
    
  
            Message  
    * 
    resp  
    = 
      
    new 
     Message();
         resp 
    -> 
    setData(msgdata,  
    true 
    );
         ss  
    << 
      
    " 
     bytes: 
    " 
      
    << 
     resp 
    -> 
    header() 
    -> 
    dataLen();
         ss  
    << 
      
    " 
     nreturned: 
    " 
      
    << 
     msgdata 
    -> 
    nReturned;
          
    // 
    将上面的消息对象指针绑定到dbresponse 
    
  
            dbresponse.response  
    = 
     resp;
         dbresponse.responseTo  
    = 
     m.header() 
    -> 
    id;
          
    if 
    ( exhaust ) {
             ss  
    << 
      
    " 
     exhaust  
    " 
    ;
             dbresponse.exhaust  
    = 
     ns;
         }
          
    return 
     ok;
     } 
   
 
     
   

可以看出，通过对message的解析找出相应的cursorid，因为mongodb如果发现游标为tailable(类型)时，会cache该cursor而不是关闭它，这主要是考虑到当下次slave请求来时，直接从cache中获取该cursor以提升效率并用它来作为继续获取后续oplog操作信息。上面方法在执行结束处会将获取到的oplog结果封装到message中并返回。但其如何获取，就要分析下面方法了：

 
      
    
 
          
     // 
     query.cpp 
     
  
          QueryResult 
     * 
      processGetMore( 
     const 
       
     char 
       
     * 
     ns,  
     int 
      ntoreturn,  
     long 
       
     long 
      cursorid , CurOp 
     & 
      curop,  
     int 
      pass,  
     bool 
     & 
      exhaust ) {
         exhaust  
     = 
       
     false 
     ;
          
     // 
     在map<CursorId, ClientCursor*>中查询相应游客信息 
     
  
             ClientCursor::Pointer p(cursorid);
          
     // 
     将结果返回（可能没找到） 
     
  
             ClientCursor  
     * 
     cc  
     = 
      p.c();
 
          
     int 
      bufSize  
     = 
       
     512 
     ;
          
     if 
      ( cc ) {
             bufSize  
     += 
       
     sizeof 
     ( QueryResult );
             bufSize  
     += 
      MaxBytesToReturnToClientAtOnce;
         }
          
     // 
     创建收集查询记录结果的buf对象 
     
  
             BufBuilder b( bufSize );
          
     // 
     跳过预留数据区间（QueryResult） 
     
  
             b.skip( 
     sizeof 
     (QueryResult));
 
          
     int 
      resultFlags  
     = 
      ResultFlag_AwaitCapable;
          
     int 
      start  
     = 
       
     0 
     ;
          
     int 
      n  
     = 
       
     0 
     ;
          
     // 
     判断cc是否有效(如未找到则无效) 
     
  
              
     if 
      (  
     ! 
     cc ) {
             log()  
     << 
       
     " 
     getMore: cursorid not found  
     " 
       
     << 
      ns  
     << 
       
     " 
       
     " 
       
     << 
      cursorid  
     << 
      endl;
             cursorid  
     = 
       
     0 
     ;
             resultFlags  
     = 
      ResultFlag_CursorNotFound;
         }
          
     else 
      {
              
     // 
     更新master结点local.slaves中的相应信息（包括lastop时间戳）
              
     // 
     注：主结点使用存储在local.slaves中的syncedTo来跟踪多少slave是已经更新的。 
     
  
                  
     if 
      ( pass  
     == 
       
     0 
      )
                 cc 
     -> 
     updateSlaveLocation( curop );
 
              
     int 
      queryOptions  
     = 
      cc 
     -> 
     queryOptions();
 
              
     if 
     ( pass  
     == 
       
     0 
      ) {
                 StringBuilder 
     & 
      ss  
     = 
      curop.debug().str;
                 ss  
     << 
       
     " 
      getMore:  
     " 
       
     << 
      cc 
     -> 
     query().toString()  
     << 
       
     " 
       
     " 
     ;
             }
              
     // 
     获取相应cursor，以便while遍历 
     
  
                 start  
     = 
      cc 
     -> 
     pos();
             Cursor  
     * 
     c  
     = 
      cc 
     -> 
     c();
             c 
     -> 
     checkLocation();
             DiskLoc last;
 
             scoped_ptr 
     < 
     Projection::KeyOnly 
     > 
      keyFieldsOnly;
              
     if 
      ( cc 
     -> 
     modifiedKeys()  
     == 
       
     false 
       
     && 
      cc 
     -> 
     isMultiKey()  
     == 
       
     false 
       
     && 
      cc 
     -> 
     fields )
                 keyFieldsOnly.reset( cc 
     -> 
     fields 
     -> 
     checkKey( cc 
     -> 
     indexKeyPattern() ) );
              
     // 
     遍历cursor，找到并封装相应查询结果给buf对象 
     
  
                  
     while 
      (  
     1 
      ) {
                  
     if 
      (  
     ! 
     c 
     -> 
     ok() ) { 
     // 
     到结尾 
     
  
                          
     if 
      ( c 
     -> 
     tailable() ) { 
     // 
     处理tailable情况
                          
     // 
     Tailable 表示在返回最后一条数据后，不要关闭当前 cursor。
                          
     // 
     这是因为系统考虑到稍后你可以再次使用该cursor.   
     
  
                              
     /* 
      when a tailable cursor hits "EOF", ok() goes false, and current() is null.  however
                            advance() can still be retries as a reactivation attempt.  when there is new data, it will
                            return true.  that's what we are doing here.
                             
     */ 
     
                          
     if 
      ( c 
     -> 
     advance() )
                              
     continue 
     ;
 
                          
     if 
     ( n  
     == 
       
     0 
       
     && 
      (queryOptions  
     & 
      QueryOption_AwaitData)  
     && 
      pass  
     < 
       
     1000 
      ) {
                              
     throw 
      GetMoreWaitException();
                         }
 
                          
     break 
     ;
                     }
                      
     // 
     释放cursor资源关闭它（执行delete操作） 
     
  
                         p.release();
                      
     bool 
      ok  
     = 
      ClientCursor::erase(cursorid);
                     assert(ok);
                     cursorid  
     = 
       
     0 
     ;
                     cc  
     = 
       
     0 
     ;
                      
     break 
     ;
                 }
                  
     // 
      如果是clone collection时，则不会匹配 
                     // If match succeeds on index key, then attempt to match full document. 
      
                     if 
      ( c 
     -> 
     matcher()  
     && 
       
     ! 
     c 
     -> 
     matcher() 
     -> 
     matches(c 
     -> 
     currKey(), c 
     -> 
     currLoc() ) ) {
                 }
                  
     /* 
     
                   TODO
                 else if ( _chunkMatcher && ! _chunkMatcher->belongsToMe( c->currKey(), c->currLoc() ) ){
                     cout << "TEMP skipping un-owned chunk: " << c->current() << endl;
                 }
                  
     */ 
     
                  
     else 
      { 
     // 
     值是否重复 
     
  
                          
     if 
     ( c 
     -> 
     getsetdup(c 
     -> 
     currLoc()) ) {
                          
     // 
     out() << "  but it's a dup \n"; 
     
  
                         }
                      
     else 
      { 
     // 
     如匹配 
     
  
                             last  
     = 
      c 
     -> 
     currLoc();
                         n 
     ++ 
     ;
                          
     // 
     装填数据到buf中 
     
  
                              
     if 
      ( keyFieldsOnly ) {
                             fillQueryResultFromObj(b,  
     0 
     , keyFieldsOnly 
     -> 
     hydrate( c 
     -> 
     currKey() ) );
                         }
                          
     else 
      {
                             BSONObj js  
     = 
      c 
     -> 
     current();
                              
     // 
      show disk loc should be part of the main query, not in an $or clause, so this should be ok 
     
  
                                 fillQueryResultFromObj(b, cc 
     -> 
     fields. 
     get 
     (), js, ( cc 
     -> 
     pq. 
     get 
     ()  
     && 
      cc 
     -> 
     pq 
     -> 
     showDiskLoc()  
     ? 
       
     & 
     last :  
     0 
     ));
                         }
 
                          
     if 
      ( ( ntoreturn  
     && 
      n  
     >= 
      ntoreturn )  
     || 
      b.len()  
     > 
      MaxBytesToReturnToClientAtOnce ) {
                             c 
     -> 
     advance();
                             cc 
     -> 
     incPos( n );
                              
     break 
     ;
                         }
                     }
                 }
                  
     // 
     指向下一条记录 
     
  
                     c 
     -> 
     advance();
 
                  
     if 
      (  
     ! 
      cc 
     -> 
     yieldSometimes() ) {
                     cc  
     = 
       
     0 
     ;
                      
     break 
     ;
                 }
             }
 
              
     if 
      ( cc ) {
                 cc 
     -> 
     updateLocation();
                 cc 
     -> 
     mayUpgradeStorage();
                  
     // 
     用last中的optime 更新_slaveReadTill 
     
  
                     cc 
     -> 
     storeOpForSlave( last );
                 exhaust  
     = 
      cc 
     -> 
     queryOptions()  
     & 
      QueryOption_Exhaust;
             }
         }
          
     // 
     将buf中的信息绑定到查询结果集 
     
  
             QueryResult  
     * 
     qr  
     = 
      (QueryResult  
     * 
     ) b.buf();
         qr 
     -> 
     len  
     = 
      b.len();
         qr 
     -> 
     setOperation(opReply);
         qr 
     -> 
     _resultFlags()  
     = 
      resultFlags;
         qr 
     -> 
     cursorId  
     = 
      cursorid;
         qr 
     -> 
     startingFrom  
     = 
      start;
         qr 
     -> 
     nReturned  
     = 
      n;
         b.decouple();
 
          
     return 
      qr;
     } 
    
 
      
    

上面代码有些长，但其目的很明确，就是针对指定的cursor进行遍历。这里mongodb会为每个slave保存一个cursor，并且其在遍历完成后将最后一条oplog的时间戳作为当前slave在local.slaves中的更新标识信息(syncedTo)，来标识当前slave的更新情况。（注：首次同步时全部复制会执行copyDatabase，复制master db上的所有document）。该方法运行截图如下：

另外需要解释的是，master结点貌似并不会使用slave发来的syncedTo来过滤capped collection中的旧oplog(指小于syncedTo时间戳)的数据，而是使用tailable类型的cursor来解决如果持续获取后续新增oplog操作信息。前者的主观臆测让我在源码中兜了一个圈子，因为我一直主观认为mongod会执行类似查询操作来过滤相应旧oplog的时间戳信息，并将结果集返回给slave端。现在看来master只是不断返回后续添加到cap collection中oplog（有可能是out of sync的情况而引发slave地点执行resync操作），而最终的过滤判断操作完全交给了slave端。这一点会在我下一篇文章中有所介绍。

好了，今天的内容到这里就告一段落了。在接下来的文章中，将会介绍slave端是如何发起同步操作，以及最终如何使用获取到的oplog来构造本机数据的。

参考链接：

http://www.mongodb.org/display/DOCS/Replication

http://www.mongodb.org/display/DOCS/Master+Slave

    http://www.snailinaturtleneck.com/blog/2010/10/12/replication-internals/
   http://www.snailinaturtleneck.com/blog/2010/10/14/getting-to-know-your-oplog/
   http://www.snailinaturtleneck.com/blog/2010/08/02/replica-sets-part-2-what-are-replica-sets/

   原文链接:http://www.cnblogs.com/daizhj/archive/2011/06/13/mongodb_sourcecode_repl_master_run.html

React 相关插件之 Redux 基本使用入门前端reactredux
引入和定义首先，你需要创建Store实例并暴露出来：//stores/login.store.jsconstloginInstance=(preState,action)=>{switch(action.type){//修改状态case"changeLoginState":preState.isLogin=action.loginFlag=='YES'?true:falsereturnpreSta
2025年毕设ssm校园二手交易平台论文+源码锦程学长--毕设程序课程设计
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容选题背景关于校园二手交易平台的研究，现有成果多集中于社会综合型平台（如闲鱼、转转）的商业模式分析，或理论层面的共享经济模型探讨，而针对高校场景特殊性（如用户密度高、交易标的额小、社交属性强）的垂直型平台研究存在明显缺口。当前高校内二手交易多依赖社群、论坛等分散渠道，存在信息不对称、交易
正则表达式全解程序喵；正则表达式 mysql 数据库 python java
Regexregularexpressions先理解什么是正则表达式,有什么用途理解:是表达一类串的抽象模式的串,来匹配字符串中符合模式的子串人话:举例,例如abc9,abcd9,a&*&%*()9,这三个字符串有相同的模式(人话来说就是他们有共同点):都以a开头,9结尾.正则表达式就能用来表示这种以a开头,9结尾的模式(共同点),来匹配这一类字符串.a开头,9结尾的模式用正则表达式表示就是:a.
奥林巴斯道Olympus DAO、奥拉丁模式、诺瓦银行、RWA模型合约解析开发白马区块Crypto100 web3 区块链区块链项目
关于OlympusDAO技术合约解析的文章草稿，整体结构偏向技术向，适合有一定DeFi或区块链背景的读者。你可以根据自己的需求微调。技术帮助“Crypto100”深入理解DeFi2.0的创新机制一、引言2021年，OlympusDAO凭借其颠覆性的机制和“协议拥有流动性”（Protocol-OwnedLiquidity,POL）概念引发了DeFi世界的巨大关注。它不是一个传统意义上的稳定币项目，而
软件设计师之树与二叉树：非线性数据结构的深度探索一杯年华@编程空间软考中级数据结构
软件设计师之树与二叉树：非线性数据结构的深度探索在软件开发领域，数据结构是程序设计的核心基础，其中树和二叉树作为重要的非线性数据结构，在众多场景中都有着广泛应用。我写这篇博客，就是希望和大家一起学习进步，深入解析树和二叉树的相关知识，用通俗易懂的语言结合图表和Java代码示例进行讲解，帮助大家更好地掌握这些内容。一、树的定义与基本概念树的定义树是由n（n≥0）个结点组成的有限集合。当n=0时，为空
深度学习-130-RAG技术之基于Anything LLM搭建本地私人知识库的应用策略问题总结(一) 皮皮冰燃深度学习深度学习人工智能 RAG
文章目录1AnythingLLM的本地知识库1.1本地知识库应用场景1.2效果对比及思考1.3本地体现在哪些方面1.3.1知识在本地1.3.2分割后的文档在本地1.3.3大模型部署运行在本地2问错问题带来的问题2.1常见的问题2.2原因分析3为什么LLM不使用我的文件？3.1LLM不是万能的【omnipotent】3.2LLM不会自省【introspect】3.3AnythingLLM是如何工作的
设备树学习（二十三、番外篇-中断子系统之softirq）奔跑的小刺猬设备树设备树原理和实现
既然开始学了，那么还是一次把中断的所有知识都系统的学一下。刚好有蜗窝大神的博客做指引。http://www.wowotech.net/irq_subsystem/soft-irq.html一、前言对于中断处理而言，linux将其分成了两个部分，一个叫做中断handler（tophalf），是全程关闭中断的，另外一部分是deferabletask（bottomhalf），属于不那么紧急需要处理的事情
http框架核心之ngx_http.c源码分析 qiuhui00 nginx源码分析 nginx 源码分析 http框架
ngx_http.c内主要实现了一个模块:ngx_http_module。ngx_http_module是nginx的http框架的一部分，它是所有http模块能够被加载的唯一入口，承担了http块配置解析，合并，以及http框架及其相关数据结构的初始化。它本身是NGX_CORE_MODULE类型，只有一个指令，就是http，如下所示:staticngx_command_tngx_http_com
密码安全：如何识别强弱密码，并打造铁壁防线！喵手零基础学Java 安全 php 开发语言
全文目录：开篇语前言：一场关于密码的角力赛目录密码的弱点：为什么弱密码是个大问题如何定义强密码？强密码的特点：举个例子：如何识别密码强弱？简单技巧帮你判断1.**密码长度：是否足够长？**示例代码演示代码解释：测试结果示例：2.**复杂度：是否包含特殊字符？**示例代码演示代码解释：测试结果示例：小结：3.**模式识别：是否包含常见模式？**️密码管理小技巧：打造更安全的数字生活1.**使用密码管
AXI总线之相关应用逾越TAO fpga开发硬件工程笔记
AXI总线作为现代SoC设计的核心互连协议，其应用场景极为广泛，覆盖移动设备、AI加速器、FPGA、存储控制器等多个领域。以下是AXI在不同应用中的关键角色及具体实现案例：一、移动处理器与SoC应用场景：智能手机、平板电脑的SoC（如高通骁龙、苹果A系列、华为麒麟）中，AXI用于连接多核CPU、GPU、ISP（图像信号处理器）、DDR控制器等模块。典型案例：ARMCortex-A系列多核集群：AX
NL2SQL 优化之 Schema 编写标准 kakaZhui oracle 数据库 AIGC python llama chatgpt
写在前面在自然语言转SQL（NL2SQL，或Text-to-SQL）任务中，数据库Schema的质量和表示方式对模型的性能有着至关重要的影响。一个清晰、规范、易于理解的Schema能够帮助模型更好地理解数据库结构，从而生成更准确的SQL查询。相反，一个混乱、不规范的Schema会增加模型的理解难度，导致生成的SQL查询错误百出。本文将深入探讨NL2SQL任务中Schema的编写标准，详细介绍如何为
Flink读取kafka数据并写入HDFS 王知无(import_bigdata) Flink系统性学习专栏 hdfs kafka flink
硬刚大数据系列文章链接：2021年从零到大数据专家的学习指南(全面升级版)2021年从零到大数据专家面试篇之Hadoop/HDFS/Yarn篇2021年从零到大数据专家面试篇之SparkSQL篇2021年从零到大数据专家面试篇之消息队列篇2021年从零到大数据专家面试篇之Spark篇2021年从零到大数据专家面试篇之Hbase篇
vue3当中使用Pinia的store的组件化开发模式堕落年代 vue vue.js
一、安装与初始化安装Pinianpminstallpinia#或yarnaddpinia目的：引入Pinia核心库，为状态管理提供基础支持。挂载Pinia实例在main.js中初始化并注入Vue应用：import{createApp}from'vue'import{createPinia}from'pinia'importAppfrom'./App.vue'constapp=createApp(A
Kafka系列之—向Kafka 写入数据（四）葛旭朋 Kafka kafka 分布式 java
一，创建Kafka生产者1.1必选的三个属性1.1.1bootstrap.servers指定broker的地址清单，不需要包含所有的broker地址，生产者会从给定的broker里找到其它broker的信息，建议最少提供两个broker的信息。1.1.2key.serializerbroker希望接收到的消息的键和值都是字节数组。1.1.3value.serializer指定的类会将值序列化。1.
机器学习之KMeans算法知舟不叙机器学习算法 kmeans
文章目录引言1.KMeans算法简介2.KMeans算法的数学原理3.KMeans算法的步骤3.1初始化簇中心3.2分配数据点3.3更新簇中心3.4停止条件4.KMeans算法的优缺点4.1优点4.2缺点5.KMeans算法的应用场景5.1图像分割5.2市场细分5.3文档聚类5.4异常检测6.Python实现KMeans算法7.总结引言KMeans算法是机器学习中最经典的无监督学习算法之一，广泛应
路由器的配置命令 yinyaoqi 路由器 interface cisco ios network 网络
路由命令十全大补router>enable从用户模式进入特权模式router#disableorexit从特权模式退出到用户模式router#showsessions查看本机上的TELNET会话router#disconnect关闭所有的TELNET会话router#showusers查看本机上的用户router#erasestartup-config删除NVRAM中的配置router#reloa
innovus命令每日精要 | setCheckMode：数字后端物理设计的必备神器数字后端物理设计知识库 innovus 命令每日精要后端性能优化
在数字后端物理设计的领域中，确保设计数据的完整性和正确性是至关重要的。今天，我们要深入探讨的是Innovus中的一个强大命令——setCheckMode。这个命令就像是你的设计流程中的“健康卫士”，能够在各个阶段帮你揪出潜在的数据问题，避免因小失大，让错误在流程中扩散。检查模式核心功能大揭秘1.设计数据完整性检查：全面扫描，无死角-all选项就像是给你的设计做一次“全身CT”，开启所有检查选项，确
Java集合之HashSet集合小白的编程日记 java java
文章目录前言一、HashSet集合特点二、HashSet集合的初始化三、HashSet集合中的成员方法1.添加集合元素2.删除集合元素3.查询集合元素4.修改集合元素5、其他成员方法四、集合的遍历总结前言HashSet集合继承了AbstractSet类，实现了Set接口。其框架图如下：一、HashSet集合特点存放单列元素，无序而且不重复。线程不安全，效率高。集合元素可以为null。没有下标，不可
深入理解 TypeScript 中的迭代器（Iterators）与生成器（Generators）念九_ysl typescript 前端 typescript
一、为什么需要迭代协议？在现代JavaScript/TypeScript开发中，我们经常需要处理各种集合型数据：数组、Map、Set甚至是自定义数据结构。ES6引入的迭代协议（IterationProtocols）正是为了解决统一遍历机制的问题。通过迭代器模式，我们可以：为不同的数据结构提供统一的访问接口实现惰性计算（LazyEvaluation）支持现代语言特性（for...of,扩展运算符等）
06.动态代理设计模式 java
06.动态代理设计模式目录介绍01.为何要动态代理1.1为何要动态代理1.2动态代理思考02.动态代理的概念2.1动态代理定义2.2动态代理类比理解2.3动态代理参与者2.4动态代理步骤03.动态代理的实现3.1罗列一个场景3.2用一个例子理解代理3.3基于接口动态代理3.4基于类动态代理3.5动态代理模版代码04.动态代理案例4.1动态代理和反射4.2Java中代理4.3Retrofit核心思想
04.原型模式设计思想 java
04.原型模式设计思想目录介绍01.原型模式介绍1.1原型模式由来1.2原型模式定义1.3原型模式场景1.4原型模式思考02.原型模式原理与实现2.1罗列一个场景2.2用例子理解原型2.3案例演变分析2.4原型模式基本实现03.原型模式分析3.1原型模式VS工厂模式3.2原型模式VS深拷贝04.原型模式应用解析4.1使用clone方法4.2实现接口Cloneable4.3深克隆和浅克隆05.原型模
03.建造者模式设计思想 java
03.建造者模式设计思想目录介绍01.建造者模式介绍1.1建造者模式由来1.2建造者模式定义1.3建造者模式场景1.4建造者模式思考02.建造者模式实现2.1罗列一个场景2.2创造对象弊端场景2.3案例演变分析2.4用例子理解建造者03.建造者模式分析3.1建造者模式结构图3.2建造者模式时序图3.3基本代码实现04.建造者案例实践4.1盖房子案例开发4.2普通盖房子开发4.3构造者优化盖房子05
Java的正则表达式一朵忧伤的蔷薇 java 正则表达式开发语言
Java中的正则表达式(RegularExpressions,简称regex)是一种强大的工具，用于在字符串中搜索、匹配和替换特定的模式。以下是Java正则表达式的一些基础知识点：1.基本语法字符类:.匹配任意单个字符（除了换行符）。\d匹配任意数字，相当于[0-9]。\D匹配任意非数字。\w匹配任意字母、数字或下划线，相当于[a-zA-Z0-9_]。\W匹配任意非字母、数字或下划线。\s匹配任意
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算【超级详细版】 AI筑梦师计算机视觉算法深度学习人工智能机器学习计算机视觉 python
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算1.引言1.1研究背景在计算机视觉、模式识别、医学影像分析和自动驾驶等领域，形状匹配是核心任务之一。然而，现实世界的形状往往存在可变性（Variability），主要体现在以下几个方面：形变（Deformation）：物体可能由于柔性材料、外力作用或生物运动发生非刚性形变。尺度变化（ScaleVariation）：目标形状在不同场景下可能大
每日实战：python爬虫之网页跳转-以某博为例代码CC python爬虫 python 爬虫 pandas 开发语言
一、项目背景与核心需求通过逆向分析微博热榜接口，实现实时热搜数据抓取，重点解决：话题跳转链接参数缺失问题页面数据清洗规范化处理多维度数据采集存储二、网页跳转爬虫实现原理2.1跳转链接生成逻辑原始热搜词→"雷军刚知道柯洁定了SU7Ultra"处理流程：1.添加话题标识→#雷军刚知道柯洁定了SU7Ultra#2.URL编码→%23雷军刚知道柯洁定了SU7Ultra%233.添加搜索参数→&t=31生成
华为OD E卷 #30 围棋的气时光回响华为OD机试E卷华为od 链表算法
题目题目描述围棋棋盘由纵横各19条线垂直相交组成，棋盘上一共19x19=361个交点，对弈双方一方执白棋，一方执黑棋，落子时只能将棋子置于交点上。“气”是围棋中很重要的一个概念，某个棋子有几口气，是指其上下左右方向四个相邻的交叉点中，有几个交叉点没有棋子，由此可知：1、在棋盘的边缘上的棋子最多有3口气（黑1），在棋盘角点的棋子最多有2口气（黑2），其他情况最多有4口气（白1）2、所有同色棋子的气之
成为编程大佬！！-----＞数据结构与算法（2）——顺序表！！ Elnaij 算法数据结构 c语言
前言：线性表是数据结构与算法的重中之重，所有具有线性逻辑结构的数据结构，都能称为线性表。这篇文章我们先来讨论线性表中的顺序表，顺序表和线性表都是后续实现栈，树，串和图等等结构的重要基础。目录❀简单介绍线性表❀顺序表❀顺序表的存储❀动态存储❀静态存储❀静态存储与动态存储的优缺点❀顺序表操作❀1.初始化顺序表❀2.销毁顺序表❀3.插入数据❀插入数据之判断已满否❀插入操作之尾插❀插入操作之头插❀插入数据
基于C语言的数据结构之串——带你熟练掌握串的基本操作！！超级详细！！ Elnaij 数据结构 c语言算法
目录前言1.数据结构——串1.1基本知识主串、子串、模式串1.2对几个字符串库函数的简单介绍1.2.1strcmp1.2.2strcpy1.2.3strlen1.2.4strcat1.3串的分类1.3.1静态分配内存的串1.3.2动态分配内存的串2.串的基本操作2.1初始化串2.2输出字符2.3插入子串2.4删除子串2.5取子串操作2.6撤销删除操作结束语前言掌握串之前最好先去学习好顺序表和单链表
字符串模式匹配——Brute-Force暴力查找算法以及KMP算法具象图解，超级详细！！ Elnaij 算法数据结构 c语言
目录前言1.串的模式匹配算法目的1.1Brute-Force算法图解Brute-force算法Brute-force暴力查找算法的弊端1.2KMP算法next数组1.2.1Getnext——求next数组的函数图解Getnext函数Getnext函数总结1.2.2KMP模式匹配操作KMP匹配过程图解KMP算法总结结束语：前言这两个算法，尤其是KMP算法，可以说是让许多算法小白头痛的了。如果你也十分
汇川EASY系列之以太网通讯（MODBUS_TCP做从站） Amos_ FAT 汇川EASY 网络服务器经验分享
汇川easy系列PLC做MODBUS_TCP从站，不需要任何操作，但是有一些需要知道的东西。具体如下：1、汇川easy系列PLC做MODBUS_TCP从站，，ModbusTCP服务器默认开启，无需设置通信协议（即不需要配置），端口号为“502”。ModbusTCP从站最多支持31个ModbusTCP客户端（ModbusTCP主站）同时连接。2、做为串口通讯的衍生，功能码是应知应会的。具体如下：关于
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那

Mongodb源码分析--Replication之主从模式--Master

你可能感兴趣的:(Mongodb源码分析--Replication之主从模式--Master)