haydenwang8287

Mongodb源码分析--插入记录及索引B树构建

在之前的一篇文章中，介绍了assembleResponse函数(位于instance.cpp第224行)，它会根据op操作枚举类型来调用相应的crud操作，枚举类型定义如下：

 
    
   enum 
   Operations{
 opReply 
   = 
    
   1 
   , 
   /* 
   reply.responseToisset. 
   */ 
   
 dbMsg 
   = 
    
   1000 
   , 
   /* 
   genericmsgcommandfollowedbyastring 
   */ 
   
 dbUpdate 
   = 
    
   2001 
   , 
   /* 
   updateobject 
   */ 
   
 dbInsert 
   = 
    
   2002 
   ,
 
   // 
   dbGetByOID=2003, 
   
 
   dbQuery 
   = 
    
   2004 
   ,
 dbGetMore 
   = 
    
   2005 
   ,
 dbDelete 
   = 
    
   2006 
   ,
 dbKillCursors 
   = 
    
   2007 
   
 }; 
  

可以看到dbInsert = 2002 为插入操作枚举值，下面我们看一下assembleResponse在确定是插入操作时调用的方法，如下：

 
   assembleResponse(Message 
   & 
   m,DbResponse 
   & 
   dbresponse, 
   const 
   SockAddr 
   & 
   client){
 .....
 
   try 
   {
 
   if 
   (op 
   == 
   dbInsert){ 
   // 
   添加记录操作 
   
 
   receivedInsert(m,currentOp);
 }
 
   else 
    
   if 
   (op 
   == 
   dbUpdate){ 
   // 
   更新记录 
   
 
   receivedUpdate(m,currentOp);
 }
 
   else 
    
   if 
   (op 
   == 
   dbDelete){ 
   // 
   删除记录 
   
 
   receivedDelete(m,currentOp);
 }
 
   else 
    
   if 
   (op 
   == 
   dbKillCursors){ 
   // 
   删除Cursors（游标）对象 
   
 
   currentOp.ensureStarted();
 logThreshold 
   = 
    
   10 
   ;
 ss 
   << 
    
   " 
   killcursors 
   " 
   ;
 receivedKillCursors(m);
 }
 
   else 
   {
 mongo::log() 
   << 
    
   " 
   operationisn'tsupported: 
   " 
    
   << 
   op 
   << 
   endl;
 currentOp.done();
 log 
   = 
    
   true 
   ;
 }
 }
 .....
 }
 } 
  

从上面代码可以看出，系统在确定dbInsert操作时，调用了receivedInsert()方法（位于instance.cpp文件第570行），下面是该方法的定义：

 
   void 
   receivedInsert(Message 
   & 
   m,CurOp 
   & 
   op){
 DbMessaged(m); 
   // 
   初始化数据库格式的消息 
   
 
    
   const 
    
   char 
    
   * 
   ns 
   = 
   d.getns(); 
   // 
   获取名空间，用于接下来insert数据 
   
 
   assert( 
   * 
   ns);
 uassert( 
   10058 
   , 
   " 
   notmaster 
   " 
   ,isMasterNs(ns));
 op.debug().str 
   << 
   ns;

 writelocklk(ns); 
   // 
   声明写锁 
   
 
   
 
   if 
   (handlePossibleShardedMessage(m, 
   0 
   )) 
   // 
   查看是不是sharding信息，如果是则处理 
   
 
    
   return 
   ;

 Client::Contextctx(ns);
 
   int 
   n 
   = 
    
   0 
   ;
 
   while 
   (d.moreJSObjs()){ 
   // 
   循环获取当前消息体中的BSONObj数据（数据库记录） 
   
 
   BSONObjjs 
   = 
   d.nextJsObj();
 uassert( 
   10059 
   , 
   " 
   objecttoinserttoolarge 
   " 
   ,js.objsize() 
   <= 
   BSONObjMaxUserSize);
 {
 
   // 
   声明BSONObj迭代器，以查看里面元素是否有更新操作，如setincpushpull等 
   
 
   BSONObjIteratori(js);
 
   while 
   (i.more()){
 BSONElemente 
   = 
   i.next();
 uassert( 
   13511 
   , 
   " 
   objecttoinsertcan'thave$modifiers 
   " 
   ,e.fieldName()[ 
   0 
   ] 
   != 
    
   ' 
   $ 
   ' 
   );
 }
 }
 
   // 
   插入记录操作，god=false用于标识当前BSONObj对象为有效数据 
   
 
   theDataFileMgr.insertWithObjMod(ns,js, 
   false 
   );
 logOp( 
   " 
   i 
   " 
   ,ns,js); 
   // 
   日志操作，包括master状态下及sharding分片情况 
   
 
   
 
   if 
   ( 
   ++ 
   n 
   % 
    
   4 
    
   == 
    
   0 
   ){
 
   // 
   在插入一些数据后，进行持久化操作，有关持久化部分参见我的这篇文章
 
   // 
    
   http://www.cnblogs.com/daizhj/archive/2011/03/21/1990344.html 
   
 
   getDur().commitIfNeeded();
 }
 }
 globalOpCounters.incInsertInWriteLock(n); 
   // 
   在写锁环境下添加已插入记录数（n）,锁采用InterlockedIncrement实现数的原子性 
   
 
   } 
  

上面的方法中，主要是在“写锁”环境下执行插入数据操作，并且在插入记录之前进行简单的数据对象检查，如长度和插入数据是否被修改，以确保数据的最终有效性。
最终上面代码会调用 insertWithObjMod()方法（位于pdfile.cpp 文件第1432行），该方法定义如下：

 
   DiskLocDataFileMgr::insertWithObjMod( 
   const 
    
   char 
    
   * 
   ns,BSONObj 
   & 
   o, 
   bool 
   god){
 DiskLocloc 
   = 
   insert(ns,o.objdata(),o.objsize(),god);
 
   if 
   ( 
   ! 
   loc.isNull()) 
   // 
   判断返回记录地址是否为空（记录是否插入成功） 
   
 
   o 
   = 
   BSONObj(loc.rec()); 
   // 
   如有效，则用记录地地址上的记录(record类型指针)绑定到o上 
   
 
    
   return 
   loc;
 } 
  

该方法只是一个对插入操作及返回结果的封装，其中ns为数据对象的名空间，o就是要插入的数据对象（BSONObj），god用于标识当前BSONObj对象是否为有效数据（false=有效），这里之所以要传入god这个参数，是因为在接下来的insert方法里同时支持添加名空间(及索引)和插入记录操作（都会不断调用该方法），而在添加名空间时god=true。

下面我们看一下insert方法（pdfile.cpp 第1467行），因为其内容较长，请详见注释：

 
   DiskLocDataFileMgr::insert( 
   const 
    
   char 
    
   * 
   ns, 
   const 
    
   void 
    
   * 
   obuf, 
   int 
   len, 
   bool 
   god, 
   const 
   BSONElement 
   & 
   writeId, 
   bool 
   mayAddIndex){
 
   bool 
   wouldAddIndex 
   = 
    
   false 
   ;
 massert( 
   10093 
   , 
   " 
   cannotinsertintoreserved$collection 
   " 
   ,god 
   || 
   isANormalNSName(ns));
 uassert( 
   10094 
   ,str::stream() 
   << 
    
   " 
   invalidns: 
   " 
    
   << 
   ns,isValidNS(ns));
 
   const 
    
   char 
    
   * 
   sys 
   = 
   strstr(ns, 
   " 
   system. 
   " 
   );
 
   if 
   (sys){ 
   // 
   对插入记录的ns进行判断，是否要插入保留的数据库名(system)，如是则停止执行其它代码 
   
 
   uassert( 
   10095 
   , 
   " 
   attempttoinsertinreserveddatabasename'system' 
   " 
   ,sys 
   != 
   ns);
 
   if 
   (strstr(ns, 
   " 
   .system. 
   " 
   )){
 
   // 
   later:checkfordba-typepermissionshereifhavethatatsomepointseparate 
   
 
    
   if 
   (strstr(ns, 
   " 
   .system.indexes 
   " 
   )) 
   // 
   判断是否创建索引 
   
 
   wouldAddIndex 
   = 
    
   true 
   ;
 
   else 
    
   if 
   (legalClientSystemNS(ns, 
   true 
   ))
 ;
 
   else 
    
   if 
   ( 
   ! 
   god){ 
   // 
   表示obuf有数据，但这就意味着要向system下插入数据（把system当成数据表了） 
   
 
    
   out 
   () 
   << 
    
   " 
   ERROR:attempttoinsertinsystemnamespace 
   " 
    
   << 
   ns 
   << 
   endl;
 
   return 
   DiskLoc();
 }
 }
 
   else 
   
 sys 
   = 
    
   0 
   ;
 }

 
   bool 
   addIndex 
   = 
   wouldAddIndex 
   && 
   mayAddIndex; 
   // 
   判断是否需要添加索引 
   
 
   
 NamespaceDetails 
   * 
   d 
   = 
   nsdetails(ns); 
   // 
   获取ns的详细信息 
   
 
    
   if 
   (d 
   == 
    
   0 
   ){
 addNewNamespaceToCatalog(ns); 
   // 
   向systemcatalog添加新的名空间，它会再次调用当前insert()方法 
   
 
    
   /* 
   todo:shouldn'tbeinthenamespacecataloguntilaftertheallocationsherework.
 alsoifthisisanaddIndex,thosechecksshouldhappenbeforethis!
 
   */ 
   
 
   // 
   创建第一个数据库文件. 
   
 
   cc().database() 
   -> 
   allocExtent(ns,Extent::initialSize(len), 
   false 
   );
 d 
   = 
   nsdetails(ns);
 
   if 
   ( 
   ! 
   god)
 ensureIdIndexForNewNs(ns);
 }
 d 
   -> 
   paddingFits();

 NamespaceDetails 
   * 
   tableToIndex 
   = 
    
   0 
   ;

 
   string 
   tabletoidxns;
 BSONObjfixedIndexObject;
 
   if 
   (addIndex){
 assert(obuf);
 BSONObjio(( 
   const 
    
   char 
    
   * 
   )obuf);
 
   // 
   做索引准备工作，这里并不真正创建索引，只是进行参数检查，以及索引是否已存在等 
   
 
    
   if 
   ( 
   ! 
   prepareToBuildIndex(io,god,tabletoidxns,tableToIndex,fixedIndexObject))
 
   return 
   DiskLoc();

 
   if 
   ( 
   ! 
   fixedIndexObject.isEmpty()){
 obuf 
   = 
   fixedIndexObject.objdata();
 len 
   = 
   fixedIndexObject.objsize();
 }

 }

 
   const 
   BSONElement 
   * 
   newId 
   = 
    
   & 
   writeId;
 
   int 
   addID 
   = 
    
   0 
   ;
 
   if 
   ( 
   ! 
   god){
 
   // 
   检查对象是否有_id字段，没有则添加
 
   // 
   Notethatbtreebucketswhichweinsertaren'tBSONObj's,butinthatcasegod==true. 
   
 
   BSONObjio(( 
   const 
    
   char 
    
   * 
   )obuf);
 BSONElementidField 
   = 
   io.getField( 
   " 
   _id 
   " 
   );
 uassert( 
   10099 
   , 
   " 
   _idcannotbeanarray 
   " 
   ,idField.type() 
   != 
   Array);

 
   if 
   (idField.eoo() 
   /* 
   判断是否是结束元素 
   */ 
   && 
    
   ! 
   wouldAddIndex 
   && 
   strstr(ns, 
   " 
   .local. 
   " 
   ) 
   == 
    
   0 
   ){
 addID 
   = 
   len;
 
   if 
   (writeId.eoo()){
 
   // 
   初始化一个_id随机值（因为_id可能是12byte类型或其它类型） 
   
 
   idToInsert_.oid.init();
 newId 
   = 
    
   & 
   idToInsert; 
   // 
   绑定初始化的_id值 
   
 
   }
 len 
   += 
   newId 
   -> 
   size();
 }
 
   // 
   如果io对象中有时间戳元素时，并用当前时间进行更新 
   
 
   BSONElementManipulator::lookForTimestamps(io);
 }

 
   // 
   兼容旧的数据文件 
   
 
   DiskLocextentLoc;
 
   int 
   lenWHdr 
   = 
   len 
   + 
   Record::HeaderSize;
 lenWHdr 
   = 
   ( 
   int 
   )(lenWHdr 
   * 
   d 
   -> 
   paddingFactor);
 
   if 
   (lenWHdr 
   == 
    
   0 
   ){
 assert(d 
   -> 
   paddingFactor 
   == 
    
   0 
   );
 
   * 
   getDur().writing( 
   & 
   d 
   -> 
   paddingFactor) 
   = 
    
   1.0 
   ;
 lenWHdr 
   = 
   len 
   + 
   Record::HeaderSize;
 }

 
   // 
   在对新的对象分配空间前检查数据是否会造成索引冲突（唯一索引）
 
   // 
   capped标识是否是固定大小的集合类型，这种类型下系统会自动将过于陈旧的数据remove掉
 
   // 
   注：此cap与nosql中常说的cap无太大关联
 
   // 
   nosqlcap即：一致性，有效性，分区容忍性
 
   // 
   参见这篇文章: 
   http://blog.nosqlfan.com/html/1112.html 
   ,
 
   // 
    
   http://blog.nosqlfan.com/html/96.html 
   ) 
   
 
    
   if 
   (d 
   -> 
   nIndexes 
   && 
   d 
   -> 
   capped 
   && 
    
   ! 
   god){
 checkNoIndexConflicts(d,BSONObj(reinterpret_cast 
   < 
   const 
    
   char 
    
   *> 
   (obuf)));
 }

 DiskLocloc 
   = 
   d 
   -> 
   alloc(ns,lenWHdr,extentLoc); 
   // 
   为当前记录分配空间namespace.cpp__stdAlloc方法 
   
 
    
   if 
   (loc.isNull()){ 
   // 
   如果分配失效 
   
 
    
   if 
   (d 
   -> 
   capped 
   == 
    
   0 
   ){ 
   // 
   cap大小未增加，即 
   
 
   log( 
   1 
   ) 
   << 
    
   " 
   allocatingnewextentfor 
   " 
    
   << 
   ns 
   << 
    
   " 
   padding: 
   " 
    
   << 
   d 
   -> 
   paddingFactor 
   << 
    
   " 
   lenWHdr: 
   " 
    
   << 
   lenWHdr 
   << 
   endl;
 
   // 
   尝试从空闲空间列表中分配空间 
   
 
   cc().database() 
   -> 
   allocExtent(ns,Extent::followupSize(lenWHdr,d 
   -> 
   lastExtentSize), 
   false 
   );
 
   // 
   尝试再次为当前记录分配空间 
   
 
   loc 
   = 
   d 
   -> 
   alloc(ns,lenWHdr,extentLoc);
 
   if 
   (loc.isNull()){
 log() 
   << 
    
   " 
   WARNING:alloc()failedafterallocatingnewextent.lenWHdr: 
   " 
    
   << 
   lenWHdr 
   << 
    
   " 
   lastextentsize: 
   " 
    
   << 
   d 
   -> 
   lastExtentSize 
   << 
    
   " 
   ;tryingagain\n 
   " 
   ;
 
   for 
   ( 
   int 
   zzz 
   = 
   0 
   ;zzz 
   < 
   10 
    
   && 
   lenWHdr 
   > 
   d 
   -> 
   lastExtentSize;zzz 
   ++ 
   ){ 
   // 
   最多尝试循环10次分配空间 
   
 
   log() 
   << 
    
   " 
   try# 
   " 
    
   << 
   zzz 
   << 
   endl;
 cc().database() 
   -> 
   allocExtent(ns,Extent::followupSize(len,d 
   -> 
   lastExtentSize), 
   false 
   );
 loc 
   = 
   d 
   -> 
   alloc(ns,lenWHdr,extentLoc);
 
   if 
   ( 
   ! 
   loc.isNull())
 
   break 
   ;
 }
 }
 }
 
   if 
   (loc.isNull()){ 
   // 
   最终未分配空间给对象 
   
 
   log() 
   << 
    
   " 
   insert:couldn'tallocspaceforobjectns: 
   " 
    
   << 
   ns 
   << 
    
   " 
   capped: 
   " 
    
   << 
   d 
   -> 
   capped 
   << 
   endl;
 assert(d 
   -> 
   capped);
 
   return 
   DiskLoc();
 }
 }

 Record 
   * 
   r 
   = 
   loc.rec();
 {
 assert(r 
   -> 
   lengthWithHeaders 
   >= 
   lenWHdr);
 r 
   = 
   (Record 
   * 
   )getDur().writingPtr(r,lenWHdr); 
   // 
   持久化插入记录信息 
   
 
    
   if 
   (addID){
 
   /* 
   alittleeffortwasmadeheretoavoidadoublecopywhenweaddanID 
   */ 
   
 (( 
   int 
   & 
   ) 
   * 
   r 
   -> 
   data) 
   = 
    
   * 
   (( 
   int 
   * 
   )obuf) 
   + 
   newId 
   -> 
   size();
 memcpy(r 
   -> 
   data 
   + 
   4 
   ,newId 
   -> 
   rawdata(),newId 
   -> 
   size()); 
   // 
   拷贝_id字段到指定记录内存空间 
   
 
   memcpy(r 
   -> 
   data 
   + 
   4 
   + 
   newId 
   -> 
   size(),(( 
   char 
    
   * 
   )obuf) 
   + 
   4 
   ,addID 
   - 
   4 
   ); 
   // 
   拷贝数据到指定内存空间 
   
 
   }
 
   else 
   {
 
   if 
   (obuf)
 memcpy(r 
   -> 
   data,obuf,len); 
   // 
   直接拷贝数据到记录字段r 
   
 
   }
 }

 {
 Extent 
   * 
   e 
   = 
   r 
   -> 
   myExtent(loc);
 
   if 
   (e 
   -> 
   lastRecord.isNull()){ 
   // 
   如果未尾记录为空，本人理解：即之前未插入过记录 
   
 
   Extent::FL 
   * 
   fl 
   = 
   getDur().writing(e 
   -> 
   fl());
 fl 
   -> 
   firstRecord 
   = 
   fl 
   -> 
   lastRecord 
   = 
   loc;
 r 
   -> 
   prevOfs 
   = 
   r 
   -> 
   nextOfs 
   = 
   DiskLoc::NullOfs;
 }
 
   else 
   {
 Record 
   * 
   oldlast 
   = 
   e 
   -> 
   lastRecord.rec(); 
   // 
   否则将新记录添加到最后一条记录的后面 
   
 
   r 
   -> 
   prevOfs 
   = 
   e 
   -> 
   lastRecord.getOfs();
 r 
   -> 
   nextOfs 
   = 
   DiskLoc::NullOfs;
 getDur().writingInt(oldlast 
   -> 
   nextOfs) 
   = 
   loc.getOfs();
 getDur().writingDiskLoc(e 
   -> 
   lastRecord) 
   = 
   loc;
 }
 }

 
   /* 
   持久化操作并更新相应统计信息 
   */ 
   
 {
 NamespaceDetails::Stats 
   * 
   s 
   = 
   getDur().writing( 
   & 
   d 
   -> 
   stats);
 s 
   -> 
   datasize 
   += 
   r 
   -> 
   netLength();
 s 
   -> 
   nrecords 
   ++ 
   ;
 }

 
   // 
   在god时会清空stats信息，同时会添加一个btreebucket（占据存储空间） 
   
 
    
   if 
   ( 
   ! 
   god)
 NamespaceDetailsTransient::get_w(ns).notifyOfWriteOp(); 
   // 
   在写操作时清空缓存，优化查询优化 
   
 
   
 
   if 
   (tableToIndex){
 uassert( 
   13143 
   , 
   " 
   can'tcreateindexonsystem.indexes 
   " 
   ,tabletoidxns.find( 
   " 
   .system.indexes 
   " 
   ) 
   == 
    
   string 
   ::npos);

 BSONObjinfo 
   = 
   loc.obj();
 
   bool 
   background 
   = 
   info[ 
   " 
   background 
   " 
   ].trueValue();
 
   if 
   (background 
   && 
   cc().isSyncThread()){
 
   /* 
   don'tdobackgroundindexingonslaves.therearenuances.thiscouldbeaddedlaterbutrequiresmorecode. 
   */ 
   
 log() 
   << 
    
   " 
   info:indexinginforegroundonthisreplica;wasabackgroundindexbuildontheprimary 
   " 
    
   << 
   endl;
 background 
   = 
    
   false 
   ;
 }

 
   int 
   idxNo 
   = 
   tableToIndex 
   -> 
   nIndexes;
 IndexDetails 
   & 
   idx 
   = 
   tableToIndex 
   -> 
   addIndex(tabletoidxns.c_str(), 
   ! 
   background); 
   // 
   清空临时缓存信息;同时递增索引数量 
   
 
   getDur().writingDiskLoc(idx.info) 
   = 
   loc;
 
   try 
   {
 buildAnIndex(tabletoidxns,tableToIndex,idx,idxNo,background); 
   // 
   创建索引 
   
 
   }
 
   catch 
   (DBException 
   & 
   e){
 
   // 
   保存异常信息，并执行dropIndexes 
   
 
   LastError 
   * 
   le 
   = 
   lastError. 
   get 
   ();
 
   int 
   savecode 
   = 
    
   0 
   ;
 
   string 
   saveerrmsg;
 
   if 
   (le){
 savecode 
   = 
   le 
   -> 
   code;
 saveerrmsg 
   = 
   le 
   -> 
   msg;
 }
 
   else 
   {
 savecode 
   = 
   e.getCode();
 saveerrmsg 
   = 
   e.what();
 }

 
   // 
   回滚索引操作(drop索引) 
   
 
    
   string 
   name 
   = 
   idx.indexName();
 BSONObjBuilderb;
 
   string 
   errmsg;
 
   bool 
   ok 
   = 
   dropIndexes(tableToIndex,tabletoidxns.c_str(),name.c_str(),errmsg,b, 
   true 
   );
 
   if 
   ( 
   ! 
   ok){
 log() 
   << 
    
   " 
   failedtodropindexafterauniquekeyerrorbuildingit: 
   " 
    
   << 
   errmsg 
   << 
    
   ' 
    
   ' 
    
   << 
   tabletoidxns 
   << 
    
   ' 
    
   ' 
    
   << 
   name 
   << 
   endl;
 }

 assert(le 
   && 
    
   ! 
   saveerrmsg.empty());
 raiseError(savecode,saveerrmsg.c_str());
 
   throw 
   ;
 }
 }

 
   /* 
   将记录数据添加到索引信息（btree）中 
   */ 
   
 
   if 
   (d 
   -> 
   nIndexes){
 
   try 
   {
 BSONObjobj(r 
   -> 
   data);
 indexRecord(d,obj,loc);
 }
 
   catch 
   (AssertionException 
   & 
   e){
 
   // 
   _idindex键值重复 
   
 
    
   if 
   (tableToIndex 
   || 
   d 
   -> 
   capped){
 massert( 
   12583 
   , 
   " 
   unexpectedindexinsertionfailureoncappedcollection 
   " 
   , 
   ! 
   d 
   -> 
   capped);
 
   string 
   s 
   = 
   e.toString();
 s 
   += 
    
   " 
   :onaddIndex/capped-collectionanditsindexwillnotmatch 
   " 
   ;
 uassert_nothrow(s.c_str());
 error() 
   << 
   s 
   << 
   endl;
 }
 
   else 
   {
 
   // 
   回滚上述操作 
   
 
   _deleteRecord(d,ns,r,loc);
 
   throw 
   ;
 }
 }
 }

 
   // 
   out()<<"insertedatloc:"<<hex<<loc.getOfs()<<"lenwhdr:"<<hex<<lenWHdr<<dec<<''<<ns<<endl; 
   
 
    
   return 
   loc;
 } 
  

正如之前所说，该方法会完成添加名空间，添加索引，添加数据记录（memcpy调用）。其中名空间的添加方法 addNewNamespaceToCatalog比较简单，下面主要介绍一下索引的创建过程，这里分为了两步：

1.创建索引树（b树）

2.将数据（主要是地址）添加到索引（树）中

先看一下创建索引过程：

 
  static 
   
  void 
  buildAnIndex( 
  string 
  ns,NamespaceDetails 
  * 
  d,IndexDetails 
  & 
  idx, 
  int 
  idxNo, 
  bool 
  background){
 tlog() 
  << 
   
  " 
  buildingnewindexon 
  " 
   
  << 
  idx.keyPattern() 
  << 
   
  " 
  for 
  " 
   
  << 
  ns 
  << 
  (background 
  ? 
   
  " 
  background 
  " 
  : 
  "" 
  ) 
  << 
  endl;
 Timert;
 unsigned 
  long 
   
  long 
  n;

 
  if 
  (background){
 log( 
  2 
  ) 
  << 
   
  " 
  buildAnIndex:background=true\n 
  " 
  ;
 }

 assert( 
  ! 
  BackgroundOperation::inProgForNs(ns.c_str())); 
  // 
  shouldhavebeencheckedearlier,betternotbe... 
  
 
  assert(d 
  -> 
  indexBuildInProgress 
  == 
   
  0 
  );
 assertInWriteLock();
 RecoverableIndexStaterecoverable(d);
 
  if 
  (inDBRepair 
  || 
   
  ! 
  background){ 
  // 
  当数据库在repair时或非后台工作方式下 
  
 
  n 
  = 
  fastBuildIndex(ns.c_str(),d,idx,idxNo); 
  // 
  创建索引 
  
 
  assert( 
  ! 
  idx.head.isNull());
 }
 
  else 
  {
 BackgroundIndexBuildJobj(ns.c_str()); 
  // 
  以后台方式创建索引 
  
 
  n 
  = 
  j.go(ns,d,idx,idxNo);
 }
 tlog() 
  << 
   
  " 
  donefor 
  " 
   
  << 
  n 
  << 
   
  " 
  records 
  " 
   
  << 
  t.millis() 
  / 
   
  1000.0 
   
  << 
   
  " 
  secs 
  " 
   
  << 
  endl;
 } 
 

创建索引方法会要据创建方式（是否是后台线程等），使用不同的方法，这里主要讲解非后台方式，也就是上面的fastBuildIndex方法（pdfile.cpp第1101行），其定义如下（内容详见注释）：

 
  unsigned 
  long 
   
  long 
  fastBuildIndex( 
  const 
   
  char 
   
  * 
  ns,NamespaceDetails 
  * 
  d,IndexDetails 
  & 
  idx, 
  int 
  idxNo){
 CurOp 
  * 
  op 
  = 
  cc().curop(); 
  // 
  设置当前操作指针，用于设置操作信息 
  
 
  
 Timert;

 tlog( 
  1 
  ) 
  << 
   
  " 
  fastBuildIndex 
  " 
   
  << 
  ns 
  << 
   
  " 
  idxNo: 
  " 
   
  << 
  idxNo 
  << 
   
  ' 
   
  ' 
   
  << 
  idx.info.obj().toString() 
  << 
  endl;

 
  bool 
  dupsAllowed 
  = 
   
  ! 
  idx.unique();
 
  bool 
  dropDups 
  = 
  idx.dropDups() 
  || 
  inDBRepair;
 BSONObjorder 
  = 
  idx.keyPattern();

 getDur().writingDiskLoc(idx.head).Null();

 
  if 
  (logLevel 
  > 
   
  1 
  )printMemInfo( 
  " 
  beforeindexstart 
  " 
  );

 
  /* 
  获取并排序所有键值----- 
  */ 
  
 unsigned 
  long 
   
  long 
  n 
  = 
   
  0 
  ;
 shared_ptr 
  < 
  Cursor 
  > 
  c 
  = 
  theDataFileMgr.findAll(ns);
 BSONObjExternalSortersorter(order);
 sorter.hintNumObjects(d 
  -> 
  stats.nrecords);
 unsigned 
  long 
   
  long 
  nkeys 
  = 
   
  0 
  ;
 ProgressMeterHolderpm(op 
  -> 
  setMessage( 
  " 
  index:(1/3)externalsort 
  " 
  ,d 
  -> 
  stats.nrecords, 
  10 
  ));
 
  while 
  (c 
  -> 
  ok()){
 BSONObjo 
  = 
  c 
  -> 
  current();
 DiskLocloc 
  = 
  c 
  -> 
  currLoc();

 BSONObjSetDefaultOrderkeys;
 idx.getKeysFromObject(o,keys); 
  // 
  从对象中获取键值信息 
  
 
   
  int 
  k 
  = 
   
  0 
  ;
 
  for 
  (BSONObjSetDefaultOrder::iteratori 
  = 
  keys.begin();i 
  != 
  keys.end();i 
  ++ 
  ){
 
  if 
  ( 
  ++ 
  k 
  == 
   
  2 
  ){ 
  // 
  是否是多键索引 
  
 
  d 
  -> 
  setIndexIsMultikey(idxNo);
 }
 sorter.add( 
  * 
  i,loc); 
  // 
  向排序器添加键值和记录位置信息 
  
 
  nkeys 
  ++ 
  ;
 }

 c 
  -> 
  advance();
 n 
  ++ 
  ;
 pm.hit();
 
  if 
  (logLevel 
  > 
   
  1 
   
  && 
  n 
  % 
   
  10000 
   
  == 
   
  0 
  ){
 printMemInfo( 
  " 
  \titeratingobjects 
  " 
  );
 }

 };
 pm.finished();

 
  if 
  (logLevel 
  > 
   
  1 
  )printMemInfo( 
  " 
  beforefinalsort 
  " 
  );
 sorter.sort();
 
  if 
  (logLevel 
  > 
   
  1 
  )printMemInfo( 
  " 
  afterfinalsort 
  " 
  );

 log(t.seconds() 
  > 
   
  5 
   
  ? 
   
  0 
  : 
  1 
  ) 
  << 
   
  " 
  \texternalsortused: 
  " 
   
  << 
  sorter.numFiles() 
  << 
   
  " 
  files 
  " 
   
  << 
   
  " 
  in 
  " 
   
  << 
  t.seconds() 
  << 
   
  " 
  secs 
  " 
   
  << 
  endl;

 list 
  < 
  DiskLoc 
  > 
  dupsToDrop;

 
  /* 
  创建索引 
  */ 
  
 {
 BtreeBuilderbtBuilder(dupsAllowed,idx); 
  // 
  实例化b树索引对象
 
  // 
  BSONObjkeyLast; 
  
 
  auto_ptr 
  < 
  BSONObjExternalSorter::Iterator 
  > 
  i 
  = 
  sorter.iterator(); 
  // 
  初始化迭代器用于下面遍历 
  
 
  assert(pm 
  == 
  op 
  -> 
  setMessage( 
  " 
  index:(2/3)btreebottomup 
  " 
  ,nkeys, 
  10 
  ));
 
  while 
  (i 
  -> 
  more()){
 RARELYkillCurrentOp.checkForInterrupt(); 
  // 
  检查冲突如shutdown或kill指令 
  
 
  BSONObjExternalSorter::Datad 
  = 
  i 
  -> 
  next();

 
  try 
  {
 btBuilder.addKey(d.first,d.second); 
  // 
  向b树索引对象中添加索引键值和记录位置信息 
  
 
  }
 
  catch 
  (AssertionException 
  & 
  e){
 
  if 
  (dupsAllowed){
 
  // 
  unknowexception?? 
  
 
   
  throw 
  ;
 }

 
  if 
  (e.interrupted())
 
  throw 
  ;

 
  if 
  ( 
  ! 
  dropDups)
 
  throw 
  ;

 
  /* 
  wecouldqueuetheseondisk,butnormallythereareveryfewdups,soinsteadwe
 keepinramandhavealimit.
 
  */ 
  
 dupsToDrop.push_back(d.second);
 uassert( 
  10092 
  , 
  " 
  toomaydupsonindexbuildwithdropDups=true 
  " 
  ,dupsToDrop.size() 
  < 
   
  1000000 
  );
 }
 pm.hit();
 }
 pm.finished();
 op 
  -> 
  setMessage( 
  " 
  index:(3/3)btree-middle 
  " 
  );
 log(t.seconds() 
  > 
   
  10 
   
  ? 
   
  0 
  : 
  1 
  ) 
  << 
   
  " 
  \tdonebuildingbottomlayer,goingtocommit 
  " 
   
  << 
  endl;
 btBuilder.commit(); 
  // 
  提交创建索引操作，该方法会完成最终构造Btree索引操作 
  
 
  wassert(btBuilder.getn() 
  == 
  nkeys 
  || 
  dropDups);
 }

 log( 
  1 
  ) 
  << 
   
  " 
  \tfastBuildIndexdupsToDrop: 
  " 
   
  << 
  dupsToDrop.size() 
  << 
  endl;
 
  // 
  删除索引中已出现的重复记录 
  
 
   
  for 
  (list 
  < 
  DiskLoc 
  > 
  ::iteratori 
  = 
  dupsToDrop.begin();i 
  != 
  dupsToDrop.end();i 
  ++ 
  )
 theDataFileMgr.deleteRecord(ns,i 
  -> 
  rec(), 
  * 
  i, 
  false 
  , 
  true 
  );

 
  return 
  n;
 } 
 

上面方法主要对要创建的索引信息进行提取，并封装到一个BtreeBuilder中，顾名思义，该对象用于进行b树的创建(因为索引也是一个b树),当信息收集排序完成后，就开始创建索引，如下：

 
  btree.cpp1842行
 
  void 
  BtreeBuilder::commit(){
 buildNextLevel(first);
 committed 
  = 
   
  true 
  ;
 }

 
  void 
  BtreeBuilder::buildNextLevel(DiskLocloc){
 
  int 
  levels 
  = 
   
  1 
  ;
 
  while 
  ( 
  1 
  ){
 
  if 
  (loc.btree() 
  -> 
  tempNext().isNull()){
 
  // 
  在当前层级上只有一个bucket 
  
 
  getDur().writingDiskLoc(idx.head) 
  = 
  loc;
 
  break 
  ;
 }
 levels 
  ++ 
  ;

 DiskLocupLoc 
  = 
  BtreeBucket::addBucket(idx); 
  // 
  添加bucket并实例化上一层DiskLoc 
  
 
  DiskLocupStart 
  = 
  upLoc;
 BtreeBucket 
  * 
  up 
  = 
  upLoc.btreemod(); 
  // 
  获取上一层的bucket指针 
  
 
  
 DiskLocxloc 
  = 
  loc;
 
  while 
  ( 
  ! 
  xloc.isNull()){
 RARELY{
 getDur().commitIfNeeded();
 b 
  = 
  cur.btreemod();
 up 
  = 
  upLoc.btreemod();
 }

 BtreeBucket 
  * 
  x 
  = 
  xloc.btreemod();
 BSONObjk;
 DiskLocr;
 x 
  -> 
  popBack(r,k); 
  // 
  弹出当前bucket中最右边的键 
  
 
   
  bool 
  keepX 
  = 
  (x 
  -> 
  n 
  != 
   
  0 
  ); 
  // 
  当前bucket中元素个数是否为0 
  
 
  DiskLockeepLoc 
  = 
  keepX 
  ? 
  xloc:x 
  -> 
  nextChild;

 
  // 
  压入上面弹出的最右边的键值，该键值为当前up（bucket）中最大值 
  
 
   
  if 
  ( 
  ! 
  up 
  -> 
  _pushBack(r,k,ordering,keepLoc))
 {
 
  // 
  当前bucket已满，则新创建一个addBucket 
  
 
  DiskLocn 
  = 
  BtreeBucket::addBucket(idx);
 up 
  -> 
  tempNext() 
  = 
  n;
 upLoc 
  = 
  n;
 up 
  = 
  upLoc.btreemod();
 up 
  -> 
  pushBack(r,k,ordering,keepLoc);
 }

 DiskLocnextLoc 
  = 
  x 
  -> 
  tempNext(); 
  // 
  getnextinchainatcurrentlevel 
  
 
   
  if 
  (keepX){ 
  // 
  表示当前结点非顶层结点，则设置它的父结点 
  
 
  x 
  -> 
  parent 
  = 
  upLoc;
 }
 
  else 
  {
 
  if 
  ( 
  ! 
  x 
  -> 
  nextChild.isNull())
 x 
  -> 
  nextChild.btreemod() 
  -> 
  parent 
  = 
  upLoc;
 x 
  -> 
  deallocBucket(xloc,idx); 
  // 
  删除xlocbucket 
  
 
  }
 xloc 
  = 
  nextLoc; 
  // 
  指向当前层的下个元素 
  
 
  }

 loc 
  = 
  upStart; 
  // 
  升级当前结点 
  
 
  mayCommitProgressDurably();
 }

 
  if 
  (levels 
  > 
   
  1 
  )
 log( 
  2 
  ) 
  << 
   
  " 
  btreelevels: 
  " 
   
  << 
  levels 
  << 
  endl;
 } 
 

上面的buildNextLevel方法自下而上根据之前抽取的键值逐层构造一个b树。这里有一个问题需要注意一下，因为mongodb使用bucket来作为b树中的一个层次结点或叶子结点容器（如下图），bucket最大尺寸为8192字节,c。有关b树索引的文章可以参见这篇文章：，
mongodb目前关于B树索引的文档：http://blog.nosqlfan.com/html/758.html

当初始化了b树索引及空间信息之后，下面就会将数据绑定到相应信息结点上了，也就是DataFileMgr::insert方法(pdfile.cpp文件)的如下代码：

 
  /* 
  将记录数据添加到索引信息（btree）中 
  */ 
  

 
  if 
  (d 
  -> 
  nIndexes){
 
  try 
  {
 BSONObjobj(r 
  -> 
  data);
 indexRecord(d,obj,loc);
 }
 ......
 }
 
 

上面的indexRecord方法会将键值和数据（包括存储位置）添加到索引中(其中参数d包括之前创建的B树索引信息), 该方法定义如下（pdfile.cpp 第1355行）:

 
  /* 
  将键值和数据（包括存储位置）添加到索引中 
  */ 
  
 
  static 
   
  void 
  indexRecord(NamespaceDetails 
  * 
  d,BSONObjobj,DiskLocloc){
 
  int 
  n 
  = 
  d 
  -> 
  nIndexesBeingBuilt(); 
  // 
  获取已（及正在）构建的索引数 
  
 
   
  for 
  ( 
  int 
  i 
  = 
   
  0 
  ;i 
  < 
  n;i 
  ++ 
  ){
 
  try 
  {
 
  bool 
  unique 
  = 
  d 
  -> 
  idx(i).unique();
 
  // 
  内联函数（inline）:将索引和记录相关信息初始化到btree中 
  
 
  _indexRecord(d,i 
  /* 
  索引顺序位 
  */ 
  ,obj,loc, 
  /* 
  dupsAllowed 
  */ 
  ! 
  unique);
 }
 
  catch 
  (DBException 
  & 
  ){
 
  /* 
  如果发生异常，则进行回滚操作
 note<=i(not<i)isimportanthereastheindexwewerejustattempted
 maybemultikeyandrequiresomecleanup.
 
  */ 
  
 
  for 
  ( 
  int 
  j 
  = 
   
  0 
  ;j 
  <= 
  i;j 
  ++ 
  ){
 
  try 
  {
 _unindexRecord(d 
  -> 
  idx(j),obj,loc, 
  false 
  );
 }
 
  catch 
  (...){
 log( 
  3 
  ) 
  << 
   
  " 
  unindexfailsonrollbackafteruniquefailure\n 
  " 
  ;
 }
 }
 
  throw 
  ;
 }
 }
 } 
 

上面的_indexRecord为内联函数（pdfile.cpp）（inline关键字参见C++说明），该参数声明如下：

 
   
  static 
  inline 
  void 
  _indexRecord(NamespaceDetails 
  * 
  d, 
  int 
  idxNo,BSONObj 
  & 
  obj,DiskLocrecordLoc, 
  bool 
  dupsAllowed){
 IndexDetails 
  & 
  idx 
  = 
  d 
  -> 
  idx(idxNo); 
  //
 
  BSONObjSetDefaultOrderkeys;
 idx.getKeysFromObject(obj,keys); 
  // 
  从对象信息中获取键属性信息 
  
 
  BSONObjorder 
  = 
  idx.keyPattern();
 Orderingordering 
  = 
  Ordering::make(order); 
  // 
  初始化排序方式用于下面传参 
  
 
   
  int 
  n 
  = 
   
  0 
  ;
 
  for 
  (BSONObjSetDefaultOrder::iteratori 
  = 
  keys.begin();i 
  != 
  keys.end();i 
  ++ 
  ){
 
  if 
  ( 
  ++ 
  n 
  == 
   
  2 
  ){
 d 
  -> 
  setIndexIsMultikey(idxNo); 
  // 
  设置多键值索引 
  
 
  }
 assert( 
  ! 
  recordLoc.isNull());
 
  try 
  {
 idx.head 
  /* 
  DiskLoc 
  */ 
  .btree() 
  /* 
  BtreeBucket 
  */ 
  -> 
  bt_insert(idx.head,recordLoc, 
  // 
  执行向btree中添加记录和绑定索引信息的操作 
  
 
   
  * 
  i,ordering,dupsAllowed,idx);
 }
 
  catch 
  (AssertionException 
  & 
  e){
 
  if 
  (e.getCode() 
  == 
   
  10287 
   
  && 
  idxNo 
  == 
  d 
  -> 
  nIndexes){
 DEVlog() 
  << 
   
  " 
  info:caughtkeyalreadyinindexonbgindexing(ok) 
  " 
   
  << 
  endl;
 
  continue 
  ;
 }
 
  if 
  ( 
  ! 
  dupsAllowed){
 
  // 
  重复键值异常 
  
 
   
  throw 
  ;
 }
 problem() 
  << 
   
  " 
  caughtassertion_indexRecord 
  " 
   
  << 
  idx.indexNamespace() 
  << 
  endl;
 }
 }
 } 
 

上面方法最终会执行b树插入方法bt_insert（btree.cpp文件1622行），如下（详情见注释）：

 
   
  int 
  BtreeBucket::bt_insert( 
  const 
  DiskLocthisLoc, 
  const 
  DiskLocrecordLoc,
 
  const 
  BSONObj 
  & 
  key, 
  const 
  Ordering 
  & 
  order, 
  bool 
  dupsAllowed,
 IndexDetails 
  & 
  idx, 
  bool 
  toplevel) 
  const 
  {
 
  if 
  (toplevel){ 
  // 
  如果是顶级节点（如果是通过构造索引方式调用，则toplevel=true）
 
  // 
  判断键值是否过界（因为其会存储在system.indexs中），其中：KeyMax=8192/10.mongodb开发团队可能会在更高版本中扩大该值 
  
 
   
  if 
  (key.objsize() 
  > 
  KeyMax){
 problem() 
  << 
   
  " 
  Btree::insert:keytoolargetoindex,skipping 
  " 
   
  << 
  idx.indexNamespace() 
  << 
   
  ' 
   
  ' 
   
  << 
  key.objsize() 
  << 
   
  ' 
   
  ' 
   
  << 
  key.toString() 
  << 
  endl;
 
  return 
   
  3 
  ;
 }
 }
 
  // 
  执行添加操作 
  
 
   
  int 
  x 
  = 
  _insert(thisLoc,recordLoc,key,order,dupsAllowed,DiskLoc(),DiskLoc(),idx);
 assertValid(order); 
  // 
  assert排序方式是否有效 
  
 
  
 
  return 
  x;
 } 
 

上面代码紧接着会调用btree.cpp文件的内部方法_insert（btree.cpp文件 1554行）：

 
   
  int 
  BtreeBucket::_insert( 
  const 
  DiskLocthisLoc, 
  const 
  DiskLocrecordLoc,
 
  const 
  BSONObj 
  & 
  key, 
  const 
  Ordering 
  & 
  order, 
  bool 
  dupsAllowed,
 
  const 
  DiskLoclChild, 
  const 
  DiskLocrChild,IndexDetails 
  & 
  idx) 
  const 
  {
 
  if 
  (key.objsize() 
  > 
  KeyMax){
 problem() 
  << 
   
  " 
  ERROR:keytoolargelen: 
  " 
   
  << 
  key.objsize() 
  << 
   
  " 
  max: 
  " 
   
  << 
  KeyMax 
  << 
   
  ' 
   
  ' 
   
  << 
  key.objsize() 
  << 
   
  ' 
   
  ' 
   
  << 
  idx.indexNamespace() 
  << 
  endl;
 
  return 
   
  2 
  ;
 }
 assert(key.objsize() 
  > 
   
  0 
  );

 
  int 
  pos;
 
  // 
  在btreebucket中使用二分查询，查看键值是否已在所索引信息中 
  
 
   
  bool 
  found 
  = 
  find(idx,key,recordLoc,order,pos 
  /* 
  返回该索引信息所在或应该在的位置 
  */ 
  , 
  ! 
  dupsAllowed);
 
  if 
  (insert_debug){
 
  out 
  () 
  << 
   
  " 
   
  " 
   
  << 
  thisLoc.toString() 
  << 
   
  ' 
  . 
  ' 
   
  << 
   
  " 
  _insert 
  " 
   
  << 
  
 key.toString() 
  << 
   
  ' 
  / 
  ' 
   
  << 
  recordLoc.toString() 
  << 
  
 
  " 
  l: 
  " 
   
  << 
  lChild.toString() 
  << 
   
  " 
  r: 
  " 
   
  << 
  rChild.toString() 
  << 
  endl;
 
  out 
  () 
  << 
   
  " 
  found: 
  " 
   
  << 
  found 
  << 
   
  " 
  pos: 
  " 
   
  << 
  pos 
  << 
   
  " 
  n: 
  " 
   
  << 
  n 
  << 
  endl;
 }

 
  if 
  (found){
 
  const 
  _KeyNode 
  & 
  kn 
  = 
  k(pos); 
  // 
  获取指定磁盘位置的节点信息，_KeyNode 
  
 
   
  if 
  (kn.isUnused()){ 
  // 
  查看已存在的键结点是否已使用 
  
 
  log( 
  4 
  ) 
  << 
   
  " 
  btree_insert:reusingunusedkey 
  " 
   
  << 
  endl;
 massert( 
  10285 
  , 
  " 
  _insert:reusekeybutlchildisnotnull 
  " 
  ,lChild.isNull());
 massert( 
  10286 
  , 
  " 
  _insert:reusekeybutrchildisnotnull 
  " 
  ,rChild.isNull());
 kn.writing().setUsed();
 
  return 
   
  0 
  ;
 }

 DEV{
 log() 
  << 
   
  " 
  _insert():keyalreadyexistsinindex(okforbackground:true)\n 
  " 
  ;
 log() 
  << 
   
  " 
   
  " 
   
  << 
  idx.indexNamespace() 
  << 
   
  " 
  thisLoc: 
  " 
   
  << 
  thisLoc.toString() 
  << 
   
  ' 
  \n 
  ' 
  ;
 log() 
  << 
   
  " 
   
  " 
   
  << 
  key.toString() 
  << 
   
  ' 
  \n 
  ' 
  ;
 log() 
  << 
   
  " 
   
  " 
   
  << 
   
  " 
  recordLoc: 
  " 
   
  << 
  recordLoc.toString() 
  << 
   
  " 
  pos: 
  " 
   
  << 
  pos 
  << 
  endl;
 log() 
  << 
   
  " 
  oldlr: 
  " 
   
  << 
  childForPos(pos).toString() 
  << 
   
  ' 
   
  ' 
   
  << 
  childForPos(pos 
  + 
  1 
  ).toString() 
  << 
  endl;
 log() 
  << 
   
  " 
  newlr: 
  " 
   
  << 
  lChild.toString() 
  << 
   
  ' 
   
  ' 
   
  << 
  rChild.toString() 
  << 
  endl;
 }
 alreadyInIndex(); 
  // 
  提示键值结点已在索引中，不必再创建，并抛出异常 
  
 
  }

 DEBUGGING 
  out 
  () 
  << 
   
  " 
  TEMP:key: 
  " 
   
  << 
  key.toString() 
  << 
  endl;
 DiskLocchild 
  = 
  childForPos(pos); 
  // 
  查询当前pos的子结点信息，以寻找插入位置 
  
 
   
  if 
  (insert_debug)
 
  out 
  () 
  << 
   
  " 
  getChild( 
  " 
   
  << 
  pos 
  << 
   
  " 
  ): 
  " 
   
  << 
  child.toString() 
  << 
  endl;
 
  if 
  (child.isNull() 
  || 
   
  ! 
  rChild.isNull() 
  /* 
  在当前buckets中插入，即'internal'插入 
  */ 
  ){
 insertHere(thisLoc,pos,recordLoc,key,order,lChild,rChild,idx); 
  // 
  在当前buckets中插入 
  
 
   
  return 
   
  0 
  ;
 }
 
  // 
  如果有子结点，则在子结点上执行插入操作 
  
 
   
  return 
  child.btree() 
  -> 
  bt_insert(child,recordLoc,key,order,dupsAllowed,idx, 
  /* 
  toplevel 
  */ 
  false 
  );
 } 
 

上面_insert方法首先会使用二分法查找要插入的记录是否已存在于索引中，同时会返回一个插入点（pos），如不存在则会进一步在插入点位置查看找元素以决定是在当前bucket中插入，还是在当前pos位置的（右）子结点(bucket)上插入（这会再次递归调用上面的bt_insert方法），这里我们假定在当前bucket插入，则会执行insertHere方法（btree.cpp文件1183行），它的定义如下：

 
   
  /* 
  *
 *insertakeyinthisbucket,splittingifnecessary.
 *@keypos-wheretoinsertthekeyinrange0..n.0=makeleftmost,n=makerightmost.
 *NOTEthisfunctionmayfreesomedata,andasaresultthevaluepassedforkeyposmay
 *beinvalidaftercallinginsertHere()
 
  */ 
  
 
  void 
  BtreeBucket::insertHere( 
  const 
  DiskLocthisLoc, 
  int 
  keypos,
 
  const 
  DiskLocrecordLoc, 
  const 
  BSONObj 
  & 
  key, 
  const 
  Ordering 
  & 
  order,
 
  const 
  DiskLoclchild, 
  const 
  DiskLocrchild,IndexDetails 
  & 
  idx) 
  const 
  {
 
  if 
  (insert_debug)
 
  out 
  () 
  << 
   
  " 
   
  " 
   
  << 
  thisLoc.toString() 
  << 
   
  " 
  .insertHere 
  " 
   
  << 
  key.toString() 
  << 
   
  ' 
  / 
  ' 
   
  << 
  recordLoc.toString() 
  << 
   
  ' 
   
  ' 
  
 
  << 
  lchild.toString() 
  << 
   
  ' 
   
  ' 
   
  << 
  rchild.toString() 
  << 
   
  " 
  keypos: 
  " 
   
  << 
  keypos 
  << 
  endl;

 DiskLocoldLoc 
  = 
  thisLoc;
 
  // 
  根据keypos插入相应位置并将数据memcpy到内存指定位置 
  
 
   
  if 
  ( 
  ! 
  basicInsert(thisLoc,keypos,recordLoc,key,order)){
 
  // 
  如果插入无效，表示当前bucket已满，则分割记录并放到新创建的bucket中 
  
 
  thisLoc.btreemod() 
  -> 
  split(thisLoc,keypos,recordLoc,key,order,lchild,rchild,idx);
 
  return 
  ;
 }

 { 
  // 
  持久化当前thisLoc的结点信息并根据插入位置（是否最后一个key），来更新当前thisLoc（及后面key结点）的子结点信息 
  
 
   
  const 
  _KeyNode 
  * 
  _kn 
  = 
   
  & 
  k(keypos);
 _KeyNode 
  * 
  kn 
  = 
  (_KeyNode 
  * 
  )getDur().alreadyDeclared((_KeyNode 
  * 
  )_kn); 
  // 
  alreadydeclaredintentinbasicInsert() 
  
 
   
  if 
  (keypos 
  + 
  1 
   
  == 
  n){ 
  // 
  n为pack（打包后）存储的记录数，这里"判断等于n"表示为最后(last)一个key 
  
 
   
  if 
  (nextChild 
  != 
  lchild){ 
  // 
  如果是最后元素，那么"当前最高键值的右子结点应该与要插入的左子结点相同 
  
 
   
  out 
  () 
  << 
   
  " 
  ERRORnextChild!=lchild 
  " 
   
  << 
  endl;
 
  out 
  () 
  << 
   
  " 
  thisLoc: 
  " 
   
  << 
  thisLoc.toString() 
  << 
   
  ' 
   
  ' 
   
  << 
  idx.indexNamespace() 
  << 
  endl;
 
  out 
  () 
  << 
   
  " 
  keyPos: 
  " 
   
  << 
  keypos 
  << 
   
  " 
  n: 
  " 
   
  << 
  n 
  << 
  endl;
 
  out 
  () 
  << 
   
  " 
  nextChild: 
  " 
   
  << 
  nextChild.toString() 
  << 
   
  " 
  lchild: 
  " 
   
  << 
  lchild.toString() 
  << 
  endl;
 
  out 
  () 
  << 
   
  " 
  recordLoc: 
  " 
   
  << 
  recordLoc.toString() 
  << 
   
  " 
  rchild: 
  " 
   
  << 
  rchild.toString() 
  << 
  endl;
 
  out 
  () 
  << 
   
  " 
  key: 
  " 
   
  << 
  key.toString() 
  << 
  endl;
 dump();
 assert( 
  false 
  );
 }
 kn 
  -> 
  prevChildBucket 
  = 
  nextChild; 
  // 
  "当前最高键值的右子结点”绑定到持久化结点的左子结点 
  
 
  assert(kn 
  -> 
  prevChildBucket 
  == 
  lchild);
 nextChild.writing() 
  = 
  rchild; 
  // 
  持久化"当前最高键值的右子结点”，并将“要插入结点”的右子结点绑定到 
  
 
   
  if 
  ( 
  ! 
  rchild.isNull()) 
  // 
  如果有右子结点，则更新右子结点的父结点信息为当前thisLoc 
  
 
  rchild.btree() 
  -> 
  parent.writing() 
  = 
  thisLoc;
 }
 
  else 
  {
 
  // 
  如果keypos位置不是最后一个 
  
 
  kn 
  -> 
  prevChildBucket 
  = 
  lchild; 
  // 
  将左子结点绑定到keypos位置结点的左子结点上 
  
 
   
  if 
  (k(keypos 
  + 
  1 
  ).prevChildBucket 
  != 
  lchild){ 
  // 
  这时左子结点应该与下一个元素的左子结点相同 
  
 
   
  out 
  () 
  << 
   
  " 
  ERRORk(keypos+1).prevChildBucket!=lchild 
  " 
   
  << 
  endl;
 
  out 
  () 
  << 
   
  " 
  thisLoc: 
  " 
   
  << 
  thisLoc.toString() 
  << 
   
  ' 
   
  ' 
   
  << 
  idx.indexNamespace() 
  << 
  endl;
 
  out 
  () 
  << 
   
  " 
  keyPos: 
  " 
   
  << 
  keypos 
  << 
   
  " 
  n: 
  " 
   
  << 
  n 
  << 
  endl;
 
  out 
  () 
  << 
   
  " 
  k(keypos+1).pcb: 
  " 
   
  << 
  k(keypos 
  + 
  1 
  ).prevChildBucket.toString() 
  << 
   
  " 
  lchild: 
  " 
   
  << 
  lchild.toString() 
  << 
  endl;
 
  out 
  () 
  << 
   
  " 
  recordLoc: 
  " 
   
  << 
  recordLoc.toString() 
  << 
   
  " 
  rchild: 
  " 
   
  << 
  rchild.toString() 
  << 
  endl;
 
  out 
  () 
  << 
   
  " 
  key: 
  " 
   
  << 
  key.toString() 
  << 
  endl;
 dump();
 assert( 
  false 
  );
 }
 
  const 
  DiskLoc 
  * 
  pc 
  = 
   
  & 
  k(keypos 
  + 
  1 
  ).prevChildBucket; 
  // 
  获取keypos后面元素的左子结点信息 
  
 
   
  * 
  getDur().alreadyDeclared((DiskLoc 
  * 
  )pc) 
  = 
  rchild; 
  // 
  将右子结点绑定到下一个元素（keypos+1）的左子结点上declaredinbasicInsert() 
  
 
   
  if 
  ( 
  ! 
  rchild.isNull()) 
  // 
  如果有右子结点，则更新右子结点的父结点信息为当前thisLoc 
  
 
  rchild.btree() 
  -> 
  parent.writing() 
  = 
  thisLoc;
 }
 
  return 
  ;
 }
 } 
 

该方法中会调用一个叫basicInsert的方法，它主要会在当前bucket中指定位置（keypos）添加记录信息，同时持久化该结点信息，如下：

 
  // 
  tree.cpp1183 
  
 
   
  bool 
  BucketBasics::basicInsert( 
  const 
  DiskLocthisLoc, 
  int 
   
  & 
  keypos, 
  const 
  DiskLocrecordLoc, 
  const 
  BSONObj 
  & 
  key, 
  const 
  Ordering 
  & 
  order) 
  const 
  {
 assert(keypos 
  >= 
   
  0 
   
  && 
  keypos 
  <= 
  n);
 
  // 
  判断bucket剩余的空间是否满足当前数据需要的存储空间 
  
 
   
  int 
  bytesNeeded 
  = 
  key.objsize() 
  + 
   
  sizeof 
  (_KeyNode);
 
  if 
  (bytesNeeded 
  > 
  emptySize){
 _pack(thisLoc,order,keypos); 
  // 
  如不够用，进行一次整理打包操作，以为bucket中整理更多空间 
  
 
   
  if 
  (bytesNeeded 
  > 
  emptySize) 
  // 
  如还不够用，则返回 
  
 
   
  return 
   
  false 
  ;
 }

 BucketBasics 
  * 
  b; 
  // 
  声明Bucket管理对象指针，该对象提供了Bucket存储管理的基本操作和属性，如insert,_pack等 
  
 
  {
 
  const 
   
  char 
   
  * 
  p 
  = 
  ( 
  const 
   
  char 
   
  * 
  ) 
  & 
  k(keypos);
 
  const 
   
  char 
   
  * 
  q 
  = 
  ( 
  const 
   
  char 
   
  * 
  ) 
  & 
  k(n 
  + 
  1 
  );
 
  // 
  declarethatwewillwriteto[k(keypos),k(n)]
 
  // 
  todo:thiswritesamediumamounttothejournal.wemaywanttoaddaverb"shift"totheredologso
 
  // 
  wecanlogaverysmallamount. 
  
 
  b 
  = 
  (BucketBasics 
  * 
  )getDur().writingAtOffset(( 
  void 
   
  * 
  ) 
  this 
  ,p 
  - 
  ( 
  char 
  * 
  ) 
  this 
  ,q 
  - 
  p);
 
  // 
  如已有3个结点，目前要插到第三个结点之间，则对每三个元素进行迁移，
 
  // 
  e.g.n==3,keypos==2
 
  // 
  149
 
  // 
  ->
 
  // 
  14_9 
  
 
   
  for 
  ( 
  int 
  j 
  = 
  n;j 
  > 
  keypos;j 
  -- 
  ) 
  // 
  makeroom 
  
 
  b 
  -> 
  k(j) 
  = 
  b 
  -> 
  k(j 
  - 
  1 
  );
 }
 getDur().declareWriteIntent( 
  & 
  b 
  -> 
  emptySize, 
  12 
  ); 
  // 
  [b->emptySize..b->n]is12bytesandwearegoingtowritethose 
  
 
  b 
  -> 
  emptySize 
  -= 
   
  sizeof 
  (_KeyNode); 
  // 
  将当前bucket中的剩余空闲空间减少 
  
 
  b 
  -> 
  n 
  ++ 
  ; 
  // 
  已有结点数加1 
  
 
  
 _KeyNode 
  & 
  kn 
  = 
  b 
  -> 
  k(keypos);
 kn.prevChildBucket.Null(); 
  // 
  设置当前结点的左子结点为空 
  
 
  kn.recordLoc 
  = 
  recordLoc; 
  // 
  绑定结点记录信息 
  
 
  kn.setKeyDataOfs(( 
  short 
  )b 
  -> 
  _alloc(key.objsize())); 
  // 
  设置结点数据偏移信息 
  
 
   
  char 
   
  * 
  p 
  = 
  b 
  -> 
  dataAt(kn.keyDataOfs()); 
  // 
  实例化指向磁盘数据(journal文件)位置（含偏移量）的指针 
  
 
  getDur().declareWriteIntent(p,key.objsize()); 
  // 
  持久化结点数据信息 
  
 
  memcpy(p,key.objdata(),key.objsize()); 
  // 
  将当前结点信息复制到p指向的地址空间 
  
 
   
  return 
   
  true 
  ;
 } 
 

如果上面方法调用失效，则意味着当前 bucket中已有可用空间插入新记录，这时系统会调用 split（btree.cpp文件 1240行）方法来进行bucket分割，以创建新的bucket并将信息塞入其中，如下：

 
   
  void 
  BtreeBucket::split( 
  const 
  DiskLocthisLoc, 
  int 
  keypos, 
  const 
  DiskLocrecordLoc, 
  const 
  BSONObj 
  & 
  key, 
  const 
  Ordering 
  & 
  order, 
  const 
  DiskLoclchild, 
  const 
  DiskLocrchild,IndexDetails 
  & 
  idx){
 assertWritable();

 
  if 
  (split_debug)
 
  out 
  () 
  << 
   
  " 
   
  " 
   
  << 
  thisLoc.toString() 
  << 
   
  " 
  .split 
  " 
   
  << 
  endl;

 
  int 
  split 
  = 
  splitPos(keypos); 
  // 
  找到要迁移的数据位置 
  
 
  DiskLocrLoc 
  = 
  addBucket(idx); 
  // 
  添加一个新的BtreeBucket 
  
 
  BtreeBucket 
  * 
  r 
  = 
  rLoc.btreemod();
 
  if 
  (split_debug)
 
  out 
  () 
  << 
   
  " 
  split: 
  " 
   
  << 
  split 
  << 
   
  ' 
   
  ' 
   
  << 
  keyNode(split).key.toString() 
  << 
   
  " 
  n: 
  " 
   
  << 
  n 
  << 
  endl;
 
  for 
  ( 
  int 
  i 
  = 
  split 
  + 
  1 
  ;i 
  < 
  n;i 
  ++ 
  ){
 KeyNodekn 
  = 
  keyNode(i);
 r 
  -> 
  pushBack(kn.recordLoc,kn.key,order,kn.prevChildBucket); 
  // 
  向新bucket中迁移过剩数据 
  
 
  }
 r 
  -> 
  nextChild 
  = 
  nextChild; 
  // 
  绑定新bucket的右子结点 
  
 
  r 
  -> 
  assertValid(order);

 
  if 
  (split_debug)
 
  out 
  () 
  << 
   
  " 
  newrLoc: 
  " 
   
  << 
  rLoc.toString() 
  << 
  endl;
 r 
  = 
   
  0 
  ;
 rLoc.btree() 
  -> 
  fixParentPtrs(rLoc); 
  // 
  设置当前bucket树的父指针信息 
  
 
  
 {
 KeyNodesplitkey 
  = 
  keyNode(split); 
  // 
  获取内存中分割点位置所存储的数据 
  
 
  nextChild 
  = 
  splitkey.prevChildBucket; 
  // 
  提升splitkey键，它的子结点将会是thisLoc(l)和rLoc(r) 
  
 
   
  if 
  (split_debug){
 
  out 
  () 
  << 
   
  " 
  splitkeykey: 
  " 
   
  << 
  splitkey.key.toString() 
  << 
  endl;
 }

 
  // 
  将splitkey提升为父结点 
  
 
   
  if 
  (parent.isNull()){
 
  // 
  如果无父结点时，则创建一个，并将 
  
 
  DiskLocL 
  = 
  addBucket(idx);
 BtreeBucket 
  * 
  p 
  = 
  L.btreemod();
 p 
  -> 
  pushBack(splitkey.recordLoc,splitkey.key,order,thisLoc);
 p 
  -> 
  nextChild 
  = 
  rLoc; 
  // 
  将分割的bucket为了当前 
  
 
  p 
  -> 
  assertValid(order);
 parent 
  = 
  idx.head.writing() 
  = 
  L; 
  // 
  将splitkey提升为父结点 
  
 
   
  if 
  (split_debug)
 
  out 
  () 
  << 
   
  " 
  wewereroot,makingnewroot: 
  " 
   
  << 
  hex 
  << 
  parent.getOfs() 
  << 
  dec 
  << 
  endl;
 rLoc.btree() 
  -> 
  parent.writing() 
  = 
  parent;
 }
 
  else 
  {
 
  // 
  setthisbeforecalling_insert-ifitsplitsitwilldofixParent()logicandchangethevalue. 
  
 
  rLoc.btree() 
  -> 
  parent.writing() 
  = 
  parent;
 
  if 
  (split_debug)
 
  out 
  () 
  << 
   
  " 
  promotingsplitkeykey 
  " 
   
  << 
  splitkey.key.toString() 
  << 
  endl;
 
  // 
  提升splitkey键，它的左子结点thisLoc，右子点rLoc 
  
 
  parent.btree() 
  -> 
  _insert(parent,splitkey.recordLoc,splitkey.key,order, 
  /* 
  dupsallowed 
  */ 
  true 
  ,thisLoc,rLoc,idx);
 }
 }

 
  int 
  newpos 
  = 
  keypos;
 
  // 
  打包压缩数据(pack,移除无用数据)，以提供更多空间 
  
 
  truncateTo(split,order,newpos); 
  // 
  notethismaytrashsplitkey.key.thuswehadtopromoteitbeforefinishinguphere.

 
  // 
  addournewkey,thereisroomnow 
  
 
  {
 
  if 
  (keypos 
  <= 
  split){ 
  // 
  如果还有空间存储新键 
  
 
   
  if 
  (split_debug)
 
  out 
  () 
  << 
   
  " 
  keypos<split,insertHere()thenewkey 
  " 
   
  << 
  endl;
 insertHere(thisLoc,newpos,recordLoc,key,order,lchild,rchild,idx); 
  // 
  再次向当前bucket中添加记录 
  
 
  }
 
  else 
  { 
  // 
  如压缩之后依旧无可用空间，则向新创建的bucket中添加节点 
  
 
   
  int 
  kp 
  = 
  keypos 
  - 
  split 
  - 
  1 
  ;
 assert(kp 
  >= 
  0 
  );
 rLoc.btree() 
  -> 
  insertHere(rLoc,kp,recordLoc,key,order,lchild,rchild,idx);
 }
 }

 
  if 
  (split_debug)
 
  out 
  () 
  << 
   
  " 
  splitend 
  " 
   
  << 
  hex 
  << 
  thisLoc.getOfs() 
  << 
  dec 
  << 
  endl;
 } 
 

好了，今天的内容到这里就告一段落了，在接下来的文章中，将会介绍客户端发起Delete操作时，Mongodb的执行流程和相应实现部分。

原文链接:http://www.cnblogs.com/daizhj/archive/2011/03/30/1999699.html
作者: daizhj, 代震军
微博: http://t.sina.com.cn/daizhj
Tags: mongodb,c++,btree

作者:代震军发表于 2011-03-30 13:23原文链接

关键字 mongodb源码分析, 插入记录及索引b树构建

你可能感兴趣的:(mongodb)

实战｜StarRocks 通过 JDBC Catalog 访问 MongoDB 的数据
方案介绍本文档介绍如何通过StarRocks的JDBCCatalog功能，结合MongoDBBIConnector，将MongoDB数据便捷接入StarRocks，实现数据打通和SQL查询分析，以下是整体流程图。前提条件StarRocks环境：版本≥3.0，支持JDBCCatalog功能。MongoDBBIConnector：已安装并运行，版本需与MongoDB兼容（参考MongoDB官方文档）。
什么是 MongoDB？它的主要特点有哪些？真IT布道者 android
一、MongoDB概述MongoDB是一个开源的、面向文档的NoSQL数据库系统，由MongoDBInc.公司开发并维护。它采用BSON（BinaryJSON）格式存储数据，属于分布式文档数据库的类别。关键结论：MongoDB通过灵活的文档模型、水平扩展能力和丰富的查询功能，成为现代应用开发中最流行的NoSQL数据库之一。二、核心架构特点1.文档数据模型MongoDB使用文档（Document）作
MongoDB 与关系型数据库的核心区别（面试向详解）真IT布道者数据库 mongodb 面试
一、数据模型差异1.1结构化vs半结构化关系型数据库：严格遵循二维表结构，需要预定义Schema（字段名、数据类型、约束等）CREATETABLEusers(idINTPRIMARYKEY,nameVARCHAR(50)NOTNULL,ageINTCHECK(age>0)MongoDB：采用BSON文档模型（类似JSON），支持动态Schema//同一个集合中可以存在不同结构的文档db.users
mongodb替代品SequoiaDB的安装使用码农下的天桥 mongodb sequoiadb 数据库
前言1、为什么不直接使用mongodb啊？答：mongodb的使用协议是SSPL，一旦使用需要将你服务器程序都开源处理–或者给钱。非常不好，而SequoiaDB号称能够兼容mongodb协议，这次来安装试试。mongodb-SSPL，SequoiaDB是AGPL3，勉强比mongodb的协议可用。至少不修改则不用开源。准备工作首先去官网下载：www.sequoiadb.com我下载的版本是：也不知
MongoDB与Redis有哪些区别相遇在春风里经验分享
MongoDB和Redis是两种不同类型的数据库，它们存在以下区别：一、数据模型MongoDBMongoDB是一个文档型数据库，它使用BSON（BinaryJSON）格式存储数据。数据以类似JSON的文档形式组织，每个文档可以有不同的结构（即模式自由）。例如，在一个存储用户信息的集合中，一个用户文档可能包含姓名、年龄、地址等字段，而另一个用户文档可能还包含额外的兴趣爱好字段。这种数据模型非常适合处
mongodb和redis的区别： huangbfeng mongodb redis 数据库
1、内存管理机制Redis数据全部存在内存，定期写入磁盘，当内存不够时，可以选择指定的LRU算法删除数据。MongoDB数据存在内存，由linux系统mmap实现，当内存不够时，只将热点数据放入内存，其他数据存在磁盘。2、支持的数据结构Redis支持的数据结构丰富，包括hash、set、list等。MongoDB数据结构比较单一，但是支持丰富的数据表达，索引，最类似关系型数据库，支持的查询语言非常
Akka Persistence MongoDB 驱动：高效持久化解决方案韩烨琰
AkkaPersistenceMongoDB驱动：高效持久化解决方案akka-persistence-mongoImplementationofakka-persistencestoragepluginsformongodb项目地址:https://gitcode.com/gh_mirrors/ak/akka-persistence-mongo项目介绍AkkaPersistenceMongoDB驱
MongoDB框架零基础入门码农研究僧 Python 100天精通全栈 mongodb nosql 数据库
目录前言1.安装配置2.关启配置3.基本概念4.基本操作4.1创建集合4.2删除集合4.3插入文档4.4更新文档4.5删除文档4.6查询文档前言先科普讲解一下NoSQL（notonlysql）本身NoSQL非关系型数据库就具备了ACID（原子性、一致性、持久性、隔离性）数据持久化一般还是要使用关系型数据库，内存的数据库使用检索MongoDB是C++编写，一个基于分布式文件存储的开源数据库系统。将其
AWS DocumentDB vs MongoDB：数据库的技术抉择在云上（oncloudai）数据库 aws mongodb
随着非关系型数据库在现代应用中的广泛应用，文档型数据库因其灵活的结构与出色的扩展性，逐渐成为企业开发与架构设计中的核心选择。在众多文档数据库中，MongoDB凭借其成熟生态与社区支持占据主导地位；与此同时，AWS提供的AmazonDocumentDB（withMongoDBcompatibility）也成为云原生架构下的重要选项。那么，AmazonDocumentDB与MongoDB究竟有何异同？
MongoDB 高性能应用场景与实践 AI自闭实验者 mongodb 数据库
```htmlMongoDB高性能应用场景与实践MongoDB高性能应用场景与实践随着大数据时代的到来，数据库作为数据存储和管理的核心工具，其性能和可扩展性显得尤为重要。在众多的数据库解决方案中，MongoDB凭借其灵活的数据模型、高性能和易于扩展的特点，在许多场景下成为开发者的首选。什么是MongoDB？MongoDB是一个开源的、面向文档的NoSQL数据库管理系统。它以JSON样式的文档存储数
缓存与加速技术实践-MongoDB数据库应用曼汐 . 数据库缓存 mongodb
一.什么是MongoDBMongoDB是一个文档型数据库，数据以类似JSON的文档形式存储。MongoDB的设计理念是为了应对大数据量、高性能和灵活性需求。MongoDB使用集合（Collections）来组织文档（Documents），每个文档都是由键值对组成的。数据库（Database）：存储数据的容器，类似于关系型数据库中的数据库。集合（Collection）：数据库中的一个集合，类似于关系
（mysql、oracle、pgsql、mongodb、redis、es）主流数据库的核心差异不愿意透露姓名的樊同学数据库 mysql oracle postgresql
以下是主流数据库的核心差异及适用场景的全面对比，结合技术特性和实际应用需求整理：一、数据库分类与核心差异1.关系型数据库（RDBMS）数据库核心特点适用场景MySQL开源、读写性能均衡，易用性高，但复杂查询较弱Web应用（博客/电商）、中小企业OLTP系统（如用户管理）Oracle商业级、强事务支持（RAC集群）、功能全面，成本高金融核心系统（银行交易）、大型ERP（复杂事务）PostgreSQL
MongoDB入门指南：从零开始掌握NoSQL数据库辗转.953 mongodb nosql 数据库
目录一、MongoDB简介（一）什么是MongoDB？（二）MongoDB的特点（三）MongoDB的应用场景二、安装MongoDB（一）安装MongoDBServer1.Windows安装2.Linux安装（以Ubuntu为例）3.macOS安装（使用Homebrew）（二）安装MongoDB客户端安装MongoDBCompass三、MongoDB基本概念（一）数据库（Database）（二）集
【MongoDB】MongoDB从零开始详细教程核心概念与原理环境搭建基础操作夜雨hiyeyu.com mongodb 数据库 java spring boot 数据库架构 spring cloud sql
MongoDB从零开始详细教程核心概念与原理环境搭建基础操作一、核心概念与原理1.核心组件2.MongoDBvs关系型数据库二、环境搭建（Windows/Linux/CentOS）1.Windows安装2.CentOS安装3.连接验证三、基础操作（CRUD）1.数据库与集合操作2.文档增删改查四、高级特性与优化1.索引优化2.聚合管道（Aggregation）3.分片集群与副本集五、编程语言集成（
NoSQL保障MongoDB数据库副本集和MongoDB副本集操作覃炳文20230322027 数据库 nosql mongodb
MongoDB是一个基于文档的NoSQL数据库，它支持多种数据存储模型，包括副本集（ReplicaSets）。副本集是MongoDB的一种高可用性和数据冗余机制，它由一组MongoDB实例组成，其中包含一个主节点（Primary）和多个从节点（Secondary）。副本集的主要目的是提供数据的冗余和高可用性，确保在主节点发生故障时，从节点可以接管服务。NoSQL保障通常指的是非关系型数据库（如Mo
Linux - firewall week@eight Linux linux 运维服务器
使用firewall-cmd管理Linux防火墙的实用指南在Linux系统中，尤其是基于RedHat的发行版（如CentOS、Fedora、RHEL），firewalld是默认的动态防火墙管理工具。它通过firewall-cmd命令提供了一个灵活的方式来管理网络规则和端口访问控制。本文将介绍如何使用firewall-cmd来查看和配置防火墙规则，并结合MongoDB和SSH服务进行示例说明。一、查
mongodb 新手入门，原理，优化，详细介绍附上代码夜雨hiyeyu.com java mongodb 数据库 nosql sql 数据库架构 java springboot
mongodb新手入门，原理，优化，详细介绍附上代码一、新手入门指南1.核心概念2.安装与启动3.基础操作（Shell命令）二、核心原理详解1.数据模型与存储2.集群架构3.索引机制三、性能优化策略1.查询优化2.资源配置3.设计模式优化四、实战代码示例Node.js操作MongoDBPython操作MongoDB总结一、新手入门指南1.核心概念文档（Document）：MongoDB的基本数据单
Docker 常见容器第三方镜像地址 Docker国内镜像 docker国内镜像 docker镜像头上一片天空 Docker docker 容器运维
Docker常见容器第三方镜像地址Docker国内镜像docker国内镜像docker镜像Docker常见容器第三方镜像地址Docker国内镜像docker国内镜像docker镜像注意这里提供的镜像需要区分Inter和AMD架构，等后面会慢慢补齐amd架构镜像1、MySQLInter平台AMD平台2、SQLServer(mssql)3、Oracle4、MongoDBInter/AMD平台5、Red
docker 安装mongodb 启航挨踢 docker docker 容器运维
docker安装mongodbdocker安装mongodb前，需要在服务器上先安装docker运行环境，可参考博文：linux搭建docker和docker-compose运行环境-CSDN博客1.上传mongo_latest.tar镜像到/home/datamongo_latest.tar可自行下载或到我的博客资源中心下载2.使用命令：dockerload-imongo_latest.tar加
MongoDb 有必要分库么旷野说数据库 mongodb 数据库
在MongoDB中，数据分散在‌多个数据库（DB）‌中查询与集中在‌单个数据库‌中查询的性能差异主要取决于资源分配、并发操作和系统负载。以下是关键区别：‌资源隔离vs.资源共享‌多个数据库‌：优势‌：每个数据库拥有独立的文件、锁和内存缓存（WiredTiger缓存）。在高并发场景下，不同数据库的查询可减少资源竞争（如锁争用）。劣势‌：若物理资源（CPU、内存、磁盘I/O）有限，多个数据库可能分散缓
Node.js 后端开发实战：项目搭建与优化 AI大模型应用实战 Java开发实战 node.js ai
Node.js后端开发实战：项目搭建与优化关键词：Node.js、后端开发、项目搭建、性能优化、Express框架、MongoDB、RESTfulAPI摘要：本文深入探讨Node.js后端开发的实战技巧，从项目搭建到性能优化的完整流程。我们将从基础架构设计开始，逐步深入到核心算法实现、数据库优化策略，最后分享实际项目中的性能调优经验。通过本文，读者将掌握构建高性能Node.js后端服务的关键技术和
MongoDB官方文档V4.0详细解读与实践偏偏无理取闹
本文还有配套的精品资源，点击获取简介：MongoDB是一个流行的开源文档数据库，特别适合处理大规模非结构化数据。版本4.0在性能、可扩展性和功能上都有显著提升，包括了对ACID事务的支持、变更流的引入、分片功能的加强以及WiredTiger存储引擎的更新。本官方文档详细介绍了这些特性以及聚合框架的增强、安全性提升等，为开发者提供了学习和掌握MongoDB的宝贵资料。文档涵盖了从基础知识到高级特性，
Docker Desktop 4.42集成的MCP工具包深海科技服务行业发展 IT应用探讨 docker 容器运维
一、介绍DockerDesktop4.42集成了MCP（Model‑Client‑Plugin）Toolkit，无需额外安装扩展即可直接使用。MCPToolkit集成细节内置于DockerDesktop：你可以直接打开应用，在设置中启用MCP服务器，比如GitHub、MongoDB、HashiCorp等，连接客户端（如ClaudeDesktop、Cursor）或Docker自家的AI代理Gordo
Python爬虫进阶：Scrapy+Playwright+智能解析高效爬取B站游戏实况视频数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫 scrapy 笔记开发语言游戏音视频
摘要本文将深入讲解如何构建一个高性能B站游戏实况视频爬虫系统，涵盖从逆向工程到分布式部署的全流程。项目采用Scrapy框架作为核心，集成Playwright处理动态渲染，使用智能解析技术应对B站反爬机制，结合MongoDB和Elasticsearch构建数据存储与检索系统，最终实现每小时可处理10万+视频数据的专业级采集方案。1.B站数据生态分析1.1游戏区数据价值热门游戏实时监测UP主影响力评估
DBeaver和Navicat哪个功能更强大？ java
从功能和适用场景来看，DBeaver与Navicat各有优势，具体取决于用户需求：‌1.数据库支持范围‌‌DBeaver‌：支持超过‌50种数据库‌，包括主流关系型数据库（MySQL、Oracle等）及NoSQL（Cassandra、MongoDB等）和云数据库，通过JDBC驱动扩展兼容性极强。‌Navicat‌：覆盖主流数据库（MySQL、PostgreSQL、SQLServer等）及部分云数据
java spark 操作 mongo实践哆啦A梦00 spark java spark
javaspark操作mongo实践按照官方文档配置https://docs.mongodb.com/spark-connector/master/java-api/需要说明一下，官方文档中要求引入的pom文件不全如果你是用IDEA创建的springboot项目要注意不要引入spring-boot-starter-data-mongodb下面是完整的pom引用,里面的exclusions主要是解决
构建Node.js应用：Mongoose模型与路由王大帅爱钢炼 Mongoose模型路由控制器 HTTP请求模板引擎
构建Node.js应用：Mongoose模型与路由背景简介随着Web应用开发需求的日益增长，Node.js以其非阻塞I/O模型和事件驱动的特性在后端开发领域变得越来越流行。本文将基于给定章节内容，详细讨论如何在Node.js应用中使用Mongoose构建模型，并创建相应的路由和控制器。创建Mongoose模型在Node.js应用中，数据模型的定义是基础。Mongoose作为MongoDB的ODM（
Mongodb之Objectid 进步哥数据库 mongodb 数据库 python
文章目录一、Objectid的概述二、Objectid的结构三、Objectid的用途四、Objectid在python中的使用1、生成一个Objectid2、指定生成Objectid3、依据时间来生成Objectid4、obj.binary来生成ObjectId5、判断是否是ObjectId对象五、使用pymong将数据导一、Objectid的概述ObjectID是MongoDB文档的默认主键，
MongoDB学习快速入门菜鸟不想菜 mongodb mongodb java
MongoDB学习快速入门1.启动服务参考文章2.基本操作CRUD2.1创建、删除数据库#创建，没有该数据库的时候就会创建它，该数据库存在时进入该数据库#刚刚新建数据库时使用showdbs还不能显示，因为还存在内存中，当该数据库创建collection后自动刷新到磁盘usedb_name;#删除db.dropDatabase()MongoDB中默认的数据库为test，如果你没有创建新的数据库，集合
Studio 3T 2025.11 - MongoDB 的终极 GUI、IDE 和客户端 mongodb
Studio3T2025.11(macOS,Linux,Windows)-MongoDB的终极GUI、IDE和客户端TheUltimateGUI,IDEandclientforMongoDB请访问原文链接：Studio3T2025.10(macOS,Linux,Windows)-MongoDB的终极GUI、IDE和客户端查看最新版。原创作品，转载请保留出处。作者主页：sysin.orgStudio
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">