默默努力的小熊

linux内核源码阅读之facebook硬盘加速flashcache之八

前面我们的分析中重点关注正常的数据流程，这一小节关注如果有异常，那么流程是怎么走完的呢？

1）创建新任务时kcached_job申请不到

2）读写命中时cache块为忙

3）系统关机时处理，系统开机时处理，系统异常掉电后的处理

首先来看第1种情况，申请kcached_job是在函数flashcache_lookup中，

543/* 
544 * dbn is the starting sector, io_size is the number of sectors.
545 */
546static int 
547flashcache_lookup(struct cache_c *dmc, struct bio *bio, int *index)
548{
549     sector_t dbn = bio->bi_sector;
550#if DMC_DEBUG
551     int io_size = to_sector(bio->bi_size);
552#endif
553     unsigned long set_number = hash_block(dmc, dbn);
554     int invalid, oldest_clean = -1;
555     int start_index;
556
557     start_index = dmc->assoc * set_number;
558     DPRINTK("Cache lookup : dbn %llu(%lu), set = %d",
559          dbn, io_size, set_number);
560     find_valid_dbn(dmc, dbn, start_index, index);
561     if (*index > 0) {
562          DPRINTK("Cache lookup HIT: Block %llu(%lu): VALID index %d",
563                    dbn, io_size, *index);
564          /* We found the exact range of blocks we are looking for */
565          return VALID;
566     }
567     invalid = find_invalid_dbn(dmc, start_index);
568     if (invalid == -1) {
569          /* We didn't find an invalid entry, search for oldest valid entry */
570          find_reclaim_dbn(dmc, start_index, &oldest_clean);
571     }
572     /* 
573     * Cache miss :
574     * We can't choose an entry marked INPROG, but choose the oldest
575     * INVALID or the oldest VALID entry.
576     */
577     *index = start_index + dmc->assoc;
578     if (invalid != -1) {
579          DPRINTK("Cache lookup MISS (INVALID): dbn %llu(%lu), set = %d, index = %d, start_index = %d",
580                    dbn, io_size, set_number, invalid, start_index);
581          *index = invalid;
582     } else if (oldest_clean != -1) {
583          DPRINTK("Cache lookup MISS (VALID): dbn %llu(%lu), set = %d, index = %d, start_index = %d",
584                    dbn, io_size, set_number, oldest_clean, start_index);
585          *index = oldest_clean;
586     } else {
587          DPRINTK_LITE("Cache read lookup MISS (NOROOM): dbn %llu(%lu), set = %d",
588               dbn, io_size, set_number);
589     }
590     if (*index < (start_index + dmc->assoc))
591          return INVALID;
592     else {
593          dmc->noroom++;
594          return -1;
595     }
596}

直接看返回值有三种情况：valid, invalid, -1

valid 命中，invalid 找到空闲块，-1 没有可用cache块，为什么会没有可用cache块呢？逐一来看代码。

553行，hash_block返回当前dbn所在的集合下标。

557行，start_index为当前集合第1个cache块下标。

560行，在当前集合里查找dbn是否命中，如果命中index返回cache块下标，否则置index=-1。

561行，命中，返回cache块下标。

567行，在当前集合里查找一个可用的cache块，找到返回cache块下标，否则返回-1.

568行，找不到可用的cache块。继续查看可否回收一个cache块。

578行，找到可用cache块。

582行，回收了一个cache块。

590行，不管是找到还是回收的，反正已经有cache块了，返回invalid

594行，没有cache块可用。

回到flashcache_read函数，1234行返回的值为-1，接着到1252行将相交的cache块的置为无效。如果说设置无效也失败的话，那这个请求就不能下发了，因为下发到磁盘之后，后面缓存中cache块往磁盘回写，这块数据就被覆盖了。所以就来到了1255行直接返回-EIO错误。

将相交cache块设置无效之后，来到1264行，尝试先刷一些脏cache块。最后到1267行将数据直接下发到磁盘。

直接下发到磁盘的回调函数是flashcache_uncached_io_callback

1864static void 
1865flashcache_uncached_io_callback(unsigned long error, void *context)
1866{
1867     struct kcached_job *job = (struct kcached_job *) context;
1868
1869     VERIFY(job->index == -1);
1870     push_uncached_io_complete(job);
1871     schedule_work(&_kcached_wq);
1872}

_kcached_wq调用到函数flashcache_uncached_io_complete，

1805/*
1806 * We handle uncached IOs ourselves to deal with the problem of out of ordered
1807 * IOs corrupting the cache. Consider the case where we get 2 concurent IOs
1808 * for the same block Write-Read (or a Write-Write). Consider the case where
1809 * the first Write is uncacheable and the second IO is cacheable. If the 
1810 * 2 IOs are out-of-ordered below flashcache, then we will cache inconsistent
1811 * data in flashcache (persistently).
1812 * 
1813 * We do invalidations before launching uncacheable IOs to disk. But in case
1814 * of out of ordering the invalidations before launching the IOs does not help.
1815 * We need to invalidate after the IO completes.
1816 * 
1817 * Doing invalidations after the completion of an uncacheable IO will cause 
1818 * any overlapping dirty blocks in the cache to be written out and the IO 
1819 * relaunched. If the overlapping blocks are busy, the IO is relaunched to 
1820 * disk also (post invalidation). In these 2 cases, we will end up sending
1821 * 2 disk IOs for the block. But this is a rare case.
1822 * 
1823 * When 2 IOs for the same block are sent down (by un co-operating processes)
1824 * the storage stack is allowed to re-order the IOs at will. So the applications
1825 * cannot expect any ordering at all.
1826 * 
1827 * What we try to avoid here is inconsistencies between disk and the ssd cache.
1828 */

首先看注释。uncached的IO由于其返回顺序无法预测，可能引起cache数据错误。例如，有2个对同一个块并发IO，一个是写，另一个是读。写IO直接下发到磁盘，读IO找到可用的cache块，读先回来而写后回来，读回来时将cache块设置为读出数据，而实际上这个时候该数据已经不是最新的了。

在下发uncached IO时已经将相关cache块设置为invalid。但是如果出现了前面讲了乱序IO下发时invalid是没有用的。因此还需要在IO结束的时候再次invalid cache块。

做invalid cache块将可能触发脏块写回磁盘，然后然发这个IO。如果这个要写的脏块忙，需要等到空闲再发起，然后再次启动这个uncached IO。在这两种情况下，都要发起两次IO，一次是写脏次，一次是重新发uncached IO。

两个IO同时操作同一块数据时（由不相关进程下发），是有可能按任意次序完成的，所以上层应用不能预测其次序。

我们所能做的只是保持缓存和磁盘的一致。

其实上面说了半天，就是用来解释为什么在uncached IO结束的时候也要调用一下1844行的flashcache_inval_blocks。

1829void 
1830flashcache_uncached_io_complete(struct kcached_job *job)
1831{
1832     struct cache_c *dmc = job->dmc;
1833     unsigned long flags;
1834     int queued;
1835     int error = job->error;
1836
1837     if (unlikely(error)) {
1838          if (bio_data_dir(job->bio) == WRITE)
1839               dmc->disk_write_errors++;
1840          else
1841               dmc->disk_read_errors++;
1842     }
1843     spin_lock_irqsave(&dmc->cache_spin_lock, flags);
1844     queued = flashcache_inval_blocks(dmc, job->bio);
1845     spin_unlock_irqrestore(&dmc->cache_spin_lock, flags);
1846     if (queued) {
1847          if (unlikely(queued < 0))
1848               flashcache_bio_endio(job->bio, -EIO);
1849          /* 
1850          * The IO will be re-executed.
1851          * The do_pending logic will re-launch the 
1852          * disk IO post-invalidation calling start_uncached_io.
1853          * This should be a rare occurrence though.
1854          * XXX - We should track this.
1855          */
1856     } else {
1857          flashcache_bio_endio(job->bio, error);
1858     }
1859     flashcache_free_cache_job(job);
1860     if (atomic_dec_and_test(&dmc->nr_jobs))
1861          wake_up(&dmc->destroyq);
1862}

1837行，uncached IO失败，做下统计。

1846行，看简简单单就一个queued判断，其背后的哲学可真不小。从1847行我们看出queued不仅有可能是小于0的，还有可能是大于0的，等于0的情况下最简单：到1857行返回IO。

先看queued小于0的情况，小于0表示申请pending_job失败，到1848行，返回失败，但这时候悲剧就出现了，就像注释里描述的一样，磁盘的数据是uncached IO写回的数据，但缓存里却是另一份数据。

如果queued大于0，实际上在这个函数里就什么都没做，到1859行释放kcached_job。
但这只是表面现象，就好像看到别人成功很容易，却不曾知道别人在背后下了多少苦功。queued大于0在这里没有做什么事情。但在背后默默努力工作着。所以现实中你看到的都是片面的，你听到的都是不可靠的，就连孔老夫子也曾经感慨说，自己亲眼看到的事情都不一定是事情的真相。所以有一句话叫做谣言止于智者，缺少思考的人只会成为他人利用的对象。所以下一次再看到一篇没有证实的微博、一段评论、一则小道消息时，如果对他人会产生伤害就不要再随意转发了。

为了追踪到queued何时返回大于0，我们跟到flashcache_inval_blocks，再继续跟到flashcache_inval_block_set：

1288/*
1289 * Invalidate any colliding blocks if they are !BUSY and !DIRTY. If the colliding
1290 * block is DIRTY, we need to kick off a write. In both cases, we need to wait 
1291 * until the underlying IO is finished, and then proceed with the invalidation.
1292 */
1293static int
1294flashcache_inval_block_set(struct cache_c *dmc, int set, struct bio *bio, int rw,
1295                  struct pending_job *pjob)
1296{
1297     sector_t io_start = bio->bi_sector;
1298     sector_t io_end = bio->bi_sector + (to_sector(bio->bi_size) - 1);
1299     int start_index, end_index, i;
1300     struct cacheblock *cacheblk;
1301     
1302     start_index = dmc->assoc * set;
1303     end_index = start_index + dmc->assoc;
1304     for (i = start_index ; i < end_index ; i++) {
1305          sector_t start_dbn = dmc->cache[i].dbn;
1306          sector_t end_dbn = start_dbn + dmc->block_size;
1307          
1308          cacheblk = &dmc->cache[i];
1309          if (cacheblk->cache_state & INVALID)
1310               continue;
1311          if ((io_start >= start_dbn && io_start < end_dbn) ||
1312              (io_end >= start_dbn && io_end < end_dbn)) {
1313               /* We have a match */
1314               if (rw == WRITE)
1315                    dmc->wr_invalidates++;
1316               else
1317                    dmc->rd_invalidates++;
1318               if (!(cacheblk->cache_state & (BLOCK_IO_INPROG | DIRTY)) &&
1319                   (cacheblk->head == NULL)) {
1320                    dmc->cached_blocks--;               
1321                    DPRINTK("Cache invalidate (!BUSY): Block %llu %lx",
1322                         start_dbn, cacheblk->cache_state);
1323                    cacheblk->cache_state = INVALID;
1324                    continue;
1325               }
1326               /*
1327               * The conflicting block has either IO in progress or is 
1328               * Dirty. In all cases, we need to add ourselves to the 
1329               * pending queue. Then if the block is dirty, we kick off
1330               * an IO to clean the block. 
1331               * Note that if the block is dirty and IO is in progress
1332               * on it, the do_pending handler will clean the block
1333               * and then process the pending queue.
1334               */
1335               flashcache_enq_pending(dmc, bio, i, INVALIDATE, pjob);
1336               if ((cacheblk->cache_state & (DIRTY | BLOCK_IO_INPROG)) == DIRTY) {
1337                    /* 
1338                    * Kick off block write.
1339                    * We can't kick off the write under the spinlock.
1340                    * Instead, we mark the slot DISKWRITEINPROG, drop 
1341                    * the spinlock and kick off the write. A block marked
1342                    * DISKWRITEINPROG cannot change underneath us. 
1343                    * to enqueue ourselves onto it's pending queue.
1344                    *
1345                    * XXX - The dropping of the lock here can be avoided if
1346                    * we punt the cleaning of the block to the worker thread,
1347                    * at the cost of a context switch.
1348                    */
1349                    cacheblk->cache_state |= DISKWRITEINPROG;
1350                    spin_unlock_irq(&dmc->cache_spin_lock);
1351                    flashcache_dirty_writeback(dmc, i); /* Must inc nr_jobs */
1352                    spin_lock_irq(&dmc->cache_spin_lock);
1353               }
1354               return 1;
1355          }
1356     }
1357     return 0;
1358}

我们直接找返回大于0的地方就在1354行，再继续往回找是1311行if里面，这个if语句就表示bio跟cache块有交集。

1318行，如果cache块不为脏且不忙的话直接设置invalid，并continue。

接着看1327行注释，冲突块可能是忙或者脏，在这两种情况下，都需要加入pending队列。如果只是脏，立即触发一次写回磁盘。如果同时是脏和忙，那么do_pending处理函数会先将脏块写回然后再继续处理。作者真是费了苦心来写这一大堆注释，但如果没有这些注释，后面在do_pending的处理也确实不大好看懂。

到这里故事还没有结束，因为在1335行插入了一个pending_job，那么这个任务什么时候执行呢？

在flashcache_md_write_done里会看到调用到flashcache_do_pending，

359void
360flashcache_do_pending(struct kcached_job *job)
361{
362     if (job->error)
363          flashcache_do_pending_error(job);
364     else
365          flashcache_do_pending_noerror(job);
366}

362行，IO返回错误，跟进去看看错误处理

262/* 
263 * Common error handling for everything.
264 * 1) If the block isn't dirty, invalidate it.
265 * 2) Error all pending IOs that totally or partly overlap this block.
266 * 3) Free the job.
267 */
268static void
269flashcache_do_pending_error(struct kcached_job *job)
270{
271     struct cache_c *dmc = job->dmc;
272     unsigned long flags;
273     struct cacheblock *cacheblk = &dmc->cache[job->index];
274
275     DMERR("flashcache_do_pending_error: error %d block %lu action %d", 
276           -job->error, job->disk.sector, job->action);
277     spin_lock_irqsave(&dmc->cache_spin_lock, flags);
278     VERIFY(cacheblk->cache_state & VALID);
279     /* Invalidate block if possible */
280     if ((cacheblk->cache_state & DIRTY) == 0) {
281          dmc->cached_blocks--;
282          dmc->pending_inval++;
283          cacheblk->cache_state &= ~VALID;
284          cacheblk->cache_state |= INVALID;
285     }
286     flashcache_free_pending_jobs(dmc, cacheblk, job->error);
287     cacheblk->cache_state &= ~(BLOCK_IO_INPROG);
288     spin_unlock_irqrestore(&dmc->cache_spin_lock, flags);
289     flashcache_free_cache_job(job);
290     if (atomic_dec_and_test(&dmc->nr_jobs))
291          wake_up(&dmc->destroyq);
292}

如果cache块不为脏，则直接设置为invalid。将pending IO都返回错误，释放kcached_job。

但我们更关心flashcache_do_pending_noerror

294static void
295flashcache_do_pending_noerror(struct kcached_job *job)
296{
297     struct cache_c *dmc = job->dmc;
298     int index = job->index;
299     unsigned long flags;
300     struct pending_job *pending_job;
301     int queued;
302     struct cacheblock *cacheblk = &dmc->cache[index];
303
304     spin_lock_irqsave(&dmc->cache_spin_lock, flags);
305     if (cacheblk->cache_state & DIRTY) {
306          cacheblk->cache_state &= ~(BLOCK_IO_INPROG);
307          cacheblk->cache_state |= DISKWRITEINPROG;
308          spin_unlock_irqrestore(&dmc->cache_spin_lock, flags);
309          flashcache_dirty_writeback(dmc, index);
310          goto out;
311     }
312     DPRINTK("flashcache_do_pending: Index %d %lx",
313          index, cacheblk->cache_state);
314     VERIFY(cacheblk->cache_state & VALID);
315     dmc->cached_blocks--;
316     dmc->pending_inval++;
317     cacheblk->cache_state &= ~VALID;
318     cacheblk->cache_state |= INVALID;
319     while (cacheblk->head) {
320          VERIFY(!(cacheblk->cache_state & DIRTY));
321          pending_job = cacheblk->head;
322          cacheblk->head = pending_job->next;
323          VERIFY(cacheblk->nr_queued > 0);
324          cacheblk->nr_queued--;
325          if (pending_job->action == INVALIDATE) {
326               DPRINTK("flashcache_do_pending: INVALIDATE  %llu",
327                    next_job->bio->bi_sector);
328               VERIFY(pending_job->bio != NULL);
329               queued = flashcache_inval_blocks(dmc, pending_job->bio);
330               if (queued) {
331                    if (unlikely(queued < 0)) {
332                         /*
333                         * Memory allocation failure inside inval_blocks.
334                         * Fail this io.
335                         */
336                         flashcache_bio_endio(pending_job->bio, -EIO);
337                    }
338                    flashcache_free_pending_job(pending_job);
339                    continue;
340               }
341          }
342          spin_unlock_irqrestore(&dmc->cache_spin_lock, flags);
343          DPRINTK("flashcache_do_pending: Sending down IO %llu",
344               pending_job->bio->bi_sector);
345          /* Start uncached IO */
346          flashcache_start_uncached_io(dmc, pending_job->bio);
347          flashcache_free_pending_job(pending_job);
348          spin_lock_irqsave(&dmc->cache_spin_lock, flags);
349     }
350     VERIFY(cacheblk->nr_queued == 0);
351     cacheblk->cache_state &= ~(BLOCK_IO_INPROG);
352     spin_unlock_irqrestore(&dmc->cache_spin_lock, flags);
353out:
354     flashcache_free_cache_job(job);
355     if (atomic_dec_and_test(&dmc->nr_jobs))
356          wake_up(&dmc->destroyq);
357}

这个函数分为两部分，第一部分是如果cache块为脏，则下发后立即返回，等待第二次调用，第二次调用才真正到处理pending_job，记得我们在上文中插入的pending_job是INVALIDATE的，那么这里也正如前面注释里所说下发了两次IO，一次是写回脏块，后一次是下发uncached IO。

319行，取出invalid的pending_job

320行，确认非dirty，因为第一次调用的时候已经写回了

325行，if语句成立，

329行，因为cache块已写回，就不脏不忙了，flashcache_inval_blocks只要设置invalid就可以返回成功

346行，下发uncached IO

至此uncached IO之旅告一个段落了。

接下来讲第2种情况读写命中但cache块忙的情况下是怎么处理的。

读写IO在cache块忙的情况下做出的表现是惊人的一致，那就是创建pending_job并挂入cache块队列中。这对我们来说已经是轻车熟路，不过我们这一次要跟踪的是读写IO的情况。经过前面的分析我们知道，pending_job是在flashcache_do_pending_noerror函数中处理的。同样如果为脏块要刷一次脏块，第二次进入到319行循环，由于Action为READCACHE或者WRITECACHE，直接到346行下发uncached IO。第2种情况的处理也就宣告结束了。似乎显得仓促，现实就是这样的，永远别想像电影里那样大起大落，只要你内心够从容，平平淡淡才是真。

第3种情况就留给大家自己分析，如果对这几个小节都已经熟悉，那就已经是小case了。

至此，flashcache源码的分析也就结束了，我也非常高兴能够坚持写完，因为这确实是一个非常耗时间的过程。如果你阅读之后能有所收获，那将是我最大的欢喜了。

C++常见知识掌握 nfgo c++开发语言
1.Linux软件开发、调试与维护内核与系统结构Linux内核是操作系统的核心，负责管理硬件资源，提供系统服务，它是系统软件与硬件之间的桥梁。主要组成部分包括：进程管理：内核通过调度器分配CPU时间给各个进程，实现进程的创建、调度、终止等操作。使用进程描述符（task_struct）来存储进程信息，包括状态（就绪、运行、阻塞等）、优先级、内存映射等。内存管理：包括物理内存和虚拟内存管理。通过页表映
KVM虚拟机源代码分析【转】 xidianjiapei001 #虚拟化技术
1.KVM结构及工作原理1.1KVM结构KVM基本结构有两部分组成。一个是KVMDriver，已经成为Linux内核的一个模块。负责虚拟机的创建，虚拟内存的分配，虚拟CPU寄存器的读写以及虚拟CPU的运行等。另外一个是稍微修改过的Qemu，用于模拟PC硬件的用户空间组件，提供I/O设备模型以及访问外设的途径。KVM基本结构如图1所示。其中KVM加入到标准的Linux内核中，被组织成Linux中标准
Android shell 常用 debug 命令晨春计 Audio debug android linux
目录1、查看版本2、am命令3、pm命令4、dumpsys命令5、sed命令6、log定位查看APK进程号7、log定位使用场景1、查看版本1.1、Android串口终端执行getpropro.build.version.release#获取Android版本uname-a#查看linux内核版本信息uname-r#单独查看内核版本1.2、linux服务器执行lsb_release-a#查看Lin
讲解Linux内核操作系统——进程状态与转换 Linux加油站网络服务器运维
一.进程控制进程控制的主要功能是对系统中的所有进程实施有效的管理，它具有创建新进程、撤销已有进程、实现进程状态转换等功能。在操作系统中，一般把进程控制用的程序段称为原语，原语的特点是执行期间不允许中断，它是一个不可分割的基本单位。1.1创建进程UNIX中进程为树状层次结构，Windows下所有进程没有层次结构允许一个进程创建另一个进程，创建者称为父进程，被创建的进程称为子进程。子进程可以继承父进程
Ubuntu系统入门指南：常用命令详解像风一样自由2020 ubuntu ubuntu linux 运维
Ubuntu系统入门指南：常用命令详解引言Ubuntu是一个基于Linux内核的开源操作系统，由Canonical公司和社区共同开发和维护。它以易用性、稳定性和广泛的软件支持而著称，广泛应用于个人电脑、服务器和云计算环境。对于新手来说，掌握Ubuntu的基本命令行操作可以大大提高工作效率和系统管理能力。Ubuntu通常每六个月发布一个新版本，每两年会推出一个长期支持（LTS）版本，提供五年的安全更
framebuffer帧缓存我相遇拾年缓存
framebuffer:帧缓冲，帧缓存Linux内核为显示提供的一套应用程序接口。（驱动内核支持）framebuffer本质上是一块显示缓存，往显示缓存中写入特定格式的数据就意味着向屏幕输出内容。framebuffer驱动程序控制LCD显示设备，通过映射framebuffer设备到用户空间，应用程序可以直接对显存进行操作，从而控制LCD显示内容framebuffer使用显示屏：800*600（横向
linux查看git log目录,教你玩转Git-查看提交历史郁清叔叔 linux查看git log目录
导读Git是一个开源的分布式版本控制系统，用于敏捷高效地处理任何或小或大的项目。Git是LinusTorvalds为了帮助管理Linux内核开发而开发的一个开放源码的版本控制软件。Git与常用的版本控制工具CVS,Subversion等不同，它采用了分布式版本库的方式，不必服务器端软件支持。在使用Git提交了若干更新之后，又或者克隆了某个项目，想回顾下提交历史，我们可以使用gitlog命令查看。针
Android的内核 setsailgo android runtime
Android的内核是基于Linux的长期支持版本的“Android通用内核(ACK)”。Android作为一个广泛使用的操作系统，其根基在于内核的设计和功能。下面将深入探讨Android内核的各个方面，从其基本结构到与Linux内核的关系，再到内核的版本管理及在设备上的应用：Android内核的基础结构基于Linux的内核：Android内核是构建在Linux长期支持版本之上的，这使得其能够充分
数据结构—内核链表 LEE_C17 数据结构链表 arm开发
一，内核链表内核链表是一种在操作系统内核中广泛使用的数据结构，特别是在Linux内核中。它主要用于高效地管理和遍历内核中的对象，如进程、设备、文件等。内核链表通常基于双向链表或双向循环链表实现，具有以下特点：双向性：每个链表节点都包含指向前一个节点和后一个节点的指针，这使得从任何节点出发都可以方便地遍历整个链表。通用性：内核链表的设计使其能够通用于不同类型的内核对象。通过在结构体中包含一个指向链表
解锁前端新潜能：如何使用 Rust 锈化前端工具链京东零售技术前端 taro 前端 taro
前言近年来，Rust的受欢迎程度不断上升。首先，在操作系统领域，Rust已成为Linux内核官方认可的开发语言之一，Windows也宣布将使用Rust来重写内核，并重写部分驱动程序。此外，国内手机厂商Vivo也宣布使用Rust开发了名为“蓝河”的操作系统。除此之外，Rust在图形渲染、游戏开发、中间件开发、边缘计算、计算安全等领域也是遍地开花，可以说，Rust正在以惊人的速度重塑着各个领域的发展，
io_uring异步IO 天夏123 php 开发语言
io_uring介绍io_uring是一个Linux内核的异步I/O框架，它提供了高性能的异步I/O操作，io_uring的目标是通过减少系统调用和上下文切换的开销来提高I/O操作的性能。在网络编程中，我们通常使用epollIO多路复用来处理网络IO，然而epoll也并不是异步网络IO，仅仅是内核提供了IO复用机制，epoll回调通知的是数据可以读取或者写入了，具体的读写操作仍然需要用户去做，而不
Linux内核以后会分块逐步用Rust重写吗? 纵然间 linux rust 运维
Linux内核已经积累了大量的代码，包括数百万行的C和C++代码。要想重写这些代码需要巨大的人力和时间投入，且存在很高的风险。这些代码已经过长时间的测试和验证，具有很高的稳定性和可靠性。Rust虽然是一种强调安全性和性能的系统编程语言，但其相对于C和C++来说仍然较新，在Linux内核开发领域的应用还相对较少。用Rust重写Linux内核需要开发者具备深厚的Rust编程技能和经验，以及对Linux
深入理解Linux内核：一部开源的探索之旅宋溪普Gale
深入理解Linux内核：一部开源的探索之旅项目介绍linux-insides-ko是一个致力于将原始英文版《linux-insides》翻译成韩语的开源项目，旨在为那些对Linux内核和底层操作机制感兴趣的读者提供深入浅出的教程。这本书详细阐述了Linux内核的工作原理以及其内部结构，无论你是初学者还是经验丰富的开发者，都能从中受益匪浅。项目技术分析该项目以Markdown格式编写，易于阅读且便于
linux启动优化内核裁剪详细说明（2） keep study linux
第一部分Linux内核裁减（1）安装新内核:i)将新内核copy到/usr/src下并解压：#tar-zxvflinux-2.6.38.4.tar.gzii)将名为linux的符号链接删掉,这是旧版本内核的符号链接.#ln-slinux-2.6.38.4linux（2）设置内核.#cd/usr/src/linux#makemrproper-----删除不必要的文件和目录.#makemenuconf
6.11 linux内核管理：内核版本阳光的王小草 linux整理 linux 内核版本
6.11linux内核管理：内核版本cat/proc/versionLinuxversion3.10.0-229.4.2.el7.x86_64([email protected])(gccversion4.8.220140120(RedHat4.8.2-16)(GCC))#1SMPWedMay1310:06:09UTC2015uname-aLinuxjenkins3.1
一篇文章带你读懂 io_uring 的接口与实现 Linux高级开发 Linux服务器开发 linux 运维服务器 epoll accept
io_uring是Linux提供的一个异步I/O接口。io_uring在2019年加入Linux内核，经过了两年的发展，现在已经变得非常强大。本文基于Linux5.12.10介绍io_uring接口。io_uring的实现主要在fs/io_uring.c中。io_uring的用户态APIio_uring的实现仅仅使用了三个syscall：io_uring_setup,io_uring_enter和
【io_uring】简介和使用 ywang_wnlo 存储 liburing io_uring
文章目录简介使用系统调用liburing样例代码流程编译参考资料简介io_uring是Linux在5.1版本引入的一套新的异步IO实现。相比Linux在2.6版本引入的AIO，io_uring性能强很多，接近SPDK[1]，同时支持bufferIOio_uring的作者JensAxboe是Linux内核块层和其他块设备的维护者，同时也是CFQ、Noop、Deadline调度器、blktrace以及
linux内核调度,深入linux内核架构--核心调度器编程幽谷隐士 linux内核调度
内存中保存了每个进程的唯一描述信息，并通过若干结构与其他进程连接起来，那么调度器的核心任务就是高效公平的执行各个进程中的内存代码段。那么一个好的调度器，需要满足哪些条件呢？高效性：应该尽量减小调度器产生的额外开销。公平性：应该尽量保证每个作业都能被执行，也应该保证每个cpu都有均衡的作业。灵活性：可以动态的设置作业的优先级，良好的迁移能力，不同作业具有不同的权利等。隔离性：不让作业之间彼此影响。控
vue项目架构影子信息前端 javascript
搭建项目框架,封装模块1.网络模块封装axios二次封装请求拦截器token是什么响应拦截器http协议2.动态权限菜单axios二次封装函数递归动态添加路由addRoutes刷新界面，菜单丢失问题，持久化存储技术实现点击菜单，不能找到路由组件问题,3.按钮资源权限根据登录用户角色获取能操作的资源列表，保存store自定义权限指令,封装有无操作该资源的权限v-permission=“[‘EditU
浅谈Docker引擎秦偏执 docker引擎
在Docker首次发布的时候，Docker引擎由两个核心构成，即：LXC和Dockerdaemon。由LXC来基于Linux内核的容器虚拟化技术来提供像NameSpace,Cgruop等基础工具的操作技术；由Daemon来统一负责镜像的管理，容器生命周期的管理，认证等工作。这样做也带来了很多的缺点，首先：LXC是基于Linux的，这对于一个立志与跨平台的项目来说本身就是一个瓶颈；其次，使用一个外部
浏览器百科：网页存储篇-Session storage介绍（七）守城小轩浏览器应用 chrome devtools chrome 指纹浏览器浏览器开发
1.引言在上一篇文章中，我们详细探讨了localStorage的各种应用实例和使用方法。本篇文章将继续网页存储系列，聚焦于Sessionstorage。Sessionstorage与localStorage类似，都用于在客户端存储数据，但它们之间存在一些关键差异。通过了解Sessionstorage的特性和应用场景，开发者可以更灵活地选择和运用网页存储技术，提升网页应用的用户体验和数据管理能力。在
嵌入式设备上SystemTap调试工具使用塵觴葉杂谈 linux bpf
SystemTap调试工具简介SystemTap调试器常用于Linux内核的动态调试，不过该工具集也可用于应用的跟踪调试。随着Linux内核及其应用程序的复杂度不断加深，使用一些在功能上区别于传统的GDB调试工具就变得越来越重要了。这类调试工具具有低延时(LowLatency)，高性能，动态调试的特点。嵌入式Linux设备的系统软件通常不需从头开发，这些调试工具可以帮助开发者快速理解Linux内核
systemtap原理及使用 csr_hema
SystemTap的架构SystemTap用于检查运行的内核的两种方法是Kprobes和返回探针。但是理解任何内核的最关键要素是内核的映射，它提供符号信息（比如函数、变量以及它们的地址）。有了内核映射之后，就可以解决任何符号的地址，以及更改探针的行为。Kprobes从2.6.9版本开始就添加到主流的Linux内核中，并且为探测内核提供一般性服务。它提供一些不同的服务，但最重要的两种服务是Kprob
zybo上运行linux,Zybo开发板linux作业系统移植周行文 zybo上运行linux
文章主要介紹zyboboard上linux作业系统移植过程。分别介绍了开发环境搭建、U-boot编译、linux内核编译、busybox制作等流程及注意事项。文章使用的开发板是zynq7000系列的zyboboard。Vivado版本是2015.1.主机系统是Debian9.1.开发环境搭建工欲善其事必先利其器，做开发前搭建好编译环境是重要的一步，这些步骤大体上都相同，然而对于不同的系统平台、硬件
Android内核介绍 zhang_li_bin Android Android Linux C C#C++
Android内核介绍Android内核介绍发布时间：2010年4月8日作者：EasyAndroidtags：已经有一些的文章介绍Android内核了，本系列篇将从Linux内核的角度来分析Android的内核，希望给初学者提够有用的信息。本章将简单的介绍Android内核的全貌，起到一个抛砖引玉的作用。从下一篇开始将详细介绍每一个Android内核驱动程序及其作用。Android内核是基于Lin
linux驱动 -- PWM配置和SysFs操作方法悟凡爱学习 linux驱动 linux 运维服务器
1：PWM介绍PWM的定义为:可调节脉冲调节器，换句话来说就是一个总周期不变，占空比可调节的方波。2：PWM的总周期和占空比、有效点平方波：在信号领域一般分为数字信号和模拟信号，数字信号就两种状态：0和1，相互交替成为方波。总周期：从1状态到1状态。也就是总周期为：从一个电平再回到这个电平。占空比：有效电平占据占总周期的比例有效电平：器件生效的电平3：linux内核下的PWM3.1linux下的P
8.12（LVS负载均衡） WPFwpf_ lvs 负载均衡运维
一、LVS（一）什么是LVSlinuxvirturalserver的简称，也就是linxu虚拟机服务器，这是一个由章文岩博士发起的开源项目，官网是http://www.linuxvirtualserver.org,现在lvs已经是linux内核标准的-部分，使用lvS可以达到的技术目标是:通过linux达到负载均衡技术和linux操作系统实现一个高性能高可用的linux服务器集群，他具有良好的可性
页面缓存（Page Cache） TABE_ 操作系统页缓存操作系统
我们知道文件一般存放在硬盘（机械硬盘或固态硬盘）中，CPU并不能直接访问硬盘中的数据，而是需要先将硬盘中的数据读入到内存中，然后才能被CPU访问。由于读写硬盘的速度比读写内存要慢很多（DDR4内存读写速度是机械硬盘500倍，是固态硬盘的200倍）。为了避免每次读写文件时，都需要对硬盘进行读写操作，Linux内核会以页大小（4KB）为单位，将文件划分为多数据块，当用户对文件中的某个数据块进行读写操作
ARM64的函数调用标准和栈布局奔跑吧Linux社区 linux
欢迎订阅奔跑吧linux社区微信公众号本文节选自《奔跑吧Linux内核》第二版卷1第1.6章函数调用标准（ProcedureCallStandard，PCS）用来描述父/子函数是如何编译、链接的，特别是父函数和子函数之间调用关系的约定，如栈的布局、参数的传递等。每个处理器架构都有不同的函数调用标准，本章重点介绍ARM64的函数调用标准。ARM公司有一份描述ARM64架构函数调用的标准和规范文档，这
深入理解 Linux epoll：高性能事件驱动的核心技术程序修炼之道 c++linux 音视频计算机网络
介绍在高并发网络编程中，有效地管理大量的客户端连接是至关重要的。传统的I/O多路复用技术如select和poll在连接数较少时表现良好，但在连接数增加时性能下降明显。而Epoll则是一种高效的I/O多路复用技术，被广泛应用于服务器编程中，特别是在大规模并发连接的场景下。Epoll概述Epoll是Linux内核提供的一种事件通知机制，用于处理大量的I/O事件。Epoll在管理大量连接时具有更高的效率
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》

linux内核源码阅读之facebook硬盘加速flashcache之八

你可能感兴趣的:(Linux内核,存储技术)