新钛云服

聊聊运维应该了解的一些内核知识|万字长文

前言

本文主要是《Linux内核设计与实现》这本书的读书笔记，这本书我读了不下十遍，但依然感觉囫囵吞枣。我结合自己的理解，从这本书中整理出了一些运维应该了解的内核知识，希望对大家能够有所帮助。另外，推荐大家读下这边书，这本书主要讲内核设计、实现原理和方法，有利于理解内核的一些机理。

运维为什么要了解内核
进程
系统调用
中断
内核同步
定时器和时间管理
内存分配
虚拟文件系统
块I/O层
I/O算法
页高速缓存和页回写
关于内核的几个概念

一、运维为什么要了解内核

运维为什么要了解内核

大神Linus说了解内核的方法就是阅读源码（*Read The Fucking Source Code*），但是linux内核学习曲线公认的陡峭，对于运维来说难度非常大，而且现代Linux已经非常庞大，别说运维了，就是专门从事Linux内核开发的人，也不可能了解到内核的全部代码。

但是运维应该了解内核的工作原理，设计哲学，了解CPU、网络的调度方法，了解内存、文件系统的结构。

了解了Linux系统如何工作，我们才能更好的使用它，让它为我们服务。

Linux的由来

内核为什么吸引人，很重要的一个原因是自由精神，可以随手拿到源码，只有愿意，可以了解到每个功能非常细微的地方。

Linux内核是如何来的，1991年，芬兰的大学生Linus热衷于使用Minix，一种教学用的Unix系统，但是他不能随意修改和发布该系统的源代码，这令他对这个系统的设计理念感到失望，于是就自己在386上设计了一款系统，并发布到了互联网上，很快就流行了起来。

顺便说下，Linux的吉祥物为什么是企鹅，那是因为Linus小的时候，被一只企鹅咬过，令他印象深刻。关于Linus还有一本书，叫做《只是为了好玩--linux之父林纳斯自传》，大家有兴趣可以阅读下。

我这里有一些数据，来自2017年度Linux内核开发者报告，通过这些数字，大家对目前的内核生态会有简单的了解。

目前，已有超过1400家公司的15600名开发人员参与了Linux内核的开发。仅就2016年到2017年，超过500家公司的4300多名开发人员对内核做出了贡献；其中有1670个开发者是第一次贡献，约占贡献者的三分之一。

2017年度，赞助Linux内核开发的十大组织包括英特尔、Red Hat、Linaro、IBM、三星、SUSE、谷歌、AMD、Renesas和Mellanox。

Linux开发的速度继续增加，参与开发的人员和公司的数量也在不断增加。内核每小时的平均变化量为8.5，比2016年报告中的7.8个变化显著增加，这意味着每天有204个变化，每周超过1400个变化。

从2016年的66天开始，平均每个版本的开发天数从去年的66天增加到67.66天，每一个版本的间隔时间分别为63或70天，提供了显著的可预测性。4.9和4.12开发周期的特点是，在内核项目历史上看到的最高补丁率。

未领取薪酬的开发者可能正在趋于稳定，这些开发者贡献了8.2%的贡献，比去年的7.7%有所增加。这一数字仍远低于2014年的11.8%。这可能是由于内核开发人员短缺，导致那些有能力提交一定质量补丁的人，在找到工作时没有困难。

新加入内核开发的前三名是英特尔、谷歌、华为，其中华为投入33名工程师。

Linux内核的设计哲学

Linux内核设计参考了Unix，并且兼容Unix API，但是Linux内核吸收了Unix系统的优点，摒弃了一些缺点。

先来了解一个概念，单内核和微内核。

单内核是整体单独的一个过程，存储方式往往也是一个大的二进制文件，使用的也是连续的一整块内存。所有服务都运行在内核态，内核之间的通信就很容易，内核可以直接调用函数。
微内核是按照功能划分为多个独立过程，这个过程叫做服务器，只有少数特权服务的服务器才运行在特权模式下，大部分服务运行在用户空间。大部分服务都使用自己的内存地址，不可能像单内核那样直接调用函数，而是要通过消息传递，系统采用进程间通讯的机制，专业术语叫IPC机制。这样的好处是一项服务失效，并不会影响到其他服务，因为彼此隔离。

因为IPC机制的开销多用于函数调用，有大量的内核空间和用户空间的上下文切换，因此，消息传递需要一定的周期，而单内核就没有这个问题。

这样还造成一个结果，就是实际上，微内核为了提高效率，会让大部分服务位于内核态。

Windows NT内核系统，包括Windows7 Windows10 Windows Server系列，MacOS都是典型的微内核系统。

前段时间，华为推出的鸿蒙系统，也宣称是微内核系统。

Linux系统是单内核系统，也就是说Linux系统运行在单独的内核地址空间上，不过Linux吸取了微内核的精华，引入了模块化设计，抢占式内核，支持内核线程，及动态装载内核的能力。同时还避免了微内核设计上的性能损失。

可见Linux的设计哲学是实用主义优先。

再解释下什么是内核抢占，抢占指的是内核具有允许在内核运行的任务优先执行的能力，大部分Unix系统是不支持这个能力的。

再来介绍下内核的版本，内核有两种版本，稳定版和开发版，稳定版有工业级的强度，可以广泛部署，开发版主要用于实现新的功能。

Linux内核通过简单的命名机制区分稳定版和开发版，使用3个或者4个点分隔数字，代表不同的版本，第一个数字是主版本号，第二个数字是从版本号，第三个数字是修改版本号，第四个数字是可选，是稳定版本号。从第二个数字可以看出是稳定版还是开发版，如果是偶数就是稳定版，如果是奇数就是开发版。

比如内核版本2.6.26.1就是稳定版，因为它的第二个数字是6，是偶数。内核版本4.9就是开发版，因为9是奇数。

二、进程

先来聊聊Linux内核开发，内核开发和普通应用开发有两个地方不一样：

自己要管理内存，普通应用跑在内核之上，内核可以帮你管理内存，但是你自己就是内核，你必须自己做好内核管理，要不很容易就内核溢出了。
没有库文件，普通应用程序有很多库文件可以调用，内核开发则没有，内核开发就是标准的C。

由此看见，做内核开发还是要对内核有深刻的理解才可以，请注意，这里的内核开发指的是内核核心功能的开发。

我们再来看看进程，进程简单的讲，就是运行中的程序，我个人理解，进程是一种生命形式，就像一个人的生命，从呱呱坠地开始一直到生命的终结，中间需要不停的从周围的环境吸收资源，并且对环境也施加影响。

进程需要的资源就是CPU、内存、文件、网络等资源，进程虽然是从程序文件开始，但是不等于程序文件，一个程序文件可以启动多个进程，一个进程也可能是由多个程序文件产生的，所以进程是一种运行中的状态。

内核用一个双向循环链表来描述进程的状态，这一链表在32位的机器上是1.7KB大小，链表中的每一项都是类型为task_struct，称为进程描述符的结构。进程描述符就不详细介绍了。

下面我们来看看进程的状态标志，进程有5种状态标志：

第一 task_running 运行，进程正在运行，或者正在队列中等待运行，运行的进程可以在用户空间，也可以在内核中。
第二 task_interruptible 可中断，或者被阻塞，等待某些条件，一旦达到条件就被唤醒，然后进入运行状态。
第三 task_uninterruptible 不可中断，这种状态，即使收到外部的信号，也不会被唤醒，这种状态一般用的比较少。
第四 task_traced 被其他进程跟踪，例如通过ptrace对进程进行跟踪调试。
第五 task_stoped 停止，进程没有运行也不能运行的状态。

下面在介绍几个概念

第一个概念，进程上下文

进程从可执行文件载入进程的内存地址空间运行，一般是在用户空间，当进程调用了系统接口，或者触发了某种异常，它就进入了内核空间，此时，我们称内核代表进程执行，并处于进程上下文中，总结下，就是内核和进程交互的时候，就是上下文状态，请注意，后面我们还会介绍中断的上下文，和进程的上下文是有区别的，中断上下文中，系统不代表进程执行，而是执行一个中断程序。

第二个概念，进程家族树

Linux系统中，所有的进程都是PID为1的init进程的后代，内核在系统启动的最后阶段启动init进程，该进程读取系统的初始化脚本，并执行其他的相关程序，最终完成系统的启动。

系统中的每个进程必有一个父进程，每个进程也会拥有灵感或者多个子进程，拥有同一父进程的所有进程被称为兄弟进程，进程间的关系也保存在前面提到的进程描述符中。

第三个概念，写时拷贝

Linux系统创建新的进程的时候，使用的是写时拷贝的技术，这样的好处是可以推迟甚至免除数据拷贝，子进程共享父进程的资源，只有当需要写入的时候

我们通过几个概念的解释，来清晰化下内核对进程的调度

第一什么是进程调度

进程调度就是决定进程什么时候运行，可以运行多长时间，进程调度程序的使命就是尽可能的让进程多运行，提高效率。

第二什么是多任务

多任务就是能够并发的执行多个进程，在单处理器上，这是一个假象，其实就是多个进程快速的在处理器上快速切进切出。

第三什么是抢占式内核

多任务系统可以划分两类，非抢占式多任务和抢占式多任务，抢占式多任务就是由内核决定什么时候停止进程的运行，这个强制的动作就叫抢占。相反，除非进程主动停止，否则就一直运行，就是非抢占式多任务，显然，非抢占式多任务要依靠进程的自觉和良好设计，很古老的Windows3.1就是这样的系统，我大概是20年前接触到的，1996年的时候，这样的系统一个特点就是容易死机，但是当时看惯了黑黑屏幕的dos，看到窗口式的Windows，给人还是非常震撼的感觉。

第四时间片

进程被抢占之前的时间是预先设置好的，有一个专门的名字，就是进程的时间片，调度策略必须规定一个默认的时间片，这里需要平衡，时间片太长影响系统的交互体验，时间片太短，会增加进程切换的频率，引起过多处理器消耗。

许多操作系统有默认的时间片长度，比如10ms，但是linux没有默认的时间片长度，Linux按照比例来划分，这样负载大的进程获得的处理器使用时间就更长。

第五 Linux的调度算法

在2.4内核以前，Linux内核调度很简陋，2.5内核中引入了Q（1）的调度程序，可以完美支持几十个处理器的进程调度，但是Q（1）算法对对时间敏感的程序有一些先天不足，因此Q（1）适合服务器，但是不适合桌面系统。

2.6内核中，引入了完全公平算法，简称是CFS，目前Linux系统默认使用的都是CFS算法。

第六 IO消耗型和处理器消耗型的进程

IO消耗型的进程总在等待IO请求，占有处理器时间比较少，大部分用户图形界面程序都是IO消耗型。相反，如果处理器消耗型进程，就是把时间大多用于代码执行上，IO请求比较少。

当然也有即是IO消耗型也是处理器消耗型的进程，比如字处理程序，大部分时间是IO消耗型，但是当执行拼写检查的时候，就是处理器消耗型。

进程调度策略经常要在进程响应速度和最大系统利用率之间找平衡，这个背后是复杂的算法，不同操作系统的倾向性也不一样，Linux系统倾向io消耗型，这样响应速度快，用户体验好。

第七进程优先级

Linux采用两种不同的优先级范围：

第一种是nice值，范围是-20到+19，默认是0，越低的nice值，可以获得更多的处理器时间。
第二种是实时优先级，变化范围是0到99，和nice值相反，越高的值，优先级越高。

两种优先级划分有什么区别，任何实时进程优先级高于普通进程，就是说两种优先级处于互不交互的两个范畴。

进一步说明下，进程分为普通进程和实时进程，普通进程使用CFS算法调度，优先级按照nice值区分。

实时进程有两种调度算法，FIFO，即先进先出，这种进程一直占用处理器，直到自己受阻塞或者释放处理器，如果有多个FIFO优先级进程，则会轮流执行。

另外一种实时进程调度算法是RR，RR进程是按照时间片分配的，优先级范围就是0到99 。

注意，再强调下，实时进程总会抢占普通进程。

三、系统调用

用户空间进程不是和硬件设备直接通讯的，而是有一个中间层，这样做的好处有三个：

第一，为用户空间提供了一种硬件的抽象接口，这样用户空间进程就不用关心具体的硬件信息。
第二，限制了用户空间进程的行为，防止对其他进程造成影响，保证了系统的稳定和安全。
第三，隔离进程使用的资源，方便内核调度。

一般的进程调用是通过API实现的，不是直接调用内核，API有一套标准，叫POSIX，Unix，Linux，甚至Windows都支持POSIX，只是大家支持的程度不一样。

具体内核的API如何实现，这个要依靠Linux内核程序员，关于系统调用，运维了解到这些知识就可以了。

四、中断

还是通过几个概念来了解中断。

第一什么是中断

中断就是键盘、鼠标、硬盘、显卡、网卡等硬件和处理器的通讯。

大部分硬件的运行速度和处理器比起来低很多，硬件要和处理器通讯，有两种方式，一种方式是处理器轮询各个硬件，一种方式是硬件主动来找处理器，实际上是硬件给处理器主动上报，因为这种方式效率更高，硬件在需要的时候给处理器发出信息，处理器来响应，这个就是中断处理。

中断信息实际就是电信号，硬件，比如键盘控制器，在你敲击键盘的时候会发出中断，信号进入中断控制器，然后进入处理器，处理器再通知操作系统。

第二 IRQ

不同的设备对应的中断不同，每个中断都有唯一的数字标志，这样系统就能区分具体的设备，这些中断值被称作IRQ，中文的意思就是中断请求线。

比如，在经典的PC机上，IRQ0是时钟中端，IRQ1是键盘中断，但是这样也有问题，设备越来越多，原来的设计，中断号有限，经常会引起冲突，我记00年初，刚有声卡的时候，经常声卡因为中断冲突而不能使用，解决方法就是更换一个PCI插槽。

所以后来就有了动态分配中断值的方法，PCI设备都是动态分配中断号的，最终的目标关键是硬件能和处理器通讯，能够引起处理器注意。

第三异常

异常简单的说，就是程序出错，需要内核来处理的时候，通常由于编程失误而导致的错误指令，比如被0除，或者是在执行期间出现特殊情况，比如缺页。这时候就需要内核来处理，因为处理器体系结构处理异常与处理中断方式类似，因此，内核对他们的处理也很类似，实际上，异常也常常被称为同步中断。

第四中断处理程序

在响应一个特定的中断的时候，内核会执行一个函数，这个函数就是中断处理程序interrput handler ，或者中断服务例程interrupt service routine，简称ISR。产生中断的每个设备都一个相应的中断处理程序。

第五中断的上半部和下半部

又想中断处理程序运行的快，又想中断处理程序完成的工作量多，这是矛盾的，为了解决这个矛盾，我们把中断处理切为两个部分，中断处理程序是上半部top half，接收到中断，立即开始执行，但只做严格时限的工作，例如对接收的中断进行应答和复位硬件，这些工作都是在所有中断被禁止的情况下完成的，所以必须尽可能快的完成。能够被允许稍后完成的工作推迟到下半部，bottom half.

用网卡做一个例子解释下，当网卡接收到网络的数据包的时候，需要通知内核数据包到了，网卡需要立即完成这件事，从而优化网络的吞吐量和传输周期，以避免超时。这时候中断开始执行，通知硬件，拷贝最新的网络数据包到内存，然后读取网卡更多的数据包，这些都是重要、紧张而又与硬件相关的工作。

内核需要快速拷贝网络数据包到内存，因为网卡的缓存的大小是固定的，如果速度不够快，就会造成溢出，网卡就会丢弃数据包。

当数据拷贝到内存，中断的任务就完成了，它将控制权交还给系统系统中断前运行的程序，数据处理在随后的下半部进行。

第六中断上下文

当执行一个中断处理程序的时候，内核处于中断上下问interrput context，我们回忆下前面提到的进程上下文，进程上下文是内核所处的操作模式，此时内核代表进程执行。

与进程上下文相反，中断上下文和进程没有关系，因为没有后备进程，所以中断上下文不可以睡眠，中断上下文有严格的时间限制，因为它打短了其他代码，

在Linux系统中，查看中断的情况，可以使用命令，可以看出详细的中断情况：

cat /proc/interrputs

中断上半部处理需要紧急处理的任务，包括对时间敏感，和硬件息息相关，不希望被其他中断打断的任务，其他不紧急的任务，都交给下半部处理。

通常我们希望尽可能的将任务交给中断下半部处理，因为上半部处理的时候，会造成其他中断被屏蔽，那么下半部是如何处理的呢，有三种方法。

第一种方法， BH，即bottom half，这是最早的中断处理机制，也是早期的唯一方法，同时只能有一个BH处理，即使有多个处理器。从内核2.5 版本开始，BH方法已经被放弃。
第二种方法，任务队列，为了充分使用多处理性能，内核开发者引入了任务队列的机制，task queue，内核定义了一组队列，驱动程序来和队列匹配，任务队列的方案在处理性能要求比较高的子系统，比如网络部分，也不能胜任。
第三种方法，软中断和tasklet，这种方法是在内核2.3版本中引入的，软中断可以在所有处理器上同时执行，tasklet是一种基于软中断实现的灵活性强、动态创建的下半部实现机制，两个不同类型的tasklet可以同时在不同的处理器上执行，但是类型相同的tasklet不能同时执行，tasklet是性能和易用性之间平衡的产物，可以处理大部分下半部中断处理。像网络这样对性能要求比较高的情况，才需要使用软中断。

五、内核同步

我们还是通过几个概念来了解下什么是内核同步。

第一个概念为什么会有内核同步问题

在使用共享内存的应用程序中，程序员必须特别留意保护共享资源，防止共享资源并发访问，防止多个线程同时访问和操作数据，造成数据互相覆盖，和数据不一致。

在单一处理器的时候，这个还好办，只有在中断发生，或者重新调度另一个任务的时候，数据才可能被并发访问。

到了多处理的时代，问题变的复杂，多处理器意味者着内核代码可以同时在两个或者两个以上的处理器上运行，为了防止同时改写内存数据的情况发生，就必须引入内核同步机制。

第二个概念临界区和竞争条件

临界区是指访问和操作共享数据的代码段，多个执行线程并发访问同一个资源通常是不安全的，为了避免在临界区中并发访问，编程者必须保证这些代码是原子的执行，也就是说，操作在执行结束前不可被打断，就如同整个临界区是一个不可分割的指令一样。如果两个执行线程有可能处于同一个临界区中同时执行，那么就是程序包含的bug。如果这种情况确实发生了，我们就称它为竞争条件，这种情况出现的机会非常小，就是因为竞争引起的错误非常不容易重现，所以调试这种错误才会非常困难，避免并发和防止竞争条件称为同步。

第三个概念，加锁

为了防止一个处理器的进程在处理数据，而另外一个处理器上的进程也同时修改这些数据，就需要给这块数据加锁，确保同时只能有一个进程访问数据。

加锁也是技术活，锁有多种多样的形式，加锁的粒度和范围也各不相同。

第四个概念伪并发和真并发

在单处理器上，用户进程可能在任何时刻被抢占，也可能造成共享内存被修改，两个进程是交叉进行的，所以被称为伪并发。

在多处理器上，有可能真的两个进程在同时访问共享内存，因此被称为真并发。

内核中有以下类似的可能，造成并发执行，他们是：

中断，中断可能随时打断正在执行的代码。
软中断和tasklet，内核能在任何时刻唤醒或者调度软中断和tasklet，打断当前正在执行的代码。
内核抢占，因为内核具有抢占性，内核中的任务可能会被另一任务抢占。
睡眠及用户空间的同步，在内核执行的进程可能睡眠，这就会唤醒调度程序执行另外一个进程。
对称多处理，两个或者多个处理器同时执行代码。

第五个概念，死锁

死锁的产生需要一定条件，要有一个或多个执行线程和一个或者多个资源，每个线程都在等待其中的一个资源，但所有的资源都被占用了。所有线程都在等待，但他们永远不会释放已经占有的资源，于是所有线程都无法继续，这便意味着死锁的发生。如何防止死锁的发生，也是程序设计的时候要考虑的问题。

第六个概念争用和扩展性

一个资源被锁定，多个进程都在竞争这个资源，被称为锁的争用，锁的争用会造成系统瓶颈，严重降低系统性能。

解决办法就是扩展性，将锁的范围尽量精细，这样就可以减少锁的争用，但是过于精细，也会额外消耗系统资源，所以掌握好平衡就需要技巧。

六、定时器和时间管理

时间管理在内核中占有非常重要的位置，内核中的函数驱动方式，可以分为事件驱动和时间驱动，其实时间驱动也可以认为是特殊的事件驱动，但是内核中，时间驱动的频率特别高。

时间驱动也可以分为周期驱动，比如每秒100次，或者推后执行，比如500ms以后执行某个任务。

另外，内核还必须管理系统的运行时间以及当前日期和时间。

这里还有一个概念，相对时间和绝对时间，如果某个事件在5s之后被执行，那么系统需要的是相对时间，相反，如果要求管理当前日期和当前时间，则内核不但要计算流逝的时间而且还要计算绝对时间。

周期性产生的事件，比如每10ms一次，都是由系统定时器产生的，系统定时器是一种硬件可编程芯片，可以固定频率产生中断，这个中断就是定时器中断.

在x86体系中，系统定时器默认频率是100Hz，也就是说i386处理器上每秒中断100次，即10ms一次，注意，每种体系的频率可能不一样，有的是250，有的是1000。频率可以在编译内核时指定。

从2.5内核版本开始，中断频率被设定为1000Hz，使用高频率的好处是准确度，精确性更高，但是同时系统负担更重，也更耗电，但是处理器性能越来越高，这点消耗不会对系统造成过大的影响。

七、内存分配

内核把物理页作为内存管理的基本单元，尽管处理器的最小可寻址单元通常为字（甚至字节），但是，内存管理单元MMU通常以页为单位进行处理。

体系不同，页的大小也不一样，大部分32位体系结构支持4KB的页，64位体系结构一般支持8KB的页，这意味着，在1GB物理内存的机器上，4KB页大小，物理内存会被划分为262144个页。

由于硬件的限制，内核并不能对所有的页一视同仁，有些页位于特定的物理地址上，所以不能将其用于特定的任务，由于存在这种限制，所以内核把页划分为不同的区zone。

Linux必须处理如下两种由于硬件存在缺陷引起的寻址问题：

一些硬件只能用某些特定的内存地址来执行DMA，即直接内存访问。
一些体系结构的内存物理寻址范围比虚拟寻址范围大得多，这样，就有一些内存不能永久地映射到内核空间上。

因为存在这些限制条件，Linux主要使用了四种区：

ZONE_DMA 这个区包含的页用来执行DMA操作
ZONE_DMA32 和ZONE_DMA相似，但是这个区只能被32位设备访问
ZONE_NORMAL 这个区包含的都是能正常映射的页
ZONE_HIGHEM 这个区包含高端内存，其中的页不能永久映射到内核地址空间。

一般DMA区使用0-16MB的内存，NORMAL区使用16-896MB的内存，HIGHEM区使用896MB以上的内存。

八、虚拟文件系统

虚拟文件系统作为内核的子系统，简称VFS，为用户空间程序提供了文件和文件系统相关的接口，系统中的所有文件系统不但依赖VFS共存，并且依靠VFS协同工作。

VFS提供了通用的接口和方法，比如open()，read()，write（）,系统调用的无需考虑具体文件系统和实际物理介质。

之所以可以这样，是因为内核在底层文件系统接口上建立一个抽象层，抽象层使Linux能够支持各种文件系统。VFS抽象层定义了所有文件系统都支持的、基本的、概念上的接口和数据结构。任何新的文件系统和新介质只要符合VFS规范，都可以直接使用。

unix系统使用四种和文件系统相关的传统抽象概念：文件、目录项、索引节点和挂载点。从本质上讲文件系统是特殊的数据分层存储结构，包含文件、目录和相关的控制信息。

VFS采用面向对象的设计思路，使用一组数据结构来代表通用文件对象。

VFS有四个主要的对象类型：

超级块对象，代表一个具体的已安装文件系统；
索引节点对象，代表一个具体文件；
目录项对象，代表一个目录项，是路径的一个组成部分；
文件对象，代表由进程打开的文件。

另外，说明下，因为VFS将目录作为文件来处理，所以不存在目录对象。

我们总结下，Linux支持了多种类型的文件系统，从本地文件系统，例如ext3,ext4，到网络文件系统比如NFS。LInux在标准内核中已支持的文件系统超过60种。VFS层提供给这些不同文件系统一个统一的实现框架，而且也提供了能和标准系统调用交互工作的统一接口。由于VFS层的存在，使得Linux上实现新文件系统的工作变得简单起来，它可以轻松地使这些文件系统通过标准Unix系统调用而协同工作。

九、块I/O层

我们还是通过五个概念了解块IO层

第一个概念块设备和字符设备。

系统能够随机访问固定大小数据片的硬件设备称为块设备，数据片的英文术语是chunk，硬盘、软盘、光盘、SSD、U盘都属于块设备，因为系统随时可以访问这些介质上的任意位置数据，另外，说明下，对这些介质的访问，是通过访问文件系统实现的。

字符设备是按照字符流的方式被有序访问的设备，像串口和键盘就属于字符设备。

块设备和字符设备主要的区别就是随机访问方式还是顺序访问方式。

第二个概念扇区和块。

块设备中最小的可寻址单元是扇区，扇区大小一般是2的整数倍，硬盘最常见的扇区大小是512字节，CD-ROM的扇区一般是2KB。

每种文件系统都有自己最小的逻辑可寻址单元，块。块是文件系统的抽象，只能基于块来访问文件系统。

扇区和块的区别是，物理磁盘寻址是按照扇区级进行的，文件系统是按照块来进行的。块大小必须是扇区的倍数，一般是2的整数倍，并且不能超过一个内存页大小，因为文件块需要被缓存到内存中。所以一般文件块的大小是512字节，1KB，4KB。

另外，磁盘还有一些术语，比如簇，柱面，磁头，请大家自己找资料看下。

第三个概念缓冲区。

当一个块被调入内存时，就存储在一个缓冲区中，每个缓冲区与一个块对应，相当于磁盘块在内存中的表示。像前面介绍的，块包含一个或多个扇区，但是大小不能超过一个页面，所以一个内存页可以容纳一个或者多个内存中的块。

第四个概念请求队列。

块设备将它们挂起的块IO请求保存在请求队列中，请求队列只要不为空，队列对应的块设备驱动程序就会从队列头部获取请求，然后将其送入对应的块设备上去。

第五个概念 IO调度程序。

如果简单的以内核产生请求的次序直接将请求发向块设备的话，性能肯定让人难以忍受，磁盘寻址是整个计算机中最慢的操作之一，每次寻址，定位磁头到特定的块上的某个位置，需要花费不少时间，所以尽量缩短寻址时间无疑是提高系统性能的关键。

为了优化寻址操作，内核既不会简单的按请求接收文件，也不会立刻将其提交给磁盘。相反，内核会在提交前，先执行合并与排序的操作，这种操作可以极大的提高系统性能，在内核中负责提交IO请求的子系统，称为IO调度程序。

IO调度程序将磁盘IO资源分配给系统中所有挂起的块IO请求，这种资源分配是通过请求队列中挂起的请求合并和排序来完成的。

IO调度器的工作是管理块设备的请求队列，它决定队列中的请求排列顺序以及在什么时刻发送请求到块设备，这样做有利于减少磁盘寻址时间，从而提高全局吞吐量。注意，全局这个定语很重要，因为IO调度器可能为了提高系统整体性能，会对某些请求不公。

IO调度器通过两种方法减少磁盘寻址时间，合并与排序。举个例子，文件系统接到多个请求队列，IO调度器可以按照磁盘扇区顺序进行排序，那么相邻扇区的访问就可以合并为一次，这样就大大减少了磁盘寻址消耗。即使没有相邻扇区的访问，通过IO调度器，按照磁盘旋转方向访问，也缩短了所有请求的磁盘寻址时间。

十、I/O算法

第一种算法 linus电梯

在2.4版本内核中，linus是默认的IO调度程序，linus算法能够执行合并与排序预处理，当有新的请求加入队列时，它首先检查其他每一个挂起的请求是否可以和新请求合并。linus电梯算法可以执行向前和向后合并，如果新的请求没有合适的插入点，则会被放入队列尾部。

另外，系统中如果有驻留时间过长的请求，新的请求也会被放到队列尾部，这样做的目的是防止对一个磁盘位置访问的过多，造成对其他磁盘位置的请求被饿死。但是这样的做法，因为仅仅是改变队列排序，没有队列的时间检测，不能完全避免有队列被饿死的情况。

第二种算法最终期限

最终期限deadline IO调度算法是为了解决linus电梯算法所带来的饥饿问题而提出的。出于减少磁盘寻址时间的考虑，对某个磁盘区域的频繁操作，会使对磁盘其他位置的操作请求饿死。

更糟糕的是，普通的请求还会造成写-饥饿-读这种问题。

写请求通常可以缓存，但是读请求的时候，程序会被阻塞，直到拿到请求的读数据，也就是写请求是异步的，读请求是同步的，如果有大量的读请求的时候，写请求就会被饿死。

问题可能还会更严重，如果读请求和写请求是相互依靠的，写请求没有操作，读操作又去请求数据，就会造成应用更长时间的等待。

最终期限算法中，每个请求都有一个超时时间，默认读请求的超时时间是500ms，写请求的超时时间是5s。

最终期限算法有三个队列，在超时时间内，调度类似于linus电梯，有一个排序队列，另外维护两个按照时间顺序的读fifo队列，和写fifo队列。

在超时时间内，按照排序队列派发操作，如果读写队列的列头请求超时，那么IO调度程序便从队列中提取请求进行服务，这样就能保证不发生磁盘操作请求超时的情况。

通过最终期限算法，可以避免写操作饿死，同时因为读操作超时时间短，这种算法也优化了大量读操作的响应。

第三种算法预测IO调度

预测IO调度和最终期限一样，也是维护三个一样的队列，不同的是，在提交请求的之前，会有意等待一段时间，默认是6ms，如果有新的请求来，在将相邻扇区的请求合并，这样可以优化磁盘操作。当然，如果没有操作请求，会浪费几毫秒的时间。

第四种算法完全公平的排队IO调度CFQ

CFQ调度程序把进入IO的请求放去特定的队列中，这种队列请求是根据引起IO请求的进程组织的，在每个队列中，刚进入的请求和相邻请求进行合并。

CFQ调度程序以时间片轮转调度队列，从每个队列中选取请求固定数字的操作，默认为4，然后进入下一轮调度。这样在进程级实现了公平。

目前内核默认的调度算法是CFQ。

第五种算法空操作

之所以这样命名，是因为这种算法基本不作什么事情，基本就是先进先出，当然，如果相邻的操作能够合并，还是会合并，空操作懒惰是有道理的，因为这种算法是用在闪存设备上，如果设备没有寻址负担，那么也没有必要对其排序。

十一、页高速缓存和页回写

我们还是通过解答几个问题，来了解页高速缓存和页回写。

第一个问题，为什么会有页高速缓存

这个主要原因是因为内存和磁盘的速度差距非常大，磁盘的读写速度是毫秒级别的，内存的读写速度是纳秒级别的，如果能够通过内存缓存磁盘数据，就可以大大提高系统速度。另外，被访问的数据，很有可能再次被访问，如果能够把数据缓存到内存中，那么数据如果再次被频繁访问，就可以提高系统性能。

第二个问题，写磁盘如何缓存

写缓存有三种方式，第一种是不缓存，就是当写数据时，直接写到磁盘，这种方式数据最安全，但是性能最低。第二种方式是透写，数据先写到缓存，然后立刻写磁盘，这样数据也是很安全，但是性能也比较低。第三种方式是回写，writeback，数据写到缓存，就认为成功，到一定时间，或者数据比较多的时候，再写盘，这种方式性能很好，但是如果数据在缓存中的时候，机器突然断电，有可能数据丢失。

第三个问题，读缓存的回收策略是什么

因为内存有限，不可能把整个磁盘的数据缓存到内存中，只能保证把比较热的数据缓存起来，那么如何确认数据比较热呢，有两种算法，一种是根据时间，系统扫描页面，没有被访问的，时间比较久的页面，就会被释放掉，还有一种算法，是双链表，或者多链表，增加了一些统计的概念，更精确一些。

第四个问题，笔记本电脑模式

在笔记本电脑上，因为有电池，同时为了提升性能，一般启用的都是回写模式，并且刷新磁盘的时间间隔更长，这样还可以省电。目前的大部分系统也可以在笔记本电脑启用电池时，自动修改回写策略。

另外也可以执行命令sync，强制系统刷盘。一般在个人版的系统上，默认都是开启回写，这样性能会好很多，但是在服务器系统上，一般默认都是透写模式，因为在服务器上，数据更重要。这也是为什么有时候你会发现，在个人PC上，磁盘写性能居然要好于服务器的原因。

十二、关于内核的几个概念

第一个概念，Linux的设备类型

在Linux及Unix中，设备被分为三种类型：

块设备
字符设备
网络设备

块设备缩写为blkdev，块设备以块为单位，并且是可以寻址的，即可以随机访问任何位置的数据。块设备通常被挂载为文件系统来使用。

字符设备缩写为cdev，字符设备不可寻址，只能流式访问，与块设备不同，应用程序通常直接和块设备交互。

网络设备通常是通过物理设备和IP协议提供的，网络设备打破了unix一切皆文件的设计原则，对网络设备的访问是通过套接字API实现的。

Linux还提供了其他设备类型，但都是针对单个任务，而非通用的。

另外，并不是所有设备驱动都表示物理设备，有些设备驱动是虚拟的，称之为“伪设备”，最常见的是内核随机数发生器/dev/urandom，空设备/dev/null，零设备/dev/zero等。

尽快Linux内核是单块内核的操作系统，但是整个内核是模块化的，允许在运行时动态的插入或者删除代码，即所谓的可装载内核模块。

第二个概念，内核的可移植性

Linux是可移植性非常好的操作系统，支持许多不同体系的计算机。可移植性是指操作系统代码从一套体系迁移到另外一套体系的方便程度。

在操作系统可移植性方面，设计有两种思路。

一种思路是尽量追求通用性，尽量少的使用汇编语言，这样设计出来的操作系统可移植性非常高，但是缺点是不能针对某种体系深入优化。
还有一种思路就是基本不考虑可移植性，只对一种体系深度优化，Windows系统就是这样的系统，主要就是针对x86系统优化，但是可移植性极差。

Linux系统走了一条中间道路，差不多所有的接口和核心代码都是独立于硬件的，但是，对于性能要求很严格的部分，内核会针对不同体系调整，这使得linux在可移植性和性能之间取得比较好的平衡。

第三个概念社区

大家都知道，linux是开源的，社区和代码随时可以访问，只要有兴趣，也可以随时参与社区活动。但是linux入门门槛比较高。需要一个比较长的过程，只要坚持，最终会跨过这个门槛。

后记

本文通过十二部分蜓蜓点水式的介绍，希望能够帮助大家能记住并理解几个概念。如果有兴趣更深入的了解，推荐阅读下《Linux内核设计与实现》这本书。

上海技术活动

爱库存+爱乐奇+齐家网

案例+原理+实践

大神讲透混合云安全

了解新钛云服

新钛云服出品的部分精品技术干货

你可能感兴趣的:(聊聊运维应该了解的一些内核知识|万字长文)

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
爬山后遗症璃绛
爬山，攀登，一步一步走向制高点，是一种挑战。成功抵达是一种无法言语的快乐，在山顶吹吹风，看看风景，这是从未有过的体验。然而，爬山一时爽，下山腿打颤，颠簸的路，一路向下走，腿部力量不够，走起来抖到不行，停不下来了！第二天必定腿疼，浑身酸痛，坐立难安！
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那