kernel中的idle分析


Cpuidle 分析


一、IDLE计时分析

1.idle是什么
  简单的说idle是一个进程,其pid号为0。其前身是系统创建的第一个进程,也是唯一一个没有通过fork()产生的进程。在smp系统中,每个处理器单元有独立的一个运行队列,而每个运行队列上又有一个idle进程,即有多少处理器单元,就有多少idle进程。系统的空闲时间,其实就是指idle进程的"运行时间"
2.idle
的创建
  我们知道系统是从BIOS加电自检,载入MBR中的引导程序(LILO/GRUB),再加载linux内核开始运行的,一直到指定shell开始运行告一段落,这时用户开始操作Linux。而大致是在vmlinux的入口startup_32(head.S)中为pid号为0的原始进程设置了执行环境,然后原是进程开始执行start_kernel()完成Linux内核的初始化工作。包括初始化页表,初始化中断向量表,初始化系统时间等。继而调用fork(),创建第一个用户进程:
  kernel_thread(kernel_init,NULL, CLONE_FS |CLONE_SIGHAND);
  这个进程就是着名的pid1init进程,它会继续完成剩下的初始化工作,然后execve(/sbin/init),成为系统中的其他所有进程的祖先。关于init我们这次先不研究,回过头来看pid=0的进程,在创建了init进程后,pid=0的进程调用cpu_idle()演变成了idle进程。
  current_thread_info()->status|= TS_POLLING;
  在smp系统中,除了上面刚才我们讲的主处理器(执行初始化工作的处理器)idle进程的创建,还有从处理器(被主处理器activate的处理器)上的idle进程,他们又是怎么创建的呢?接着看init进程,init在演变成/sbin/init之前,会执行一部分初始化工作,其中一个就是smp_prepare_cpus(),初始化SMP处理器,在这过程中会在处理每个从处理器时调用
  task= copy_process(CLONE_VM, 0, idle_regs(&regs), 0, NULL, NULL,0);
  init_idle(task,cpu);
  即从init中复制出一个进程,并把它初始化为idle进程(pid仍然为0)。从处理器上的idle进程会进行一些Activate工作,然后执行cpu_idle()
  整个过程简单的说就是,原始进程(pid=0)创建init进程(pid=1),然后演化成idle进程(pid=0)init进程为每个从处理器(运行队列)创建出一个idle进程(pid=0),然后演化成/sbin/init
3.idle
的运行时机
  idle进程优先级为MAX_PRIO,即最低优先级。早先版本中,idle是参与调度的,所以将其优先级设为最低,当没有其他进程可以运行时,才会调度执行idle。而目前的版本中idle并不在运行队列中参与调度,而是在运行队列结构中含idle指针,指向idle进程,在调度器发现运行队列为空的时候运行,调入运行。
4.idle
workload
  从上面的分析我们可以看出,idle在系统没有其他就绪的进程可执行的时候才会被调度。不管是主处理器,还是从处理器,最后都是执行的cpu_idle()函数。所以我们来看看cpu_idle做了什么事情。
  因为idle进程中并不执行什么有意义的任务,所以通常考虑的是两点:1.节能,2.低退出延迟。
其核心代码如下:

voidcpu_idle(void)
{
int cpu = smp_processor_id();

current_thread_info()->status|= TS_POLLING;

/*endless idle loop with no priority at all */
while (1) {
tick_nohz_stop_sched_tick(1);
while (!need_resched()){

check_pgt_cache();
rmb();

if(rcu_pending(cpu))
rcu_check_callbacks(cpu, 0);

if(cpu_is_offline(cpu))
play_dead();

local_irq_disable();
__get_cpu_var(irq_stat).idle_timestamp = jiffies;
/* Don't trace irqs off for idle */
stop_critical_timings();
pm_idle();
start_critical_timings();
}
tick_nohz_restart_sched_tick();
preempt_enable_no_resched();
schedule();
preempt_disable();
}
}
循环判断need_resched以降低退出延迟,用idle()来节能。
  默认的idle实现是hlt指令,hlt指令使CPU处于暂停状态,等待硬件中断发生的时候恢复,从而达到节能的目的。即从处理器C0态变到C1(ACPI标准)。这也是早些年windows平台上各种"处理器降温"工具的主要手段。当然idle也可以是在别的ACPI或者APM模块中定义的,甚至是自定义的一个idle(比如说nop)
小结:
1.idle
是一个进程,其pid0
2.
主处理器上的idle由原始进程(pid=0)演变而来。从处理器上的idleinit进程fork得到,但是它们的pid都为0

3.Idle进程为最低优先级,且不参与调度,只是在运行队列为空的时候才被调度。

4.Idle循环等待need_resched置位。默认使用hlt节能。

###########以上为转载####################################

/proc/stat文件中的idle时间计算方法

根据/proc/stat源码分析得到stat中的idle时间由

idle= kstat_cpu(i).cpustat.idle;

//得到cpu已经空闲的时间

idle= cputime64_add(idle, arch_idle_time(i)); //将原有的空闲时间与目前增加的空闲时间相加



arch_idle_time(i)中的i代表cpu的下标,如果是第一个cpu那么i=0,如果是第二个则i=1.

arch_idle_time函数来自于arch/s390/include/asm/cputime.h文件中

#definearch_idle_time(cpu) s390_get_idle_time(cpu)继续向下找


cputime64_ts390_get_idle_time(int cpu)

{

structs390_idle_data *idle;

unsignedlong long now, idle_time, idle_enter;

unsignedint sequence;

idle= &per_cpu(s390_idle, cpu);

now= get_clock();

repeat:

sequence= idle->sequence;

smp_rmb();

if(sequence & 1)

gotorepeat;

idle_time= 0;

idle_enter= idle->idle_enter;

if(idle_enter != 0ULL && idle_enter < now)

idle_time= now - idle_enter;

smp_rmb();

if(idle->sequence != sequence)

gotorepeat;

returnidle_time;

}


通过此函数返回当前cpuidle时间,此函数的判断条件是当前cpu是否处于idle状态,只有处于idle状态才会计时,如果不处于idle状态是不会开始计时的。而当前的cpu状态是由cpu_idle()函数中的current_thread_info()函数设定的。




你可能感兴趣的:(kernel中的idle分析)