weixin_30389003

linux loadavg详解（top cpu load）

1 Loadavg分析
- 1.1 Loadavg浅述
- 1.2 Loadavg读取
- 1.3 Loadavg和进程之间的关系
- 1.4 Loadavg采样
2 18内核计算loadavg存在的问题
- 2.1 xtime_lock解析
- 2.2 全局load读写分离解xtime_lock问题
- 2.3 几个关键点：
- - 2.3.1 不加xtime_lock的per cpu load计算
  - 2.3.2 Thomas的解决方案
  - 2.3.3 sched_tick的时机
  - 2.3.4 交错的时间差
3 32内核Load计数nohz问题
- 3.1 解决方案
- 3.2 更细粒度的时间问题
- 3.3 再次回归到公平性问题

Loadavg分析

Loadavg浅述

cat /proc/loadavg可以看到当前系统的load
$ cat /proc/loadavg
0.01 0.02 0.05 2/317 26207
前面三个值分别对应系统当前1分钟、5分钟、15分钟内的平均load。load用于反映当前系统的负载情况，对于16核的系统，如果每个核上cpu利用率为30%，则在不存在uninterruptible进程的情况下，系统load应该维持在4.8左右。对16核系统，如果load维持在16左右，在不存在uninterrptible进程的情况下，意味着系统CPU几乎不存在空闲状态，利用率接近于100%。结合iowait、vmstat和loadavg可以分析出系统当前的整体负载，各部分负载分布情况。

Loadavg读取

在内核中/proc/loadavg是通过load_read_proc来读取相应数据，下面首先来看一下load_read_proc的实现：

fs/proc/proc_misc.c
static int loadavg_read_proc(char *page, char **start, off_t off, 
                                 int count, int *eof, void *data) 
{ 
        int a, b, c; 
        int len; 

        a = avenrun[0] + (FIXED_1/200); 
        b = avenrun[1] + (FIXED_1/200); 
        c = avenrun[2] + (FIXED_1/200); 
        len = sprintf(page,"%d.%02d %d.%02d %d.%02d %ld/%d %d\n", 
                LOAD_INT(a), LOAD_FRAC(a), 
                LOAD_INT(b), LOAD_FRAC(b), 
                LOAD_INT(c), LOAD_FRAC(c), 
                nr_running(), nr_threads, last_pid); 
        return proc_calc_metrics(page, start, off, count, eof, len); 
}

几个宏定义如下：

#define FSHIFT          11              /* nr of bits of precision */ 
#define FIXED_1         (1<#define LOAD_INT(x) ((x) >> FSHIFT) 
#define LOAD_FRAC(x) LOAD_INT(((x) & (FIXED_1-1)) * 100)

根据输出格式，LOAD_INT对应计算的是load的整数部分，LOAD_FRAC计算的是load的小数部分。
将a=avenrun[0] + (FIXED_1/200）带入整数部分和小数部分计算可得：

LOAD_INT(a) = avenrun[0]/(2^11) + 1/200
LOAD_FRAC(a) = ((avenrun[0]%(2^11) + 2^11/200) * 100) / (2^11)
             = (((avenrun[0]%(2^11)) * 100 + 2^10) / (2^11)
             = ((avenrun[0]%(2^11) * 100) / (2^11) + ½

由上述计算结果可以看出，FIXED_1/200在这里是用于小数部分第三位的四舍五入，由于小数部分只取前两位，第三位如果大于5，则进一位，否则直接舍去。

临时变量a/b/c的低11位存放的为load的小数部分值，第11位开始的高位存放的为load整数部分。因此可以得到a=load(1min) * 2^11
因此有: load(1min) * 2^11 = avenrun[0] + 2^11 / 200
进而推导出： load(1min)=avenrun[0]/(2^11) + 1/200
忽略用于小数部分第3位四舍五入的1/200，可以得到load(1min)=avenrun[0] / 2^11，即：
avenrun[0] = load(1min) * 2^11

avenrun是个陌生的量，这个变量是如何计算的，和系统运行进程、cpu之间的关系如何，在第二阶段进行分析。

Loadavg和进程之间的关系

内核将load的计算和load的查看进行了分离，avenrun就是用于连接load计算和load查看的桥梁。
下面开始分析通过avenrun进一步分析系统load的计算。
avenrun数组是在calc_load中进行更新

kernel/timer.c
/* 
* calc_load - given tick count, update the avenrun load estimates. 
* This is called while holding a write_lock on xtime_lock. 
*/ 
static inline void calc_load(unsigned long ticks) 
{ 
        unsigned long active_tasks; /* fixed-point */ 
        static int count = LOAD_FREQ;  
        count -= ticks; 
        if (count < 0) { 
                count += LOAD_FREQ; 
                active_tasks = count_active_tasks(); 
                CALC_LOAD(avenrun[0], EXP_1, active_tasks); 
                CALC_LOAD(avenrun[1], EXP_5, active_tasks); 
                CALC_LOAD(avenrun[2], EXP_15, active_tasks); 
        } 
}
static unsigned long count_active_tasks(void) 
{ 
        return nr_active() * FIXED_1; 
}
#define LOAD_FREQ       (5*HZ)          /* 5 sec intervals */ 
#define EXP_1           1884            /* 1/exp(5sec/1min) as fixed-point */ 
#define EXP_5           2014            /* 1/exp(5sec/5min) */ 
#define EXP_15          2037            /* 1/exp(5sec/15min) */

calc_load在每个tick都会执行一次，每个LOAD_FREQ（5s）周期执行一次avenrun的更新。
active_tasks为系统中当前贡献load的task数nr_active乘于FIXED_1，用于计算avenrun。宏CALC_LOAD定义如下：

#define CALC_LOAD(load,exp,n) \ 
       load *= exp; \ 
       load += n*(FIXED_1-exp); \ 
       load >>= FSHIFT;

用avenrun(t-1)和avenrun(t)分别表示上一次计算的avenrun和本次计算的avenrun，则根据CALC_LOAD宏可以得到如下计算：

avenrun(t)=(avenrun(t-1) * EXP_N + nr_active * FIXED_1*(FIXED_1 – EXP_N)) / FIXED_1
          = avenrun(t-1) + (nr_active*FIXED_1 – avenrun(t-1)) * (FIXED_1 -EXP_N) / FIXED_1

推导出：

avenrun(t) – avenrun(t-1) = (nr_active*FIXED_1 – avenrun(t-1)) * (FIXED_1 – EXP_N) / FIXED_1

将第一阶段推导的结果代入上式，可得：

(load(t) – load(t-1)) * FIXED_1 = (nr_active – load(t-1)) * (FIXED_1 – EXP_N)

进一步得到nr_active变化和load变化之间的关系式：

load(t) – load(t-1) = (nr_active – load(t-1)) * (FIXED_1 – EXP_N) / FIXED_1

这个式子可以反映的内容包含如下两点：
1）当nr_active为常数时，load会不断的趋近于nr_active，趋近速率由快逐渐变缓
2）nr_active的变化反映在load的变化上是被降级了的，系统突然间增加10个进程，
1分钟load的变化每次只能够有不到1的增加（这个也就是权重的的分配）。

另外也可以通过将式子简化为：

load(t)= load(t-1) * EXP_N / FIXED_1 + nr_active * (1 - EXP_N/FIXED_1)

这样可以更加直观的看出nr_active和历史load在当前load中的权重关系（多谢任震宇大师的指出）

#define EXP_1           1884            /* 1/exp(5sec/1min) as fixed-point */ 
#define EXP_5           2014            /* 1/exp(5sec/5min) */ 
#define EXP_15          2037            /* 1/exp(5sec/15min) */

1分钟、5分钟、15分钟对应的EXP_N值如上，随着EXP_N的增大，(FIXED_1 – EXP_N)/FIXED_1值就越小，
这样nr_active的变化对整体load带来的影响就越小。对于一个nr_active波动较小的系统，load会
不断的趋近于nr_active，最开始趋近比较快，随着相差值变小，趋近慢慢变缓，越接近时越缓慢，并最
终达到nr_active。如下图所示：
文件:load 1515.jpg(无图）

也因此得到一个结论，load直接反应的是系统中的nr_active。那么nr_active又包含哪些？如何去计算
当前系统中的nr_active？这些就涉及到了nr_active的采样。

Loadavg采样

nr_active直接反映的是为系统贡献load的进程总数，这个总数在nr_active函数中计算：

kernel/sched.c
unsigned long nr_active(void) 
{ 
        unsigned long i, running = 0, uninterruptible = 0; 

        for_each_online_cpu(i) { 
                running += cpu_rq(i)->nr_running; 
                uninterruptible += cpu_rq(i)->nr_uninterruptible; 
        } 

        if (unlikely((long)uninterruptible < 0)) 
                uninterruptible = 0; 

        return running + uninterruptible; 
}

#define TASK_RUNNING            0 
#define TASK_INTERRUPTIBLE      1 
#define TASK_UNINTERRUPTIBLE    2 
#define TASK_STOPPED            4 
#define TASK_TRACED             8 
/* in tsk->exit_state */ 
#define EXIT_ZOMBIE             16 
#define EXIT_DEAD               32 
/* in tsk->state again */ 
#define TASK_NONINTERACTIVE     64

该函数反映，为系统贡献load的进程主要包括两类，一类是TASK_RUNNING，一类是TASK_UNINTERRUPTIBLE。
当5s采样周期到达时，对各个online-cpu的运行队列进行遍历，取得当前时刻该队列上running和uninterruptible的
进程数作为当前cpu的load，各个cpu load的和即为本次采样得到的nr_active。

下面的示例说明了在2.6.18内核情况下loadavg的计算方法：

18内核loadavg计算
	cpu0	cpu1	cpu2	cpu3	cpu4	cpu5	cpu6	cpu7	calc_load
0HZ+10	1	1	1	0	0	0	0	0	0
5HZ	0	0	0	0	1	1	1	1	4
5HZ+1	0	1	1	1	0	0	0	0	0
5HZ+9	0	0	0	0	0	1	1	1	0
5HZ+11	1	1	1	0	0	0	0	0	0

18内核计算loadavg存在的问题

xtime_lock解析

内核在5s周期执行一次全局load的更新，这些都是在calc_load函数中执行。追寻calc_load的调用：

kernel/timer.c
static inline void update_times(void) 
{  
        unsigned long ticks; 

        ticks = jiffies - wall_jiffies; 
        wall_jiffies += ticks; 
        update_wall_time(); 
        calc_load(ticks); 
}

update_times中更新系统wall time，然后执行全局load的更新。

kernel/timer.c
void do_timer(struct pt_regs *regs) 
{  
        jiffies_64++; 
        /* prevent loading jiffies before storing new jiffies_64 value. */ 
        barrier(); 
        update_times(); 
}

do_timer中首先执行全局时钟jiffies的更新，然后是update_times。

void main_timer_handler(struct pt_regs *regs) 
{ 
...
        write_seqlock(&xtime_lock);
...
        do_timer(regs); 
#ifndef CONFIG_SMP 
        update_process_times(user_mode(regs)); 
#endif 
...
        write_sequnlock(&xtime_lock); 
}

对wall_time和全局jiffies的更新都是在加串行锁（sequence lock）xtime_lock之后执行的。

include/linux/seqlock.h
static inline void write_seqlock(seqlock_t *sl) 
{ 
        spin_lock(&sl->lock);
        ++sl->sequence; 
        smp_wmb(); 
} 

static inline void write_sequnlock(seqlock_t *sl) 
{ 
        smp_wmb(); 
        sl->sequence++; 
        spin_unlock(&sl->lock); 
} 
 
typedef struct { 
        unsigned sequence; 
        spinlock_t lock; 
} seqlock_t;

sequence lock内部保护一个用于计数的sequence。Sequence lock的写锁是通过spin_lock实现的，
在spin_lock后对sequence计数器执行一次自增操作，然后在锁解除之前再次执行sequence的自增操作。
sequence初始化时为0。这样，当锁内部的sequence为奇数时，说明当前该sequence lock的写锁正被拿，
读和写可能不安全。如果在写的过程中，读是不安全的，那么就需要在读的时候等待写锁完成。对应读锁使用如下：

#if (BITS_PER_LONG < 64) 
u64 get_jiffies_64(void) 
{ 
        unsigned long seq; 
        u64 ret;  

        do { 
                seq = read_seqbegin(&xtime_lock); 
                ret = jiffies_64; 
        } while (read_seqretry(&xtime_lock, seq)); 
        return ret; 
} 

EXPORT_SYMBOL(get_jiffies_64); 
#endif

读锁实现如下：

static __always_inline unsigned read_seqbegin(const seqlock_t *sl) 
{ 
        unsigned ret = sl->sequence; 
        smp_rmb(); 
        return ret; 
} 

static __always_inline int read_seqretry(const seqlock_t *sl, unsigned iv) 
{ 
        smp_rmb(); 
        /*iv为读之前的锁计数器
        * 当iv为基数时，说明读的过程中写锁被拿，可能读到错误值
        * 当iv为偶数，但是读完之后锁的计数值和读之前不一致，则说明读的过程中写锁被拿，
        * 也可能读到错误值。
        */
        return (iv & 1) | (sl->sequence ^ iv);  
}

至此xtime_lock的实现解析完毕，由于对应写锁基于spin_lock实现，多个程序竞争写锁时等待者会一直循环等待，
当锁里面处理时间过长，会导致整个系统的延时增长。另外，如果系统存在很多xtime_lock的读锁，在某个程
序获取该写锁后，读锁就会进入类似spin_lock的循环查询状态，直到保证可以读取到正确值。因此需要尽可能
短的减少在xtime_lock写锁之间执行的处理流程。

全局load读写分离解xtime_lock问题

在计算全局load函数calc_load中，每5s需要遍历一次所有cpu的运行队列，获取对应cpu上的load。1）由于cpu个数是不固
定的，造成calc_load的执行时间不固定，在核数特别多的情况下会造成xtime_lock获取的时间过长。2）calc_load是
每5s一次的采样程序，本身并不能够精度特别高，对全局avenrun的读和写之间也不需要专门的锁保护，可以将全局load的
更新和读进行分离。
Dimitri Sivanich提出在他们的large SMP系统上，由于calc_load需要遍历所有online CPU，造成系统延迟较大。
基于上述原因Thomas Gleixnert提交了下述patch对该bug进行修复：

[Patch 1/2] sched, timers: move calc_load() to scheduler
[Patch 2/2] sched, timers: cleanup avenrun users

文件:rw isolate.jpg

Thomas的两个patch，主要思想如上图所示。首先将全局load的计算分离到per-cpu上，各个cpu上计算load时不加xtime_lock
的锁，计算的load更新到全局calc_load_tasks中，所有cpu上load计算完后calc_load_tasks即为整体的load。在5s定
时器到达时执行calc_global_load，读取全局cacl_load_tasks，更新avenrun。由于只是简单的读取calc_load_tasks，
执行时间和cpu个数没有关系。

几个关键点：

不加xtime_lock的per cpu load计算

在不加xtime_lock的情况下，如何保证每次更新avenrun时候读取的calc_load_tasks为所有cpu已经更新之后的load？

Thomas的解决方案

Thomas的做法是将定时器放到sched_tick中，每个cpu都设置一个LOAD_FREQ定时器。
定时周期到达时执行当前处理器上load的计算。sched_tick在每个tick到达时执行
一次，tick到达是由硬件进行控制的，客观上不受系统运行状况的影响。

sched_tick的时机

将per-cpu load的计算放至sched_tick中执行，第一反应这不是又回到了时间处理中断之间，是否依旧
存在xtime_lock问题？下面对sched_tick进行分析（以下分析基于linux-2.6.32-220.17.1.el5源码）

static void update_cpu_load_active(struct rq *this_rq) 
{ 
        update_cpu_load(this_rq); 

        calc_load_account_active(this_rq); 
}
 
void scheduler_tick(void) 
{ 
        int cpu = smp_processor_id(); 
        struct rq *rq = cpu_rq(cpu); 
...
        spin_lock(&rq->lock); 
...
        update_cpu_load_active(rq); 
...
        spin_unlock(&rq->lock); 

...
} 
 
void update_process_times(int user_tick) 
{ 
...
        scheduler_tick(); 
...
}
 
static void tick_periodic(int cpu) 
{ 
        if (tick_do_timer_cpu == cpu) { 
                write_seqlock(&xtime_lock); 

                /* Keep track of the next tick event */ 
                tick_next_period = ktime_add(tick_next_period, tick_period); 
           
                do_timer(1);  // calc_global_load在do_timer中被调用
                write_sequnlock(&xtime_lock); 
        } 
 
        update_process_times(user_mode(get_irq_regs())); 
...
}
 
void tick_handle_periodic(struct clock_event_device *dev) 
{ 
        int cpu = smp_processor_id(); 
...
        tick_periodic(cpu); 
...
}

交错的时间差

将per-cpu load的计算放到sched_tick中后，还存在一个问题就是何时执行per-cpu上的load计算，如何保证更新全
局avenrun时读取的全局load为所有cpu都计算之后的？当前的方法是给所有cpu设定同样的步进时间LOAD_FREQ，
过了这个周期点当有tick到达则执行该cpu上load的计算，更新至全局的calc_load_tasks。calc_global_load
的执行点为LOAD_FREQ+10，即在所有cpu load计算执行完10 ticks之后，读取全局的calc_load_tasks更新avenrun。

32内核loadavg计算
	cpu0	cpu1	cpu2	cpu3	cpu4	cpu5	cpu6	cpu7	calc_load_tasks
0HZ+10	0	0	0	0	0	0	0	0	0
5HZ	1	1	1	1	1	1	1	1	0
5HZ+1	0	1	1	1	0	0	0	0	0
		+1	+1	+1					1+1+1=3
5HZ+11	0	1	1	1	0	0	0	0	3
calc_global_load	<--	--	--	--	--	--	--	--	3

通过将calc_global_load和per-cpu load计算的时间进行交错，可以避免calc_global_load在各个cpu load计算之间执行，
导致load采样不准确问题。

32内核Load计数nohz问题

一个问题的解决，往往伴随着无数其他问题的诞生！Per-cpu load的计算能够很好的分离全局load的更新和读取，避免大型系统中cpu
核数过多导致的xtime_lock问题。但是也同时带来了很多其他需要解决的问题。这其中最主要的问题就是nohz问题。

为避免cpu空闲状态时大量无意义的时钟中断，引入了nohz技术。在这种技术下，cpu进入空闲状态之后会关闭该cpu对应的时钟中断，等
到下一个定时器到达，或者该cpu需要执行重新调度时再重新开启时钟中断。

cpu进入nohz状态后该cpu上的时钟tick停止，导致sched_tick并非每个tick都会执行一次。这使得将per-cpu的load计算放在
sched_tick中并不能保证每个LOAD_FREQ都执行一次。如果在执行per-cpu load计算时，当前cpu处于nohz状态，那么当
前cpu上的sched_tick就会错过，进而错过这次load的更新，最终全局的load计算不准确。
基于Thomas第一个patch的思想，可以在cpu调度idle时对nohz情况进行处理。采用的方式是在当前cpu进入idle前进行一次该cpu
上load的更新，这样即便进入了nohz状态，该cpu上的load也已经更新至最新状态，不会出现不更新的情况。如下图所示：

32内核loadavg计算
	cpu0	cpu1	cpu2	cpu3	cpu4	cpu5	cpu6	cpu7	calc_load_tasks
0HZ+11	1	1	1	0	0	0	0	0	3
5HZ	0	0	0	0	3	2	1	3	0
	-1	-1	-1						3-3=0
5HZ+1	0	1	1	1	1	1	1	1	1
		+1	+1	+1	+1	+1	+1	+1	0+1+...+1=7
5HZ+11	0	1	1	1	1	1	1	1	7
calc_global_load	<--	--	--	--	--	--	--	--	7

理论上，该方案很好的解决了nohz状态导致全局load计数可能不准确的问题，事实上这却是一个苦果的开始。大量线上应用反馈
最新内核的load计数存在问题，在16核机器cpu利用率平均为20%~30%的情况下，整体load却始终低于1。

解决方案

接到我们线上报告load计数偏低的问题之后，进行了研究。最初怀疑对全局load计数更新存在竞争。对16核的系统，如果都没有进入
nohz状态，那么这16个核都将在LOAD_FREQ周期到达的那个tick内执行per-cpu load的计算，并更新到全局的load中，这
之间如果存在竞争，整体计算的load就会出错。当前每个cpu对应rq都维护着该cpu上一次计算的load值，如果发现本次计算load
和上一次维护的load值之间差值为0，则不用更新全局load，否则将差值更新到全局load中。正是由于这个机制，全局load如果被
篡改，那么在各个cpu维护着自己load的情况下，全局load最终将可能出现负值。而负值通过各种观察，并没有在线上出现，最终竞
争条件被排除。

通过/proc/sched_debug对线上调度信息进行分析，发现每个时刻在cpu上运行的进程基本维持在2~3个，每个时刻运行有进程的cpu都
不一样。进一步分析，每个cpu上平均每秒出现sched_goidle的情况大概为1000次左右。因此得到线上每次进入idle的间隔为1ms/次。
结合1HZ=1s=1000ticks，可以得到1tick =1ms。所以可以得到线上应用基本每一个tick就会进入一次idle！！！这个发现就好比
原来一直用肉眼看一滴水，看着那么完美那么纯净，突然间给你眼前架了一个放大镜，一下出现各种凌乱的杂碎物。在原有的世界里，
10ticks是那么的短暂，一个进程都可能没有运行完成，如今发现10ticks内调度idle的次数就会有近10次。接着用例子对应用场景进行分析：

32内核loadavg计算
	cpu0	cpu1	cpu2	cpu3	cpu4	cpu5	cpu6	cpu7	calc_load_tasks
0HZ+11	1	1	1	0	0	0	0	0	3
5HZ	0	0	0	1	1	1	0	0
	-1	-1	-1						3-3=0
5HZ+1	1	0	0	0	0	0	1	1
	+1						+1	+1	0+1+1+1=3
5HZ+3	0	1	1	1	0	0	0	0	3
	-1						-1	-1	3-1-1-1=0
5HZ+5	0	0	0	0	1	1	1	0	0
5HZ+11	1	0	0	0	0	0	1	1	0
calc_global_load	<--	--	--	--	--	--	--	--	0

(说明：可能你注意到了在5HZ+5到5HZ+11过程中也有CPU从非idle进入了idle，但是为什么没有-1，这里是由于每个cpu都保留
了一份该CPU上一次计算时的load，如果load没有变化则不进行计算，这几个cpu上一次计算load为0，并没有变化)

Orz！load为3的情况直接算成了0，难怪系统整体load会偏低。这里面的一个关键点是：对已经计算过load的cpu，我们对idle进
行了计算，却从未考虑过这给从idle进入非idle的情况带来的不公平性。这个是当前线上2.6.32系统存在的问题。在定位到问题
之后，跟进到upstream中发现Peter Z针对该load计数问题先后提交了三个patch，最新的一个patch是在4月份提交。这三个
patch如下：

[Patch] sched: Cure load average vs NO_HZ woes
[Patch] sched: Cure more NO_HZ load average woes
[Patch] sched: Fix nohz load accounting – again!

这是目前我们backport的patch，基本思想是将进入idle造成的load变化暂时记录起来，不是每次进入idle都导致全局load的更新。
这里面的难点是什么时候将idle更新至全局的load中？在最开始计算per-cpu load的时候需要将之前所有的idle都计算进来，
由于目前各个CPU执行load计算的先后顺序暂时没有定，所以将这个计算放在每个cpu里面都计算一遍是一种方法。接着用示例进行说明：

32内核loadavg计算
	cpu0	cpu1	cpu2	cpu3	cpu4	cpu5	cpu6	cpu7	calc_load_tasks	tasks_idle
0HZ+11	1	1	1	0	0	0	0	0	3	0
5HZ	0	0	0	1	1	1	0	0
	-1	-1	-1						3	-3
5HZ+1	1	0	0	0	0	0	1	1	3
	+1						+1	+1	3-3+1+1+1=3	0
5HZ+3	0	1	1	1	0	0	0	0	3
5HZ+3	-1						-1	-1	3	-1-1-1=-3
5HZ+5	0	0	0	0	1	1	1	0	3
5HZ+11	1	0	0	0	0	0	1	1	3
calc_global_load	<--	--	--	--	--	--	--	--	3	-3

至此这三个patch能够很好的处理我们的之前碰到的进入idle的问题。
将上述三个patch整理完后，在淘客前端线上机器中进行测试，测试结果表明load得到了明显改善。

更细粒度的时间问题

将上述三个patch整理完后，似乎一切都完美了，idle进行了很好的处理，全局load的读写分离也很好实现。然而在业务线上的测试结果却出乎意料，虽然添加patch之后load计数较之前有明显改善，但是依旧偏低。下面是一个抓取的trace数据（粗体为pick_next_idle）：

<...>-9195 [000] 11994.232382: calc_global_load: calc_load_task = 0
<...>-9198 [000] 11999.213365: calc_load_account_active: cpu 0 nr_run 1 nr_uni 0 nr_act 1 delta 1 calc 1
<...>-9199 [001] 11999.213379: calc_load_account_active: cpu 1 nr_run 1 nr_uni 0 nr_act 1 delta 1 calc 2
<...>-9194 [002] 11999.213394: calc_load_account_active: cpu 2 nr_run 1 nr_uni 0 nr_act 1 delta 1 calc 3 
<...>-9198 [000] 11999.213406: calc_load_account_active: cpu 0 nr_run 0 nr_uni 0 nr_act 0 delta -1 calc 2
<...>-9201 [003] 11999.213409: calc_load_account_active: cpu 3 nr_run 1 nr_uni 0 nr_act 1 delta 1 calc 3
<...>-9190 [004] 11999.213424: calc_load_account_active: cpu 4 nr_run 1 nr_uni 0 nr_act 1 delta 1 calc 4
<...>-9197 [005] 11999.213440: calc_load_account_active: cpu 5 nr_run 1 nr_uni 0 nr_act 1 delta 1 calc 5
<...>-9194 [002] 11999.213448: calc_load_account_active: cpu 2 nr_run 0 nr_uni 0 nr_act 0 delta -1 calc 4
<...>-9203 [006] 11999.213455: calc_load_account_active: cpu 6 nr_run 1 nr_uni 0 nr_act 1 delta 1 calc 5
<...>-9202 [007] 11999.213471: calc_load_account_active: cpu 7 nr_run 1 nr_uni 0 nr_act 1 delta 1 calc 6
<...>-9195 [008] 11999.213487: calc_load_account_active: cpu 8 nr_run 1 nr_uni 0 nr_act 1 delta 1 calc 7
<...>-9204 [009] 11999.213502: calc_load_account_active: cpu 9 nr_run 1 nr_uni 0 nr_act 1 delta 1 calc 8
<...>-9190 [004] 11999.213517: calc_load_account_active: cpu 4 nr_run 0 nr_uni 0 nr_act 0 delta -1 calc 7
<...>-9192 [010] 11999.213519: calc_load_account_active: cpu 10 nr_run 1 nr_uni 0 nr_act 1 delta 1 calc 8
<...>-9200 [011] 11999.213533: calc_load_account_active: cpu 11 nr_run 1 nr_uni 0 nr_act 1 delta 1 calc 9
<...>-9189 [012] 11999.213548: calc_load_account_active: cpu 12 nr_run 1 nr_uni 0 nr_act 1 delta 1 calc 10
<...>-9196 [013] 11999.213564: calc_load_account_active: cpu 13 nr_run 1 nr_uni 0 nr_act 1 delta 1 calc 11
<...>-9193 [014] 11999.213580: calc_load_account_active: cpu 14 nr_run 1 nr_uni 0 nr_act 1 delta 1 calc 12
<...>-9191 [015] 11999.213596: calc_load_account_active: cpu 15 nr_run 1 nr_uni 0 nr_act 1 delta 1 calc 13
<...>-9204 [009] 11999.213610: calc_load_account_active: cpu 9 nr_run 0 nr_uni 0 nr_act 0 delta -1 calc 12<...>-9195 [008] 11999.213645: calc_load_account_active: cpu 8 nr_run 0 nr_uni 0 nr_act 0 delta -1 calc 11<...>-9203 [006] 11999.213782: calc_load_account_active: cpu 6 nr_run 0 nr_uni 0 nr_act 0 delta -1 calc 10<...>-9197 [005] 11999.213809: calc_load_account_active: cpu 5 nr_run 0 nr_uni 0 nr_act 0 delta -1 calc 9<...>-9196 [013] 11999.213930: calc_load_account_active: cpu 13 nr_run 0 nr_uni 0 nr_act 0 delta -1 calc 8<...>-9193 [014] 11999.213971: calc_load_account_active: cpu 14 nr_run 0 nr_uni 0 nr_act 0 delta -1 calc 7<...>-9189 [012] 11999.214004: calc_load_account_active: cpu 12 nr_run 0 nr_uni 0 nr_act 0 delta -1 calc 6<...>-9199 [001] 11999.214032: calc_load_account_active: cpu 1 nr_run 0 nr_uni 0 nr_act 0 delta -1 calc 5<...>-9191 [015] 11999.214164: calc_load_account_active: cpu 15 nr_run 0 nr_uni 0 nr_act 0 delta -1 calc 4<...>-9202 [007] 11999.214201: calc_load_account_active: cpu 7 nr_run 0 nr_uni 0 nr_act 0 delta -1 calc 3<...>-9201 [003] 11999.214353: calc_load_account_active: cpu 3 nr_run 0 nr_uni 0 nr_act 0 delta -1 calc 2<...>-9192 [010] 11999.214998: calc_load_account_active: cpu 10 nr_run 0 nr_uni 0 nr_act 0 delta -1 calc 1<...>-9200 [011] 11999.215115: calc_load_account_active: cpu 11 nr_run 0 nr_uni 0 nr_act 0 delta -1 calc 0
<...>-9198 [000] 11999.223342: calc_global_load: calc_load_task = 0

虽然这个是未加三个patch之前的trace数据，但是我们依旧能够发现一些问题：原来的10tick对我们来说从一个微不足道的小时间片被提升为一个大时间片，相对此低了一个数量级的1 tick却一直未真正被我们所重视。trace数据中，cpu0、2、4在计算完自己的load之后，其他cpu计算完自己的load之前，进入了idle，由于默认情况下每个cpu都会去将idle计算入全局的load中，这部分进入idle造成的cpu load发生的变化会被计算到全局load中。依旧出现了之前10ticks的不公平问题。示例如下：

32内核loadavg计算
	cpu0	cpu1	cpu2	cpu3	cpu4	cpu5	cpu6	cpu7	calc_load_tasks	tasks_idle
0HZ+11	1	1	1	0	0	0	0	0	3	0
5HZ	0	0	0	1	1	1	0	0
	-1	-1	-1						3	-3
5HZ+1.3	1	0	0	0	0	0	1	1
	+1								3-3+1=1	0
5HZ+1.5	0	1	1	1	0	0	0	0	1	0
	-1			+1					1+1-1=1	0
5HZ+1.7	0	0	0	0	1	1	1	0	0	0
				-1			+1		1-1+1=3	0
5HZ+3	0	1	1	1	0	0	1	0
							-1		1	-1
5HZ+5	0	0	0	0	1	1	1	0
5HZ+11	1	1	0	0	0	0	1	-1
calc_global_load	<--	--	--	--	--	--	--	--	1	-1

线上业务平均每个任务运行时间为0.3ms，任务运行周期为0.5ms，因此每个周期idle执行时间为0.2ms。在1个tick内，cpu执行完自己load的计算之后，很大的概率会在其他cpu执行自己load计算之前进入idle，致使整体load计算对idle和非idle不公平，load计数不准确。针对该问题，一个简单的方案是检测第一个开始执行load计算的CPU，只在该CPU上将之前所有进入idle计算的load更新至全局的load，之后的CPU不在将idle更新至全局的load中。这个方案中检测第一个开始执行load计算的CPU是难点。另外一个解决方案是将LOAD_FREQ周期点和全局load更新至avenren的LOAD_FREQ+10时间点作为分界点。对上一次LOAD_FREQ+10到本次周期点之间的idle load，可以在本次CPU执行load计算时更新至全局的load；对周期点之后到LOAD_FREQ+10时间点之间的idle load可以在全局load更新至avenrun之后更新至全局load。
Peter Z采用的是上述第二个解决，使用idx翻转的技术实现。通过LOAD_FREQ和LOAD_FREQ+10两个时间点，可以将idle导致的load分为两部分，一部分为LOAD_FREQ至LOAD_FREQ+10这部分，这部分load由于在各个cpu计算load之后到全局avenrun更新之间，不应该直接更新至全局load中；另一部分为LOAD_FREQ+10至下一个周期点LOAD_FREQ，这部分idle导致的load可以随时更新至全局的load中。实现中使用了一个含2个元素的数组，用于对这两部分load进行存储，但这两部分并不是分别存储在数组的不同元素中，而是每个LOAD_FREQ周期存储一个元素。如下图所示，在0~5周期中，这两部分idle都存储在数组下标为1的元素中。5~10周期内，这两个部分都存储在数组下标为0的元素中。在5~10周期中，各个cpu计算load时读取的idle为0~5周期存储的；在计算完avenrun之后，更新idle至全局load时读取的为5~10周期中前10个ticks的idle导致的load。这样在10~15周期中，各个cpu计算load时读取的idle即为更新avenrun之后产生的idle load。具体实现方案如下：

      0             5             10            15          --->HZ
        +10           +10           +10           +10       ---> ticks
      |-|-----------|-|-----------|-|-----------|-|
idx:0   1     1       0     0       1      1      0   
  w:0 1 1         1 0 0         0 1 1         1 0 0
  r:0 0 1         1 1 0         0 0 1         1 1 0

说明：1）0 5 10 15代表的为0HZ、5HZ、10HZ、15HZ，这个就是各个cpu执行load计算的周期点
     2）+10表示周期点之后10ticks（即为计算avenrun的时间点）
     3）idx表示当前的idx值（每次只取最后一位的值，因此变化范围为0~1）
     4）w后面3列值，第一列表示周期点之前idle计算值写入的数组idx；第二列表示周期点到+10之间idle导致的load变化写入的数
       组idx；第三列表示计算万avenrun之后到下一个周期点之间idle写入的数组idx；

用如下示例进行说明（假定0HZ+11之后idx为0）：

32内核loadavg计算
	cpu0	cpu1	cpu2	cpu3	cpu4	cpu5	cpu6	cpu7	calc_load_tasks	idle[0]	idle[1]	idx
0HZ+11	1	1	1	0	0	0	0	0	3	0	0	0
5HZ	0	0	0	1	1	1	0	0
	-1	-1	-1						3	-3	0	0
5HZ+1.3	1	0	0	0	0	0	1	1
	+1								3-3+1=1	0	0	0
5HZ+1.5	0	1	1	1	0	0	0	0	1	0
	-1			+1					1+1=2	0	-1	0
5HZ+1.7	0	0	0	0	1	1	1	0	0	0
				-1			+1		2+1=3	0	-2	0
5HZ+3	0	1	1	1	0	0	1	0	0
5HZ+3									3	0	-2	0
5HZ+5	0	0	0	0	1	1	1	0	0
5HZ+11	1	1	0	0	0	0	1	1
calc_global_load	<--	--	--	--	--	--	--	--	3	0	-2	0
									3-2=1	0	0	1
5HZ+15	1	1	0	0	0	0	0	1
							-1		1	0	-1	1

再次回归到公平性问题

经过对细粒度idle调度问题进行解决，在线上业务整体load得到了很好的改善。原来平均运行进程数在16的情况下，load一直徘徊在1左右，改善之后load回升到了15左右。
然而这个patch发布到社区，经过相关报告load计数有问题的社区人员进行测试之后，发现系统的load整体偏高，而且很多时候都是趋近于系统总运行进程数。为了验证这个patch的效果，升级了一台添加该patch的机器，进行观察，确实发现升级之后机器的load比原有18还高出1左右。
又是一次深度的思考，是否当前这个patch中存在BUG? 是否从第一个CPU到最后一个CPU之间的idle就应该直接计算在整体load中？对于高频度调度idle的情况，这部分idle是不应该加入到全局load中，否则无论系统运行多少进程，最终load都会始终徘徊在0左右。因此这部分idle必须不能够加入到全局load中。通过trace数据进行分析，也证明了patch运行的行为符合预期，并不存在异常。
如果假设之前所有的patch都没有问题，是否存在其他情况会导致系统load偏高？导致load偏高，一个很可能的原因就是在该计算为idle时，计算为非idle情况。为此先后提出了负载均衡的假设、计算load时有进程wakeup到当前运行队列的假设，最终都被一一排除。
进一步观察trace数据，发现几乎每次都是在做完该CPU上load计算之后，该CPU立即就进入idle。16个CPU，每个CPU都是在非idle的时候执行load计算，执行完load计算之后又都是立即进入idle。而且这种情况是在每一次做load计算时都是如此，并非偶然。按照采样逻辑，由于采样时间点不受系统运行状况影响，对于频繁进出idle的情况，采样时idle和非idle都应该会出现。如今只有非idle情况，意味着采样时间点选取存在问题。
进一步分析，如果采样点处于idle内部，由于nohz导致进入idle之后并不会周期执行sched_tick，也就无法执行load计算，看起来似乎会导致idle load计算丢失。事实并不是，之前计算idle load就是为了避免进入nohz导致load计算丢失的问题，在进入idle调度前会将当前cpu上的load计算入idle load中，这样其他cpu执行load计算时会将这部分load一同计算入内。
但是基于上述逻辑，也可以得到一个结论：如果采样点在idle内部，默认应该是将进入idle时的load作为该cpu上采样load。事实是否如此？继续分析，该CPU如果从nohz重新进入调度，这个时候由于采样时间点还存在，而且间隔上一次采样已经超过一个LOAD_FREQ周期，会再次执行load计算。再次执行load计算会覆盖原有进入idle时计算的load，这直接的一个结果是，该CPU上的采样点从idle内部变成了非idle！问题已经变得清晰，对采样点在idle内部的情况，实际计算load应该为进入idle时该cpu上的load，然而由于该cpu上采样时间点没有更新，导致退出nohz状态之后会再次执行load计算，最终将退出nohz状态之后的load作为采样的load。

问题已经清楚，解决方案也比较简单：在退出nohz状态时检测采样时间点在当前时间点之前，如果是，则意味着这次采样时间点在idle内部，这个周期内不需要再次计算该CPU上的load。

转自： http://kernel.taobao.org/index.php?title=Loadavg%E9%97%AE%E9%A2%98%E5%88%86%E6%9E%90&diff=514&oldid=293

转载于:https://www.cnblogs.com/qqmomery/p/6267429.html

你可能感兴趣的:(linux loadavg详解（top cpu load）)

NL2SQL进阶系列(1)：DB-GPT-Hub、SQLcoder、Text2SQL开源应用实践详解汀、人工智能 LLM工业级落地实践人工智能 LLM 自然语言处理 NL2SQL 大模型应用 Text2SQL gpt
NL2SQL进阶系列(1)：DB-GPT-Hub、SQLcoder、Text2SQL开源应用实践详解NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（SpidervsBIRD）全面对比优劣分析[Text2SQL、Text2DSL]NL2SQL基础系列(2)：主流大模型与微调方法精选集，Text2SQL经典算法技术回顾七年发展脉络梳理1.MindSQL(库)MindSQL是一
SQLSERVER 中GO的作用详解
为了省事，直接贴过来的。请看下文详解。usedb_CSharpgoselect*,备注=casewhenGrade>=90then'成绩优秀'whenGrade=80then'成绩良好'whenGrade=70then'成绩及格'else'不及格'endfromtb_Grade如果只是执行一条语句，有没有GO都一样如果多条语句之间用GO分隔开就不一样了每个被GO分隔的语句都是一个单独的事务，一个语
麒麟系统使用-进行.NET开发 mystonelxj 麒麟系统 .net 麒麟系统控制台及web
文章目录前言一、搭建dotnet环境1.获取相关资源2.配置dotnet二、使用dotnet三、其他说明总结前言麒麟系统的内核是基于linux的，如果需要进行.NET开发，则需要安装特定的应用。由于NETFramework是仅适用于Windows版本的.NET，所以要进行.NET开发需要特定的安装及配置。使用.NET方式与在windows环境下使用有些出入。本文将细致讲解在如何在麒麟系统中使用.N
强化学习 16G实践以下是基于CQL（Conservative Q-Learning）与QLoRA（Quantized Low-Rank Adaptation）结合的方案相关开源项目及资源，【ai技】行云流水AI笔记开源人工智能
根据你提供的CUDA版本（11.5）和NVIDIA驱动错误信息，以下是PyTorch、TensorFlow的兼容版本建议及环境修复方案：1.版本兼容性表框架兼容CUDA版本推荐安装命令（CUDA11.5）PyTorch11.3/11.6pipinstalltorchtorchvisiontorchaudio--extra-index-urlhttps://download.pytorch.org/
【.net core】【watercloud】【layui】弹出层回调方法定位当前弹出层位置并调用弹出窗口内部方法 MoFe1 .netcore layui 前端
common.modalOpen({title:"数据生成",url:"your/url/path",width:"95%",height:"90%",yes:function(index,layero){//定位到顶层窗口查找，如果仅使用window，为从当前页面窗口查找，会查找不到信息variframeWin=top.window[layero.find('iframe')[0]['name'
uniapp vue3版本的一些小细节！养乐多～ch uni uni-app vue.js 前端
1,生命周期的引用import{onShow,onHide,onLoad}from"@dcloudio/uni-app"onShow(()=>{showLog('onShow')})onLoad((options)=>{showLog('onLoad')})需要引入，才可以调用2，全局引入css在main.js或者ts中，导入就可以//例如引入全局CSS文件import'./util/baseCs
给群晖6.2.4(NAS)实现免费的内网穿透_以zerotier-One实现牛奶咖啡13 NAS系统 zerotier 群晖内网穿透实现外网访问家里的群晖
一、实现效果①实现通过外网访问家里的群晖NAS，随时方便访问调取自己家里的群晖资料、视屏等资源。②实现群晖重启后依然能够启动zerotier-one服务，让外网能够访问。二、实现方法2.1、需要先到ZeroTier官网注册账号ZeroTier官网https://www.zerotier.com/download/具体的注册操作请参考如下连接：
ROS构建地图服务器节点map_server Xian-HHappy 机器人 linux 运维服务器 map_server ros
运行环境：ubuntu20.04ros1-noetic该文章可用到的代码和资源下载：https://download.csdn.net/download/weixin_42140236/91171139一、构建工作空间文件夹mkdirmyok_ws二、构建rospackagecdmyok_ws/mkdirsrccdsrc/catkin_create_pkgmap_publisherrospynav
Objective-C面向对象编程：类、对象、方法详解（保姆级教程）帅次 iOS Obj-C objective-c ios iphone safari swift macos flutter
目录一、核心概念二、类的定义（分.h和.m文件）1.头文件（.h）——公开声明2.实现文件（.m）——具体实现3.属性特性解析原子性所有权语义(ARC环境下)读写控制三、对象创建与内存管理1.创建对象的两种方式2.关键步骤解析3.instancetype四、方法调用（消息传递机制）1.基本语法2.关键概念五、self与super关键字六、动手实践：完整工作流1.创建Person对象并调用方法2.项
荣耀手机应用使用时间查看方法详解游戏开发爱好者8 http udp https websocket 网络安全网络协议 tcp/ip
荣耀手机如何查看应用使用时间想要了解荣耀手机中各个应用的使用时间吗？接下来，我们将为您详细介绍如何查看这些信息。一、引言在当下智能手机广泛应用的时代，手机应用已然成为我们生活中不可或缺的助手。荣耀手机，作为华为旗下的出色品牌，凭借其出色的性能与丰富的功能，赢得了众多用户的青睐。为了更有效地管理手机使用时间，洞悉个人的应用使用习惯，掌握查看应用使用时间的技巧显得尤为关键。接下来，我们将一步步引导您了
iOS App 上架常见问题解决方案：六大难点与实战工具分工详解游戏开发爱好者8 http udp https websocket 网络安全网络协议 tcp/ip
作为一名主要负责移动端交付的工程师，iOS上架过程向来是开发周期中最容易“卡壳”的一环，特别是在跨平台项目、资源有限的团队中更为明显。在最近一个智能出行类App项目中，我们团队采用Flutter开发，最终要将成品应用发布至AppStore。在整个过程中，我们遇到了不少实际问题。本文将围绕“上架过程中最棘手的6个典型难点”，结合我们的解决方法和所用工具，进行一次全面复盘。难点一：没有Mac电脑，无法
Mariadb-Server的二进制安装 linux土老帽 linux土老帽 mariadb linux centos
搭建环境：OS:centos7.6版本mariadb:mariadb-10.2.25-linux-x86_64.tar.gz#下载地址：DownloadMariaDBServer-MariaDB.org1.创建用户组useradd-r-s/sbin/nologin-d/data/mysqlmysql#创建用户-r系统账户-s指定shell/sbin/nologin-d指定家目录但是不创建原因是系统
MySql主从备份Slave 甚享享 mysql 数据库
Mysql主从备份可以在除主服务器外的其他服务器是部署从库，用于实时备份生产环境数据，核心是mysql的log-bin日志（二进制日志），主库开启bin日志后，从库通过日志同步(SlaveI/O)和回放(SlaveSQL)实现数据同步.因为设置主从备份时，需要指定主库lob-bin日志运行行数，所以之前的数据需要通过“数据同步”或者手动同步完成修改配置文件Linux:my.cnfWindows:m
高通 QCS8550 大模型性能深度解析：从算力基准到场景实测的全维度 Benchmark 伊利丹~怒风 Qualcomm 人工智能 AI编程 python arm 自然语言处理
前言在人工智能技术狂飙突进的时代，大模型正以前所未有的速度重塑各行业生态，从智能客服到多模态交互，从边缘推理到端侧部署，其应用场景不断拓展。而这一切革新的背后，离不开底层硬件的强力支撑。高通QCS8550作为面向下一代智能设备的旗舰级计算平台，凭借高达48TOPS的AI算力与先进的第七代高通AI引擎，在大模型性能表现上极具竞争力。其异构多核架构不仅能高效处理复杂的神经网络计算，还通过软硬件协同优化
高通手机跑AI系列之——3D姿势估计伊利丹~怒风 Qualcomm 智能手机 AI编程 arm python 人工智能
目录环境准备手机软件算法Demo代码功能分析关键模块解析示例代码代码效果环境准备手机测试手机型号：RedmiK60Pro处理器：第二代骁龙8移动--8gen2运行内存：8.0GB，LPDDR5X-8400，67.0GB/s摄像头：前置16MP+后置50MP+8MP+2MPAI算力：NPU48TopsINT8&&GPU1536ALUx2x680MHz=2.089TFLOPS提示：任意手机均可以，性能
高通手机跑AI系列之——姿态识别伊利丹~怒风 Qualcomm 智能手机人工智能 AI编程 python arm
环境准备手机测试手机型号：RedmiK60Pro处理器：第二代骁龙8移动--8gen2运行内存：8.0GB，LPDDR5X-8400，67.0GB/s摄像头：前置16MP+后置50MP+8MP+2MPAI算力：NPU48TopsINT8&&GPU1536ALUx2x680MHz=2.089TFLOPS提示：任意手机均可以，性能越好的手机速度越快软件APP：AidLux2.0系统环境：Ubuntu2
高通手机跑AI系列之——实时头发识别伊利丹~怒风 Qualcomm 智能手机 AI编程 python arm 人工智能
环境准备手机测试手机型号：RedmiK60Pro处理器：第二代骁龙8移动--8gen2运行内存：8.0GB，LPDDR5X-8400，67.0GB/s摄像头：前置16MP+后置50MP+8MP+2MPAI算力：NPU48TopsINT8&&GPU1536ALUx2x680MHz=2.089TFLOPS提示：任意手机均可以，性能越好的手机速度越快软件APP：AidLux2.0系统环境：Ubuntu2
高通手机跑AI系列之——手部姿势跟踪伊利丹~怒风 Qualcomm 智能手机 AI编程 python arm 人工智能
环境准备手机测试手机型号：RedmiK60Pro处理器：第二代骁龙8移动--8gen2运行内存：8.0GB，LPDDR5X-8400，67.0GB/s摄像头：前置16MP+后置50MP+8MP+2MPAI算力：NPU48TopsINT8&&GPU1536ALUx2x680MHz=2.089TFLOPS提示：任意手机均可以，性能越好的手机运行速度越快软件APP：AidLux2.0系统环境：Ubunt
Mysql 主从备份龙那个猫robot 数据库 mysql
英文好的可以直接去mysql官网查看https://dev.mysql.com/doc/refman/5.7/en/replication.html1环境准备我这里准备两套linux虚拟机，主mysql服务器,从mysql服务区ip192.168.1.30ip192.168.1.1001.1备份主mysql数据库1.2从数据库恢复主mysql数据库1.3配置主mysql服务器配置server-id
让一个程序在后台运行 Hi_kenyon python linux 网络
PartI:如何让一个程序在后台运行，在关闭终端的时候，命令或者进行不会被中断在Linux上，如果你希望一个命令在后台持续运行，即使你关闭终端，它不会被终止，有几种常用的方法可以实现这个目的：方法一：使用nohupnohup（nohangup）命令可以让进程忽略挂起（HUP）信号，这样即使关闭终端也不会结束。nohupyour-command>output.log2>&1&your-command
ubuntu切换目录命令 Joel Jin ubuntu ubuntu linux
UbuntuLinux命令查看目录信息1.切换目录命令的使用cd~效果:cd..效果:cd.效果cd-效果1.切换目录命令的使用命令说明cd目录切换到指定目录cd~切换到当前用户的主目录cd…两个点切换到上一级目录cd.切换到当前目录cd-切换到上一次目录cd~效果:root@root1:~#cd/etc/acpiroot@root1:/etc/acpi#cd~root@root1:~#cd…效果
linux服务器上创建一个文件需要授权一次的问题根源：umask qq_30024063 linux 运维服务器
umask命令用于设置文件的默认权限掩码。文件的权限掩码决定了新建文件的默认权限。umask命令的语法如下：umask[-S][模式]其中，-S选项用于以符号方式显示当前的权限掩码。模式表示要设置的新的权限掩码，可以使用八进制或者符号两种方式。在Linux系统中，每个文件都有三个属性：所有者权限、所属组权限和其他用户权限。每个属性有读、写和执行三个权限，分别用r、w和x表示。对于每一个属性，权限可
【LlamaIndex核心组件指南 | 模型篇】一文通晓 LlamaIndex 模型层：LLM、Embedding 及多模态应用全景解析
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
如何用Docker部署Mysql 小楠小楠小楠 docker mysql 容器
1.安装Docker确保已安装Docker，并启动Docker服务。Linux：bash复制sudoaptupdatesudoaptinstalldocker.iosudosystemctlstartdockersudosystemctlenabledocker2.拉取MySQL镜像从DockerHub拉取官方MySQL镜像。bash复制dockerpullmysql:latest3.启动MySQ
软件测试从业者必备的SQL知识十二测试录数据库 sql 数据库
作为职场人，学一门技能是用来解决日常工作问题的，没必要从头到尾把这块知识弄透，没那么多时间。基于此，十二根据自己的经验，把软件测试从业者需要掌握的SQL知识，整理如下；只要跟着这个顺序，从头到尾执行即可。前置准备事项：1、在自己电脑上安装一个mysql数据库，文章见->虚拟机Centos下安装Mysql完整过程（图文详解）_虚拟机安装mysql-CSDN博客2、找一个mysql客户端链接工具：初学
Java静态static详解 Obltv Java基础 java
更多内容请看我的个人网站date:2025-06-04tags:八股基础静态变量特点被该类的所有对象共享不属于对象，属于类优先于对象存在，随着类的加载而加载调用方式类名调用对象名调用（不推荐）静态方法没有this关键字publicclassStudent{privateStringname;privateintage;privateStringteacherName;publicvoidshow(
平台再升级！接入DeepSeek AI，三大能力一键生成橙武科技低代码 AI deepseek 人工智能
在数字化项目落地过程中，很多企业都会面临相同的问题：数据库建模要写SQL表结构；业务流程需要画LogicFlow流程图；前端页面还要写AMISJSON配置。从想法到实现，中间至少要经历产品经理、架构师、后端、前端多轮沟通。每个环节都耗时，改起来还要推翻重来。demo地址：https://admin.cwcode.top✨我们的平台，现在直接整合了DeepSeekAI大模型只要输入一句需求，就能：✅
鸿蒙仓颉开发语言实战教程：页面跳转和传参湖北穷逼首席代表 harmonyos 开发语言华为
合集-仓颉教程(25)1.详解鸿蒙仓颉开发语言中的日志打印问题05-212.鸿蒙仓颉开发语言实战教程：实现商城应用首页05-223.鸿蒙仓颉开发语言实战教程：页面跳转和传参05-254.鸿蒙仓颉语言开发教程：页面和组件的生命周期05-285.鸿蒙仓颉语言开发实战教程：购物车页面06-036.鸿蒙仓颉语言开发实战教程：商城登录页06-047.鸿蒙仓颉语言开发实战教程：商城搜索页06-058.鸿蒙仓颉
鸿蒙仓颉语言开发实战教程：购物车页面王家那谁 harmonyos 华为
合集-仓颉教程(25)1.详解鸿蒙仓颉开发语言中的日志打印问题05-212.鸿蒙仓颉开发语言实战教程：实现商城应用首页05-223.鸿蒙仓颉开发语言实战教程：页面跳转和传参05-254.鸿蒙仓颉语言开发教程：页面和组件的生命周期05-285.鸿蒙仓颉语言开发实战教程：购物车页面06-036.鸿蒙仓颉语言开发实战教程：商城登录页06-047.鸿蒙仓颉语言开发实战教程：商城搜索页06-058.鸿蒙仓颉
深入详解：决策树算法的概念、原理、实现与应用场景猿享天开算法决策树机器学习
深入详解：决策树算法的概念、原理、实现与应用场景决策树（DecisionTree）是机器学习中一种直观且广泛应用的监督学习算法，适用于分类和回归任务。其树形结构易于理解，特别适合初学者。本文将从概念、原理、实现到应用场景，全面讲解决策树，并通过流程图和可视化示例增强理解，通俗易懂，帮助小白快速掌握决策树算法相关知识。1.决策树的概念1.1什么是决策树？决策树通过一系列条件判断（决策节点）将输入数据
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那