weixin_33747129

Suspend to RAM和Suspend to Idle分析，以及在HiKey上性能对比

测试环境：AOSP 7.1.1+Kernel 4.4.17 HW：HiKey

Ubuntu 14.04+Kernel 4.4.0-31

1. Linux内核suspend状态

Linux内核支持多种类型的睡眠状态，通过设置不同的模块进入低功耗模式来达到省电功能。

目前存在四种模式：suspend to idle、power-on standby（Standby）、suspend to ram（STR）和sudpend to disk（Hibernate），分别对应ACPI状态的S0、S1、S3和S4。

State in Linux	Label	state	ACPI state	注释
#define PM_SUSPEND_ON ((__force suspend_state_t) 0)				一切正常
#define PM_SUSPEND_FREEZE ((__force suspend_state_t) 1)	freeze	Suspend-to-Idle	S0	冻结进程+挂起设备+CPU空闲
#define PM_SUSPEND_STANDBY ((__force suspend_state_t) 2)	standby	Standby/Power-on Suspend	S1	冻结进程+挂起设备+关闭nonbootCPU
#define PM_SUSPEND_MEM ((__force suspend_state_t) 3)	mem	Suspend-to-RAM	S3	仅保留RAM自刷新
#define PM_SUSPEND_MAX ((__force suspend_state_t) 4)	disk	Suspend-to-disk	S4	关闭所有设备包括RAM，也被称为Hibernate

从freeze-->standby-->mem睡眠程度越来越深，唤醒花费的时间也越来越多。

Suspend-To-Idle

此状态包括frozen processes+suspended devices+idle processors，具有轻量化的特点；

并且相对于相对于Idle状态能节省更多的功耗，因为此时的用户空间被冻结且I/O设备进入了低功耗状态。

相对于Suspend-To-RAM它具有低延时的优势。

Standby/Power-On Suspend

此状态包括frozen processes+suspended devices+offline nonboot CPUs+suspend low-level system，对CPU的处理更近一步。

所以相对于Suspend-To-Idle节省了更多的功耗，但是由于需要恢复CPU和一些底层功能也花费了更多的时间。

Suspend-to-RAM

此状态使所有的设备进入低功耗状态，仅保留RAM自刷新。

所有的设备和系统状态都保存在RAM中，所有外设被挂起。

（在HiKey的实际测试中，boot CPU是没有关闭的！实际上这里也没有standby，mem和standby基本上没有区别。）

Suspend-to-disk

此状态是最省功耗的模式。

相对Suspend-to-RAMRAM能节省更多功耗的原因是数据会被写入磁盘中，RAM也可以被关闭。

但是这也导致了，更多的恢复延时，在resume的时候读回到RAM，然后在进行系统和设备状态恢复工作。

但是在一般的嵌入式设备上，此种状态不支持。

下面用STR表示Suspend to RAM，STI表示Suspend to Idle。

详情请参考：http://www.linaro.org/blog/suspend-to-idle/

2. Suspend状态，以及STR 和STI区别

写入/sys/power/state不同字符串，可以让系统进入不同睡眠状态。

针对state sysfs节点的写入，最终会进入到state_store这个函数，将字符串转换成上表中不同状态。

state_store(kernel/power/main.c)
    -->pm_suspend (kernel/power/suspend.c)-------------处理除freeze、standby、mem三种类型suspend
        -->enter_state---------------------------------在进入睡眠之前，做一些准备工作
            -->suspend_devices_and_enter
                -->suspend_enter-----------------------这里才是freeze与standby/mem区别所在。
    -->hibernate---------------------------------------进入suspend to disk流程

STR和STI的最主要区别就是下面一段代码：

static int suspend_enter(suspend_state_t state, bool *wakeup)
{

…

    /*
     * PM_SUSPEND_FREEZE equals
     * frozen processes + suspended devices + idle processors.
     * Thus we should invoke freeze_enter() soon after
     * all the devices are suspended.
     */
//====================================FREEZE===============================================================
    if (state == PM_SUSPEND_FREEZE) {------------------------------------如果要进入freeze状态，就会执行此段代码。
        trace_suspend_resume(TPS("machine_suspend"), state, true);
        freeze_enter();
        trace_suspend_resume(TPS("machine_suspend"), state, false);
        goto Platform_wake;----------------------------------------------在执行结束跳转到Platform_wake，中间一段绿色代码将会被跳过。所以说freeze和standby、mem相比，多了freeze_enter，少了对non-boot CPUs、arch、syscore的操作。
    }
//=====================================MEM===============================================================
    error = disable_nonboot_cpus();
    if (error || suspend_test(TEST_CPUS)) {
        log_suspend_abort_reason("Disabling non-boot cpus failed");
        goto Enable_cpus;
    }

    arch_suspend_disable_irqs();
    BUG_ON(!irqs_disabled());

    error = syscore_suspend();
    if (!error) {
        *wakeup = pm_wakeup_pending();
        if (!(suspend_test(TEST_CORE) || *wakeup)) {
            trace_suspend_resume(TPS("machine_suspend"),
                state, true);
            error = suspend_ops->enter(state);
            trace_suspend_resume(TPS("machine_suspend"),
                state, false);
            events_check_enabled = false;
        } else if (*wakeup) {
            pm_get_active_wakeup_sources(suspend_abort,
                MAX_SUSPEND_ABORT_LEN);
            log_suspend_abort_reason(suspend_abort);
            error = -EBUSY;
        }
        syscore_resume();
    }

    arch_suspend_enable_irqs();
    BUG_ON(irqs_disabled());

Enable_cpus:
    enable_nonboot_cpus();

Platform_wake:
    platform_resume_noirq(state);
    dpm_resume_noirq(PMSG_RESUME);

…

}

3 suspend/resume流程梳理

下面分析一下suspend/resume每个细分阶段。

整个suspend可以分为若干阶段，每个阶段函数—>关键节点Trace—>analyze_suspend.py解析Trace—>根据Trace时间画出Timeline图表

这样就可以分析出总的时间差异，每个阶段差异，甚至一个设备suspend/resume、一个子系统suspend/resume的时间差异。

analyze_suspend.py 基于默认基于ftrace进行分析（在指定dmesg的时候，会发现缺失了很多log信息，无法生成timeline类型的html文件），将suspend/resume分为若干阶段。

下面简要介绍一下各个阶段，然后基于此进行代码分析。

在kernel版本大于等与3.15之后，解析需要的所有log信息都可以从ftrace中获取。之前的内核版本还需要借助于dmesg。

由于使用的kernel版本是4.4.17，sysvals.usetraceeventsonly被置位，所以只会parseTraceLog()。

下表中的各个阶段通过解析suspend_resume: XXXXXXX类型的ftrace来获取。

各子模块、子系统的解析通过device_pm_callback_start和device_pm_callback_end来截取时间段，以及这时间段内的callgraph。

Phase名称	ftrace关键词
suspend_prepare	dpm_prepare
suspend	dpm_suspend
suspend_late	dpm_suspend_late
suspend_noirq	dpm_suspend_noirq
suspend_machine	machine_suspend start
resume_machine	machine_suspend end
resume_noirq	dpm_resume_noirq
resume_early	dpm_resume_early
resume	dpm_resume
resume_complete	dpm_complete

下面是一组suspend/resume执行ftrace log，我们将据此进行各阶段代码分析，包括suspend_enter、suspend_prepare、suspend、suspend_late、suspend_noirq、suspend_machine、resume_machine、resume_noirq、resume_early、resume、resume_complete。

从这里也可以看出freeze和mem/standby除了machine部分不同之外，还少了CPU开关和syscore suspend/resume操作。

suspend_resume: suspend_enter[1] begin
suspend_resume: sync_filesystems[0] begin
suspend_resume: sync_filesystems[0] end
suspend_resume: freeze_processes[0] begin
suspend_resume: freeze_processes[0] end
suspend_resume: suspend_enter[1] end
suspend_resume: dpm_prepare[2] begin
suspend_resume: dpm_prepare[2] end
suspend_resume: dpm_suspend[2] begin
suspend_resume: dpm_suspend[2] end
suspend_resume: dpm_suspend_late[2] begin
suspend_resume: dpm_suspend_late[2] end
suspend_resume: dpm_suspend_noirq[2] begin
suspend_resume: dpm_suspend_noirq[2] end
No CPU_OFF…
No syscore_suspend…
suspend_resume: machine_suspend[1] begin
suspend_resume: machine_suspend[1] end
No suscore_resume…
No CPU_ON…
suspend_resume: dpm_resume_noirq[16] begin
suspend_resume: dpm_resume_noirq[16] end
suspend_resume: dpm_resume_early[16] begin
suspend_resume: dpm_resume_early[16] end
suspend_resume: dpm_resume[16] begin
suspend_resume: dpm_resume[16] end
suspend_resume: dpm_complete[16] begin
suspend_resume: dpm_complete[16] end
suspend_resume: resume_console[1] begin
suspend_resume: resume_console[1] end
suspend_resume: thaw_processes[0] begin
suspend_resume: thaw_processes[0] end

suspend_resume: suspend_enter[3] begin
suspend_resume: sync_filesystems[0] begin
suspend_resume: sync_filesystems[0] end
suspend_resume: freeze_processes[0] begin
suspend_resume: freeze_processes[0] end
suspend_resume: suspend_enter[3] end
suspend_resume: dpm_prepare[2] begin
suspend_resume: dpm_prepare[2] end
suspend_resume: dpm_suspend[2] begin
suspend_resume: dpm_suspend[2] end
suspend_resume: dpm_suspend_late[2] begin
suspend_resume: dpm_suspend_late[2] end
suspend_resume: dpm_suspend_noirq[2] begin
suspend_resume: dpm_suspend_noirq[2] end
suspend_resume: CPU_OFF[1-7] begin/end
suspend_resume: syscore_suspend[0] begin/end
suspend_resume: machine_suspend[3] begin
suspend_resume: machine_suspend[3] end
suspend_resume: syscore_resume[0] begin/end
suspend_resume: CPU_ON[1-7] begin/end
suspend_resume: dpm_resume_noirq[16] begin
suspend_resume: dpm_resume_noirq[16] end
suspend_resume: dpm_resume_early[16] begin
suspend_resume: dpm_resume_early[16] end
suspend_resume: dpm_resume[16] begin
suspend_resume: dpm_resume[16] end
suspend_resume: dpm_complete[16] begin
suspend_resume: dpm_complete[16] end
suspend_resume: resume_console[3] begin
suspend_resume: resume_console[3] end
suspend_resume: thaw_processes[0] begin
suspend_resume: thaw_processes[0] end

在介绍相关代码之前，先介绍一下HiKey使用的platform_suspend_ops：

static const struct platform_suspend_ops psci_suspend_ops = {
.valid = suspend_valid_only_mem, 仅支持mem类型的suspend
.enter = psci_system_suspend_enter, 睡眠的CPU底层支持
};

freeze的platform_freeze_ops如下：

static const struct platform_freeze_ops acpi_freeze_ops = {
    .begin = acpi_freeze_begin,
    .prepare = acpi_freeze_prepare,
    .restore = acpi_freeze_restore,
    .end = acpi_freeze_end,
};

3.1 suspend_enter

enter_state作为suspend/resume的入口点，完成了绝大部分工作。首先确保系统没有正在进入睡眠状态；然后为suspend做一些准备，使系统进入睡眠并在唤醒后进行必要清理恢复工作。

下面分析一下suspend之前的准备工作，即suspend_enter阶段：

static int enter_state(suspend_state_t state)
{
    int error;

    trace_suspend_resume(TPS("suspend_enter"), state, true);
    if (state == PM_SUSPEND_FREEZE) {--------------------------------------是否是freeze类型suspend
#ifdef CONFIG_PM_DEBUG
        if (pm_test_level != TEST_NONE && pm_test_level <= TEST_CPUS) {
            pr_warning("PM: Unsupported test mode for suspend to idle,"
                   "please choose none/freezer/devices/platform.\n");
            return -EAGAIN;
        }
#endif
    } else if (!valid_state(state)) {-------------------------------------目前只支持mem类型suspend
        return -EINVAL;
    }
    if (!mutex_trylock(&pm_mutex))
        return -EBUSY;

    if (state == PM_SUSPEND_FREEZE)
        freeze_begin();--------------------------------------------------初始化suspend_freeze_state为FREEZE_STATE_NONE

#ifndef CONFIG_SUSPEND_SKIP_SYNC
    trace_suspend_resume(TPS("sync_filesystems"), 0, true);
    printk(KERN_INFO "PM: Syncing filesystems ... ");
    sys_sync();----------------------------------------------------------sync文件系统缓存文件，确保数据sync到硬盘。
    printk("done.\n");
    trace_suspend_resume(TPS("sync_filesystems"), 0, false);
#endif

    pr_debug("PM: Preparing system for sleep (%s)\n", pm_states[state]);
    pm_suspend_clear_flags();
    error = suspend_prepare(state);--------------------------------------注意这里面的suspend_prepare和下面的suspend_prepare阶段容易搞混。
    if (error)
        goto Unlock;

    if (suspend_test(TEST_FREEZER))
        goto Finish;

    trace_suspend_resume(TPS("suspend_enter"), state, false);
    pr_debug("PM: Suspending system (%s)\n", pm_states[state]);
    pm_restrict_gfp_mask();
    error = suspend_devices_and_enter(state);
    pm_restore_gfp_mask();

Finish:
    pr_debug("PM: Finishing wakeup.\n");
    suspend_finish();---------------------------------------------------解冻，重启进程；发送PM_POST_SUSPEND通知；释放之前分配的console。
Unlock:
    mutex_unlock(&pm_mutex);
    return error;
}

接着分析一下suspend_prepare函数：

static int suspend_prepare(suspend_state_t state)
{
int error;

if (!sleep_state_supported(state)) 验证suspend状态
return -EPERM;

pm_prepare_console(); 分配一个suspend console

    error = pm_notifier_call_chain(PM_SUSPEND_PREPARE); 发送PM_SUSPEND_PREPARE通知消息
    if (error)
        goto Finish;

    trace_suspend_resume(TPS("freeze_processes"), 0, true);
    error = suspend_freeze_processes(); 冻结进程
    trace_suspend_resume(TPS("freeze_processes"), 0, false);
    if (!error)
        return 0;

    suspend_stats.failed_freeze++;
    dpm_save_failed_step(SUSPEND_FREEZE);
Finish:
    pm_notifier_call_chain(PM_POST_SUSPEND);
    pm_restore_console();
    return error;
}

suspend_freeze_process先处理用户空间进程，然后处理内核进程：

static inline int suspend_freeze_processes(void)
{
int error;

    error = freeze_processes(); 触发用户空间进程进入freeze状态。当前进程不会被冻结。因为冻结失败的进程会自动被解冻，所以不需要进行错误处理。
    /*
     * freeze_processes() automatically thaws every task if freezing
     * fails. So we need not do anything extra upon error.
     */
    if (error)
        return error;

    error = freeze_kernel_threads(); 冻结内核线程
    /*
     * freeze_kernel_threads() thaws only kernel threads upon freezing
     * failure. So we have to thaw the userspace tasks ourselves.
     */
    if (error) 由于freeze_kernel_threads冻结失败，只会解冻内核线程。所以还需要对用户空间进程进行解冻。
        thaw_processes();

return error;
}

下面的阶段都在suspend_devices_and_enter中，可以看出这是一个对称的流程，每一阶段的suspend，都有对应的resume。

int suspend_devices_and_enter(suspend_state_t state)
{
int error;
bool wakeup = false;

if (!sleep_state_supported(state))
return -ENOSYS;

    error = platform_suspend_begin(state);
    if (error)
        goto Close;

    suspend_console(); 关闭console子系统，暂停printk打印
    suspend_test_start();
    error = dpm_suspend_start(PMSG_SUSPEND); suspend_prepare(dpm_prepare)、suspend(dpm_suspend)两阶段
    if (error) {
        pr_err("PM: Some devices failed to suspend, or early wake event detected\n");
        log_suspend_abort_reason("Some devices failed to suspend, or early wake event detected");
        goto Recover_platform;
    }
    suspend_test_finish("suspend devices");
    if (suspend_test(TEST_DEVICES))
        goto Recover_platform;

    do {
        error = suspend_enter(state, &wakeup); suspend_late(dpm_suspend_late)、suspend_noirq(dpm_suspend_noirq)、suspend_machine、resume_machine、resume_noirq(dpm_resume_noirq)、resume_early(dpm_resume_early)
    } while (!error && !wakeup && platform_suspend_again(state));

Resume_devices:
    suspend_test_start();
    dpm_resume_end(PMSG_RESUME); resume(dpm_resume)、resume_complete(dpm_complete)
    suspend_test_finish("resume devices");
    trace_suspend_resume(TPS("resume_console"), state, true);
    resume_console(); 打开console子系统，恢复printk打印。
    trace_suspend_resume(TPS("resume_console"), state, false);

Close:
platform_resume_end(state);
return error;

Recover_platform:
platform_recover(state);
goto Resume_devices;
}

还有必要过一下suspend_enter：

static int suspend_enter(suspend_state_t state, bool *wakeup)
{
char suspend_abort[MAX_SUSPEND_ABORT_LEN];
int error, last_dev;

    error = platform_suspend_prepare(state); 因为suspend_ops的prepare为空，所以返回0
    if (error)
        goto Platform_finish;

    error = dpm_suspend_late(PMSG_SUSPEND); suspend_late
    if (error) {
        last_dev = suspend_stats.last_failed_dev + REC_FAILED_NUM - 1;
        last_dev %= REC_FAILED_NUM;
        printk(KERN_ERR "PM: late suspend of devices failed\n");
        log_suspend_abort_reason("%s device failed to power down",
            suspend_stats.failed_devs[last_dev]);
        goto Platform_finish;
    }
    error = platform_suspend_prepare_late(state); 执行freeze_ops->prepare()
    if (error)
        goto Devices_early_resume;

    error = dpm_suspend_noirq(PMSG_SUSPEND); suspend_noirq
    if (error) {
        last_dev = suspend_stats.last_failed_dev + REC_FAILED_NUM - 1;
        last_dev %= REC_FAILED_NUM;
        printk(KERN_ERR "PM: noirq suspend of devices failed\n");
        log_suspend_abort_reason("noirq suspend of %s device failed",
            suspend_stats.failed_devs[last_dev]);
        goto Platform_early_resume;
    }
    error = platform_suspend_prepare_noirq(state);
    if (error)
        goto Platform_wake;

if (suspend_test(TEST_PLATFORM))
goto Platform_wake;

    /*
     * PM_SUSPEND_FREEZE equals
     * frozen processes + suspended devices + idle processors.
     * Thus we should invoke freeze_enter() soon after
     * all the devices are suspended.
     */
    if (state == PM_SUSPEND_FREEZE) { 这里是freeze和mem/standy差别所在
        trace_suspend_resume(TPS("machine_suspend"), state, true);
        freeze_enter();
        trace_suspend_resume(TPS("machine_suspend"), state, false);
        goto Platform_wake;
    }

    error = disable_nonboot_cpus(); 关闭所有boot-CPU之外的CPU
    if (error || suspend_test(TEST_CPUS)) {
        log_suspend_abort_reason("Disabling non-boot cpus failed");
        goto Enable_cpus;
    }

arch_suspend_disable_irqs();
BUG_ON(!irqs_disabled());

    error = syscore_suspend(); 执行syscore_ops_list上所有syscore_ops的suspend回调函数
    if (!error) {
        *wakeup = pm_wakeup_pending(); 检查是否需要终止suspend流程？
        if (!(suspend_test(TEST_CORE) || *wakeup)) {
            trace_suspend_resume(TPS("machine_suspend"),
                state, true);
            error = suspend_ops->enter(state); 调用psci_suspend_ops的enter回调函数，关闭machine
            trace_suspend_resume(TPS("machine_suspend"),
                state, false); !!!!!!!!!!!!!!!!这里即为唤醒之后的执行路径了!!!!!!!!!!!!!!!!
            events_check_enabled = false;
        } else if (*wakeup) {
            pm_get_active_wakeup_sources(suspend_abort,
                MAX_SUSPEND_ABORT_LEN);
            log_suspend_abort_reason(suspend_abort);
            error = -EBUSY;
        }
        syscore_resume(); 执行所有syscore_ops_list的resume回调函数
    }

arch_suspend_enable_irqs();
BUG_ON(irqs_disabled());

Enable_cpus:
enable_nonboot_cpus(); 打开所有non-boot CPU

Platform_wake:
platform_resume_noirq(state);
dpm_resume_noirq(PMSG_RESUME); resume_noirq

Platform_early_resume:
platform_resume_early(state);

Devices_early_resume:
dpm_resume_early(PMSG_RESUME); resume_early

Platform_finish:
platform_resume_finish(state);
return error;
}

3.2 suspend_prepare和suspend

DPM是Device Power Management的意思，这些操作都是针对非系统设备（non-sysdev）进行的。那什么是系统设备呢？下面的machine应该就是所谓的sysdev了。

dpm_prepare实际上就是遍历dpm_list上的所有设备，执行->prepare回调函数。如果设备存在->prepare回电函数，会将设备的prepare阶段打印到ftrace。

int dpm_prepare(pm_message_t state)
{
int error = 0;

trace_suspend_resume(TPS("dpm_prepare"), state.event, true);
might_sleep();

    mutex_lock(&dpm_list_mtx);
    while (!list_empty(&dpm_list)) { 遍历dpm_list
        struct device *dev = to_device(dpm_list.next);

get_device(dev);
mutex_unlock(&dpm_list_mtx);

        trace_device_pm_callback_start(dev, "", state.event);
        error = device_prepare(dev, state); 执行->prepare回调函数
        trace_device_pm_callback_end(dev, error);

        mutex_lock(&dpm_list_mtx);
        if (error) {
            if (error == -EAGAIN) {
                put_device(dev);
                error = 0;
                continue;
            }
            printk(KERN_INFO "PM: Device %s not prepared "
                "for power transition: code %d\n",
                dev_name(dev), error);
            put_device(dev);
            break;
        }
        dev->power.is_prepared = true;
        if (!list_empty(&dev->power.entry))
            list_move_tail(&dev->power.entry, &dpm_prepared_list); 移动设备到dpm_prepared_list
        put_device(dev);
    }
    mutex_unlock(&dpm_list_mtx);
    trace_suspend_resume(TPS("dpm_prepare"), state.event, false);
    return error;
}

dpm_suspend遍历dpm_prepared_list，这点和dpm_prepare有区别。然后执行设备的->suspend回调函数。

int dpm_suspend(pm_message_t state)
{
ktime_t starttime = ktime_get();
int error = 0;

trace_suspend_resume(TPS("dpm_suspend"), state.event, true);
might_sleep();

cpufreq_suspend();

    mutex_lock(&dpm_list_mtx);
    pm_transition = state;
    async_error = 0;
    while (!list_empty(&dpm_prepared_list)) { 基于dpm_prepared_list遍历设备
        struct device *dev = to_device(dpm_prepared_list.prev);

get_device(dev);
mutex_unlock(&dpm_list_mtx);

error = device_suspend(dev); 执行设备->suspend回调函数

        mutex_lock(&dpm_list_mtx);
        if (error) {
            pm_dev_err(dev, state, "", error);
            dpm_save_failed_dev(dev_name(dev));
            put_device(dev);
            break;
        }
        if (!list_empty(&dev->power.entry))
            list_move(&dev->power.entry, &dpm_suspended_list); 移动设备到dpm_suspended_list
        put_device(dev);
        if (async_error)
            break;
    }
    mutex_unlock(&dpm_list_mtx);
    async_synchronize_full();
    if (!error)
        error = async_error;
    if (error) {
        suspend_stats.failed_suspend++;
        dpm_save_failed_step(SUSPEND_SUSPEND);
    } else
        dpm_show_time(starttime, state, NULL);
    trace_suspend_resume(TPS("dpm_suspend"), state.event, false);
    return error;
}

3.3 suspend_late和suspend_noirq

dpm_suspend_late基于dpm_suspended_list操作设备，所以这也需要函数之间顺序执行。

int dpm_suspend_late(pm_message_t state)
{
ktime_t starttime = ktime_get();
int error = 0;

    trace_suspend_resume(TPS("dpm_suspend_late"), state.event, true);
    mutex_lock(&dpm_list_mtx);
    pm_transition = state;
    async_error = 0;

while (!list_empty(&dpm_suspended_list)) { 遍历dpm_suspended_list列表
struct device *dev = to_device(dpm_suspended_list.prev);

get_device(dev);
mutex_unlock(&dpm_list_mtx);

error = device_suspend_late(dev); 执行->suspend_late回调函数

        mutex_lock(&dpm_list_mtx);
        if (!list_empty(&dev->power.entry))
            list_move(&dev->power.entry, &dpm_late_early_list); 移动设备到dpm_late_early_list

        if (error) {
            pm_dev_err(dev, state, " late", error);
            dpm_save_failed_dev(dev_name(dev));
            put_device(dev);
            break;
        }
        put_device(dev);

        if (async_error)
            break;
    }
    mutex_unlock(&dpm_list_mtx);
    async_synchronize_full();
    if (!error)
        error = async_error;
    if (error) {
        suspend_stats.failed_suspend_late++;
        dpm_save_failed_step(SUSPEND_SUSPEND_LATE);
        dpm_resume_early(resume_event(state));
    } else {
        dpm_show_time(starttime, state, "late");
    }
    trace_suspend_resume(TPS("dpm_suspend_late"), state.event, false);
    return error;
}

dpm_suspend_noirq基于dpm_late_early_list遍历所有设备。首先阻止设备驱动接收中断信息，然后执行->suspend_noirq回调函数。

int dpm_suspend_noirq(pm_message_t state)
{
ktime_t starttime = ktime_get();
int error = 0;

    trace_suspend_resume(TPS("dpm_suspend_noirq"), state.event, true);
    cpuidle_pause(); 暂停cpuidle功能，退出idle的CPU
    device_wakeup_arm_wake_irqs(); 将具有wakeirq的设备设置成wakeup resource
    suspend_device_irqs(); 关闭当前所有能够关闭的irq，置成IRQS_SUSPENDED。IRQF_NO_SUSPEND类型的wakeup中断不能被关闭，并且作为wakeup唤醒源的中断不能被关闭。
    mutex_lock(&dpm_list_mtx);
    pm_transition = state;
    async_error = 0;

while (!list_empty(&dpm_late_early_list)) {
struct device *dev = to_device(dpm_late_early_list.prev);

get_device(dev);
mutex_unlock(&dpm_list_mtx);

error = device_suspend_noirq(dev); 调用->suspend_noirq回调函数

        mutex_lock(&dpm_list_mtx);
        if (error) {
            pm_dev_err(dev, state, " noirq", error);
            dpm_save_failed_dev(dev_name(dev));
            put_device(dev);
            break;
        }
        if (!list_empty(&dev->power.entry))
            list_move(&dev->power.entry, &dpm_noirq_list); 移动设备到dpm_noirq_list
        put_device(dev);

        if (async_error)
            break;
    }
    mutex_unlock(&dpm_list_mtx);
    async_synchronize_full();
    if (!error)
        error = async_error;

    if (error) {
        suspend_stats.failed_suspend_noirq++;
        dpm_save_failed_step(SUSPEND_SUSPEND_NOIRQ);
        dpm_resume_noirq(resume_event(state));
    } else {
        dpm_show_time(starttime, state, "noirq");
    }
    trace_suspend_resume(TPS("dpm_suspend_noirq"), state.event, false);
    return error;
}

3.4 suspend_machine和resume_machine

freeze和mem/standby在这部分是不同的。

mem/standby直接调用suspend_ops->enter进入对应的睡眠模式。

而freeze就要稍微复杂了：

static void freeze_enter(void)
{
    spin_lock_irq(&suspend_freeze_lock);
    if (pm_wakeup_pending()) 检查是否有wakeup信号在处理，如果有则退出当前流程。
        goto out;

suspend_freeze_state = FREEZE_STATE_ENTER;
spin_unlock_irq(&suspend_freeze_lock);

get_online_cpus();
cpuidle_resume(); 允许使用cpuidle

    /* Push all the CPUs into the idle loop. */
    wake_up_all_idle_cpus(); 强制所有CPU退出idle状态
    pr_debug("PM: suspend-to-idle\n");
    /* Make the current CPU wait so it can enter the idle loop too. */
    wait_event(suspend_freeze_wait_head,
           suspend_freeze_state == FREEZE_STATE_WAKE); 等待FREEZE_STATE_WAKE事件，进入idle loop
    pr_debug("PM: resume from suspend-to-idle\n"); !!!!!!!!!!!!!!!!这里即为唤醒之后的执行路径了!!!!!!!!!!!!!!!!
    cpuidle_pause(); 暂停使用cpuidle
    put_online_cpus();

spin_lock_irq(&suspend_freeze_lock);

out:
suspend_freeze_state = FREEZE_STATE_NONE;
spin_unlock_irq(&suspend_freeze_lock);
}

3.5 resume_noirq

执行dpm_noirq_list上设备的resume_noirq回调函数。

void dpm_resume_noirq(pm_message_t state)
{
struct device *dev;
ktime_t starttime = ktime_get();

    trace_suspend_resume(TPS("dpm_resume_noirq"), state.event, true);
    mutex_lock(&dpm_list_mtx);
    pm_transition = state;

    /*
     * Advanced the async threads upfront,
     * in case the starting of async threads is
     * delayed by non-async resuming devices.
     */
    list_for_each_entry(dev, &dpm_noirq_list, power.entry) {
        reinit_completion(&dev->power.completion);
        if (is_async(dev)) {
            get_device(dev);
            async_schedule(async_resume_noirq, dev);
        }
    }

    while (!list_empty(&dpm_noirq_list)) { 遍历dpm_noirq_list
        dev = to_device(dpm_noirq_list.next);
        get_device(dev);
        list_move_tail(&dev->power.entry, &dpm_late_early_list); 移动设备到下一级dpm_late_early_list
        mutex_unlock(&dpm_list_mtx);

if (!is_async(dev)) {
int error;

            error = device_resume_noirq(dev, state, false);
            if (error) {
                suspend_stats.failed_resume_noirq++;
                dpm_save_failed_step(SUSPEND_RESUME_NOIRQ);
                dpm_save_failed_dev(dev_name(dev));
                pm_dev_err(dev, state, " noirq", error);
            }
        }

        mutex_lock(&dpm_list_mtx);
        put_device(dev);
    }
    mutex_unlock(&dpm_list_mtx);
    async_synchronize_full();
    dpm_show_time(starttime, state, "noirq");
    resume_device_irqs();
    device_wakeup_disarm_wake_irqs();
    cpuidle_resume();
    trace_suspend_resume(TPS("dpm_resume_noirq"), state.event, false);
}

3.6 resume_early

执行前述dpm_late_early_list设备的resume_early回调函数，移动设备到dpm_suspended_list列表。

void dpm_resume_early(pm_message_t state)
{
struct device *dev;
ktime_t starttime = ktime_get();

    trace_suspend_resume(TPS("dpm_resume_early"), state.event, true);
    mutex_lock(&dpm_list_mtx);
    pm_transition = state;

    /*
     * Advanced the async threads upfront,
     * in case the starting of async threads is
     * delayed by non-async resuming devices.
     */
    list_for_each_entry(dev, &dpm_late_early_list, power.entry) {
        reinit_completion(&dev->power.completion);
        if (is_async(dev)) {
            get_device(dev);
            async_schedule(async_resume_early, dev);
        }
    }

    while (!list_empty(&dpm_late_early_list)) {
        dev = to_device(dpm_late_early_list.next);
        get_device(dev);
        list_move_tail(&dev->power.entry, &dpm_suspended_list);
        mutex_unlock(&dpm_list_mtx);

if (!is_async(dev)) {
int error;

            error = device_resume_early(dev, state, false);
            if (error) {
                suspend_stats.failed_resume_early++;
                dpm_save_failed_step(SUSPEND_RESUME_EARLY);
                dpm_save_failed_dev(dev_name(dev));
                pm_dev_err(dev, state, " early", error);
            }
        }
        mutex_lock(&dpm_list_mtx);
        put_device(dev);
    }
    mutex_unlock(&dpm_list_mtx);
    async_synchronize_full();
    dpm_show_time(starttime, state, "early");
    trace_suspend_resume(TPS("dpm_resume_early"), state.event, false);
}

3.7 resume

执行所有dpm_suspended_list上设备的resume回调函数。

void dpm_resume(pm_message_t state)
{
struct device *dev;
ktime_t starttime = ktime_get();

trace_suspend_resume(TPS("dpm_resume"), state.event, true);
might_sleep();

    mutex_lock(&dpm_list_mtx);
    pm_transition = state;
    async_error = 0;

    list_for_each_entry(dev, &dpm_suspended_list, power.entry) {
        reinit_completion(&dev->power.completion);
        if (is_async(dev)) {
            get_device(dev);
            async_schedule(async_resume, dev);
        }
    }

    while (!list_empty(&dpm_suspended_list)) {
        dev = to_device(dpm_suspended_list.next);
        get_device(dev);
        if (!is_async(dev)) {
            int error;

mutex_unlock(&dpm_list_mtx);

            error = device_resume(dev, state, false);
            if (error) {
                suspend_stats.failed_resume++;
                dpm_save_failed_step(SUSPEND_RESUME);
                dpm_save_failed_dev(dev_name(dev));
                pm_dev_err(dev, state, "", error);
            }

            mutex_lock(&dpm_list_mtx);
        }
        if (!list_empty(&dev->power.entry))
            list_move_tail(&dev->power.entry, &dpm_prepared_list);
        put_device(dev);
    }
    mutex_unlock(&dpm_list_mtx);
    async_synchronize_full();
    dpm_show_time(starttime, state, NULL);

cpufreq_resume();
trace_suspend_resume(TPS("dpm_resume"), state.event, false);
}

3.8 resume_complete

执行所有dpm_prepared_list上设备的complete回调函数。至此dpm_complete结束所有非系统设备的睡眠。

void dpm_complete(pm_message_t state)
{
struct list_head list;

trace_suspend_resume(TPS("dpm_complete"), state.event, true);
might_sleep();

    INIT_LIST_HEAD(&list);
    mutex_lock(&dpm_list_mtx);
    while (!list_empty(&dpm_prepared_list)) {
        struct device *dev = to_device(dpm_prepared_list.prev);

        get_device(dev);
        dev->power.is_prepared = false;
        list_move(&dev->power.entry, &list);
        mutex_unlock(&dpm_list_mtx);

        trace_device_pm_callback_start(dev, "", state.event);
        device_complete(dev, state);
        trace_device_pm_callback_end(dev, 0);

        mutex_lock(&dpm_list_mtx);
        put_device(dev);
    }
    list_splice(&list, &dpm_list);
    mutex_unlock(&dpm_list_mtx);
    trace_suspend_resume(TPS("dpm_complete"), state.event, false);
}

4 如何让HiKey进入STR/STI并唤醒？

可以通过配置GPIO作为唤醒源，或者通过RTC作为唤醒源，延时一定时间来唤醒。

检查是否存在/sys/class/rtc/rtc0/wakealarm，入不存在则需要打开CONFIG_RTC_DRV_PL031。

写入wakealarm的参数，表示在多少秒之后resume唤醒，退出suspend。

写mem进入state，是系统进入suspend流程。

adb root && adb remount
adb shell "echo +10 > /sys/class/rtc/rtc0/wakealarm && echo mem > /sys/power/state"

5. suspend/resume的latency分析手段

5.1 analyze_suspend.py v3.0

在kernel的scripts中，这个工具可以帮助内核和OS开发者优化suspend/resume时间。

在打开一系列内核选项之后，此工具就可以执行suspend操作，然后抓取dmesg和ftrace数据知道resume结束。

这些数据会按照时间线显示每个设备，并且显示占用最多suspend/resume时间的设备或者子系统的调用关系详图。

执行工具后，会根据时间生成一个子目录，里面包含：html、dmesg和原始ftrace文件。

下面简单看一下工具选项：

Options:
[general]
    -h          Print this help text
    -v          Print the current tool version
    -verbose    Print extra information during execution and analysis
    -status     Test to see if the system is enabled to run this tool
    -modes      List available suspend modes 显示当前支持的suspend模式
    -m mode     Mode to initiate for suspend ['freeze', 'mem', 'disk'] (default: mem) 设置进入何种模式的suspend
    -rtcwake t Use rtcwake to autoresume after seconds (default: disabled) 使用rtc来唤醒，参数是间隔时间
[advanced]
    -f          Use ftrace to create device callgraphs (default: disabled) 基于ftrace生成调用关系图
    -filter "d1 d2 ..." Filter out all but this list of dev names
    -x2         Run two suspend/resumes back to back (default: disabled)
    -x2delay t Minimum millisecond delay between the two test runs (default: 0 ms)
    -postres t Time after resume completion to wait for post-resume events (default: 0 S)
    -multi n d Execute consecutive tests at seconds intervals. The outputs will
                be created in a new subdirectory with a summary page.
[utilities]
    -fpdt       Print out the contents of the ACPI Firmware Performance Data Table
    -usbtopo    Print out the current USB topology with power info
    -usbauto    Enable autosuspend for all connected USB devices
[android testing]
    -adb binary Use the given adb binary to run the test on an android device. 参数需要给出adb路径，工具就会对Android设备进行测试，并将结果pull出来。有一点需要注意，在此之前确保adb具有root权限。
                The device should already be connected and with root access.
                Commands will be executed on the device using "adb shell"
[re-analyze data from previous runs] 针对之前测试数据重新分析
    -ftrace ftracefile Create HTML output using ftrace input
    -dmesg dmesgfile    Create HTML output using dmesg (not needed for kernel >= 3.15)
    -summary directory Create a summary of all test in this dir

在了解了工具使用方法之后，就可以进行相关测试了。

5.1.1 Android

./analysze_suspend.py –modes –adb /usr/bin/adb获取当前系统支持的suspend状态。

['freeze', 'mem']

1.Android上测试STR，suspend/resume共5次，每次间隔20秒。

./analyze_suspend.py -adb /usr/bin/adb -rtcwake 10 -multi 5 20 -f -m mem

2.Android上测试STI，suspend/resume共10次，每次间隔5秒。

./analyze_suspend.py -adb /usr/bin/adb -rtcwake 10 -multi 5 20 -f -m freeze

测试结果可以在如下获得：

https://github.com/arnoldlu/common-use/tree/master/tools/analyze_suspend/hikey_test

存在的问题：analyze_suspend.py不支持Android的rtcwakeup和callgraph。已经在如下fix：

https://github.com/arnoldlu/common-use/blob/master/tools/analyze_suspend/analyze_suspend.py

5.1.1.1 总体对比

下面是HiKey上测试结果，可以看出两个数据都不够稳定。mem的suspend和resume平均值都比较高。

freeze相比mem的suspend/resume平均值提高了304.3ms/613.5ms。

5.1.1.2 是否suspend CPU

对比如下两幅图，明显看出mem类型的suspend关闭了除CPU0之外的所有CPU；而freeze则没有关闭任何CPU。

non-boot CPUs的suspend/resume时间就达到300ms/200ms。

同时从log中也可以看出mem和freeze的主要区别就在于是否disabling/enabling non-boot CPU。其他设备和子系统的suspend/resume时间基本一致。

同时还可以看出mem的suspend后，系统的timestamp是停止的；而freeze的timestamp还是一直在运行的。可以得出freeze状态持续的时间。

因为先写rtcwake为10s，然后进入睡眠，再唤醒，所以freeze时间是小于10s的。

[ 3385.642962] PM: suspend entry 1970-01-01 00:57:30.580909763 UTC
[ 3385.649165] PM: Syncing filesystems ... done.
[ 3385.661349] Freezing user space processes ...
[ 3385.671207] dwc2 f72c0000.usb: dwc2_hsotg_ep_stop_xfr: timeout DOEPCTL.EPDisable
[ 3385.678933] dwc2 f72c0000.usb: GINNakEff triggered
[ 3385.685718] (elapsed 0.019 seconds) done.
[ 3385.689860] Freezing remaining freezable tasks ... (elapsed 0.002 seconds) done.
[ 3385.700092] Suspending console(s) (use no_console_suspend to debug)
[ 3385.736020] PM: suspend of devices complete after 27.195 msecs
[ 3385.740811] PM: late suspend of devices complete after 4.765 msecs
[ 3385.743919] PM: noirq suspend of devices complete after 3.090 msecs
Disabling and Enabling non-boot CPUs
[ 3386.209126] PM: noirq resume of devices complete after 1.865 msecs
[ 3386.212066] PM: early resume of devices complete after 2.460 msecs
[ 3386.234729] mmc_host mmc0: Bus speed (slot 0) = 24800000Hz (slot req 400000Hz, actual 400000HZ div = 31)
[ 3386.311480] mmc_host mmc0: Bus speed (slot 0) = 51756522Hz (slot req 52000000Hz, actual 51756522HZ div = 0)
[ 3386.410411] mmc_host mmc2: Bus speed (slot 0) = 24800000Hz (slot req 400000Hz, actual 400000HZ div = 31)
[ 3386.458232] mmc_host mmc2: Bus speed (slot 0) = 24800000Hz (slot req 25000000Hz, actual 24800000HZ div = 0)
[ 3386.458729] PM: resume of devices complete after 246.646 msecs
[ 3386.818770] Restarting tasks ...
[ 3386.827026] done.
[ 3386.844139] PM: suspend exit 1970-01-01 00:57:40.624589167 UTC

[ 3471.760265] PM: Syncing filesystems ... done.
[ 3471.771897] Freezing user space processes ...
[ 3471.780407] dwc2 f72c0000.usb: dwc2_hsotg_ep_stop_xfr: timeout DOEPCTL.EPDisable
[ 3471.788105] dwc2 f72c0000.usb: GINNakEff triggered
[ 3471.794916] (elapsed 0.018 seconds) done.
[ 3471.799078] Freezing remaining freezable tasks ... (elapsed 0.002 seconds) done.
[ 3471.809320] Suspending console(s) (use no_console_suspend to debug)
[ 3471.847947] PM: suspend of devices complete after 29.905 msecs
[ 3471.852473] PM: late suspend of devices complete after 4.497 msecs
[ 3471.855611] PM: noirq suspend of devices complete after 3.120 msecs

[ 3481.034722] PM: noirq resume of devices complete after 1.945 msecs
[ 3481.037992] PM: early resume of devices complete after 2.694 msecs
[ 3481.062803] mmc_host mmc0: Bus speed (slot 0) = 24800000Hz (slot req 400000Hz, actual 400000HZ div = 31)
[ 3481.137795] mmc_host mmc0: Bus speed (slot 0) = 51756522Hz (slot req 52000000Hz, actual 51756522HZ div = 0)
[ 3481.234796] mmc_host mmc2: Bus speed (slot 0) = 24800000Hz (slot req 400000Hz, actual 400000HZ div = 31)
[ 3481.278601] mmc_host mmc2: Bus speed (slot 0) = 24800000Hz (slot req 25000000Hz, actual 24800000HZ div = 0)
[ 3481.279396] PM: resume of devices complete after 241.388 msecs
[ 3481.358513] Restarting tasks ... done.
[ 3481.377766] PM: suspend exit 1970-01-01 00:59:15.332218333 UTC

5.1.1.3 resume_console节省时间

对比resume_console可以发现，mem要比freeze多210ms。

5.1.2 Ubuntu

此工具在Ubuntu上显示了更强大的功能。

支持了callgraph功能之后，更能清晰地分析每个设备或者子系统的suspend/resume占用的时间。

sudo ./analyze_suspend.py -rtcwake 10 -multi 5 20 -f -m mem
sudo ./analyze_suspend.py -rtcwake 10 -multi 5 20 -f -m freeze

在对比两种不同suspend模式后，发现freeze花费的时间要比mem少。这也符合预期，但是没有功耗数据?_?。

下面着重分析一下如何基于此工具分析。

5.1.3 工具界面总体分析

最上面显示Kernel Suspend Time和Kernel Resume Time，可以从总体上查看是否有回退或者进步。

再下面是一些缩放按钮。

然后就是基于timeline的图表，比对颜色示意图，可以清晰看出suspend prepare、suspend、suspend late、suspend irq、suspend machine、resume machine、resume irq、resume early、resume和resume complete的分布。

最下面是每个模块、子系统的详细函数调用图以及开始时间、消耗时间。

5.1.4 子系统、模块详细分析

选中一个模块，会在最下面显示详细的模块在suspend/resume各个阶段消费的时间，以及函数调用关系图。

5.1.5 缩放查看细节

ZOOM IN放大，ZOOMOUT缩小，ZOOM 1:1恢复原始尺寸。

通过在timeline图表，放大可以查看到更小的模块消耗的时间。从宏观到模块，再到函数消耗时间，逐步细化，很有利于分析。

如果发现某个函数占用时间较大，可以逐级展开。知道发现最终占用较大的函数，发现问题所在。

5.1.6 工具代码分析

首先从入口main开始，和大多数工具一样开始都是解析命令选项，打印help信息；将所有的待测对象参数和测试参数保存在sysvals；

# ----------------- MAIN --------------------
# exec start (skipped if script is loaded as library)
if __name__ == '__main__':
    cmd = ''
    cmdarg = ''
    multitest = {'run': False, 'count': 0, 'delay': 0}
    # loop through the command line arguments
    args = iter(sys.argv[1:])
    for arg in args:
        …

    # just run a utility command and exit
    if(cmd != ''):
        if(cmd == 'status'):
            statusCheck()
        elif(cmd == 'fpdt'):
            if(sysvals.android):
                doError('cannot read FPDT on android device', False)
            getFPDT(True)
        elif(cmd == 'usbtopo'):
            if(sysvals.android):
                doError('cannot read USB topology '+\
                    'on an android device', False)
            detectUSB(True)
        elif(cmd == 'modes'):
            modes = getModes()
            print modes
        elif(cmd == 'usbauto'):
            setUSBDevicesAuto()
        elif(cmd == 'summary'):
            print("Generating a summary of folder \"%s\"" % cmdarg)
            runSummary(cmdarg, True)
        sys.exit()

    # run test on android device
    if(sysvals.android): 注释此段代码可以在Android上支持callgraph
        #if(sysvals.usecallgraph):
        #    doError('ftrace (-f) is not yet supported '+\
        #        'in the android kernel', False)
        if(sysvals.notestrun):
            doError('cannot analyze test files on the '+\
                'android device', False)

    # if instructed, re-analyze existing data files
    if(sysvals.notestrun): 分析已有数据文件，不需要重新测试
        rerunTest()
        sys.exit()

    # verify that we can run a test
    if(not statusCheck()): 检查测试条件是否满足
        print('Check FAILED, aborting the test run!')
        sys.exit()

    if multitest['run']: 连续多次测试
        # run multiple tests in a separte subdirectory
        s = 'x%d' % multitest['count']
        subdir = datetime.now().strftime('suspend-'+s+'-%m%d%y-%H%M%S')
        os.mkdir(subdir)
        for i in range(multitest['count']):
            if(i != 0):
                print('Waiting %d seconds...' % (multitest['delay']))
                time.sleep(multitest['delay'])
            print('TEST (%d/%d) START' % (i+1, multitest['count']))
            runTest(subdir) 进行单次测试
            print('TEST (%d/%d) COMPLETE' % (i+1, multitest['count']))
        runSummary(subdir, False) 生成summary.html
    else:
        # run the test in the current directory
        runTest(".")

sysvals.android表示是否在Android设备进行测试。

sysvals.usecallgraph表示是否生成函数调用关系图。

sysvals.rtcwake表示是否使用rtc进行唤醒。

针对Ubuntu之类的host设备，测试进行的很顺利。但是针对Android设备，在callgraph还存在一点问题。

run_Test无疑作为核心，收集log信息（ftrace、dmesg），执行suspend/resume，生成输出文件（txt、html）。

def runTest(subdir):
global sysvals

    # prepare for the test
    if(not sysvals.android): 针对不同的待测设备，初始化ftrace
        initFtrace()
    else:
        initFtraceAndroid()
    sysvals.initTestOutput(subdir) 生成输出目录，输出文件名等。

    vprint('Output files:\n    %s' % sysvals.dmesgfile)
    if(sysvals.usecallgraph or
        sysvals.usetraceevents or
        sysvals.usetraceeventsonly):
        vprint('    %s' % sysvals.ftracefile)
    vprint('    %s' % sysvals.htmlfile)

    # execute the test 执行测试，实际上命令内容基本一致。只是针对Android设备，增加了adb shell '…'。
    if(not sysvals.android):
        executeSuspend()
    else:
        executeAndroidSuspend()

    # analyze the data and create the html output
    print('PROCESSING DATA')
    if(sysvals.usetraceeventsonly): 3.15之后的版本，只需要通过ftrace即可获取足够信息。之前的版本的数据都存在dmesg中。
        # data for kernels 3.15 or newer is entirely in ftrace
        testruns = parseTraceLog()
    else:
        # data for kernels older than 3.15 is primarily in dmesg
        testruns = loadKernelLog()
        for data in testruns:
            parseKernelLog(data)
        if(sysvals.usecallgraph or sysvals.usetraceevents):
            appendIncompleteTraceLog(testruns)
    createHTML(testruns) 根据解析的数据生成html矢量图表

executeAndroidSuspend在Android设备上操作sysfs节点来配置ftrace，抓取log，suspend/resume，然后将log拉到主机。

def executeAndroidSuspend():
global sysvals

    # check to see if the display is currently off
    tp = sysvals.tpath
    out = os.popen(sysvals.adb+\
        ' shell dumpsys power | grep mScreenOn').read().strip()
    # if so we need to turn it on so we can issue a new suspend
    if(out.endswith('false')):
        print('Waking the device up for the test...')
        # send the KEYPAD_POWER keyevent to wake it up
        os.system(sysvals.adb+' shell input keyevent 26')
        # wait a few seconds so the user can see the device wake up
        time.sleep(3)
    # execute however many s/r runs requested
    for count in range(1,sysvals.execcount+1):
        # clear the kernel ring buffer just as we start
        os.system(sysvals.adb+' shell dmesg -c > /dev/null 2>&1') 清空dmesg
        # start ftrace
        if(sysvals.usetraceevents):
            print('START TRACING')
            os.system(sysvals.adb+" shell 'echo 1 > "+tp+"tracing_on'") 开始ftrace抓取
        # initiate suspend
        for count in range(1,sysvals.execcount+1):
            if(sysvals.usetraceevents):
                os.system(sysvals.adb+\
                    " shell 'echo SUSPEND START > "+tp+"trace_marker'") 写SUSPEND START到ftrace，作为开始标记。后面解析log，会以此为标记。
            if(sysvals.rtcwake):
                print('SUSPEND START')
                print('will autoresume in %d seconds' % sysvals.rtcwaketime)
                os.system(sysvals.adb+" shell 'echo +%d > /sys/class/rtc/rtc0/wakealarm'"%(sysvals.rtcwaketime)) 设置wakeup resource
            else:
                print('SUSPEND START (press a key to resume)')

            os.system(sysvals.adb+" shell 'echo "+sysvals.suspendmode+\
                " > "+sysvals.powerfile+"'") 进入suspend，之后就是resume
            # execution will pause here, then adb will exit
            while(True): 轮询adb shell pwd判断设备是否被唤醒
                check = os.popen(sysvals.adb+\
                    ' shell pwd 2>/dev/null').read().strip()
                if(len(check) > 0):
                    break
                time.sleep(1)
            if(sysvals.usetraceevents):
                os.system(sysvals.adb+" shell 'echo RESUME COMPLETE > "+tp+\
                    "trace_marker'") 写RESUME COMPLETE到ftrace，作为结束标记
        # return from suspend
        print('RESUME COMPLETE')
        # stop ftrace
        if(sysvals.usetraceevents):
            os.system(sysvals.adb+" shell 'echo 0 > "+tp+"tracing_on'") 关闭ftrace功能
            print('CAPTURING TRACE')
            os.system('echo "'+sysvals.teststamp+'" > '+sysvals.ftracefile)
            os.system(sysvals.adb+' shell cat '+tp+\
                'trace >> '+sysvals.ftracefile) 将/sys/kernel/debug/tracing/trace内容保存到本地log
        # grab a copy of the dmesg output
        print('CAPTURING DMESG')
        os.system('echo "'+sysvals.teststamp+'" > '+sysvals.dmesgfile)
        os.system(sysvals.adb+' shell dmesg >> '+sysvals.dmesgfile) 将dmesg保存到本地

parseTraceLog用于解析ftrace log，phase的判断是依据suspend_resume关键词；每个模块的开始结束是以device_pm_callback_start/device_pm_callback_end作为判断；还调用FTraceCallGraph进行函数调用关系的解析。

createHTML是这个工具真正NB的地方，对parseTraceLog结果进行了可视化，生成可缩放、查看细节的html文件。

6 对工具的改进

虽然工具非常强大，但是在使用中还是有一些视角没有覆盖到。所以做了一些改进。

在Android上使能rtcwake；在Android上使能callgraph；针对多次测试生成csv比较不同phase消耗时间，比summary.html更细化；这对每次测试给出Phase时间和每个Phase内Device消耗时间。

6.1 Android上使能rtcwake

https://github.com/arnoldlu/common-use/commit/a862d8c2a4f9bd005c516c6b61b394386b882217

可以在Android上使用rtc作为唤醒源，可以在没有实体按键的设备上进行测试。

6.2 Android上使能callgraph

https://github.com/arnoldlu/common-use/commit/f8e288753a472cf48ccc0e9d7ffc67978c7d165e

如果没有callgraph只能显示Phase级别的信息，不能显示每个device的信息以及内部函数耗费的时间。

6.3 单次测试summary结果

https://github.com/arnoldlu/common-use/commit/53c270669bb0dfaada53e29852999d5367ec65da

在每次测试目录下，生成一个summary_phase_dev.csv文件。可以直观的看到不同Phase、不同device消耗的时间。

如果想要发现那个模块消耗最大时间，可以使用Excel的Filter功能。比如想看suspend_prepare下Device消耗时间有大到小排列。

这样就可以找出每个Phase中消耗资源大户。

6.4 多次测试summary结果

https://github.com/arnoldlu/common-use/commit/d162c4827a0cdc50fe94d3f1303af682b387dc3d

生成summary_phase.csv文件，按每次测试的不同phase显示耗费时间。

可以比较不同测试phase的时间耗费，看出哪一个phase存在回退现象。

6.5 suspend/resume起止时间点判断

analyze_suspend.py在解析log的时候，以SUSPEND START作为起点，以RESUME COMPLETE为终点。

在发送SUSPEND START之后，触发suspend动作。在这期间，如果host存在一定抢占，会增加suspend时间。

然后通poll设备的adb状态，来判断是否resume。一方面，adb可用状态要在resume结束之后，另一方面，在最坏的情况下，可能存在1s的误差，这对于毫秒级的resume来说是非常严重的一个结果。

最后发送RESUME COMPLETE作为结束。

if(sysvals.usetraceevents):
    os.system(sysvals.adb+\
        " shell 'echo SUSPEND START > "+tp+"trace_marker'")
print('SUSPEND START (press a key on the device to resume)')
os.system(sysvals.adb+" shell 'echo "+sysvals.suspendmode+\
    " > "+sysvals.powerfile+"'")
# execution will pause here, then adb will exit
while(True):
    check = os.popen(sysvals.adb+\
        ' shell pwd 2>/dev/null').read().strip()
    if(len(check) > 0):
        break
    time.sleep(1)
if(sysvals.usetraceevents):
    os.system(sysvals.adb+" shell 'echo RESUME COMPLETE > "+tp+\
        "trace_marker'")

更好的方式是在enter_state的开头结尾加ftrace，然后解析的时候以此为标记。

@@ -486,6 +496,7 @@ static int enter_state(suspend_state_t state)
{
        int error;

+       trace_suspend_resume(TPS("enter_state"), state, true);
        trace_suspend_resume(TPS("suspend_enter"), state, true);
        if (state == PM_SUSPEND_FREEZE) {
#ifdef CONFIG_PM_DEBUG
@@ -532,6 +543,7 @@ static int enter_state(suspend_state_t state)
        suspend_finish();
Unlock:
        mutex_unlock(&pm_mutex);
+       trace_suspend_resume(TPS("enter_state"), state, false);
        return error;
}

7 分析步骤

本着从宏观到微观的进阶，一步步分找出可以优化的点。

下面是从开始一次测试到每次测试到suspend/resume不同phase，再到每个phase里面device callback的关系。

下面是每一次正常suspend/resume的流程，之前每个阶段函数分析也可以看出他们的对称关系。

在修改了工具对于suspend和resume时间判断的bug过后，得到了一组的数据。

分析一下稳定性，均方差比较小，还算比较稳定。数据稳定之后，就可以进行详细分析了。

下面查看每次测试的每个phase数据，可以看出每个phase数据的稳定性，以及每个phase费时占比。找出费时大户，suspend_prepare、suspend、suspend_machine、resume_machine、resume、resume_complete。

针对上述六个phase，列出Top 10设备或者子系统。

从下图可以看出，freeze_processes、sync_filesystems、mmc0、mmc2、CUP0~7、resume_console、tsensor是需要重点分析的设备。

不区分phase列出Top 30如下，下面逐一分析可优化的空间。

7.1 resume_console

adb shell 'echo N > /sys/module/printk/parameters/console_suspend'
adb shell 'cat /sys/module/printk/parameters/console_suspend'

先看一下resume_console流程函数：

void resume_console(void)
{
    if (!console_suspend_enabled)
        return;
    down_console_sem(); 获取console_sem和console_lock_dep_map
    console_suspended = 0;
    console_unlock();
}

通过分析ftrace发现，主要时间消耗在console_unlock中。因为在console_lock被占用期间，有相当一部分由printk缓存的log。所以在释放锁之前需要将其处理掉。

void console_unlock(void)
{
    static char ext_text[CONSOLE_EXT_LOG_MAX];
    static char text[LOG_LINE_MAX + PREFIX_MAX];
    static u64 seen_seq;
    unsigned long flags;
    bool wake_klogd = false;
    bool do_cond_resched, retry;

    trace_console_lock("console_unlock start", strlen("console_unlock start"));\
    if (console_suspended) {
        up_console_sem();
        return;
    }

    /*
     * Console drivers are called under logbuf_lock, so
     * @console_may_schedule should be cleared before; however, we may
     * end up dumping a lot of lines, for example, if called from
     * console registration path, and should invoke cond_resched()
     * between lines if allowable. Not doing so can cause a very long
     * scheduling stall on a slow console leading to RCU stall and
     * softlockup warnings which exacerbate the issue with more
     * messages practically incapacitating the system.
     */
    do_cond_resched = console_may_schedule;
    console_may_schedule = 0;

    /* flush buffered message fragment immediately to console */
    console_cont_flush(text, sizeof(text));
again:
    for (;;) { 如果默认的LOGLEVEL定的比较高，即优先级低，则会有相当多的log需要打印。占用很多时间。
        …
    }
    console_locked = 0;

    /* Release the exclusive_console once it is used */
    if (unlikely(exclusive_console))
        exclusive_console = NULL;

raw_spin_unlock(&logbuf_lock);

up_console_sem(); 释放console_sem和console_lock_dep_map

    /*
     * Someone could have filled up the buffer again, so re-check if there's
     * something to flush. In case we cannot trylock the console_sem again,
     * there's a new owner and the console_unlock() from them will do the
     * flush, no worries.
     */
    raw_spin_lock(&logbuf_lock);
    retry = console_seq != log_next_seq;
    raw_spin_unlock_irqrestore(&logbuf_lock, flags);

if (retry && console_trylock())
goto again;

    if (wake_klogd)
        wake_up_klogd();
    trace_console_lock("console_unlock end", strlen("console_unlock end"));\
}

那么问题就变得简单了，减少printk量就可以了。

通过cat /proc/sys/kernel/printk可以得到。在kernel/sysctl.c中有其实现。

7 4 1 7

这四个值分别对应：

#define console_loglevel (console_printk[0])
#define default_message_loglevel (console_printk[1])
#define minimum_console_loglevel (console_printk[2])
#define default_console_loglevel (console_printk[3])

又对应到：

int console_printk[4] = {
    CONSOLE_LOGLEVEL_DEFAULT,    /* console_loglevel */
    MESSAGE_LOGLEVEL_DEFAULT,    /* default_message_loglevel */
    CONSOLE_LOGLEVEL_MIN,        /* minimum_console_loglevel */
    CONSOLE_LOGLEVEL_DEFAULT,    /* default_console_loglevel */
};

/* We show everything that is MORE important than this.. */
#define CONSOLE_LOGLEVEL_SILENT 0 /* Mum's the word */
#define CONSOLE_LOGLEVEL_MIN     1 /* Minimum loglevel we let people use */
#define CONSOLE_LOGLEVEL_QUIET     4 /* Shhh ..., when booted with "quiet" */
#define CONSOLE_LOGLEVEL_DEFAULT 7 /* anything MORE serious than KERN_DEBUG */
#define CONSOLE_LOGLEVEL_DEBUG    10 /* issue debug messages */
#define CONSOLE_LOGLEVEL_MOTORMOUTH 15    /* You can't shut this one up */

可知只要内核log优先级高于KERN_DEBUG都会被打印。由下表可知几乎所有的log都会被打印。这就会造成printk相当繁忙，console_unlock会处理相当多信息。

#define KERN_EMERG    KERN_SOH "0"    /* system is unusable */
#define KERN_ALERT    KERN_SOH "1"    /* action must be taken immediately */
#define KERN_CRIT    KERN_SOH "2"    /* critical conditions */
#define KERN_ERR    KERN_SOH "3"    /* error conditions */
#define KERN_WARNING    KERN_SOH "4"    /* warning conditions */
#define KERN_NOTICE    KERN_SOH "5"    /* normal but significant condition */
#define KERN_INFO    KERN_SOH "6"    /* informational */
#define KERN_DEBUG    KERN_SOH "7"    /* debug-level messages */

#define KERN_DEFAULT KERN_SOH "d" /* the default kernel loglevel */

想解决也很简单，提高console_loglevel的优先级。

diff --git a/kernel/printk/printk.c b/kernel/printk/printk.c
old mode 100644
new mode 100755
index e7e586b..b927d67
--- a/kernel/printk/printk.c
+++ b/kernel/printk/printk.c
@@ -60,7 +60,7 @@ extern void printascii(char *);
#endif

int console_printk[4] = {
-       CONSOLE_LOGLEVEL_DEFAULT,       /* console_loglevel */
+       CONSOLE_LOGLEVEL_QUIET, /* console_loglevel */
        MESSAGE_LOGLEVEL_DEFAULT,       /* default_message_loglevel */
        CONSOLE_LOGLEVEL_MIN,           /* minimum_console_loglevel */
        CONSOLE_LOGLEVEL_DEFAULT,       /* default_console_loglevel */

在进行修改后，再来进行对比测试。可以看出消耗时间得到显著提升，优化后的resume_complete时间基本上可以忽略不计。

7, mem
    Line 748: resume_complete,resume_console[3],248.54900000002544
    Line 748: resume_complete,resume_console[3],248.6340000000382
    Line 748: resume_complete,resume_console[3],248.26499999994667
    Line 748: resume_complete,resume_console[3],248.3510000000706
    Line 748: resume_complete,resume_console[3],248.42499999999745

7, freeze
    Line 996: resume_complete,resume_console[1],76.18400000001202
    Line 996: resume_complete,resume_console[1],76.19500000009793
    Line 996: resume_complete,resume_console[1],76.3280000001032
    Line 996: resume_complete,resume_console[1],76.1689999999362
    Line 996: resume_complete,resume_console[1],76.19999999997162

4, freeze
    Line 996: resume_complete,resume_console[1],0.1010000000007949
    Line 996: resume_complete,resume_console[1],0.10499999999069587
    Line 996: resume_complete,resume_console[1],0.09799999997994746
    Line 996: resume_complete,resume_console[1],0.1010000000007949
    Line 996: resume_complete,resume_console[1],0.10000000003174137

4, mem
    Line 749: resume_complete,resume_console[3],0.3370000000586515
    Line 749: resume_complete,resume_console[3],0.33800000005612674
    Line 749: resume_complete,resume_console[3],0.37700000007134804
    Line 749: resume_complete,resume_console[3],0.3359999999474894
    Line 749: resume_complete,resume_console[3],0.3429999999298161

7.2 mmc suspend/resuem分析

从下图可知，mmc相关suspend/resume主要在mmc0:0001和mmc2:0001两个设备的suspend/resume。下面重点分析这两个设备的suspend/resume回调函数。

在执行suspend过程中，先将bus上面的设备driver先suspend，然后在suspend bus。

在resume时，过程相反，先bus resume，然后再逐个设备driver resume。

mmc0:0001

那就来看看bus和各个设备耗费的时间：

4013.868837 |   4)    sh-4511     |               | /* device_pm_callback_start: mmcblk mmc0:0001, parent: mmc0, [suspend] */
4013.868893 |   4)    sh-4511     |               | /* device_pm_callback_end: mmcblk mmc0:0001, err=0 */
4013.869000 |   4)    sh-4511     |               | /* device_pm_callback_start: block mmcblk0, parent: mmc0:0001, [suspend] */
4013.869053 |   4)    sh-4511     |               | /* device_pm_callback_end: block mmcblk0, err=0 */
4013.889229 |   5)    sh-4511     |               | /* device_pm_callback_start: mmcblk mmc0:0001, parent: mmc0, bus [suspend] */
4013.914631 |   0)    sh-4511     |               | /* device_pm_callback_end: mmcblk mmc0:0001, err=0 */
4022.787571 |   0)    sh-4511     |               | /* device_pm_callback_start: mmcblk mmc0:0001, parent: mmc0, bus [resume] */
4022.886749 |   0)    sh-4511     |               | /* device_pm_callback_end: mmcblk mmc0:0001, err=0 */
4023.059198 |   0)    sh-4511     |               | /* device_pm_callback_start: block mmcblk0, parent: mmc0:0001, [resume] */
4023.059270 |   0)    sh-4511     |               | /* device_pm_callback_end: block mmcblk0, err=0 */
4023.059398 |   0)    sh-4511     |               | /* device_pm_callback_start: mmcblk mmc0:0001, parent: mmc0, [resume] */
4023.059830 |   0)    sh-4511     |               | /* device_pm_callback_end: mmcblk mmc0:0001, err=0 */

可以看出driver的suspend/resume并没有耗费太多时间，主要在mmc bus的suspend/resume耗费了太多时间。

在drivers/mmc/core/bus.c中

static struct bus_type mmc_bus_type = {
    .name        = "mmc",
    .dev_groups    = mmc_dev_groups,
    .match        = mmc_bus_match,
    .uevent        = mmc_bus_uevent,
    .probe        = mmc_bus_probe,
    .remove        = mmc_bus_remove,
    .shutdown    = mmc_bus_shutdown,
    .pm        = &mmc_bus_pm_ops,
};

mmc_bus_pm_bus对应的suspend/resume函数如下：

static const struct dev_pm_ops mmc_bus_pm_ops = {
SET_RUNTIME_PM_OPS(mmc_runtime_suspend, mmc_runtime_resume, NULL)
SET_SYSTEM_SLEEP_PM_OPS(mmc_bus_suspend, mmc_bus_resume)
};

mmc bus的suspend/resume如下：

static int mmc_bus_suspend(struct device *dev)
{
    struct mmc_card *card = mmc_dev_to_card(dev);
    struct mmc_host *host = card->host;
    int ret;

    ret = pm_generic_suspend(dev); 对应设备驱动的suspend回调函数。
    if (ret)
        return ret;

ret = host->bus_ops->suspend(host); 这里的host指的是mmc_host，bus_ops指的是mmc_ops。
return ret;
}

static int mmc_bus_resume(struct device *dev)
{
    struct mmc_card *card = mmc_dev_to_card(dev);
    struct mmc_host *host = card->host;
    int ret;

ret = host->bus_ops->resume(host); 这里的host指的是mmc_host，bus_ops指的是mmc_ops。

    if (ret)
        pr_warn("%s: error %d during resume (card was removed?)\n",
            mmc_hostname(host), ret);

ret = pm_generic_resume(dev); 对应设备的驱动的resume回调函数。
return ret;
}

pm_generic_suspend和pm_generic_resume是对子系统设备的通用回调函数。

int pm_generic_suspend(struct device *dev)
{
const struct dev_pm_ops *pm = dev->driver ? dev->driver->pm : NULL;

return pm && pm->suspend ? pm->suspend(dev) : 0;
}

int pm_generic_resume(struct device *dev)
{
const struct dev_pm_ops *pm = dev->driver ? dev->driver->pm : NULL;

return pm && pm->resume ? pm->resume(dev) : 0;
}

从中可以看出，如果对应设备存在dev->driver->pm->suspend和dev->driver->pm->resume则，调用回调函数。

mmc_bus_suspend

mmc_bus_suspend花费了大概25.4ms。下面是ftrace中截取的一段，从中可以看出时间主要消耗在struct mmc_bus_ops mmc_ops的.suspend回调函数。

/*            */   mmc_bus_suspend() {
/*            */     pm_generic_suspend() {
/*! 307.552 us*/     }
/*            */     mmc_suspend() {
/** 25060.78 us*/      } /* mmc_suspend */
/** 25378.28 us*/    } /* mmc_bus_suspend */

mmc_bus_resume

mmc_resume消耗了大部分时间，整个流程才99.158ms。

/*              */   mmc_bus_resume() {
/*              */     mmc_resume() {
/* * 97167.39 us*/     }
/*              */     pm_generic_resume() {
/* # 1980.104 us*/     }
/* * 99158.12 us*/   }

mmc_suspend

对应的host->bus_ops，即mmc_ops。在host下的设备都suspend之后，suspend mmc_host。

在mmc_host resume之后，才能进行设备的resume。

static const struct mmc_bus_ops mmc_ops = {
    .remove = mmc_remove,
    .detect = mmc_detect,
    .suspend = mmc_suspend,
    .resume = mmc_resume,
    .runtime_suspend = mmc_runtime_suspend,
    .runtime_resume = mmc_runtime_resume,
    .alive = mmc_alive,
    .shutdown = mmc_shutdown,
    .reset = mmc_reset,
};

通过分析ftrace.txt文件，发现其中msleep花费了17.1ms，这里是存在问题的。

int __mmc_switch(struct mmc_card *card, u8 set, u8 index, u8 value,
        unsigned int timeout_ms, bool use_busy_signal, bool send_status,
        bool ignore_crc)
{
    struct mmc_host *host = card->host;
    int err;
    struct mmc_command cmd = {0};
    unsigned long timeout;
    u32 status = 0;
    bool use_r1b_resp = use_busy_signal;

mmc_retune_hold(host);

…
        /*
         * We are not allowed to issue a status command and the host
         * does'nt support MMC_CAP_WAIT_WHILE_BUSY, then we can only
         * rely on waiting for the stated timeout to be sufficient.
         */
        if (!send_status) {
            mmc_delay(timeout_ms);
            goto out;
        }

…
}

mmc_resume

通过分析ftrece.txt，可以发现mmc_resume存在4个msleep，共消耗了12646.35 +14260.78 +13881.66 +15093.22 =55.882 ms。

关于mmc_ops的suspend/resume/runtime_suspend/runtime_resume的探讨

先来看看这四个函数的，其流程受到MMC_CAP_AGGRESSIVE_PM和MMC_CAP_RUNTIME_RESUME两个flag的控制。执行的实体都是_mmc_suspend、_mmc_resume。

static int mmc_suspend(struct mmc_host *host)
{
int err;

    err = _mmc_suspend(host, true);
    if (!err) {
        pm_runtime_disable(&host->card->dev);
        pm_runtime_set_suspended(&host->card->dev);
    }

return err;
}

static int mmc_resume(struct mmc_host *host)
{
int err = 0;

    if (!(host->caps & MMC_CAP_RUNTIME_RESUME)) {
        err = _mmc_resume(host);
        pm_runtime_set_active(&host->card->dev);
        pm_runtime_mark_last_busy(&host->card->dev);
    }
    pm_runtime_enable(&host->card->dev);

return err;
}

static int mmc_runtime_suspend(struct mmc_host *host)
{
int err;

if (!(host->caps & MMC_CAP_AGGRESSIVE_PM))
return 0;

    err = _mmc_suspend(host, true);
    if (err)
        pr_err("%s: error %d doing aggressive suspend\n",
            mmc_hostname(host), err);

return err;
}

static int mmc_runtime_resume(struct mmc_host *host)
{
int err;

if (!(host->caps & (MMC_CAP_AGGRESSIVE_PM | MMC_CAP_RUNTIME_RESUME)))
return 0;

    err = _mmc_resume(host);
    if (err)
        pr_err("%s: error %d doing aggressive resume\n",
            mmc_hostname(host), err);

return 0;
}

1.如果两flag都没有定义，则runtime_suspend和runtim_resume都是空函数。起作用的就是跟随系统的suspend/resume流程。

2.如果只定义了MMC_CAP_RUNTIME_RESUME，则不会runtime_suspend。并且在系统resume的时候，不会执行resume回调函数。只会在根据需要执行runtime_resume。使用runtime_resume代替了resume。

3.如果只定义了MMC_CAP_AGGRESSIVE_PM ，则suspend/resume跟随系统suspend/resume流程。并且runtime_suspend/resume_resume也根据实际情况执行。一切正常。

4.如果两者都定义了，既可以suspend也可以runtime_suspend，但是只能runtime_resume，不能跟随系统resume流程执行resume回调函数。

也就是说MMC_CAP_AGGRESSIVE_PM 则runtime_suspend/runtime_resume都可用，MMC_CAP_RUNTIME_RESUME则只能使用runtime_resume执行resume功能。

那么就来看一下，在应用了MMC_CAP_RUNTIME_RESUME之后效果如何。

mmc0:0001增加runtime-suspend属性：

diff --git a/arch/arm64/boot/dts/hisilicon/hi6220.dtsi b/arch/arm64/boot/dts/hisilicon/hi6220.dtsi
old mode 100644
new mode 100755
index 09e2c71..2cec392
--- a/arch/arm64/boot/dts/hisilicon/hi6220.dtsi
+++ b/arch/arm64/boot/dts/hisilicon/hi6220.dtsi
@@ -801,6 +801,7 @@
                        clock-names = "ciu", "biu";
                        resets = <&sys_ctrl PERIPH_RSTDIS0_MMC0>;
                        bus-width = <0x8>;
+                      runtime-suspend;
                        vmmc-supply = <&ldo19>;
                        pinctrl-names = "default";
                        pinctrl-0 = <&emmc_pmx_func &emmc_clk_cfg_func

修改DeviceTree解析文件，增加MMC_CAP_RUNTIME_RESUME。

index 094202c..35fd7b5
--- a/drivers/mmc/host/dw_mmc.c
+++ b/drivers/mmc/host/dw_mmc.c
@@ -2922,6 +2922,10 @@ static struct dw_mci_board *dw_mci_parse_dt(struct dw_mci *host)
                dev_info(dev, "supports-highspeed property is deprecated.\n");
                pdata->caps |= MMC_CAP_SD_HIGHSPEED | MMC_CAP_MMC_HIGHSPEED;
        }
+       if (of_find_property(np, "runtime-suspend", NULL)) {
+               dev_info(dev, "supports-highspeed property is deprecated.\n");
+               pdata->caps |= MMC_CAP_RUNTIME_RESUME;
+       }

        return pdata;
}

修改后mmc0:0001的resume达到了预期，mmc_resume没有被执行。

针对统计结果，效果明显。

虽然没有在系统resume过程中执行，但是mmc0:0001总要resume。只不过稍微延迟了，不再这个工具统计之中。

延后执行的mmc0:0001的resume耗费了72.317ms，也和之前的差不多。实际上没有对整个流程作出实质贡献，只是不在统计数据之内。

[32m[   32.486851] [0m[33mmmc_host mmc0[0m: Bus speed (slot 0) = 24800000Hz (slot req 400000Hz, actual 400000HZ div = 31 caps=40138143 caps2=0)
[32m[   32.500871] [0m[33mueventd[0m: fixup /sys/devices/system/cpu/cpu4/cpufreq/scaling_max_freq 1000 1000 664
[32m[   32.501305] [0m[33mueventd[0m: fixup /sys/devices/system/cpu/cpu4/cpufreq/scaling_min_freq 1000 1000 664
[32m[   32.540313] [0m[33mueventd[0m: fixup /sys/devices/system/cpu/cpu5/cpufreq/scaling_max_freq 1000 1000 664
[32m[   32.540747] [0m[33mueventd[0m: fixup /sys/devices/system/cpu/cpu5/cpufreq/scaling_min_freq 1000 1000 664
[32m[   32.559168] [0m[33mmmc_host mmc0[0m: Bus speed (slot 0) = 51756522Hz (slot req 52000000Hz, actual 51756522HZ div = 0 caps=40138143 caps2=0)

mmc2:0001

mmc2:0001和mmc0:0001的区别在于不同的mmc_bus_ops，mmc2:0001是SDIO接口，对应的应该是mmc_sdio_ops。

4013.876306 |   4)    sh-4511     |               | /* device_pm_callback_start: mmc mmc2:0001, parent: mmc2, [suspend] */
4013.876360 |   4)    sh-4511     |               | /* device_pm_callback_end: mmc mmc2:0001, err=0 */
4013.876397 |   4)    sh-4511     |               | /* device_pm_callback_start: sdio mmc2:0001:1, parent: mmc2:0001, [suspend] */
4013.876437 |   4)    sh-4511     |               | /* device_pm_callback_end: sdio mmc2:0001:1, err=0 */
4013.876470 |   4)    sh-4511     |               | /* device_pm_callback_start: wl1271_sdio mmc2:0001:2, parent: mmc2:0001, [suspend] */
4013.876525 |   4)    sh-4511     |               | /* device_pm_callback_end: wl1271_sdio mmc2:0001:2, err=0 */
4013.876556 |   4)    sh-4511     |               | /* device_pm_callback_start: wl18xx_driver wl18xx.1.auto, parent: mmc2:0001:2, [suspend] */
4013.876596 |   4)    sh-4511     |               | /* device_pm_callback_end: wl18xx_driver wl18xx.1.auto, err=0 */
4013.881676 |   4)    sh-4511     |               | /* device_pm_callback_start: wl18xx_driver wl18xx.1.auto, parent: mmc2:0001:2, bus [suspend] */
4013.881698 |   4)    sh-4511     |               | /* device_pm_callback_end: wl18xx_driver wl18xx.1.auto, err=0 */
4013.881740 |   4)    sh-4511     |               | /* device_pm_callback_start: wl1271_sdio mmc2:0001:2, parent: mmc2:0001, bus [suspend] */
4013.881765 |   4)    sh-4511     |               | /* device_pm_callback_end: wl1271_sdio mmc2:0001:2, err=0 */
4013.882582 |   4)    sh-4511     |               | /* device_pm_callback_start: sdio mmc2:0001:1, parent: mmc2:0001, bus [suspend] */
4013.882603 |   4)    sh-4511     |               | /* device_pm_callback_end: sdio mmc2:0001:1, err=0 */
4013.882645 |   4)    sh-4511     |               | /* device_pm_callback_start: mmc mmc2:0001, parent: mmc2, bus [suspend] */
4013.885524 |   4)    sh-4511     |               | /* device_pm_callback_end: mmc mmc2:0001, err=0 */
4022.888667 |   0)    sh-4511     |               | /* device_pm_callback_start: mmc mmc2:0001, parent: mmc2, bus [resume] */
4023.042980 |   0)    sh-4511     |               | /* device_pm_callback_end: mmc mmc2:0001, err=0 */
4023.043021 |   0)    sh-4511     |               | /* device_pm_callback_start: sdio mmc2:0001:1, parent: mmc2:0001, bus [resume] */
4023.043037 |   0)    sh-4511     |               | /* device_pm_callback_end: sdio mmc2:0001:1, err=0 */
4023.043067 |   0)    sh-4511     |               | /* device_pm_callback_start: wl1271_sdio mmc2:0001:2, parent: mmc2:0001, bus [resume] */
4023.043089 |   0)    sh-4511     |               | /* device_pm_callback_end: wl1271_sdio mmc2:0001:2, err=0 */
4023.043128 |   0)    sh-4511     |               | /* device_pm_callback_start: wl18xx_driver wl18xx.1.auto, parent: mmc2:0001:2, bus [resume] */
4023.043151 |   0)    sh-4511     |               | /* device_pm_callback_end: wl18xx_driver wl18xx.1.auto, err=0 */
4023.048824 |   0)    sh-4511     |               | /* device_pm_callback_start: wl18xx_driver wl18xx.1.auto, parent: mmc2:0001:2, [resume] */
4023.048877 |   0)    sh-4511     |               | /* device_pm_callback_end: wl18xx_driver wl18xx.1.auto, err=0 */
4023.048916 |   0)    sh-4511     |               | /* device_pm_callback_start: wl1271_sdio mmc2:0001:2, parent: mmc2:0001, [resume] */
4023.048979 |   0)    sh-4511     |               | /* device_pm_callback_end: wl1271_sdio mmc2:0001:2, err=0 */
4023.049011 |   0)    sh-4511     |               | /* device_pm_callback_start: sdio mmc2:0001:1, parent: mmc2:0001, [resume] */
4023.049074 |   0)    sh-4511     |               | /* device_pm_callback_end: sdio mmc2:0001:1, err=0 */
4023.049113 |   0)    sh-4511     |               | /* device_pm_callback_start: mmc mmc2:0001, parent: mmc2, [resume] */
4023.049165 |   0)    sh-4511     |               | /* device_pm_callback_end: mmc mmc2:0001, err=0 */

由下可知不同部分在于mmc_host的suspend/resume，pm_generic_suspend/pm_generic_resume基本上耗费的时间都很少。

所以重点看看mmc_sdio_suspend和mmc_sdio_resume两个函数。

/*              */    mmc_bus_suspend() {
/*   0.833 us   */      pm_generic_suspend();
/*              */      mmc_sdio_suspend() {
/* # 2854.687 us*/      }
/* # 2864.115 us*/    }

/*              */    mmc_bus_resume() {
/*              */      mmc_sdio_resume() {
/* @ 154277.3 us*/      }
/*   1.563 us   */      pm_generic_resume();
/* @ 154290.3 us*/    }

mmc_sdio_suspend

时间很短，不关注。

mmc_sdio_resume

mmc2:001的mmc_bus_resume时间达到154.313，mmc_sdio_resume包含三个msleep共75331.82+15953.43+14369.58=105654.83us=105.654ms。

考虑：是否可以将SDIO的resume也像MMC那样延后执行呢？

7.3 CPU_OFF/CPU_ON

在分析了resome_console和mmc之后，再来看一下CPU_OFF/CPU_ON的执行过程。

在disable_nonboot_cpus中选取first_cpu，除此之外的所有for_each_online_cpu都会被_cpu_down，并且将其放到frozen_cpus上。

在enable_nonboot_cpus中，遍历frozen_cpus，将其_cpu_up。

针对HiKey，真个流程就是对CPU 1-7进行关闭、打开的操作，所以重点分析一下_cpu_down和_cpu_up。

耗时最大的三个地方都用粗体下划线标出，除了发送状态通知之外，还有rcu sync处理。

对cpu_chain上所有注册notifier，逐个执行回调函数notifier_call，根据action进行处理，这是一个很耗时的过程。

/* Requires cpu_add_remove_lock to be held */
static int _cpu_down(unsigned int cpu, int tasks_frozen)
{
    int err, nr_calls = 0;
    void *hcpu = (void *)(long)cpu;
    unsigned long mod = tasks_frozen ? CPU_TASKS_FROZEN : 0;
    struct take_cpu_down_param tcd_param = {
        .mod = mod,
        .hcpu = hcpu,
    };

if (num_online_cpus() == 1) 如果online只有一个CPU，则无法再进行down操作。
return -EBUSY;

if (!cpu_online(cpu)) 如果当前CPU没有online，则无需进行down。
return -EINVAL;

cpu_hotplug_begin(); 取得cpu_hotplug.lock锁

    err = __cpu_notify(CPU_DOWN_PREPARE | mod, hcpu, -1, &nr_calls); 在cpu_chain上发从CPU_DOWN_PREPARE状态。
    if (err) {
        nr_calls--;
        __cpu_notify(CPU_DOWN_FAILED | mod, hcpu, nr_calls, NULL);
        pr_warn("%s: attempt to take down CPU %u failed\n",
            __func__, cpu);
        goto out_release;
    }

    /*
     * By now we've cleared cpu_active_mask, wait for all preempt-disabled
     * and RCU users of this state to go away such that all new such users
     * will observe it.
     *
     * For CONFIG_PREEMPT we have preemptible RCU and its sync_rcu() might
     * not imply sync_sched(), so wait for both.
     *
     * Do sync before park smpboot threads to take care the rcu boost case.
     */
    if (IS_ENABLED(CONFIG_PREEMPT))
        synchronize_rcu_mult(call_rcu, call_rcu_sched);
    else
        synchronize_rcu();

smpboot_park_threads(cpu); 将此CPU的由kthread_create创建的线程设置为PARKED。

    /*
     * Prevent irq alloc/free while the dying cpu reorganizes the
     * interrupt affinities.
     */
    irq_lock_sparse();

    /*
     * So now all preempt/rcu users must observe !cpu_active().
     */
    err = stop_machine(take_cpu_down, &tcd_param, cpumask_of(cpu));
    if (err) {
        /* CPU didn't die: tell everyone. Can't complain. */
        cpu_notify_nofail(CPU_DOWN_FAILED | mod, hcpu);
        irq_unlock_sparse();
        goto out_release;
    }
    BUG_ON(cpu_online(cpu)); 如果指定的CPU还处于online状态，则触发kernel panic。

    /*
     * The migration_call() CPU_DYING callback will have removed all
     * runnable tasks from the cpu, there's only the idle task left now
     * that the migration thread is done doing the stop_machine thing.
     *
     * Wait for the stop thread to go away.
     */
    while (!per_cpu(cpu_dead_idle, cpu))
        cpu_relax();
    smp_mb(); /* Read from cpu_dead_idle before __cpu_die(). */
    per_cpu(cpu_dead_idle, cpu) = false;

/* Interrupts are moved away from the dying cpu, reenable alloc/free */
irq_unlock_sparse();

    hotplug_cpu__broadcast_tick_pull(cpu);
    /* This actually kills the CPU. */
    __cpu_die(cpu); 调用底层架构相关的cpu_kill回调函数。

    /* CPU is completely dead: tell everyone. Too late to complain. */
    tick_cleanup_dead_cpu(cpu);
    cpu_notify_nofail(CPU_DEAD | mod, hcpu); 通知完成offline动作的处理器状态为CPU_DEAD。

check_for_tasks(cpu);

out_release:
    cpu_hotplug_done(); 释放cpu_hotplug.lock锁。
    trace_sched_cpu_hotplug(cpu, err, 0);
    if (!err)
        cpu_notify_nofail(CPU_POST_DEAD | mod, hcpu);
    return err;
}

/* Requires cpu_add_remove_lock to be held */
static int _cpu_up(unsigned int cpu, int tasks_frozen)
{
    int ret, nr_calls = 0;
    void *hcpu = (void *)(long)cpu;
    unsigned long mod = tasks_frozen ? CPU_TASKS_FROZEN : 0;
    struct task_struct *idle;

cpu_hotplug_begin(); 如果没有其他进程占有，则退出，执行后面的工作；如果被占用，则设置这个进程为TASK_INTERRUPTIBLE，等待结束。

    if (cpu_online(cpu) || !cpu_present(cpu)) { 如果该CPU已经online，则没有必要执行up；或者非present，则无法up。
        ret = -EINVAL;
        goto out;
    }

    idle = idle_thread_get(cpu); 给指定CPU生成一个idle线程
    if (IS_ERR(idle)) {
        ret = PTR_ERR(idle);
        goto out;
    }

    ret = smpboot_create_threads(cpu); 创建一个用于管理CPU hotplug动作的线程
    if (ret)
        goto out;

    ret = __cpu_notify(CPU_UP_PREPARE | mod, hcpu, -1, &nr_calls); 通知cpu_chain中的处理器，当前正在online的CPU状态为CPU_UP_PREPARE。
    if (ret) {
        nr_calls--;
        pr_warn("%s: attempt to bring up CPU %u failed\n",
            __func__, cpu);
        goto out_notify;
    }

/* Arch-specific enabling code. */
ret = __cpu_up(cpu, idle); 调用更底层的使能CPU操作。

    if (ret != 0)
        goto out_notify;
    BUG_ON(!cpu_online(cpu));

/* Now call notifier in preparation. */
cpu_notify(CPU_ONLINE | mod, hcpu); 通知cpu_chanin中的处理器，目前online动作的处理器的状态为CPU_ONLINE。

out_notify:
    if (ret != 0)
        __cpu_notify(CPU_UP_CANCELED | mod, hcpu, nr_calls, NULL);
out:
    cpu_hotplug_done(); 释放cpu_hotplug.lock锁。
    trace_sched_cpu_hotplug(cpu, ret, 1);

return ret;
}

RCU synchronize

RCU即Read-Copy Update，是Linux内核比较成熟的新型读写锁，具有较高的读写并发性能，常常用在需要互斥的关键性能路径。

在Kernel中，有两种类型实现tiny和tree，tiny rcu更简洁，常用在小型嵌入式系统中；tree rcu被广泛用在了server、desktop、android中。

RCU的和心理链式读者访问的同时，写者可以更新访问对象的副本，但写者需要等待所有读者完成访问之后，才能删除老对象。这个过程实现的关键和难点在于如何判断所有的读者已经完成访问。通常把写者开始更新，到所有读者完成访问这段时间叫做宽限期（Grace Period）。内核中实现宽限期等待的函数是synchronize_rcu。

synchronize_rcu_mult同时在call_rcu()函数列表的宽限期上等待，知道所有的都结束。

总结：cpu_chain和rcu sync耗时大部是由外界因素决定的，如果cpu_chain或者call_rcu()列表很多，或者里面回调函数特别耗时，都会拉长CPU_OFF/CPU_ON时间。这部分的优化特别离散。

参考文档：

RCU synchronize原理分析 http://www.wowotech.net/kernel_synchronization/223.html

synchronize_rcu()函数详解 http://blog.chinaunix.net/uid-20648784-id-1592811.html

如何确定一个函数耗费时间？

在函数中添加以下ftrace，可以得到执行时的timestamp，进程名称，函数名和对应的行数。

trace_suspend_resume(TPS(__func__), __LINE__, true);

结果如下：

223.502950 |   1)    sh-2832     |               |                  /* suspend_resume: CPU_ON[4] begin */
223.502953 |   1)    sh-2832     |               |                  /* suspend_resume: _cpu_up[513] begin */
223.502957 |   1)    sh-2832     |               |                  /* suspend_resume: _cpu_up[516] begin */
223.502959 |   1)    sh-2832     |               |                  /* suspend_resume: _cpu_up[522] begin */
223.502969 |   1)    sh-2832     |               |                  /* suspend_resume: _cpu_up[529] begin */
223.502973 |   1)    sh-2832     |               |                  /* suspend_resume: _cpu_up[534] begin */
223.529988 |   1)    sh-2832     |               |                  /* suspend_resume: _cpu_up[544] begin */
223.530382 |   1)    sh-2832     |               |                  /* suspend_resume: _cpu_up[552] begin */
223.531451 |   1)    sh-2832     |               |                  /* suspend_resume: _cpu_up[559] begin */
223.531454 |   1)    sh-2832     |               |                  /* suspend_resume: _cpu_up[563] begin */
223.531456 |   1)    sh-2832     |               |                  /* suspend_resume: CPU_ON[4] end */

在Excel中打开，可以轻松算出时间差。可知Line 534到Line 544之前耗费了最多时间。

详情请参考：

cpu hotplug的流程 http://blog.csdn.net/u013686805/article/details/46942469

Linux CPU core的电源管理(5)_cpu control及cpu hotplug http://www.wowotech.net/pm_subsystem/cpu_hotplug.html

8 参考文档

Power Management Support in Hikey (suspend-resume)：http://www.96boards.org/forums/topic/power-management-support-in-hikey-suspend-resume/#gsc.tab=0

Suspend to Idle：http://www.linaro.org/blog/suspend-to-idle/

Suspend and Resume：https://01.org/zh/suspendresume

SuspendAndResume github：https://github.com/arnoldlu/suspendresume

Linux电源管理(6)_Generic PM之Suspend功能：http://www.wowotech.net/pm_subsystem/suspend_and_resume.html

你可能感兴趣的:(Suspend to RAM和Suspend to Idle分析，以及在HiKey上性能对比)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
什么是证书吊销列表？CRL 解释 WoTrusSSL ssl https
数字证书是安全在线互动的支柱，用于验证身份和确保加密通信。但是，当这些证书被盗用或滥用时，必须立即撤销它们以维持信任。这就是证书撤销列表(CRL)的作用所在。CRL由证书颁发机构(CA)维护，对于识别和撤销已撤销的证书，防止其造成危害至关重要。在本指南中，我们将探讨什么是CRL、它们如何运作以及为什么它们对网络安全至关重要。什么是证书吊销列表(CRL)？证书吊销列表(CRL)是证书颁发机构(CA)
有必要获得WHQL测试认证吗，有什么好处？
什么是WHQL认证？WHQL是MicrosoftWindowsHardwareQualityLab的缩写，中文意思是Windows硬件设备质量实验室，主要是对Windows操作系统的兼容性测试，检验硬件产品和驱动程序在windows系统下的兼容性和稳定性。当某一硬件或软件通过WHQL测试时，制造商可以在其产品包装和广告上使用“DesignedforWindows”标志。该标志可以证明硬件或软件已经
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
驱动程序为什么要做 WHQL 认证? GDCA SSL证书网络协议网络
驱动程序进行WHQL（WindowsHardwareQualityLabs）认证的核心价值在于解决兼容性、安全性和市场准入三大关键问题，具体必要性如下：️‌一、规避系统拦截，保障驱动可用性‌消除安装警告‌未认证的驱动在安装时会触发Windows的‌红色安全警告‌（如“无法验证发布者”），甚至被系统强制拦截。通过WHQL认证的驱动获得微软数字签名，用户可无阻安装‌。满足系统强制要求‌Windows1
求是网：“内卷式”竞争的突出表现和主要危害有哪些？加百力财经研究科技知识人工智能大数据
"内卷式"竞争主要表现为：企业层面的低价竞争、同质化竞争和营销"逐底竞争"；地方政府层面的违规优惠政策、盲目重复建设和设置市场壁垒。危害体现在三个层面：微观上导致"劣币驱逐良币"，损害消费者利益；中观上破坏行业生态，挤压产业链利润空间；宏观上扭曲资源配置，抑制创新活力。什么是“内卷式”竞争？概括其一般特征，是指经济主体为了维持市场地位或争夺有限市场，不断投入大量精力和资源，却没有带来整体收益增长的
WHQL签名怎么申请 GDCA SSL证书 windows
WHQL（WindowsHardwareQualityLabs）签名是微软对硬件和驱动程序进行认证的一种方式，以确保它们与Windows操作系统的兼容性和稳定性。以下是申请WHQL签名的基本步骤，供您参考：1.准备阶段准备硬件设备和驱动程序：确保您的硬件设备已经准备好，并且对应的驱动程序已经经过充分的测试，能够在各种配置和环境下正常工作。获取EV代码签名证书：根据微软的要求，驱动程序进行WHQL认
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
k8s:安装 Helm 私有仓库ChartMuseum、helm-push插件并上传、安装Zookeeper 云游 docker helm helm-push
ChartMuseum是Kubernetes生态中用于存储、管理和发布HelmCharts的开源系统，主要用于扩展Helm包管理器的功能核心功能‌集中存储‌：提供中央化仓库存储Charts，支持版本管理和权限控制。‌‌跨集群部署‌：支持多集群环境下共享Charts，简化部署流程。‌‌离线部署‌：适配无网络环境，可将Charts存储在本地或局域网内。‌‌HTTP接口‌：通过HTTP协议提供服务，用户
上位机知识篇---SD卡&U盘镜像
常用的镜像烧录软件balenaEtcherbalenaEtcher是一个开源的、跨平台的工具，用于将操作系统镜像文件（如ISO和IMG文件）烧录到SD卡和USB驱动器中。以下是其使用方法、使用场景和使用注意事项的介绍：使用方法下载安装：根据自己的操作系统，从官方网站下载对应的安装包。Windows系统下载.exe文件后双击安装；Linux系统若下载的是.deb文件，可在终端执行“sudodpkg-
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
LeetCode 148. 排序链表：归并排序的细节解析进击的小白菜 2025 Top100 详解 leetcode 链表算法
文章目录题目描述一、方法思路：归并排序的核心步骤二、关键实现细节：快慢指针分割链表1.快慢指针的初始化问题2.为什么选择`fast=head.next`？示例1：链表长度为偶数（`1->2->3->4`）三、完整代码实现四、复杂度分析五、总结题目描述LeetCode148题要求对链表进行排序，时间复杂度需为O(nlogn)，且空间复杂度为O(logn)。由于链表的特殊结构（无法随机访问），归并排序
前端项目架构设计要领
1.架构设计的核心目标在设计前端项目架构时，核心目标是模块化、可维护、可扩展、可测试，以及开发效率的最大化。这些目标可以通过以下几个方面来实现：组件化：将UI功能封装为可复用的组件。模块化：将业务逻辑分解为独立的模块或服务。自动化构建与部署：实现自动化构建、测试和部署流程，减少人为操作的错误。代码规范化与检查：确保团队协作时，代码风格和质量一致。2.项目目录结构设计一个清晰合理的目录结构对大型项目
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
理解TCP连接中的进程阻塞与CPU调度机制 109702008 编程 #C语言网络 tcp/ip 网络人工智能
引言在计算机网络通信中，TCP连接的建立是一个经典的三次握手过程。当用户调用connect()函数发起连接时，内核会发送SYN报文并等待对方的SYN-ACK响应。此时，调用进程通常会进入阻塞状态，暂停执行直至连接成功或超时。这一机制看似简单，但其背后的内核实现却涉及进程调度、等待队列管理和CPU资源分配等复杂操作。本文将深入探讨阻塞状态的实现原理，并解析CPU在进程阻塞期间的行为。一、进程阻塞的实
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。