os从业人员

linux 内核启动参数

Linux 内核引导选项简介
作者：金步国
版权声明
本文作者是一位开源理念的坚定支持者，所以本文虽然不是软件，但是遵照开源的精神发布。

无担保：本文作者不保证作品内容准确无误，亦不承担任何由于使用此文档所导致的损失。
自由使用：任何人都可以自由的阅读/链接/打印此文档，无需任何附加条件。
名誉权：任何人都可以自由的转载/引用/再创作此文档，但必须保留作者署名并注明出处。
其他作品
本文作者十分愿意与他人分享劳动成果，如果你对我的其他翻译作品或者技术文章有兴趣，可以在如下位置查看现有的作品集：

金步国作品集 [ http://www.jinbuguo.com/ ]
联系方式
由于作者水平有限，因此不能保证作品内容准确无误。如果你发现了作品中的错误(哪怕是错别字也好)，请来信指出，任何提高作品质量的建议我都将虚心接纳。

Email(QQ)：70171448在QQ邮箱
概述
内核引导选项大体上可以分为两类：一类与设备无关、另一类与设备有关。与设备有关的引导选项多如牛毛，需要你自己阅读内核中的相应驱动程序源码以获取其能够接受的引导选项。比如，如果你想知道可以向 AHA1542 SCSI 驱动程序传递哪些引导选项，那么就查看 drivers/scsi/aha1542.c 文件，一般在前面 100 行注释里就可以找到所接受的引导选项说明。大多数选项是通过”__setup()”函数设置的，少部分是通过”early_param()”或”module_param()”或”module_param_named()”之类的函数设置的，逗号前的部分就是引导选项的名称，后面的部分就是处理这些选项的函数名。

[提示]你可以在源码树的根目录下试一试下面几个命令：

grep -r ‘\b__setup (’
grep -r ‘\bearly_param (’
grep -r ‘\bmodule_param (’
grep -r ‘\bmodule_param_named (’
格式上，多个选项之间用空格分割，选项值是一个逗号分割的列表，并且选项值中不能包含空白。

正确：ether=9,0x300,0xd0000,0xd4000,eth0 root=/dev/sda2
错误：ether = 9, 0x300, 0xd0000, 0xd4000, eth0 root = /dev/sda2
注意，所有引导选项都是大小写敏感的！

在内核运行起来之后，可以通过 cat /proc/cmdline 命令查看当初使用的引导选项以及相应的值。

内核模块
对于模块而言，引导选项只能用于直接编译到核心中的模块，格式是”模块名.选项=值”，比如”usbcore.blinkenlights=1”。动态加载的模块则可以在 modprobe 命令行上指定相应的选项值，比如”modprobe usbcore blinkenlights=1”。

可以使用”modinfo -p modulename"命令显示可加载模块的所有可用选项。已经加载到内核中的模块会在/sys/module/ {modulename}/parameters/ 中显示出其选项，并且某些选项的值还可以在运行时通过”echo -n value>/sys/module/ {modulename}/parameters/${parm}”进行修改。

内核如何处理引导选项
绝大部分的内核引导选项的格式如下(每个选项的值列表中最多只能有十项)：

name[=value_1][,value_2]…[,value_10]
如果”name”不能被识别并且满足”name=value”的格式，那么将被解译为一个环境变量(比如”TERM=linux”或”BOOT_IMAGE=vmlinuz.bak”)，否则将被原封不动的传递给 init 程序(比如”single”)。

内核可以接受的选项个数没有限制，但是整个命令行的总长度(选项/值/空格全部包含在内)却是有限制的，定义在 include/asm/setup.h 中的 COMMAND_LINE_SIZE 宏中(对于X86_64而言是2048)。

内核引导选项精选
由于引导选项多如牛毛，本文不可能涉及全部，因此本文只基于 X86_64 平台以及 Linux-3.13.2 精选了一些与设备无关的引导选项以及少部分与设备有关的引导选项，过时的选项、非x86平台选项、与设备有关的选项，基本上都被忽略了。

[提示]内核源码树下的 Documentation/kernel-parameters.txt 和 Documentation/x86/x86_64/boot-options.txt 文件列出了所有可用的引导选项，并作了简要说明。

标记说明
并不是所有的选项都是永远可用的，只有在特定的模块存在并且相应的硬件也存在的情况下才可用。引导选项上面的方括号说明了其依赖关系，其中使用的标记解释如下：

ACPI 开启了高级配置与电源接口(CONFIG_ACPI)支持
AGP 开启了AGP(CONFIG_AGP)支持
APIC 开启了高级可编程中断控制器支持(2000年以后的CPU都支持)
APPARMOR 开启了AppArmor(CONFIG_SECURITY_APPARMOR)支持
DRM 开启了Direct Rendering Manager(CONFIG_DRM)支持
EFI 开启了EFI分区(CONFIG_EFI_PARTITION)支持
EVM 开启了Extended Verification Module(CONFIG_EVM)支持
FB 开启了帧缓冲设备(CONFIG_FB)支持
HIBERNATION 开启了”休眠到硬盘”(CONFIG_HIBERNATION)支持
HPET_MMAP 允许对HPET寄存器进行映射(CONFIG_HPET_MMAP)
HW 存在相应的硬件设备
IOMMU 开启了IOMMU(CONFIG_IOMMU_SUPPORT)支持
IOSCHED 开启了多个不同的I/O调度程序(CONFIG_IOSCHED_*)
IPV6 开启了IPv6(CONFIG_IPV6)支持
IP_PNP 开启了自动获取IP的协议(DHCP,BOOTP,RARP)支持
IP_VS_FTP 开启了IPVS FTP协议连接追踪(CONFIG_IP_VS_FTP)支持
KVM 开启了KVM(CONFIG_KVM_*)支持
LIBATA 开启了libata(CONFIG_ATA)驱动支持
LOOP 开启了回环设备(CONFIG_BLK_DEV_LOOP)支持
MCE 开启了Machine Check Exception(CONFIG_X86_MCE)支持
MOUSE 开启了鼠标(CONFIG_INPUT_MOUSEDEV)支持
MSI 开启了PCI MSI(CONFIG_PCI_MSI)支持
NET 开启了网络支持
NETFILTER 开启了Netfilter(CONFIG_NETFILTER)支持
NFS 开启了NFS(网络文件系统)支持
NUMA 开启了NUMA(CONFIG_NUMA)支持
PCI 开启了PCI总线(CONFIG_PCI)支持
PCIE 开启了PCI-Express(CONFIG_PCIEPORTBUS)支持
PNP 开启了即插即用(CONFIG_PNP)支持
PV_OPS 内核本身是半虚拟化的(paravirtualized)
RAID 开启了软RAID(CONFIG_BLK_DEV_MD)支持
SECURITY 开启了多个不同的安全模型(CONFIG_SECURITY)
SELINUX 开启了SELinux(CONFIG_SECURITY_SELINUX)支持
SLUB 开启了SLUB内存分配管理器(CONFIG_SLUB)
SMP 开启了对称多处理器(CONFIG_SMP)支持
TPM 开启了可信赖平台模块(CONFIG_TCG_TPM)支持
UMS 开启了USB大容量存储设备(CONFIG_USB_STORAGE)支持
USB 开启了USB(CONFIG_USB_SUPPORT)支持
USBHID 开启了USB HID(CONFIG_USB_HID)支持
VMMIO 开启了使用内存映射机制的virtio设备驱动(CONFIG_VIRTIO_MMIO)
VT 开启了虚拟终端(CONFIG_VT)支持
此外，下面的标记在含义上与上面的有所不同：

BUGS 用于解决某些特定硬件的缺陷
KNL 是一个内核启动选项
BOOT 是一个引导程序选项
标记为”BOOT”的选项实际上由引导程序(例如GRUB)使用，对内核本身没有直接的意义。如果没有特别的需求，请不要修改此类选项的语法，更多信息请阅读 Documentation/x86/boot.txt 文档。

说明：下文中的 [KMG] 后缀表示 210, 220, 230 的含义。

控制台与终端
[KNL]
console=设备及选项
设置输出控制台使用的设备及选项。例如：ttyN 表示使用第N个虚拟控制台。其它用法主要针对嵌入式环境(Documentation/serial-console.txt)。
[KNL]
consoleblank=秒数
控制台多长时间无操作后黑屏，默认值是600秒，设为0表示禁止黑屏。
[HW]
no_console_suspend
永远也不要将控制台进入休眠状态。因为当控制台进入休眠之后，所有内核的消息就都看不见了(包括串口与VGA)。开启此选项有助于调试系统在休眠/唤醒中发生的故障。
[VT]
vt.default_utf8={0|1}
是否将所有TTY都默认设置为UTF-8模式。默认值”1”表示将所有新打开的终端都设置为UTF-8模式。
日志与调试
earlyprintk=设备[,keep]
使用哪个设备显示早期的引导信息，主要用于调试硬件故障。此选项默认并未开启，因为在某些情况下并不能正常工作。
在传统的控制台初始化之前，在哪个设备上显示内核日志信息。不使用此选项，那么你将永远没机会看见这些信息。
在尾部加上”,keep”选项表示在真正的内核控制台初始化并接管系统后，不会抹掉本选项消息的显示。
earlyprintk=vga 表示在VGA上显示内核日志信息，这是最常用的选项，但不能用于EFI环境。
earlyprintk=efi v3.13新增，表示将错误日志写入EFI framebuffer，专用于EFI环境。
earlyprintk=xen 仅可用于XEN的半虚拟化客户机。
loglevel={0|1|2|3|4|5|6|7}
设置内核日志的级别，所有小于该数字的内核信息(具有更高优先级的信息)都将在控制台上显示出来。这个级别可以使用 klogd 程序或者修改 /proc/sys/kernel/printk 文件进行调整。取值范围是”0”(不显示任何信息)到”7”(显示所有级别的信息)。建议至少设为”4”(WARNING)。[提示]级别”7”要求编译时加入了调试支持。
[KNL]
ignore_loglevel
忽略内核日志等级的设置，向控制台输出所有内核消息。仅用于调试目的。
[KNL]
debug
将引导过程中的所有调试信息都显示在控制台上。相当于设置”loglevel=7”(DEBUG)。
[KNL]
quiet
静默模式。相当于设置”loglevel=4”(WARNING)。
log_buf_len=n[KMG]
内核日志缓冲区的大小。”n”必须是2的整数倍(否则会被自动上调到最接近的2的整数倍)。该值也可以通过内核配置选项CONFIG_LOG_BUF_SHIFT来设置。
[KNL]
initcall_debug
跟踪所有内核初始化过程中调用的函数。有助于诊断内核在启动过程中死在了那个函数上面。
kstack=N
在内核异常(oops)时，应该打印出内核栈中多少个字(word)到异常转储中。仅供调试使用。
[KNL]
kmemleak={on|off}
是否开启检测内核内存泄漏的功能(CONFIG_DEBUG_KMEMLEAK)，默认为”on”，仅供调试使用。
检测方法类似于跟踪内存收集器，一个内核线程每10分钟(默认值)扫描内存，并打印发现新的未引用的对象的数量。
[KNL]
memtest=整数
设置内存测试(CONFIG_MEMTEST)的轮数。”0”表示禁止测试。仅在你确实知道这是什么东西并且确实需要的时候再开启。
norandmaps
默认情况下，内核会随机化程序的启动地址，也就是每一次分配给程序的虚拟地址空间都不一样，主要目的是为了防止缓冲区溢出攻击。但是这也给程序调试增加了麻烦，此选项(相当于”echo 0 > /proc/sys/kernel/randomize_va_space”)的目的就是禁用该功能以方便调试。
[PNP]
pnp.debug=1
开启PNP调试信息(需要内核已开启CONFIG_PNP_DEBUG_MESSAGES选项)，仅用于调试目的。也可在运行时通过 /sys/module/pnp/parameters/debug 来控制。
show_msr=CPU数
显示启动时由BIOS初始化的MSR(Model-Specific Register)寄存器设置。CPU数设为”1”表示仅显示”boot CPU”的设置。
printk.time={0|1}
是否在每一行printk输出前都加上时间戳，仅供调试使用。默认值是”0”(不添加)
boot_delay=毫秒数
在启动过程中，为每一个printk动作延迟指定的毫秒数，取值范围是0-10000，超出这个范围将等价于”0”(无延迟)。仅用于调试目的。
pause_on_oops=秒数
当内核发生异常时，挂起所有CPU的时间。当异常信息太多，屏幕持续滚动时，这个选项就很有用处了。主要用于调试目的。
异常检测与处理
[MCE]
mce=off
彻底禁用MCE(CONFIG_X86_MCE)
[MCE]
mce=dont_log_ce
不为已纠正错误(corrected error)记录日志。
[MCE]
mce=容错级别[,超时]
容错级别(还可通过sysfs设置)：
0 在出现未能纠正的错误时panic，记录所有已纠正的错误
1(默认值) 在出现未能纠正的错误时panic或SIGBUS，记录所有已纠正的错误
2 在出现未能纠正的错误时SIGBUS或记录日志，记录所有已纠正的错误
3 从不panic或SIGBUS，记录所有日志。仅用于调试目的。
超时(单位是微秒[百万分之一秒])：在machine check时等待其它CPU的时长，”0”表示不等待。
[ACPI]
erst_disable
禁用ERST(Error Record Serialization Table)支持。主要用于解决某些有缺陷的BIOS导致的ERST故障。
[ACPI]
hest_disable
禁用HEST(Hardware Error Source Table)支持。主要用于解决某些有缺陷的BIOS导致的HEST故障。
[KNL]
nosoftlockup
禁止内核进行软死锁检测
[KNL]
softlockup_panic={0|1}
是否在检测到软死锁(soft-lockup)的时候让内核panic，其默认值由 CONFIG_BOOTPARAM_SOFTLOCKUP_PANIC_VALUE 确定
[KNL]
nowatchdog
禁止硬死锁检测(NMI watchdog)
[KNL,BUGS]
nmi_watchdog={0|panic|nopanic}
配置nmi_watchdog(不可屏蔽中断看门狗)。更多信息可查看”lockup-watchdogs.txt”文档。
0 表示关闭看门狗；
panic 表示出现看门狗超时(长时间没喂狗)的时候触发内核错误，通常和”panic=”配合使用，以实现在系统出现锁死的时候自动重启。
nopanic 正好相反，表示即使出现看门狗超时(长时间没喂狗)，也不触发内核错误。
unknown_nmi_panic
在收到未知的NMI(不可屏蔽中断)时直接panic
oops=panic
在内核oops时直接panic(而默认是仅仅杀死oops进程[这样做会有很小的概率导致死锁])，而且这同样也会导致在发生MCE(CONFIG_X86_MCE)时直接panic。主要目的是和”panic=”选项连用以实现自动重启。
[KNL]
panic=秒数
内核在遇到panic时等待重启的行为：
秒数>0 等待指定的秒数后重启
秒数=0(默认值) 只是简单的挂起，而永不重启
秒数<0 立即重启
时钟(Timer)
时钟(Timer)的功能有两个：(1)定时触发中断；(2)维护和读取当前时间。x86_64平台常见的时钟硬件有以下这些：
RTC(Real Time Clock) 实时时钟的独特之处在于，RTC是主板上一块电池供电的CMOS芯片(精度一般只到秒级)，RTC(Clock)吐出来的是”时刻”(例如”2014-2-22 23:38:44”)，而其他硬件时钟(Timer)吐出来的是”时长”(我走过了XX个周期，按照我的频率，应该是10秒钟)。
PIT(Programmable Interval Timer) PIT是最古老的时钟源，产生周期性的时钟中断(IRQ0)，精度在100-1000Hz，现在基本已经被HPET取代。
APIC Timer 这是PIT针对多CPU环境的升级，每个CPU上都有一个APIC Timer(而PIT则是所有CPU共享的)，但是它经常有BUG且精度也不高(3MHz左右)，所实际很少使用。
ACPI Timer(Power Management Timer) 它唯一的功能就是为每个时钟周期提供一个时间戳，用于提供与处理器速度无关的可靠时间戳。但其精度并不高(3.579545MHz)。
HPET(High Precision Event Timer) HPET提供了更高的精度(14.31818MHz)以及更宽的计数器(64位)。HPET可以替代前述除RTC之外的所有时钟硬件(Timer)，因为它既能定时触发中断，又能维护和读取当前时间。一个HPET包含了一个固定频率的数值递增的计数器以及3-32个独立计数器，每个计数器又包含了一个比较器和一个寄存器，当两者数值相等时就会触发中断。HPET的出现将允许删除芯片组中的一些冗余的旧式硬件。2006年之后的主板基本都已支持HPET。
TSC(Time Stamp Counter) TSC是位于CPU里面的一个64位寄存器，与传统的周期性时钟不同，TSC并不触发中断，它是以计数器形式存在的单步递增性时钟。也就是说，周期性时钟是通过周期性触发中断达到计时目的，如心跳一般。而单步递增时钟则不发送中断，取而代之的是由软件自己在需要的时候去主动读取TSC寄存器的值来获得时间。TSC的精度(纳秒级)远超HPET并且速度更快，但仅能在较新的CPU(Sandy Bridge之后)上使用。

[HW,ACPI]
acpi_skip_timer_override
用于解决某些有缺陷的Nvidia nForce2 BIOS中的计时器覆盖问题(例如开启ACPI后频繁死机或时钟故障)。
[HW,ACPI]
acpi_use_timer_override
用于解决某些有缺陷的Nvidia nForce5 BIOS中的计时器覆盖问题(例如开启ACPI后频繁死机或时钟故障)。
[APIC]
no_timer_check
禁止运行内核中时钟IRQ源缺陷检测代码。主要用于解决某些AMD平台的CPU占用过高以及时钟过快的故障。
pmtmr=十六进制端口号
手动指定pmtimer(CONFIG_X86_PM_TIMER)的I/O端口(16进制值)，例如：pmtmr=0x508
acpi_pm_good
跳过pmtimer(CONFIG_X86_PM_TIMER)的bug检测，强制内核认为这台机器的pmtimer没有毛病。用于解决某些有缺陷的BIOS导致的故障。
[APIC]
apicpmtimer
使用pmtimer(CONFIG_X86_PM_TIMER)来校准APIC timer。此选项隐含了”apicmaintimer”。用于PIT timer彻底坏掉的场合。
[APIC]
apicmaintimer
noapicmaintimer
apicmaintimer 将APIC timer用于计时(而不是PIT/HPET中断)。这主要用于PIT/HPET中断不可靠的场合。
noapicmaintimer 不将APIC timer用于计时(而是使用PIT/HPET中断)。这是默认值。但有时候依然需要明确指定。
[APIC]
lapic_timer_c2_ok
按照ACPI规范的要求，local APIC Timer 不能在C2休眠状态下关闭，但可以在C3休眠状态下关闭。但某些BIOS(主要是AMD平台)会在向操作系统报告CPU进入C2休眠状态时，实际进入C3休眠状态。因此，内核默认采取了保守的假定：认为 local APIC Timer 在C2/C3状态时皆处于关闭状态。如果你确定你的BIOS没有这个问题，那么可以使用此选项明确告诉内核，即使CPU在C2休眠状态，local APIC Timer 也依然可用。
[APIC]
noapictimer
禁用CPU Local APIC Timer
enable_timer_pin_1
disable_timer_pin_1
开启/关闭APIC定时器的PIN1，内核将尽可能自动探测正确的值。但有时需要手动指定以解决某些有缺陷的ATI芯片组故障。
clocksource={jiffies|acpi_pm|hpet|tsc}
强制使用指定的时钟源，以代替内核默认的时钟源。
jiffies 最差的时钟源，只能作为最后的选择。
acpi_pm [ACPI]符合ACPI规范的主板都提供的硬件时钟源(CONFIG_X86_PM_TIMER)，提供3.579545MHz固定频率，这是传统的硬件时钟发生器。
hpet 一种取代传统”acpi_pm”的高精度硬件时钟源(CONFIG_HPET)，提供14.31818MHz固定频率。2007年以后的芯片组一般都支持。
tsc TSC(Time Stamp Counter)的主体是位于CPU里面的一个64位TSC寄存器，与传统的以中断形式存在的周期性时钟不同，TSC是以计数器形式存在的单步递增性时钟，两者的区别在于，周期性时钟是通过周期性触发中断达到计时目的，如心跳一般。而单步递增时钟则不发送中断，取而代之的是由软件自己在需要的时候去主动读取TSC寄存器的值来获得时间。TSC的精度更高并且速度更快，但仅能在较新的CPU(Sandy Bridge之后)上使用。
[KNL]
highres={“on”|”off”}
启用(默认值)还是禁用高精度定时器模式。主要用于关闭主板上有故障的高精度时钟源。
nohpet
禁用HPET timer(CONFIG_HPET)
[HPET_MMAP]
hpet_mmap
v3.13新增，默认允许对HPET寄存器进行映射，相当于开启了内核CONFIG_HPET_MMAP_DEFAULT选项。需要注意的是，某些包含HPET硬件寄存器的页中同时还含有其他不该暴露给用户的信息。
notsc
tsc=reliable
tsc=noirqtime
设置TSC时钟源的属性。
notsc 表示不将TSC用作”wall time”时钟源，主要用于不能在多个CPU之间保持正确同步的SMP系统。
tsc=reliable 表示TSC时钟源是绝对稳定的，关闭启动时和运行时的稳定性检查。用于在某些老旧硬件/虚拟化环境使用TSC时钟源。
tsc=noirqtime 不将TSC用于统计进程IRQ时间。主要用于在RDTSC速度较慢的CPU上禁止内核的CONFIG_IRQ_TIME_ACCOUNTING功能。
关于”TSC时钟源”，详见”clocksource=”选项的说明。
中断
常见的中断控制器有两种：传统的8259A和新式的APIC，前者也被称为”PIC”。8259A只适合单CPU的场合，而APIC则能够把中断传递给系统中的每个CPU，从而充分挖掘SMP体系结构的并行性。所以8259A已经被淘汰了。APIC系统由3部分组成：APIC总线(前端总线)、IO-APIC(南桥)、本地APIC(CPU)。每个CPU中集成了一个本地APIC，负责传递中断信号到处理器。而IO-APIC是系统芯片组中一部分，负责收集来自I/O设备的中断信号并发送到本地APIC。APIC总线则是连接IO-APIC和各个本地APIC的桥梁。

[SMP,APIC]
noapic
禁止使用IO-APIC(输入输出高级可编程输入控制器)，主要用于解决某些有缺陷的BIOS导致的APIC故障。
[APIC]
nolapic
disableapic
禁止使用local APIC。主要用于解决某些有缺陷的BIOS导致的APIC故障。”nolapic”是为了保持传统习惯的兼容写法，与”disableapic”的含义相同。
[APIC]
nox2apic
关闭x2APIC支持(CONFIG_X86_X2APIC)
[APIC]
x2apic_phys
在支持x2apic的平台上使用physical模式代替默认的cluster模式。
[KNL]
threadirqs
强制线程化所有的中断处理器(明确标记为IRQF_NO_THREAD的除外)
[SMP,APIC]
pirq=
手动指定mp-table的设置。此选项仅对某些有缺陷的、具备多个IO-APIC的高端主板有意义。详见Documentation/x86/i386/IO-APIC.txt文档
[HW]
irqfixup
用于修复简单的中断问题：当一个中断没有被处理时搜索所有可用的中断处理器。用于解决某些简单的固件缺陷。
[HW]
irqpoll
用于修复高级的中断问题：当一个中断没有被处理时搜索所有可用的中断处理器，并且对每个时钟中断都进行搜索。用于解决某些严重的固件缺陷。
ACPI
高级配置与电源管理接口(Advanced Configuration and Power Interface)是提供操作系统与应用程序管理所有电源管理接口，包括了各种软件和硬件方面的规范。2004年推出3.0规范；2009年推出4.0规范；2011年推出5.0规范。2013年之后新的ACPI规格将由UEFI论坛制定。ACPI可以实现的功能包括：电源管理；性能管理；配置与即插即用；系统事件；温度管理；电池管理；SMBus控制器；嵌入式控制器。

[HW,ACPI]
acpi={force|off|noirq|strict|rsdt|nocmcff|copy_dsdt}
ACPI的总开关。
force 表示强制启用ACPI(即使BIOS中已关闭)；
off 表示强制禁用ACPI(即使BIOS中已开启)；
noirq 表示不要将ACPI用于IRQ路由；
strict 表示严格要求系统遵循ACPI规格(降低兼容性)；
rsdt 表示使用老旧的RSDT(Root System Description Table)代替较新的XSDT(Extended System Description Table)；
copy_dsdt 表示将DSDT(Differentiated System Description Table)复制到内存中。
更多信息可参考Documentation/power/runtime_pm.txt以及”pci=noacpi”。
[HW,ACPI]
acpi_backlight={vendor|video}
选择屏幕背光亮度调节驱动。
video(默认值)表示使用通用的ACPI video.ko驱动(CONFIG_ACPI_VIDEO)，该驱动仅可用于集成显卡。
vendor表示使用厂商特定的ACPI驱动(thinkpad_acpi,sony_acpi等)。
详见Documentation/acpi/video_extension.txt文档。
[HW,ACPI]
acpi_os_name=”字符串”
告诉ACPI BIOS操作系统的名称。
常用于哄骗有缺陷的BIOS，让其以为运行的是Windows系统而不是Linux系统。
“Linux” = Linux
“Microsoft Windows” = Windows 98
“Windows 2000” = Windows 2000
“Windows 2001” = Windows XP
“Windows 2001 SP2” = Windows XP SP2
“Windows 2001.1” = Windows Server 2003
“Windows 2001.1 SP1” = Windows Server 2003 SP1
“Windows 2006” = Windows Vista
“Windows 2006 SP1” = Windows Vista SP1
“Windows 2006.1” = Windows Server 2008
“Windows 2009” = Windows 7 / Windows Server 2008 R2
“Windows 2012” = Windows 8 / Windows Server 2012
“Windows 2013” = Windows 8.1 / Windows Server 2012 R2
[HW,ACPI]
acpi_osi=”字符串”
对于较新的内核(Linux-2.6.23之后)而言，当BIOS询问内核：”你是Linux吗?”，内核都会回答”No”，但历史上(Linux-2.6.22及更早版本)内核会如实回答”Yes”，结果造成很多BIOS兼容性问题(主要是电源管理方面)。具体故事的细节请到内核源码文件drivers/acpi/osl.c中搜索”The story of _OSI(Linux)”注释。
此选项用于修改内核中的操作系统接口字符串(_OSI string)列表默认值，这样当BIOS向内核询问：”你是xxx吗?”的时候，内核就可以根据修改后的列表中是否存在”xxx”回答”Yes”或”No”了，主要用于解决BIOS兼容性问题导致的故障(例如屏幕亮度调整)。
acpi_osi=”Linux”表示添加”Linux”；
acpi_osi=”!Linux”表示删除”Linux”；
acpi_osi=!* 表示删除所有字符串(v3.13新增)，可以和多个acpi_osi=”Linux”格式联合使用；
acpi_osi=! 表示删除所有内置的字符串(v3.13新增)，可以和多个acpi_osi=”Linux”格式联合使用；
acpi_osi= 表示禁用所有字符串，仅可单独使用(不能联合使用)。
[HW,ACPI]
acpi_serialize
强制内核以串行方式执行AML(ACPI Machine Language)字节码。用于解决某些有缺陷的BIOS导致的故障。
[ACPI]
acpi_enforce_resources={strict|lax|no}
检查驱动程序和ACPI操作区域(SystemIO,SystemMemory)之间资源冲突的方式。
strict(默认值)禁止任何驱动程序访问已被ACPI声明为”受保护”的操作区域，这是最安全的方式，可以从根本上避免冲突。
lax允许驱动程序访问已被ACPI声明的保护区域(但会显示一个警告)。这可能会造成冲突，但是可以兼容某些老旧且脑残的驱动程序(例如某些硬件监控驱动)。
no表示根本不声明任何ACPI保护区域，也就是完全允许任意驱动程序访问ACPI操作区域。
[ACPI]
pnpacpi=off
禁用ACPI的即插即用功能，转而使用古董的PNPBIOS来代替。
休眠与唤醒
[HW,ACPI]
acpi_sleep={s3_bios,s3_mode,s3_beep,s4_nohwsig,old_ordering,nonvs,sci_force_enable}
ACPI休眠选项。
(1)s3_bios和s3_mode与显卡有关。计算机从S3状态(挂起到内存)恢复时，硬件需要被正确的初始化。这对大多数硬件都不是问题，但因为显卡是由BIOS初始化的，内核无法获取必要的恢复信息(仅存在于BIOS中，内核无法读取)，所以这里就提供了两个选项，以允许内核通过两种不同的方式来恢复显卡，更多细节请参考Documentation/power/video.txt文档。
(2)s3_beep主要用于调试，它让PC喇叭在内核的实模式入口点被调用时发出响声。
(3)s4_nohwsig用于关闭ACPI硬件签名功能，某些有缺陷的BIOS会因为这个原因导致从S4状态(挂起到硬盘)唤醒时失败。
(4)old_ordering用于兼容古董级的ACPI 1.0 BIOS
(5)nonvs表示阻止内核在挂起/唤醒过程中保存/恢复ACPI NVS内存信息，主要用于解决某些有缺陷的BIOS导致的挂起/唤醒故障。
(6)sci_force_enable表示由内核直接设置SCI_EN(ACPI模式开关)的状态，主要用于解决某些有缺陷的BIOS导致的从S1/S3状态唤醒时的故障。
[HIBERNATION]
noresume
禁用内核的休眠到硬盘功能(CONFIG_HIBERNATION)，也就是不从先前的休眠状态中恢复(即使该状态已经被保存在了硬盘的swap分区上)，并且清楚先前已经保存的休眠状态(如果有的话)。
[HIBERNATION]
hibernate={noresume|nocompress}
设置休眠/唤醒属性：
noresume 表示禁用唤醒，也就是在启动过程中无视任何已经存在的休眠镜像，完全重新启动。
nocompress 表示禁止对休眠镜像进行压缩/解压。
[HIBERNATION]
resume={ /dev/swap | PARTUUID=uuid | major:minor | hex }
告诉内核被挂起的内存镜像存放在那个磁盘分区(默认值是CONFIG_PM_STD_PARTITION)。
假定内存镜像存放在”/dev/sdc15”分区上，该分区的 UUID=0123456789ABCDEF ，其主设备号是”8”，次设备号是”47”，那么这4种表示法应该分别这样表示：
resume=/dev/sdc15 (这是内核设备名称，有可能与用户空间的设备名称不同)
resume=PARTUUID=0123456789ABCDEF
resume=08:47
resume=082F
[HIBERNATION]
resume_offset=整数
指定swap header所在位置的偏移量(单位是PAGE_SIZE)，偏移量的计算基准点是”resume=”分区的起点。
仅在使用swap文件(而不是分区)的时候才需要此选项。详见Documentation/power/swsusp-and-swap-files.txt文档
[HIBERNATION]
resumedelay=秒数
在读取resume文件(设备)之前延迟的秒数，主要用于等待那些反应速度较慢的异步检测的设备就绪(例如USB/MMC)。
[HIBERNATION]
resumewait
在resume设备没有就绪之前无限等待，主要用于等待那些反应速度较慢的异步检测的设备就绪(例如USB/MMC)。
温度控制
[HW,ACPI]
thermal.act=摄氏度
-1 禁用所有”主动散热”标志点(active trip point)
正整数强制设置所有的最低”主动散热”标志点的温度值，单位是摄氏度。
详见Documentation/thermal/sysfs-api.txt文档。
[HW,ACPI]
thermal.psv=摄氏度
-1 禁用所有”被动散热”标志点(passive trip point)
正整数强制设置所有的”被动散热”标志点的温度值，单位是摄氏度。
详见Documentation/thermal/sysfs-api.txt文档。
[HW,ACPI]
thermal.crt=摄氏度
-1 禁用所有”紧急”标志点(critical trip point)
正整数强制设置所有的”紧急”标志点的温度值，单位是摄氏度。
详见Documentation/thermal/sysfs-api.txt文档。
[HW,ACPI]
thermal.nocrt=1
禁止在ACPI热区(thermal zone)温度达到”紧急”标志点时采取任何动作。
[HW,ACPI]
thermal.off=1
彻底关闭ACPI热量控制(CONFIG_ACPI_THERMAL)
[HW,ACPI]
thermal.tzp=整数
设置ACPI热区(thermal zone)的轮询速度：
0(默认值) 不轮询
正整数轮询间隔，单位是十分之一秒。
CPU节能
[KNL]
nohz={on|off}
启用/禁用内核的dynamic ticks特性。默认值是”on”。
[KNL,BOOT]
nohz_full=CPU列表
在内核”CONFIG_NO_HZ_FULL=y”的前提下，指定哪些CPU核心可以进入完全无滴答状态。
“CPU列表”是一个逗号分隔的CPU编号(从0开始计数)，也可以使用”-“界定一个范围。例如”0,2,4-7”等价于”0,2,4,5,6,7”
注意“boot CPU”(通常都是”0”号CPU)会无条件的从列表中剔除。(2)这里列出的CPU编号必须也要同时列进”rcu_nocbs=…”选项中。
[HW,ACPI]
processor.nocst
不使用_CST方法检测C-states，而是用老旧的FADT方法检测。
[HW,ACPI]
processor.max_cstate={0|1|2|3|4|5|6|7|8|9}
无视ACPI表报告的值，强制指定CPU的最大C-state值(必须是一个有效值)：C0为正常状态，其他则为不同的省电模式(数字越大表示CPU休眠的程度越深/越省电)。”9”表示无视所有的DMI黑名单限制。
[KNL,HW,ACPI]
intel_idle.max_cstate=[0|正整数]
设置intel_idle驱动(CONFIG_INTEL_IDLE)允许使用的最大C-state深度。”0”表示禁用intel_idle驱动，转而使用通用的acpi_idle驱动(CONFIG_CPU_IDLE)
idle=poll
idle=halt
idle=nomwait
对CPU进入休眠状态的额外设置。
poll 从根本上禁用休眠功能(也就是禁止进入C-states状态)，可以略微提升一些CPU性能，但是却需要多消耗许多电力，得不偿失。不推荐使用。
halt 表示直接使用HALT指令让CPU进入C1/C1E休眠状态，但是不再继续进入C2/C3以及更深的休眠状态。此选项兼容性最好，唤醒速度也最快。但是电力消耗并不最低。
nomwait 表示进入休眠状态时禁止使用CPU的MWAIT指令。MWAIT是专用于Intel超线程技术的线程同步指令，有助于提升CPU的超线程效能，但对于不具备超线程技术的CPU没有意义。
[提示]可以同时使用halt和nomwait，也就是”idle=halt idle=nomwait”(但不是：idle=halt,nomwait)
intel_pstate=disable
禁用 Intel CPU 的 P-state 驱动(CONFIG_X86_INTEL_PSTATE)，也就是Intel CPU专用的频率调节器驱动
PCI与PCIE
[PCI]
pci=选项[,选项…]
指定各种PCI子系统选项：
earlydump 在内核做出任何改变之前，首先转储出PCI配置空间。主要用于调试目的。
off 不检测PCI总线，也就是关闭所有PCI设备。
conf1 强制使用”PCI配置机制1”(目前的事实标准)
conf2 强制使用”PCI配置机制2”(已被抛弃的老古董)
noaer [PCIE]禁止使用CONFIG_PCIEAER功能(PCI Express Root Port Advanced Error Reporting)
nodomains 禁止支持多个PCI root domain(也就是PCI总线域[PCI segment])
nommconf 禁止使用通过MMCONFIG(CONFIG_PCI_MMCONFIG)方式访问PCI配置空间，MMCONFIG是PCI Express引入的新总线枚举方式。
check_enable_amd_mmconf 在 AMD family 10h CPU 上检查并启用正确配置的MMIO以访问PCI配置空间
nomsi [MSI]在全系统范围内禁止MSI中断(CONFIG_PCI_MSI)的使用
noioapicquirk [APIC]禁止屏蔽任何boot中断(CONFIG_X86_REROUTE_FOR_BROKEN_BOOT_IRQS)，以确保boot IRQ永远可用。应该永远不需要使用此选项。
ioapicreroute [APIC]允许将boot IRQ重新路由到主IO-APIC(相当于开启CONFIG_X86_REROUTE_FOR_BROKEN_BOOT_IRQS)，用于修复某些芯片组bug(在某些情况下会发送多余的”boot IRQ”)。
noioapicreroute [APIC]禁止将boot IRQ重新路由到主IO-APIC(相当于关闭CONFIG_X86_REROUTE_FOR_BROKEN_BOOT_IRQS)，不建议使用此项。
rom 为扩展ROM分配地址空间。使用此选项要小心，因为某些设备在ROM与其它资源之间共享地址译码器。
norom 即使BIOS没有为扩展ROM分配地址空间，也禁止内核为扩展ROM分配地址空间。
nobar 即使BIOS没有为BAR分配地址空间，也禁止内核为BAR分配地址空间。
irqmask=0xMMMM 指定允许自动分配到PCI设备的IRQ位掩码，目的是为了避免使用那些被ISA设备占用的IRQ。
pirqaddr=0xAAAAA 如果PIRQ表(通常情况下由BIOS生成)在F0000h-100000h范围之外，此选项可用于明确指定其物理地址。
lastbus=N 通过扫描N号总线来扫描全部总线。如果内核不能找到第二条总线，可以通过此方法明确告知其位置。
assign-busses 总是使用内核自己生成的PCI总线号码替代固件自己生成的值。
usepirqmask 优先使用可能存在于BIOS $PIR表中的IRQ掩码。某些有缺陷的BIOS需要这个选项(例如HP Pavilion N5400和Omnibook XE3笔记本)。此选项仅在noioapicreroute(相当于关闭CONFIG_X86_REROUTE_FOR_BROKEN_BOOT_IRQS)的前提下有效。
noacpi 不为IRQ路由或PCI扫描使用ACPI
use_crs 使用来自ACPI的PCI主桥的窗口信息。在2008年之后的BIOS上，这是默认值，如果需要明确使用此项，请当做bug上报开发者。
nocrs 忽略来自ACPI的PCI主桥的窗口信息，如果需要明确使用此项，请当做bug上报开发者。
routeirq 对所有PCI设备使用IRQ路由。这个通常是由内核的pci_enable_device()函数完成，所以此项仅为那些忘记调用此函数的驱动提供的临时解决方案。
skip_isa_align 不对齐ISA IO起始地址，这样就可以处理更多的PCI卡
noearly 不做任何”early type 1”扫描，这样许多针对主板缺陷的检测将被禁止，同时某些IOMMU驱动也会失效。仅用于解决某些有缺陷的主板故障。
bfsort 按照宽度优先(breadth-first)的顺序对PCI设备进行排序。目的是为了以与2.4内核兼容的方式获取设备序号。
nobfsort 不按宽度优先(breadth-first)的顺序对PCI设备进行排序。
pcie_bus_tune_off 不对PCIe MPS(Max Payload Size)进行调整，而是使用BIOS配置好的默认值。
pcie_bus_safe 将每个设备的MPS都设为root complex下所有设备支持的MPS中的最大值
pcie_bus_perf 将设备的MPS设为其上级总线允许的最大MPS，同时将MRRS(Max Read Request Size)设为能支持的最大值(但不能大于设备或总线所支持的MPS值)
pcie_bus_peer2peer 将每个设备的MPS都设为最安全的”128B”，以确保支持所有设备之间的点对点DMA，同时也能保证热插入(hot-added)设备能够正常工作，但代价是可能会造成性能损失。
cbiosize=nn[KMG] 从CardBus桥的IO窗口中保留的固定长度的总线空间(bus space)，默认值是256B。
cbmemsize=nn[KMG] 从CardBus桥的内存窗口中保留的固定长度的总线空间(bus space)，默认值是64MB。
resource_alignment=[对齐规则@][域:]总线:插槽.功能[; …] 为重新分配已对齐的内存资源指定对齐方式与设备。如果未指定对齐规则，那么将使用PAGE_SIZE作为对齐规则。也可以通过指定PCI-PCI桥来扩展资源窗口(resource windows)。
ecrc={bios|on|off} 启用/禁用PCIe ECRC(事务层的端对端CRC校验)。默认值是”bios”(使用BIOS/固件的设定)。
hpiosize=nn[KMG] 为热插拔桥的IO窗口保留的固定总线空间的大小，默认值是256B。
hpmemsize=nn[KMG] 为热插拔桥的内存窗口保留的固定总线空间的大小，默认值是2MB。
realloc={on|off} 当BIOS分配的PCI桥资源太小而无法满足所有子设备的需求时，是否由内核重新分配PCI桥资源。没有默认值(内核的默认值为”undefined”)
realloc 等价于”realloc=on”
noari 不使用PCIe ARI
pcie_scan_all 扫描所有可能的PCIe设备。默认只在每个PCIe下游端口扫描一个设备。
[PCIE]
pcie_hp=nomsi
禁止PCIe本地热插拔使用MSI(CONFIG_PCI_MSI)，这将导致所有PCIe端口使用INTx中断提供热插拔服务。
[PCIE]
pcie_ports={auto|native|compat}
PCIe端口处理方式：
auto 由BIOS来决定是否使用关联在PCIe端口上的本地PCIe服务(PME, hot-plug, AER)
native 无条件的使用关联在PCIe端口上的本地PCIe服务(PME, hot-plug, AER)
compat 禁用PCIe端口驱动，同时将PCIe端口当做PCI-to-PCI桥处理。
[PCIE]
pcie_aspm={off|force}
强制启用/禁用PCIe Active State Power Management(CONFIG_PCIEASPM)。内核的默认值取决于内核”Default ASPM policy”的配置。
off 强制禁用
force 即使设备声明不支持ASPM也强制启用(可能会导致系统锁死)。
[PCIE]
pcie_pme=nomsi
禁止本地PCIe PME信号使用MSI(CONFIG_PCI_MSI)，这将导致所有PCIe root端口使用INTx中断提供所有服务。
LIBATA
[LIBATA]
libata.noacpi
在libata驱动休眠/唤醒过程中禁止使用ACPI。主要用于解决某些有缺陷的BIOS导致的硬盘假死问题。
[LIBATA]
libata.dma=整数
控制DMA特性的使用
libata.dma=0 表示完全禁止所有SATA/PATA端口使用DMA
libata.dma=1 表示仅允许SATA/PATA硬盘使用DMA
libata.dma=2 表示仅允许ATAPI(CDROM)使用DMA
libata.dma=4 表示仅允许CF卡使用DMA
上述1,2,4实际上是位掩码，可以组合使用，例如 libata.dma=3 表示允许硬盘和CDROM使用DMA，但是禁止CF卡使用DMA
[LIBATA]
libata.ignore_hpa={0|1}
是否忽略HPA(Host Protected Area)的限制。”0”(默认值)表示不忽略；”1”表示忽略(也就是可以使用整个磁盘空间)
[LIBATA]
libata.force=PORT[.DEVICE]:VAL,PORT[.DEVICE]:VAL,…
手动强制指定libata的配置。
其中的”PORT[.DEVICE]”是libata驱动在控制台上以相同格式显示出来的ATA ID字符串(PORT和DEVICE都是十进制数字)，下面是两个实例(“1.00”,”2.00”)：
ata1.00: ATAPI: VBOX CD-ROM, 1.0, max UDMA/133
ata2.00: ATA-6: VBOX HARDDISK, 1.0, max UDMA/133
如果不指定DEVICE部分，那么就表示适用于该PORT端口上的所有设备。
VAL部分用来强制设定设备属性：
40c, 80c, short40c, unk, ign, sata 这些都用于指定线缆类型
1.5Gbps, 3.0Gbps 这些都用于指定SATA连接速度
noncq, ncq 关闭还是开启NCQ功能
dump_id 转储IDENTIFY数据
pio[0-7], mwdma[0-4], udma0-7 数据传输模式
nohrst, nosrst, norst 只禁止硬重置,只禁止软重置,同时禁止硬重置和软重置
rstonce 在热拔连接恢复(hot-unplug link recovery)过程中仅尝试一次重置
atapi_dmadir 开启 ATAPI DMADIR bridge 支持
disable 禁用该设备
键盘/鼠标/触摸板
[HW]
atkbd.set={2|3}
设置atkbd驱动(CONFIG_KEYBOARD_ATKBD)的键盘类型：2(默认值)表示AT键盘；3 表示PS/2键盘。
[HW]
atkbd.reset
在初始化AT或PS/2键盘时重置键盘状态。常用于解决从休眠状态唤醒后键盘失效的故障。
[HW]
atkbd.softraw={0|1}
当键盘按键被按下时，是返回原始的扫描码(Scancode)还是经过转换之后的键码(Keycode)。常用于解决某些功能键(例如Fn键)故障。
0 表示返回原始的扫描码(Scancode)
1(默认值)表示返回转换之后的键码(Keycode)
[USBHID]
usbhid.mousepoll=毫秒数
USB鼠标的轮询时间间隔，单位是毫秒。默认值是”10”，也就是每秒轮询100次，相当于100Hz
[MOUSE]
mousedev.tap_time=毫秒数
手指触碰和离开触摸板的最大时间间隔，只有小于此间隔的触碰才会被当成鼠标左键单击。此选项仅对工作在绝对模式的触摸板有意义。
[MOUSE]
mousedev.xres=正整数
mousedev.yres=正整数
触摸板的水平(X)/垂直(Y)方向的分辨率。
USB
[USB]
nousb
禁用USB子系统(CONFIG_USB_SUPPORT)
[USB]
usbcore.authorized_default={-1|0|1}
USB设备的默认授权规则：
-1(默认值) 对除无线USB之外的设备默认授权
0 对所有设备都默认不授权
1 对所有设备都默认授权
[USB]
usbcore.autosuspend=秒数
让USB设备(新检测到的设备以及空闲设备)进入自动休眠前的延迟秒数。默认为2秒。
如果将秒数设为负数，则表示永不进入自动休眠状态。
[USB]
usbcore.initial_descriptor_timeout=毫秒数
等待设备回应初始化64位USB_REQ_GET_DESCRIPTOR请求的超时时间。默认值是”5000”，也就是5秒。
[USB]
usbcore.blinkenlights={0|1}
是否让所有的USB集线器(HUB)上的LED指示灯闪烁。默认值”0”表示不闪烁，”1”表示闪烁。
[USB]
usbcore.usbfs_snoop={0|1}
是否在在日志中记录所有的usbfs traffic信息。默认值”0”表示不记录，”1”表示记录。
[USB]
usbcore.old_scheme_first={0|1}
是否优先使用老旧的USB设备初始化方法。默认值”0”表示不优先使用。
[USB]
usbcore.use_both_schemes={0|1}
是否在第一种USB设备初始化方法失败之后，继续尝试第二种方法。默认值”1”表示继续尝试第二种方法。
[USB]
usbcore.usbfs_memory_mb=[0-2047]
由usbfs分配的缓存上限。取值范围是[0-2047]，默认值是”16”，单位是”MB”。
[UMS]
usb-storage.delay_use=秒数
在扫描新USB存储设备上的逻辑单元(Logical Unit)前暂停的秒数。默认值是”5”秒。
[UMS]
usb-storage.quirks=VID:PID:Flags[,VID:PID:Flags]…
设置一系列的修正项(quirk)，用于增补或者改写内核内置的unusual_devs列表内容。该列表用于修正各种有缺陷的USB存储设备的怪毛病。
多个修正项之间用逗号分隔，修正项的格式是”VID:PID:Flags”，其中VID和PID的含义分别是4位16进制数表示的”Vendor ID”与”Product ID”。
而Flags则是一组字符的组合，其中的每个字符都对应一个具有特定含义的修正(quirk)标记：
a = SANE_SENSE (收集超过18字节的传感器数据)
b = BAD_SENSE (不收集超过18字节的传感器数据)
c = FIX_CAPACITY (无条件的将设备报告的扇区数(容量)减少一个扇区)
d = NO_READ_DISC_INFO (不使用 READ_DISC_INFO 命令)
e = NO_READ_CAPACITY_16 (不使用 READ_CAPACITY_16 命令)
h = CAPACITY_HEURISTICS (如果设备报告的扇区数(容量)是奇数，那么就减少一个扇区)
i = IGNORE_DEVICE (不绑定此设备)
l = NOT_LOCKABLE (不要尝试锁定/解锁可弹出媒体)
m = MAX_SECTORS_64 (每次传输最大不超过64个扇区(32KB)的数据)
n = INITIAL_READ10 (强制重试初始的 READ(10) 命令(如果最初一次读取失败的话))
o = CAPACITY_OK (完全信任设备报告的扇区数(容量))
p = WRITE_CACHE (默认开启设备写入缓存[不怕数据丢失的风险])
r = IGNORE_RESIDUE (不相信设备报告的[容量]剩余值)
s = SINGLE_LUN (此设备只有一个逻辑单元(Logical Unit))
w = NO_WP_DETECT (不检测设备是否有写保护)
例如：usb-storage.quirks=0419:aaf5:rl,0421:0433:rc
[USB]
uhci-hcd.ignore_oc={0|1}
是否忽略”电流超限”(overcurrent)事件。
0(默认值) 不忽略
1 忽略。某些有缺陷的主板会在USB端口未连接任何设备时，报告很多虚假的”电流超限”事件。设为”1”之后可以避免在内核日志中出现大量的”电流超限”警告，但同时，真实的”电流超限”事件也会被一并忽略。
IOMMU
IOMMU非常类似于MMU，主要有如下功能：(1)IO地址转换[在64位系统上支持32位设备]；(2)分散-聚集(scatter-gather)支持[简化驱动程序的编写]；(3)DMA重映射与IRQ重映射[简化了IO设备的虚拟化]。
Linux内核当前的DMA映射有如下4种具体实现：
(1)在内存不足3G的机器上，根本不使用任何IOMMU功能，因为根本没必要。内核消息：”PCI-DMA: Disabling IOMMU”
(2)基于GART(CONFIG_GART_IOMMU)的硬件IOMMU。内核消息：”PCI-DMA: using GART IOMMU”
(3)如果内存大于3G同时机器上又没有IOMMU硬件(或者用了”iommu=soft”)，那么就使用软件模拟的IOMMU(CONFIG_BOUNCE)。内核消息：”PCI-DMA: Using software bounce buffering for IO (SWIOTLB)”
(4)基于IBM Calgary硬件的IOMMU，仅用于IBM pSeries/xSeries系列服务器。内核消息：”PCI-DMA: Using Calgary IOMMU”

[IOMMU]
iommu={off,force,noforce,soft}
通用IOMMU设置：
off 彻底关闭IOMMU功能
force 强制使用硬件IOMMU，即使硬件可能有缺陷(例如VIA芯片组)或者根本没有必要这样做(例如内存不足3G)。
noforce(默认) 在内存不足3G的机器上，不使用硬件IOMMU，因为根本没有必要。
soft(Intel平台的默认值) 使用通过软件模拟的IOMMU(SWIOTLB)，同时禁止使用硬件IOMMU(即使存在)。
[IOMMU]
iommu=[SIZE][,allowed][,fullflush|nofullflush][,leak[=NUM]][,memaper[=N]|noaperture][,noagp][,merge|nomerge][,forcesac][,panic][,allowdac|nodac][,calgary]
仅适用于硬件IOMMU(GART与Calgary)的设置：
SIZE 重映射区域的大小，单位是字节。
allowed 含义与”force”相同，即使硬件可能有缺陷(例如VIA芯片组)也强制使用硬件IOMMU
fullflush(默认) 每次分配时都刷新IOMMU
nofullflush 不刷新IOMMU
leak=NUM 开启IOMMU泄漏跟踪(CONFIG_IOMMU_LEAK)，NUM是的泄漏页数(默认值是20)。
memaper=N 在RAM中分配的固有窗口(own aperture)的大小，算法是 2N*32MB，N的默认值是”1”，也就是64MB。
noaperture 禁止IOMMU使用AGP的”aperture”。
noagp 不初始化AGP驱动，使用完全的”aperture”。
merge 强制”scatter-gather”合并，隐含了”force”，这是一个实验性选项。
nomerge 禁止”scatter-gather”合并
forcesac 对于少于40位的掩码强制使用单地址周期(single-address cycle)，这是一个实验性选项。
panic 当IOMMU益处时，允许panic
allowdac 将32位PCI地址用两个时钟周期推入64位地址，这就是DAC的作用。
nodac 禁用DAC，也就是所有4GB以上的DMA将强制通过IOMMU(硬件的或模拟的)
calgary 使用IBM Calgary IOMMU
swiotlb=页数[,force]
仅适用于软件IOMMU(CONFIG_BOUNCE)的设置：
页数为”IO bounce buffer”预先保留的页数，每个页的大小是128K
force 强制所有IO都透过软件IOMMU
[AMD-IOMMU]
amd_iommu={fullflush|off|force_isolation}
向AMD IOMMU驱动(CONFIG_AMD_IOMMU)传递选项
fullflush 表示当IO/TLB项被取消映射的时候立即刷新IO/TLB项(严格模式，速度较慢)，否则将仅在IO/TLB项被重用之前进行刷新(宽松模式，速度更快)
off 表示彻底禁用AMD IOMMU功能
force_isolation 表示为所有设备强制启用IOMMU隔离(映射)，这样IOMMU驱动就不再需要自己去发起隔离请求。注意：此选项不会覆盖”iommu=pt”
[Intel-IOMMU]
intel_iommu={on,off,igfx_off,forcedac,strict,sp_off}
Intel-IOMMU驱动(CONFIG_INTEL_IOMMU)的主要功能就是DMA重映射，该选项用于设置其特性。
on 开启Intel-IOMMU驱动
off 关闭Intel-IOMMU驱动
igfx_off 关闭Intel集成显卡的DMA重映射功能(默认值为开启)
forcedac 强制PCI设备使用DAC，而禁止进行地址转换(默认值为允许)
strict 禁止批量刷写IOTLB(默认值为允许)
sp_off 关闭super page支持(默认值为开启)
[Intel-IOMMU]
intremap={on,off,nosid,no_x2apic_optout}
设置中断重映射功能：
on(默认值)开启中断重映射
off 关闭中断重映射
nosid 重映射时不对SID(Source ID)做检查
no_x2apic_optout 无视BIOS的设置，强制禁用x2APIC特性，主要用于解决某些对x2APIC支持有缺陷的BIOS导致的故障
虚拟化
[PV_OPS]
noreplace-paravirt
禁止使用内核通用的半虚拟化接口paravirt_ops，主要用于解决某些在Virtual PC上安装或运行Linux的故障。
[VMMIO]
virtio_mmio.device=size@baseaddr:irq[:id]
实例化virtio-mmio设备(CONFIG_VIRTIO_MMIO)。可以多次使用以实例化多个设备。
size 大小(可以使用K,M,G后缀)
baseaddr 物理基准地址(physical base address)
irq 中断号(将会被传递给request_irq())
id(可选) platform设备号(device id)
例子：virtio_mmio.device=1K@0x100b0000:48:7
[KVM]
kvm.ignore_msrs={0|1}
是否忽略客户机对未经处理的MSR(unhandled MSR)的访问。”0”(默认值)表示不忽略但是会注入#GP；”1”表示忽略。
[KVM]
kvm.mmu_audit={0|1}
是否允许在运行时对KVM MMU进行审计。”0”(默认值)表示禁止审计；”1”表示允许审计。
[KVM,AMD]
kvm-amd.nested={0|1}
是否允许嵌套虚拟化(在虚拟机内再创建虚拟机)。”0”表示禁止嵌套；”1”(默认值)表示允许嵌套。
[KVM,AMD]
kvm-amd.npt={0|1}
是否允许客户机使用嵌套页表(Nested Page Table)。”0”表示禁止使用；”1”(默认值)表示允许使用。
[KVM,Intel]
kvm-intel.ept={0|1}
是否允许客户机使用扩展页表(Extended Page Table)。”0”表示禁止使用；”1”(默认值)表示允许使用。
[KVM,Intel]
kvm-intel.emulate_invalid_guest_state={0|1}
是否允许仿真无效的客户机状态。”0”(默认值)表示禁止仿真；”1”表示允许仿真。
[KVM,Intel]
kvm-intel.flexpriority={0|1}
是否允许使用FlexPriority技术(TPR[Task Priority Register] shadow)。”0”表示禁止使用；”1”(默认值)表示允许使用。
[KVM,Intel]
kvm-intel.nested={0|1}
是否允许VMX嵌套(nVMX)。”0”(默认值)表示禁止；”1”表示允许。
[KVM,Intel]
kvm-intel.unrestricted_guest={0|1}
是否允许使用”unrestricted guest”技术。”0”表示禁止使用；”1”(默认值)表示允许使用。
[KVM,Intel]
kvm-intel.vpid={0|1}
是否允许使用”Virtual Processor Identification”(tagged TLB)技术。”0”表示禁止使用；”1”(默认值)表示允许使用。
内存
[KNL,BOOT]
mem=nn[KMG]
强制指定内核使用多少数量的内存。仅在你想限定内存使用量时，才需要指定这个选项。同时为了避免PCI设备使用指定范围之外的内存，你还应该配合”memmap=”一起使用。
[KNL]
memmap=exactmap
表示将要使用随后的”memmap=…”等选项进行精确的E820内存映射(因为有时候E820报告的并不准确)，同时禁止内核进行任何自动的探测。比如对于一个4G内存的机器可能是：”memmap=exactmap memmap=640K@0 memmap=4095M@1M”。
[KNL]
memmap=nn[KMG]@ss[KMG]
强制只使用从ss开始的nn长度的特定内存区域。可以多次使用以指定多个区域。
[KNL,ACPI]
memmap=nn[KMG]#ss[KMG]
强制将从ss开始的nn长度的特定内存区域标记为ACPI数据。
[KNL,ACPI]
memmap=nn[KMG]$ss[KMG]
强制保留(不使用)从ss开始的nn长度的特定内存区域。
[KNL,BUGS]
reserve=起点,长度[,起点,长度]…
禁止设备驱动程序自动探测某些iomem区域，因为某些设计不良的硬件会导致自动探测失败或出错。此外，还可以用于人为禁止内核初始化某些端口上的设备。
内核会将此处指定的iomem区域标记为”reserved”(意为”已经在此处找到设备”)，从而将该区域保留。
因为设备驱动不应该去侦测标记为”reserved”的区域，除非另一个启动选项明确地指示它这样做，所以此选项经常和其它启动选项一起使用：
用”reserve=”保留一段区域禁止所有其他驱动的探测，同时再明确指定一个驱动去检测被保留的区域。例如：
reserve=0x300,32 blah=0x300
的意思是：除了允许”blah”驱动探测 0x300 之外，禁止任何其他驱动探测 0x300-0x31f 区域。
绝大部份的机器都不需要此选项。只有真正有缺陷的硬件或特殊情况才会需要使用它。
[注意]每个”reserve=”选项最多可以指定4个保留区域，如果你有异常复杂的需求，可以使用多重”reserve=”来指定。
reservelow=nn[K]
设置为BIOS保留的底端地址空间数量。
memory_corruption_check={0|1}
是否开启低位内存脏数据检查(CONFIG_X86_CHECK_BIOS_CORRUPTION)。某些有bug的BIOS经常会在执行系统休眠/唤醒之类动作的时候，破坏内存中前64k的内容。如果始终检查到错误,那么就应该通过”memmap=”选项来避免使用这段内存。
memory_corruption_check_size=字节数
低位内存脏数据检查(CONFIG_X86_CHECK_BIOS_CORRUPTION)的内存范围。默认值是”64K”，表示”0-64K”这个内存范围。
memory_corruption_check_period=秒数
低位内存脏数据检查(CONFIG_X86_CHECK_BIOS_CORRUPTION)的周期。默认值是60秒。设为”0”则表示禁止这种周期性的检查。
[KNL,BOOT]
vmalloc=nn[KMG]
强制指定vmalloc区域的大小。可用于增加vmalloc区域的最小尺寸(x86默认128MB)，也可以用于减少vmalloc的大小，增加更多的空间用于直接映射内核RAM。
[SLUB]
slub_min_order=整数
slub_max_order=整数
SLUB页块最小与最大order数(默认值分别是”0”与”3”)，当然slub_min_order必须小于slub_max_order。每一个slab需要2order个物理页框。过高的值可能会导致内存溢出错误。详见Documentation/vm/slub.txt
[SLUB]
slub_min_objects=整数
每个slab的最小object总数目(默认值是”4”)。详见Documentation/vm/slub.txt
[SLUB]
slub_nomerge
禁止合并大小相近的多个slab，主要用于调试目的。
[KNL]
dhash_entries=正整数
设置内核目录项缓存中哈希表默认项数。仅供内核专家使用。
[KNL]
ihash_entries=正整数
内核会在内存中缓存一定数量的inode结构来加速文件访问，每个inode对应一个文件(不同于文件系统中的inode概念)，包含文件访问权限/属主/组/大小/生成时间/访问时间/最后修改时间等信息。这些inode保存在一个哈希表中。
这个值用于指定这个哈希表的最大项数。你可以根据自己硬盘上可能被访问的文件数量对默认值进行调整(注意需要考虑哈希值的碰撞)。仅供内核专家使用。
[KNL]
transparent_hugepage={always|madvise|never}
设置透明大内存页(CONFIG_TRANSPARENT_HUGEPAGE)的默认用法：
always 表示总是对所有应用程序启用透明大内存页支持
madvise 表示仅对明确要求该特性的程序启用
never 表示彻底禁用。
其默认值由内核的编译时设置决定。详见”Documentation/vm/transhuge.txt”文档。
[HW]
default_hugepagesz={2M|1G}
默认的HugeTLB页大小。若未指定，那么其默认值就是CPU自身的默认值。
大多数现代计算机体系结构提供对多页面大小的支持，比如X86_64支持4K和2M(要求CPU带有”pse”标记)以及1G(要求CPU带有”pdpe1gb”标记)。
因此Linux将物理内存划分成许多固定大小的页面(默认为4K)，每个页对应一个page结构，这些结构组成一个mem_map[]数组。TLB(Translation Lookaside Buffer)是虚拟地址到物理地址的翻译缓冲区，这种缓冲区在处理器上是很宝贵的，操作系统总是尝试将有限的TLB资源发挥到极致。特别是能够轻松获得若干G内存的时候(大于4G)，这种优化就显得尤为关键。而HugeTLB特性则允许将某些页的尺寸增大到2MB或1GB，从而大大减小TLB的尺寸，提高缓冲区的命中率，进而提升内存性能。
[HW]
hugepagesz={2M|1G}
指定HugeTLB页的大小，通常与”hugepages=”联合使用(可使用多次)，为不同尺寸的大页分别预留不同的数量。
例如：hugepagesz=2M hugepages=128 hugepagesz=1G hugepages=8
注意：1GB的大页只能在命令行上使用”hugepages=”预先分配，且分配之后不可在运行时释放。
[HW]
hugepages=正整数
在启动时分配的HugeTLB页数量，仅在内核开启了CONFIG_HUGETLBFS之后有效。
gbpages
nogbpages
是否允许内核页表对大小为1GB的Hugepages进行直接映射(CONFIG_DIRECT_GBPAGES)。当”CONFIG_DIRECT_GBPAGES=y”时，默认值是”gbpages”。
vdso={0|1|2}
vdso=0 禁用VDSO(Virtual Dynamic Shared Object)映射
vdso=1 启用VDSO(Virtual Dynamic Shared Object)映射，这是”CONFIG_COMPAT_VDSO=n”时的默认值。
vdso=2 将VDSO(Virtual Dynamic Shared Object)映射到旧式的确定性地址，这是”CONFIG_COMPAT_VDSO=y”时的默认值。
vdso32={0|1|2}
vdso32=0 禁用32位VDSO(Virtual Dynamic Shared Object)映射
vdso32=1 启用32位VDSO(Virtual Dynamic Shared Object)映射，这是”CONFIG_COMPAT_VDSO=n”时的默认值。
vdso32=2 将32位VDSO(Virtual Dynamic Shared Object)映射到旧式的确定性地址，这是”CONFIG_COMPAT_VDSO=y”时的默认值。
MTRR与PAT
enable_mtrr_cleanup
disable_mtrr_cleanup
开启/关闭MTRR cleanup(CONFIG_MTRR_SANITIZER)特性。
mtrr_chunk_size=nn[KMG]
用于”MTRR cleanup”(CONFIG_MTRR_SANITIZER)功能，设置允许的最大连续块尺寸(也就是uncacheable项)。
mtrr_gran_size=nn[KMG]
用于”MTRR cleanup”(CONFIG_MTRR_SANITIZER)功能，设置MTRR块的粒度(每块的大小)。默认值是”1”。较大的值可以防止小的对齐耗尽MTRR。
mtrr_spare_reg_nr=N
用于”MTRR cleanup”(CONFIG_MTRR_SANITIZER)功能，设置备用MTRR项的编号。也就是告诉内核reg0N可以被清理或改写(参见”/proc/mtrr”文件)，默认值是”1”。
nopat
禁用PAT支持(CONFIG_X86_PAT)。主要用于解决某PAT故障导致的无法正常启动或者显卡驱动不能正常工作的问题。
图形与显示
[AGP]
agp={off|try_unsupported}
off 表示关闭内核的AGP(CONFIG_AGP)支持；
try_unsupported 表示尝试驱动那些不受支持的芯片(可能会导致系统崩溃或数据错误)
[HW,DRM]
gamma=浮点数
设置显示器的Gamma值。
video.brightness_switch_enabled={0|1}
[背景知识]如果ACPI video.ko驱动(CONFIG_ACPI_VIDEO)能够收到用户通过键盘热键触发的ACPI事件(这需要固件的帮助)，video.ko将会把收到的ACPI事件转化为一个”key”类型输入事件，并通过其创建的输入设备发送到用户空间，这样用户空间的工具就可以通过sysfs接口去修改显示器的亮度。这是传统的做法。
但是从v3.13内核开始，新增了此选项，并且其默认值为”1”，表示video.ko驱动除了向用户空间传递事件之外，还要自己在内核层去改变显示器的亮度。
如果设为”0”则表示不在内核层改变显示器的亮度，依然留给用户层的工具去通过sysfs接口修改。
详见Documentation/acpi/video_extension.txt文档。
[DRM]
i915.invert_brightness={-1|0|1}
反转显示器背光亮度控制变量(brightness)的含义。
通常情况下，brightness的值为”0”表示关闭背光(全黑)，随着brightness的值增大到最大值，表示最大亮度。
但是通过这个选项，可以反转brightness的含义，让”0”表示最亮，而随着brightness值的递增亮度逐渐降低，直到最大值关闭背光(全黑)。
-1 表示绝不反转其含义，也就是”0”始终表示关闭，最大值始终表示最亮。
0 表示内核不对此变量的含义加以干预，使用机器自身的默认含义。
1 表示强制反转其含义，也就是”0”始终表示最亮，最大值始终表示关闭。
此选项常用于解决某些使用Intel集显/核显(CONFIG_DRM_I915)的电脑在启动时黑屏的问题。
[FB]
logo.nologo
在系统启动时不显示Linux的企鹅标志图(企鹅数=CPU核心数)
网络
[IPV6]
ipv6.disable={0|1}
ipv6.disable_ipv6={0|1}
是否在所有网络接口上禁用IPv6支持：0(默认值)表示在所有网络接口上开启IPv6支持；1 表示在所有网络接口上关闭IPv6支持。建议使用”ipv6.disable=1”(彻底禁用ipv6内核模块)
[IPV6]
ipv6.autoconf={0|1}
是否在所有网络接口上开启IPv6地址自动配置。
0 表示禁止自动配置，这样就只有IPv6回环地址(::1)和”link-local”地址会被自动添加到网络接口上。如果你不想从路由器公告(Router Advertisements)中的地址前缀自动生成IPv6地址，可以使用此项。
1(默认值) 表示在所有网络接口上开启IPv6地址自动配置
[IP_PNP]
ip=[client-ip:server-ip:gateway-ip:netmask:hostname:device:]autoconf[:dns0-ip:dns1-ip]
此选项告诉内核如何在启动过程中配置网卡的IP地址及路由表(而不是在启动完成后依赖用户空间的脚本去配置)。仅在内核已启用了CONFIG_IP_PNP的前提下有效。通常用于需要将NFS挂载为根文件系统(CONFIG_ROOT_NFS)的场合。
此选项有以下4种用法：
(1)ip={off|none}或者没有使用”ip”选项。这是默认值，表示彻底关闭自动配置功能。
(2)ip={dhcp|bootp|rarp|any} 表示内核全自动完成所有配置工作(也就是将所有字段设为各自的默认值)。各选项的含义参见下面对autoconf字段的说明。
(3)将autoconf字段设为{off|none}之一，并明确指定所有其它字段。表示全静态配置，也就是手动指定各字段的值(禁止自动检测)。
(4)将autoconf字段设为{dhcp|bootp|rarp|any}之一，并明将部分字段留空(字段分割符”:”不能省略)。表示半自动配置，也就是将留空的字段设为各自的默认值(自动检测)，而将手动指定的字段设为指定的值(禁止自动检测)。
各字段的说明如下：
client-ip NFS客户端IP地址。若留空，其默认值将通过自动检测获取。
server-ip NFS服务器IP地址。该字段仅在需要将NFS挂载为根文件系统(root=/dev/nfs)的时候才是必须的。如果使用RARP检测client-ip并且此字段非空，那么将仅接受指定服务器的应答。若留空，其默认值将通过自动检测获取(也就是自动配置服务器的地址)。
gateway-ip 网关的IP地址。仅在NFS服务器位于不同子网的时候才是必须的。若留空，其默认值将通过自动检测获取。
netmask 子网掩码。若留空，其默认值将通过自动检测获取(根据client-ip所属的地址类型[A/B/C之类])。
hostname NFS客户端的主机名。若留空，其默认值将通过自动检测获取(client-ip的ASCII表示形式)。
device 使用的网卡。若留空，其默认值将通过自动检测获取：若有多个网卡，那么将通过所有网卡同时发送自动配置请求包，并将最先接收到应答的网卡设为默认网卡。
autoconf 自动配置方式。{off|none}表示不使用自动配置(必须手动指定个字段的值)；{dhcp|bootp|rarp}分别表示只使用DHCP/BOOTP/RARP协议进行自动配置(当然内核必须支持指定的协议)；”any”表示使用内核支持的所有自动配置协议(同时发送不同协议的自动配置请求包，以最先接收到的应答为准)。 dns0-ip 主DNS服务器IP地址。若留空，其默认值将通过自动检测获取。其值将通过 /proc/net/pnp 导出到用户空间。在嵌入式系统上，/etc/resolv.conf 常常是到 /proc/net/pnp 的软连接。
dns1-ip 辅DNS服务器IP地址。其它同上。
[KNL,NET]
rhash_entries=正整数
设置内核路由缓冲区哈希表的大小，仅供内核网络专家使用。
[KNL,NET]
thash_entries=正整数
设置内核允许使用的TCP链接哈希表的大小。
[KNL,NET]
uhash_entries=正整数
设置内核允许使用的UDP/UDP-Lite链接哈希表的大小。
[NETFILTER]
nf_conntrack.acct={0|1}
是否允许对连接追踪(CONFIG_NF_CONNTRACK)流进行记账。”0”(默认值)表示禁止记账，”1”表示允许记账。
块设备与磁盘阵列
blkdevparts=
手动设置块设备分区表(而不是从块设备读取)，主要用于嵌入式环境或分区表损坏恢复的场合。详情参见Documentation/block/cmdline-partition.txt文档
[EFI]
gpt
强制将拥有有效GPT签名但同时又包含无效”保护MBR”的磁盘当做GPT格式的磁盘。
[IOSCHED]
elevator={“bfq”|”cfq”|”deadline”|”noop”}
指定默认的IO调度器
[LOOP]
loop.max_loop=[0-256]
在系统启动时无条件的预先创建的回环(loopback)设备数，默认值由CONFIG_BLK_DEV_LOOP_MIN_COUNT决定。如果你使用util-linux-2.21以上版本,建议设为”0”(loop设备将通过/dev/loop-control动态创建)。
[HW,RAID]
raid={autodetect|noautodetect,partitionable|part}
明确向内核的MD驱动(CONFIG_BLK_DEV_MD)传递RAID配置属性
autodetect|noautodetect 表示内核是否应该自动检测RAID模式(CONFIG_MD_AUTODETECT)。如果关闭了自动检测，那么必须使用”md=”明确告诉内核RAID模式及配置。
partitionable|part 两者含义相同，都表示内核应该将组装之后得到的RAID设备视为”可分区”设备。
[HW,RAID]
md=N,dev0,dev1,…
明确向内核的MD驱动(CONFIG_BLK_DEV_MD)传递RAID配置信息，并将列出的设备(dev0,dev1,…)组装为 /dev/mdN 阵列(表现为一个块设备文件)。
建议仅在根文件系统位于RAID上的情况下使用这个选项。其他非根文件系统的RAID最好在系统启动后(挂载完根之后)再组装。
N 可以是 0,1,2,3,…,255 中的任意一个整数，表示被创建的md设备的编号，例如：
md=2,/dev/sda,/dev/sdb,/dev/sdc,/dev/sdd
表示将 /dev/sda,/dev/sdb,/dev/sdc,/dev/sdd 组装成 /dev/md2 块设备(至于RAID级别之类的信息则由存储在超级块中的元数据提供)。
[提示]2.6.28之前的老版本内核对创建的阵列还有所谓”可分区阵列”和”不可分区阵列”的区别，具体表现是：如果在N前加上字母”d”，则表示所创建的阵列是一个可分区阵列，否则就是不可分区阵列。不过现在已经没有这个区别了，所有创建的阵列都是可分区的，因此”d”也就没有存在的必要了。
根文件系统
[KNL]
root=字符串
指定根文件系统的所在位置。通常这是一个必须明确设置的选项。
“字符串”可以使用如下几种形式：
XXxx 一个16进制数，其中”XX”是主设备号，”xx”是次设备号。例如”/dev/sdc15”(主设备号是”8”，次设备号是”47”)，可以表示成”082F”。
/dev/nfs 表示使用由nfsroot选项指定的NFS磁盘，仅在根文件系统位于NFS文件系统上的时候才使用。
/dev/disk 表示一块完整的无分区块设备。比如：/dev/md0 /dev/loop0 /dev/sdb /dev/mmcblk0
/dev/diskN 表示disk磁盘的第N(十进制)个分区。这是最常见的用法，比如：/dev/sda2 /dev/ubda1 /dev/xvda13
/dev/diskpN 含义与上面的一样，也表示disk磁盘的第N(十进制)个分区，但是用于disk本身以数字结尾的情况(避免混淆)。比如：/dev/md0p3 /dev/emd/0p2 /dev/mmcblk0p1
PARTUUID=00112233-4455-6677-8899-AABBCCDDEEFF 仅用于EFI/GPT格式的磁盘，表示分区表中UUID值为”00112233-4455-6677-8899-AABBCCDDEEFF”的分区。[提示]可以使用blkid查看”PARTUUID”。
PARTUUID=SSSSSSSS-PP 仅用于传统的MSDOS分区表。”SSSSSSSS”是用16进制表示的32位”NT disk signature”，”PP”是用16进制表示的分区号。比如：PARTUUID=97531ACF-02 可能相当于 /dev/sda2
PARTUUID=XXXX/PARTNROFF=N 表示以UUID=”XXXX”的分区为基准，偏移N个分区。假定 /dev/sdb5 的UUID=XXXX，那么 PARTUUID=XXXX/PARTNROFF=3 就表示 /dev/sdb8 ，而 PARTUUID=XXXX/PARTNROFF=-3 则表示 /dev/sdb2
major:minor 由一对十进制数组成，其中major是主设备号，minor是次设备号。例如”/dev/sdc15”(主设备号是”8”，次设备号是”47”)，可以表示成”8:47”。
LABEL=??? 表示卷标为”???”的分区。比如：root=LABEL=/ 。不过这种格式并不被内核直接支持，仅是发行版通过initramfs中的脚本添加了这种格式的支持而已。所以并不通用。
[KNL]
rootfstype=文件系统类型
指定根文件系统的类型。例如：”xfs”或”ext4”之类
[KNL]
rootflags=挂载选项
设置根文件系统的挂载选项，比如”noatime,ro”。各种不同的文件系统所能使用的选项各不相同，可以参考 mount 程序的选项。
[KNL]
ro
rw
以只读(ro)/读写(rw)模式挂载根文件系统
[KNL]
rootdelay=秒数
在挂载根文件系统前延迟多少秒，主要用于等待那些反应速度较慢的异步检测的设备就绪(例如USB/MMC/FireWire)。
[KNL]
rootwait
在根文件系统就绪之前无限等待。主要用于等待那些反应速度较慢的异步检测的设备就绪(例如USB/MMC/FireWire)。
系统初始化(init)
[KNL]
init=文件全路径
指定内核挂载根文件系统后运行的第一个用户空间程序的绝对路径。默认为”/sbin/init”。
[KNL]
rdinit=全路径
设置从initramfs中运行的第一个用户空间程序的绝对路径，默认为”/init”。
[注意]一旦使用了initramfs并且成功的运行了其中的”/init”，所有”init”以及与根文件系统相关的选项(包括”nfsroot”)对内核而言都将失效。
initramfs中的脚本必须自己分析各个内核引导选项(/proc/cmdline)并完成根文件系统的挂载与切换，当然也包括启动真正的”init”进程。
[KNL]
S
以单用户模式运行”init”。注意，这不是一个真正的内核选项，只是给initramfs中的脚本用的。所以并不通用。
NFS(网络文件系统)
[NFS]
lockd.nlm_grace_period=秒数
为NFS锁管理器指定宽限时间，单位是秒。取值范围在[0-240]？
[NFS]
lockd.nlm_tcpport=端口号
为NFS锁管理器指定TCP端口
[NFS]
lockd.nlm_timeout=秒数
为NFS锁管理器指定默认超时时间，单位是秒。默认值是10秒。取值范围在[3-20]？
[NFS]
lockd.nlm_udpport=端口号
为NFS锁管理器指定UDP端口
[NFS]
nfsroot=[server-ip:]root-dir[,nfs-options]
指定NFS根文件系统的位置。如果没有设置此选项，那么将使用”/tftpboot/本机IP”(默认值)作为根文件系统，并使用默认的NFS挂载选项。
server-ip NFS服务器IP地址。其默认值是”ip”选项中的server-ip字段的值。
root-dir 作为根文件系统挂载的NFS服务器的目录。如果其中包含”%s”，那么将会被替换为本机IP地址的ASCII表示形式。
nfs-options 标准的NFS文件系统挂载选项(例如”ro”)，多个选项之间使用逗号分隔。下面是默认使用的值：
port = 由NFS服务器的portmap守护进程给出
rsize = 4096
wsize = 4096
timeo = 7
retrans = 3
acregmin = 3
acregmax = 60
acdirmin = 30
acdirmax = 60
flags = hard,nointr,noposix,cto,ac
[NFS]
nfsrootdebug
在启动过程中，在内核日志里显示详细的NFS相关的调试信息(挂载选项、服务器IP地址、根文件系统路径等)，以方便调试和故障诊断。
[NFS]
nfs.callback_tcpport=端口号
设置NFSv4回复通道(callback channel)监听的TCP端口
[NFS]
nfs.cache_getent=路径
设置用于更新NFS客户端缓存项的程序的路径。默认值是”/sbin/nfs_cache_getent”。
[NFS]
nfs.cache_getent_timeout=秒数
尝试更新缓存项超时秒数，超过指定时间仍未更新成功则视为更新失败。默认值是15秒。
[NFS]
nfs.idmap_cache_timeout=秒数
设置idmapper缓存项的最大寿命，单位是秒。
[NFS]
nfs.enable_ino64={0|1}
是否开启64位inode号。”0”表示NFS客户端将会为readdir()与stat()系统调用模拟一个32位inode号(而不是返回真实的64位inode号)。”1”(默认值)表示返回真实的64位inode号。
[NFSv4.1]
nfs.max_session_slots=正整数
设置NFS客户端尝试和服务器端协商的最大会话slot数。这也同时限定了客户端能够像服务器端发送的最大并发RPC请求数。默认值是64。将此值设置为比max_tcp_slot_table_limit大是没有价值的。
[NFSv4]
nfs.nfs4_unique_id=字符串
指定NFSv4客户端插入到nfs_client_id4字符串中的额外的唯一标识字符串。这通常是一个在系统安装时自动生成的UUID。
[NFSv4.1]
nfs.send_implementation_id={0|1}
是否在exchange_id请求中包含客户端实现识别信息(implementation identification information)。”0”表示不发送，默认值”1”表示发送。
[NFSv4]
nfs.recover_lost_locks={0|1}
v3.12新增。是否尝试恢复服务器上由于租约超时而丢失的锁。需要注意的是，这样做很有可能会导致数据错误，因为无法保证超时后的锁文件未被更改。默认值”0”表示不做这样的尝试，而”1”则表示尝试恢复(这是v3.11及之前内核的默认行为)。
[NFSv4]
nfs.nfs4_disable_idmapping={0|1}
默认值”1”表示在使用了”sec=sys”挂载选项的情况下，RPC身份认证和NFS操作都使用数字化的uid/gid。这会导致idmapping被禁用，从而让NFSv2/v3向NFSv4的迁移变得更加容易。客户端将会自动检测不支持此种操作模式的服务器，并回退到使用idmapper的模式。”0”表示禁止这种行为。
[NFSv4]
nfsd.nfs4_disable_idmapping={0|1}
默认值”1”表示NFSv4服务器与那些使用auth_sys的客户端之间只使用数字化的uid/gid(包括发送与接收)，从而让NFSv2/v3向NFSv4的迁移变得更加容易。”0”表示禁止这种行为。
模块功能
nomodule
禁用内核模块加载功能(CONFIG_MODULES)。
[KNL]
module.sig_enforce
强制内核在加载模块时检查模块签名(CONFIG_MODULE_SIG)，并且只接受具有合法签名的模块。如果内核开启了CONFIG_MODULE_SIG_FORCE，那么无论是否使用此选项，都将强制检查模块的签名。
安全
no_file_caps
要求内核无视文件的权限。这样，执行文件的唯一途径就只有：由root去执行或者setuid root
noexec={on|off}
noexec32={on|off}
是否允许将某部分内存映射为”禁止执行”，这是一种防止数据缓冲区溢出攻击的保护措施(也就是WinXP SP2曾经大力宣传的数据执行保护功能)，建议保持默认值”on”。
[说明]noexec对32bit代码以及64bit代码都有约束力，而noexec32只针对32bit代码。
nosmap
禁用SMAP(CONFIG_X86_SMAP)支持。SMAP是Intel从Haswell微架构开始引入的一种新特征，用途是禁止内核因为自身错误意外访问用户空间的数据，以避免一些内核漏洞所导致的安全隐患。
nosmep
禁用SMEP(Supervisor Mode Execution Prevention)支持。SMEP与SMAP类似，也是Intel从Haswell微架构开始引入的一种新特征，用途是禁止内核因为自身错误意外执行用户空间的代码。以避免一些内核漏洞所导致的安全隐患。
nordrand
即使CPU支持(CONFIG_ARCH_RANDOM)，也禁止内核使用RDRAND指令(不过用户空间依然可以使用此指令)。由于很多人怀疑RDRAND指令所依赖的硬件随机数生成器所使用的加密标准(NIST SP800-90)被NSA植入了后门，所以提供了该选项以禁用它，不过大神Torvalds不以为然。
vsyscall={emulate|native|none}
控制vsyscall系统调用(调用固定的地址0xffffffffff600x00)的行为。大多数静态链接的可执行程序和老旧的Glibc会使用这个系统调用。因为vsyscall始终位于固定的地址，所以很容易被攻击者利用。
emulate(默认值) 捕捉vsyscalls系统调用，并对其进行安全的模拟。这是比较安全的选项，但效率并不最高。
native 将vsyscall系统调用直接转变成本地syscall指令，这比模拟方式效率稍微高一些。但是很容易被攻击。
none 完全禁用vsyscall系统调用。这是最安全的选项，但是有可能会导致系统工作异常。
[EVM]
evm=”fix”
不管当前的完整性状态如何，都允许更新”security.evm”。
[SECURITY]
security={selinux|smack|tomoyo|apparmor|yama}
选择启用的安全模块。仅在内核同时开启了多个安全模块的情况下才有意义。
[SELINUX]
selinux={0|1}
是否在启动时就开启SELinux功能(CONFIG_SECURITY_SELINUX_BOOTPARAM)：”0”表示关闭，”1”表示开启。
默认值由内核在编译时确定(CONFIG_SECURITY_SELINUX_BOOTPARAM_VALUE)。
即使设为”1”，随后也可以通过 /selinux/disable 在加载安全策略前禁止SELinux功能。
[SELINUX]
enforcing={0|1}
是否在启动时强制启用SELinux规则。
“0”(默认值)表示仅仅做记录违规操作日志而不真正拒绝违规操作；
“1”表示真正拒绝违规操作并做记录违规操作日志。
该选项还可以在运行时通过 /selinux/enforce 进行修改
[SELINUX]
checkreqprot={0|1}
设置”checkreqprot”标记的初始值。
“0”表示由内核强制执行检查保护(包括其中隐含的所有执行保护)
“1”表示由应用程序自己主动请求执行检查保护
默认值由内核在编译时确定，也可以在运行时通过 /selinux/checkreqprot 修改
[APPARMOR]
apparmor={0|1}
是否在启动时就开启AppArmor功能(CONFIG_SECURITY_APPARMOR)：”0”表示关闭，”1”表示开启。
默认值由内核在编译时确定(CONFIG_SECURITY_APPARMOR_BOOTPARAM_VALUE)。
多CPU与CPU间调度
SMP(对称多处理器)系统中，所有的CPU共享全部资源(总线，内存，I/O等)，最大的特点就是所有资源共享，多个CPU之间没有区别。NUMA(非一致内存访问)的基本特征是具有多个CPU节点，每个CPU节点由多个CPU组成，并且具有独立的本地内存与I/O槽口等。因此，虽然每个CPU都可以访问整个系统的内存，但是访问本地节点内存的速度远远高于访问其它节点的内存。详见《SMP/NUMA/MPP体系结构对比》

[SMP]
nosmp
强制禁用SMP，这是个已被反对使用的旧选项
[SMP]
maxcpus=整数
最大允许使用的CPU核心数。”0”表示禁用SMP特性(等价于已被反对使用的旧”nosmp”选项)，同时也禁用IO APIC；正整数”n”表示最大允许使用n个CPU核心。
[SMP]
nr_cpus=正整数
允许SMP内核支持的最大CPU核心数(等价于CONFIG_NR_CPUS)。配合CPU热插拔(CONFIG_HOTPLUG_CPU)，可在运行时增加CPU数目。
cpu0_hotplug
强制允许CPU0(boot CPU)热插拔(CONFIG_BOOTPARAM_HOTPLUG_CPU0)。下列特性必须依赖于cpu0，所此选项应谨慎使用：
(1)从休眠状态(S3,S4)唤醒以及从运行状态进入休眠状态
(2)PIC中断，也就是某些情况下，关机和重启也会依赖于cpu0
[SMP]
additional_cpus=整数
最大允许热插拔的CPU数量。默认值由BIOS决定。相见Documentation/x86/x86_64/cpu-hotplug-spec
[NUMA]
numa={off|noacpi}
off 关闭NUMA支持，也就是让所有内存都只属于同一个节点。
noacpi 不为NUMA解析ACPI SRAT表
[KNL]
numa_balancing={enable|disable}
启用/禁用NUMA均衡(CONFIG_NUMA_BALANCING)，其默认值由CONFIG_NUMA_BALANCING_DEFAULT_ENABLED决定
[KNL,BOOT]
numa_zonelist_order={zone|node|default}
设置NUMA的zonelist顺序。这里设置的值还可以在运行中通过sysctl来修改。详见Documentation/sysctl/vm.txt
[KNL,SMP]
isolcpus=CPU编号列表
将列表中的CPU从内核SMP平衡和调度算法中剔除。
[注意]提出后并不是绝对不能再使用该CPU的，操作系统仍然可以强制指定特定的进程使用哪个CPU(可以通过taskset来做到)。
该选项的目的主要是用于实现特定cpu只运行特定进程的目的。
CPU编号从”0”开始计数，列表的表示方法有三种：
numA,numB,…,numN
numA-numN
以及上述两种表示方法的组合：
numA,…,numM-numN
例如：0,3,4-7,9
[KNL,SMP]
relax_domain_level={-1|0|1|2|3|4|5}
设置CPUSET调度域(sched domain)的默认级别。大于此级别的调度域层次将禁用闲时均衡和唤醒均衡，而其余级别的调度域都开启。
-1(默认值) 使用系统的默认值(取决于不同的硬件架构)或者由其他的请求确定，也就是不人为指定默认级别。
0 禁用所有调度域的闲时均衡和唤醒均衡
1 超线程域(siblings)，也就是同一个物理核心内的不同超线程
2 核域(cores)，也就是同一个物理CPU中不同的核心
3 节点域(node)，对于NUMA系统来说就是同一个NUMA节点内，对于non-NUMA系统来说这是整个系统范围
4 节点组域(chunk of node)，仅适用于NUMA系统，表示在一组特定的NUMA节点范围内
5 全系统(system wide)，全部系统范围内
详见Documentation/cgroups/cpusets.txt文档
控制组(Control Group)
Cgroup(CONFIG_CGROUPS)是一种进程管理机制，也是内核的资源分配框架。

[KNL]
cgroup_disable=”控制器名称”
禁用cgroup中特定的控制器名称。目前只支持一个”memory”控制器。
noautogroup
禁止自动创建进程组(CONFIG_SCHED_AUTOGROUP)，服务器环境可以考虑使用此选项。
[KNL]
swapaccount={0|1}
是否统计换入(swap in)内存的资源。”0”表示不统计，”1”表示统计。详见Documentation/cgroups/memory.txt文档。
EFI/UEFI
noefi
禁用EFI支持(CONFIG_EFI)。
[EFI]
add_efi_memmap
将EFI内存映像包括在内核的可用物理内存映像之中
pstore.backend=efivars
将”efivars”(CONFIG_EFI_VARS_PSTORE)用作pstore内存文件系统的后端。
杂项
[IP_VS_FTP]
ports=portA,portB,…
IPVS(IP Virtual Server) FTP帮助模块所使用的端口，最多允许指定8个。默认值是”21”。
io_delay={0x80|0xed|udelay|none}
设置IO延迟方式
0x80(CONFIG_IO_DELAY_0X80) 传统的Linux IO延迟方式,久经考验,也最安全
0xed(CONFIG_IO_DELAY_0XED) 基于0xed端口的IO延迟方式,主要是为了避免和基于0x80端口的主板诊断卡冲突
udelay(CONFIG_IO_DELAY_UDELAY) 使用内核端udelay()函数作为延迟方法(简单的延迟2微秒).可以不占用任何IO端口空间.
none(CONFIG_IO_DELAY_NONE) 不使用任何port-IO延迟机制.只要你的机器不是老古董,这个应该是首选.
[KNL]
reboot=[mode][,type][,force]
指定系统重启的方式：
mode 用于指定重启模式，可以使用如下2种模式之一：warm(热重启[跳过内存检测]), cold(冷重启[检测并重新初始化所有硬件])
type 用于指定重启类型，可以使用如下4种类型之一：bios(为热重启使用CPU reboot vector), acpi(优先使用FADT中的ACPI RESET_REG,若失败再转kbd), kbd(使用键盘控制器冷重启,这是默认值), triple, efi(优先使用EFI提供的reset_system运行时服务,若失败再转kbd)
结尾的”force”表示在重启时不停用其它的CPU，在某些情况下可以让reboot更可靠。
[KNL]
reset_devices
强制驱动程序在初始化底层设备的过程中重置设备
[KNL]
rcu_nocbs=
在”CONFIG_RCU_NOCB_CPU=y”的情况下,指定哪些CPU是No-CB CPU
[KNL]
nodelayacct
禁止在针对每个进程的统计信息中包含进程等候系统资源(cpu,IO同步,内存交换等)所花费的时间，相当于禁用CONFIG_TASK_DELAY_ACCT模块。
[KNL]
sysfs.deprecated={0|1}
为了兼容旧版本的应用程序而保留过时的sysfs特性(CONFIG_SYSFS_DEPRECATED)，其默认值由CONFIG_SYSFS_DEPRECATED_V2确定。

你可能感兴趣的:(linux内核)

C++常见知识掌握 nfgo c++开发语言
1.Linux软件开发、调试与维护内核与系统结构Linux内核是操作系统的核心，负责管理硬件资源，提供系统服务，它是系统软件与硬件之间的桥梁。主要组成部分包括：进程管理：内核通过调度器分配CPU时间给各个进程，实现进程的创建、调度、终止等操作。使用进程描述符（task_struct）来存储进程信息，包括状态（就绪、运行、阻塞等）、优先级、内存映射等。内存管理：包括物理内存和虚拟内存管理。通过页表映
KVM虚拟机源代码分析【转】 xidianjiapei001 #虚拟化技术
1.KVM结构及工作原理1.1KVM结构KVM基本结构有两部分组成。一个是KVMDriver，已经成为Linux内核的一个模块。负责虚拟机的创建，虚拟内存的分配，虚拟CPU寄存器的读写以及虚拟CPU的运行等。另外一个是稍微修改过的Qemu，用于模拟PC硬件的用户空间组件，提供I/O设备模型以及访问外设的途径。KVM基本结构如图1所示。其中KVM加入到标准的Linux内核中，被组织成Linux中标准
Android shell 常用 debug 命令晨春计 Audio debug android linux
目录1、查看版本2、am命令3、pm命令4、dumpsys命令5、sed命令6、log定位查看APK进程号7、log定位使用场景1、查看版本1.1、Android串口终端执行getpropro.build.version.release#获取Android版本uname-a#查看linux内核版本信息uname-r#单独查看内核版本1.2、linux服务器执行lsb_release-a#查看Lin
讲解Linux内核操作系统——进程状态与转换 Linux加油站网络服务器运维
一.进程控制进程控制的主要功能是对系统中的所有进程实施有效的管理，它具有创建新进程、撤销已有进程、实现进程状态转换等功能。在操作系统中，一般把进程控制用的程序段称为原语，原语的特点是执行期间不允许中断，它是一个不可分割的基本单位。1.1创建进程UNIX中进程为树状层次结构，Windows下所有进程没有层次结构允许一个进程创建另一个进程，创建者称为父进程，被创建的进程称为子进程。子进程可以继承父进程
Ubuntu系统入门指南：常用命令详解像风一样自由2020 ubuntu ubuntu linux 运维
Ubuntu系统入门指南：常用命令详解引言Ubuntu是一个基于Linux内核的开源操作系统，由Canonical公司和社区共同开发和维护。它以易用性、稳定性和广泛的软件支持而著称，广泛应用于个人电脑、服务器和云计算环境。对于新手来说，掌握Ubuntu的基本命令行操作可以大大提高工作效率和系统管理能力。Ubuntu通常每六个月发布一个新版本，每两年会推出一个长期支持（LTS）版本，提供五年的安全更
framebuffer帧缓存我相遇拾年缓存
framebuffer:帧缓冲，帧缓存Linux内核为显示提供的一套应用程序接口。（驱动内核支持）framebuffer本质上是一块显示缓存，往显示缓存中写入特定格式的数据就意味着向屏幕输出内容。framebuffer驱动程序控制LCD显示设备，通过映射framebuffer设备到用户空间，应用程序可以直接对显存进行操作，从而控制LCD显示内容framebuffer使用显示屏：800*600（横向
linux查看git log目录,教你玩转Git-查看提交历史郁清叔叔 linux查看git log目录
导读Git是一个开源的分布式版本控制系统，用于敏捷高效地处理任何或小或大的项目。Git是LinusTorvalds为了帮助管理Linux内核开发而开发的一个开放源码的版本控制软件。Git与常用的版本控制工具CVS,Subversion等不同，它采用了分布式版本库的方式，不必服务器端软件支持。在使用Git提交了若干更新之后，又或者克隆了某个项目，想回顾下提交历史，我们可以使用gitlog命令查看。针
Android的内核 setsailgo android runtime
Android的内核是基于Linux的长期支持版本的“Android通用内核(ACK)”。Android作为一个广泛使用的操作系统，其根基在于内核的设计和功能。下面将深入探讨Android内核的各个方面，从其基本结构到与Linux内核的关系，再到内核的版本管理及在设备上的应用：Android内核的基础结构基于Linux的内核：Android内核是构建在Linux长期支持版本之上的，这使得其能够充分
数据结构—内核链表 LEE_C17 数据结构链表 arm开发
一，内核链表内核链表是一种在操作系统内核中广泛使用的数据结构，特别是在Linux内核中。它主要用于高效地管理和遍历内核中的对象，如进程、设备、文件等。内核链表通常基于双向链表或双向循环链表实现，具有以下特点：双向性：每个链表节点都包含指向前一个节点和后一个节点的指针，这使得从任何节点出发都可以方便地遍历整个链表。通用性：内核链表的设计使其能够通用于不同类型的内核对象。通过在结构体中包含一个指向链表
解锁前端新潜能：如何使用 Rust 锈化前端工具链京东零售技术前端 taro 前端 taro
前言近年来，Rust的受欢迎程度不断上升。首先，在操作系统领域，Rust已成为Linux内核官方认可的开发语言之一，Windows也宣布将使用Rust来重写内核，并重写部分驱动程序。此外，国内手机厂商Vivo也宣布使用Rust开发了名为“蓝河”的操作系统。除此之外，Rust在图形渲染、游戏开发、中间件开发、边缘计算、计算安全等领域也是遍地开花，可以说，Rust正在以惊人的速度重塑着各个领域的发展，
io_uring异步IO 天夏123 php 开发语言
io_uring介绍io_uring是一个Linux内核的异步I/O框架，它提供了高性能的异步I/O操作，io_uring的目标是通过减少系统调用和上下文切换的开销来提高I/O操作的性能。在网络编程中，我们通常使用epollIO多路复用来处理网络IO，然而epoll也并不是异步网络IO，仅仅是内核提供了IO复用机制，epoll回调通知的是数据可以读取或者写入了，具体的读写操作仍然需要用户去做，而不
Linux内核以后会分块逐步用Rust重写吗? 纵然间 linux rust 运维
Linux内核已经积累了大量的代码，包括数百万行的C和C++代码。要想重写这些代码需要巨大的人力和时间投入，且存在很高的风险。这些代码已经过长时间的测试和验证，具有很高的稳定性和可靠性。Rust虽然是一种强调安全性和性能的系统编程语言，但其相对于C和C++来说仍然较新，在Linux内核开发领域的应用还相对较少。用Rust重写Linux内核需要开发者具备深厚的Rust编程技能和经验，以及对Linux
深入理解Linux内核：一部开源的探索之旅宋溪普Gale
深入理解Linux内核：一部开源的探索之旅项目介绍linux-insides-ko是一个致力于将原始英文版《linux-insides》翻译成韩语的开源项目，旨在为那些对Linux内核和底层操作机制感兴趣的读者提供深入浅出的教程。这本书详细阐述了Linux内核的工作原理以及其内部结构，无论你是初学者还是经验丰富的开发者，都能从中受益匪浅。项目技术分析该项目以Markdown格式编写，易于阅读且便于
linux启动优化内核裁剪详细说明（2） keep study linux
第一部分Linux内核裁减（1）安装新内核:i)将新内核copy到/usr/src下并解压：#tar-zxvflinux-2.6.38.4.tar.gzii)将名为linux的符号链接删掉,这是旧版本内核的符号链接.#ln-slinux-2.6.38.4linux（2）设置内核.#cd/usr/src/linux#makemrproper-----删除不必要的文件和目录.#makemenuconf
6.11 linux内核管理：内核版本阳光的王小草 linux整理 linux 内核版本
6.11linux内核管理：内核版本cat/proc/versionLinuxversion3.10.0-229.4.2.el7.x86_64([email protected])(gccversion4.8.220140120(RedHat4.8.2-16)(GCC))#1SMPWedMay1310:06:09UTC2015uname-aLinuxjenkins3.1
一篇文章带你读懂 io_uring 的接口与实现 Linux高级开发 Linux服务器开发 linux 运维服务器 epoll accept
io_uring是Linux提供的一个异步I/O接口。io_uring在2019年加入Linux内核，经过了两年的发展，现在已经变得非常强大。本文基于Linux5.12.10介绍io_uring接口。io_uring的实现主要在fs/io_uring.c中。io_uring的用户态APIio_uring的实现仅仅使用了三个syscall：io_uring_setup,io_uring_enter和
【io_uring】简介和使用 ywang_wnlo 存储 liburing io_uring
文章目录简介使用系统调用liburing样例代码流程编译参考资料简介io_uring是Linux在5.1版本引入的一套新的异步IO实现。相比Linux在2.6版本引入的AIO，io_uring性能强很多，接近SPDK[1]，同时支持bufferIOio_uring的作者JensAxboe是Linux内核块层和其他块设备的维护者，同时也是CFQ、Noop、Deadline调度器、blktrace以及
linux内核调度,深入linux内核架构--核心调度器编程幽谷隐士 linux内核调度
内存中保存了每个进程的唯一描述信息，并通过若干结构与其他进程连接起来，那么调度器的核心任务就是高效公平的执行各个进程中的内存代码段。那么一个好的调度器，需要满足哪些条件呢？高效性：应该尽量减小调度器产生的额外开销。公平性：应该尽量保证每个作业都能被执行，也应该保证每个cpu都有均衡的作业。灵活性：可以动态的设置作业的优先级，良好的迁移能力，不同作业具有不同的权利等。隔离性：不让作业之间彼此影响。控
浅谈Docker引擎秦偏执 docker引擎
在Docker首次发布的时候，Docker引擎由两个核心构成，即：LXC和Dockerdaemon。由LXC来基于Linux内核的容器虚拟化技术来提供像NameSpace,Cgruop等基础工具的操作技术；由Daemon来统一负责镜像的管理，容器生命周期的管理，认证等工作。这样做也带来了很多的缺点，首先：LXC是基于Linux的，这对于一个立志与跨平台的项目来说本身就是一个瓶颈；其次，使用一个外部
嵌入式设备上SystemTap调试工具使用塵觴葉杂谈 linux bpf
SystemTap调试工具简介SystemTap调试器常用于Linux内核的动态调试，不过该工具集也可用于应用的跟踪调试。随着Linux内核及其应用程序的复杂度不断加深，使用一些在功能上区别于传统的GDB调试工具就变得越来越重要了。这类调试工具具有低延时(LowLatency)，高性能，动态调试的特点。嵌入式Linux设备的系统软件通常不需从头开发，这些调试工具可以帮助开发者快速理解Linux内核
systemtap原理及使用 csr_hema
SystemTap的架构SystemTap用于检查运行的内核的两种方法是Kprobes和返回探针。但是理解任何内核的最关键要素是内核的映射，它提供符号信息（比如函数、变量以及它们的地址）。有了内核映射之后，就可以解决任何符号的地址，以及更改探针的行为。Kprobes从2.6.9版本开始就添加到主流的Linux内核中，并且为探测内核提供一般性服务。它提供一些不同的服务，但最重要的两种服务是Kprob
zybo上运行linux,Zybo开发板linux作业系统移植周行文 zybo上运行linux
文章主要介紹zyboboard上linux作业系统移植过程。分别介绍了开发环境搭建、U-boot编译、linux内核编译、busybox制作等流程及注意事项。文章使用的开发板是zynq7000系列的zyboboard。Vivado版本是2015.1.主机系统是Debian9.1.开发环境搭建工欲善其事必先利其器，做开发前搭建好编译环境是重要的一步，这些步骤大体上都相同，然而对于不同的系统平台、硬件
Android内核介绍 zhang_li_bin Android Android Linux C C#C++
Android内核介绍Android内核介绍发布时间：2010年4月8日作者：EasyAndroidtags：已经有一些的文章介绍Android内核了，本系列篇将从Linux内核的角度来分析Android的内核，希望给初学者提够有用的信息。本章将简单的介绍Android内核的全貌，起到一个抛砖引玉的作用。从下一篇开始将详细介绍每一个Android内核驱动程序及其作用。Android内核是基于Lin
linux驱动 -- PWM配置和SysFs操作方法悟凡爱学习 linux驱动 linux 运维服务器
1：PWM介绍PWM的定义为:可调节脉冲调节器，换句话来说就是一个总周期不变，占空比可调节的方波。2：PWM的总周期和占空比、有效点平方波：在信号领域一般分为数字信号和模拟信号，数字信号就两种状态：0和1，相互交替成为方波。总周期：从1状态到1状态。也就是总周期为：从一个电平再回到这个电平。占空比：有效电平占据占总周期的比例有效电平：器件生效的电平3：linux内核下的PWM3.1linux下的P
8.12（LVS负载均衡） WPFwpf_ lvs 负载均衡运维
一、LVS（一）什么是LVSlinuxvirturalserver的简称，也就是linxu虚拟机服务器，这是一个由章文岩博士发起的开源项目，官网是http://www.linuxvirtualserver.org,现在lvs已经是linux内核标准的-部分，使用lvS可以达到的技术目标是:通过linux达到负载均衡技术和linux操作系统实现一个高性能高可用的linux服务器集群，他具有良好的可性
页面缓存（Page Cache） TABE_ 操作系统页缓存操作系统
我们知道文件一般存放在硬盘（机械硬盘或固态硬盘）中，CPU并不能直接访问硬盘中的数据，而是需要先将硬盘中的数据读入到内存中，然后才能被CPU访问。由于读写硬盘的速度比读写内存要慢很多（DDR4内存读写速度是机械硬盘500倍，是固态硬盘的200倍）。为了避免每次读写文件时，都需要对硬盘进行读写操作，Linux内核会以页大小（4KB）为单位，将文件划分为多数据块，当用户对文件中的某个数据块进行读写操作
ARM64的函数调用标准和栈布局奔跑吧Linux社区 linux
欢迎订阅奔跑吧linux社区微信公众号本文节选自《奔跑吧Linux内核》第二版卷1第1.6章函数调用标准（ProcedureCallStandard，PCS）用来描述父/子函数是如何编译、链接的，特别是父函数和子函数之间调用关系的约定，如栈的布局、参数的传递等。每个处理器架构都有不同的函数调用标准，本章重点介绍ARM64的函数调用标准。ARM公司有一份描述ARM64架构函数调用的标准和规范文档，这
深入理解 Linux epoll：高性能事件驱动的核心技术程序修炼之道 c++linux 音视频计算机网络
介绍在高并发网络编程中，有效地管理大量的客户端连接是至关重要的。传统的I/O多路复用技术如select和poll在连接数较少时表现良好，但在连接数增加时性能下降明显。而Epoll则是一种高效的I/O多路复用技术，被广泛应用于服务器编程中，特别是在大规模并发连接的场景下。Epoll概述Epoll是Linux内核提供的一种事件通知机制，用于处理大量的I/O事件。Epoll在管理大量连接时具有更高的效率
Linux内核0.11学习九阳道人 linux 学习内核
Linux内核0.11学习文章目录Linux内核0.11学习一、计算机开机的过程1、启动BIOS2、BIOS在内存中加载中断向量表和中断服务程序Linux内核最新已经版本已经到5.18了，代码量千万行的级别，一天看五百行也要看两万天，然而很多程序员能不能活到两万天都是个大问题，所以不可能看得完。Linux0.11内核虽然是三十多年前的产物，就像孙子兵法、黄帝内经等古书一样，不代表它们没有学习的价值
云原生 | 在 Kubernetes 中使用 Cilium 替代 Calico 网络插件实践指南! 全栈工程师修炼指南企业IT运维实践云原生 kubernetes 网络容器
[知识是人生的灯塔，只有不断学习，才能照亮前行的道路]0x00简述介绍什么是Cilium?Cilium是一款开源软件，它基于一种名为eBPF的新的Linux内核技术提供动力，用于透明地保护使用Docker和Kubernetes等Linux容器管理平台中部署的应用程序服务之间的网络连接，Cilium主要使用场景是在Kubernetes中，但Cilium的优势并不仅限于Kubernetes环境。在Ku
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p