X86 PCID and TLB flush

PCID全称是Intel的process context identifier,目的是为了解决进程切换时TLBflush导致的性能下降问题。提出了好多年,但是直到最近才重新引起关注。

因为2018年的安全漏洞meltdown和spectre,导致各个操作系统紧急出台修补方案,这个就是KPTI,内核页表的隔离。由于KPTI的引入,导致了已有业务的性能下降,最高超过了30%。Linux使用了PCID,目的就是为了缓解KPTI机制引入的过大的性能下降。

尽管如此,PCID+KPTI仍然使得已有workload的性能下降,有报道说大约5%。

熟悉X86的都知道,提到进程切换引起的TLB flush,那就是来自CR3的加载,而PCID就是放在了CR3当中。因为CR3的特殊用法,使得PCID实际只有12位,理论上只能支持4096个process的使用,这在现今的Linux系统里面时不切实际。所以Linux采取了折中的方案,具体请参考http://happyseeker.github.io/kernel/2018/05/04/pti-and-pcid.html

而这里主要还是简单讲讲在支持PCID的Intel X86上,怎么正确的做到TLBflush。这个就是来自Intel SDM的描述,如下。

SDM


SDM


目前Linux内核只使用了6个PCID给用户进程,这个可以通过读取进程CR3来进行确认。示例代码的输出如下(Ubuntu18.04, 4.15.17)。

CR3=0x41e478005

CR4=0x1606e0

Current Process[3165] = cat

XXXX process 3165 CR3 = 41e478000, context_id = 1029

CR3=0x427bdc002

CR4=0x1606f0

Current Process[3166] = cat

XXXX process 3166 CR3 = 427bdc000, context_id = 102b

CR3=0x42786c003

CR4=0x1606e0

Current Process[3167] = cat

XXXX process 3167 CR3 = 42786c000, context_id = 102d

CR3=0x424cc2005

CR4=0x1606e0

Current Process[3168] = cat

XXXX process 3168 CR3 = 424cc2000, context_id = 102f

CR3=0x4281a8006

CR4=0x1606e0

Current Process[3169] = cat

XXXX process 3169 CR3 = 4281a8000, context_id = 1031

CR3=0x4295c0006

CR4=0x1606e0

Current Process[3170] = cat

XXXX process 3170 CR3 = 4295c0000, context_id = 1033

CR3=0x424148004

CR4=0x1606e0

Current Process[3171] = cat

XXXX process 3171 CR3 = 424148000, context_id = 1035

从输出可见,PCID是使能了(bit17 of CR4),而且进程的PCID都在预期的范围内。

后续会实际操作TLB flush,看看有和没有TLB flush的区别。

你可能感兴趣的:(X86 PCID and TLB flush)