pthread 1:1atomic cache同步降低性能
fiber n:1 -> nginx 多核难以扩展, 用户不能做阻塞操作.
context 存储contextualStack
bthread_make_fcontext (boost::context)手动切换线程上下文->函数栈, 寄存器
bthread_jump_fcontext 将context解包, 恢复上下文
防止栈溢出: 1. mprotect to add a guarding page (并发bthread 过多会导致mmap失败)
2.use mmap to alloc page-aligned memory
basic-> run_queue(FIFO)
remotetaskqueue->备份二级队列, 向队列中提交不在btrhead中创建的任务
taskgroup逻辑
while not stop
wait until signaled
work stealing from other
sched_to(that_bthread)
futex_wait_private(value, expect) #atomic 系统调用原语 Parkinglot封装, wait signal
避免全局竞争的方法:
很多个parkinglot, 进行worker分组, 改成局部竞争, 只唤醒组内部分worker
workstealingqueue: 从这个队列里偷
local queue->remote queue->other worker local queue->other worker remote taskqueue
32bit 版本号(防止aba问题) + 32bit slot id(resourcepool中的下标)->taskMeta bthread的管理结构
start_foreground ->set_mained(ready_to_run + sched_to) 直接跑新的, 正在跑的放队尾
start_background ->ready_to_run
阻塞操作
yield -> 把当前运行环境空出来, 加到queue尾
usleep()->把当前任务从runqueue pop 定时加到remote_queue
具体来说,bthread_id解决的问题有:
设置timer后很快触发了,超时处理代码和发送代码产生竞争。
重试产生的多个response同时回来产生的竞争。
对于每个fd, 最多有一个I和O bthread
在brpc中加mutex锁, brpc请求下游模块, 没有worker资源处理下游返回的read..无法释放mutex锁
IOBuf->BlockRef->Block 三层结构
非连续的存储, 每个block引用计数, 避免频繁new, 使用cache in TLSData
定时器分桶, 每个结构要存的: task_list, mutex, _nearest_run_time 无锁无竞争
拿到所有定时器时, _nearset_run_time建一个全局堆
while not stop
check each bucket for new tasks
build a heap (remove deleted tasks)
pop first task from heap
run if timeout
cal the next timeout
futex_wait_private(如果有更紧急的timer插入, 会唤醒timer线程)
BlockGroup / Block / T 类似于buddy 算法
resourceid = group_idex + block_offset + slot_offset
每个写bvar的时候, 只写tls . 读的时候combine.