Synchronization,同步。很好理解,简单的可以认为是同一个节奏。引申到计算机,其实就是多任务保持一致性。这个一致性一般是指数据,也可能会是操作。在单任务单线(进)程中,同步是天然的。在多任务无共同操作条件下,同步没有意义。
同步一般是在多线(进)程(多任务)且这些线程之间必须有共同操作部分时,才会有意义。
以前说过,计算机中的应用和现实的应用是映射。什么意思呢?如果计算机解决的问题,在现实世界上都可以找到原型。比如同步,举一个例子:如果测试学生做操的成绩,各自单独测试即可。可要测试班级操的成绩,这个即使每个学生做的都非常好,但各自做各自的,那么成绩也不一定好。只有同一班的学生保持一致(同步),这样才成绩更优秀。
刚刚说过,在单线程和多线程的某些情况下,同步是没有意义的。所以,同步一定是在并发和并行中且有交互的情况下,才有意义。而并发和并行,又增加了同步的复杂性。但是当把同步抽象出来,其实就是具体到某一个粒度是串行的。也就是说,如何保证这个粒度是最合适的。也就引出了后面,使用哪种锁是最合适的话题。
在开发者们学习多线程编程时,最先接触的同步方式一般是互斥体(Mutex)。它是一种重量级锁,既支持进程间的同步又支持线程间的同步方式。然后才是其它的如信号量、条件变量、临界区等等。使用互斥锁缺点主要是太耗费时间,而且一不小心还有可能产生死锁。
那么,就产生了一种读写锁,读写锁其实是一种对锁机制的平衡,在正常的情况下,如果只是读取的话,其实数据自然是同步的,而且事实是在某些场合下,读是一种非常频繁的操作(比如缓存),所以这就可以不进行排它的读,减少锁的时间耗费。当然,如果判断一个线程要写数据时,需要启动排它性,只能它一个操作了。在Linux中设计了一个读写锁ReadWriteLock 。但是,一定要知道在什么情况下使用读写锁。比如,一个场景就是十个线程抢占式写一个数据区,那么读写锁反而没啥意义了。读写锁其实是两部分,一部分是读锁,需要支持多个持有者,一个是写锁,排它。在内核中使用提把一个int型分成高低两位,一部分用来处理读(两个字节,最多65535个读锁持有者),一部分用来处理写。读部分因为是共同持有,所以需要使用CAS进行处理。
而在c++11中推出了automic,原子操作。当然,别的语言和别的情况下也各自有各自的原子操作的方式。所谓原子操作,就是不可再分解的意思。也就是说,这是串行化的,操作它,只能一个个轮流来,不能说你读一下我写一下乱序执行。原子操作其实就基本涉及到了硬件操作了,通过汇编的指令接口,来影响具体的执行过程。一般为说,原子操作和内存顺序也是有一定的关系的,需要大家注意。同时,不同的架构的CPU和不同的架构体系(SMP NUMA MPP)也有不同的处理方式,都需要根据实际情况来分析。原子操作只能操作一个变量,当然一个位操作也算一个变量,也就是原子位操作。
还有一种比较常见的,也是目前在无锁编程中用得比较多的,自旋锁。自旋锁,就是自个儿旋转的锁?表面上看就是这么一个玩意儿。它底层其实是通过CAS不断的尝试去读取锁(表现出来就是一个循环,但其实底层如果支持PAUSE指令,则可以使用其),获取了就操作不获取就继续。
CAS有几个经典的问题,ABA问题,时间耗费问题和只能操作一个变量(这也是前面把一个int分成高低两部分的原因)。但它也有闪光点啊。一般来说,在多线程编程中,当线程达到一定数量后,线程上下文的切换就成为了一个需要重视的点。互斥锁等会引起线程的切换及线程的睡眠,而CAS只是阻塞CPU而不会引起线程的退让,这在某些场景下,优势还是非常明显的。
那么就可以明白,在只有一颗CPU一个核心的情况下,自旋锁没有意义,已经退化为普通的互斥体类似的机制,只有在多核多CPU的情况下才有意义。同时,自旋锁持有CPU不放,所以只能短时间使用,如果长时间需要锁住一个数据,就不能使用自旋锁。所以早期的自旋锁,基本都只是在内核中使用,后期才渐渐在应用层开始使用。同时为了安全,应用层使用自旋锁往往会提供一些安全机制,比如回退到某个时间点上会退化为普通锁。自旋锁在使用过程中是不允许递归的,同样在自旋锁的源码中可以看到其屏蔽了中断请求的函数(中断中如果也有自旋锁,这事儿就难办了)。
当然,还有一些其它的同步操作方式,如内存栅栏等,它们之间或多或少都有一些相通之处。这里不再赘述。
最后,所有的有锁编程,当然不如无锁编程更好。无锁并不是真正意义上的无锁,而把锁进一步下移到非上层控制,在上层表现为无传统意义上锁机制。可以简单的理解成使用指令级操作通过硬件来进行锁操作,速度更快。
那么,开发中到底使用哪种锁最好呢?
一般来说,没有最好,只有最合适。前面也简单分析了一些锁的应用场景,其实就是提醒开发者,在实际应用中,要根据实际情况动态选择使用哪种锁甚至混合使用这些锁。哪种方式能更好的实现目的,就用哪种,这才是正确的方法。
DPDK中同样也引入原子操作、读写锁和自旋锁三种方式。
1、原子操作
//rte_atomic.h
#define rte_mb() _mm_mfence()
#define rte_wmb() _mm_sfence()
#define rte_rmb() _mm_lfence()
#define rte_smp_wmb() rte_compiler_barrier()
#define rte_smp_rmb() rte_compiler_barrier()
/**
* Compiler barrier.
*
* Guarantees that operation reordering does not occur at compile time
* for operations directly before and after the barrier.
*/
#define rte_compiler_barrier() do { \
asm volatile ("" : : : "memory"); \
} while(0)
static inline void
rte_atomic64_add(rte_atomic64_t *v, int64_t inc);
#ifdef RTE_FORCE_INTRINSICS
static inline void
rte_atomic64_add(rte_atomic64_t *v, int64_t inc)
{
__sync_fetch_and_add(&v->cnt, inc);
}
#endif
/**
* Atomically subtract a 64-bit value from a counter.
*
* @param v
* A pointer to the atomic counter.
* @param dec
* The value to be subtracted from the counter.
*/
static inline void
rte_atomic64_sub(rte_atomic64_t *v, int64_t dec);
#ifdef RTE_FORCE_INTRINSICS
static inline void
rte_atomic64_sub(rte_atomic64_t *v, int64_t dec)
{
__sync_fetch_and_sub(&v->cnt, dec);
}
#endif
/**
* Atomically increment a 64-bit counter by one and test.
*
* @param v
* A pointer to the atomic counter.
*/
static inline void
rte_atomic64_inc(rte_atomic64_t *v);
#ifdef RTE_FORCE_INTRINSICS
static inline void
rte_atomic64_inc(rte_atomic64_t *v)
{
rte_atomic64_add(v, 1);
}
2、读写锁
//rte_rwlock.h
/**
* The rte_rwlock_t type.
*
* cnt is -1 when write lock is held, and > 0 when read locks are held.
*/
typedef struct {
volatile int32_t cnt; /**< -1 when W lock held, > 0 when R locks held. */
} rte_rwlock_t;
/**
* A static rwlock initializer.
*/
#define RTE_RWLOCK_INITIALIZER { 0 }
/**
* Initialize the rwlock to an unlocked state.
*
* @param rwl
* A pointer to the rwlock structure.
*/
static inline void
rte_rwlock_init(rte_rwlock_t *rwl)
{
rwl->cnt = 0;
}
/**
* Take a read lock. Loop until the lock is held.
*
* @param rwl
* A pointer to a rwlock structure.
*/
static inline void
rte_rwlock_read_lock(rte_rwlock_t *rwl)
{
int32_t x;
int success = 0;
while (success == 0) {
x = __atomic_load_n(&rwl->cnt, __ATOMIC_RELAXED);
/* write lock is held */
if (x < 0) {
rte_pause();
continue;
}
success = __atomic_compare_exchange_n(&rwl->cnt, &x, x + 1, 1,
__ATOMIC_ACQUIRE, __ATOMIC_RELAXED);
}
}
/**
* @warning
* @b EXPERIMENTAL: this API may change without prior notice.
*
* try to take a read lock.
*
* @param rwl
* A pointer to a rwlock structure.
* @return
* - zero if the lock is successfully taken
* - -EBUSY if lock could not be acquired for reading because a
* writer holds the lock
*/
__rte_experimental
static inline int
rte_rwlock_read_trylock(rte_rwlock_t *rwl)
{
int32_t x;
int success = 0;
while (success == 0) {
x = __atomic_load_n(&rwl->cnt, __ATOMIC_RELAXED);
/* write lock is held */
if (x < 0)
return -EBUSY;
success = __atomic_compare_exchange_n(&rwl->cnt, &x, x + 1, 1,
__ATOMIC_ACQUIRE, __ATOMIC_RELAXED);
}
return 0;
}
3、自旋锁
//ret_spinlock.h
static inline void
rte_spinlock_lock(rte_spinlock_t *sl)
{
int lock_val = 1;
asm volatile (
"1:\n"
"xchg %[locked], %[lv]\n"
"test %[lv], %[lv]\n"
"jz 3f\n"
"2:\n"
"pause\n"
"cmpl $0, %[locked]\n"
"jnz 2b\n"
"jmp 1b\n"
"3:\n"
: [locked] "=m" (sl->locked), [lv] "=q" (lock_val)
: "[lv]" (lock_val)
: "memory");
}
static inline void
rte_spinlock_unlock (rte_spinlock_t *sl)
{
int unlock_val = 0;
asm volatile (
"xchg %[locked], %[ulv]\n"
: [locked] "=m" (sl->locked), [ulv] "=q" (unlock_val)
: "[ulv]" (unlock_val)
: "memory");
}
static inline int
rte_spinlock_trylock (rte_spinlock_t *sl)
{
int lockval = 1;
asm volatile (
"xchg %[locked], %[lockval]"
: [locked] "=m" (sl->locked), [lockval] "=q" (lockval)
: "[lockval]" (lockval)
: "memory");
return lockval == 0;
}
#endif
extern uint8_t rte_rtm_supported;
static inline int rte_tm_supported(void)
{
return rte_rtm_supported;
}
static inline int
rte_try_tm(volatile int *lock)
{
int i, retries;
if (!rte_rtm_supported)
return 0;
retries = RTE_RTM_MAX_RETRIES;
while (likely(retries--)) {
unsigned int status = rte_xbegin();
if (likely(RTE_XBEGIN_STARTED == status)) {
if (unlikely(*lock))
rte_xabort(RTE_XABORT_LOCK_BUSY);
else
return 1;
}
while (*lock)
rte_pause();
if ((status & RTE_XABORT_CONFLICT) ||
((status & RTE_XABORT_EXPLICIT) &&
(RTE_XABORT_CODE(status) == RTE_XABORT_LOCK_BUSY))) {
/* add a small delay before retrying, basing the
* delay on the number of times we've already tried,
* to give a back-off type of behaviour. We
* randomize trycount by taking bits from the tsc count
*/
int try_count = RTE_RTM_MAX_RETRIES - retries;
int pause_count = (rte_rdtsc() & 0x7) | 1;
pause_count <<= try_count;
for (i = 0; i < pause_count; i++)
rte_pause();
continue;
}
if ((status & RTE_XABORT_RETRY) == 0) /* do not retry */
break;
}
return 0;
}
static inline void
rte_spinlock_lock_tm(rte_spinlock_t *sl)
{
if (likely(rte_try_tm(&sl->locked)))
return;
rte_spinlock_lock(sl); /* fall-back */
}
4、DPDK无锁队列
这里多说一句,DPDK的无锁队列是通过CAS来实现的,目前无锁队列也是应用CAS最广泛的一种应用。这个队列在前面分析过,这里就不再重贴代码了。
上面的代码都只是一部分的实现,有兴趣可以去DPDK的相关目录下找到这些文件,认真分析一下。至于如何调用的,可以直接查看引用,在代码中看这些API是如何调用的,基本就可以知道这几类锁在DPDK中的应用情况。
锁的机制在不同的层次上有着不同的表述和表现形式,在不同的语言上可能又会衍生出不同的形式。这就需要开发者去仔细的分析其真正使用的哪种锁,从而能更好的对其进行应用。可以试着看一下Mutex在内核中是如何实现的(futex机制),其实就明白了上面的话的意思。
底层建设一直是重要的环节,侯捷老师说过:勿在浮沙筑高台。