yuyin86

Pthread_Mutex_t Vs Pthread_Spinlock_t （转载）

锁机制(lock) 是多线程编程中最常用的同步机制,用来对多线程间共享的临界区(Critical Section) 进行保护。

Pthreads提供了多种锁机制,常见的有：
1) Mutex（互斥量）：pthread_mutex_***
2) Spin lock（自旋锁）：pthread_spin_***
3) Condition Variable（条件变量）：pthread_con_***
4) Read/Write lock（读写锁）：pthread_rwlock_***

在多线程编中,根据应用场合的不同,选择合适的锁来进行同步,对多线程程序的性能影响非常大. 本文主要对 pthread_mutex 和 pthread_spinlock 两种锁制机进行比较,并讨论其适用的场合.

1 Pthread mutex

Mutex属于sleep-waiting类型的锁. 从 2.6.x 系列稳定版内核开始, Linux 的 mutex 都是 futex (Fast-Usermode-muTEX)锁.
futex（快速用户区互斥的简称）是一个在Linux上实现锁定和构建高级抽象锁如信号量和POSIX互斥的基本工具。它们第一次出现在内核开发的2.5.7版；其语义在2.5.40固定下来，然后在2.6.x系列稳定版内核中出现。
Futex 是由Hubertus Franke（IBM Thomas J. Watson 研究中心）, Matthew Kirkwood，Ingo Molnar（Red Hat）和 Rusty Russell（IBM Linux 技术中心）等人创建的。
Futex 是由用户空间的一个对齐的整型变量和附在其上的内核空间等待队列构成. 多进程或多线程绝大多数情况下对位于用户空间的futex 的整型变量进行操作(汇编语言调用CPU提供的原子操作指令来增加或减少),而其它情况下,则需要通过代价较大的系统调用来对位于内核空间的等待队列进行操作(如唤醒等待的进程/线程,或将当前进程/线程放入等待队列). 除了多个线程同时竞争锁的少数情况外,基于 futex 的 lock 操作是不需要进行代价昂贵的系统调用操作的.
.
这种机制的核心思想是通过将大多数情况下非同时竞争 lock 的操作放到在用户空间来执行,而不是代价昂贵的内核系统调用方式来执行,从而提高了效率.

Pthreads提供的Mutex锁操作相关的API主要有：
1、 pthread_mutex_lock (pthread_mutex_t *mutex);
2、 pthread_mutex_trylock (pthread_mutex_t *mutex);
3、 pthread_mutex_unlock (pthread_mutex_t *mutex);

因为源代码比较长,这里不做摘录,大家可以参考:
glibc-2.12.2/nptl/pthread_mutex_lock.c

2 Pthread spinlock

spinlock，也称自旋锁,是属于busy-waiting类型的锁.在多处理器环境中, 自旋锁最多只能被一个可执行线程持有。如果一个可执行线程试图获得一个被争用(已经被持有的)自旋锁，那么该线程就会一直进行忙等待，自旋，也就是空转，等待锁重新可用。如果锁未被争用，请求锁的执行线程便立刻得到它，继续执行。

一个被争用的自旋锁使得请求它的线程在等待锁重新可用时自旋，特别的浪费CPU时间，所以自旋锁不应该被长时间的持有。实际上，这就是自旋锁的设计初衷，在短时间内进行轻量级加锁。

Kernel中的自旋锁不能够在能够导致睡眠的环境中使用。举个例子，一个线程A获得了自旋锁L；这个时候，发生了中断，在对应的中断处理函数B中，也尝试获得自旋锁L，就会中断处理程序进行自旋。但是原先锁的持有者只有在中断处理程序结束后，采用机会释放自旋锁，从而导致死锁。
由于涉及到多个处理器环境下，spin lock的效率非常重要。因为在等待spin lock的过程，处理器只是不停的循环检查，并不执行其他指令。但即使这样，一般来说，spinlock的开销还是比进程调度(context switch）少得多。这就是spin lock 被广泛应用在多处理器环境的原因

Pthreads提供的与Spin Lock锁操作相关的API主要有：
pthread_spin_lock (pthread_spinlock_t *lock);
pthread_spin_trylock (pthread_spinlock_t *lock);
pthread_spin_unlock (pthread_spinlock_t *lock);

下面,来看一下spinlock在pthread中的实现:

1) spin lock的数据结构

glibc-2.12.2\nptl\sysdeps\unix\sysv\linux\i386\bits\pthreadtypes.h

 
    ? 
   
         typedef 
         volatile 
         int 
         pthread_spinlock_t;

2) pthread_spin_lock

glibc-2.12.2\nptl\sysdeps\i386\pthread_spin_lock.c

 
    ? 
   
         #ifndef LOCK_PREFIX  
        
         # ifdef UP  
        
         #  define LOCK_PREFIX    /* nothing */  
        
         # else  
        
         #  define LOCK_PREFIX    "lock;"  
        
         # endif  
        
         #endif  
        
         int 
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>lock (lock)  
        
         pthread_spinlock_t *lock;  
        
         {  
        
         asm ( 
         "\n" 
        
         "1:\t" 
         LOCK_PREFIX  
         "decl %0\n\t" 
        
         "jne 2f\n\t" 
        
         ".subsection 1\n\t" 
        
         ".align 16\n" 
        
         "2:\trep; nop\n\t" 
        
         "cmpl $0, %0\n\t" 
        
         "jg 1b\n\t" 
        
         "jmp 2b\n\t" 
        
         ".previous" 
        
         :  
         "=m" 
          (*lock)  
        
         :  
         "m" 
          (*lock));  
        
         return 
         0;  
        
         }

a、 LOCK_PREFIX: 是为了在SMP下锁总线，保证接下来一条指令的原子性。

b、 %0: 这里是*lock的值，先将lock的值减一，如果ZF=0（lock值不为0），跳到下面的2标签处继续执行；否则执行结束（lock值为0）。
c、 jne: Jump near if not equal (ZF=0). Not supported in 64-bit mode.

下面继续看2标签处的代码：
d、 rep; nop: 为实际上为多个nop指令，实际上这条指令可以降低CPU的运行频率，减低电的消耗量，但最重要的是，提高了整体的效率。因为这段指令执行太快的话，会生成很多读取内存变量的指令，另外的一个CPU可能也要写这个内存变量，现在的CPU经常需要重新排序指令来提高效率，如果读指令太多的话，为了保证指令之间的依赖性，CPU会以牺牲流水线执行（pipeline）所带来的好处。从pentium 4以后，intel引进了一条pause指令，专门用于spin lock这种情况，据intel的文档说，加上pause可以提高25倍的效率！。
e、 cmpl $0, %0 :比较lock与0的大小，当发现Lock大于0的时候，跳回到1标签，尝试重新获得锁；否则，跳回到标签2继续进行循环。

f、标签1处的代码，在尝试获得锁的时候，直接将lock值减1，如果获得锁操作失败的时候，实际上lock值已经被减了1。这样会不会有问题呢？实际上，这个问题不用担心，因为在释放锁的时候，lock的值还会被重新设置为1。

.subsection和.previous之间的这段代码用来检测spin lock何时被释放. 这段代码与其它的常用指令代码并不是放在同一个代码段中的,因为大部分情况下，lock都会成功返回，将这段lock失败后的操作代码与其它的代码分开，会提高高速缓存的效率（有限的高速缓存可以放置更多的数据）。

3) pthread_spin_unlock

glibc-2.12.2\nptl\sysdeps\i386\pthread_spin_unlock.S

 
    ? 
   
         .globl    <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>unlock  
        
         .type    <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>unlock,@function  
        
         .align    16  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>unlock:  
        
         movl    4(%esp), %eax  
        
         movl    $1, (%eax)  
        
         xorl    %eax, %eax  
        
         ret  
        
         .size    <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>unlock,.-<STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>unlock  
        
         /* The implementation of <STRONG style="BACKGROUND-COLOR: #00aa00; COLOR: white">pthread_spin_</STRONG>init is identical.  */ 
        
         .globl    <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>init  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>init = <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>unlock

pthread_spin_unlock()就简单很多了，只是简单的将lock值设置为1，并返回0

3 性能测试对比

测试环境

Memory: 16G
Cpu: 8 core

 
    ? 
   
         processor       : 7  
        
         vendor_id       : GenuineIntel  
        
         cpu family      : 6  
        
         model           : 23  
        
         model name      : Intel(R) Xeon(R) CPU           E5410  @ 2.33GHz  
        
         stepping        : 6  
        
         cpu MHz         : 2327.529  
        
         cache size      : 6144 KB  
        
         physical id     : 1  
        
         siblings        : 4  
        
         core id         : 7  
        
         cpu cores       : 4  
        
         fpu             : yes  
        
         fpu_exception   : yes  
        
         cpuid level     : 10  
        
         wp              : yes  
        
         flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm syscall nx lm pni monitor ds_cpl est tm2 cx16 xtpr lahf_lm  
        
         bogomips        : 4655.07  
        
         clflush size    : 64  
        
         cache_alignment : 64  
        
         address sizes   : 38 bits physical, 48 bits virtual  
        
         power management:

?? OS: Rhel 5U4 , Linux Kernel : 2.6.18-164.el5

?? 测试方法:

在 case1~case3 中,通过逐渐增加临界区(Critical Section)的长度来比较在此情况下 pthread spinlock 与 pthread mutex 的性能.
Case4: 是在 case1 的基础上,给各个线程增加非临界区的工作,以减少冲突. 在此情况下 pthread spinlock 与 pthread mutex 的性能.

在每个 case 中,从线程数依次从 1个线程增加到 15个线程,
并重复执行 10 次以保证测试结果不受意外情况的影响.

3.1 Case 1:

 
    ? 
   
         #include <stdio.h>  
        
         #include <pthread.h>  
        
         #include <stdint.h>  
        
         #include <unistd.h>  
        
         #include <sys/syscall.h>  
        
         #include <errno.h>  
        
         #include <sys/time.h>  
        
         #include <sched.h>  
        
         #include <linux/unistd.h>  
        
         #include <list>  
        
         #include "TimeHelper.h"  
        
         #define MAX_ARRAY_NUM 10000000  
        
         using 
         namespace 
         std;  
        
         union 
         AlignInt32  
        
         {  
        
         uint32_t _member;  
        
         char 
         _align[64];  
         // for false sharing for multi-core  
        
         };  
        
         struct 
         StatItem  
        
         {  
        
         uint32_t    _times;  
        
         uint32_t    _id;  
        
         };  
        
         union 
         AlignStat  
        
         {  
        
         StatItem _item;  
        
         char 
         _align[64];  
         // for false sharing for multi-core  
        
         };  
        
         AlignInt32 g_Array[10000000];  
        
         volatile 
         uint32_t g_Index=0;  
        
         #ifdef USE_SPINLOCK  
        
         pthread_spinlock_t spinlock;  
        
         #else  
        
         pthread_mutex_t mutex;  
        
         #endif  
        
         pid_t gettid() {  
         return 
          syscall( __NR_gettid ); }  
        
         void 
         *consumer( 
         void 
         *arg)  
        
         {  
        
         AlignStat* pItem=(AlignStat*)arg;  
        
         while 
         (1)  
        
         {  
        
         #ifdef USE_SPINLOCK  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>lock(&spinlock);  
        
         #else  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #ffff66; COLOR: black" 
         >pthread_mutex_lock</STRONG>(&mutex);  
        
         #endif  
        
         if 
         (g_Index>=MAX_ARRAY_NUM)  
        
         {  
        
         #ifdef USE_SPINLOCK  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>unlock(&spinlock);  
        
         #else  
        
         pthread_mutex_unlock(&mutex);  
        
         #endif  
        
         break 
         ;  
        
         }  
        
         ++(pItem->_item._times);  
        
         g_Array[g_Index]._member=g_Index;  
        
         ++g_Index;  
        
         #ifdef USE_SPINLOCK  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>unlock(&spinlock);  
        
         #else  
        
         pthread_mutex_unlock(&mutex);  
        
         #endif  
        
         }  
        
         return 
         NULL;  
        
         }  
        
         int 
         main( 
         int 
         argc,  
         char 
         *argv[])  
        
         {  
        
         uint64_t t1,t2;  
        
         uint64_t nTimeSum=0;  
        
         uint32_t nThreadNum=0;  
        
         #ifdef USE_SPINLOCK  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>init(&spinlock, 0);  
        
         fprintf 
         (stderr, 
         "case for spinlock: " 
         );  
        
         #else  
        
         pthread_mutex_init(&mutex, NULL);  
        
         fprintf 
         (stderr, 
         "case for mutex: " 
         );  
        
         #endif  
        
         int32_t nCpuNum = ( 
         int 
         )sysconf( _SC_NPROCESSORS_ONLN )*2;  
        
         fprintf 
         (stderr, 
         "cpu_num=%d\n" 
         ,nCpuNum/2);  
        
         for 
         (int32_t j=1; j< nCpuNum; j++)  
        
         {  
        
         nTimeSum=0;  
        
         nThreadNum=j;  
        
         AlignStat *pStatArray=  
         new 
         AlignStat[nThreadNum];  
        
         memset 
         (pStatArray,0x0,nThreadNum* 
         sizeof 
         (AlignStat));  
        
         for 
         (uint32_t nLoop=10; nLoop> 0 ; nLoop--)  
        
         {  
        
         g_Index=0;  
        
         pthread_t * pThreadArray= 
         new 
         pthread_t[nThreadNum];  
        
         // Measuring time before starting the threads...  
        
         t1=TimeHelper::nowTime();  
        
         for 
         (uint32_t i=0; i <nThreadNum; i++)  
        
         {  
        
         pStatArray[i]._item._id=i;  
        
         if 
         ( pthread_create(&pThreadArray[i], NULL, consumer, ( 
         void 
         *)(&pStatArray[i]) ))  
        
         {  
        
         perror 
         (  
         "error: pthread_create" 
         );  
        
         nThreadNum = i;  
        
         break 
         ;  
        
         }  
        
         }  
        
         for 
         (uint32_t i=0; i <nThreadNum; i++)  
        
         {  
        
         pthread_join(pThreadArray[i], NULL);  
        
         }  
        
         // Measuring time after threads finished...  
        
         t2=TimeHelper::nowTime();  
        
         nTimeSum+=t2-t1;  
        
         delete 
         [] pThreadArray;  
        
         }  
        
         fprintf 
         (stderr, 
         "RepeatTimes=%d, ThreadNum=%d, UsedTime=%.6lf s\n" 
         ,10, nThreadNum,( 
         double 
         (nTimeSum))/1000000);  
        
         for 
         (uint32_t i=0; i <nThreadNum; i++)  
        
         {  
        
         fprintf 
         (stderr, 
         "thread_id=%u\t times=%u\n" 
         ,pStatArray[i]._item._id,pStatArray[i]._item._times);  
        
         }  
        
         delete 
         [] pStatArray;  
        
         }  
        
         #ifdef USE_SPINLOCK  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>destroy(&spinlock);  
        
         #else  
        
         pthread_mutex_destroy(&mutex);  
        
         #endif  
        
         return 
         0;  
        
         }

3.2 Case2

 
    ? 
   
         void 
         *consumer( 
         void 
         *arg)  
        
         {  
        
         AlignStat* pItem=(AlignStat*)arg;  
        
         while 
         (1)  
        
         {  
        
         #ifdef USE_SPINLOCK  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>lock(&spinlock);  
        
         #else  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #ffff66; COLOR: black" 
         >pthread_mutex_lock</STRONG>(&mutex);  
        
         #endif  
        
         if 
         (g_Index>=MAX_ARRAY_NUM)  
        
         {  
        
         #ifdef USE_SPINLOCK  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>unlock(&spinlock);  
        
         #else  
        
         pthread_mutex_unlock(&mutex);  
        
         #endif  
        
         break 
         ;  
        
         }  
        
         ++(pItem->_item._times);  
        
         g_Array[g_Index]._member=g_Index;  
        
         ++g_Index;  
        
         // add critical section's length  
        
         list<uint32_t> tmpList;  
        
         for 
         (uint32_t i=0; i< 3; i++)  
        
         {  
        
         tmpList.push_back(i);  
        
         }  
        
         #ifdef USE_SPINLOCK  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>unlock(&spinlock);  
        
         #else  
        
         pthread_mutex_unlock(&mutex);  
        
         #endif  
        
         }  
        
         return 
         NULL;  
        
         }

3.3 Case3

 
    ? 
   
         void 
         *consumer( 
         void 
         *arg)  
        
         {  
        
         AlignStat* pItem=(AlignStat*)arg;  
        
         while 
         (1)  
        
         {  
        
         #ifdef USE_SPINLOCK  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>lock(&spinlock);  
        
         #else  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #ffff66; COLOR: black" 
         >pthread_mutex_lock</STRONG>(&mutex);  
        
         #endif  
        
         if 
         (g_Index>=MAX_ARRAY_NUM)  
        
         {  
        
         #ifdef USE_SPINLOCK  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>unlock(&spinlock);  
        
         #else  
        
         pthread_mutex_unlock(&mutex);  
        
         #endif  
        
         break 
         ;  
        
         }  
        
         ++(pItem->_item._times);  
        
         g_Array[g_Index]._member=g_Index;  
        
         ++g_Index;  
        
         // add critical section's length  
        
         list<uint32_t> tmpList;  
        
         for 
         (uint32_t i=0; i< 6; i++)  
        
         {  
        
         tmpList.push_back(i);  
        
         }  
        
         #ifdef USE_SPINLOCK  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>unlock(&spinlock);  
        
         #else  
        
         pthread_mutex_unlock(&mutex);  
        
         #endif  
        
         }  
        
         return 
         NULL;  
        
         }

3.4 Case4

 
    ? 
   
         void 
         *consumer( 
         void 
         *arg)  
        
         {  
        
         AlignStat* pItem=(AlignStat*)arg;  
        
         while 
         (1)  
        
         {  
        
         #ifdef USE_SPINLOCK  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>lock(&spinlock);  
        
         #else  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #ffff66; COLOR: black" 
         >pthread_mutex_lock</STRONG>(&mutex);  
        
         #endif  
        
         if 
         (g_Index>=MAX_ARRAY_NUM)  
        
         {  
        
         #ifdef USE_SPINLOCK  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>unlock(&spinlock);  
        
         #else  
        
         pthread_mutex_unlock(&mutex);  
        
         #endif  
        
         break 
         ;  
        
         }  
        
         ++(pItem->_item._times);  
        
         g_Array[g_Index]._member=g_Index;  
        
         ++g_Index;  
        
         #ifdef USE_SPINLOCK  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>unlock(&spinlock);  
        
         #else  
        
         pthread_mutex_unlock(&mutex);  
        
         #endif  
        
         //do same work  
        
         //AlignInt32 tmpArray[10000000];  
        
         //uint32_t tmpArray[10000000];  
        
         list<uint32_t> tmpList;  
        
         for 
         (uint32_t i=0; i< 20; i++)  
        
         {  
        
         tmpList.push_back(i);  
        
         //tmpArray[i]._member=i;  
        
         //tmpArray[i]=i;  
        
         }  
        
         }  
        
         return 
         NULL;  
        
         }

4 不同线程数下 spinlock分析

以下数据是用 intel vtune 采集得到
4.1 源代码

 
    ? 
   
         #include <stdio.h>  
        
         #include <pthread.h>  
        
         #include <stdint.h>  
        
         #include <unistd.h>  
        
         #include <sys/syscall.h>  
        
         #include <errno.h>  
        
         #include <sys/time.h>  
        
         #include <sched.h>  
        
         #include <linux/unistd.h>  
        
         #include <list>  
        
         #include "TimeHelper.h"  
        
         #define MAX_ARRAY_NUM 10000000  
        
         using 
         namespace 
         std;  
        
         struct 
         StatItem  
        
         {  
        
         uint32_t    _times;  
        
         uint32_t    _id;  
        
         };  
        
         union 
         AlignStat  
        
         {  
        
         StatItem _item;  
        
         char 
         _align[64];  
         // for false sharing for multi-core  
        
         };  
        
         volatile 
         uint32_t g_Index=0;  
        
         #ifdef USE_SPINLOCK  
        
         pthread_spinlock_t spinlock;  
        
         #else  
        
         pthread_mutex_t mutex;  
        
         #endif  
        
         pid_t gettid() {  
         return 
          syscall( __NR_gettid ); }  
        
         void 
         *consumer( 
         void 
         *arg)  
        
         {  
        
         AlignStat* pItem=(AlignStat*)arg;  
        
         while 
         (1)  
        
         {  
        
         #ifdef USE_SPINLOCK  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>lock(&spinlock);  
        
         #else  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #ffff66; COLOR: black" 
         >pthread_mutex_lock</STRONG>(&mutex);  
        
         #endif  
        
         if 
         (g_Index>=MAX_ARRAY_NUM)  
        
         {  
        
         #ifdef USE_SPINLOCK  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>unlock(&spinlock);  
        
         #else  
        
         pthread_mutex_unlock(&mutex);  
        
         #endif  
        
         break 
         ;  
        
         }  
        
         ++(pItem->_item._times);  
        
         ++g_Index;  
        
         #ifdef USE_SPINLOCK  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>unlock(&spinlock);  
        
         #else  
        
         pthread_mutex_unlock(&mutex);  
        
         #endif  
        
         }  
        
         return 
         NULL;  
        
         }  
        
         int 
         main( 
         int 
         argc,  
         char 
         *argv[])  
        
         {  
        
         if 
         (argc < 2)  
        
         {  
        
         fprintf 
         (stderr, 
         "%s thread_num\n" 
         ,argv[0]);  
        
         exit 
         (-1);  
        
         }  
        
         uint64_t t1,t2;  
        
         uint64_t nTimeSum=0;  
        
         uint32_t nThreadNum=(uint32_t) 
         atoi 
         (argv[1]);  
        
         #ifdef USE_SPINLOCK  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>init(&spinlock, 0);  
        
         fprintf 
         (stderr, 
         "case for spinlock: \n" 
         );  
        
         #else  
        
         pthread_mutex_init(&mutex, NULL);  
        
         fprintf 
         (stderr, 
         "case for mutex: \n" 
         );  
        
         #endif  
        
         nTimeSum=0;  
        
         AlignStat *pStatArray=  
         new 
         AlignStat[nThreadNum];  
        
         memset 
         (pStatArray,0x0,nThreadNum* 
         sizeof 
         (AlignStat));  
        
         for 
         (uint32_t nLoop=10; nLoop> 0 ; nLoop--)  
        
         {  
        
         g_Index=0;  
        
         pthread_t * pThreadArray= 
         new 
         pthread_t[nThreadNum];  
        
         // Measuring time before starting the threads...  
        
         t1=TimeHelper::nowTime();  
        
         for 
         (uint32_t i=0; i <nThreadNum; i++)  
        
         {  
        
         pStatArray[i]._item._id=i;  
        
         if 
         ( pthread_create(&pThreadArray[i], NULL, consumer, ( 
         void 
         *)(&pStatArray[i]) ))  
        
         {  
        
         perror 
         (  
         "error: pthread_create" 
         );  
        
         nThreadNum = i;  
        
         break 
         ;  
        
         }  
        
         }  
        
         for 
         (uint32_t i=0; i <nThreadNum; i++)  
        
         {  
        
         pthread_join(pThreadArray[i], NULL);  
        
         }  
        
         // Measuring time after threads finished...  
        
         t2=TimeHelper::nowTime();  
        
         nTimeSum+=t2-t1;  
        
         delete 
         [] pThreadArray;  
        
         }  
        
         fprintf 
         (stderr, 
         "RepeatTimes=%d, ThreadNum=%d, UsedTime=%.6lf s\n" 
         ,10, nThreadNum,( 
         double 
         (nTimeSum))/1000000);  
        
         for 
         (uint32_t i=0; i <nThreadNum; i++)  
        
         {  
        
         fprintf 
         (stderr, 
         "thread_id=%u\t times=%u\n" 
         ,pStatArray[i]._item._id,pStatArray[i]._item._times);  
        
         }  
        
         delete 
         [] pStatArray;  
        
         #ifdef USE_SPINLOCK  
        
         <STRONG style= 
         "BACKGROUND-COLOR: #00aa00; COLOR: white" 
         >pthread_spin_</STRONG>destroy(&spinlock);  
        
         #else  
        
         pthread_mutex_destroy(&mutex);  
        
         #endif  
        
         return 
         0;  
        
         }

编译:

 
    ? 
   
         g++ -g -O2 -Wall -I./ -DUSE_SPINLOCK -lpthread t_spinlock_thread.cpp -o t_spin_thread  
        
         g++ -g -O2 -Wall -I./ -lpthread t_spinlock_thread.cpp -o t_mutex_thread

4.2 Spinlock 在不同线程数下锁总线统计
4.2.1 t_spin_thread_1

4.2.2 t_spin_thread_2

4.2.3 t_spin_thread_3

4.2.4 t_spin_thread_4

4.2.5 t_spin_thread_5

4.2.6 t_spin_thread_6

4.2.7 t_spin_thread_7

4.2.8 t_spin_thread_8

5 测试结果分析

1) 现象1: 在性能对比测试 case1,case2,case3 中, spinlock 版本程序的运行时间基本上是随线程数的增加而递增的?

在对锁竞争激烈case1,case2,case3 情况下,因为除了临界区,线程不用执行其他任务, 任务实际是串行执行的.
spinlock 的循环偿试时是需要锁总线( lock bus)的,随着线程的增多,每个线程取得锁的概率就越小,循环偿试等待的概率就越大, 锁总线的操作也越频繁(见4.2Spinlock 在不同线程数下锁总线统计),从而导致临界区任务所需的执行时间就越长. 而且当线程大于cpu core 的个数后,可能会有线程切换.

2) 现象2: 在性能对比测试 case1,case2,case3 中, mutex 版本程序的运行时间先随线程数从 1增加到 3 而增加,然后随着线程数的进一步增加而减少,直到达到8个线程数后稳定下来.
这个现象的前半部随着线程数从 1 个线程增加到 3个线程,执行时间增加还好理解,因为在case1,case2,case3 情况下,因为除了临界区,线程不用执行其他任务,此时任务实际是串行执行的,所以1个线程时执行时间最少,因为没有其他线程来竞争锁, futex 在用户态就可以取得锁. 当线程从1个逐步增加到3个时, 因为锁竞争越来越激列,所以其在用户态就取得锁的概率也越低,从而需要进入相比用户态下取得锁的代价大很多的内核系统调用,所以执行所需时间相应增加.

这个现象的后半部随着线程数从 4 个线程增加到 15个线程时,执行时间又开始逐步减少,并到 8 个线程时逐步稳定. 这个从比较难以理解.

我猜测是因为临界区短,线程取得锁后很快就会释放,所以在 3-4个线程时,线程因取不到锁而进行系统调用进入等待的这段代码
我是这样理解的,将Consumer 线程的可以划分成3部分:
?? pthread_mutex_lock为Task1,执行时间T1, 并可细分成两种:
?? 在用户态直接获得锁的时间 T11
?? 通过系统调用等待锁后被唤醒得到锁 T12
?? 临界区为Task2, 执行时间 T2,
?? pthread_mutex_unlock为Task3, 执行时间T3.
?? 在用户态直接释放锁的时间 T31
?? 通过系统调用释放锁 T32

其中临界区的代码是被串行执行的,但 pthread_mutex_lock 和pthread_mutex_unlock 是各线程并发执行的,由于临界区很比较短,所以 T12和 T32远大于 T2. 因此,在并发度不够高时,Task1 和 Task3 重叠执行的部分就相对就小,所以 T12和 T32占总执行时长的比例就大,而随着线程数的增多, Task1 和 Task3 重叠执行的部分就相对递增,则其占总执行时长的比例就开始下降. 当线程数达到 cpu core 数后,就基本稳定下来了.
同时 T12和T32 与 T2相比越大,则下降越明显,这个可以解释从临界区长度从case1 到 case3 递增后,总执行时间的下降程序也相应变缓.

3) 现象3: 在性能对比测试 case1,case2,case3 中,线程数相对少的情况下(case1是5个线程, case3是 8个线程),spinlock版本的执行时间比 mutex 版本的执行时间要少,但之后,则相反.

这个现象我是这样理解的,在对锁竞争激烈case1,case2,case3 情况下,因为除了临界区,线程不用执行其他任务, 任务实际是串行执行的.此时,在线程数少的情况下, spinlock 比 mutex 的性能要好,随着线程数的增多, spinlock 的性能比 mutex 就变差. 原因是随着线程数的增加, spinlock 循环等待的代价逐渐比mutex 的睡眠等待而产生的上下文切换的系统调用的代价更大.

4) 现象 4: 在性能对比测试 case1,case2,case3 中, 从 case1 到 case3 ,临界区逐渐变长, spinlock 的性能比 mutex 的性能好的情况从 case1 的5个线程逐渐增加到 case3 的8个线程.

在采用 spinlock 机制的的情况下, 随着临界区的变长, spinlock 循环等待过程中锁总线的次数随临界区代码的长度而相应的增加,所以case1~case3 的情况下,其执行时间基本是按相应比例增加的.
而正如现象 2 所解释的,而采用 mutex 机制的情况下其执行时间是选增后减的,所以会有交叉. 又因为随着临界区的变长, mutex 的执行时间在下降部分会变缓,所以与 spinlock 的交叉相与对靠后.

5) 现象 5: 在性能测试中,线程除了临界区的代码外,还有另外的代码要执行,在线程数从 1 个到 11 个之间, spinlock 版本的执行时间比 mutex 版本的执行时间要好,特别是 6个线程时, spinlock 版本的执行时间只有mutex 版本的执行时间的 26% 左右.

此情况主要模拟锁竞争不激烈,同时临界区又比较短的情况; 这种情况下, 线程数从 1个增加到 6个左右时,spinlock 基本需要循环等待的概率很小,而每个线程又分摊了临界区的任务,所以6个线程左右时, spinlock 版本的执行时间最短.

6) 现象6: 在测试过程中,使用 spinlock 的 cpu 时间会比 mutex 高很多,因为 spinlock 是循环空等待.

6 附录

6.1 测试数据

6.2 参考:
http://en.wikipedia.org/wiki/Futex
http://www.alexonlinux.com/pthread-mutex-vs-pthread-spinlock

2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
2022-04-18 Apbenz
语重心长的和我说，不要老是说不行，人至而立之年危机四伏，内在的，外在的，感觉就是心力憔悴，让人无所适从。面对职场的无情，突然好羡慕干体力劳动的外卖小哥。难道命运是想让我去送外卖了吗？干体力活才能让我活下去？fastadmin打卡成功,淘宝金币任务完成。ㅏㅓㅗㅜㅡㅣㅐㅔㅑㅕㅛㅠㅢㅒㅖY行。야자여자요리우유의사얘기예
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
398顺境，逆境戴骁勇
2018.11.27周二雾霾最近儿子进入了一段顺境期，今天表现尤其不错。今天的数学测试成绩喜人，没有出现以往的计算错误，整个卷面书写工整，附加题也在规定时间内完成且做对。为迎接体育测试的锻炼有了质的飞跃。坐位体前屈成绩突飞猛进，估测成绩能达到12cm，这和上次测试的零分来比，简直是逆袭。儿子还在不断锻炼和提升，唯恐到时候掉链子。跑步姿势在我的调教下，逐渐正规起来，速度随之也有了提升。今晚测试的50
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
【JS】执行时长(100分) |思路参考+代码解析（C++） l939035548 JS 算法数据结构 c++
题目为了充分发挥GPU算力，需要尽可能多的将任务交给GPU执行，现在有一个任务数组，数组元素表示在这1秒内新增的任务个数且每秒都有新增任务。假设GPU最多一次执行n个任务，一次执行耗时1秒，在保证GPU不空闲情况下，最少需要多长时间执行完成。题目输入第一个参数为GPU一次最多执行的任务个数，取值范围[1,10000]第二个参数为任务数组长度，取值范围[1,10000]第三个参数为任务数组，数字范围
CX8836：小体积大功率升降压方案推荐（附Demo设计指南）诚芯微科技社交电子
CX8836是一颗同步四开关单向升降压控制器，在4.5V-40V宽输入电压范围内稳定工作，持续负载电流10A，能够在输入高于或低于输出电压时稳定调节输出电压，可适用于USBPD快充、车载充电器、HUB、汽车启停系统、工业PC电源等多种升降压应用场合，为大功率TYPE-CPD车载充电器提供最优解决方案。提供CX8836Demo测试、CX8836样品申请及CX8836方案开发技术支持。CX8836同升
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
2019-3-23晨间日记红红火火小耳朵
今天是什么日子起床：7点40就寝：23点半天气：有太阳，不过一会儿出来一会儿进去特别清爽的凉意，还蛮舒服的心情：小激动要给女朋友过生日啦纪念日：田田女士过生日任务清单昨日完成的任务，最重要的三件事：1.英语一对一2.运动计划3.认真护肤习惯养成：调整状态周目标·完成进度英语七天打卡（5/7）轻课阅读（87/180）音标课（25/30）读书（福尔摩斯一章）学习·信息·阅读#英语课#Cookingte
Linux MariaDB使用OpenSSL安装SSL证书 Meta39 MySQL Oracle MariaDB Linux Windows ssl linux mariadb
进入到证书存放目录，批量删除.pem证书警告：确保已经进入到证书存放目录find.-typef-iname\*.pem-delete查看是否安装OpenSSLopensslversion没有则安装yuminstallopensslopenssl-devel开启SSL编辑/etc/my.cnf文件（没有的话就创建，但是要注意，在/etc/my.cnf.d/server.cnf配置了datadir的，
ios GCD _Waiting_
1.GCD任务和队列学习GCD之前，先来了解GCD中两个核心概念：任务和队列。任务：就是执行操作的意思，换句话说就是你在线程中执行的那段代码。在GCD中是放在block中的。执行任务有两种方式：同步执行（sync）和异步执行（async）。两者的主要区别是：是否等待队列的任务执行结束，以及是否具备开启新线程的能力。同步执行（sync）：同步添加任务到指定的队列中，在添加的任务执行结束之前，会一直等
为什么你总是对下属不满意? ZhaoWu1050
【ZhaoWu的听课笔记】大多数公司，都存在两种问题。我创业四年，更是体会深切。这两种问题就是：老板经常不满意下属的表现；下属总是不知道老板想要什么；虽然这两种问题普遍存在，其实解决方法并不复杂。这节课，我们再聊聊第一个问题：为什么老板经常不满意下属表现?其实，这背后也是一条管理常识。管理学家德鲁克先生早就说过：管理者的任务，不是去改变人。*来自《卓有成效的管理者》只是大多数老板和我一样，都是一边
多线程之——ExecutorCompletionService 阿福德
在我们开发中，经常会遇到这种情况，我们起多个线程来执行，等所有的线程都执行完成后，我们需要得到个线程的执行结果来进行聚合处理。我在内部代码评审时，发现了不少这种情况。看很多同学都使用正确，但比较啰嗦，效率也不高。本文介绍一个简单处理这种情况的方法：直接上代码：publicclassExecutorCompletionServiceTest{@TestpublicvoidtestExecutorCo
python多线程程序设计之一 IT_Beijing_BIT #Python 程序设计语言 python
python多线程程序设计之一全局解释器锁线程APIsthreading.active_count()threading.current_thread()threading.excepthook(args,/)threading.get_native_id()threading.main_thread()threading.stack_size([size])线程对象成员函数构造器start/ru
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
2020-8-19晨间日记：看过的电影盐大虾
今天是周三起床：6点半就寝：11点天气：晴心情：正常纪念日：周三任务清单今日完成的任务，最重要的三件事：1.整理写过的文档2.电影《电灯泡》3.这就是街舞第三季第五期改进：早睡早起习惯养成：早睡早起，看书周目标·完成进度两篇文章学习·信息·阅读电影艺术发展史相关教材健康·饮食·锻炼吃了挺多零食，还喝了果粒橙，还是得少吃，多锻炼，不然会慢慢死掉的。人际·家人·朋友淡定交流，不放在心上。工作·思考专心
第1步win10宿主机与虚拟机通过NAT共享上网互通学习3人组大数据大数据
VM的CentOS采用NAT共用宿主机网卡宿主机器无法连接到虚拟CentOS要实现宿主机与虚拟机通信，原理就是给宿主机的网卡配置一个与虚拟机网关相同网段的IP地址，实现可以互通。1、查看虚拟机的IP地址2、编辑虚拟机的虚拟网络的NAT和DHCP的配置，设置虚拟机的网卡选择NAT共享模式3、宿主机的IP配置，确保vnet8的IPV4属性与虚拟机在同一网段4、ping测试连通性[root@localh
spring如何整合druid连接池？惜.己 spring spring junit 数据库 java idea 后端 xml
目录spring整合druid连接池1.新建maven项目2.新建mavenModule3.导入相关依赖4.配置log4j2.xml5.配置druid.xml1)xml中如何引入properties2)下面是配置文件6.准备jdbc.propertiesJDBC配置项解释7.配置druid8.测试spring整合druid连接池1.新建maven项目打开IDE（比如IntelliJIDEA,Ecl
Python神器！WEB自动化测试集成工具 DrissionPage 亚丁号 python 开发语言
一、前言用requests做数据采集面对要登录的网站时，要分析数据包、JS源码，构造复杂的请求，往往还要应付验证码、JS混淆、签名参数等反爬手段，门槛较高。若数据是由JS计算生成的，还须重现计算过程，体验不好，开发效率不高。使用浏览器，可以很大程度上绕过这些坑，但浏览器运行效率不高。因此，这个库设计初衷，是将它们合而为一，能够在不同须要时切换相应模式，并提供一种人性化的使用方法，提高开发和运行效率
python批量读取tiff文件_Python Pillow批量转换tif格式到jpg weixin_39557797
最近因为想要整下网站的壁纸，从网站下载了别人整理好的合集压缩包，解压之后，却发现里面的文件都是tif的，tif格式网站和电脑都不认的，根本不能作壁纸。这时候，就需要转换图片格式了，首先我找了几款转换格式的软件，发现效果都不好，要不是不支持tif格式，要不就是转换出来的图片糊的不行。最终，还是决定用Python的Pillow库来写一个脚本，完成这个任务。下面是整个的小脚本----importosim
Python多线程实现大规模数据集高效转移 sand&wich 网络 python 服务器
背景在处理大规模数据集时，通常需要在不同存储设备、不同服务器或文件夹之间高效地传输数据。如果采用单线程传输方式，当数据量非常大时，整个过程会非常耗时。因此，通过多线程并行处理可以大幅提升数据传输效率。本文将分享一个基于Python多线程实现的高效数据传输工具，通过遍历源文件夹中的所有文件，将它们移动到目标文件夹。工具和库这个数据集转移工具主要依赖于以下Python标准库：os：用于文件系统操作，如
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
Python实现下载当前年份的谷歌影像 sand&wich python 开发语言
在GIS项目和地图应用中，获取最新的地理影像数据是非常重要的。本文将介绍如何使用Python代码从Google地图自动下载当前年份的影像数据，并将其保存为高分辨率的TIFF格式文件。这个过程涉及地理坐标转换、多线程下载和图像处理。关键功能该脚本的核心功能包括：坐标转换：支持WGS-84与WebMercator投影之间转换，以及处理中国GCJ-02偏移。自动化下载：多线程下载地图瓦片，提高效率。图像
C++八股 Petrichorzncu 八股总结 c++开发语言
这里写目录标题C++内存管理C++的构造函数，复制构造函数，和析构函数深复制与浅复制：构造函数和析构函数哪个能写成虚函数，为什么？C++数据结构内存排列结构体和类占用的内存：==虚函数和虚表的原理==虚函数虚表（Vtable）虚函数和虚表的实现细节==内存泄漏==指针的工作原理函数的传值和传址new和delete与malloc和freeC++内存区域划分C++11新特性C++常见新特性==智能指针
放松的一天 4da9b7687fa0
20190325总结起床07:20图片发自App睡觉:23:00天气:晴今日任务清单学习·信息·阅读•水滴阅读Day40Alice’sAdventuresinWonderlandChapter6.2图片发自App•BBC跟读训练营Day24图片发自App图片发自App图片发自App•潘多拉口语训练营Day6Wow.Whatabigboy!•文化知识学习今日无•阅读时间地狱健康·饮食·锻炼•饮食目标
[Unity]在场景中随机生成不同位置且不重叠的物体 Bartender_Jill Graphics图形学笔记 unity 游戏引擎动画
1.前言最近任务需要用到Unity在场景中随机生成物体，且这些物体不能重叠，简单记录一下。参考资料:Howtoensurethatspawnedtargetsdonotoverlap?2.结果与代码结果如下所示：代码如下所示：usingSystem.Collections.Generic;usingUnityEngine;namespaceAssets.Scripts{publicclassNew
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l