Icemelon99

python详解(8)--python中的多任务(进程与线程)

多任务：指的是一台电脑可以同时运行多个应用程序（一个应用程序可能有多个进程），是一种共享CPU的方法。

协同式多任务(cooperative multitasking)：进程在执行过程中不受限制的占用cpu，不存在时间片概念，系统对cpu使用权的收回要靠进程主动上交。

抢先式多任务(preemptive multitasking)：当一个新的进程开始时，在它的时间片（timeslice）之内，cpu的使用权是在这个进程手里的，当时间片结束时，系统要收回cpu的使用权做下一轮分配，即由系统进行cup使用权的分配与应用程序无关。

单核：CPU集成了一个运算核心，所有的任务都是由这个运算核心完成的，同一时间只能完成一个任务。

多核：CPU集成了多个运算核心，可以同一时间让多个运算核心同时工作完成多个任务。

并发：任务数多于CPU核心数，通过操作系统调度（Scheduling）方法，在很短时间内不断切换（时间片轮转，并有优先级算法等以任务的重要度优先考虑），实现在固定时间内多个任务共同执行。

并行：任务数小于CPU核心数，多个任务执行于不同的运算核心，真正的同时执行。

程序（program）：是一种静态的实体，如封装的EXE文件，.py文件等。

进程（process）：可以认为是运行的程序，是一个动态的实体，代表程序的执行过程，随着程序中指令的执行而不断的变化，在某个特定时刻的进程的内容被称为进程映像（process image），分为①正文段（text，被执行的机器指令，即代码）②用户数据段（user segment，存放进程在执行时直接操作的所有数据，包括进程使用的全部变量在内）③系统数据段（system segment，存放程序运行的环境，即进程的控制信息，是进程与程序的区别所在）；进程有三种状态，就绪态、执行态、等待态（堵塞态），是多任务的一种实现方式。

线程(thread)：线程（有时候称为轻量级进程）与进程类似，不过它们是在同一个进程下执行的，并共享相同的上下文，即将多任务的思想拓展到应用层面，将单个任务分解为小任务，再将这些任务分配给不同的CPU内核，提高进程速度；以python程序为例，其主代码顺序执行即主线程，在主线程过程中有一些函数、类等也需要新的线程去执行，称之为子线程。是多任务的一种轻量级的实现方式。

一、python中的多线程

python中的threading模块
python内置了threading模块（其前身为thread模块，但相对底层，在python3中更名为_thread），可用于多线程的执行，threading模块的类对象如下：

Thread	表示一个执行线程的对象
Lock	锁对象
RLock	可重入锁对象，使单一线程可以（再次）获得已持有的锁（递归锁）
Condition	条件变量对象，使得一个线程等待另外一个线程满足特定的条件，比如改变状态或者某个数据值
Event　	条件变量的通用版本，任意数量的线程等待某个事件的发生，在该事件发生后所有的线程都将被激活
Semaphore	为线程间的有限资源提供一个计数器，如果没有可用资源时会被阻塞
BoundedSemaphore	与Semaphore相似，不过它不允许超过初始值
Timer	与Thread类似，不过它要在运行前等待一定时间
Barrier	创建一个障碍，必须达到指定数量的线程后才可以继续

threading.enumerate() 返回一个列表，列表中是当前的线程，其中主线程显示为MainThread
threading.current_thread() 返回当前线程，线程名在定义线程时指定，若不指定系统会默认写为Thread-1等，除了打印时用于显示没有别的用途

其中Thread类是线程的主要执行对象，其他类都属于同步机制。

# Thread类属性
name	线程名
ident	线程的标识符
daemon	布尔值，表示这个线程是否是守护线程

# Thread类的主要方法
__init__(group=None,target=None,name=None,args=(),kwargs={},verbose=None,daemon=None)	实例化一个线程对象，需要一个可调用的target对象，以及参数args或者kwargs。还可以传递name和group参数。daemon的值将会设定thread.daemon的属性
start()	开始执行该线程
run()	定义线程的方法（一般开发者在子类中重写此方法）
join(timeout=None)	直至启动的线程终止之前一直挂起；除非给出了timeout(单位秒)，否则一直被阻塞

在python中使用多线程的常用方法有两种：
(1)创建Thread类实例，传递函数作为线程执行的内容。

def loop():
    n = 0
    while n < 5:
        n = n + 1
        print(threading.current_thread().name)
        time.sleep(1)
t = threading.Thread(target=loop, name='LoopThread')
t.start()
t.join()
print('end')

如上所示，直接生成Thread实例，调用start()方法即开始执行线程，join()方法意为等待子线程执行完毕后再执行主线程，否则'end'会在loop函数调用前就打印出来。

(2)派生Thread的子类，并创建子类的实例。

class MyThread(threading.Thread):
    def __init__(self,func,args,name=''):
        threading.Thread.__init__(self)
        self.func = func
        self.name = name
        self.args = args
        
    def run(self):
        print('开始执行',self.name,' 在：',ctime())
        self.res = self.func(*self.args)
        print(self.name,'结束于：',ctime())
        
    def getResult(self):
        return self.res

如上所示，自定义Thread的派生类，在其中定义run方法(一般在run方法中会直接调用start()/join()方法)，其实只是上述方法的封装，但更适合面向对象的开发。
注：①主线程是可能在子线程之前结束的，但其并不会直接将子线程结束掉，join()只有在主线程需要等待子线程完成时候才是有用的(主线程与子线程是相互独立的，其都同属于一个进程，在默认情况下，进程会等待所有的子线程结束后再结束)；
②只有调用实例的start方法时，才会创建并开始线程的执行；
③假如在一个函数中使用线程并使用变量传入参数，若子线程函数需要等待，而主线程很快的执行完毕，由于主线程执行完毕后与它关联的所有数据都会被回收，则子线程的参数就不存在了（正常情况下子线程会自动关闭，但特殊情况下其会报错）。

python多线程的同步机制

多线程与全局变量：在一个进程的多线程任务中，多个线程共享全局变量(创建Thread类实例时传入的变量就是全局变量，或处理磁盘上的文件等)，即在一个线程中声明或更改了全局变量，按时间顺序另一个线程会获得更改后的全局变量。注意，在共享全局变量时，多个线程不断调用全局变量并且不断改变，可能会产生全局变量在不同进程中同时改变，最终得到的运算结果与预期值不同(例如传入的参数是一个可变对象，则每个线程对参数的改变都会影响到其他线程)。

线程同步：为了解决上述问题，需要同步(协同步调)，如按照约定好的次序执行，A在执行到一定程度时依靠B的结果，反之相同，当多个线程几乎同时修改一个共享数据时，需要同步控制，线程同步能保证多个线程安全访问共享资源，threading模块拥有多个同步机制，如下。

互斥锁机制 Lock类
互斥锁为共享资源引入一个状态，当某个线程要修改共享资源时先将其’锁定’，锁定状态下其他线程无法更改(但可以读取)该共享资源，其保证了每次只有一个线程进行写入操作，保证了对共享资源进行修改的原子性()，保证了多线程时数据的正确性。

Lock拥有两种状态：locked and unlocked，并通过acquire() and release()来改变状态。有如下规则:

如果当前状态是unlocked状态，调用acquire()方法改变状态为locked。
如果当前状态是locked状态，调用acquire()方法将会阻塞(blocked, 同步阻塞)直到另一个线程调用release()方法。
如果当前状态是unlocked状态，调用release()方法将会造成RuntiemError 异常。
如果当前状态是locked状态，调用release()方法改变状态为unlocked。

mutex = threading.Lock() # 创建锁，默认状态为unlocked
mutex.acquire() # 上锁，返回值为True
mutex.release() # 解锁，无返回值

with mutex: # 锁的另一种用法，其将上锁与解锁封装进了上下文管理器中
	dosomething()

注：①上锁的代码越少越好。锁是可以有多个的，当不同的线程持有不同的锁并同时试图获取对方的锁时，可能出现死锁；
②锁的优势是确保了某段关键的代码可以从头到尾的完整执行，但也阻止了多线程的并发执行，在某段加锁的代码实际上只能单线程执行；
③死锁的解决办法：Ⅰ添加超时时间，即在join函数中限定阻塞时间；Ⅱ银行家算法：银行家手中的资金并不足以同时满足多位客户的要求，因此它从当前状态出发，逐个按安全序列检查各客户谁能完成工作，然后假定其完成工作且归还全部贷款，再进而检查下一个能完成工作的客户；
④RLock模块与Lock模块的功能大部分相同，其区别是：RLock模块的lock允许同一线程内对同一lock进行多次获取，但注意必须使获取与释放成对出现。

信号量机制 Semaphore类
①信号量基于内部计数器counter，每次acquire()被调用时counter减1，每次release()被调用计数器加1。如果counter==0，再去调用acquire()将阻塞，其常用于限制对资源的访问；
②Semaphore模块的用法与同步阻塞状态与Lock类似，同样使用acquire()与release()函数，同样可使用with语句。

sem = threading.Semaphore(value = 3)

条件判断机制 Condition类
一个线程在等待特定的条件而另一个线程表明这个特定条件已经发生，只要条件发生，线程就需要获得lock然后独立的使用共享资源，条件判断机制最常用的就是生产者-消费者模式，消费者等待生产者来表明特定条件，其中不仅有acquire(),release()方法，还有用于条件判断的wait(),notify(),notifyAll()方法，举例如下：

class Goods:#产品类
  def __init__(self):
    self.count = 0
  def add(self,num = 1):
    self.count += num
  def sub(self):
    if self.count>=0:
      self.count -= 1
  def empty(self):
    return self.count <= 0
 
class Producer(threading.Thread):#生产者类
  def __init__(self,condition,goods,sleeptime = 1):#sleeptime=1
    threading.Thread.__init__(self)
    self.cond = condition
    self.goods = goods
    self.sleeptime = sleeptime
  def run(self):
    cond = self.cond
    goods = self.goods
    while True:
      cond.acquire()#锁住资源
      goods.add()
      print("产品数量:",goods.count,"生产者线程")
      cond.notifyAll()#唤醒所有等待的线程--》其实就是唤醒消费者进程
      cond.release()#解锁资源
      time.sleep(self.sleeptime)
 
class Consumer(threading.Thread):#消费者类
  def __init__(self,condition,goods,sleeptime = 2):#sleeptime=2
    threading.Thread.__init__(self)
    self.cond = condition
    self.goods = goods
    self.sleeptime = sleeptime
  def run(self):
    cond = self.cond
    goods = self.goods
    while True:
      time.sleep(self.sleeptime)
      cond.acquire()#锁住资源
      while goods.empty():#如无产品则让线程等待
        cond.wait()
      goods.sub()
      print("产品数量:",goods.count,"消费者线程")
      cond.release()#解锁资源
 
g = Goods()
c = threading.Condition()
 
pro = Producer(c,g)
pro.start()
 
con = Consumer(c,g)
con.start()

同步队列机制
同步队列机制依据队列的特性来实现，其使用的不是threading模块中的类，而是queue中的队列类Queue，Queue将锁的机制封装，其也适用于生产者-消费者机制，即类似于消息队列，当队列中无任务时消费者阻塞，当队列满时生产者阻塞，可以对队列添加一个join()函数使得当队列为空(所有任务都被处理完)时主进程退出。

事件通知机制 Event类
一个线程发出一个event的信号并且其他的线程等待它。Event类实例的方法有set()设置事件，clear()清除事件并通知消费者，wait()保持阻塞状态直至set()被调用。

条件变量与互斥锁、信号量的区别
①互斥锁必须总是由给它上锁的线程解锁，信号量的挂出即不必由执行过它的等待操作的同一进程执行，一个线程可以等待某个给定信号灯，而另一个线程可以挂出该信号灯；
②互斥锁要么锁住，要么被解开（二值状态，类型二值信号量）；
③由于信号量有一个与之关联的状态（它的计数值），信号量挂出操作总是被记住。然而当向一个条件变量发送信号时，如果没有线程等待在该条件变量上，那么该信号将丢失；
④互斥锁是为了上锁而设计的，条件变量是为了等待而设计的，信号灯既可用于上锁，也可用于等待，因而可能导致更多的开销和更高的复杂性。

python中的守护线程与join方法
①守护线程要守护的对象是主线程，若某个线程是守护线程，则当主线程结束时该线程随之结束，t.setDaemon(True)；
②join()方法阻塞的是除自己以外的所有线程(包括主线程与守护线程)，因此join()方法一般在所有线程都开启之后统一调用，否则子线程之间会相互阻塞，变成顺序执行。

独立全局变量
threading模块中的l = threading.local()创建一个全局对象，其作用为在每个线程中都可以将l作为一个实例进行实例属性的赋值l.name = 'bob'，在进程中维护每一个线程的副本，且每个属性都是其线程的局部变量(属性名可以重复，线程间互不干扰)，相当于一个全局的以线程id为key的嵌套字典。

二、进程与线程的区别

依存关系
①进程与线程都是由操作系统所提供的程序运行的基本单元，系统利用其实现对应用的并发性；
②线程不能独立运行，其必须依赖于进程才能运行，一个进程中可以包含多个线程，但必须至少有一个线程；
③进程与进程之间没有关系，完全独立；
④同属一个进程的多个线程之间处于相同的级别(不论创建关系如何)，进程内的任何线程都可以销毁、挂起、恢复和更改其它线程(包括主线程)的优先权，销毁主线程将导致该进程的销毁，对主线程的修改可能影响所有的线程，因此线程是可以影响其所在的进程的(但一般不要这么做，应等待线程自行停止)。

占据资源
①如前所述，一个进程中必然有三部分资源：
Ⅰ正文段（text，被执行的机器指令，即代码）Ⅱ用户数据段（user segment，存放进程在执行时直接操作的所有数据，包括进程使用的全部变量在内）Ⅲ系统数据段（system segment，存放程序运行的环境，即进程的控制信息/上下文，是进程与程序的区别所在），这部分资源是每一个进程都独立拥有的，进程在开启时就会在内存中开辟一部分空间用以保存进程上下文，各个进程之间互不干扰，都拥有自己的正文段和数据段；
②线程拥有的所有资源都来自于进程，同一个进程的多个线程之间共享进程的资源，即代码段和数据段，具体可划分如下：
Ⅰ堆：是进程与线程共有的空间，分全局堆和局部堆：全局堆就是所有没有分配的空间，局部堆就是用户分配的空间。堆在操作系统对进程初始化的时候分配，运行过程中也可以向系统要额外的堆，但是记得用完了要还给操作系统，要不然就是内存泄漏。
Ⅱ栈：是每个线程独有的，用以保存其运行状态和局部自动变量，栈在线程开始的时候初始化，每个线程的栈互相独立，操作系统在切换线程的时候会自动的切换栈，在高级语言中无须开发者操作切换栈，由系统完成；
Ⅲ同进程下的多线程共享的内容有：进程代码段、进程的公有数据(即全局变量，线程可以利用公有数据很容易的实现相互之间的通讯)、进程打开的文件描述符、信号的处理器、进程的当前目录和进程用户ID与进程组ID等；
Ⅳ多线程并发运行时独有的内容有：唯一的线程ID、寄存器组的值(用以保存线程的运行上下文的容器的位置)、堆栈(线程独有的堆栈用以保存局部变量)、错误返回码、信号屏蔽码、线程优先级等；
③总结来说，线程几乎不额外占用系统资源，其所有的资源都来自于所在的进程，且多个线程之间共享其进程资源，而新建一个进程则需要很大的开销。

开销与切换与根本差异
①操作系统新建一个进程的开销是很大的，CPU其对于一个进程/线程的调用分为三部分：加载上下文→CPU执行代码内容→保存上下文，进程的上下文很大内容很多，因此CPU切换会更加消耗时间、效率低，而线程的上下文较少，且多线程共享进程的上下文，因此在同进程的线程间切换无需重新加载全局上下文，速度快效率高，即进程的创建和切换都很昂贵，而线程的创建和切换相比进程的开销要小很多；
②进程是系统中能独立运行的并作为资源分配的最小单位，线程的划分尺度小于进程，是CPU调度和分派的最小单位，这也是最重要最根本的区别。

通信与安全
①线程间的同步控制参上述(python中的多线程)，其拥有互斥锁、信号量、条件判断、信号通知、队列等机制，进程间通信IPC(Interprocess communication)有管道、命名管道、信号量、消息队列、共享内存等机制(后详)，进程间同步(后详)；
②相比较来说，线程间通信更加的方便(共享全局变量)，进程间通信相对复杂，但线程的同步比进程的同步更难操作；
③由于进程相互独立，因此多进程程序更加的安全/健壮，单个进程的死亡不会影响其他进程，而单进程多线程程序相对不安全，单个线程的死亡可能会对整个程序产生很大的影响。

注：
文件描述符：是内核为了高效管理已被打开的文件所创建的索引，用于指向被打开的文件，所有执行I/O操作的系统调用都通过文件描述符；文件描述符是一个简单的非负整数，用以表明每个被进程打开的文件，也可以理解为当前占用文件的身份ID。
每个进程所能占用的文件描述符是有最大限制的(其依赖于系统和内存)，所有已打开的文件描述符会组成一个有序列表，其中系统默认占用0,1,2分别为标准输入、标准输出、标准错误，当文件关闭后、后续文件打开会占用之前的文件描述符而非往后顺延。
python中可以使用打开文件对象(即字节流)的fileno()方法查看当前文件的文件描述符，sys.stdin.fileno()返回0。

同步控制与通信
同步与通信是不同的两个概念，同步指的是对竞争资源的访问的一种处理方式，避免一个线程/进程长期占用一个资源的目的，而通信指的是不同进程/线程之间传播或交换信息，进程与线程都有各自的同步机制和通信方式。
①线程间通信一般采用全局变量，也有消息、事件等方式，而进程间通信即IPC，有多种方式(后详)；
②线程的同步机制参上述，进程的同步机制主要是处理多进程同时使用一个文件、资源的情况，其实也相当于一种以操作系统为全局的全局变量；
③同步其实也是一种通信方式。

三、python中的多进程

进程的创建
①但凡是硬件，都需要有操作系统去管理，只要有操作系统，就有进程的概念，就需要有创建进程的方式，有一些操作系统只为了一个应用程序设计，比如微波炉中的控制器，一旦启动微波炉，所有的进程都已经存在，归属于嵌入式，即对硬件、软件的运行方式都有明确的规定；
②平时常用的Win/Linux等系统都属于通用系统，需要跑很多进程且事先并不确定进程的具体内容，这就需要有系统运行过程中创建或者撤销进程的能力，创建新进程主要有四种情况：
Ⅰ系统初始化(对于操作系统来说其分为前台进程与后台进程，前台进程负责与用户交互，后台进程用于操作硬件、维持运转等)；
Ⅱ进程开启子进程；
Ⅲ用户的交互式请求创建子进程(其实也属于进程开启子进程)；
Ⅳ一个批处理作业的初始化(只在大型机的批处理系统中应用)；
但无论哪种，新进程的创建都是由一个已经存在的进程执行了一个用于创建进程的系统调用而创建的；
③在unix平台下，可以通过系统的fork调用来创建子进程，python中的表示为os.fork()，这个函数调用时就创建了一个与父进程一模一样的副本，二者拥有相同的存储映像、同样的环境字符串和同样的打开文件，将这个进程称为子进程；fork函数调用后，在父进程和子进程中返回的值是不同的，在父进程中返回子进程的pid，在子进程中返回0，可以通过os.getpid()来获取当前进程的进程号，os.getppid()获取父进程的进程号；
④在windows平台下，系统调用的是CreateProcess，其既处理进程的创建，也负责把正确的程序装入新进程；
⑤在UNIX中，子进程的初始地址空间是父进程的一个副本(子进程和父进程是可以有只读的共享内存区的)，但是在windows中，从一开始父进程和子进程的地址空间就是不同的。

注：①进程的三种状态(前面已提到)：Ⅰ运行态：应用程序正在被CPU执行中；Ⅱ阻塞态：当前进程突然要做I/O操作，然后CPU去执行其他的程序；Ⅲ就绪态：时刻准备着能够被执行。
②写时拷贝(copy-on-write)：子进程在开启时会复制复制主进程的所有地址空间、环境变量、文件描述符（file descriptors）到子进程，即子进程可以直接使用主进程的变量，包括 import 过的模块，且这种复制是写时拷贝（copy on write），即只有子进程内容要发生变化时，才将主进程的内容复制一份给子进程并进行改动，否则是共享的。

python中的multiprocessing模块
与threading模块类似的，其中除了Process类用于进程实体的创建外，其余类都是用于进程间通信的，分属不同的同步机制。
进程的一些用法：

Process([group [, target [, name [, args [, kwargs]]]]])
target：如果传递了函数的引用，可以任务这个子进程就执行这里的代码
args：给target指定的函数传递的参数，以元组的方式传递
kwargs：给target指定的函数传递命名参数
name：给进程设定一个名字，可以不设定
group：指定进程组，大多数情况下用不到

Process创建的实例对象的常用方法：

start()：启动子进程实例（创建子进程）
is_alive()：判断进程子进程是否还在活着
join([timeout])：是否等待子进程执行结束，或等待多少秒
terminate()：不管任务是否完成，终止子进程，但不是立即关闭，有一个等待操作系统去关闭这个进程的时间

Process创建的实例对象的常用属性：

name：当前进程的别名，默认为Process-N，N为从1开始递增的整数
pid：当前进程的pid（进程号），使用os.getpid()可获取当前进程进程号，使用os.getppid()可获取当前进程父进程进程号
daemon：表示是否为守护进程，默认为False，若设置为True，则表示为主进程的守护进程，必须在p.start ()之前进行设置

注：①在windows系统下，由于没有fork函数，其在创建进程的时候自动import启动它的这个文件，而在import的时候又执行了整个文件，如果将创建子进程的过程直接写在文件中就会无限递归创建子进程报错，因此必须把创建子进程的部分写在 if __name__ == '__main__'条件下；
②关于守护进程，守护进程内无法再开启子进程，并随主进程的关闭而关闭；
③进程中的join()方法与线程中join()效果不同，进程中的join()方阻塞主进程，令主进程等待该子进程结束后再执行，但线程中的join()方法阻塞所有线程，只要该线程没有结束，其他所有线程都等待；
④Process实例可以控制进程的创建、结束等，但其并不是进程本身；
⑤进程中的run()方法与线程中是类似的，当实例创建时若target不存在，则实例的start方法调用的就是类中的run方法；
⑥多个子进程执行的顺序不是根据启动顺序决定的；
⑦直接调用terminate()方法关闭进程会产生僵尸进程，start()与join()方法都会对僵尸进程进行处理(所有进程的此两种方法都可以)，也可以使用os.wait()方法对子进程进行回收，其返回一个包含pid的元组；
⑧僵尸进程：就是在主进程开启了一个子进程后，无论什么时候都可以去查看子进程的状态，即使子进程死掉了，也要为主进程保留子进程状态信息，僵尸进程是有害的，因为一个进程死掉后，它的PID不会立马消除，如果僵尸进程多了，PID还被占用着，操作系统再开启新的进程的话可能无法开启；
⑨孤儿进程：就是子进程还没有执行完，主进程就已经死掉了，但是子进程是无害的，此时子进程的PID由init进程去回收；
⑩fork函数兼容性/扩展性都很差，且容易产生僵尸进程和孤儿进程，需要手动回收资源，但是系统自带的接近低层的创建方式，运行效率高；使用python中multiprocessing模块创建子进程，属于高级方式，效率相对低，但功能完善，更安全。

python中多进程的同步机制
与多线程类似的，用于处理多个进程同时修改一块数据(文件、数据库中表等)时可能出现的冲突和错误。

互斥锁 multiprocessing.Lock
信号量 multiprocessing.Semaphore
事件 multiprocessing.Event
条件 multiprocessing.Condition
上述四个类在多进程中同样存在，在python中，其实multiprocessing的很大一部份与threading使用同一套API，只不过换到了多进程的情境，其原理类似，用法也几乎相同，但注意多进程中每个进程都有自己独立的全局变量，因此在进行多进程编程时，若要模拟同时修改某数据，可以使用文件或数据库。

注：①有必要对每个Process对象调用join()方法，以避免其结束后成为僵尸进程(占用pid)；
②应尽量避免使用上述接口，在multiprocessing模块中提供了更优秀的IPC接口(Queue和Pipe)，使用IPC的方式比上述接口效率更高，应该尽量避免处理复杂的同步和锁问题，这样也在有更多任务时方便扩展；
③使多进程共享资源很容易出问题，既麻烦效率又低，应尽可能的使用IPC的方式实现同步，注意IPC其实只是信息的交互，并不能实现资源共享，即一个进程去修改另一个进程的数据。

python中多进程的进程间通信(Interprocess communication)方式

队列 multiprocessing.Queue
队列本身的机制与其作为数据结构时相同，其额外开辟一块内存用于保存队列中的数据，因此其对于多进程来说相当于是全局的，且应该存储尽量少的数据，其可以完成进程间的数据共享，可以用于解耦(即使各个进程之间的依存度降低)，以下为简单用法：

q = Queue(maxsize) maxsize是队列中允许最大项数，省略则无大小限制
q.put (item, blocked=True, time) : 将item放入队列中, 如果当前队列已满, 就会阻塞, 直到有数据从管道中取出，若blocked为False，则不等待直接抛出Queue.Full异常
q.put_nowait (item) : 将item放入队列中, 如果当前队列已满, 不会阻塞, 但是会报错
q.get (blocked=True, time) : 返回放入队列中的一项数据, 由于队列的特点是先进先出(First In First Out, 简称FIFO), 取出的数据将是先放进去的数据, 若当前队列为空, 就会阻塞, 直到放入数据进来
q.get_nowait () : 返回放入队列中的一项数据, 同样是取先放进队列中的数据, 若当前队列为空, 不会阻塞, 但是会报错
q.empty () : 返回队列是否为空的bool值, 为空即为True,不为空即为False, 如果其他进程或线程正在往队列中添加数据, 结果是不可靠的, 即在返回和使用之间, 队列中可能已经放入了新的数据
q.size () : 返回队列中目前数据的正确数量, 同q.empty(), 并不可靠
q.full () : 返回队列是否已满的bool值, 同q.empty(), 并不可靠

高级队列 JoinableQueue

JoinableQueue(maxsize)的实例q除了与Queue对象相同的方法之外，还有：
q.task_done()：消费者使用此方法发出信号，表示q.get()的返回项目已经被处理。如果调用此方法的次数大于从队列中删除项目的数量，将引发异常
q.join()：生产者使用此方法发出信号，直到队列中所有的项目都被处理。阻塞将持续到队列中的每个项目均调用q.task_done()方法为止

即join()方法是生产者调用的，只需要调用一次，就为其生产的所有内容添加了标记(若有循环，则阻塞到所有标记都被消费者处理后才会继续生产)，而task_done()方法是消费者调用的，消费的每一个内容都需要调用一次。

注：①在使用队列时，需要将队列对象作为参数传入子进程调用的函数/方法中，解释器会自动将其作为进程以上的全局类型；
②queue模块中的队列类是线程安全的，multiprocessing模块中的队列类是进程安全的，注意不能混淆。

管道 multiprocessing.Pipe
①管道是一种可选单/双向通信的半双工通信方式，队列其实就是管道和锁的高级封装，且克服了一些问题，因此一般使用队列，管道的常用方法如下：
p,q = multiprocessing.Pipe(duplex=True) 参数默认为True，双向管道，若为False则为单向管道，其返回两个对象分别为管道的两端，都可以使用send()方法发送字符串，recv()方法接收字符串，close()方法关闭管道；
②管道的两端都可以发送或接收消息，但由于其是半双工通信，因此管道中最多只会保存一个数据，只有等一端发送的数据被另一端接收后才可以继续发送数据，否则会阻塞在发送端，为了避免混淆，一般对两个需要通信的进程每个传入一端的管道，足以完成通信；
③注意，管道和队列虽然实现了进程间消息传递，但其实它们使用的Queue()与Pipe()对象并不是同一个(内存地址不同)，解释器在底层完成了互相之间的通信工作，并实现了同步。

各种进程间通信机制：
管道pipe：管道是一种半双工的通信方式，数据只能单向流动，而且只能在具有亲缘关系的进程间使用。进程的亲缘关系通常是指父子进程关系。
命名管道FIFO：有名管道也是半双工的通信方式，但是它允许无亲缘关系进程间的通信。
消息队列MessageQueue：消息队列是由消息的链表，存放在内核中并由消息队列标识符标识。消息队列克服了信号传递信息少、管道只能承载无格式字节流以及缓冲区大小受限等缺点。
共享存储SharedMemory：共享内存就是映射一段能被其他进程所访问的内存，这段共享内存由一个进程创建，但多个进程都可以访问。共享内存是最快的 IPC 方式，它是针对其他进程间通信方式运行效率低而专门设计的。它往往与其他通信机制，如信号量，配合使用，来实现进程间的同步和通信。
python中的共享存储参下文。

进程池 multiprocessing.Pool
在实际处理问题的过程中, 忙时会有成千上万的任务需要被执行, 我们不可能创建那么多进程去完成任务。首先创建进程需要时间, 销毁进程同样需要时间. 即便是真的创建好了这么多进程, 操作系统也不允许他们同时执行的,这样反而影响了程序的效率.
进程池即定义一个池子, 在里面放上固定数量的进程 , 有任务要处理的时候就会拿一个池中的进程来处理任务, 等到处理完毕, 进程并不关闭而是放回进程池中继续等待任务. 如果需要有很多任务需要执行, 池中的进程数不够, 任务会就要等待进程执行完任务回到进程池, 拿到空闲的进程才能继续执行.池中的进程数量是固定的,那么同一时间最多有固定数量的进程(默认是CPU的核数)在运行. 这样不会增加操作系统的调度难度, 还节省了开闭进程的时间, 也一定程度上能够实现并发效果。
其常用方法如下：

Pool ( [numprocess [ ,initializer  [, initargs] ] ] ) : 创建进程池

numprocess : 要创建的进程数, 如果省略, 将默认使用os.cpu_count () 的值
initializer : 是每个工作进程启动时要执行的可调用对象, 默认为None
initargs : 是要传给initializer的参数组

主要方法

p.map(f, args) 与python中的map方法类似
p.map_async() 与map类似，不过是异步变体
p.apply (func [ ,args [ ,kwargs] ] ) : 在一个池工作进程中执行func(*args,**kwargs), 然后返回结果，这个结果就是func函数的返回值
注意: 此操作并不会在所有池工作进程中并发执行func函数, 如果要通过不同参数并发地执行func函数, 必须从不同线程调用p.apply()函数或者使用p.apply_async()
p.apply_async(func [ ,args [ ,kwargs] ] ) : 在一个池工作进程中执行func(*args,**kwargs), 然后返回结果
注意: 此方法的结果是AsyncResult类的实例, callback是可调用对象, 接收输入参数. 当func的结果变为可用时, 将直接传递给callback. callback禁止执行任何阻塞操作, 否则将接收其他异步操作中的结果
p.close() : 关闭进程池，此后进程池不再接收进程执行任务
p.join() : 等待所有工作进程退出. 此方法只能在close () 或terminate () 之后调用

其他方法

方法apply_async () 和map_async () 的返回值是AsyncResult的实例是obj. 实例具有以下方法:

obj.get () : 返回结果, 如果有必要则等待结果到达. timeout是可选的. 如果在制定时间内还没有到达, 将引发异常, 如果远程操作中引发了异常, 它将在调用此方法时再次被引发
obj.ready () : 如果调度完成, 返回True
obj.successful () : 如果调用完成也没有引发异常, 返回True, 如果在结果就绪之前调用此方法, 引发异常
obj.wait (timeout) :等待结果变为可用
obj.terminate () : 立即终止所有工作进程, 同时不执行任何清理或结束任何挂起工作, 如果p被垃圾回收, 将自动调用此函数

注：①apply/map方法在同一时间只允许一个进程进入pool，在该进程处理结束后，才可以有别的进程进入进程池获取任务进行处理；
②apply_async/map_async方法允许多个进程同时进入pool并同步获取任务进行处理，其返回值可以通过回调函数处理也可以直接调用get()方法阻塞等待；
③在异步处理任务时，一般添加p.close()与p.join()，因为异步处理任务时所有的子进程都是守护进程，但其实由于obj.get()方法是阻塞的，所以主进程仍然会阻塞直到所有的子进程任务执行完毕并执行完get方法后才关闭；
④一般在任务数不确定的情况下使用进程池，进程池中的进程其任务代码都是相同的，因此才可以共享资源不开启新的进程。

python中的多进程数据共享
multiprocessing模块中提供了Value(整型与字符串)，Array(元素类型相同的数组)等对象可用于共享内存，Manager模块封装了这些类，提供了一个更高级的对象，Manager支持的类型有list,dict,Namespace,Lock,RLock,Semaphore,BoundedSemaphore,Condition,Event,Queue,Value和Array。
使用mgr = multiprocessing.Manager()创建Manager()对象，其下可以使用mgr.dict()创建共享字典，mgr.list()创建列表等，在子进程中对这些对象进行改变后，
注：Manager对象类似于服务器与客户之间的通信 (server-client)，与我们在Internet上的活动很类似。我们用一个进程作为服务器，建立Manager来真正存放资源。其它的进程可以通过参数传递或者根据地址来访问Manager，建立连接后，操作服务器上的资源。在防火墙允许的情况下，我们完全可以将Manager运用于多计算机，从而模仿了一个真实的网络情境。

python中的分布式进程
上述Manager类中提供了很多可用于共享的类型，其实这些用于共享的类型就是通过服务器-客户端之间的通信实现的，将其注册到网络上，就可以直接通过网络连接实现分布式共享。
multiprocessing模块中提供了managers模块，其中提供了BaseManager类，该类中封装了注册等方法用以实现多机器的分布式进程。
但实际操作中使用RabbitMQ/redis等作为消息队列实现分布式部署的情况更多，进程间甚至是机器间的数据同步基本是以传递信息的方式实现的，真正的安全的共享数据会极大降低工作效率。

计算密集型和IO密集型任务
计算密集型任务的特点是要进行大量的计算，消耗CPU资源，因此其同时进行的任务数量应等于CPU核数，可使效率最大化。
涉及到网络、磁盘IO的任务都是IO密集型任务，这类任务的特点是CPU消耗很少，任务的大部分时间都在等待IO操作完成（因为IO的速度远远低于CPU和内存的速度），对于IO密集型任务，任务越多，CPU效率越高，但也有一个限度(常见的大部分任务都是IO密集型任务，比如Web应用)。
因此对于IO密集型任务，最合适的语言就是开发效率最高（代码量最少）的语言。

总结：本文简单介绍了python中的多线程与多进程及其一些使用方法和原理，同步与通信机制等，并着重分析了线程与进程的异同。

你可能感兴趣的:(python,python)

理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python编译器鹿鹿~ Python编译器 Python python 开发语言后端
嘿嘿嘿我又来了啊有些小盆友可能不知道Python其实是有编译器的，也就是PyCharm。你们可能会问到这个是干嘛的又不可以吃也不可以穿好像没有什么用，其实你还说对了这个还真的不可以吃也不可以穿，但是它用来干嘛的呢。用来编译你所打出的代码进行运行（可能这里说的有点不对但是只是个人认为）现在我们来说说PyCharm是用来干嘛的。PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Pyt
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
一文掌握python常用的list（列表）操作程序员neil python python 开发语言
目录一、创建列表1.直接创建列表：2.使用list()构造器3.使用列表推导式4.创建空列表二、访问列表元素1.列表支持通过索引访问元素，索引从0开始：2.还可以使用切片操作访问列表的一部分：三、修改列表元素四、添加元素1.append()：在末尾添加元素2.insert()：在指定位置插入元素五、删除元素1.del：删除指定位置的元素2.remove()：删除指定值的第一个匹配项3.pop()：
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
python中的深拷贝与浅拷贝 anshejd70787 python
深拷贝和浅拷贝浅拷贝的时候，修改原来的对象，浅拷贝的对象不会发生改变。1、对象的赋值对象的赋值实际上是对象之间的引用：当创建一个对象，然后将这个对象赋值给另外一个变量的时候，python并没有拷贝这个对象，而只是拷贝了这个对象的引用。当对对象做赋值或者是参数传递或者作为返回值的时候，总是传递原始对象的引用，而不是一个副本。如下所示：>>>aList=["kel","abc",123]>>>bLis
用Python实现简单的猜数字游戏程序媛了了 python 游戏 java
猜数字游戏代码：importrandomdefpythonit():a=random.randint(1,100)n=int(input("输入你猜想的数字："))whilen!=a:ifn>a:print("很遗憾，猜大了")n=int(input("请再次输入你猜想的数字："))elifna::如果玩家猜的数字n大于随机数字a，则输出"很遗憾，猜大了"，并提示玩家再次输入。elifn
用Python实现读取统计单词个数程序媛了了 python 游戏 java
完整实例代码：fromcollectionsimportCounterdefpythonit():danci={}withopen("pythonit.txt","r",encoding="utf-8")asf:foriinf:words=i.strip().split()forwordinwords:ifwordnotindanci:danci[word]=1else:danci[word]+=
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，