采蘑菇的下午茶

python学习之路--多线程精讲

并发与多线程

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3jMlBs35-1589445214945)(http://prya5mckf.bkt.clouddn.com/blog/20190618/0BtjeHsSij71.jpg?imageslim)]

基本概念

并发与并行的区别

并行: parallel 互不干扰的同一时刻做几件事情

并发: concurrency 同一时刻有很多事情要做

并发的解决

1> 对列,缓冲区 # 排队如Queue Lifoqueue PriorityQueue (小顶堆实现)

2> 争抢 # 互相抢,哪个抢到就执行哪个

3> 预处理 # 提前处理好一些事情

4> 并行 # 多个任务同时进行

5> 提速 # 使用处理速度更快的设备提高单个CPU性能,或者服务器安装更多的CPU

6> 消息中间件 # 如进地铁一样,设置中间排队常见消息中间件有: 常见的消息中间件有RabbitMQ、ActiveMQ（Apache）、RocketMQ（阿里Apache）、kafka（Apache）等。

进程与线程

进程: 进程是计算机程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单元,是操作系统机构的基础

进程和程序的基础

程序是源代码编译后的文件,而这些文件存放在磁盘上,当程序被操作系统加载到内存中,就是进程,进程中存放着指令和数据,它也是线程的容器

Linux 进程有父进程,子进程,windows 的进程是平等关系

线程，有时被称为轻量级进程(Lightweight Process，LWP），是程序执行流的最小单元。
一个标准的线程由线程ID，当前指令指针(PC）、寄存器集合和堆栈组成。
在许多系统中，创建一个线程比创建一个进程快10-100倍。

进程、线程的理解
现代操作系统提出进程的概念，每一个进程都认为自己独占所有的计算机硬件资源。
进程就是独立的王国，进程间不可以随便的共享数据。
线程就是省份，同一个进程内的线程可以共享进程的资源，每一个线程拥有自己独立的堆栈。

线程的状态

状态	含义
就绪	线程能够运行，但在等待被调度。可能线程刚刚创建启动，或刚刚从阻塞中恢复，或者被其他线程抢占
运行	线程正在运行
阻塞	线程等待外部事件发生而无法运行,如I /O操作
终止	线程完成,或退出,或被取消

python中的进程和线程

进程会启动一个解释器进程，线程共享一个解释器进程。

Python 的线程开发

Python的线程开发使用标准库threading
进程靠线程执行代码，至少有一个主线程，其它线程是工作线程。
主线程是第一个启动的线程。
父线程：如果线程A中启动了一个线程B，A就是B的父线程。
子线程：B就是A的子线程。

Thread类

def __init__(self,group= None,target =None,name = None,args = (),kwargs = None,*,demon = None)

参数	含义
target	线程调用的对像,就是目标函数
name	为线程起一个名字
args	为目标函数传递实参,元组类型
kwargs	为目标函数关键字传参,字典类型
demon	继承父类的demon 为None ,表示等待线程,若为True表示不等待

import threading
def fun1():
    paaa
t = threading.Thread(target = fun1 ,name = 'fun1')
t.start()# 启动线程

通过threading.Thread创建一个线程对象，target是目标函数，可以使用name为线程指定名称。
但是线程没有启动，需要调用start方法。
线程之所以执行函数，是因为线程中就是要执行代码的，而最简单的封装就是函数，所以还是函数调用。
函数执行完，线程也就退出了。

线程退出

python中没有提供线程退出的方法,线程在下面情况下退出
1,线程函数内语句执行完毕
2,线程函数中抛出未处理异常

线程的传参

t = threading.Thread(target = fun1,name= 'fun1',args = (1,3,3),kwargs = ('x'= 123,'y'= 456))
t.start()

threading的属性和方法

名称	含义
current_thread()	返回当前线程对像
main_thread()	返回主线程对像
active_count()	当前处于alive状态的线程个数
enumerate()	返回所有活着的线程列表,不包括已终止的线程和未开始的线程
get_ident()	返回当前线程的ID,非0 整数

active_count(),enumerate 方法返回的值还包括主线程

Thread实例的属性和方法

名称	含义
name	只是一个名字，只是个标识，名称可以重名。getName()、setName()获取、设置这个
ident	线程ID，它是非0整数。线程启动后才会有ID，否则为None。线程退出，此ID依旧可以访问.此ID可以重复使用
is_alive()	返回线程是否活着

run() 与start()

start()方法会调用run()方法，而run()方法可以运行函数。
这两个方法看似功能重复了，这么看来留一个方法就可以了。是这样吗？

start和run的区别

使用start方法启动线程，启动了一个新的线程，名字叫做worker运行。但是使用run方法的，并没有启动新的线程，就是在主线程中调用了一个普通的函数而已。
因此，启动线程请使用start方法，且对于这个线程来说，start方法只能调用一次。（设置_started属性实现）

import threading
import time
def worker():
    print(threading.enumerate()) # 增加这一句
    for i in range(5):
        time.sleep(1)
        print('i am working')
    print('finished')
class MyThread(threading.Thread):
    def start(self):
        print('start~~~~')
        super().start()
    def run(self):
        print('run~~~~~~')
        super().run()
t = MyThread(target=worker, name='worker')
t.start() # start 方法会开启新的线程来运行函数
# t.run() # 分别执行start或者run方法 ,只是在主线程运行
# 观察run  方法与start()方法的区别

多线程

多线程,一个进程中如果有多个线程运行,就是多线程,实现一种并发

import threading
import time
import datetime

def worker():
    t = threading.current_thread()
    for i in range(5):
        time.sleep(1)
        print('i am working', t.name, t.ident)
    print('finished')
class MyThread(threading.Thread):
    def start(self):
        print('start~~~~')
        super().start()
    def run(self):
        print('run~~~~~~')
        super().run()
t1 = MyThread(target=worker, name='worker1')
t2 = MyThread(target=worker, name='worker2')
# t1.start()
# t2.start()
t1.run() # 等待t1.run 执行结束后才会执行下一句
t2.run()

通过比较run 方法和start 方法可以发现:

run 方法没有开新的线程，这就是普通函数调用，所以执行完t1.run()，然后执行t2.run()，这里就不是多线程。
当使用start方法启动线程后，进程内有多个活动的线程并行的工作，就是多线程。
一个进程中至少有一个线程，并作为程序的入口，这个线程就是主线程。
一个进程至少有一个主线程。
其他线程称为工作线程。

线程安全

定义: 线程执行一段代码,不会产生不确定的结果,那么这段代码就是线程安全的

logging模块

标准库里面的logging模块，日志处理模块，线程安全的，生成环境代码都使用logging

import threading
import logging
def worker():
    for x in range(100):
        logging.warning('{} is running.'.format(threading.current_thread().name))
        #print('{} is running.\n'.format(threading.current_thread().name), end='')
for x in range(1, 8): # 可以增加线程
    name = 'worker{}'.format(x)
    t = threading.Thread(target=worker, name=name)
    t.start()
    
    
fmstr = "%(asctime)s%(thread)s%(threadName)s%(message)s"
logging.basicConfig(level=logging.INFO,format=fmstr)  # 配置格式字符串,默认为warring
.......		
logging.info("{} is running.".format(threading.current_thread().name)),上面设定了INFO  的格式后,下面就可以使用logging.info 进行打印

daemon 线程和non -daemon线程

# 源码Thread的__init__方法中
if daemon is not None:
	self._daemonic = daemon # 用户设定bool值
else:
	self._daemonic = current_thread().daemon

线程daemon属性，如果设定就是用户的设置，否则就取当前线程的daemon值。
主线程是non-daemon线程，即daemon = False。

t = threading.Thread(target = worker, name = 'worker',daemon = False)

如果线程中定义了daemon 为True ,那么主线程在运行时将不会等待其他线程

名称	含义
daemon	表示线程是否具有daemon 线程,这个值必须在start( )前设置,否则引发RuntimeError异常
isDaemon()	是否是daemon 线程
setDaemon	设置daemon 线程,必须在start ()之前设置

import  time
import threading
def worker( name ,timeout):
    time.sleep(timeout)
    print('{}working'.format(name))
t1 = threading.Thread(target=worker,args = ('t1',5),name= 'worker1',daemon=True)
t1.setDaemon(False) # 可以手动给线程设定daemon值
t1.start()
print('start')
t2 = threading.Thread(target=worker,name = 'worker2',args = ('t2',3),daemon=False)
t2.start()
print('Main Thread Exits')
# 交换上面代码中timeout时间的值,可以看出,若将daemon设置为True, 那么主线程运行时将不再等待子线程的运行

从上可以得出，如果除主线程之外还有non-daemon线程的时候，主线程退出时，也不会杀掉所有daemon线程，直到
所有non-daemon线程全部结束，如果还有daemon线程，主线程需要退出（主线程退出也可以理解为最后一个
non-daemon线程也要退出了），会结束所有daemon线程，程序退出。

总结
线程具有一个daemon属性，可以手动设置为True或False，也可以不设置，则取默认值None。
如果不设置daemon，就取当前线程的daemon来设置它。

主线程是non-daemon线程，即daemon = False。

从主线程创建的所有线程的不设置daemon属性，则默认都是daemon = False，也就是non-daemon线程。

Python程序在没有活着的non-daemon线程运行时，程序退出，也就是除主线程之外剩下的只能都是daemon线
程，主线程才能退出，否则主线程就只能等待。

join 方法:

import time
import threading
def worker(name, timeout):
	time.sleep(timeout)
	print('{} working'.format(name))
t1 = threading.Thread(target=worker, args=('t1', 3), daemon=True)
t1.start()
t1.join()# 设置join，取消join对比一下
print('Main Thread Exits')

使用了join方法后,daemon线程执行完了,主线程才退出

import time
import threading
def worker(name, timeout):
    time.sleep(timeout)
    print('{} working'.format(name))
t1 = threading.Thread(target=worker, args=('t1',3), daemon=True)
t1.start()
t1.join(2)  # 等待daemon线程2 秒
print('+++++++++++')
t1.join(2) # 在等待daemon线程2 秒
print('~~~~~~~~~~~')
print('Main Thread Exits')
#结果如下:
+++++++++++
t1 working
~~~~~~~~~~~
Main Thread Exits
# 可以看出仅仅打印出了一个线程working  ,因为第一个join()等待的时间小于线程函数睡眠时间,所以在等待2s后退出等待,主线程继续运行

join(timeout=None)，是线程的标准方法之一。

一个线程中调用另一个线程的join方法，调用者将被阻塞，直到被调用线程终止。

一个线程可以被join多次。

timeout参数指定调用者等待多久，没有设置超时，就一直等到被调用线程结束。

调用谁的join方法，就是join谁，就要等谁。

daemon线程应用场景

简单来说就是，本来并没有 daemon thread，为了简化程序员的工作，让他们不用去记录和管理那些后台线程，
创造了一个 daemon thread 的概念。这个概念唯一的作用就是，当你把一个线程设置为 daemon，它可以会随主
线程的退出而退出。

主要应用场景有：

1、后台任务。如发送心跳包、监控，这种场景最多。

2、主线程工作才有用的线程。如主线程中维护这公共的资源，主线程已经清理了，准备退出，而工作线程使用这
些资源工作也没有意义了，一起退出最合适。

3、随时可以被终止的线程

如果主线程退出，想所有其它工作线程一起退出，就使用daemon=True来创建工作线程。
比如，开启一个线程定时判断WEB服务是否正常工作，主线程退出，工作线程也没有必须存在了，应该随着主线程
退出一起退出。这种daemon线程一旦创建，就可以忘记它了，只用关心主线程什么时候退出就行了。
daemon线程，简化了程序员手动关闭线程的工作。

如果在non-daemon线程A中，对另一个daemon线程B使用了join方法，这个线程B设置成daemon就没有什么意
义了，因为non-daemon线程A总是要等待B。

如果在一个daemon线程C中，对另一个daemon线程D使用了join方法，只能说明C要等待D，主线程退出，C和D
不管是否结束，也不管它们谁等谁，都要被杀掉。

threading.local类

先看一个例子:

import threading 
import time 
def worker():
    x = 0
    for i in range(100):
        time.sleep(0.05)
        x+=1
    print(threading.current_thread(),x,end = '')
    print('~~~~~~~~~')
for i in range(10):
    threading.Thread(target = worker).start()

上例使用线程,每个线程完成不同的计算任务.
x是局部变量,可以看出每一个线程的x的独立的,互不干扰,
能否改造成使用全局变量完成?

import threading
import time 
class A :
    def __init__(self):
        self.x = 0
global_data =A()
def worker():
    global_data.x = 0
    for i in range(100):
        time.sleep(0.05)
        global_data.x +=1
     print(threading.current_thread().global_data.x) # 当读取数据时,可能有线程正在调用全局变量,进行加操作,所以最后的结果将不可预期
for i in range(10):
    threading.Thread(target =worker,name = 'worker')

上例中虽然使用了全局变量,但是线程之间互相干扰,导致了不期望的结果

能不能即使用全局变量,还能保持每个线程之间使用不同的数据呢?

python提供了threading.local类,将这个实例化得到一个全局变量,但是不同的线程使用这个线程存储的数据其他线程看不见

import threading
import time
X = 'ABC'
global_data = threading.local()
global_data.x = 100
print(global_data,type(global_data),global_data.x)
def worker():
    print(X)
    print(global_data)
    print(global_data.x)
    print('in worker')
worker()
print('-'*30)
threading.Thread(target=worker,name = 'worker').start()

从运行结果上来看,另起一个线程打印global_data.x 出差了,
AttributeError: '_thread._local' object has no attribute 'x'
但是global_data 打印没有出错,说名能看到global-data, 但是global _data中的x 看不到,这个x 不能跨线程

# 上例可以改为如下代码
import threading
import time
global_data = threading.local()

def worker():
    global_data = 0
    for i in range(100):
        time.sleep(0.05)
        global_data +=1
    print(threading.current_thread(),global_data) 
for i in range(10):
    threading.Thread(target =worker,name = 'workr').start()

本质
运行时，threading.local实例处在不同的线程中，就从大字典中找到当前线程相关键值对中的字典，覆盖
threading.local实例的__dict__。

这样就可以在不同的线程中，安全地使用线程独有的数据，做到了线程间数据隔离，如同本地变量一样安
全。

线程同步

线程同步,线程间协同,通过某种技术,让一个线程访问某些数据时,其他线程不能访问这些数据,直到该线程完成对数据的操作

Event ***

Event 事件,是线程间通信机制中最简单的实现,使用一个内部标记Flag ,通过flag 的True,或者False 是变化来进行操作.

名称	含义
set()	标记设置为True
clear()	标记设置为False
is_set()	标记是否为True
wait(timeout= None)	设计等待标记True的时长,None 为无限等待,等到True ,未等到超时了返回False

#练习
#老板雇佣了一个工人，让他生产杯子，老板一直等着这个工人，直到生产了10个杯子
from threading import Event, Thread
# import threading
import logging
import time
event = Event()
# event2 = threading.Event
FORMAT = '%(asctime)s %(threadName)s %(thread)s %(message)s'
logging.basicConfig(format=FORMAT, level=logging.INFO)

def worker(event:Event, count=10):
    logging.info('I am working for U')
    cups = []
    while True:
        logging.info('make 1 cup')
        time.sleep(0.5)
        cups.append(1)
        if len(cups) >= count:
            event.set()
            break
    logging.info('I finished my job. cups={}'.format(cups))
def boss(event:Event):
    logging.info("I'm boss, waiting for U")
# 阻塞等待
    event.wait()
    logging.info('Good Job.')
b = Thread(target=boss, name='boss', args=(event,))
w = Thread(target=worker, name='worker', args=(event,))
b.start()
w.start()

总结:

使用同一个Event 对象的标记flag
谁wait 谁就是等到flag 变为True, 或者等到超时返回False, 不限制等待的个数

wait 的使用

from threading import Event, Thread
# import threading
import logging
import time
event = Event()
# event2 = threading.Event
FORMAT = '%(asctime)s %(threadName)s %(thread)s %(message)s'
logging.basicConfig(format=FORMAT, level=logging.INFO)
def worker(event:Event, interval:int): 
    while not event.wait(interval): # 等不到返回False,(等到3秒后仍然没有人event.set(),就返回False )
        logging.info('do sth')
w = Thread(target=worker, name='worker', args=(event,3))
w.start()
print('+++end++++')

定时器 Timer /延时执行

threading.Timer 继承自Thread ,这个类用来定义延迟多久后执行一个函数

class threading.Timer(interval,function,args=None,kwargs = None)

start方法执行之后,Timer 对象会处于等待状态,等待interval秒之后,开始执行function 函数

import threading
import time
import  logging
format = "%(asctime)s%(threadName)s %(threadName)s %(thread)s %(message)s"
logging.basicConfig(level=logging.INFO,format=format)
def worker():
     logging.info('in work')
     time.sleep(2)
t = threading.Timer(4,worker)
t.cancel() # 线程没有起到之前可以取消
t.start()
# t.cancel()线程即使启动,但只要在wait ()等待时间内,都可以取消,本质是调用的Event()函数
while True:
    print(threading.enumerate())
    time.sleep(1)
    
# 本质是在cancel类中定义了:
def __init__(self):
    ....
    self.finiseed= Event()
    ..
def cancel(self):
    ....
    self.finished.set()

上述代码工作县城关早就启动了,只不过是在工作线程中延时等待了4秒才执行worker函数,

Timer 是线程Thread 的子类,Timer 实例内部提供了一个finished 属性,该属性是Event 对象, cancel方法,是在worker 函数执行前对finished 属性set 方法操作,从而跳过了worker 函数执行,达到了取消的效果,

总结:

Timer 是线程Thread 的子类,就是线程类,具有线程的能力和特征,
它的实例是能够延时执行目标函数的线程,在真正执行目标函数之前,都可以cancel 它
cancel 方法本质使用Event 类实现,这并不是说线程提供了取消的方法,线程一旦被创建,不可被取消

Lock ***

Lock

锁,一旦线程获得锁,其他试图获取锁的线程将被阻塞

锁,凡是存在共享资源争抢的地方都可以使用锁,从而保证只有一个使用者可以完全使用这个资源

名称	含义
acquire(block =True,timeout = -1)	默认阻塞，阻塞可以设置超时时间。非阻塞时，timeout禁止设置。成功获取锁，返回True，否则返回False
release()	释放锁。可以从任何线程调用释放。已上锁的锁，会被重置为unlocked未上锁的锁上调用，抛RuntimeError异常。

锁的基本使用:

先看一个例子:

订单要求生产1000个杯子,组织10个工人生产,请忽略老板,关注工人生产杯子

import logging
import  threading
import  time
event = threading.Event()
fmstr = "%(asctime)s%(thread)s%(threadName)s%(message)s"
logging.basicConfig(level=logging.INFO,format=fmstr)  
cups = []
def worker(count):
    logging.info("{} if working".format(threading.current_thread().name))
    while len(cups)< count:  # 存在大问题 最后的数目会超出目标值
        time.sleep(0.0001)
        cups.append(1)
    logging.info('{}finished my job.cups={}'.format(threading.current_thread().name,len(cups)))

for i in range(10):
    threading.Thread(target=worker, name='worker{}'.format(i),args=(1000,)).start()

上面可以看出,多线程调度,导致了判断失败,多生产了杯子,可以使用Event 加判断.

有什么好的解决方案呢?
上锁!

import logging
import  threading
import  time
event = threading.Event()
fmstr = "%(asctime)s%(thread)s%(threadName)s%(message)s"
logging.basicConfig(level=logging.INFO ,format=fmstr)  # 配置格式字符串,默认为warring
cups = []
lock = threading.Lock()
def worker(lock ,count):
    logging.info("{} if working".format(threading.current_thread().name))
    flag = False
    while True:  # 存在大问题 最后的数目会超出目标值
        lock.acquire()
        if len(cups)>=count:
            flag2 =True
        time.sleep(0.0001)
        if not flag:
            cups.append(1)
        if flag:
            lock.release()
        if flag :
            break
    logging.info('{}finished my job.cups={}'.format(threading.current_thread().name ,len(cups)))
for i in range(10):
    threading.Thread(target=worker, name='worker{}'.format(i) ,args=(lock ,10000,)).start()

加锁,解锁

一般来说,加锁就需要解锁,但是加锁后解锁,还要有一些代码执行,就可能抛异常,一旦出现异常,锁是无法释放,但是当前线程可能因为这个异常被终止了,这也就产生了死锁.

加锁解锁常用语句:

1,使用try …finally 语句保证锁的释放.

2,with 上下文管理,锁对象支持上下文管理

import threading 
import time

class Counter:
    def __init__(self):
        self._value =0
    @property
    def value(self):
        return self._value
    def inc(self):
        self._value+=1
    def dec (self):
        self._value-=1
def balabce(c:Counter,loop:int):
    for i in range(loop):
        for j in range(-50,50):
            if j< 0 :
                c.dec()
            else:
                c.inc()
c = Counter()
l1=10# 线程数
l2=100#loop
for i in range(l1):
    t = threading.Thread(target=balabce,args=(c,l2))
    t.start()
# 达不到平衡,因为在多个线程同时操作时,比如现在有一个线程得到当前数值为1,
# 另外一个线程得到的数值也是1 那么两个线程的值都是加 1 ,之间存在不同步,
# 所以最后的结果不是0
print(c.value)
# with threading.Lock() : 
# 存在上下文管理, 有__ enter__  和__release__ 
#  不一定能保证一定会执行,有try : .... finally  :....,所以用上下文管理会更好

# 对锁使用上下文管理
import threading 
import time

class Counter:
    def __init__(self):
        self._value =0
        self._lock = threading.Lock()
    @property
    def value(self):
        with self._lock:
            return self._value
    def inc(self):
        with self._lock:
            self._value+=1
    def dec (self):
        with self._lock :
            self._value-=1

def balabce(c:Counter,loop:int):
    for i in range(loop):
        for j in range(-50,50):
            if j< 0 :
                c.dec()
            else:
                c.inc()
c = Counter()
l1=10# 线程数
l2=100#loop
thread_list=[]
for i in range(l1):
    t = threading.Thread(target=balabce,args=(c,l2))
    t.start()
    thread_list.append(t)
for t in thread_list:
    t.join() # 不加阻塞的话,下面的读取数据,可能线程还没执行完就去取数据导致数据不准确
print(c.value)

对读取数据部分进行改造:

while True:
    time.sleep(1)
    if threading.active_count()==1:
        print(threading.enumerate())
        print(c.value)
        break
    else:
        print(threading.enumerate())

说明:

ptinr(c.value)这一句在主线程中时,很早就执行了.退出条件是只剩下主线程的时候,这样改造后,代码可以保证最后得到value 值一定是0

锁的应用场景

锁适用于访问和修改同一个共享资源的时候，即读写同一个资源的时候。

如果全部都是读取同一个共享资源需要锁吗？
不需要。因为这时可以认为共享资源是不可变的，每一次读取它都是一样的值，所以不用加锁

使用锁的注意事项：

少用锁，必要时用锁。使用了锁，多线程访问被锁的资源时，就成了串行，要么排队执行，要么争抢执行
- 举例，高速公路上车并行跑，可是到了省界只开放了一个收费口，过了这个口，车辆依然可以在多车道
  上一起跑。过收费口的时候，如果排队一辆辆过，加不加锁一样效率相当，但是一旦出现争抢，就必须
  加锁一辆辆过。注意，不管加不加锁，只要是一辆辆过，效率就下降了。
加锁时间越短越好，不需要就立即释放锁
一定要避免死锁

不使用锁，有了效率，但是结果是错的。
使用了锁，效率低下，但是结果是对的。
所以，我们是为了效率要错误结果呢？还是为了对的结果，让计算机去计算吧

非阻塞锁使用

import threading
import logging
import time
FORMAT = '%(asctime)s %(threadName)s %(thread)-10d %(message)s'
logging.basicConfig(level=logging.INFO, format=FORMAT)
lock = threading.Lock()
def worker(l:threading.Lock):
    while True:
        flag = l.acquire(False)  # 非阻塞,会不断尝试去拿锁
        if flag:
            logging.info('do something.') # 为了显示效果，没有释放锁
        else:
            logging.info('try again')
            time.sleep(1)
for i in range(5):
    threading.Thread(target=worker, name='worker={}'.format(i), args=(lock, )).start()

可重人锁RLock

可重入锁,是线程相关的锁.

线程A获得可重复锁,并可以多次成功获得,不会阻塞,最后要在线程A中做和acquire次数相同的release

import threading
lock = threading.RLock()
print(lock.acquire()) #True
print(lock.acquire(False))#True  # 非阻塞锁,直接拿到锁
print(lock.acquire(timeout = 4))#True  # 直接拿到锁,不需要等
print(lock.acquire()) #True
RLock 会立即得到4把锁
#比较与lock=threading.Lock()
# print(lock.acquire()) # 第一个会得到锁 返回True
# print(lock.acquire(False)) # 非阻塞锁,得不到锁
# print(lock.acquire(timeout = 4))# 阻塞4秒返回False,因为第一个锁没有释放
# print(lock.acquire()) # 阻塞锁,返回False ,当前线程阻塞.
lock.release()
lock.release()
lock.release()
#lock.release()
def sub(l):
    print('enter')
    print(l.acquire())# 若主线程拿了4把锁,但是只还了三把锁,这里要是在拿锁便会拿不到
    print(threading.current_thread().ident)
    print(threading.main_thread().ident)
    print(l.acquire(timeout=4))
    
    print('exit')
#     l.release()
t = threading.Thread(target=sub,name='sub',args=(lock,))
t.start()
# 在可重入锁中:存在特殊情况
# 当主线程的锁没有释放,子线程是无法在使用锁.
# 当子线程中拿到了锁,在其他线程中也无法释放该锁,否则其他线程无法使用该锁

可重入锁:

与线程相关,可在一个线程中获取锁,并可继续在同一线程中不阻塞多次获取锁
当锁未释放完,其他线程获取锁就会阻塞,直到当前持有的线程释放完锁
锁都应该使用完后释放,可重入锁也是锁,应该acquire 多少次,就release 多少次

Condition

构造方法Condition(lock=None)，可以传入一个Lock或RLock对象，默认是RLock。

名称	含义
acquire(*args)	获取锁
wait(self,timeout= None)	等待或者超时
notify(n=1)	唤醒至多指定数目个数的等待的线程，没有等待的线程就没有任何操作

一个工人生产1000个杯子,有2个老板等到他生产完为止

import threading
import time
from threading import Thread
import logging
FORMAT= "%(asctime)s%(thread)s%(threadName)s%(message)s"
logging.basicConfig(format= FORMAT,level = logging.INFO)
cups =[]
cond= threading.Condition()
event = threading.Event()
def boss():
    print('I am waiting')
    with cond:  # 利用上下文管理
        cond.wait()# 等待阻塞中
    	print('Good job')
def worker(count):
    print('I am working')
    with cond: # 上下文管理
        while len(cups)< count:
            time.sleep(0.001)
            cups.append(1)
        print('I finished my job{}'.format(len(cups)))
        cond.notify(2) # 通知两个等待者
        # cond.notify(1)通知一个等待者
        # cond.notify_all# 通知所有等待者
threading.Thread(target=boss,name = 'boss').start()
threading.Thread(target=boss,name = 'boss').start()
threading.Thread(target=worker,name='worker',args = (1000,)).start()
print('====')

Condition 用于生产者消费者模型,为了解决生产者消费者速度匹配问题

在看一个例子,消费者速度大于生产者速度

import random
import logging
import threading
FORMAT= "%(asctime)s %(thread)s %(threadName)s %(message)s"
logging.basicConfig(format= FORMAT,level = logging.INFO)
class Dispacter:
    def __init__(self):
        self.data= None
        self.event = threading.Event()
        self.cond = threading.Condition()
    def product(self,count = 100):
        for i in range(count):
            data = random.randint(1,100)
            logging.info(data) # 打印下信息
            self.data = data
            self.event.wait(1) # 模拟生产数据需要耗时 1 秒
            # time.sleep(1) # 与上面一样.都是模拟等待一秒
    def consume(self):
       #  print('consume')
        while not self.event.wait(0.5):
            data = self.data
            logging.info('recived{}'.format(data))
d = Dispacter()
p = threading.Thread(target=d.product,name = 'producer')
for i in range(2):
    c = threading.Thread(target= d.consume,name ='consumer{}'.format(i))
    c.start()
p.start()

这个例子采用了消费者主动消费,消费者浪费了大量时间,主动来查看有没有数据.
能否换成一种通知机制,有数据通知消费者来小费呢?
使用condition

import random
import threading
import logging
import Event
FORMAT= "%(asctime)s %(thread)s %(threadName)s %(message)s"
logging.basicConfig(format= FORMAT,level = logging.INFO)
class Dispacter:
    def __init__(self):
        self.data= None
        self.event = threading.Event()
        self.cond = threading.Condition()
    def product(self,count = 100):
        for i in range(count):
            data = random.randint(1,100)
            with self.cond:
                logging.info(data) # 打印下信息
                self.data = data
                self.cond.notify_all()
             self.event.wait(1) # 模拟生产数据需要耗时 1 秒 
            # time.sleep(1) # 与上面一样.都是模拟等待一秒
    def consume(self):
       #  print('consume')
        while not self.event.is_set(): # 先等待0.5秒,若有设置为set()则返回True ,否则返回False 
            with self.cond:
                self.conde.wait()
                data = self.data
                logging.info('recived{}'.format(data))
                # self.data = None
            # self.event.wait(0.5)
d = Dispacter()
p = threading.Thread(target=d.product,name = 'producer')
for i in range(2)
    c = threading.Thread(target= d.consume,name ='consumer{}'.format(i))
    c.start()
p.start()

多个消费者使用的是cond.notify_all() 若想生产一个产品给一个消费者,那么只需要设置为cond.notify(1)即可,后面便会一次交替执行.

Condition总结:

Condition 用于生产者消费模型中,解决生产者消费速度匹配问题,采用了通知机制,效率非常高

使用方式

使用condition ,必须先acquire ,用完了release . 因为内部使用了锁,默认使用Rlock锁,最好的方式是使用上下文管理

消费者wait ,等待通知

生产者生产好消息,对消费者发通知,可以使用notify 或者notify_all 方法

semaphore 信号量

和lock 很像,信号量对象内部维护一个倒数计数器,每一次acquire 都会减1 ,当acquire方法发现技术为0 就阻塞请求的线程,直到其他线程对信号量release 后,计数大于0恢复阻塞线程

名称	含义
Semaphore(value =1)	构造方法,value 小于1 ,抛valueError 异常
acquire(blocking =True,timeout =None)	获取信号量,计数器减1 ,获取成功返回True
release()	释放信号量,计数器加1

计数器永远不会低于0 ,因为acquire 的时候,发现是0 ,都会被阻塞

s = Semaphore(3)
print(s.acquire())
print(s.acquire())
print(s.acquire())
# print(s.acquire()) # 阻塞,只允许获取三把锁,再多便会阻塞
print(s._value) # 有几把锁空闲就返回几,这里返回0
s.release()
s.release()
print(s._value)# 返回2 上面释放了2次
s.release()
s.release()
s.release()
s.release()
print(s._value)# 返回6
#超过一开始给定的值,没还一次,下面可以使用的次数就加一次
# 在不同线程中操作的是同一个对象,在线程中归还是一样的.

在看

import random
import logging
import threading
import time
from threading import Thread ,Semaphore
FORMAT= "%(asctime)s %(thread)s %(threadName)s %(message)s"
logging.basicConfig(format= FORMAT,level = logging.INFO)
def worker(s:Semaphore):
    logging.info('in worker thread')
    logging.info(s.acquire()) # 线程中获取锁,如果主线程中 s._value 的值等于0 ,那么线程中是不能获取锁的,将会被阻塞
    logging.info('worker thread over')
# 信号量
s = Semaphore(3)
logging.info(s.acquire())
print(s._value)
logging.info(s.acquire())
print(s._value)
logging.info(s.acquire())
print(s._value)
Thread(target=worker,name = 'worker',args=(s,)).start()

time.sleep(2)
logging.info(s.acquire(False)) # 非阻塞
logging.info(s.acquire(timeout=3)) # 阻塞3 秒
logging.info('relsese one')
s.release()

release 方法超界问题
假设如果没有acquire 信号量,就release,会怎么样?
结果就是会比设定的值继续往上追加,大于设定值.这就要使用到下面的方法

BoundedSemaphpore

有界的信号量，不允许使用release超出初始值的范围，否则，抛出ValueError异常。
将上例的信号量改成有界的信号量试一试。

应用举例:

连接池
因为资源有限,且开启一个连接成本高,所以使用连接池

一个简单的连接池
连接池应该有容量,(总数),有一个工厂方法可以获取连接,能够把不用的连接返回,供其他调用者使用

class Conn:  # 创建一个连接对象
    def __init__(self, name):
        self.name = name
class Pool: # 连接池
    def __init__(self, count:int):
        self.count = count
# 池中提前放着连接备用
        self.pool = [self._connect('conn-{}'.format(i)) for i in range(self.count)]
    	self.lock = threading.Lock()
    def _connect(self, conn_name):
    # 创建连接的方法，返回一个连接对象
        return Conn(conn_name)
    def get_conn(self):
        with self.lock:# 多线程情况下会发生数据不确定性,所以要加锁
        # 从池中拿走一个连接
            if len(self.pool) > 0:
                return self.pool.pop()
    def return_conn(self, conn: Conn):
        # 向池中返回一个连接对象
        with self.lock: 
            if len(self.pool)< self.count:
                self.pool.append(conn)

真正的连接池的实现比上面的例子要复杂的多，这里只是简单的一个功能的实现。

本例中，get_conn()方法在多线程的时候有线程安全问题。

假设池中正好有一个连接，有可能多个线程判断池的长度是大于0的，当一个线程拿走了连接对象，其他线程再来
pop就会抛异常的。如何解决？

1、加锁，在读写的地方加锁

2、使用信号量Semaphore

对上面的代码进行修改:

import random
import logging
import threading
import time
from threading import Thread ,Semaphore
FORMAT= "%(asctime)s %(thread)s %(threadName)s %(message)s"
logging.basicConfig(format= FORMAT,level = logging.INFO)
class Conn:
    def __init__(self, name):
        self.name = name
class Pool:
    def __init__(self, count:int):
        self.count = count
# 池中提前放着连接备用
        self.pool = [self._connect('conn-{}'.format(i)) for i in range(self.count)]
        self.semaphore = threading.BoundedSemaphore(count)
    def _connect(self, conn_name):
    # 创建连接的方法，返回一个连接对象
        return Conn(conn_name)
    def get_conn(self):
        # 从池中拿走一个连接
        logging.info('get~~~~~~~~~~~~')
        self.semaphore.acquire()
        logging.info('-------------')
        return self.pool.pop()
    def return_conn(self, conn: Conn):
        logging.info('return~~~~~~~~~~')
        # 向池中返回一个连接对象
        self.pool.append(conn)
        self.semaphore.release() # 要放在append 后面,若放前面,先释放了release ,但是容器内没有数据,其他线程去取数据时会发现是空的,报错
# 初始化连接池
pool = Pool(3)
def worker(pool:Pool):
    conn = pool.get_conn()
    logging.info(conn)
    # 模拟使用了一段时间
    time.sleep(random.randint(1, 5))
    pool.return_conn(conn)
for i in range(6):
    threading.Thread(target=worker, name='worker-{}'.format(i), args=(pool,)).start()

补充:

import uuid 
print(uuid.uuid4().hex)
这里返回的是不同的实例的ID

上例中,使用信号量解决资源有限问题

如果池中有资源,请求者获取资源时信号量减1，拿走资源。当请求超过资源数，请求者只能等待。当使用者用完
归还资源后信号量加1，等待线程就可以被唤醒拿走资源。

注意：这个连接池的例子不能用到生成环境，只是为了说明信号量使用的例子，连接池还有很多未完成功能。

问题:

self.append(conn)这一句有哪些问题考虑

1,边界问题分析

return_conn方法可以单独执行，有可能多归还连接，也就是会多release，所以，要用有界信号量
BoundedSemaphore类。

这样用有界信号量修改源代码，保证如果多return_conn就会抛异常。

self.pool.append(conn)
self.semphore.release()

假设一种极端情况，计数器还差1就归还满了，有三个线程A、B、C都执行了第一句，都没有来得及release，这时
候轮到线程A release，正常的release，然后轮到线程C先release，一定出问题，超界了，直接抛异常。
因此信号量，可以保证，一定不能多归还。

如果归还了同一个连接多次怎么办，重复很容易判断。
这个程序还不能判断这些连接是不是原来自己创建的，这不是生成环境用的代码，只是简单演示。

2,正常使用分析

正常使用信号量，都会先获取信号量，然后用完归还。

创建很多线程，都去获取信号量，没有获得信号量的线程都阻塞。能归还的线程都是前面获取到信号量的线程，其
他没有获得线程都阻塞着。非阻塞的线程append后才release，这时候等待的线程被唤醒，才能pop，也就是没有
获取信号量就不能pop，这是安全的。

经过上面的分析，信号量比计算列表长度好，线程安全。

信号量和锁

信号量，可以多个线程访问共享资源，但这个共享资源数量有限。

锁，可以看做特殊的信号量，即信号量计数器初值为1。只允许同一个时间一个线程独占资源。

数据结构和GIL

Queue
**<**br/>标准库queue模块，提供FIFO的Queue、LIFO的队列、优先队列。
Queue类是线程安全的，适用于多线程间安全的交换数据。内部使用了Lock和Condition。

为什么讲魔术方法时，说实现容器的大小，不准确？
如果不加锁，是不可能获得准确的大小的，因为你刚读取到了一个大小，还没有取走数据，就有可能被其他线程改
了。

Queue类的size虽然加了锁，但是，依然不能保证立即get、put就能成功，因为读取大小和get、put方法是分开
的。

GIL全局解释器锁

CPython 在解释器进程级别有一把锁，叫做GIL，即全局解释器锁。

GIL 保证CPython进程中，只有一个线程执行字节码。甚至是在多核CPU的情况下，也只允许同时只能有一个CPU
上运行该进程的一个线程。

CPython中

IO密集型，某个线程阻塞，就会调度其他就绪线程；

CPU密集型，当前线程可能会连续的获得GIL，导致其它线程几乎无法使用CPU。
在CPython中由于有GIL存在，IO密集型，使用多线程较为合算；CPU密集型，使用多进程，要绕开GIL。

新版CPython正在努力优化GIL的问题，但不是移除。

如果在意多线程的效率问题，请绕行，选择其它语言erlang、Go等。

Python中绝大多数内置数据结构的读、写操作都是原子操作。
由于GIL的存在，Python的内置数据类型在多线程编程的时候就变成了安全的了，但是实际上它们本身不是
线程安全类型。

你可能感兴趣的:(Python学习历程)

Python异步编程 - asyncio库孤寒者 Python全栈系列教程 python 异步编程 asyncio yield 协程
目录：每篇前言：异步IOPython中的异步编程实现方式：协程Python传统协程示例：实现生产者-消费者模型消费者：生产者：运行流程：整体流程：传统协程——>现代协程：asyncio库async/await每篇前言：作者介绍：【孤寒者】—CSDN全栈领域优质创作者、HDZ核心组成员、华为云享专家Python全栈领域博主、CSDN原力计划作者本文已收录于爬虫必备前端技术栈专栏：《爬虫必备前端技术栈
python输出星号等腰三角形_python打印直角三角形与等腰三角形实例代码 weixin_39644139 python输出星号等腰三角形
python打印直角三角形与等腰三角形实例代码前言本文通过示例给大家详细介绍了关于python打印三角形的相关，分享出来供大家参考学习，下面话不多说了，来一起看看详细的介绍吧1、直角三角形#i控制行数j控制*的个数foriinrange(5):i+=1forjinrange(i):print('*',end='')#end=‘'输出空格print()/2、等腰三角形row=int(input('p
python绘制等边三角形的代码_Python打印等边三角形 weixin_39621178
示例1:#!/usr/bin/python#-*-coding:UTF-8-*-#根据输入打印rows=int(raw_input('pleaseinputnumber:'))#等边三角形foriinrange(0,rows+1):forjinrange(0,rows-i):print"",j+=1forkinrange(0,2*i-1):ifk==0ork==2*i-2ori==rows:ifi
Python写倒三角森之林 python
4.(程序题)编程显示如下所示的三角形图案。要求程序运行时，输入一个正整数，显示该整数行高度的三角形图案。#############h=int(input("请输入高度："))foriinrange(h):forjinrange(i,h):print("#",end="")forrinrange(0,i):print("",end="")print("")
python+flask计算机毕业设计基于Android平台的景区移动端旅游软件系统（程序+开题+论文） Node.js彤彤程序 python flask 课程设计
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容研究背景随着移动互联网技术的飞速发展，智能手机已成为人们日常生活中不可或缺的一部分，特别是在旅游领域，移动端应用以其便捷性、实时性和个性化服务的特点，极大地改变了人们的旅游体验方式。当前，旅游市场日益繁荣，游客对于旅游信息获取、行程规划、景点导航、票务预订及个性化服务的需
ALO蚁狮优化算法：从背景到实战的全面解析 der丸子吱吱吱智能优化算法 ALO算法
目录引言背景2.1蚁狮优化算法的起源2.2自然启发式算法的背景2.3ALO的发展与应用原理3.1蚁狮的生物行为3.2ALO的数学建模3.3算法流程与关键步骤实战应用4.1函数优化问题4.2工程优化案例4.3组合优化与约束优化代码实现与结果分析5.1Python代码实现5.2实验设计与结果分析5.3性能评估与优化建议学习资源6.1工具推荐6.2网站与文献资源6.3ALO与AI结合的方法结论1.引言在
全面掌握Python：从安装到基础再到进阶的系统学习之路（附代码，建议新手收藏） der丸子吱吱吱 python 学习开发语言新手入门代码
Python，作为一种现代化的高级编程语言，因其简洁易懂的语法和强大的功能，成为了数据科学、人工智能、Web开发等多个领域的首选语言。在这篇文章中，我们将从大学课本的结构来详细介绍Python，帮助大家从零基础开始，逐步深入掌握Python的各个方面。目录第一章：Python简介与安装1.1Python语言概述1.2安装Python1.3Python的开发环境1.4第一个Python程序第二章：基
Centos7软件包管理(rpm、yum) Bulut0907 Linux centos 软件包管理 rpm yum yum源修改
目录1.rpm2.yum2.1修改yum源1.rpmRPM(RedHatPackageManager)，redhat系列操作系统里面的打包安装工具查询命令：查询安装的所有rpm软件包：rpm-qa查询指定rpm软件包，并显示详细信息：rpm-qipython3卸载命令：卸载软件包，不管是否有其它软件包依赖该软件包：rpm-e--nodeps软件包名称安装命令：安装rpm包，并显示详细信息和进度条(
从 0 到 1 构建 Python 分布式爬虫，实现搜索引擎全攻略七七知享 Python python 分布式爬虫搜索引擎算法程序人生网络爬虫
从0到1构建Python分布式爬虫，实现搜索引擎全攻略在大数据与信息爆炸的时代，搜索引擎已然成为人们获取信息的关键入口。你是否好奇，像百度、谷歌这般强大的搜索引擎，背后是如何精准且高效地抓取海量网页数据的？本文将带你一探究竟，以Python为工具，打造属于自己的分布式爬虫，进而搭建一个简易搜索引擎，完整呈现从底层代码编写到系统搭建的全过程。通过本文的实践，我们成功打造了Python分布式爬虫，并以
Flink启动任务 swg321321 flink 大数据
Flink以本地运行作为解读例如：第一章Python机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Flink前言StreamExecutionEnvironmentLocalExecutorMiniClusterStreamGraph二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发
python中Flask模块的使用 weixin_30315905 python json
1.简介在服务器上运行Flask接口，就能使用requests模块获取该接口的值。先运行接口文件，再运行requests文件，即可获取值。2.示例2.1一个简单的flask接口1importjson2fromflaskimportFlask,request34#python类型5data={6'name':'John',7'age':18,8'location':'nanjing'910}1112
计算机专业毕业设计题目推荐（新颖选题）本科计算机人工智能专业相关毕业设计选题大全✅ 会写代码的羊毕设选题课程设计人工智能毕业设计毕设题目毕业设计题目 ai AI编程
文章目录前言最新毕设选题（建议收藏起来）本科计算机人工智能专业相关的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费功能
python中的静态方法绛洞花主敏明 python
问题：pycharm中建立新的方法，出现如下的警告：在python中建立类一般使用如下的方法：classDog(object):defrun(self):print("running")run方法是类中的普通方法声明和创建静态方法，在方法上加上staticmethod注明一下classDog(object):@staticmethoddefrun(self):print("running")如下的
一文弄懂Python 变量初始化与内存管理宇寒风暖 python编程 python 开发语言笔记学习
在Python中，变量的初始化并不一定会开辟新的内存空间。Python的内存管理机制非常灵活，它会根据变量的值、类型以及Python的内部优化策略来决定是否复用已有的内存空间。1.变量初始化的基本概念在Python中，变量是对象的引用。当你初始化一个变量时，Python会执行以下操作：创建一个对象（如果该对象不存在）。将变量名绑定到该对象。例如：a=10b="hello"a是一个整数对象的引用。b
python静态方法_Python静态方法 cunchi4221 python java 深度学习设计模式 javascript ViewUI
python静态方法Python静态方法(Pythonstaticmethod)Inthisquickpost,wewilllearnhowtocreateanduseaPythonstaticmethod.Wewillalsohavealookatwhatadvantagesanddisadvantagesstaticmethodsofferascomparedtotheinstancemeth
python中的类方法，静态方法，对象方法 a174817529
原文地址：http://blog.chinaunix.net/uid-26602509-id-3087296.htmlclassA:count=100def__init__(self,instancedata):self.instancedata=instancedata@staticmethod#静态方法不能访问类参数和实例参数defsm():print"sm"@classmethod#类方法不
Python 静态方法和类方法 a540366413 Python python
静态方法我们知道在其他语言中静态方法一般使用static修饰，静态方法的主要特点是不需要new出对象，直接通过类名就可以访问，也可以通过对象访问。需要使用staticmethod装饰器装饰方法举例：classA:@staticmethoddefstaticfunc():print("A")A.staticfunc()#A类方法类方法和静态方法类似，也可以直接通过类名访问，不过要使用classmet
Python静态方法 Frank_Yee python
在Python中，静态方法是一种不会自动接收类（cls）或实例（self）作为第一个参数的方法。它可以通过类直接调用，而不需要类的实例。静态方法通常用于实现与当前类的对象状态无关的功能，或者提供一些通用的工具函数。一、使用场景1.工具函数：当方法不需要访问对象属性或类属性时，可以将其定义为静态方法。2.常量类：有时候，你可能需要一个类仅仅作为一个容器，用来存储常量。3.工厂方法：在某些情况下，你可
day11 学习笔记豆豆学习笔记 python
文章目录前言一、类方法二、静态方法三、构造方法四、魔术方法前言通过今天的学习，我掌握了更多Python中有关面向对象编程思想中方法的概念与操作，包括类方法，静态方法，构造方法，魔术方法一、类方法类方法是属于类的行为，一般使用类而非对象进行调用类方法需要使用@classmethod装饰器定义类方法至少有一个形参用于绑定类，约定为cls类和该类的实例都可以调用类方法，但一般不用实例进行调用类方法不能访
Python 正则表达式小结1 大收藏家 Python 正则表达式 python
[声明]：本文参考了白夜黑雨老师的网页讲解。如有侵权，请与我联系！！！Python正则表达式小结11.正则表达式验证2.特殊元字符及含义3匹配某种字符类型4.正则表达式举例大收藏家说1.正则表达式验证提供两个网站用于正则表达式的验证，可以敲入文本与正则表达式。通过该网站，验证正则表达式的正确性。非常好用！英文网站中文网站2.特殊元字符及含义元字符含义.表示要匹配除了换行符之外的任何单个字符*星号-
python离线语音转文本_使用Python将语音转换为文本的方法 weixin_39760619 python离线语音转文本
使用Python将语音转换为文本的方法,语音,转换为,文本,您的,麦克风使用Python将语音转换为文本的方法易采站长站，站长之家为您整理了使用Python将语音转换为文本的方法的相关内容。语音识别是计算机软件识别口语中的单词和短语，并将其转换为可读文本的能力。那么如何在Python中将语音转换为文本？如何使用SpeechRecognition库在Python中将语音转换为文本？我们不需要从头开始
Open-Sora - 为所有人实现高效的视频制作大众化小众AI AI开源音视频人工智能 AI编程
GitHub：https://github.com/hpcaitech/Open-Sora更多AI开源软件：发现分享好用的AI工具、AI开源软件、AI模型、AI变现-小众AI这是一款开源的SOTA（State-of-the-Art）视频生成模型，仅用20万美元（224张GPU）就能训练出商业级11B参数的视频生成大模型。它采用Python语言和PyTorch深度学习框架开发，具有生成速度快、资源消
8、Python 字符串处理与正则表达式实战指南 wolf犭良 python python 正则表达式
Python字符串处理与正则表达式实战指南文章概述本文深入探讨Python字符串处理核心方法与正则表达式实战技巧，涵盖字符串编码转换、分割替换、正则表达式语法精髓，并通过日志解析、数据清洗等真实场景案例展示高阶应用。最后提供10道阶梯式练习题（附完整答案代码），助你从基础到进阶全面掌握文本处理技能。一、字符串处理核心三剑客1.1编码转换（encode/decode）text="中文文本"utf8_
deepseek api参数详解孽小倩大语言模型 python java 前端人工智能 deepseek
deepseek的参数与openai保持兼容，所以openai能用的参数deepseek都可以使用，以下是常用的参数介绍。在使用Deepseek/OpenAI的PythonAPI时，最常用的API端点是chat/completions，用于调用deepseek生成文本对话内容。以下是openai.ChatCompletion.create()方法的主要参数及其作用：1.model作用：指定使用的模
算法基础——蓝桥杯（python实现，实际上大多数用c++更明白易懂）（第一部分，共12个小题） New_Teen 算法蓝桥杯 python
1.成绩统计问题描述:编写一个程序，建立一个字典，每个字典包含姓名、学号、英语成绩、数学成绩和C++成绩，并通过字典操作平均分最高的学生和平均分最低的学生并且输出。输入格式：输入n+1行，第一行输入一个正整数n，表示学生数量；接下来的n行每行输入5个数据，分别表示姓名、学号、英语成绩、数学成绩和C++成绩。注意成绩有可能会有小数。输出格式：输出两行，第一行输出平均成绩最高的学生姓名。第二行输出平均
Python（正则表达式）羡江007 Python进阶 python 正则表达式开发语言
re模块#在Python中需要通过正则表达式对字符串进行匹配的时候，可以使用一个re模块'''re模块三步走#第一步：导入re模块importre#第二步：使用match方法进行匹配操作result=re.match(pattern正则表达式,string要匹配的字符串,flags=0)#第三步：如果数据匹配成功，使用group方法来提取数据result.group()re.match(patte
Ubuntu20.04安装并配置Pycharm2020.2.5 搬砖的打工人!!! ubuntu pycharm python
一.下载pycharm社区版1.下载地址：PyCharm:thePythonIDEfordatascienceandwebdevelopmentThePythonIDEfordatascienceandwebdevelopmentwithintelligentcodecompletion,on-the-flyerrorchecking,quick-fixes,andmuchmore.https:/
使用python中you-get库实现下载网抑云瞎老弟 python python 音视频爬虫
WYY音乐下载前言代码实现使用说明前言前几天，我做了b站视频的下载，有好兄弟表示，只下载视频，不能够让人满足，我还希望能够下载网易云的音乐。上一次在我发布的b站视频下载中，使用了you-get库作为下载方式，但是实际上，这个库也可以下载网易云音乐，因此，我们只需要参考我们上次的b站视频下载，简单的进行一下修改，就可以完成音乐的下载了。为了能够更加方便的批量下载音乐，这里采用了“按艺术家“的下载方式
Python用Pyqt5制作音乐播放器 Aix959 python 开发语言
具体效果如下需要实现的功能主要的几个有：1、搜索结果更新至当前音乐的列表，这样播放下一首是搜素结果的下一首2、自动播放3、滚动音乐文本4、音乐进度条5、根据实际情况生成音乐列表。我这里的是下面的情况，音乐文件的格式是歌名_歌手.mp3所以根据需求修改find_mp3_files方法，我这里返回的是[{"path":音乐文件路径,"music":歌名,"singer":歌手},{"path":音乐文
使用vscode远程连接linux运行项目报错解决方案大数据lsy 笔记 vscode linux python
报错：subprocess.CalledProcessError:Command'['/xxx/anaconda3/envs/graphinvent/bin/python','./graphinvent/main.py','--job-dir','/xxx/GraphINVENT/output_gdb13_1K/example/job_0/']'returnednon-zeroexitstatus
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo