alun550

Python —— 并发编程（多线程、多进程）

Python多线程编程

并行与并发
高并发解决理念
进程和线程
- 进程（Process）
- 线程（LightWeight Process，LWP）
- 进程与线程的理解
线程
- 线程的状态
- 线程安全
- daemon线程和non-daemon线程
- join
- thread.local 类
- Timer 定时器
- 线程池
Python中的进程和线程
- python中的进程
threading
- 基础
线程同步
- Event 事件
- Lock
- - 非阻塞锁
  - 可重入锁
  - Condition
- Barrier
- semaphore 信号量
进程
- 写法
- - 面相过程的写法
  - 面相对象的写法
- 进程控制
- daemon进程
- fork创建子进程（linux、unix）
- psutil
- 进程池
- 进程通信
- - Pipe
  - 进程队列
  - subprocess
  - Manager
- 进程同步
- - Lock
  - Semaphore
  - Event
  - Barrier

并行与并发

并行（parallel）

同一时刻有多个事情在同时进行（真同时并非时间切片），如多核CPU可以容纳多个工作同时进行

并发（concurrency）

并发着重于发，即发生。在某个时刻或者某段时间，同时发生了很多需要处理的请求

队列和缓冲区

队列即任务队列，任务按照任务队列的顺序进行执行；队列中存在优先队列，优先队列中的任务优先执行。
缓冲区即队列长度，允许排列的最长任务数；

对比

并行实际可以解决并发的问题，但反之不成立。

高并发解决理念

解决方式：
1、队列。以队列顺序执行，一些特殊的任务可以以优先队列的形式进行优先执行

2、争抢。各个任务以争抢的方式进行排列，当某个任务争抢到资源时，会生成排他性的独占锁若没有锁可能还未获取到资源便为其他任务挤出

特点：时间分布不均，某些应用可能长时间无法抢到计算机资源

3、预处理。以一种提前加载用户所需的数据的思路，提前进行一些处理以减少任务的实际运行时间（减少排他锁存在的时间），常用的如缓存

4、并行（水平扩展）：通过多开进程来线性的提高工作效率。如有10个任务，以5个进程运行则只需要运行两批即可

特点：对硬件需求较高（CPU核心数）、分布式、云服务等

5、提速（垂直提升）：提高硬件处理速度，如扩展内存、提高内存频率、CPU频率、减少南北桥通信延迟等

特点：容易摸到天花板，且容错能力极差

6、消息中间件（外部的队列）：常用的如RabbitMQ、ActiveMQ（Apache）、RocketMQ（阿里的Apache）、kafka（Apache ）等。系统外的外部第三方服务，将消息（数据）放在这些队列中，对请求高峰进行平滑

7、分布式部署

进程和线程

进程（Process）

进程是计算机中某程序关于某数据集合上的一次运行活动，是系统进行资源分配和调度的基本单位，是操作系统结构的基础。

程序和进程之间的关系，程序是源代码编译后的文件，当程序被操作系统加载到内存中，就是进程。进程中存放着指令和数据，也是线程的容器。

Liunx中有父进程、子进程，Windows的进程是平等关系。

线程（LightWeight Process，LWP）

并非所有的操作系统都实现了线程，但在实现了线程的操作系统中线程是操作系统能够进行运算的最小操作单元。线程被包含在进程中，是进程中的实际运作单位。一个程序的运行实例就是一个进程。

一个标准的线程由线程ID，当前指令指针（PC），寄存器集合和堆栈组成。
线程ID：用于表示当前线程；
当前指令指针（PC）：用于记录、描述当前指令运行位置，用于不同线程间的切换；
寄存器集合：将CPU还未处理完的数据保存在寄存器集合中；
堆栈：栈—只允许一段进行插入和删除，有底无顶的罐子，先进后出。先进进栈底后出出栈顶(TOP)，当TOP = -1 时栈为空。
栈类似于数组，有以下五种操作：push（压栈）、pop（弹栈）、判断是否为空、判断是否已满、返回栈顶的值。

进程与线程的理解

1、在操作系统中，每一个进程都认为自己独占所有的计算机资源。进程是一个独立的王国，进程间不可以随便的共享数据。多进程本来就是操作系统对程序的虚拟化。
2、线程是省份，同一个进程内的线程可以共享进程的资源，每一个线程拥有自己独立的堆栈。

线程

线程的状态

1、运行态（Ready）：该时刻，该线程正在占用CPU

2、就绪态（Running）：可随时转换为运行态，因为其他线程正在运行而暂停。目前该线程不占用CPU

3、阻塞态（Blocked）：线程处于阻塞状态，等待某些外部条件的触发，否则线程不运行（不希望出现永久阻塞）

4、终止态（Terminated）：线程完成后退出或者被取消

线程安全

在 python 中多线程会将某些非原子性的语句块打断，交叉执行。如 print() 在多线程调度时，很容易把最后的回车和前面的输出字符串做打断。这种情况就称作线程不安全

logging 是线程安全的，建议在多线程（日常调 bug 也建议替换）中使用 logging 来替换 print

daemon线程和non-daemon线程

daemon 是在 python 中为了简化程序员的工作，让他们不用管理那些只需要丢在后台，并且会随着主线程的退出而退出的线程。常用场景：发送心跳包、监控或者一些随时可以被终止的线程

此处的 daemon 并非 linux 中的 daemon守护线程，其含义更多的偏向于 “可以随时停止的线程” 而非 “后台线程”

daemon 线程会在主线程结束时，自动结束掉。而非 daemon 线程则不论主线程是否结束，都会执行完自身或者有异常抛出时才结束

开启方式，在 threading.Thread(daemon=True) 即代表新开线程为 daemon 线程

注：当子线程中既存在 daemon 线程又存在 non-daemon 线程时，会等待所有的 non-daemon 线程全部执行完毕后，再去执行 daemon 线程

daemon 必须在 start() 前进行设置，可以在构造时设置 daemon 参数，也可以对 thread 对象使用 setDaemon 同样必须在线程 start() 之前进行

如：

import threading
import time

from log import Log
from logging import DEBUG

logger = Log.getLogger(DEBUG)
debug = logger.debug


def worker():
    for x in range(100):
        debug(f"{threading.current_thread()} is running")
        threading.Thread(name="t2", target=worker1, daemon=True).start()

    debug(f"=== {threading.enumerate()} ===")


def worker1():
    for x in range(10000):
        debug(f"{threading.current_thread()} is running")

    debug(f"xxx {threading.enumerate()} xxx")


debug(f"*** {threading.current_thread()} is running ***")
debug(f"*** {threading.enumerate()} ***")
t1 = threading.Thread(name="t1", target=worker, daemon=True)
t1.start()
time.sleep(0.5)

join

写法： thread.join()

join() 的功能类似 ”使等待“，如在主线程中使用 t1.join()，即使当前线程（主线程）等待调用 join() 方法的线程，等到 t1 线程执行完毕后，当前线程（主线程）再继续向下执行（当前线程被阻塞在 join() 处）

join() —— 可以设置 timeout

import threading
import time

from log import Log
from logging import DEBUG

logger = Log.getLogger(DEBUG)
debug = logger.debug


def worker():
    for x in range(100):
        debug(f"{threading.current_thread()} is running")
        t2 = threading.Thread(name="t2", target=worker1, daemon=True)
        t2.start()
        t2.join()

    debug(f"=== {threading.enumerate()} ===")


def worker1():
    for x in range(100):
        debug(f"{threading.current_thread()} is running")

    debug(f"xxx {threading.enumerate()} xxx")


debug(f"*** {threading.current_thread()} is running ***")
debug(f"*** {threading.enumerate()} ***")
t1 = threading.Thread(name="t1", target=worker, daemon=True)
t1.start()
t1.join()
debug("w" * 30)

thread.local 类

thread.local 是一个类（线程安全的类），虽然没有用大写，但是是一个类，并且是一个可能会被大量实例化的类（因为内部实现了__slots__）。

其实是实现了一个可以被多个函数调用，但是每个函数中调用的又是独立的一个实例对象，常用于挂载属性，如要开启多个线程对一个同名属性进行修改时。

特点：

在全局变量中进行实现

可以大胆的用在本地变量中，用在各个线程的各局部变量时，是被隔离开的

注：能用局部变量就用局部变量，如非必要不要使用全局变量。使用优先级 “局部变量 > thread.local() > 全局变量”

写法如下：

import logging
import threading
import time

logger = logging.getLogger(__name__)
logger.setLevel(logging.DEBUG)
handler = logging.StreamHandler()
logger.addHandler(handler)

a = threading.local()


def worker():
    a.x = 0
    for i in range(100):
        time.sleep(0.00001)
        a.x += 1

    logger.debug(f"{threading.current_thread()}, {a.x}")


for i in range(10):
    threading.Thread(target=worker).start()

Timer 定时器

threading.Timer() 开启一个延时启动的线程（是 thread 的子类），参数如下：

interval —— 延迟的时间，单位秒

function —— 要调用的函数

args —— 位置参数（非收集，需要传入元组或列表）

kwargs —— 关键字参数（非收集，需要传入字典）

Python 中的线程一旦执行则无法被取消，除非线程执行结束或抛出异常。但是在线程未执行前，是可以被取消的。但是其他非延迟启动线程，当调用 .start() 时线程即启动，则无法取消，延迟线程则在未达到延迟时间前都可被取消

取消方式：t1.cancel()

注： cancel() 并非一定要放到 start() 后面，也可放到 start() 前，同样可以在线程执行前取消掉线程的执行

import threading


def add(x, y):
    print(x, y)
    print(threading.enumerate())


t = threading.Timer(3, add, (4, 5)).start()
print("main")
print(threading.enumerate())

线程池

线程的新建与终止需要回收资源，如果可以重用线程，则可以减少这部分的资源消耗，线程池就是为此而生

线程池工作的两部分：

线程池 —— 提供固定数量的可用线程

任务队列 —— 统一收集要处理的任务

适用场景：适合突发性大量请求或者需要大量线程完成的任务（单个任务的处理时间较短的任务）

主要执行方法：

pool.map(func, tasks) —— 直接将任务列表传入。直接返回 func 的运行结果

pool.submit(func, task) —— 将单个任务传入，一般通过列表生成器来批量完成。返回 futures 对象列表，相当于前端的 promise 对象
1、若直接迭代列表，则会等待当前 future 状态为完成时，才进行 print，并继续下一个 future
2、若使用 as_completed(futures) 进行迭代，则会打乱顺序，先执行完的先走循环中的 print

import time, random
import time
from concurrent.futures import ThreadPoolExecutor, as_completed


def worker(s):
    time.sleep(s)
    return s


tasks = [random.uniform(0.1, 0.3) for i in range(100)]
# 方法一
start = time.time()
with ThreadPoolExecutor(10) as pool:
    results = pool.map(worker, tasks)
    for result in results:
        ...
        # print(result)

print(f"cost: {time.time()-start}")

# 方法二
start = time.time()
with ThreadPoolExecutor(10) as pool:
    futures = [pool.submit(worker, task) for task in tasks]

    # # 固定顺序获取结果
    # for future in futures:
    #     ...
        # print(future.result())

    # 任务完成顺序获取结果
    for future in as_completed(futures):
        ...

print(f"cost: {time.time()-start}")

Python中的进程和线程

python中的进程

python中的进程会启动一个解释器进程，线程共享一个解释器进程

Python的线程通过 Thread类来完成，其主要参数如下

target —— 线程调用的对象，就是目标函数名

name —— 为线程起名

args —— 为目标函数传递实参，元组

kwargs —— 为目标函数传递关键字参数，字典

注意：
1、Python 中并没有线程退出的方法，只能等待线程完成或者抛出异常

2、Python 中的线程没有优先级、没有线程组的概念，也不能被销毁、停止、挂起，那也就没有恢复、中断了

threading

基础

threading.Thread 的参数

参数	含义
group	为未来留 ThreadGroup 扩展留的参数，目前只接受 None
target	线程调用的对象，就是目标函数名
name	为线程起名
args	为目标函数传递实参，元组
kwargs	为目标函数传递关键字参数，字典

threading 的属性和方法

名称	含义
current_thread()	返回当前线程对象
main_thread()	返回主线程对象
active_count()	当前处于 alive 状态的线程个数
enumerate()	返回所有活着的线程列表，不包括已经终止的线程和未开始的线程
get_ident()	返回当前线程的ID，非0整数

Thread实例的属性和方法

属性及方法	含义
name	线程的名称
ident	线程的ID，非 0 整数，线程启动后才会有 ID，否则为 None。线程退出，此 ID 会被回收
is_alive()	返回线程是否活着
getName()	获取线程名称
setName()	设置线程名称
start()	启动线程。每一个线程必须且只能 start 一次，即使线程已经退出，也无法再调用 start
run()	运行线程

注意：

1、线程在 start() 时，先运行 threading.start()，再运行 threading.run()

2、线程在 start() 时，会给 Thread 实例添加 _target、_args、_kwargs 等属性，并且会在线程退出时清空这些属性。由此在线程退出后，在调用 run() 方法时，会找不到这些属性，进而导致无法运行，如果人为补全，也是可以运行的

3、当在主线程内直接调用 t.run() 时，会直接使用主线程调用 threading.Thread() 传入的函数，此时主线程被阻塞，等待函数调用完成后，主线程继续执行

实例一：运行 start() 是先调用 start()，再调用 run()

import threading
import time


class MyThread(threading.Thread):

    def run(self) -> None:
        print("run")
        super().run()

    def start(self) -> None:
        print("start")
        super().start()


def add(x, y):
    for i in range(5):
        time.sleep(1)
        print("adding...")
    print("over")
    return x + y


t1 = MyThread(None, add, "t1", (1, 2), {})
t2 = MyThread(None, add, "t2", (3, 4), {})
t1.start()
t2.start()

实例二：不使用 start() 直接使用 run()，会使用主线程执行 threading.Thread() 传入的函数

import threading
import time


class MyThread(threading.Thread):

    def run(self) -> None:
        print("run")
        super().run()

    def start(self) -> None:
        print("start")
        super().start()


def add(x, y):
    print(threading.current_thread())
    for i in range(3):
        time.sleep(1)
        print("adding...")
    print("over")
    print(threading.enumerate())
    return x + y


t1 = MyThread(None, add, "t1", (1, 2), {})
t1.run()
print(threading.enumerate())

线程同步

线程同步，线程间协同，通过某种技术，让一个线程访问某些数据时，其他线程不能访问这些数据，直到该线程完成对数据的操作

基本方法：临界区（Critical Section）、互斥量（Mutex）、信号量（Semaphore）、事件Event

多个线程中，如果需要主动释放计算资源，则可以调用 time.sleep(0)

Event 事件

Event事件，是线程间通信机制中最简单的实现，使用一个内部的标记 flag，通过 flag 的 True 或 False 的变化来操作

名称	含义
set()	标记设置为 True
clear()	标记为 False
is_set()	标记是否为 True
wait(timeout=None)	设置等待标记为 True 的时长，None 为无限等待。等到返回 True，未等到超时了返回 False

如下示例，通过 Event 事件在不同线程间进行信息传递。在不同线程间检测 Event 实例的 flag。需要等待的线程，可以调用 wait() 来等待一定时间。

import threading
import time
import logging

logger = logging.getLogger()
handler = logging.StreamHandler()
handler.setFormatter(logging.Formatter("%(levelname)s - %(asctime)s - %(message)s"))
logger.addHandler(handler)
logger.setLevel(logging.DEBUG)

n = 0


# 给参数设置注解，可以帮助 IDE 搜索该对象的属性及方法
def boss(event: threading.Event):
    logger.info("老板在等待...")

    # 让该线程等待
    if event.wait(timeout=2):
        # wait 等到了 event 的 flag 变为 true
        logger.info("老板很开心")
    else:
        # wait 返回的 event 的 flag 为 false
        logger.info("老板生气了")


def create_cup(event: threading.Event):
    global n
    for i in range(10):
        time.sleep(0.1)
        n += 1
        logger.info(f"已经做了{n}个")

        logger.info(threading.enumerate())

    # 设置 flag 为 True 代表执行结束
    event.set()
    logger.info("制作杯子结束")


event = threading.Event()
logging.info(f"event is set: {event.is_set()}")
t1 = threading.Thread(target=boss, args=(event,))
t2 = threading.Thread(target=create_cup, args=(event,))
t1.start()
t2.start()
logger.info("主线程执行完毕")
logger.info(threading.enumerate())

Lock

凡是存在资源争抢的地方都可以使用锁，从而保证只有一个使用者可以完全使用这个资源

可以使用 threading 提供的 Lock，也可以自己实现 lock

使用方法：

实例化锁 —— lock = threading.Lock()

加锁 —— lock.acquire(blocking=True, timeout=-1)，成功拿到锁返回 True，否则返回 False。当 blocking=False（非阻塞态）时，timeout 会被禁用

解锁 —— lock.release()

在锁开启阻塞状态下，通过多个线程对同一个锁的同时操作来完成数据的共享，当要修改某个共享数据时，要求线程先拿到锁，再修改，修改完再释放。由此可以避免多个线程对共享数据的同时修改

阻塞锁的注意事项：

1、当一个线程获取锁后，若线程内的代码执行失败，则无法正常对锁进行释放，由此所有的线程都无法继续运行。为避免这种情况，需要借助 try…except…finally 来将释放锁放到 finally 中，无论如何要将当前线程加的锁释放掉

2、避免线程调度不均衡。即避免在某个线程的死循环内，频繁的解锁、加锁，尤其是当两次操作间的代码执行的非常快的时候。有可能造成该线程刚释放锁，中间部分的代码就执行完毕，该线程又迅速加上了锁，由此会导致其他线程无法运行

3、多线程使用锁最重要的就是代码的逻辑，即线程的调度能力。如，尽量避免在加锁后到解锁前的代码中执行中断循环的操作。因为当任务目标达成时，完成最后一个任务的线程会中断循环，但是此时锁并没有释放，其他线程会持续阻塞，导致程序无法结束退出

适用场景

锁适用于访问和修改同一个共享资源时，即读写同一个资源的时候。若被访问的资源仅仅是读取，那么不需要加锁

注意事项

少用锁，必要的时候用锁，多线程中访问被锁资源时，就成了串行，要么排队执行，要么争抢执行
加锁的时间越短越好，不需要就立即释放
一定要避免死锁
避免在加锁后的操作无法正常执行完毕，从而导致锁不会被释放。最好使锁对象支持 with 语法，以保证无论如何锁一定会被释放（使用 try … except … finally … 次之）

非阻塞锁

在获取锁的时候，使用参数 blocking 来控制，若 blocking 为 True 则表示锁为阻塞锁，即当前线程拿到锁后，其他线程无法在当前线程释放前拿到锁，并且若其他线程的 blocking 为 True 则其他线程在此处阻塞，并争抢锁，拿到锁后再继续运行。若其他线程的 blocking 为 False 则其他线程的 .acquire(Flase) 返回 Flase 并继续向下执行。即锁的阻塞与否，影响的是自身线程，控制自身线程是否在此处等待，

可重入锁

可重入锁是线程相关的锁。某个线程获得可重复锁，并且可以获取多个，但是有多少个 .acquire() 就要有多少个 release。对相同的 rlock 对象，在哪个线程内加是锁，就只能由这个线程操作。其他线程操作的都是自己的 RLock

语法：lock - threading.RLock()

Condition

构造方法 Condition(lock=None)，可以传入一个 Lock 或 RLock 对象，默认是 RLock

Condition 用户生产者、消费者模型，为了解决生产者消费者速度匹配问题

Condition 在内部以 _waiters 属性（_deque() 的双端队列）存储需要等待（使线程进入休眠的状态）的线程，当达到某些情况时，Condition通过调用 notify() 和 notify_all() 来唤醒线程

设计模式中的广播模式就是类似情况

方法

方法	含义
acquire()	获取锁
wait(timeout=None)	使当前线程处于等待状态，会加入到等待队列（每个 Condition 对象都有一个自己的 _waiters 的队列）。处于等待状态的线程需要别的线程（因为自己已经阻塞住了）调用 notify() 或者 notify_all() 来激活处于等待队列中的线程，使其继续执行
notify(n=1)	唤醒之多 n 个等待的线程，没有等待的线程就没有任何操作
notify_all()	唤醒所有等待线程

使用场景：生产者生产产品，消费者排队获取

Barrier

Barrier 常用于并发初始化，所有线程必须都初始化完成后，才能继续工作。当 barrier.wait() 的线程数（每个线程执行到 barrier.wait() 的时候都会阻塞住）达到预设的 parties 时，会将各线程放开（争抢）执行

Barrier 类似 MOBA 游戏的对战房，每个对战房有不同的人数限制（2人，6人，10人，20人等），当房间内人数不满时，所有人均在房间内等待。当房间内人数达到预设值时，游戏开始所有人（线程）自行行动

Barrier 没有次数限制，一波放行后，继续积攒下一波

名称	含义
Barrier(parties, action=None, timeout=None)	构建 Barrier 对象，指定参与方数目。timeout 是 wait 方法未指定超时时间时的默认值
n_waiting	当前在屏障中等待的线程数
parties	各方数，需要等待的个数
wait(timeout=None)	等待通过屏障。返回 0 到线程数 -1 的整数，每个线程返回不通。如果 wait 方法设置了超时，并超时发送，屏障将处于 broken 状态
abort()	打破屏障使 barrier 处于 broken 状态，现有的处于等待的线程会触发 threading.BrokenBarrierError。处于 broken 状态的 barrier 无法继续 wait()，碰到 wait() 直接触发 BrokenBarrierError

semaphore 信号量

信号量与 Lock 很像，信号量对象内部维护一个倒计数器，每一次 acquire 都会减 1，当 acquire 方法发现计数为 0 就阻塞请求的线程，直到其他线程对信号量 release 后，计数大于 0，恢复阻塞的线程

常见应用：连接池

若 Semaphore 没有 acquire() 则直接 release()，其信号值会增加（semaphore对象的_value属性）。若要生成有顶的 Semaphore 则使用 BoundedSemaphore()，当尝试 release() 超过上限时，会抛出 Value Error

名称	方法
Semaphore(value=1)	构造方法，value 小于 0，抛 ValueError 异常
acquire(blocking=True, timeout=None)	获取信号量，计数器减1，获取成功返回 True
release()	释放信号量，计数器加 1

进程

在 Python 中进行多进程开发，需要借助 multiprocessing 模块进行多进程编写，而在这个模块内部提供有一个 Process 类，利用这个类可以进行多进程的定义

进程的声明周期

创建状态 —— 系统已经为其分配了 PCB（可以获取进程信息），但是所需要执行的进程的上下文环境并未分配，因此当前进程还无法被调度

就绪状态 —— 该进程已经分配到了除 CPU 之外的全部资源（上下文），并等待 CPU 调度

执行状态 —— 进程已获取了 CPU 资源，开始正常提供服务（执行进程）

阻塞状态 —— 所有的进程不可能一直强占 CPU（共享资源），依据资源调度算法，每一个进程运行一段时间后，让出当前的 CPU 资源给他其他进程执行

终止状态 —— 某一个进程达到了自然终止的状态，或者进行了强制性的停止，则当前进程进入到了终止态，不再继续执行

注意：

1、每个进程都认为自己独占所有计算机资源。由此多个进程中的线程地址可能存在相同值

2、任何一个进程都包含有各自独立的数据，各个进程间无法直接互相访问数据，若要进程通信需要特殊的方法（如“管道”）

process 类的方法

方法	类型	描述
pid	属性	获取进程ID
name	属性	获取进程名称
multiprocessing.Process()	初始化方法	参数如下： - group：分组定义 - target：进程处理对象（代替 run() 方法） - name：进程名称，若不设置则自动分配一个名称 - args：进程间处理对象所需要的执行参数 - kwargs：关键字参数 - daemon：是否被设置为后台进程
start()	方法	启动进程，进入进程调度队列
run()	方法	处理进程，不指定 target 时起效

CPU密集型任务的 “单线程”、“多进程”、“多线程” 的运算速度对比

| | 单线程 | 多线程 | 多进程 |
|–|–|–|–|–|
| 三并发 | 1min 31sec | 1min 35sec | 34sec

cpu密集型任务（从1加到1亿）在多进程和多线程下的耗时情况如下图，我的机器是 6核 12线程

可以看到多进程任务大致有如下规律（不要看曲线斜率，x轴尺度变化不均匀，看斜率没用）

在进程数达到物理核心数前，多进程并行处理任务，时间基本与单进程相同（考虑主要受操作系统和其他软件所占用资源的影响，所以时间略长一些）
当进程数达到核心数后，任务耗时增加的比例与进程数与核心数的比例几乎相同。可以理解为物理核心数分 n 波执行了任务，每波都是并行的，前后两波间是串行的（只是这么理解，操作系统会把任务分割成时间片，也就是说每一波都是交叉执行的。实际代码执行时不会是先执行 6个，再执行 6个，会表现为每个进程之间耗时差不太多，几乎同步结束）

多线程有大致如下规律

在 CPU 密集型任务下，多线程的任务耗时和串行执行几乎相同，甚至更久（线程切换、GIL加锁解锁的耗时），基本都是线性递增

写法

面相过程的写法

import multiprocessing
from datetime import datetime


def worker():
    sum = 0
    for i in range(1000000000):
        sum += 1

    print(sum)


if __name__ == '__main__':
    start = datetime.now()
    processes = []
    for i in range(6):
        process = multiprocessing.Process(target=worker)
        process.start()
        processes.append(process)
    for process in processes:
        process.join()

    end = datetime.now()
    print(end - start)

面相对象的写法

自定义一个类，使其继承 multiprocessing.Process，并且重写 __init__、run() 方法，前者用来传参（如 name），后者用来将 target 指向的函数在 run() 的内部进行实现。并且经常会添加一个 “延迟启动” 的功能，通过传一个值给 __init__ 并且在 run() 内 sleep 给定时间即可

import multiprocessing
import time


class MyProcess(multiprocessing.Process):
    def __init__(self, name, delay, count):
        super(MyProcess, self).__init__(name=name)
        self.__delay = delay
        self.__count = count

    def run(self) -> None:
        for num in range(self.__count):
            print(f"{num}, 进程ID：{multiprocessing.current_process().pid}, 进程名称：{multiprocessing.current_process().name}")
            # 延迟运行
            time.sleep(self.__delay)


if __name__ == '__main__':
    # 查看当前活动的子进程
    print(multiprocessing.active_children())
    processes = []
    for i in range(3):
        process = MyProcess(name=f"Process-{i}", delay=1, count=10)
        process.start()
        processes.append(process)

    # 查看子进程全部启动后当前活跃的子进程
    print(multiprocessing.active_children())

    for process in processes:
        process.join()

    # 查看子进程全部执行完毕后，当前活跃的子进程
    print(multiprocessing.active_children())

进程控制

主要方法

方法	含义
terminate()	关闭进程
is_alive()	查看线程是否存活
join(timeout=None)	同 thread，让当前线程等待执行这个方法的线程对象所在的线程执行完毕

daemon进程

类似 thread 中的 daemon 线程，当创建此线程的线程执行结束或者中断后，daemon 进程会被立即停止掉。常用于服务状态的检测、分发等非工作业务功能

import multiprocessing
import logging
import time

logger = logging.getLogger(__name__)
handler = logging.StreamHandler()
handler.setFormatter(logging.Formatter("%(message)s"))
logger.addHandler(handler)
logger.setLevel(logging.DEBUG)


# 守护进程
def status():
    while True:
        logger.info(
            f"守护进程ID：{multiprocessing.current_process().pid}, 守护进程name：{multiprocessing.current_process().name}")
        time.sleep(1)

# 工作进程
def worker():
    # 启动守护进程
    multiprocessing.Process(target=status, name="守护进程", daemon=True).start()
    for i in range(3):
        time.sleep(1)
        logger.info(
            f"工作进程ID: {multiprocessing.current_process().pid}, 工作进程name：{multiprocessing.current_process().name}"
            f", item: {i}")


def main():
    multiprocessing.Process(target=worker, name="工作进程").start()


if __name__ == '__main__':
    main()

fork创建子进程（linux、unix）

使用 multiprocessing 创建的子进程都是通过 Python 创建的一个跨平台的子进程。除了使用 Python 创建外，也可以使用操作系统创建子进程（os.fork()），这种形式创建的子进程并不是跨平台的，仅在 linux 下可用

fork() 有三种结果 <0、=0、>0 分别对应 “创建失败”、“子进程获取数据”、“父进程获取数据” 三种状态

import os
import multiprocessing


def sub():
    print(f"sub() 子进程ID：{os.getpid()}，父进程ID：{os.getppid()}")


def main():
    print(f"main() 进程ID：{multiprocessing.current_process().pid}，进程名称：{multiprocessing.current_process().name}")
    newpid = os.fork()
    print(f"fork() 的新子进程状态码：{newpid}")
    # 给子进程分发任务
    if newpid == 0:
        sub()
    else:
        print(f"父进程执行，父进程ID：{os.getpid()}")


if __name__ == '__main__':
    main()

linux执行如下

psutil

psutil是一个第三方的进程管理模块，该模块可以跨平台进行进程管理

pip install -i https://pypi.douban.com/simple psutil

import psutil


def main():
    for process in psutil.process_iter():
        print(f"进程编号:{process.pid}，进程名称：{process.name()}，创建时间：{process.create_time()}")
        # 关闭记事本
        if process.name() == "notepad.exe":
            process.terminate()


if __name__ == '__main__':
    main()

进程池

使用多进程的确可以充分的发挥出全部的硬件性能，但是随之有可能带来一些问题：例如，多进程过多的时候如何保证系统的性能平衡，以及对于这多个进程的管理问题

为了更好的保证多进程和操作系统性能之间的平衡问题，所以一般可以将多个进程放在一个对象池中进行统一管理，对象池本身是有大小限制的，这样就可以保证不会产生过多的进程从而影响到硬件的性能，这个对象池实际上就是进程池

实现：multiprocessing.Pool(processes=2) # 开启两个进程

def resample_jpgs_from_log(log_file: str):
    # 获取需要处理的图片
    unvalid_jpgs: list = _get_unvalid_jpg_from_log(log_file)
    # 创建进程池，进程数为系统逻辑处理器数减一
    pool = multiprocessing.Pool(os.cpu_count() - 1)
    pool.map(_resample_jpg, unvalid_jpgs)
    # 关闭进程池（停止接收新任务到进程池）
    pool.close()
    # 等待子进程结束
    pool.join()

进程通信

Pipe

管道是由内核管理的一个缓冲区，用于从一个进程获取信息并传递给另一个线程，其工作模式类似广播，获取信息的进程在管道中没有信息时会被阻塞，直到有新信息进入管道或者超时。

管道的空间有限，当管道中信息填满时，向管道传递信息的进程会被阻塞，等待有空间后再放入

管道可用于具有亲缘关系进程间的通信，有名管道甚至还允许无亲缘关系的进程间通信

注意：

管道既可以被发送者关闭，也可以被接收者关闭，二者均会触发 EOFError，要即使捕捉并处理

当进程（send、receive）执行完毕时，管道会被关闭掉

import multiprocessing
import time
from multiprocessing.connection import PipeConnection


def send_data(pipe_send: PipeConnection):
    for i in range(10):
        pipe_send.send(f"message {i}")
        print(f"*** 已发送：message {i}")
        time.sleep(0.5)


def receive_data(pipe_recv: PipeConnection):
    for i in range(10):
        recv = pipe_recv.recv()
        print(f"=== 已接收：{recv}")


def main():
    pipe_send, pipe_recv = multiprocessing.Pipe()
    process_send = multiprocessing.Process(target=send_data, args=(pipe_send,))
    process_recv = multiprocessing.Process(target=receive_data, args=(pipe_recv,))
    process_send.start()
    process_recv.start()


if __name__ == '__main__':
    main()

进程队列

不通的进程彼此之间可以利用管道实现数据的发送和接受，但是如果说现在发送的数据过多并且接收处理缓慢的时候，那么这种情况下就需要引入队列的形式来进行缓冲的操作实现

使用队列对象
from multiprocessing import Queue

队列的方法

方法	描述
put(obj, block=True, timeout=None)	将数据推入队列，若 block 为 False 则当无法推入数据时候（队列满或者队列不可用）直接抛出异常
get(block=True, timeout=None)	从队列获取数据，若 block 为 False 则当无法获取数据时候（空队列或者队列不可用）直接抛出异常
qsize()	获取队列保存数据个数
empty()	bool，是否为空队列
full()	bool，是否为满队列

subprocess

采用管道的形式去启动操作系统中的另外一个进程，并且还可以获取此进程的相关信息

主要方法 subprocess.Popen()，参数如下

args —— 要执行的 shell 命令或命令列表

bufsize —— 缓冲区大小

stdin —— 标准输入

stdout —— 标准输出

stderr —— 错误信息

shell —— 是否直接执行命令

cwd —— 当前的工作目录

env —— 子进程的环境变量

subprocess 可以通过管道来对进程间进行通信，包括从一个进程中执行另外一个进程

实例：通过 subprocess 启动 python 命令行，并且执行命令

import subprocess
import time

# 启动并进入 python 解释器
py = subprocess.Popen(["python.exe"], stdin=subprocess.PIPE, stdout=subprocess.PIPE, stderr=subprocess.PIPE)

# 在 python 解释器中以输入流输入
py.stdin.write("import time\n".encode())
py.stdin.write("print(time.localtime())\n".encode())
py.stdin.write("print('123')\n".encode())
py.stdin.write("1/0\n".encode())
py.stdin.close()

cmd_out = py.stdout.read().decode()
py.stdout.close()
print(cmd_out)

cmd_error = py.stderr.read().decode()
py.stderr.close()
print(cmd_error)

实例二、自动装包

import subprocess
import sys

subprocess.call(
    [sys.executable, '-m', 'pip', 'install', '-i', 'http://pypi.douban.com/simple', '--trusted-host', 'pypi.douban.com',
     'pandas'])

Manager

不同进程之间虽然可以通过管道的形式实现数据的传输，但是如果每一次操作都是通过管道进行处理，那么实际上就会非常麻烦，所以为了进一步简化不同进程之间的数据共享，提供了一个 Manager 类

Manager类中提供 dict、list 两种数据类型，供多进程进行数据共享

实例：多进程共同修改

import multiprocessing


def worker(list, item):
    list.append((f"item: {item}", (multiprocessing.current_process().name, item)))


def main():
    manager = multiprocessing.Manager()
    main_item = f"Manager类: {multiprocessing.current_process().name}"
    mgr_list = manager.list()

    # 开启三个进程，每个进程向 Manager 的 list 中插入一条数据
    processes = [multiprocessing.Process(target=worker, args=(mgr_list, item), name=f"name-{item}") for item in
                 range(3)]
    # 启动所有进程
    [process.start() for process in processes]
    # 阻塞主进程
    [process.join() for process in processes]

    # 在主进程中读取数据，查看是否成功被各个子进程修改
    print(mgr_list)


if __name__ == '__main__':
    main()

进程同步

Lock

当多进程加上进程锁后，被锁住的部分就成了单进程执行。只有在需要保证数据安全的前提下，才建议使用锁，否则尽量避免锁的使用

借助：multiprocessing.Lock()

主要方法

方法	含义
acquire(blocking=False, timeout=None)	请求锁
release()	释放锁

import time
from multiprocessing.synchronize import Lock
import multiprocessing
import sys


def worker(ticket_dict: dict, lock: Lock):
    while True:
        # 在获取数据前就要加锁，否则依旧会有多个进程共同修改数据
        lock.acquire()
        number = ticket_dict.get("ticket")
        if number > 0:
            time.sleep(1)
            print(f"{multiprocessing.current_process().name} --- {number} ticket")
            number -= 1
            ticket_dict.update({"ticket": number})
            lock.release()
        else:
            lock.release()
            break


def main():
    manager = multiprocessing.Manager()
    mgr_dict = manager.dict({"ticket": 5})
    lock = multiprocessing.Lock()
    print(type(lock))
    # sys.exit()
    processes = [multiprocessing.Process(target=worker, args=(mgr_dict, lock), name=f"售票员：{i}") for i in range(10)]
    [process.start() for process in processes]
    [process.join() for process in processes]
    print(f"最终剩余票数：{mgr_dict.get('ticket')}")


if __name__ == '__main__':
    main()

Semaphore

信号量，原理与多线程的信号量相同，当信号量归零前一直可以进行 acquire()，但是归零后则无法 acquire() 只有当之前的信号被 release() 之后，后续的进程才可以 acquire()

主要方法

方法	含义
acquire(blocking=False, timeout=None)	请求锁
release()	释放锁

import time
from multiprocessing.synchronize import Lock
import multiprocessing


def worker(ticket_dict: dict, sema: Lock):
    while True:
        # 在获取数据前就要加锁，否则依旧会有多个进程共同修改数据
        sema.acquire()

        number = ticket_dict.get("ticket")
        number -= 1

        if number < 0:
            sema.release()
            break
        ticket_dict.update({"ticket": number})
        time.sleep(5)
        print(f"{multiprocessing.current_process().name} --- {number} ticket")

        sema.release()


def main():
    manager = multiprocessing.Manager()
    mgr_dict = manager.dict({"ticket": 5})
    sema = multiprocessing.Semaphore(3)
    print(type(sema))
    # sys.exit()
    processes = [multiprocessing.Process(target=worker, args=(mgr_dict, sema), name=f"售票员：{i}") for i in range(10)]
    [process.start() for process in processes]
    [process.join() for process in processes]
    print(f"最终剩余票数：{mgr_dict.get('ticket')}")


if __name__ == '__main__':
    main()

Event

通过 Event 对象来进行多进程之间的数据同步，各个线程通过判断 flag 来进行程序控制。一般用于有前后承接关系的场景，前一个任务完成后，之后的任务才能进行

import multiprocessing
import time


def customer(event):
    print(f"正在点餐")
    time.sleep(1)
    print("点餐结束")
    event.set()


def waiter(event):
    event.wait()
    print("正在服务")
    time.sleep(1)
    print("服务完成")


def main():
    event = multiprocessing.Event()
    process_customer = multiprocessing.Process(target=customer, args=(event,))
    process_waiter = multiprocessing.Process(target=waiter, args=(event,))
    process_customer.start()
    process_waiter.start()


if __name__ == '__main__':
    main()

Barrier

略

你可能感兴趣的:(python,python,开发语言,后端)

04.文本标签龙哥带你学编程 #html 前端
一、文本简介1、页面组成元素1）以淘宝购物官网为例，分析网页：在淘宝购物官网的首页上，我们可以看到它是由超链接，文字，图片等元素构成。2）页面组成元素①一个静态页面绝大部分由以下四种元素组成：文本图片超链接音频和视频②思考：符合以下特点的网页是静态还是动态页面？带有音频和视频带有flash动画带有css动画带有JavaScript特效不是。动态页面和静态页面区别在于：是否用到了后端技术，以及是否与
深度优先搜索和广度优先搜索详细解析和区别潇杨爱吃粉深度优先宽度优先算法数据结构
一、深度优先搜索（DFS）1.核心思想像探险家走迷宫，遇到岔路就选一条路走到头，无路可走时返回上一个岔路口换另一条路。2.实现方式数据结构：栈（Stack，先进后出）或递归（隐式栈）遍历顺序：纵向深入，优先访问最深层的节点3.图解示例假设有以下树结构：A/\BC/\/DEFDFS遍历顺序（从根节点A出发）：A→B→D→E→C→F4.代码实现（Python）defdfs(graph,start):s
DeepSeek 模型未来怎么走？技术创新、行业落地全解析！网罗开发 AI 大模型人工智能人工智能职场和发展
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
Python-modbustcp通信-plc读写张凯的工作室 python python
Python-modbustcp通信-plc读写1，功能码说明读取：%m对应READ_COILS线圈寄存器数值0和1%mw存单字节%mf浮点数%md双字节对应READ_HOLDING_REGISTERS保持寄存器写入单个写入线圈寄存器WRITE_SINGLE_COIL%m单个写入保持寄存器WRITE_SINGLE_REGISTER写入多个保持寄存器WRITE_MULTIPLE_REGISTERS写
PyCharm v2024.3.5 强大的Python IDE工具支持M、Intel芯片 2401_89264762 python ide pycharm
PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具，比如调试、语法高亮、Project管理、代码跳转、智能提示、自动完成、单元测试、版本控制。此外，该IDE提供了一些高级功能，以用于支持Django框架下的专业Web开发。应用介绍PyCharm是由JetBrains打造的一款PythonIDE，VS2010的重构插件Resharper就是出自
免费界面库 python_一个非常简单好用的Python图形界面库(PysimpleGUI) 不妧免费界面库 python
前一阵，我在为朋友编写一个源代码监控程序的时候，发现了一个Python领域非常简单好用的图形界面库。说起图形界面库，你可能会想到TkInter、PyQt、PyGUI等流行的图形界面库，我也曾经尝试使用，一个很直观的感受就是，这太难用了。就去网上搜搜，看看有没有一些demo，拿来改改，结果很少有，当时我就放弃了这些图形库的学习，转而使用了vue+flask的形式以浏览器网页作为程序界面，因为我会这个
Python 网络爬虫：从入门到实践一ge科研小菜菜编程语言 Python python
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注网络爬虫是一种自动化的程序，用于从互联网上抓取数据。Python以其强大的库和简单的语法，是开发网络爬虫的绝佳选择。本文将详细介绍Python网络爬虫的基本原理、开发工具、常用框架以及实践案例。一、网络爬虫的基本原理网络爬虫的工作流程通常包括以下步骤：发送请求：向目标网站发送HTTP请求，获取网页内容。解析内容：提取需要的数据，可以是HTML标签
PySimpleGUI 4.60.5 孔帆贝
PySimpleGUI4.60.5【下载地址】PySimpleGUI4.60.5**PySimpleGUI**是一款专为简化PythonGUI（图形用户界面）编程而生的库。该库设计宗旨在于通过提供简洁、易懂的API接口，使开发者能够以更快的速度和更少的代码量创建出美观实用的应用程序。对于无论是GUI编程新手还是寻求快速开发工具的老手来说，PySimpleGUI都是一个极具吸引力的选择。其通过封装了
《今日AI-人工智能-编程日报》-源自2025年3月19日小亦编辑部每日AI-人工智能-编程日报人工智能
1.豆包AI编程功能迎来三项重磅升级豆包平台今日宣布其AI编程功能迎来三项重要升级，包括：HTML实时预览：支持用户在编写HTML代码时实时查看网页效果，显著提升前端开发效率，尤其适用于小游戏和网页制作。Python代码直接运行与一键修复：用户可直接运行Python代码，并在出错时一键修复，极大降低了编程门槛，提升了开发效率。生成完整项目：新增生成完整项目的功能，帮助用户快速创建应用程序，缩短开发
python PySimpleGUI 使用 Seeklike python
#PySimpleGUI库快速简单构建一个gui窗口#PySimpleGUI是一个用于简化GUI编程的Python包，它封装了多种底层GUI框架（如tkinter、Qt、WxPython等），提供了简单易用的API。#PySimpleGUI包含了大量的控件（也称为小部件或组件），这些控件可以帮助你快速构建用户界面#导包importPySimpleGUIassgimportcv2importkeyb
2024年最全Python二级考试试题汇总（史上最全） 2401_84584831 程序员 python 开发语言算法
C‘1,2,3,4,5,’D1,2,3,4,5,正确答案：D以下程序的输出结果是：a=30b=1ifa>=10:a=20elifa>=20:a=30elifa>=30:b=aelse:b=0print(‘a={},b={}’.format(a,b))Aa=30,b=1Ba=30,b=30Ca=20,b=20Da=20,b=1正确答案：D以下程序的输出结果是：s=‘’try:foriinrange(
如何通过Python实现自动化任务：从入门到实践小弟有话说1.0 python 自动化开发语言
在当今快节奏的数字化时代，自动化技术正逐渐成为提高工作效率的利器。无论是处理重复性任务，还是管理复杂的工作流程，自动化都能为我们节省大量时间和精力。本文将以Python为例，带你从零开始学习如何实现自动化任务，并通过一个实际案例展示其强大功能。一、为什么选择Python实现自动化？Python作为一种简单易学、功能强大的编程语言，已经成为自动化领域的首选工具。以下是Python在自动化中的几大优势
2024年Python最新Python二级考试试题汇总（史上最全）_计算机二级python真题 2301_82243979 程序员 python 开发语言前端
表达式1001==0x3e7的结果是：AfalseBFalseCtrueDTrue正确答案：B以下选项，不是Python保留字的选项是：AdelBpassCnotDstring正确答案：D表达式eval(‘500/10’)的结果是：A‘500/10’B500/10C50D50.0正确答案：D表达式type(eval(‘45’))的结果是：ABCNoneD正确答案：D表达式divmod(20,3)的
Python点名器代码及打包教程羽落惊鸿TQ python 开发语言
接下来再写一个功能性齐全稍微复杂一点的Python点名器程序，在原简易版的基础上增加历史记录功能、支持多种名单格式（CSV/Excel）、增加点名统计功能，并详细说明了将该程序打包成exe可执行文件的方法，以下是源代码，仅供学习参考：importtkinterastkfromtkinterimportttk, messagebox, filedialogimportrandomimportcsvi
基于python+django的旅游信息网站-旅游景点门票管理系统源码+运行步骤冷琴1996 Python系统设计 python django 旅游
该系统是基于python+django开发的旅游景点门票管理系统。是给师弟做的课程作业。大家学习过程中，遇到问题可以在github咨询作者。学习过程问题可以留言哦演示地址前台地址：http://travel.gitapp.cn后台地址：http://travel.gitapp.cn/admin后台管理帐号：用户名：admin123密码：admin123源码地址https://github.com/
50个常见的python毕业设计/课程设计（源码+文档）冷琴1996 Python系统设计 python 课程设计开发语言
计算机课程设计/毕业设计指南，为计算机相关专业毕业生提供源码、数据库安装、远程调试等相关服务，提供功能讲解视频。下面是50个基于python/django/vue的毕业设计/课程设计。1.网上商城系统这是一个基于python+vue开发的商城网站，平台采用B/S结构，后端采用主流的Python语言进行开发，前端采用主流的Vue.js进行开发。整个平台包括前台和后台两个部分。前台功能包括：首页、商品
分享Python7个爬虫小案例（附源码）人工智能-猫猫爬虫 python 开发语言
在这篇文章中，我们将分享7个Python爬虫的小案例，帮助大家更好地学习和了解Python爬虫的基础知识。以下是每个案例的简介和源代码：1.爬取豆瓣电影Top250这个案例使用BeautifulSoup库爬取豆瓣电影Top250的电影名称、评分和评价人数等信息，并将这些信息保存到CSV文件中。importrequestsfrombs4importBeautifulSoupimportcsv#请求U
后端框架模块化 GIS程序媛—椰子后端
后端框架的模块化设计旨在简化开发流程、提高可维护性，并通过分层解耦降低复杂性。以下是常见的后端模块及其在不同语言（Node.js、Java、Python）中的实现方式：目录1.路由（Routing）2.中间件（Middleware）3.数据库与ORM（models）4.迁移（Migration）5.服务层（ServiceLayer）6.配置管理（Configuration）7.依赖注入（DI）8.
Pyhton 基础 368. python python 开发语言
初识PythonPython是一种解释型语言Python使用缩进对齐组织代码执行，所以没有缩进的代码，都会在载入时自动执行数据类型：整形int无限大浮点型float小数复数complex由实数和虚数组成Python中有6个标准的数据类型：Number(数字)String(字符串)List(列表)Tuple(元组)Sets(集合)Dictionart(字典)其中不可变得数据：Number(数字)St
基于python+django+mysql的小区物业管理系统源码+运行步骤冷琴1996 Python系统设计 python 开发语言
该系统是基于python+django开发的小区物业管理系统。适用场景：大学生、课程作业、毕业设计。学习过程中，如遇问题可以在github给作者留言。主要功能有：业主管理、报修管理、停车管理、资产管理、小区管理、用户管理、日志管理、系统信息。源码学习技术。演示地址http://wuye.gitapp.cn/admin后台管理帐号：用户名：admin123密码：admin123源码地址https:/
用Python修改Word文档字体
在数字化办公场景中，Word文档作为主流文件格式承载着大量商务文书与学术资料。传统手动调整字体格式的操作模式存在显著局限性：当面对批量文档处理、动态内容生成或企业级模板维护时，逐一手工修改不仅效率低下，更难以保障格式规范的统一性。通过Python实现文档字体的程序化控制，能够有效构建自动化处理流程，在确保排版精准度的同时，显著提升文档批量化操作能力。本文将介绍如何使用Python修改Word文档段
python中strip的使用 ICER瞌睡虫
今天聊聊python去除字符串空格的函数：strip（）和replace（）1.strip():函数功能描述：Pythonstrip()方法用于移除字符串头尾指定的字符（默认为空格或换行符）或字符序列。注意：该方法只能删除开头或是结尾的字符，不能删除中间部分的字符。格式：str.strip([char])。其中，str为待处理的字符，char指定去除的源字符串首尾的字符。返回结果：去除空格时候的新
基于python+django的家教预约网站-家教信息管理系统源码+运行步骤冷琴1996 Python系统设计 python django 开发语言
该系统是基于python+django开发的家教预约网站。是给师妹做的课程作业。大家在学习过程中，遇到问题可以在github给作者留言。共同学习进步哦效果演示前台地址：http://jiajiao.gitapp.cn后台地址：http://jiajiao.gitapp.cn/admin后台管理帐号：用户名：admin123密码：admin123源码地址https://github.com/geee
python strip函数用法_Python字符串函数strip()原理及用法详解 weixin_39944233 python strip函数用法
strip:用于移除字符串头尾指定的字符（默认为空格）或字符序列。注意：该方法只能删除开头或是结尾的字符，不能删除中间部分的字符。语法：str.strip([chars])str="*****thisis**string**example....wow!!!*****"print(str.strip('*'))#指定字符串*输出结果：thisis**string**example....wow!!
python中strip_python中的strip是什么意思 weixin_39613744 python中strip
Python中strip()方法用于移除字符串头尾指定的字符（默认为空格或换行符）或字符序列。注意：该方法只能删除开头或是结尾的字符，不能删除中间部分的字符。它的函数原型：string.strip(s[,chars])，它返回的是字符串的副本，并删除前导和后缀字符。（意思就是你想去掉字符串里面的哪些字符，那么你就把这些字符当参数传入。此函数只会删除头和尾的字符，中间的不会删除。）如果strip()
python爬虫系列实例-python爬虫实例，一小时上手爬取淘宝评论(附代码) weixin_37988176
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。1明确目的通过访问天猫的网站，先搜索对应的商品，然后爬取它的评论数据。可以作为设计前期的市场调研的数据，帮助很大。2爬取评论并储存（首先要进行登录，获取cookie）搜索你想收集的信息的评价，然后点开对应的产品图片。找到对应的评价的位置。找到对应的位置之后就可以进行数据的爬取了
python基于Django的旅游景点数据分析及可视化的设计与实现 7blk7 qq2295116502 python django 数据分析
目录项目介绍技术栈具体实现截图Scrapy爬虫框架关键技术和使用的工具环境等的说明解决的思路开发流程爬虫核心代码展示系统设计论文书写大纲详细视频演示源码获取项目介绍大数据分析是现下比较热门的词汇，通过分析之后可以得到更多深入且有价值的信息。现实的科技手段中，越来越多的应用都会涉及到大数据随着大数据时代的到来，数据挖掘、分析与应用成为多个行业的关键,本课题首先介绍了网络爬虫的基本概念以及技术实现方法
python strip()函数牛也唱歌
strip函数原型声明：s为字符串，rm为要删除的字符序列.只能删除开头或是结尾的字符或是字符串。不能删除中间的字符或是字符串。s.strip(rm)删除s字符串中开头、结尾处，位于rm删除序列的字符s.lstrip(rm)删除s字符串中开头处，位于rm删除序列的字符s.rstrip(rm)删除s字符串中结尾处，位于rm删除序列的字符注意：1.当rm为空时，默认删除空白符（包括'\n','\r',
用python执行js代码：PyExecJS库详解数据知道 2025年爬虫和逆向教程 python javascript 爬虫数据采集 nodejs
更多内容请见：爬虫和逆向教程-专栏介绍和目录文章目录1.介绍和安装1.1PyExecJS介绍1.2安装JavaScript运行时1.3安装PyExecJS2.PyExecJS的基本使用2.1执行简单的JavaScript代码2.2使用外部JavaScript文件2.3先编译、后调用2.4传递参数和获取返回值3.PyExecJS的高级功能3.1指定JavaScript运行时3.2处理异步JavaSc
Python中strip()函数详细讲解甯公子_ Python入门程序 python 开发语言算法
strip()是Python中字符串（str）对象的一个内置方法，用于去除字符串开头和结尾的空白字符（包括空格、换行符、制表符等）。它不会修改字符串中间的空白字符。语法str.strip([chars])str：需要处理的字符串。chars（可选）：指定要去除的字符集合。如果未指定，默认去除空白字符（包括空格、换行符\n、制表符\t等）。返回值返回一个新的字符串，去除了开头和结尾的指定字符。常见用
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe