流浮生

Python 进程、线程、协程

进程和线程

在爬虫开发中，进程和线程的概念非常重要的，提高爬虫的工作效率，打造分布式爬虫，都离不开进程和线程的身影。本节将从多进程、多线程、协程三个方面，帮组大家回顾 Python 语言中进程和线程的常用操作，以便在接下来的爬虫开发中灵活运用进程和线程。

多进程

Python 实现多进程的方式主要有两种，一种方法是使用 os 模块中的 fork 方法，另一种方法是使用 multiprocessing 模块。这两种方法的区别在于前者仅使用 Unix/Linux 操作系统，对 Windows 不支持，后者则是跨平台的实现方式。由于现在很多爬虫程序都运行在 Unix/Linux 操作系统上，所以本节对两种方式进行讲解

使用 os 模块中的 fork 方式实现多进程

Python 的 os 模块封装了常见的系统调用，其中就有 fork 方法。fork 方法来自Unix/Linux 操作系统中提供的一个 fork 系统调用，这个方法非常特殊。普通的方法都是调用一次返回一次，而 fork 方法是调用一次返回两次，原因在于操作系统将当前进程（父进程）复制出一份进程（子进程），这两个进程几乎完全相同，于是 fork 方法分别在父进程和子进程中返回。子进程中永远返回 0，副进程中返回的是子进程的 ID。下面举个例子，对Python使用 fork 方法创建进程进行讲解。其中 os 模块中的 getpid 方法用于获取当前进程 ID，getppid 方法获取父进程的 ID。代码如下：
```
import os
if __name__ == '__main__':
    print('current Process (%s) start ...' % (os.getpid()))
    pid = os.fork()
    if pid < 0:
        print('error in fork')
    elif pid == 0:
        print('I am child process(%s) and my parent process is (%s)', os.getpid(), os.getppid())
    else:
        print('I(%s) created a chlid process (%s).', (os.getpid(), pid))
 
>>> 
current Process (64764) start ...
I(64763) created a chlid process (64765).
I(64764) created a chlid process (64766).
I am child process(64765) and my parent process is (64763)
I am child process(64766) and my parent process is (64764)
```
使用 multiprocessing 模块创建多线程

multiprocessimg 模块提供一个 Process 类来描述一个进程对象。创建子进程时，只需要传入一个执行函数和函数的参数，即可完成一个 Process 实例的创建，用 start() 方法启动进程，用 join() 方法实现进程间的同步。下面通过一个例子来演示创建多进程的流程，代码如下：

import os
from multiprocessing import Process


def run_proc(name):
    print('Child process %s (%s) Running...' % (name, os.getpid()))


if __name__ == '__main__':
    print('parent process %s' % (os.getpid()))
    for i in range(5):
        p = Process(target=run_proc, args=str(i))
        print('Process will start')
        p.start()
    p.join()
    print('Process end.')

以上介绍了创建进程的两种方法，但是要启动大量的子进程，使用进程池批量创建子进程的方式更加常见，因为当被操作的对象数目不大时，可以直接利用 multiprocessing 中的 Process 动态生成多个进程，如果上百个、上千个目标，手动去限制进程数量却又太过频繁，这时候进程池 Pool 发挥作用的时候就到了。

multiprocessing 模块提供了一个 Pool 类来代表进程池对象

Pool 可以提供指定数量的进程提供用户调用，默认大小是 CPU 的核数。当有新的请求提交到 Pool 中时，如果池还没有满，那么就会创建一个新的进程用来执行该请求；但如果池中的进程数已经达到规定的最大值，那么该请求就会等待，知道池中有进程结束，才会创建新的进程来处理它。下面通过一个例子来演示进程池的工作流程，代码如下：
```
import os
import time
import random
from multiprocessing import Pool


def run_task(name):
    print('Task {} (pid={}) is running...'.format(name, os.getpid()))
    time.sleep(random.random() * 3)
    print('Task {} end.'.format(name))


if __name__ == '__main__':
    print('Current process {}'.format(os.getpid()))
    p = Pool(processes=3)
    for i in range(5):
        p.apply_async(run_task, args=(i, ))
    print('Waiting for all subprocesses done...')
    p.close()
    p.join()
    print('All processes done...')

    
>>>>
Current process 70694
Waiting for all subprocesses done...
Task 0 (pid=70696) is running...
Task 1 (pid=70697) is running...
Task 2 (pid=70698) is running...
Task 0 end.
Task 3 (pid=70696) is running...
Task 1 end.
Task 4 (pid=70697) is running...
Task 3 end.
Task 4 end.
Task 2 end.
All processes done...    
```
上述程序先创建了容量为3的进程池，依次向进程池中添加5个任务。从运行结果中可以看到虽然添加5个任务，但是一开始只运行了3个，而且每次最多运行3个进程。当一个任务结束了，新的任务一次添加进来，任务执行使用的进程依然是原来的进程，这一点通过进程的 pid 可以看出来。

注意⚠️：Pool 对象调用 join() 方法会等待所有子进程执行完毕，调用 join() 之前必须先调用 close()，调用 close() 之后就不能继续添加新的 Process 了。

进程间的通信

假如创建大量的进程，那么进程间的通信是必不可少的。Python 提供了多种进程间通信的方式，例如：Queue、Pipe、Value+Array 等。本节主要讲解 Queue 和 Pipe 这两种方式。Queue 和 Pipe 的区别在于 Pipe 常用来在两个进程间通信，Queue 用来在多个进程间实现通信。

首先讲解一下 Queue 通信方式。Queue 是多进程安全的队列，可以使用 Queue 实现多进程之间的数据传递。有两个方法：Put 和 Get 可以进行 Queue 操作：

Put 方法用以插入数据到队列中，它还有两个可选参数：blocked 和 timeout。如果 blocked 为 True（默认值），并且 timeout 为正值，该方法会阻塞 timeout 指定的时间，直到该队列有剩余的空间。如果超时，会抛出 Queue.Full 异常。如果 blocked 为 Flase，但该 Queue 已满，会立即抛出 Queue.Full 异常。
Get 方法可以从队列读取并且删除一个元素。同样，Get 方法有两个可选参数：blocked 和 timeout。如果 blocked 为 True（默认值），并且 timeout 为正值，那么在等待时间内没有取到任何元素，会抛出 Queue.Empty 异常。如果 blocked 为 False，分两种情况：如果 Queue 有一个值可用，则立即返回该值，否则，如果队列为空，则立即抛出 Queue.Empty 异常。

下面通过一个例子进行说明：在父进程中创建三个子进程，两个子进程往 Queue 中写入数据，一个子进程从 Queue 中读取数据。程序实例如下所示：

# 进程间的通信
from multiprocessing import Process, Queue
import os
import time
import random


def proc_write(q, urls):
    print('Process ({}) is writing...'.format(os.getpid()))
    for url in urls:
        q.put(url)
        print('Put {} to queue...'.format(url))
        time.sleep(random.random())

# 读数据进程执行的代码
def proc_read(q):
    print('Process ({}) is reading...'.format(os.getpid()))
    while 1:
        url = q.get(True)
        print('Get {} from queue'.format(url))


if __name__ == '__main__':
    # 父进程创建 Queue，并传给各个子进程
    q = Queue()
    proc_write1 = Process(target=proc_write, args=(q, ['url1', 'url2', 'url3']))
    proc_write2 = Process(target=proc_write, args=(q, ['url4', 'url5', 'url6']))
    proc_reader = Process(target=proc_read, args=(q,))
    # 启动子进程 proc_write 写入
    proc_write1.start()
    proc_write2.start()
    # 启动子进程 proc_read 读取
    proc_reader.start()
    # 等待 proc_write 结束
    proc_write1.join()
    proc_write2.join()
    # proc_read 进程死循环，无法等待其结束，只能强制终止
    proc_reader.terminate()
    
>>>
Process (76534) is writing...
Put url1 to queue...
Process (76535) is writing...
Put url4 to queue...
Process (76536) is reading...
Get url1 from queue
Get url4 from queue
Put url2 to queue...
Get url2 from queue
Put url5 to queue...
Get url5 from queue
Put url3 to queue...
Get url3 from queue
Put url6 to queue...
Get url6 from queue

最后介绍一下 Pipe 的通信机制， Pipe 常用来在两个进程间进行通信，两个进程分别位于管道的两端。

Pipe 方法返回（conn1，conn2）代表一个管道的两个端，Pipe 方法有 duplex 参数，如果 duplex 参数为 True(默认值)，那么这个管道就是全双工模式，也就是说 conn1 和 conn2 均可收发。若 duplex 为 False，conn1 只负责接受消息，conn2 只负责发送消息。send 和 recv 方法分别是发送和接收消息的方法。例如，在全双工模式下，可以调用 conn1.send 发送消息，conn1.recv接收消息。如果没有消息可接收，recv 方法会一直阻塞。如果管道已经被关闭，那么 recv 方法会抛出 EOFError。

下面通过一个例子进行说明：创建两个进程，一个子进程通过 Pipe 发送数据，一个子进程通过 Pipe 接收数据。程序如下

# Pipe 进程间的通信
import multiprocessing
import random
import time
import os


def proc_send(pipe, msgs):
    for m in msgs:
        print('Process ({}) send: {}'.format(os.getpid(), m))
        pipe.send(m)
        time.sleep(random.random())


def proc_recv(pipe):
    while 1:
        print('Process ({}) rev: {}'.format(os.getpid(), pipe.recv()))
        time.sleep(random.random())


if __name__ == '__main__':
    pipe = multiprocessing.Pipe()
    print('>>>', pipe)
    p1 = multiprocessing.Process(target=proc_send, args=(pipe[0], ['url'+str(i) for i in range(10)]))
    p2 = multiprocessing.Process(target=proc_recv, args=(pipe[1], ))
    p1.start()
    p2.start()
    p1.join()
    # p2 死循环，只能强制结束
    p2.terminate()
    
>>>>
>>> (<multiprocessing.connection.Connection object at 0x10f668160>, <multiprocessing.connection.Connection object at 0x10f668460>)
Process (77371) send: url0
Process (77372) rev: url0
Process (77371) send: url1
Process (77371) send: url2
Process (77372) rev: url1
Process (77371) send: url3
Process (77371) send: url4
Process (77371) send: url5
Process (77372) rev: url2
Process (77372) rev: url3
Process (77371) send: url6
Process (77372) rev: url4
Process (77372) rev: url5
Process (77372) rev: url6
Process (77371) send: url7
Process (77371) send: url8
Process (77372) rev: url7
Process (77372) rev: url8
Process (77371) send: url9

多线程

多线程类似于同时执行多个不同程序，多线程运行有如下优点：

可以把运行时间长的任务放到后台去处理
用户界面可以更加吸引人，比如用户点击一个按钮去触发某些事件的处理，可以弹出一个进度条来现实处理的进度。
程序运行速度可能加快
在一些需要等待的任务实现上，如用户输入、文件读写和网络收发数据等，线程就比较有用。在这种情况下我们可以释放一些珍贵的资源，如内存占用等

Python 的标准库提供了两个模块：thread 和 threading，thread 是低级模块，threading 是高级模块，对 thread 进行了封装。绝大多数情况下，我们只需要使用 threading 高级模块

用 threading 模块创建多线程

threading 模块一般通过两种方式创建多线程：
- 第一种方式是把一个函数传入并创建 Thread 实例，然后调用 start 方法开始执行
- 第二种方式是直接从 threading.Thread继承并创建线程类，然后重写 __ init __ 方法和 run 方法

第一种方法实例：

# 多线程实例
import random
import time
import threading


def thread_run(urls):
    print('Current {} is running...'.format(threading.current_thread().name))
    for u in urls:
        print('{} ---> {}'.format(threading.current_thread().name, u))
        time.sleep(random.random())
    print('{} ended.'.format(threading.current_thread().name))


print('Current {} is running...'.format(threading.current_thread().name))
t1 = threading.Thread(target=thread_run, name='Thread1', args=(['url1', 'url2'],))
t2 = threading.Thread(target=thread_run, name='Thread2', args=(['url3', 'url4'],))
t1.start()
t2.start()
t1.join()
t2.join()
print('{} overed...'.format(threading.current_thread().name))

>>>>
Current MainThread is running...
Current Thread1 is running...
Thread1 ---> url1
Current Thread2 is running...
Thread2 ---> url3
Thread1 ---> url2
Thread2 ---> url4
Thread2 ended.
Thread1 ended.
MainThread overed...

第二种方法实例：

从 threading.Thread 继承创建线程类，下面将方法一的程序进行重写，程序如下：

import random
import threading
import time


class MyThread(threading.Thread):
    def __init__(self, name, urls):
        threading.Thread.__init__(self, name=name)
        self.urls = urls

    def run(self):
        print('Current {} is running...'.format(threading.current_thread().name))
        for u in self.urls:
            print('{} ---> {}'.format(threading.current_thread().name, u))
            time.sleep(random.random())
        print('{} ended.'.format(threading.current_thread().name))


t1 = MyThread(name='thread1', urls=['url1', 'url2'])
t2 = MyThread(name='thread2', urls=['url3', 'url4'])
t1.start()
t2.start()
t1.join()
t2.join()
print('{} overed.'.format(threading.current_thread().name))

>>>
Current thread1 is running...
thread1 ---> url1
Current thread2 is running...
thread2 ---> url3
thread1 ---> url2
thread2 ---> url4
thread2 ended.
thread1 ended.
MainThread overed.

线程同步

如果多个线程共同对某一个数据修改，则可能出现不可预料的结果，为了保证数据的恶正确性，需要对多个线程进行同步。使用 Thread 对象 Lock 和 RLock 可以实现简单的线程同步，这两个对象都有 acquire 方法和 release 方法，对于那些每次只允许一个线程操作的数据，可以将其操作放到 acquire 和 release 方法之间。

对于 Lock 对象而言，如果一个线程连续两次进行 acquire 操作，那么由于第一次 acquire 之后没有 release。第二次 acquire 将挂起线程。这会导致 Lock 对象永远不会 release，使的线程死锁。RLock 对象允许一个线程多次对其进行 acquire 操作，因为在其内部通过一个 counter 变量维护着线程 acquire 的次数，而且每次的 acquire 操作必须有一个 release 操作与之对应，在所有的 release 操作完成之后，别的线程才能申请该 RLock 对象。下面通过一个简单的例子演示线程同步的过程：

# 线程锁 Lock RLock
import threading
mylock = threading.RLock()
num = 0


class MyThread(threading.Thread):
    def __init__(self, name):
        super().__init__(name=name)

    def run(self):
        global num
        while 1:
            mylock.acquire()
            print('{} locked, Number: '.format(threading.current_thread().name), num)
            if 4 <= num:
                mylock.release()
                print('{} release, Number: {}'.format(threading.current_thread().name, num))
                break
            num += 1
            print('{} release, Number: {}'.format(threading.current_thread().name, num))
            mylock.release()


if __name__ == '__main__':
    thread1 = MyThread('thread1')
    thread2 = MyThread('thread2')
    thread1.start()
    thread2.start()

    
>>>>
thread1 locked, Number:  0
thread1 release, Number: 1
thread1 locked, Number:  1
thread1 release, Number: 2
thread1 locked, Number:  2
thread1 release, Number: 3
thread1 locked, Number:  3
thread1 release, Number: 4
thread1 locked, Number:  4
thread1 release, Number: 4
thread2 locked, Number:  4
thread2 release, Number: 4

全局解释器锁（GIL）

在 Python 的原始解释器 CPython 中存在着 GIL (Global Interpreter Lock，全局解释器锁)，因此在解释执行 Python 代码时，会产生互斥锁来限制线程对共享资源的访问，知道解释器遇到 I/O 操作或者次数达到一定数目时才会释放GIL。由于全局解释器锁的存在，在进行多线程操作的时候，不能调用多个 CPU 内核，只能利用一个内核，所以在进行 CPU 密集型操作时，不推荐使用多线程，更加倾向于多线程，那么多线程适合什么样的应用场景呢？对于 IO 密集型操作，多线程可以明显提高效率，例如 Python 爬虫的开发，绝大多数时间爬虫实在等待 socket 返回数据，网络 IO 的操作延迟比 CPU 大得多。

总结：由于多线程其实时运行在一个进程中，不能调用多个 CPU 内核，只能利用一个内核。所以进行 CPU 密集型操作时，不推荐使用多线程，更倾向于多线程。

在进行 IO 密集型操作时推荐使用多线程，可以明显提高效率。

协程

协程（coroutine），又称微线程，纤程，是一种用户级的轻量级线程。协程拥有自己的寄存器上下文和栈。协程调度切换时，将寄存器上下文和栈保存到其他地方，在切回来的时候，恢复先前保存的寄存器上下文和栈。因此协程能保留上一次调用时的状态，每次过程重入时，就相当于进入上一次调用的状态。在并发编程中，写成与线程类似，每个协程表示一个执行单元，有自己的本地数据，与其他写成共享全局数据和其他资源。

协程需要用户自己来编写调度逻辑，对于 CPU 来说，协程其实是单线程，所以 CPU 不用去考虑怎么调度、切换上下文，这就省去了 CPU 的切换开销，所以协程在一定程度上又好于多线程。那么在 Python 中是如何实现协程的呢？

Python 用过 yield 提供了对协程的基本支持，但是不完全，而使用第三方 gevent 库是更好的选择，gevent 提供了比较完善的协程支持。gevent 是一个基于协程的 Python 网络函数库，使用greenlet在 libev 事件循环顶部提供了一个有高级别并发性的 API。主要特性有以下几点：

基于 libev 的快速事件循环，Liunx 上是 epoll 机制。
基于 greenlet 的轻量级执行单元
API 复用了 Python 标准库的内容
支持 SSL 的协作式 socket
可通过线程池或 c-ares 是实现 DNS 查询
通过 monkey patching 功能使得第三方模块变成协作式

gevent 对协程的支持，本质上 greenlet 在实现切换工作。greenlet 工作流程如下：

假如进行访问网络的 IO 操作时，出现阻塞，greenlet 就显式切换到另一段没有被阻塞的代码段执行，直到原来的阻塞状况消失以后，再自动切换回原来的代码段继续处理。因此 greenlet 是一种合理安排的串行方式。

由于IO操作非常耗时，经常使程序处于等待状态，有了 gevent 为我们自动切换协程，就保证总有 greenlet 在运行，而不是等待 IO，这就是协程比一般线程效率高的原因。由于切换是在 IO 操作时自动完成，所以 gevent 需要修改 Python 自带的一些标准库，将一些常见的阻塞，如 socket、select 等地方实现协程跳转，这一过程在启动时通过 monkey patch 完成。下面通过一个例子来演示 gevent 使用流程，代码如下：

from gevent import monkey
monkey.patch_all()
import gevent
import requests


def run_task(url):
    print('Visit >>>> {}'.format(url))
    try:
        res = requests.get(url)
        data = res.text
        print('{} bytes received from {}'.format(len(data), url))
    except Exception as e:
        print(e)


if __name__ == '__main__':
    urls = ['https://www.baidu.com', 'https://www.cnblogs.com']
    greenlets = [gevent.spawn(run_task, url) for url in urls]
    gevent.joinall(greenlets)

    
>>>
Visit >>>> https://www.baidu.com
Visit >>>> https://www.cnblogs.com
2443 bytes received from https://www.baidu.com
69457 bytes received from https://www.cnblogs.com

以上程序主要用了 gevent 中的 spawn 方法和 joinall 方法。spawn 方法可以看做是用来形成协程，joinall 方法就是添加这些协程任务，并且启动运行，从运行结果看，2个网络操作是并发执行的，而且结束顺序不同，但其实只有一个线程。

gevent 中还提供了对池的支持。当拥有动态数量的 greenlet 需要进行并发管理（限制并发数）时，就可以使用池，这在处理大量的网络和 IO 操作时是非常重要的，接下来使用 gevent 中 pool 对象，对上面的例子进行改写，程序如下：

from gevent import monkey
monkey.patch_all()
from gevent.pool import Pool
import requests


def run_task(url):
    print('Visit >>>> {}'.format(url))
    try:
        res = requests.get(url)
        data = res.text
        print('{} bytes received from {}'.format(len(data), url))
    except Exception as e:
        print(e)


if __name__ == '__main__':
    pool = Pool(2)
    urls = ['https://www.baidu.com', 'https://www.cnblogs.com', 'https://mo.fish']
    pool.map(run_task, urls)


>>>
Visit >>>> https://www.baidu.com
Visit >>>> https://www.cnblogs.com
2443 bytes received from https://www.baidu.com
Visit >>>> https://mo.fish
3497 bytes received from https://mo.fish
69458 bytes received from https://www.cnblogs.com

通过运行结果可以看出，Pool 对象确实对协程的并发数量进行管理，先访问前面两个网址，当其中一个任务完成时，才会执行第三个。

数据分析面试全攻略：项目经验篇代码CC 数据分析（包括各种面试题）数据分析面试 python
引言：为什么项目经验是数据分析面试的“敲门砖”？在数据分析岗位的面试中，项目经验是最核心的竞争力证明。HR视角：80%的面试官会通过项目细节判断候选人的真实能力技术视角：项目是数据清洗、建模分析、业务落地的综合体现误区警示：单纯罗列工具名称（如Python/SQL）≠具备实战能力本文将系统讲解如何用STAR法则包装项目、如何选择高含金量数据集、以及如何通过和鲸社区快速积累实战经验。文末提供10个可
Rpm安装Docker 星光落入你灰蒙蒙的眼 Docker docker linux 运维容器 kubernetes
如果您不能使用Docker的存储库来安装Docker，您可以下载.rpm文件并手动安装。每次要升级Docker引擎时，都需要下载一个新文件。官方文档1、登录https://download.docker.com/linux/centos/并选择您的CentOS版本。然后浏览到x86_64/stable/Packages/，下载您想要安装的Docker版本的.rpm文件#已Centos7.9为例mk
Python-Django毕业设计医院门诊管理信息系统（程序+Lw) Python计算机毕设程序源码_ python django 课程设计
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置：Pychram社区版+python3.7.7+Mysql5.7+HBuilderX+listpip+Navicat11+Django+nodejs。项目技术：django+python+Vue等等组成，B/S模式+pychram管理等等。环境需要1.运行环境：最好是python3.7.7，我们在这个版本上开发的。其他版
centos 8 安装docker（RPM离线）——k8s和docker系列名栩 #容器 docker linux centos
如果无法使用Docker的存储库来安装Docker，可以下载.rpm版本的文件并手动安装。每次要升级DockerEngine时都需要下载一个新文件。前往https://download.docker.com/linux/centos/并选择CentOS版本。然后浏览x86_64/stable/Packages/并下载.rpm要安装的Docker版本的文件。笔记要安装每晚或测试（预发布）包，stab
python+django+vue医院门诊挂号预约管理系统57wsx QQ_402205496 django pycharm python
开发语言：Python框架：django/flaskPython版本：python3.7.7数据库：mysql数据库工具：Navicat开发软件：PyCharm主要功能有：管理员功能：系统首页、个人中心、用户管理、医生管理、疫情公告管理、行动轨迹管理、异样报告管理、科室信息管理、异常报告管理、系统管理、医院信息管理、预约信息管理、在线聊天管理、聊天回复管理、我的收藏管理。用户功能模块：系统首页、个
Python 入门『六哥』 Python python 开发语言
Python安装检测许多PC和Mac都已经安装了python。如果需要检查是否已在WindowsPC上安装了python，请在开始栏中寻找Python或在命令行（cmd.exe）上运行以下命令:C:\Users\YourName>python--version如果是检查是否在Linux或Mac上安装了python，请在Linux上打开命令行或在Mac上打开终端并键入:python--version
Python爬虫|获取大麦网演出信息最好的药物是乌梅 python 爬虫开发语言
使用Selenium库自动化浏览器操作，从大麦网的搜索结果页面抓取演唱会信息，并将这些信息保存到一个CSV文件中代码的主要步骤包括：1.初始化WebDriver。2.打开指定的URL。3.模拟点击“全部”按钮。4.循环抓取每一页的演唱会信息，并写入CSV文件。5.关闭WebDriver。代码拆分讲解1.导入相关库fromselenium.webdriver.supportimportexpecte
数码管绘制程序(python) 最好的药物是乌梅 python 开发语言
题目自行设计界面上的输出信息"加上班级姓名学号,日期的年月日等"包括字体、颜色、样式均可自行编辑.将——————————的每一行补充正确的代码。importturtle,datetimedefdrawLine(draw):#绘制单段数码管turtle.pendown()ifdrawelseturtle.penup()turtle.fd(40)——————————————————————（1）———
tensorflow 不支持python3以下的版本辽宁大学神经网络神经网络
小白一枚，没用过tensorflow，所以在安装的时候导致版本错误安装不上。遇到这种情况建议换python的版本。
pmap 命令详解：使用场景、参数解析与实际应用实例 weixin_42587823 linux云计算服务器 linux 运维
pmap命令详解：使用场景、参数解析与实际应用实例在Linux系统中，了解进程的内存使用情况对系统调优、故障排查和内存泄漏分析至关重要。pmap命令就是一个非常实用的工具，它可以显示指定进程的内存映射信息，帮助我们直观地了解内存分配情况、共享库的加载情况以及各个内存段的占用详情。本文将详细介绍pmap命令的使用场景、各参数的功能及实际应用实例，包括具体的输入命令和输出解释。一、pmap命令的基本概
第5篇：从入门到精通：深入详解Python模块与包管理的应用猿享天开 python 开发语言
第5篇：模块与包管理目录模块概述什么是模块导入模块标准库简介创建与使用自定义模块创建模块导入自定义模块模块搜索路径包（Packages）什么是包创建包导入包中的模块常用内置模块介绍math模块datetime模块os模块sys模块模块与包的最佳实践命名规范组织结构避免循环导入示例代码常见问题及解决方法总结模块概述什么是模块模块是Python中组织代码的一种方式。一个模块就是一个包含Python定义
用Python打造智能姓名生成器：从数据分离到AI赋能灏瀚星空 python 人工智能开发语言经验分享笔记
用Python打造智能姓名生成器：从数据分离到AI赋能目录项目概述与功能清单环境准备与工具选择项目架构设计核心代码实现AI古文解析模块交互界面开发使用示例与效果展示扩展思路与优化建议1.项目概述与功能清单核心功能数据管理CSV文件存储姓氏/名字库支持用户导入/导出数据交互界面姓名生成与实时预览已选名单管理（增删改查）排除词输入框（黑名单过滤）AI赋能从古文中提取字词及注解自动生成姓名寓意解析扩展功
Python常用10个模块详解：提升开发效率的利器 Python_trys python microsoft 数据库开发语言 Python入门 Python基础 Python教程
包含编程籽料、学习路线图、爬虫代码、安装包等！【点击领取！】Python作为一门功能强大且易于学习的编程语言，拥有丰富的标准库和第三方模块，能够帮助开发者快速实现各种功能。本文将详细介绍Python中常用的10个模块，帮助你在开发中更高效地完成任务。1.os模块：操作系统交互os模块提供了与操作系统交互的功能，包括文件操作、目录管理、环境变量等。常用功能：文件与目录操作：importos#获取当前
Linux文件描述符 linuxvim
Linux文件描述符Linux系统中，把一切都看做是文件，当进程打开现有文件或创建新文件时，内核向进程返回一个文件描述符（filedescriptor，fd）[1,4]，在windows下面，这玩意儿叫filehandle，句柄。文件描述符（filedescriptor）就是内核为了高效管理这些已经被打开的文件所创建的索引，其是一个非负整数（通常是小整数），用于指代被打开的文件，所有执行I/O操作
掌握Conda的艺术：精通channels管理 2401_85702623 conda
掌握Conda的艺术：精通channels管理Conda作为Python和其他科学计算包的包管理器，其强大的包管理能力很大程度上依赖于channels。channels是Conda用来查找和安装包的源。默认情况下，Conda会从Anaconda的官方源安装包，但有时我们需要添加额外的channels来获取更多的包或者特定版本的包。本文将详细介绍如何在Conda中使用condaconfig--add
VMware中linux系统与主机win系统设置共享文件夹、安装VMware tools 鲁鲁在川 linux 运维服务器
1.设置.虚拟机==》设置==硬件/选项==》共享文件夹==》总是启用总是启用为灰色，在虚拟机未开启其设置2.添加共享文件夹3..否存在/mnt/hgfs文件夹没有创建，有则提示sudomkdir/mnt/hgfs4.挂载共享文件夹!!挂载共享文件夹!!挂载共享文件夹!!下次启动虚拟机，还需要再填一次！！每次启用，每次挂载！！！！！！！！sudovmhgfs-fuse.host://mnt/hgf
Python模块详解：定义、操作方法与高级特性编程咕咕gu- python 数据库开发语言学习路线数据分析
如果你正在学习Python，那么你需要的话可以点击这里Python重磅福利：入门&进阶全套学习资料、电子书、软件包、项目源码等等免费分享！在Python中，模块是一个包含Python定义和语句的文件。模块可以定义函数、类和变量。模块也可以包含可执行的代码。你可以通过import语句将一个模块中的函数、类等导入到当前的程序中，以便能够重复使用代码，提高代码的可维护性。模块定义一个Python文件（.
3.13.0 python 配置tensorflow（CPU版本） m0_Gattuso tensorflow 人工智能 python
condacreate--nametestpython=3.12activatetestpipinstalltensorflow上面3步骤在condaprompt里完成退出时记得condadeactivate来源：Windows下tensorflow/pytorch环境配置_pycharm怎么配置tensorflow环境-CSDN博客然后问题出现了：condaenvironment里什么都没有，理
2021-05-21 python中curses基本用法 zerfew python curses cli
有时候linux系统没有界面，可能需要在terminal终端完成程序的交互和状态显示，C语言的ncurses支持命令行界面程序开发，curses是基于ncurses实现的python终端界面库。本文实现一个简单的demo小程序，方便初学者学习和使用。首先上demo主程序#-*-coding:UTF-8-*-importcursesimportlocalelocale.setlocale(local
构建可扩展的Python API与框架：实践与指南清水白石008 Python题库 python 计算机 python 开发语言
构建可扩展的PythonAPI与框架：实践与指南一、引言在当今的软件开发中，可扩展性已成为一个不可或缺的特性。一个可扩展的API或框架不仅能够满足当前的需求，还能轻松应对未来的变化和增长。本文将深入探讨在Python中如何设计一个可扩展的API或框架，通过实际例子和详细步骤，为您提供一个实用的指南。二、理解可扩展性可扩展性指的是系统或软件能够容易地适应变化，包括但不限于新功能的添加、现有功能的修改
在 Python 中实现 RESTful API 的完整指南清水白石008 python Python题库 python restful 开发语言
在Python中实现RESTfulAPI的完整指南随着互联网的发展，RESTfulAPI（RepresentationalStateTransfer）已成为现代应用程序架构的重要组成部分。RESTfulAPI允许不同系统之间通过HTTP协议进行通信，提供了一种简单而灵活的方式来访问和操作资源。在这篇文章中，我们将深入探讨如何在Python中实现RESTfulAPI，并提供简单的示例代码。一、什么是
MIE 1622H Risk-Based and Robust 后端
MIE1622H:Assignment2–Risk-BasedandRobustPortfolioSelectionStrategiesDr.OleksandrRomanko,MohammadrezaMohammadiFebruary10,2025Due:Friday,March7,2025,notlaterthan11:59p.m.UsePythonforallMIE1622Hassignmen
python测试工具 doctest pythondoctest
python调试工具doctestbriefintroductiondoctest是python自带的一个调试测试工具，可用于初步检测你写的python程序的输入与输出结果是否符合你的预期通过在自己写的函数内，按照规定的格式写上你想要对比的输入输出结果，再使用python3-mdoctestexample.py(example.py是你要test的python程序)，python会自动帮你用你的输
关于“Python int too large to convert to C long”的解决。 James Bamp python python too large long
这个问题在我使用python计算平方的时候出现，其实问题的症结并不是数据太大（你可以使用print(很大的数的平方)来验证，会发现是可以输出的），而是数据结构的问题。具体是指，直接使用np.array数据来遍历，会出问题，但是如果将np.array数据转化为列表形式再遍历，那么就不会出现问题。例如：data=np.array(100020003000)#计算平方和sum_squa=0foriinr
python restful api 高并发_Python 之路，Restful API设计规范 IT小霸王 python restful api 高并发
理解RESTful架构RestfulAPI设计指南理解RESTful架构越来越多的人开始意识到，网站即软件，而且是一种新型的软件。这种"互联网软件"采用客户端/服务器模式，建立在分布式体系上，通过互联网通信，具有高延时(highlatency)、高并发等特点。网站开发，完全可以采用软件开发的模式。但是传统上，软件和网络是两个不同的领域，很少有交集；软件开发主要针对单机环境，网络则主要研究系统之间的
Python int too large to convert to C long 铃音. 笔记 python 开发语言 c语言
报错在用python的matplotlib库绘制折线图时我报了这个错误PythoninttoolargetoconverttoClong解决方法win+R然后输入cmd,再输入pipinstall--upgradematplotlib然后问题就解决了
Python精进系列： K-Means 聚类算法调用库函数和手动实现对比分析进一步有进一步的欢喜 Python 精进系列算法 python kmeans
一、引言在机器学习领域，聚类分析是一种重要的无监督学习方法，用于将数据集中的样本划分为不同的组或簇，使得同一簇内的样本具有较高的相似性，而不同簇之间的样本具有较大的差异性。K-Means聚类算法是最常用的聚类算法之一，它以其简单性和高效性在数据挖掘、图像分割、模式识别等领域得到了广泛应用。本文将详细介绍K-Means聚类算法，并分别给出调用现成函数和不调用任何现成函数实现K-Means聚类的代码示
Windows Curses Python 模块使用教程邱进斌Olivia
WindowsCursesPython模块使用教程windows-cursesWindowsCursesPythonmodule项目地址:https://gitcode.com/gh_mirrors/wi/windows-curses1.项目介绍windows-curses是一个为Windows平台提供Pythoncurses模块的Python包。curses模块是Python标准库的一部分，但在
OverflowError: Python int too large to convert to C long**：整数太大，无法转换为C类型long完美解决方法 ️ 默语 c语言开发语言
OverflowError:PythoninttoolargetoconverttoClong**：整数太大，无法转换为C类型long完美解决方法️OverflowError:PythoninttoolargetoconverttoClong**：整数太大，无法转换为C类型long完美解决方法️**摘要****1.引言****2.产生`OverflowError`的原因****2.1Python与
OpenAI Agents SDK 中文文档中文教程（1） wtsolutions openai agents sdk openai agents sdk python 中文文档教程
英文文档原文详见OpenAIAgentsSDKhttps://openai.github.io/openai-agents-python/本文是OpenAI-agents-sdk-python使用翻译软件翻译后的中文文档/教程。分多个帖子发布，帖子的目录如下：(1)OpenAI代理SDK，介绍及快速入门(2)OpenAIagentssdk,agents，运行agents，结果，流，工具，交接目录O
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">

Python 进程、线程、协程

进程和线程

多进程

多线程

协程

你可能感兴趣的:(python,python,爬虫,linux)