程序员晓晓

【Python爬虫教程】还不会多线程和线程池？这篇教程直接搞定！

在网络爬虫的世界中，效率是我们永恒的追求。为了在短时间内抓取更多数据，了解并发编程的基础知识至关重要。本文将介绍线程和进程的基本概念，以及为什么我们应该在爬虫中使用线程。

前言

线程和进程

在学习多线程的使用之前，需要先了解线程、进程的概念。

1.1.1 什么是进程

进程是操作系统分配资源和调度的基本单位，它包含了执行程序所需的所有资源。

1.1.2 什么是线程

线程是进程内的执行单位，它共享进程的资源，是实现并发编程的重要元素。

1.1.3 什么是全局解释器锁（GIL）

Python代码的执行由Python虚拟机（解释器主循环）控制。Python在设计之初就考虑到在主循环中只能有一个线程执行，虽然Python解释器中可以“运行”多个线程，但是在任意时刻只有一个线程在解释器中运行。

Python虚拟机的访问由全局解释器锁（Global Interpreter Lock, GIL）控制，这个锁能保证同一时刻只有一个线程运行。

在多线程环境中，Python虚拟机按以下方式执行：

设置GIL。
切换到一个线程运行。
运行指定数量的字节码指令或线程主动让出控制（可以调用time.sleep(0)）。
把线程设置为睡眠状态。
解锁GIL。
再次重复以上所有步骤。

在调用外部代码（如C/C++扩展函数）时，GIL将被锁定，直到这个函数结束为止（由于在此期间没有运行Python的字节码，因此不会做线程切换），编写扩展的程序员可以主动解锁GIL。

1.1.4 什么是多任务

多任务简单来说就是同时进行多项任务。比如一边读文献，一边听音乐，一边转笔，这样你就同时进行着三项任务。

那么单核CPU是如何完成多任务的呢？实际上，单核CPU的操作系统轮流让各个任务交替执行，任务1执行0.01秒，切换到任务2，任务2执行0.01秒，再切换到任务3，执行0.01秒……这样反复执行下去。表面上看，每个任务都是交替执行的，但是，由于CPU的执行速度实在是太快了，我们感觉就像所有任务都在同时执行一样。

真正的并行执行多任务只能在多核CPU上实现，但是，由于任务数量远远多于CPU的核心数量，所以，操作系统也会自动把很多任务轮流调度到每个核心上执行。

注意：

并发：指的是任务数多余cpu核数，通过操作系统的各种任务调度算法，实现用多个任务“一起”执行（实际上总有一些任务不在执行，因为切换任务的速度相当快，看上去一起执行而已）
并行：指的是任务数小于等于cpu核数，即任务真的是一起执行的。

1.1.5 线程和进程的优势与限制对比

线程共享内存空间，创建和切换成本低，但易于产生竞争条件。进程有独立的内存空间，安全但创建和切换成本高。

线程一般是并发执行的。正是由于这种并行和数据共享的机制，使得多个任务的合作变得可能。实际上，在单CPU系统中，真正的并发并不可能，每个线程会被安排成每次只运行一小会儿，然后就把CPU让出来，让其他线程运行。在进程的整个运行过程中，每个线程都只做自己的事，需要时再跟其他线程共享运行结果。多个线程共同访问同一块数据不是完全没有危险的，由于访问数据的顺序不一样，因此有可能导致数据结果不一致的问题，这叫作竞态条件。大多数线程库都带有一系列同步原语，用于控制线程的执行和数据的访问。

多线程的使用

threading 模块的使用

单线程代码示例：

import time  
  
  
def print_hello():  
    print('hello')  
    time.sleep(1)  
  
  
if __name__ == "__main__":  
    for i in range(5):  
        print_hello()

多线程代码示例：

import time  
import threading  
  
  
def print_hello():  
    print('hello')  
    time.sleep(1)  
  
  
if __name__ == "__main__":  
    t = threading.Thread(target=print_hello)  
    t.start()

主线程等待所有子线程结束后退出

import threading  
from time import sleep, ctime  
  
  
def sing():  
    for i in range(3):  
        print(f'正在唱歌: {i}')  
        sleep(1)  
  
def dance():  
    for i in range(3):  
        print(f'正在跳舞: {i}')  
        sleep(1)  
  
if __name__ == "__main__":  
    print(f'程序开始: {ctime()}')  
    t1 = threading.Thread(target=sing)  
    t2 = threading.Thread(target=dance)  
    t1.start()  
    t2.start()  
    # 注释下一行代码查看程序是否立即退出  
    # sleep(5)  
    print(f'程序结束: {ctime()}')

查看线程数量

import threading  
from time import sleep, ctime  
  
  
def sing():  
    for i in range(3):  
        print(f'正在唱歌: {i}')  
        sleep(1)  
  
def dance():  
    for i in range(3):  
        print(f'正在跳舞: {i}')  
        sleep(1)  
  
if __name__ == "__main__":  
    print(f'程序开始: {ctime}')  
    t1 = threading.Thread(target=sing)  
    t2 = threading.Thread(target=dance)  
  
    t1.start()  
    t2.start()  
  
    while True:  
        length = len(threading.enumerate())  
        print(f'当前线程数量: {length}')  
        if length <= 1:  
            break  
        sleep(0.5)

线程执行代码的封装

通过上一小节，能够看出，通过使用threading模块能完成多任务的程序开发，为了让每个线程的封装性更完美，所以使用threading模块时，往往会定义一个新的子类class，只要继承threading.Thread就可以了，然后重写run方法。

示例如下：

import time  
import threading  
  
  
class MyThread(threading.Thread):  
    def run(self):  
        for i in range(3):  
            time.sleep(1)  
            # self.name是threading模块中的一个方法 保存的是当前线程的名称  
            msg = '我是 ' + self.name + ' @ ' + str(i)  
            print(msg)  
  
  
if __name__ == "__main__":  
    t = MyThread()  
    t.start()

说明：python的threading.Thread类有一个run方法，用于定义线程的功能函数，可以在自己的线程类中覆盖该方法。而创建自己的线程实例后，通过Thread类的start方法，可以启动该线程，交给python虚拟机进行调度，当该线程获得执行的机会时，就会调用run方法执行线程。

线程的执行顺序

import time  
import threading  
  
  
class MyThread(threading.Thread):  
    def run(self):  
        for i in range(3):  
            time.sleep(1)  
            msg = '我是 ' + self.name + ' @ ' + str(i)  
            print(msg)  
  
  
def test():  
    for i in range(5):  
        t = MyThread()  
        t.start()  
  
  
if __name__ == "__main__":  
    test()

**说明：**从代码和执行结果我们可以看出，多线程程序的执行顺序是不确定的。当执行到sleep语句时，线程将被阻塞（Blocked），到sleep结束后，线程进入就绪（Runnable）状态，等待调度。而线程调度将自行选择一个线程执行。上面的代码中只能保证每个线程都运行完整个run函数，但是线程的启动顺序、run函数中每次循环的执行顺序都不能确定。

总结

每个线程默认有一个名字，尽管上面的例子中没有指定线程对象的name，但是python会自动为线程指定一个名字。
当线程的run()方法结束时该线程完成。
无法控制线程调度程序，但可以通过别的方式来影响线程调度的方式。

多线程 - 共享全局变量

整型类型共享

import time  
import threading  
  
g_num = 100  
  
  
def work_1():  
    global g_num  
    for i in range(3):  
        # 循环相加三次  
        g_num += 1  
    print(f"子线程1中计算得出的值为: {g_num}")  
  
  
def work_2():  
    global g_num  
    print(f'子线程2中获取到的值为: {g_num}')  
  
  
if __name__ == '__main__':  
    # 线程启动之前获取全局变量  
    print(f'子线程未启动之前主线程获取的值为: {g_num}')  
  
    # 创建线程对象  
    t1 = threading.Thread(target=work_1)  
    t1.start()  
  
    # 通过延迟保证t1线程中的事情做完  
    time.sleep(0.1)  
  
    t2 = threading.Thread(target=work_2)  
    t2.start()  
  
    time.sleep(0.1)  
    print(f'主线程最终获取到的值为: {g_num}')

序列类型共享

import time  
import threading  
  
g_nums = [11, 22, 33]  
  
  
def work_1(nums):  
    # 在全局列表中添加一个元素  
    nums.append(44)  
    print(f'子线程1添加完成之后的列表元素为: {nums}')  
  
  
def work_2(nums):  
    print(f'子线程2获取的列表元素为: {nums}')  
  
  
if __name__ == '__main__':  
    t1 = threading.Thread(target=work_1, args=(g_nums,))  
    t1.start()  
    # 确保子线程1完成操作后再执行一下代码  
    time.sleep(0.1)  
    t2 = threading.Thread(target=work_2, args=(g_nums,))  
    t2.start()  
    time.sleep(0.1)  
    print(f'主线程获取到的全局列表元素为: {g_nums}')

总结：

在一个进程内的所有线程共享全局变量，很方便在多个线程间共享数据
缺点就是，线程是对全局变量随意更改可能造成多线程之间对全局变量的混乱（即线程非安全）

多线程开发可能遇到的问题

假设两个线程t1和t2都要对全局变量g_num(默认是0)进行加1运算，t1和t2都各对g_num加10次，g_num的最终的结果应该为20。

但是由于是多线程同时操作，有可能出现下面情况：

在g_num=0时，t1取得g_num=0。此时系统把t1调度为”sleeping”状态，把t2转换为”running”状态，t2也获得g_num=0
然后t2对得到的值进行加1并赋给g_num，使得g_num=1
然后系统又把t2调度为”sleeping”，把t1转为”running”。线程t1又把它之前得到的0加1后赋值给g_num。
这样导致虽然t1和t2都对g_num加1，但结果仍然是g_num=1

示例代码一：

import threading  
import time  
  
g_num = 0  
  
  
def work_1(num):  
    global g_num  
    for i in range(num):  
        g_num += 1  
    print(f"线程1计算的结果为: {g_num}")  
  
  
def work_2(num):  
    global g_num  
    for i in range(num):  
        g_num += 1  
    print(f"线程2计算的结果为: {g_num}")  
  
  
if __name__ == "__main__":  
    print(f"线程创建之前g_num的值为: {g_num}")  
    t1 = threading.Thread(target=work_1, args=(100,))  
    t1.start()  
  
    t2 = threading.Thread(target=work_2, args=(100,))  
    t2.start()  
  
    # 等待子线程任务执行完毕后再执行主线程代码  
    while len(threading.enumerate()) != 1:  
        time.sleep(1)  
  
    print("2个线程对同一个全局变量操作之后的最终结果是:%s" % g_num)

示例代码二：

import threading  
import time  
  
g_num = 0  
  
  
def work_1(num):  
    global g_num  
    for i in range(num):  
        g_num += 1  
    print(f"线程1计算的结果为: {g_num}")  
  
  
def work_2(num):  
    global g_num  
    for i in range(num):  
        g_num += 1  
    print(f"线程2计算的结果为: {g_num}")  
  
  
if __name__ == "__main__":  
    print(f"线程创建之前g_num的值为: {g_num}")  
    t1 = threading.Thread(target=work_1, args=(1000000,))  
    t1.start()  
  
    t2 = threading.Thread(target=work_2, args=(1000000,))  
    t2.start()  
  
    # 等待子线程任务执行完毕后再执行主线程代码  
    while len(threading.enumerate()) != 1:  
        time.sleep(1)  
  
    print("2个线程对同一个全局变量操作之后的最终结果是:%s" % g_num)

**结论：**如果多个线程同时对同一个全局变量操作，会出现资源竞争问题，从而数据结果会不正确

同步的概念

同步就是协同步调，按预定的先后次序进行运行。如:你说完，我再说。

“同” 字从字面上容易理解为一起动作

其实不是，“同” 字应是指协同、协助、互相配合。

如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行;B执行，再将结果给A;A再继续操作。

解决线程同时修改全局变量的方式

对于上一小节提出的那个计算错误的问题，可以通过线程同步来进行解决

思路，如下:

系统调用t1，然后获取到g_num的值为0，此时上一把锁，即不允许其他线程操作g_num
t1对g_num的值进行+1
t1解锁，此时g_num的值为1，其他的线程就可以使用g_num了，而且是g_num的值不是0而是1
同理其他线程在对g_num进行修改时，都要先上锁，处理完后再解锁，在上锁的整个过程中不允许其他线程访问，就保证了数据的正确性

互斥锁

当多个线程几乎同时修改某一个共享数据的时候，需要进行同步控制

线程同步能够保证多个线程安全访问竞争资源，最简单的同步机制是引入互斥锁。

互斥锁为资源引入一个状态：锁定 / 非锁定

某个线程要更改共享数据时，先将其锁定，此时资源的状态为 “锁定”，其他线程不能更改；直到该线程释放资源，将资源的状态变成 “非锁定”，其他的线程才能再次锁定该资源。互斥锁保证了每次只有一个线程进行写入操作，从而保证了多线程情况下数据的正确性。

threading模块中定义了Lock类，可以方便的处理锁定：

# 创建锁  
mutex = threading.Lock()  
  
# 锁定  
mutex.acquire()  
  
# 释放  
mutex.release()

注意点：

如果这个锁之前是没有上锁的，那么acquire不会堵塞
如果在调用acquire对这个锁上锁之前它已经被其他线程上了锁，那么此时acquire会堵塞，直到这个锁被解锁为止

互斥锁的使用

import threading  
import time  
  
  
# 创建一个互斥锁  
# 默认是未上锁的状态  
mutex = threading.Lock()  
# 全局变量  
g_num = 0  
  
def add_number_1(num):  
    global g_num  
    for i in range(num):  
        mutex.acquire()  # 上锁  
        g_num += 1  
        mutex.release()  # 解锁  
  
    print(f"线程1计算得出的结果为: {g_num}")  
  
def add_number_2(num):  
    global g_num  
    for i in range(num):  
        mutex.acquire()  # 上锁  
        g_num += 1  
        mutex.release()  # 解锁  
  
    print(f"线程2计算得出的结果为: {g_num}")  
  
if __name__ == "__main__":  
    # 创建2个线程，让他们各自对g_num加1000000次  
    p1 = threading.Thread(target=add_number_1, args=(1000000,))  
    p1.start()  
  
    p2 = threading.Thread(target=add_number_2, args=(1000000,))  
    p2.start()  
  
    # 等待计算完成  
    while len(threading.enumerate()) != 1:  
        time.sleep(1)  
  
    print("2个线程对同一个全局变量操作之后的最终结果是:%s" % g_num)

可以看到最后的结果，加入互斥锁后，其结果与预期相符。

上锁解锁过程

当一个线程调用锁的acquire()方法获得锁时，锁就进入“locked”状态。

每次只有一个线程可以获得锁。如果此时另一个线程试图获得这个锁，该线程就会变为“blocked”状态，称为“阻塞”，直到拥有锁的线程调用锁的release()方法释放锁之后，锁进入“unlocked”状态。

线程调度程序从处于同步阻塞状态的线程中选择一个来获得锁，并使得该线程进入运行（running）状态。

总结：

锁的好处：

确保了某段关键代码只能由一个线程从头到尾完整地执行

锁的坏处：

阻止了多线程并发执行，包含锁的某段代码实际上只能以单线程模式执行，效率就大大地下降了
由于可以存在多个锁，不同的线程持有不同的锁，并试图获取对方持有的锁时，可能会造成死锁

死锁

在线程间共享多个资源的时候，如果两个线程分别占有一部分资源并且同时等待对方的资源，就会造成死锁。

尽管死锁很少发生，但一旦发生就会造成应用的停止响应。

死锁代码案例

#coding=utf-8  
import threading  
import time  
  
mutexA = threading.Lock()  
mutexB = threading.Lock()  
  
class MyThread1(threading.Thread):  
    def run(self):  
        # 对mutexA上锁  
        mutexA.acquire()  
  
        # mutexA上锁后，延时1秒，等待另外那个线程 把mutexB上锁  
        print(self.name+'----do1---up----')  
        time.sleep(1)  
  
        # 此时会堵塞，因为这个mutexB已经被另外的线程抢先上锁了  
        mutexB.acquire()  
        print(self.name+'----do1---down----')  
        mutexB.release()  
  
        # 对mutexA解锁  
        mutexA.release()  
  
class MyThread2(threading.Thread):  
    def run(self):  
        # 对mutexB上锁  
        mutexB.acquire()  
  
        # mutexB上锁后，延时1秒，等待另外那个线程 把mutexA上锁  
        print(self.name+'----do2---up----')  
        time.sleep(1)  
  
        # 此时会堵塞，因为这个mutexA已经被另外的线程抢先上锁了  
        mutexA.acquire()  
        print(self.name+'----do2---down----')  
        mutexA.release()  
  
        # 对mutexB解锁  
        mutexB.release()  
  
  
if __name__ == '__main__':  
    t1 = MyThread1()  
    t2 = MyThread2()  
    t1.start()  
    t2.start()

线程池

线程池，是一种线程的使用模式，它为了降低线程使用中频繁的创建和销毁所带来的资源消耗与代价。通过创建一定数量的线程，让他们时刻准备就绪等待新任务的到达，而任务执行结束之后再重新回来继续待命

实例化线程池对象

from concurrent.futures import ThreadPoolExecutor   
def crawl(url):   
   print(url)   
if __name__ == '__main__0':   
   base_url = 'https://jobs.51job.com/pachongkaifa/p{}/'   
   with ThreadPoolExecutor(10) as f:   
   for i in range(1,15):   
       f.submit(crawl,url=base_url.format(i))

使用线程池来执行线程任务的步骤如下：
调用 ThreadPoolExecutor 类的构造器创建一个线程池。
定义一个普通函数作为线程任务。
调用 ThreadPoolExecutor 对象的 submit() 方法来提交线程任务。

当不想提交任何任务时，调用 ThreadPoolExecutor 对象的 shutdown() 方法来关闭线程池。

from concurrent.futures import ThreadPoolExecutor  
import threading  
import time  
  
# 定义一个准备作为线程任务的函数  
def action(max):  
   my_sum = 0  
   for i in range(max):  
       print(threading.current_thread().name + '  ' + str(i))  
       my_sum += i  
   return my_sum  
# 创建一个包含2条线程的线程池  
pool = ThreadPoolExecutor(max_workers=2)  
# 向线程池提交一个task, 50会作为action()函数的参数  
future1 = pool.submit(action, 50)  
# 向线程池再提交一个task, 100会作为action()函数的参数  
future2 = pool.submit(action, 100)  
# 判断future1代表的任务是否结束  
print(future1.done())  
time.sleep(3)  
# 判断future2代表的任务是否结束  
print(future2.done())  
# 查看future1代表的任务返回的结果  
print(future1.result())  
# 查看future2代表的任务返回的结果  
print(future2.result())  
# 关闭线程池   
pool.shutdown()

感兴趣的小伙伴，赠送全套Python学习资料，包含面试题、简历资料等具体看下方。

一、Python所有方向的学习路线

Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。

二、Python必备开发工具

工具都帮大家整理好了，安装就可直接上手！

三、最新Python学习笔记

当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理解，这些理解是比较独到，可以学到不一样的思路。

四、Python视频合集

观看全面零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

五、实战案例

纸上得来终觉浅，要学会跟着视频一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

六、面试宝典

简历模板

若有侵权，请联系删除

你可能感兴趣的:(1024程序员节,python,爬虫,网络,开发语言,多线程,编程)

目前市场上主流的机器视觉的框架有哪些？他们的特点及优劣 yuanpan 机器学习计算机视觉
目前市场上主流的机器视觉框架和工具可以分为商业软件、开源工具和深度学习框架三大类。以下是它们的总结及特点对比：1.商业软件(1)Halcon(MVTec)特点：专注于工业机器视觉，提供高精度、高效率的算法。支持复杂的工业应用，如缺陷检测、3D视觉、深度学习等。提供图形化开发工具HDevelop和多种编程接口。优势：算法优化好，适合实时工业应用。硬件兼容性强，支持多种工业相机和设备。劣势：商业软件，
清晰易懂的Python安装与配置教程 Tee xm python 开发语言
初学者也能看懂的Python安装与配置教程本教程将手把手教你安装Python，并配置国内镜像源和自定义依赖包缓存位置，即使你是零基础小白，也能轻松完成！一、准备工作操作系统：Windows10/11、macOS或Linux。下载工具：浏览器（推荐Chrome或Edge）。存储空间：至少预留500MB可用空间。二、安装Python1.下载Python访问Python官网下载页面：https://ww
go面向对象编程三大特性，封装、继承和多态平谷一勺 Golang基础篇 golang 开发语言后端 go封装继承多态封装多态继承
1.简介go具有面向对象编程的封装、继承和多态的特性，只是实现的方式和其它OOP语言不一样，下面看下go的三大特性是如何实现的。2.封装2.1基本介绍封装就是把抽象出的字段和对字段的操作封装在一起，数据被保护在内部，程序的其它包只能通过被授权的操作（方法），才能对字段进行操作。优点：隐藏细节。可以对数据进行验证，保证安全合理。2.2封装的实现步骤将结构体、字段（属性）的首字母小写（不能导出了，其他
双均线量化策略实战指南：基于 iTick 外汇API、股票API报价源的 Python 实现算法pythonai开发
在量化交易领域，iTick报价API凭借其强大的多市场覆盖能力，已成为专业交易员的首选数据解决方案。其外汇API支持全球主要货币对（如EURUSD、GBPUSD）的毫秒级行情推送，包含Bid/Ask深度报价和实时波动率数据；股票API则覆盖A股、港股及美股市场，提供Level-2逐笔成交和十档盘口信息。通过统一的RESTful接口，开发者可轻松获取标准化的OHLCV数据，实现外汇、股票等多资产策略
1.1PaddleTS_环境配置：一个易用的深度时序建模的Python库 pythonQA python paddlepaddle
PaddleTS是一个易用的深度时序建模的Python库，它基于飞桨深度学习框架PaddlePaddle，专注业界领先的深度模型，旨在为领域专家和行业用户提供可扩展的时序建模能力和便捷易用的用户体验。PaddleTS的主要特性包括：设计统一数据结构，实现对多样化时序数据的表达，支持单目标与多目标变量，支持多类型协变量封装基础模型功能，如数据加载、回调设置、损失函数、训练过程控制等公共方法，帮助开发
【大模型科普】AIGC技术发展与应用实践（一文读懂AIGC）人工智能
【专栏介绍】⌈⌈⌈人工智能与大模型应用⌋⌋⌋人工智能（AI）通过算法模拟人类智能，利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络（如ChatGPT），经海量数据训练后能完成文本生成、图像创作等复杂任务，显著提升效率，但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合，未来需平衡技术创新与伦理风险，推动可持续发展。文章目录一、AIGC概述（一）什么是
ESP8266 与 ARM7 接口-LPC2148 创建 Web 服务器以控制 LED David WangYang ESP8266项目服务器运维
ESP8266与ARM7接口-LPC2148创建Web服务器以控制LEDESP8266Wi-Fi收发器提供了一种将微控制器连接到网络的方法。它被广泛用于物联网项目，因为它便宜、体积小且易于使用。在本教程中，我们将ESP8266Wi-Fi模块与ARM7-LPC2148微控制器连接，并创建一个Web服务器来控制连接到LPC2148的LED。工作流程将如下所示：从LPC2148向ESP8266发送AT命
热点研究 | OpenAI 重磅发布 Agents SDK，人人都能手搓 Manus? Ai野生菌技术面 php 开发语言 manus openai agent
3月12日，OpenAI正式发布了OpenAIAgentsSDK，这一重要发布不仅为开发者提供了强大的工具，更预示着AIAgent技术即将进入快速发展期。这些工具为开发者提供更强大功能，使代理能够独立执行复杂任务，如搜索网络、处理文件和自动化计算机操作。ResponsesAPI同步发布，为开发者提供了构建自定义AIAgent的能力，能够执行网络搜索、文件检索等任务。这套新工具和API旨在赋能开发者
Ada语言的数据结构与算法尤宸翎包罗万象 golang 开发语言后端
Ada语言的数据结构与算法引言在计算机科学的领域里，数据结构与算法是核心的组成部分，围绕着如何高效地存储和处理数据。这些概念不仅是程序设计的重要基础，也是提高程序性能的关键。Ada是一种强类型、结构化的编程语言，早在20世纪80年代就被设计用于军用和实时系统。由于其高可靠性和可维护性，Ada逐渐在航空航天、军事和其他需要高安全性的领域获得了广泛应用。本文将探讨Ada语言中的数据结构和算法，包括常见
蓝桥杯pythonB组备赛暴力执码蓝桥杯职场和发展
P1003[NOIP2011提高组]铺地毯题目描述为了准备一个独特的颁奖典礼，组织者在会场的一片矩形区域（可看做是平面直角坐标系的第一象限）铺上一些矩形地毯。一共有n张地毯，编号从1到n。现在将这些地毯按照编号从小到大的顺序平行于坐标轴先后铺设，后铺的地毯覆盖在前面已经铺好的地毯之上。地毯铺设完成后，组织者想知道覆盖地面某个点的最上面的那张地毯的编号。注意：在矩形地毯边界和四个顶点上的点也算被地毯
本周安全速报（2025.3.11~3.17）联蔚盘云安全
合规速递01瑞士出台新规：关基设施遭遇网络攻击需在24小时内上报原文:https://www.bleepingcomputer.com/news/security/swiss-critical-sector-faces-new-24-hour-cyberattack-reporting-rule/新规要求，关键基础设施组织发现网络攻击后，首次报告需在24小时内完成，详细报告需在后续14天内完成，未
解决 Python 中 `cv2` 模块部分初始化导致的 `AttributeError` Leuanghing python 开发语言
解决Python中cv2模块部分初始化导致的AttributeError在Python开发中，尤其是使用OpenCV库进行图像处理时，可能会遇到一些令人困惑的错误。今天，我们就来探讨一个常见的错误：AttributeError:partiallyinitializedmodule'cv2'hasnoattribute'gapi_wip_gst_GStreamerPipeline'，并提供一个有效的
Julia语言的饼图尤宸翎包罗万象 golang 开发语言后端
Julia语言的饼图：全面剖析与实战指南引言在数据可视化的领域中，饼图作为一种经典的可视化工具，广泛用于展示各个分类在总体中的占比关系。尽管饼图在一些数据分析师中被视为相对简单和直观的图形，但它在实际运用中依然扮演着重要角色。本文将重点探讨如何使用Julia语言实现饼图的绘制，分析其背后的逻辑，并通过实例帮助读者掌握这一基本技能。Julia语言简介Julia是一种高性能、高级别的编程语言，适用于数
施磊老师高级c++(二) Zhuai-行淮施磊老师cpp c++开发语言
智能指针文章目录智能指针基础--实现简单的智能指针2.不带引用计数的智能指针问题解决不带引用计数的智能指针汇总auto_ptr--#include--不推荐scoped_ptr---不推荐unique_ptr--推荐--右值引用--move3.带引用计数的智能指针4.shared_ptr交叉(循环)引用问题代码示例整体过程解决办法--强弱混用弱智能指针-不能使用资源5.多线程访问共享对象的线程安全
python 正则表达式的语法及使用主打Python 正则表达式 python 基础语法正则表达式 python
python正则表达式的语法及使用概念：按照程序员的指示，字符串里提取你要的数据。应用：爬虫清洗数据，匹配电话，匹配邮箱，匹配账号……最重要的就是（.*?）正则语法（元字符）1、？：前面的内容出现0-1次2、+：前面的内容出现1-多次3、*：前面的内容出现0-多次‘’’正则(Regular)：记住的点：1、(.？)2、re.findall()结果是一个列表3、用(.?)的是后，一定要复制，而不是手
python pandas 读取excel单元门公式值_Python pandas对excel的操作实现示例 weixin_39585761 python pandas 读取excel单元门公式值
最近经常看到各平台里都有Python的广告，都是对excel的操作，这里明哥收集整理了一下pandas对excel的操作方法和使用过程。本篇介绍pandas的DataFrame对列(Column)的处理方法。示例数据请通过明哥的gitee进行下载。增加计算列pandas的DataFrame，每一行或每一列都是一个序列(Series)。比如：importpandasaspddf1=pd.read_e
httpcanary动态注入_HttpCanary weixin_39760721 httpcanary动态注入
HttpCanary是一款功能十分强大网络抓包工具，它可以分析多个协议HTTP、https、http2等，这是一款最新的专为移动端设计的抓包工具，用户可以根据这个工具来应用，使用非常的简单，一学就会。对这款HttpCanary感兴趣的用户点击下载就可以使用啦!软件介绍HttpCanary是一款功能齐全的互联网包抓取和分析工具，相当于是移动端的Fiddler或是Charles，可是HttpCanar
pandas整表写入excel指定位置_pandas操作Excel的常用场景及问题那个吴小明
很多场景下使用pandas就能够胜任手上的excel处理任务，之前写的用python操作具体到excel单元格的方法参考：贺霆：python操作Excel实现自动化报表zhuanlan.zhihu.com现在主要介绍使用pandas读取excel的几种常用场景：一、常规读取importpandasaspdfrompandasimportDataFrame,Seriesimportosos.chdi
httpcanary小米闪退_Android HttpCanary最强抓包工具！ ssslience httpcanary小米闪退
迎使用HttpCanary——最强Android抓包工具！HttpCanary是一款功能强大的HTTP/HTTPS/HTTP2网络包抓取和分析工具，你可以把他看成是移动端的Fiddler或者Charles，但是HttpCanary使用起来更加地简单容易，因为它是专门为移动端设计的！最重要的是：无需root权限！无需root权限！无需root权限！HttpCanary支持对HTTP协议包的抓取和注入
httpcanary动态注入_HttpCanary使用指南——正则匹配注入火锅大魔王 httpcanary动态注入
HttpCanary于v2.11.0版本上线了正则匹配注入功能。顾名思义，就是使用正则表达式或者匹配字符串，动态修改网络请求数据中的部分数据。举个例子：{"date":"30日星期天","high":"高温30℃","fengli":"","low":"低温23℃","fengxiang":"西南风","type":"多云"}复制代码我们希望将网络请求体中这段数据中的符号℃修改为中文摄氏度，即：{
国产信创AI IDE：开启智能编程新时代 InsCode AI IDE
国产信创AIIDE：开启智能编程新时代随着信息技术的迅猛发展，软件开发工具也在不断演进。近年来，人工智能（AI）技术的应用为编程工具带来了革命性的变化。其中，国产信创AIIDE——InsCodeAIIDE，作为一款由CSDN、GitCode和华为云CodeArtsIDE联合开发的新一代集成开发环境（IDE），以其智能化、高效化的特点，正在引领智能编程的新时代。最新接入DeepSeek-V3模型，点
如何用Python批量将CSV文件编码转换为UTF-8并转为Excel格式？字节王德发 python python excel 开发语言
在处理数据时，CSV文件格式常常用作数据的交换格式。不过，很多情况下我们会遇到编码问题，特别是当文件不是UTF-8编码时。为了更好地处理这些文件，可能需要将它们转换为UTF-8编码，并且将其转换为Excel格式，这样可以方便后续的数据分析和使用。今天就来聊聊如何用Python实现这一过程。准备工作：安装必要的库我们需要确保安装了所需的Python库。主要用到的库有pandas和openpyxl。p
AI编程工具领域：深度理解项目架构篇 xinxiyinhe AI编程 python 人工智能 AI编程人工智能
AI编程工具领域：深度理解项目架构篇在AI编程工具领域，能够读取项目目录并深度理解项目架构的工具主要通过代码索引、上下文感知和智能问答等功能实现。以下是基于最新信息的工具评估与分析：1.通义灵码（阿里云）核心能力：@workspace功能：基于RAG技术，支持本地代码库的索引和深度感知，可分析项目完整结构，生成文件解释、代码逻辑查询和整体修改建议。多语言支持：覆盖200+编程语言，兼容VSCode
清晰易懂的Java8安装教程 Tee xm windows java
小白也能看懂的Java8安装教程（JDK和JRE分目录安装）本教程将手把手教你如何在Windows系统上安装Java8（JDK1.8），并将JDK和JRE安装到不同的目录中，同时提供国内Java8下载源和方法。即使你是编程小白，也能轻松学会！一、准备工作操作系统：Windows10或更高版本。下载工具：一个浏览器（如Chrome、Edge）。存储空间：确保你的电脑有至少500MB的可用空间。二、下
Python 的 ORM（Object-Relational Mapping）工具浅讲 Code_Geo python 开发语言
SQLAlchemy相关讲解1.SQLAlchemy是什么？定义：一个Python的ORM（Object-RelationalMapping）工具，允许开发者通过Python类与对象操作数据库，而非直接编写SQL。核心组件：Core：底层SQL表达式语言，提供数据库无关的SQL操作接口。ORM：基于Core的高层抽象，将数据库表映射为Python类（模型），记录映射为对象。适用场景：需要灵活操作数
#Python 项目：实现功能——使用钉钉“自定义”机器人在群中发送文字消息 Window Unlock 钉钉 python 机器人
（目前还是新手，程序难免有废话代码，请大家耐心看__比心）第一步：创建群聊机器人，参考官方手册官方链接：自定义机器人的创建和安装-钉钉开放平台此步骤可以得到两个关键参数：Webhook（机器人的通信网址）：https://oapi.dingtalk.com/robot/send?############（如这样）secret（加签未解密密钥）：SECe2######################
Hyperlane：Rust 生态中的轻量级高性能 HTTP 服务器库，助力现代 Web 开发 LTPP rust http 服务器开发语言后端前端面试
Hyperlane：Rust生态中的轻量级高性能HTTP服务器库，助力现代Web开发在Rust生态系统中，Hyperlane是一个备受关注的HTTP服务器库，以其轻量级、高性能和易用性脱颖而出。无论你是想快速构建一个高效的Web服务，还是需要支持实时通信的现代应用，Hyperlane都能成为你的理想选择。它不仅简化了网络服务的开发，还提供了强大的功能支持，如HTTP请求解析、响应构建、TCP通信，
Python-有效字母异位词 m0_37763377 python 哈希算法算法数据结构
一、什么是字母异位词字母异位词‌是指由相同字母组成但排列顺序不同的单词。例如，"eat"、"tea"和"ate"都是字母异位词，因为它们由相同的字母组成，只是排列顺序不同。‌二、思路（一）暴力解法这里可以用两层循环来判断2个字符串的元素是否一样，显然时间复杂度为O(n²），在这里大家可以自己写一下，文章就不再提供演示。（二）哈希表解法1.什么是哈希表？哈希表（HashTable），也称为散列表，是
LeetCode56☞合并区间 fantasy_4 LeetCode刷题 leetcode python java 算法贪心算法
关联LeetCode题号56本题特点贪心本题思路将二维数组排序按照左边界排序。排序后，右边界的大小成为找到局部最大值的关键。由题意合并区间可知，应该取数组的’并集‘，局部最优解推出全局最优解，每次找到局部最大的范围，整体就会合并成一个大区间Python写法defmerge(self,intervals):result=[]iflen(intervals)==0:returnresult#区间集合为
【python】图形用户界面和游戏开发 usp1994 python ui ide
图形用户界面和游戏开发文章目录图形用户界面和游戏开发基于tkinter模块的GUI使用Pygame进行游戏开发制作游戏窗口在窗口中绘图加载图像实现动画效果碰撞检测事件处理基于tkinter模块的GUIGUI是图形用户界面的缩写，图形化的用户界面对使用过计算机的人来说应该都不陌生，在此也无需进行赘述。Python默认的GUI开发模块是tkinter（在Python3以前的版本中名为Tkinter），
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI linux PHP android
╔-----------------------------------╗┆
zookeeper admin 笔记 braveCS zookeeper
Required Software 1) JDK>=1.6 2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘数据和日志目录 1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
Spring配置多个连接池 easterfly spring
项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ Spring中有关于dataSource的配置： <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" &nb
Mysql 171815164 mysql
例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI TH GRANT OPTION; 如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
CommonDAO（公共/基础DAO） g21121 DAO
好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
直言有讳永夜-极光感悟随笔
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 精华: “直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
安装CentOS 7 和Win 7后，Win7 引导丢失随便小屋 centos
一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。一、首先具有root 的权限。即进入Terminal后输入命令su，然后输入密码即可二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 v
Oracle备份与恢复案例 aijuans oracle
Oracle备份与恢复案例一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
JavaEE开源快速开发平台G4Studio v5.0发布無為子
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。访问G4Studio网站 http://www.g4it.org 2013-04-06 发布G4Studio_V5.0版本功能新增 (1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
Oracle显示根据高考分数模拟录取百合不是茶 PL/SQL编程 oracle例子模拟高考录取学习交流
题目要求: 1,创建student表和result表 2,pl/sql对学生的成绩数据进行处理 3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 1,创建student表,和result表学生信息表; create table student( student_id number primary key,--学生id
优秀的领导与差劲的领导 bijian1013 领导管理团队
责任优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。努力工作优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
js函数在浏览器下的兼容 Bill_chen jquery 浏览器 IE DWR ext
做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： IE6：node.nextSibling,对于FF是不能识别的； FF：node.nextElementSibling,对于IE是不能识别的；兼容解决方式：var Div = node.nextSibl
【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC) bit1129 垃圾回收
吞吐量与用户线程暂停时间衡量垃圾回收算法优劣的指标有两个：吞吐量越高，则算法越好暂停时间越短，则算法越好首先说明吞吐量和暂停时间的含义。垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
J2EE监听器和过滤器基础白糖_ J2EE
Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 ServletContex监听器 ServletContex又叫application
博弈AngularJS讲义(16) - 提供者 boyitech js AngularJS api Angular Provider
Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 bylijinnan java
public class CommonSubSequence { /** * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 * 写一个版本算法复杂度O(N^2)和一个O(N) 。 * * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。 * O(
sqlserver 2000 无法验证产品密钥 Chen.H sql windows SQL Server Microsoft
在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。这样做, 收到以下错误信息CD KEY的 SQ
[新概念武器]气象战争 comsci
气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 原因如下: 地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
oracle 中 rollup、cube、grouping 使用详解 daizj oracle grouping rollup cube
oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示转自namesliu -- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景 --- ROLLUP ，为了理解分组的成员数量，我增加了分组的计数 COUNT(SAL)
技术资料汇总分享 Dead_knight 技术资料汇总分享
本人汇总的技术资料，分享出来，希望对大家有用。 http://pan.baidu.com/s/1jGr56uE 资料主要包含： Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) Ser
初一下学期难记忆单词背诵第一课 dcj3sjt126com english word
could 能够 minute 分钟 Tuesday 星期二 February 二月 eighteenth 第十八 listen 听 careful 小心的，仔细的 short 短的 heavy 重的 empty 空的 certainly 当然 carry 携带；搬运 tape 磁带 basket 蓝子 bottle 瓶 juice 汁，果汁 head 头；头部
截取视图的图片, 然后分享出去 dcj3sjt126com OS Objective-C
OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. I implemented a category method on UIView to get the vi
MySql重置密码 fanxiaolong MySql重置密码
方法一: 在my.ini的[mysqld]字段加入： skip-grant-tables 重启mysql服务，这时的mysql不需要密码即可登录数据库然后进入mysql mysql>use mysql; mysql>更新 user set password=password('新密码') WHERE User='root'; mysq
Ehcache（03）——Ehcache中储存缓存的方式 234390216 ehcache MemoryStore DiskStore 存储驱除策略
Ehcache中储存缓存的方式目录 1 堆内存（MemoryStore） 1.1 指定可用内存 1.2 驱除策略 1.3 元素过期 2 &nbs
spring mvc中的@propertysource jackyrong spring mvc
在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： @PropertySource 在spring 3.1中开始引入比如有配置文件 config.properties mongodb.url=1.2.3.4 mongodb.db=hello 则代码中 @PropertySource(&
重学单例模式 lanqiu17 单例 Singleton 模式
最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式静态内部类方式: package test.pattern.singleton.statics; publ
.NET开源核心运行时，且行且珍惜 netcome java .net 开源
背景 2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
使用oscahe缓存技术减少与数据库的频繁交互 Everyday都不同 Web 高并发 oscahe缓存
此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
Spring+Mybatis 手动控制事务 toknowme mybatis
@Override public boolean testDelete(String jobCode) throws Exception { boolean flag = false; &nbs
菜鸟级的android程序员面试时候需要掌握的知识点 xp9802 android
熟悉Android开发架构和API调用掌握APP适应不同型号手机屏幕开发技巧熟悉Android下的数据存储熟练Android Debug Bridge Tool 熟练Eclipse/ADT及相关工具熟悉Android框架原理及Activity生命周期熟练进行Android UI布局熟练使用SQLite数据库；熟悉Android下网络通信机制，S