米兔-miny

生产者与消费者模式

1、生产者与消费者模式

2、线程间的通信

3、Queue线程安全队列

4、课堂案例（Queue在多线程中的使用）

5、课堂案例（多线程下载王者荣耀高清壁纸）

1）分析URL

2）爬取第一页壁纸的url

3）存储壁纸

4）多线程下载壁纸

1、生产者与消费者模式

生产者与消费者模式是多线程开发中常见到的一种模式
生产者线程
- 生产者线程用于“生产”数据
消费者线程
- 消费者线程用于“消费”数据

import time
import random
import threading
g_money = 0      # 全局变量
lock=threading.Lock()   # 创建锁对象
class Producer(threading.Thread):
    def run(self):
        global g_money
        for _ in range(10):   # 不需要使用变量，只需要计算次数的时候就可以用下划线_
            lock.acquire()      # 加锁
            money=random.randint(10000,80000)
            g_money+=money
            print(threading.current_thread().getName(),f'挣了{money}元钱，当前余额为{g_money}元')
            time.sleep(1)
            lock.release()      # 释放锁

class Customer(threading.Thread):
    def run(self):
        global g_money
        for _ in range(10):
            lock.acquire()
            money = random.randint(10000, 80000)
            if money<=g_money:
                g_money-=money
                print(threading.current_thread().getName(), f'花了{money}元钱，当前余额为{g_money}元')
            else:
                print(threading.current_thread().getName(), f'想花了{money}元钱，但是余额不足，当前余额为{g_money}元')
            time.sleep(1)
            lock.release()

def start():
    for i in range(5):
        t=Producer(name='生产者{0}'.format(i))
        t.start()

    for i in range(5):
        t=Customer(name='--------消费者{0}'.format(i))
        t.start()

if __name__ == '__main__':
    start()     # 调用自定义的start()函数，创建线程对象，启动线程

2、线程间的通信

Condition版的生产者与消费者模式

序号	函数	描述
1	acquire()	上锁
2	release()	解锁
3	wait()	将当前线程处于等待状态，并且会释放锁。可以被其他线程使用notify()和notify_all()函数唤醒。被唤醒后会继续等待上锁，上锁后继续执行下面的代码。
4	notify()	通知某个正等待的线程，默认是第1个等待的线程
5	notify_all()	通知所有正等待的线程。notify()和notify_all()需要在release()之前调用

消费者已经余额不足了，就不需要再消费了

import random
import threading
g_money = 0      # 全局变量
lock=threading.Condition()   # 创建Condition对象
g_time=0
class Producer(threading.Thread):
    def run(self):
        global g_money
        global g_time
        for _ in range(10):   # 不需要使用变量，只需要计算次数的时候就可以用下划线_
            lock.acquire()      # 加锁
            money=random.randint(10000,80000)
            g_money+=money
            g_time+=1
            print(threading.current_thread().getName(),f'挣了{money}元钱，当前余额为{g_money}元')
            lock.notify_all()
            lock.release()      # 释放锁

class Customer(threading.Thread):
    def run(self):
        global g_money
        for _ in range(10):
            lock.acquire()
            money = random.randint(80000, 100000)
            while g_money < money:
                if g_time>=10:
                    lock.release()
                    return
                print(threading.current_thread().getName(), f'想花了{money}元钱，但是余额不足，当前余额为{g_money}元')
                lock.wait()     # 余额不足的情况下需要等待生产者赚钱唤醒

            g_money-=money
            print(threading.current_thread().getName(), f'--------共花了{money}元钱，当前余额为{g_money}元')
            lock.release()

def start():
    for i in range(5):
        t=Producer(name='生产者{0}'.format(i))
        t.start()

    for i in range(5):
        t=Customer(name='--------消费者{0}'.format(i))
        t.start()

if __name__ == '__main__':
    start()     # 调用自定义的start()函数，创建线程对象，启动线程

3、Queue线程安全队列

Python内置的线程安全的模块叫queue（再也不用加锁解锁了）
- FIFO（先进先出）队列Queue
- LIFO（后进先出）队列Queue

序号	函数	描述
1	qsize()	返回队列的大小
2	empty()	判断队列是否为空
3	full()	判断队列是否满了
4	get()	从队列中取最先插入的数据
5	put()	将一个数据放到队列中

from queue import Queue     # FIFO

q=Queue(5)      # 创建一个队列，最多可以存放5个数据
# 向队列中存放数据
for i in range(4):
    q.put(i)
print('队列中实际数据的多少：', q.qsize())     # 队列中实际数据的多少： 4

for _ in range(5):
    try:
        print(q.get(block=False))       # 0  1  2  3
    except:
        print('数据已经取完，队列目前为空')
        break

if q.full():
    print('队列已满')
else:
    print('队列当前数据的个数为：', q.qsize(),'队列不满')   # 个数为： 0 。因为上面已经把数据取完了


q2=Queue(5)
for i in range(6):  # 程序最多放5个，可以现在有6个，最后一个一直处于等待状态，程序结束不了
    try:
        q2.put(i, block=False)
    except:
        print('队列已满')
        break

print('程序结束')

总结：使用block的情况：

1、队很长，元素很少，get使用

2、队很短，元素很多，put使用

4、课堂案例（Queue在多线程中的使用）

Queue是线程安全的队列，在使用时无需加锁，可以在多线程中直接使用
队列也是实现线程间同步的方式

from queue import Queue
import random
import time
import threading

def add_value(q):
    while True:
        q.put(random.randint(100,1000))
        time.sleep(1)

def get_value(q):
    while True:
        print('取出了元素:{0}'.format(q.get()))

def start():
    q = Queue(10)
    t1 = threading.Thread(target=add_value, args=(q,))    # 元组后面只有一个元素需要加逗号
    t2 = threading.Thread(target=get_value, args=(q,))
    t1.start()
    t2.start()

if __name__ == '__main__':
    start()

5、课堂案例（多线程下载王者荣耀高清壁纸）

1）分析URL

分析URL
- 高清壁纸的URL：王者荣耀壁纸下载-王者荣耀官方网站-腾讯游戏
- 含有数据的URL：
- 页码范围：一共25页，页码范围为0到24

验证是否是Ajax请求：

1、点击第2页，URL栏地址不变，点击XHR，找到唯一一个，但是看preview发现无内容，说明不是

2、看F12和网页源代码是否是一样的。一样的说明不是Ajax请求。如果不一样，说明数据并没有在服务器端，而是通过另外的请求发回的客户端，在客户端组装的。

找真实的数据源：点击ALL，点击含WorkLis(就是和高清壁纸div板块的class名有点像的)的，复制它的Request URL，粘贴到URL栏。复制获取到的数据，粘贴到json.cn，掐头去尾进行解析。

from urllib import parse    # 可以解析网址
result=parse.unquote('http%3A%2F%2Fshp%2Eqpic%2Ecn%2Fishow%2F2735042018%2F1618915966%5F84828260%5F2160%5FsProdImgNo%5F8%2Ejpg%2F200')
print(result)   # 得到链接，粘贴到URL上，发现是图片，但是图片很小
# http://shp.qpic.cn/ishow/2735042018/1618915966_84828260_2160_sProdImgNo_8.jpg/200

# 在F12Element中找最大图片的URL，对比获得的数据，把末尾的200改成0即可获得最大图片
# http://shp.qpic.cn/ishow/2735042018/1618915966_84828260_2160_sProdImgNo_8.jpg/0

2）爬取第一页壁纸的url

添加请求头参数headers应对反爬
urllib下的parse解析URL与解码中文编码

当打印resp.text时，返回的数据需要掐头去尾才是json数据，如果不需要掐头去尾，也可以发现我们的url中有一段与json数据前一样的值，把它删掉重新运行即可。

打印resp.text时：jQuery171032545231727144275_1619310537581( 需要删去

或者删掉url中：&jsoncallback=jQuery171032545231727144275_1619310537581，重新运行

import requests
from urllib import parse

headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.114 Safari/537.36',
'referer': 'https://pvp.qq.com/'
}

def exact_url(data):        # 提取一个data中的8张壁纸
    image_url_lst=[]
    for i in range(1,9):
        image_url=parse.unquote(data['sProdImgNo_{}'.format(i)].replace('200','0'))
        image_url_lst.append(image_url)
    return image_url_lst

def send_request():
    # url是含有数据的Request URL，即worklist的Request URL
    url='https://apps.game.qq.com/cgi-bin/ams/module/ishow/V1.0/query/workList_inc.cgi?activityId=2735&sVerifyCode=ABCD&sDataType=JSON&iListNum=20&totalpage=0&page=0&iOrder=0&iSortNumClose=1&iAMSActivityId=51991&_everyRead=true&iTypeId=2&iFlowId=267733&iActId=2735&iModuleId=2735&_=1619310537883'
    resp = requests.get(url, headers=headers)
    # print(resp.text)
    return resp.json()


def parse_json(json_data):
    d={}
    data_lst=json_data['List']
    for data in data_lst:
        image_url_lst=exact_url(data)
        sProdName=parse.unquote(data['sProdName'])
        d[sProdName]=image_url_lst
    for item in d:
        print(item, d[item])

def start():
    json_data=send_request()
    parse_json(json_data)

if __name__ == '__main__':
    start()

3）存储壁纸

路径的拼接
os.mkdir()创建文件夹
request.urlretrieve(url,path)从url处下载文件并存储到path中

import requests
from urllib import parse
from urllib import request
import os

headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.114 Safari/537.36',
'referer': 'https://pvp.qq.com/'
}

def exact_url(data):        # 提取一个data中的8张壁纸
    image_url_lst=[]
    for i in range(1,9):
        image_url=parse.unquote(data['sProdImgNo_{}'.format(i)].replace('200','0'))
        image_url_lst.append(image_url)
    return image_url_lst

def send_request():
    # url是含有数据的Request URL，即worklist的Request URL
    url='https://apps.game.qq.com/cgi-bin/ams/module/ishow/V1.0/query/workList_inc.cgi?activityId=2735&sVerifyCode=ABCD&sDataType=JSON&iListNum=20&totalpage=0&page=0&iOrder=0&iSortNumClose=1&iAMSActivityId=51991&_everyRead=true&iTypeId=2&iFlowId=267733&iActId=2735&iModuleId=2735&_=1619310537883'
    resp = requests.get(url, headers=headers)
    # print(resp.text)
    return resp.json()

def parse_json(json_data):
    d={}
    data_lst=json_data['List']
    for data in data_lst:
        image_url_lst=exact_url(data)
        sProdName=parse.unquote(data['sProdName'])
        d[sProdName]=image_url_lst
    # for item in d:
    #     print(item, d[item])
    save_jsp(d)

def save_jsp(d):
    for key in d:
        # 拼接路径  image/李白-鸣剑·曳影   image/露娜-瓷语鉴心
        dirpath=os.path.join('img/王者荣耀壁纸/', key.strip(' '))
        os.mkdir(dirpath)
        # 下载图片并保存
        for index,image_url in enumerate(d[key]):
            request.urlretrieve(image_url,os.path.join(dirpath,'{}.jpg'.format(index+1)))
            print('{}下载完毕'.format(d[key][index]))

def start():
    json_data=send_request()
    parse_json(json_data)

if __name__ == '__main__':
    start()

4）多线程下载壁纸

生产者线程
- page_queue.get()
- image_url_queue.put()
- 用于生产图片路径
消费者线程
- image_url_queue.get()
- 用于下载并存储

# 用于编辑下载路径
import os
# 用来发请求
import requests
# 多线程，用来继承
import threading
# 创建队列，配合多线程
from queue import Queue
# url解码
from urllib import parse
# 用于下载保存文件
from urllib import request

# 全局变量
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.114 Safari/537.36',
    'referer': 'https://pvp.qq.com/'
}


# 用于壁纸url解码，利用循环迭代获取data数据中8个键值
def exact_url(data):
    image_url_lst = []
    for i in range(1, 9):
        # 获取json中（sProdImgNo_1~9）键值数据（获得9个普通壁纸链接），将url中的200替换为0，以得到高清壁纸链接，解析url
        image_url = parse.unquote(data['sProdImgNo_{}'.format(i)]).replace('200', '0')
        # 将解析好的url存入列表
        image_url_lst.append(image_url)
    return image_url_lst


# 生产者线程
class Producer(threading.Thread):
    """
       1、子类不重写__init__ ， 实例化子类时，会自动调用父类定义的__init__
       2、子类重写了__init__时，实例化子类，就不会调用父类已经定义的__init__
    """

    def __init__(self, page_queue, image_url_queue):
        # super（）方法在子类中调用父类__init__（）方法
        super().__init__()
        self.page_queue = page_queue
        self.image_url_queue = image_url_queue

    # 重写run（）方法
    def run(self):
        # 判断，当队列不为空时！（empty()判断队列是否为空）
        while not self.page_queue.empty():
            # 从队列1中取出url开始处理
            page_url = self.page_queue.get()
            # 取出后发送请求
            resp = requests.get(page_url, headers=headers)
            # 将请求来的页面数据转换为json类型(页面请求类型为Ajax请求)
            json_data = resp.json()
            d = {}
            # 获取json数据中的list项
            data_list = json_data['List']
            # 获取壁纸名字与url，将名字与url按字典键与值对应拼接起来
            for data in data_list:
                # 调用函数exact_url(data)处理好的壁纸url数据
                image_url_lst = exact_url(data)
                # 获取壁纸名字，将url数据解码(parse.unquote（）方法)
                sProdName = parse.unquote(data['sProdName'])
                # 字典的强制增加，dict[键] = 值
                d[sProdName] = image_url_lst
            # 创建本地文件夹路径,将处理好的路径与url放入队列2
            for key in d:
                # 拼接路径（path.join（）），创建目录文件夹: image/马可波罗-暗影游猎 image/李信—一念神魔
                # strip()方法用于移除字符串头尾指定的字符（默认为空格或换行符）或字符序列。
                dirpath = os.path.join('img/王者荣耀壁纸/', key.strip(' '))
                # 判断路径是否存在,如果不存在则创建路径（path.exists（））
                if not os.path.exists(dirpath):
                    os.mkdir(dirpath)
                # 下载图片并保存,遍历字典中的每一个值，此时key索引为字典中每一个键（dict[键] = 值）
                # enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列，同时列出数据和数据下标
                for index, image_url in enumerate(d[key]):
                    # 将处理好的（{图片路径,下载地址}）打包，以字典的形式放入队列2中.
                    self.image_url_queue.put(
                        {'image_path': os.path.join(dirpath, f'{index + 1}.jpg'), 'image_url': image_url})

# 消费者线程
class Customer(threading.Thread):
    def __init__(self, image_url_queue):
        super().__init__()
        self.image_url_queue = image_url_queue

    def run(self):
        # 持续下载
        while True:
            # 当程序20秒无响应时报错，退出程序
            try:
                # 从队列2中取出数据，设置响应时间20S
                image_obj = self.image_url_queue.get(timeout=20)
                # 将URL表示的网络对象复制/下载到本地文件，request.urlretrieve（url,保存路径）。
                request.urlretrieve(image_obj['image_url'], image_obj['image_path'])
                print(f'{image_obj["image_path"]}下载完成')
            except:
                break

def start():
    # 创建队列1，用于存储每个页面url的队列（共22页）
    page_queue = Queue(22)
    # 创建队列2，用于存储图片路径的队列
    image_url_queue = Queue(1000)
    # 序列索引迭代22页url，批量放入队列1
    for i in range(0, 3):
        # 格式字符串语法，在字符串前加f，字符串中{}内输入替换内容，用途同str.format()方法
        page_url = f'https://apps.game.qq.com/cgi-bin/ams/module/ishow/V1.0/query/workList_inc.cgi?activityId=2735&sVerifyCode=ABCD&sDataType=JSON&iListNum=20&totalpage=0&page={i}&iOrder=0&iSortNumClose=1&iAMSActivityId=51991&_everyRead=true&iTypeId=2&iFlowId=267733&iActId=2735&iModuleId=2735&_=1616725860371'
        # print(page_url)
        # 利用循环，将请求url批量放入队列1
        page_queue.put(page_url)

    # 创建生产者线程对象
    for i in range(5):
        # 调用类方法，实例化类
        th = Producer(page_queue, image_url_queue)
        # 调用父类start()方法
        th.start()

    # 创建消费者线程队列
    for i in range(10):
        # 取
        th = Customer(image_url_queue)
        th.start()
        
if __name__ == '__main__':
    start()

GitHub项目推荐--基于LLM的开源爬虫项目惟贤箬溪穷玩Ai github 爬虫
以下是一些基于大语言模型（LLM，LargeLanguageModel）的开源爬虫项目，它们结合了自然语言处理（NLP）技术与爬虫的功能，能在一定程度上提升爬取的智能化和精度。这些项目可以用于自动化抓取、内容提取、数据分析等任务。1.GPT-3WebScraper简介：这是一个基于OpenAIGPT-3模型的网页抓取工具，利用GPT-3的自然语言理解能力来生成有用的爬虫策略、处理网页内容并提取有价
PHP与Java的区别分析 Monika Zhang java 架构设计 php java 开发语言
一、语言特点php：一种的像Python的动态弱语言类型的服务器脚本语言，不需要编译代码；它是专为Web开发目的而开发和设计的，而且简单容易上手。Java：是一种通用的面向对象编程语言，属于强势优选语言类型，在执行前必须先正确编译。是面向对象的和人类可读的；支持服务器端和客户端；可用于开发独立应用程序或基于Web的应用程序，上手比PHP难。二、语法1.PHP是一种脚本语言，代码在服务器上执行，而结
闭包的概念总结与分析 Monika Zhang java java
1定义闭包又称词法闭包闭包最早定义为一种包含和的实体.在计算机科学中，闭包（英语：Closure），又称词法闭包（LexicalClosure）或函数闭包（functionclosures），是引用了自由变量的函数。解释一：闭包是引用了自由变量的函数，这个被引用的变量将和这个函数一同存在。解释二：闭包是函数和相关引用环境组成的实体。注：：除了局部变量的其他变量《Python核心编程》对闭包的解释:
毕业论文代码实验（Python\MATLAB）基于K-means聚类的EMD-BiLSTM-Attention光伏功率预测模型清风AI 毕业设计代码实现 python lstm 深度学习神经网络人工智能 matlab pytorch
一、项目背景1.1光伏功率预测意义在能源结构转型背景下（国家能源局2025规划），光伏发电渗透率已超过18%。但受天气突变、云层遮挡等因素影响，光伏出力具有显著波动性，导致：电网调度难度增加（±15%功率波动）电力市场交易风险提升光储协同控制效率降低1.2技术挑战多尺度特征耦合：分钟级辐照度变化与小时级天气模式共存非线性映射关系：气象因素与发电功率呈高阶非线性关系数据模态差异：数值天气预报(NWP
DeepSeek 部署指南 (使用 vLLM 本地部署) AGI大模型资料分享员人工智能语言模型学习 chatgpt 深度学习大模型 deepseek
DeepSeek部署指南(使用vLLM本地部署)本文档将指导您如何使用vLLM在本地部署DeepSeek语言模型。我们以deepseek-ai/DeepSeek-R1-Distill-Qwen-7B模型为例进行演示。1、安装Python环境首先，您需要安装Python环境。访问Python官网:https://www.python.org/根据您的操作系统选择安装包:Python官网提供Windo
Python基础知识点总结豆芽819 tip python 开发语言
1Python简介Python特点：解释型语言：无需编译，逐行执行。动态类型：变量类型在运行时确定。简洁易读：语法接近自然语言，代码简洁。跨平台支持：Windows/Linux/macOS均可运行。应用领域：Web开发、数据分析、人工智能、自动化脚本等。开发环境：推荐使用IDLE、PyCharm、VSCode或JupyterNotebook。2Python数值运算基本运算符：算术：+,-,*,/,
Python与区块链隐私保护技术：如何在去中心化世界中保障数据安全 Echo_Wish Python！实战！区块链 python 去中心化
Python与区块链隐私保护技术：如何在去中心化世界中保障数据安全在区块链世界里，透明性和不可篡改性是两大核心优势，但这也带来了一个悖论——如何在公开账本的同时保障用户隐私？如果你的交易记录对所有人可见，如何防止敏感信息泄露？Python作为区块链开发中最受欢迎的语言之一，提供了强大的工具和库来增强隐私保护。本文将深入探讨区块链的隐私保护技术，并结合Python代码示例，带你了解如何在Web3时代
人脸识别的一些代码饿了就干饭 CV相关人脸识别
1、cv2入门函数imread及其相关操作2、（详解）opencv里的cv2.resize改变图片大小Python3、机器学习之人脸识别face_recognition使用4、使用face_recognition进行人脸校准5、简单的人脸识别通用流程示意图（这个看着写的挺好的）6、face_recognition和图像处理中left、top、right、bottom解释7、使用pillow库对图片
Python从入门到精通的系统性学习路径 niuTaylor 编程区 python 学习开发语言
Python从入门到精通的系统性学习路径一、基础语法快速突破1.变量与基础操作#动态类型演示a=10#整型a=3.14#浮点型a="Python"#字符串a=[1,2,3]#列表#格式化输出进阶name="Alice"print(f"{name:*^20}")#居中填充输出：******Alice*******2.运算符优先级实战#常见运算符优先级练习result=5+3*2**2//(4%3)p
推荐开源项目：FastAPI Best Architecture — 极致的后端架构设计蓬玮剑
推荐开源项目：FastAPIBestArchitecture—极致的后端架构设计项目地址:https://gitcode.com/gh_mirrors/fa/fastapi_best_architecture项目简介在寻找一款基于FastAPI构建的强大且灵活的后端解决方案吗？那么，你已经找到了——FastAPIBestArchitecture。这是一个遵循前端与后端分离原则的中间件层解决方案，采
【SpringBoot】MorningBox小程序的完整后端接口文档爱因斯坦乐 spring boot 小程序 java
以下是「晨光宅配」小程序的完整接口文档，涵盖了所有12个表的接口。每个接口包括请求方法、URL、请求参数、响应格式和示例接口文档1.用户模块1.1获取用户信息URL:/user/{userId}方法:GET请求参数:userId(路径参数):用户ID响应格式:{"userId":1,"openid":"openid_123456","phone":"13800138000","nickname":
Python技术全景解析：从基础到前沿的深度探索靠近彗星 python 开发语言性能优化个人开发极限编程
目录一、Python为何成为开发者首选？1.核心优势矩阵2.性能进化史二、Python核心应用领域1.数据科学黄金三角2.AI开发新范式三、现代Python进阶技巧1.类型提示革命2.异步编程实战四、Python工程化实践1.现代项目架构2.性能优化矩阵五、Python未来生态展望1.前沿技术融合2.性能革命六、学习路线图1.技能成长路径基础阶段（1-3月）专业方向（3-6月）深度进阶（6-12月
如何使用DeepSeek编写测试用例？海姐软件测试 deepseek 大数据测试工具
一、DeepSeek在测试用例设计中的定位DeepSeek作为AI工具，并非直接替代测试设计，而是通过以下方式提升效率：快速生成基础用例框架（等价类、边界值等）智能补充易遗漏场景（如特殊字符、异常流）自动化脚本片段生成（Python/pytest/JUnit等）测试数据构造建议（符合业务规则的Mock数据）二、四步法实战：AI协作编写测试用例Step1：明确需求输入输入质量决定输出质量，需向Dee
Explore Model-Based Feature Importance 后端
Question1.ExploreModel-BasedFeatureImportanceThroughoutthisquestion,youmayonlyusePython.Foreachsub-question,providecommentary(ifneeded)alongwithscreenshotsofthecodeused.Pleasealsoprovideacopyofthecode
Python 标准库之 logging 模块 36度道 python系列学习笔记 python
1.logging模块简介在软件开发过程中，了解程序的运行状态、记录重要事件以及排查错误是至关重要的。logging模块为Python提供了灵活且强大的日志记录功能。它允许开发者控制日志的输出内容、输出位置（如文件、控制台）、日志级别（用于过滤不同重要程度的日志信息）等，帮助开发者更好地监控和调试程序。2.基本使用简单配置与输出：importlogging#配置日志基本设置logging.basi
python 标准库之 functools 模块 36度道 python系列学习笔记 python
functools模块提供了一系列用于处理函数的工具。其中，像partial可以创建一个新的可调用对象，这个对象固定了原函数的部分参数，有点像给函数穿上了“参数防护服”；reduce能对一个序列进行累积计算，就好比是一个勤劳的小会计，按顺序把序列里的数加起来或者做其他运算；wraps主要用于装饰器，它能帮助装饰器函数保留被装饰函数的元信息，比如函数名、文档字符串等，让被装饰函数“表里如一”。底层原
github如何为开源项目作出贡献 PXM的算法星球 github 开源
就在昨天，笔者取得了第一次开源项目贡献，虽然更新的内容很小，但是也算是迈出了第一步1.选择合适的开源项目（1）兴趣优先选择自己感兴趣的项目会更有动力参与，比如你喜欢前端开发，可以关注React、Vue相关的开源项目；如果喜欢后端，可以尝试贡献Django、SpringBoot等项目。（2）关注活跃度一个活跃的开源项目通常意味着更快的反馈和更友好的开发者社区。你可以通过以下方式判断：Issue更新频
Python——函数生如雪花 Python python
一、十进制小数转换成二进制小数【问题描述】编写程序，输入十进制小数（只考虑正数），把它转换为以字符串形式存储的二进制小数，输出该二进制小数字符串。对于转换得到的二进制小数，小数点后最多保留10位。小数点后不足10位，则输出这些位，尾部不补0；小数点后超出10位，则直接舍弃超出部分。【输入形式】十进制浮点小数【输出形式】对应输入小数的二进制小数字符串。若整数部分或者小数部分为0，则输出0。比如输入0
Python Web框架 Flask vs Django vs FastAPI ZengDerby python flask fastapi django
如果您需要构建大型的、功能丰富的应用程序，Django可能是一个很好的选择。如果您需要更灵活的框架，可以选择Flask来定制开发。而对于追求极致性能和高并发处理的项目，FastAPI可能是一个更加理想的选择。优缺点Flask在小型项目或微服务理想的选择。Flask灵活且轻量，非常适合快速开发小型应用。Flask是一个非常灵活的框架，它允许您根据项目需求进行定制。您可以根据需要选择合适的插件和扩展。
python if用法 IT技术土狗 python从入门到入狱 python
pythonif用法流程控制流程控制即控制流程，具体指控制程序的执行流程，而程序的执行流程分为三种结构：顺序结构（之前我们写的代码都是顺序结构）、分支结构（用到if判断）、循环结构（用到while与for）1、分支结构分支结构就是根据条件判断的真假去执行不同分支对应的子代码2、为什么需要分支结构人类某些时候需要根据条件来决定做什么事情，比如：如果今天下雨，就带伞所以程序中必须有相应的机制来控制计算
python与数值有关的问题 cbxjsdg python
1.复数的问题x=123+456j#后面没加j部分为实数，加j部分为虚数print('实数部分',x.real)#表示实数print('虚数部分',x.imag)#表示虚数2.查看数值的类型a=10b=10.0c=1.99E2#表示1.99*10的二次方的意思，这是科学计数法print('数值为',a,'数值类型为',type(a))print('数值为',b,'数值类型为',type(b))pr
【架构设计】前置知识 GIS程序媛—椰子架构设计架构设计
架构设计是软件开发的进阶技能，需要结合理论知识和实践经验。以下是掌握架构设计所需的前置知识及其重要性，以及学习路径建议：一、基础编程能力1.编程语言与核心概念掌握至少一门主流语言（如Java、Python、C#、Go等），理解其语法、特性及生态。核心概念：面向对象（OOP）、函数式编程（FP）、并发/异步、内存管理等。示例：通过Java理解接口、多态、设计模式。通过Go学习并发模型（Gorouti
Python, C ++开发家庭开支 Geeker-2025 python c++
开发一款**家庭开支数字化记录与结算App**是一个非常有意义的项目，旨在帮助家庭用户高效管理开支、记录消费、分析财务状况，并提供结算和预算管理功能。以下是基于**Python**和**C++**的开发方案，结合两者在数据处理、实时通信和系统开发中的优势。---##1.**项目需求分析**家庭开支数字化记录与结算App的核心功能包括：1.**用户管理**：-用户注册、登录，支持家庭成员管理。2.*
linux执行python脚本conda库_Pycharm使用远程linux服务器conda/python环境在本地运行的方法(图解）)... weixin_39992462
Pycharm使用远程linux服务器conda/python环境在本地运行的方法(图解))1.首先在PycharmTools->Deployment->Configurations打开新建SFTP输入host:ip地址username密码然后点击TestConnection出现下图，则测试成功因为已经连接成功，这时候已经可以读取远程服务器的目录了：2.选择项目mapping(可以跳过3.在Set
brew mysql client_Mac安装mysqlclient过程解析 weixin_39630440 brew mysql client
尝试在虚拟环境下通过pip安装：pipinstallmysqlclient然后报错：OSError:mysql_confignotfound找到官方文档https://github.com/PyMySQL/mysqlclient-python，解释说安装前需安装另一个模块：brewinstallmysql-connector-c但是报错：查看报错信息，在安装mysql-connector-c前先b
macos安装python-nodejs_MAC平台基于Python Appium环境搭建过程图解 weixin_39612038
前言最近笔者要为python+appium课程做准备，mac在2019年重新安装了一次系统，这次重新在mac下搭建appium环境，刚好顺带写个文稿给大家分享分享搭建过程。一、环境和所需软件概述1.1目前环境：MacOS(10.15.3)1.2所需软件:jdk-8u91-macosx-x64.dmg(jdk1.8及以上版本应该都可以)android-sdk_r24.4.1-macosx.zip(m
python接口自动化全世界最帅的男人 python 自动化开发语言
Python是一种非常流行的编程语言，也是许多接口自动化测试框架的首选语言。下面是一个简单的接口自动化测试框架的思路：1.安装必要的库和工具：在Python中，我们可以使用requests库来发送HTTP请求，使用unittest库来编写测试用例，使用HTMLTestRunner库来生成测试报告。此外，我们还需要安装一个代码编辑器，如PyCharm或VSCode。2.创建测试用例：编写测试用例是接
Python接口自动化花落同学 Python自动化从入门到放弃 python 自动化
4接口自动化4.1使用python实现接口自动化如果不了解接口测试可参考https://ke.qq.com/course/4092904使用Python的request库实现接口测试：importjsonimportrequests#使用session管理：#1.可以自动关联set-cookie里面的内容#2.可以加快与服务器的连接速度session=requests.session()#auth
Python异步编程：从基础到高级 CarlowZJ python 网络数据库
前言在现代软件开发中，异步编程已经成为一种必不可少的技能。Python的异步编程模型（基于asyncio）为开发者提供了一种高效的方式来处理高并发任务，而无需依赖多线程或多进程。异步编程不仅可以提高程序的性能，还能简化并发代码的复杂性。本文将带你从异步编程的基础概念出发，逐步深入到高级应用，帮助你掌握Python异步编程的核心技能。一、异步编程的基础概念1.1什么是异步编程？异步编程是一种编程范式
使用Java爬虫按关键字搜索1688商品小爬虫程序猿 java 爬虫开发语言
在电商领域，获取1688商品信息对于市场分析、选品上架、库存管理和价格策略制定等方面至关重要。1688作为国内领先的B2B电商平台，提供了丰富的商品数据。虽然1688开放平台提供了官方API来获取商品信息，但有时使用爬虫技术来抓取数据也是一种有效的手段。本文将介绍如何利用Java按关键字搜索1688商品，并提供详细的代码示例。一、准备工作1.Java开发环境确保你的Java开发环境已经安装了以下必
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio

生产者与消费者模式

1、生产者与消费者模式

2、线程间的通信

3、Queue线程安全队列

4、课堂案例（Queue在多线程中的使用）

5、课堂案例（多线程下载王者荣耀高清壁纸）

1）分析URL

2）爬取第一页壁纸的url

3）存储壁纸

4）多线程下载壁纸

你可能感兴趣的:(爬虫,django,python,后端)