PythonicCC

Python协程详解：从基础到实战

协程是Python中实现并发编程的重要方式之一，它比线程更轻量级，能够高效处理I/O密集型任务。本文将全面介绍协程的概念、原理、实现方式以及与线程、进程的对比，包含完整的效率对比代码和详细说明，帮助Python开发者深入理解并掌握协程技术。

1. 协程基础概念

1.1 什么是协程

协程(Coroutine)是Python中另外一种实现多任务的方式，它是一种比线程更小的执行单元，占用更少的资源。协程之所以被称为执行单元，是因为它自带CPU上下文。这意味着只要在合适的时机，我们可以把一个协程切换到另一个协程，只要在这个过程中保存或恢复CPU上下文，程序就可以继续运行。

通俗地说：在一个线程中的某个函数，可以在任何地方保存当前函数的一些临时变量等信息，然后切换到另外一个函数中执行（注意不是通过调用函数的方式做到的），并且切换的次数以及什么时候再切换到原来的函数都由开发者自己确定。

1.2 为什么需要协程

在传统多线程编程中，我们知道：

进程是资源分配的最小单位
线程是CPU调度的最小单位

虽然多线程已经提高了CPU利用率，但创建和管理线程/进程需要消耗系统资源。随着对效率的追求不断提高，基于单线程实现并发成为一个新的课题，即只用一个主线程（很明显可利用的CPU只有一个）情况下实现并发。这样可以节省创建线程/进程所消耗的时间。

1.3 并发的本质

并发的本质可以概括为：切换+保存状态

CPU正在运行一个任务，会在两种情况下切走去执行其他的任务（切换由操作系统强制控制）：

该任务发生了阻塞（如I/O操作）
该任务计算的时间过长（时间片用完）

其中第二种情况并不能提升效率，只是为了让CPU能够"雨露均沾"，实现看起来所有任务都被"同时"执行的效果。如果多个任务都是纯计算的，这种切换反而会降低效率。

2. 协程与线程的差异

在实现多任务时，线程切换从系统层面远不止保存和恢复CPU上下文这么简单。操作系统为了程序运行的高效性，每个线程都有自己缓存Cache等数据，操作系统还会帮你做这些数据的恢复操作。所以线程的切换非常耗性能。

相比之下，协程的切换只是单纯地操作CPU的上下文，所以一秒钟切换个上百万次系统都抗得住。具体差异如下：

特性	线程	协程
调度者	操作系统	用户程序
切换代价	高（涉及内核态切换）	低（用户态切换）
内存占用	较大（MB级）	极小（KB级）
并发数量	有限（千级）	极高（百万级）
数据同步	需要锁机制	无需加锁

3. Python协程的特点

必须在单线程里实现并发：协程的本质是单线程下的并发
修改共享数据不需加锁：因为是单线程，不存在竞争条件
用户程序自己保存多个控制流的上下文栈
自动I/O切换：一个协程遇到I/O操作自动切换到其它协程（需要gevent等模块支持）

4. Python协程的实现方式

4.1 yield模拟协程

Python中的生成器(generator)和yield关键字可以初步模拟协程的行为：

def consumer():
    while True:
        x = yield  # 接收send发送的值
        print(f"处理数据: {x}")

def producer():
    c = consumer()
    c.__next__()  # 启动生成器
    for i in range(5):
        print(f"生产数据: {i}")
        c.send(i)  # 发送数据给consumer

producer()

这段代码展示了生产者-消费者模型的基本协程实现。生产者通过send()方法将数据发送给消费者，消费者通过yield接收并处理数据。

4.2 Greenlet模块

Greenlet是一个更专业的协程实现，它提供了明确的切换方法：

from greenlet import greenlet
import time

def task1():
    print("执行任务1")
    gr2.switch()  # 切换到任务2
    print("任务1继续执行")
    gr2.switch()

def task2():
    print("执行任务2")
    gr1.switch()  # 切换回任务1
    print("任务2继续执行")

gr1 = greenlet(task1)
gr2 = greenlet(task2)
gr1.switch()  # 启动任务1

Greenlet的优点是切换明确，缺点是需要手动切换，无法自动识别I/O阻塞。

4.3 Gevent模块

Gevent是基于Greenlet的更高级协程库，它能够自动处理I/O阻塞：

import gevent
from gevent import monkey
monkey.patch_all()  # 打补丁，替换标准库中的阻塞式I/O

def fetch(url):
    print(f"获取 {url}")
    gevent.sleep(2)  # 模拟I/O操作
    print(f"{url} 返回数据")

def async_fetch():
    urls = ['url1', 'url2', 'url3']
    jobs = [gevent.spawn(fetch, url) for url in urls]
    gevent.joinall(jobs)

async_fetch()

Gevent的关键点：

monkey.patch_all()：替换Python标准库中的阻塞式I/O为Gevent的非阻塞版本
gevent.spawn()：创建协程任务
gevent.joinall()：等待所有协程完成

5. 协程效率对比测试

5.1 顺序执行 vs 协程执行

下面我们通过一个完整的例子来对比顺序执行和协程执行的效率差异：

from gevent import monkey
import gevent
import time
import requests

# 打补丁
monkey.patch_all()

# 测试URL
url = "https://www.baidu.com"

# 顺序执行
def sequential_fetch():
    start = time.time()
    for i in range(5):
        print(f"顺序请求 {i} 开始")
        response = requests.get(url)
        print(f"顺序请求 {i} 完成，状态码: {response.status_code}")
    print(f"顺序执行总耗时: {time.time() - start:.2f}秒")

# 协程执行
def coroutine_fetch():
    start = time.time()
    def fetch(i):
        print(f"协程请求 {i} 开始")
        response = requests.get(url)
        print(f"协程请求 {i} 完成，状态码: {response.status_code}")
    
    jobs = [gevent.spawn(fetch, i) for i in range(5)]
    gevent.joinall(jobs)
    print(f"协程执行总耗时: {time.time() - start:.2f}秒")

# 执行测试
print("=== 顺序执行测试 ===")
sequential_fetch()

print("\n=== 协程执行测试 ===")
coroutine_fetch()

执行结果分析：

顺序执行：每个请求依次执行，总耗时≈各请求耗时之和
协程执行：所有请求并发执行，总耗时≈最慢的单个请求耗时

5.2 线程 vs 协程效率对比

下面我们对比线程和协程在处理I/O密集型任务时的效率：

import threading
import time
import requests
from gevent import monkey
import gevent

monkey.patch_all()
url = "https://www.baidu.com"
n = 10  # 并发数量

# 线程方式
def thread_fetch():
    start = time.time()
    
    def fetch(i):
        response = requests.get(url)
        print(f"线程 {i} 完成")
    
    threads = []
    for i in range(n):
        t = threading.Thread(target=fetch, args=(i,))
        t.start()
        threads.append(t)
    
    for t in threads:
        t.join()
    
    print(f"线程方式总耗时: {time.time() - start:.2f}秒")

# 协程方式
def gevent_fetch():
    start = time.time()
    
    def fetch(i):
        response = requests.get(url)
        print(f"协程 {i} 完成")
    
    jobs = [gevent.spawn(fetch, i) for i in range(n)]
    gevent.joinall(jobs)
    print(f"协程方式总耗时: {time.time() - start:.2f}秒")

# 执行测试
print("=== 线程方式测试 ===")
thread_fetch()

print("\n=== 协程方式测试 ===")
gevent_fetch()

执行结果分析：

线程方式：创建线程有一定开销，线程切换需要内核参与
协程方式：协程创建和切换开销极小，完全在用户空间完成

5.3 不同并发量下的效率对比

我们测试不同并发量下协程的执行效率：

import time
from gevent import monkey
import gevent
import requests

monkey.patch_all()

def test_concurrency(concurrency):
    print(f"\n=== 并发数: {concurrency} ===")
    start = time.time()
    
    def task(i):
        requests.get("https://www.baidu.com")
        print(f"任务 {i} 完成", end=" | ")
    
    jobs = [gevent.spawn(task, i) for i in range(concurrency)]
    gevent.joinall(jobs)
    
    elapsed = time.time() - start
    print(f"\n并发数 {concurrency} 总耗时: {elapsed:.2f}秒")
    return elapsed

# 测试不同并发量
concurrency_levels = [10, 50, 100, 200, 500]
results = {}
for level in concurrency_levels:
    results[level] = test_concurrency(level)

# 打印结果对比
print("\n=== 结果汇总 ===")
for level, time_cost in results.items():
    print(f"并发数 {level}: {time_cost:.2f}秒")

预期结果：

小并发量时总耗时接近单个请求耗时
随着并发量增加，总耗时增长缓慢
协程可以轻松支持上千并发

6. 协程的实际应用

6.1 网络爬虫

协程特别适合网络爬虫这种I/O密集型应用：

import gevent
from gevent import monkey
monkey.patch_all()
import requests
from urllib.parse import urljoin
from bs4 import BeautifulSoup

base_url = "https://www.example.com"
visited = set()

def crawler(url):
    if url in visited:
        return
    visited.add(url)
    
    try:
        print(f"抓取: {url}")
        response = requests.get(url)
        soup = BeautifulSoup(response.text, 'html.parser')
        
        # 处理页面内容...
        print(f"从 {url} 找到 {len(soup.find_all('a'))} 个链接")
        
        # 发现新链接
        links = [urljoin(base_url, a['href']) for a in soup.find_all('a', href=True)]
        
        # 创建协程抓取新链接
        jobs = [gevent.spawn(crawler, link) for link in links if link.startswith(base_url)]
        gevent.joinall(jobs)
    except Exception as e:
        print(f"抓取 {url} 出错: {e}")

# 开始抓取
crawler(base_url)

6.2 Web服务器

使用协程可以轻松实现高并发的Web服务器：

from gevent.pywsgi import WSGIServer
from gevent import monkey
monkey.patch_all()

def application(env, start_response):
    path = env['PATH_INFO']
    
    if path == '/':
        start_response('200 OK', [('Content-Type', 'text/html')])
        return [b"Welcome
Hello from Gevent server!"]
    
    elif path == '/api/data':
        # 模拟数据库查询
        gevent.sleep(1)
        start_response('200 OK', [('Content-Type', 'application/json')])
        return [b'{"data": [1, 2, 3]}']
    
    else:
        start_response('404 Not Found', [('Content-Type', 'text/html')])
        return [b"404 Not Found"]

if __name__ == '__main__':
    print("Server running on http://localhost:8000")
    server = WSGIServer(('0.0.0.0', 8000), application)
    server.serve_forever()

6.3 数据库操作

协程化的数据库操作可以显著提高并发性能：

import gevent
from gevent import monkey
monkey.patch_all()
import pymysql
from DBUtils.PooledDB import PooledDB

# 创建数据库连接池
db_pool = PooledDB(
    creator=pymysql,
    host='localhost',
    user='root',
    password='123456',
    db='test',
    maxconnections=20
)

def query_user(user_id):
    conn = db_pool.connection()
    try:
        with conn.cursor() as cursor:
            sql = "SELECT * FROM users WHERE id = %s"
            cursor.execute(sql, (user_id,))
            result = cursor.fetchone()
            print(f"查询到用户 {user_id}: {result}")
            return result
    finally:
        conn.close()

# 并发查询多个用户
user_ids = [1, 2, 3, 4, 5]
jobs = [gevent.spawn(query_user, uid) for uid in user_ids]
gevent.joinall(jobs)

7. 协程与多线程、多进程的对比

7.1 完整对比表格

特性	进程	线程	协程
创建开销	大(10+MB)	中(1MB左右)	极小(几KB)
切换开销	高(微秒级)	中(微秒级)	低(纳秒级)
内存占用	独立内存空间	共享进程内存	共享线程内存
数据共享	IPC机制	全局变量	全局变量
并发数量	数十个	数百个	数十万个
CPU利用	多核	多核(受GIL限制)	单核
适用场景	CPU密集型	I/O+少量CPU	I/O密集型
编程复杂度	高	中(需同步)	低
稳定性	高(隔离性好)	中(一个线程崩溃影响整个进程)	中(一个协程出错可能影响其他协程)

7.2 性能对比测试

下面我们通过一个完整的测试来对比进程、线程和协程的性能差异：

import time
import multiprocessing
import threading
from gevent import monkey
import gevent

monkey.patch_all()

# 测试任务：模拟I/O密集型操作
def task(n):
    gevent.sleep(1)  # 模拟I/O操作
    return n * n

# 进程方式
def process_way():
    start = time.time()
    pool = multiprocessing.Pool(processes=10)
    results = pool.map(task, range(10))
    pool.close()
    pool.join()
    print(f"进程方式 结果: {results} 耗时: {time.time() - start:.2f}秒")

# 线程方式
def thread_way():
    start = time.time()
    threads = []
    results = []
    
    def worker(n):
        results.append(task(n))
    
    for i in range(10):
        t = threading.Thread(target=worker, args=(i,))
        t.start()
        threads.append(t)
    
    for t in threads:
        t.join()
    
    print(f"线程方式 结果: {results} 耗时: {time.time() - start:.2f}秒")

# 协程方式
def coroutine_way():
    start = time.time()
    jobs = [gevent.spawn(task, i) for i in range(10)]
    gevent.joinall(jobs)
    results = [job.value for job in jobs]
    print(f"协程方式 结果: {results} 耗时: {time.time() - start:.2f}秒")

# 执行测试
print("=== 进程方式测试 ===")
process_way()

print("\n=== 线程方式测试 ===")
thread_way()

print("\n=== 协程方式测试 ===")
coroutine_way()

预期结果：

进程方式：耗时≈1秒，但创建进程开销大
线程方式：耗时≈1秒，受GIL影响
协程方式：耗时≈1秒，但资源占用最少

8. 协程最佳实践

8.1 避免CPU密集型任务

协程不适合纯CPU计算任务，下面是一个反面例子：

import time
from gevent import monkey
import gevent

monkey.patch_all()

# CPU密集型任务
def cpu_intensive(n):
    result = 0
    for i in range(n):
        result += i * i
    return result

# 测试协程执行CPU密集型任务
def test_coroutine_cpu():
    start = time.time()
    jobs = [gevent.spawn(cpu_intensive, 1000000) for _ in range(10)]
    gevent.joinall(jobs)
    print(f"协程执行CPU密集型任务耗时: {time.time() - start:.2f}秒")

# 测试顺序执行
def test_sequential_cpu():
    start = time.time()
    results = [cpu_intensive(1000000) for _ in range(10)]
    print(f"顺序执行CPU密集型任务耗时: {time.time() - start:.2f}秒")

print("=== CPU密集型任务测试 ===")
test_coroutine_cpu()
test_sequential_cpu()

结论：对于CPU密集型任务，协程不会带来性能提升，反而可能因为切换开销而降低性能。

8.2 合理控制并发量

虽然协程很轻量，但也需要合理控制并发量：

from gevent import monkey
import gevent
import requests
import time

monkey.patch_all()

def fetch(url, semaphore):
    with semaphore:  # 控制并发量
        print(f"开始请求 {url}")
        response = requests.get(url)
        print(f"完成请求 {url} 状态码: {response.status_code}")

def controlled_concurrency(url, concurrency=10, total=100):
    start = time.time()
    semaphore = gevent.pool.Semaphore(concurrency)  # 并发信号量
    jobs = [gevent.spawn(fetch, url, semaphore) for _ in range(total)]
    gevent.joinall(jobs)
    print(f"总请求数: {total} 并发数: {concurrency} 总耗时: {time.time() - start:.2f}秒")

# 测试不同并发控制
url = "https://www.baidu.com"
controlled_concurrency(url, concurrency=10, total=100)
controlled_concurrency(url, concurrency=20, total=100)
controlled_concurrency(url, concurrency=50, total=100)

8.3 异常处理

正确处理协程中的异常：

import gevent
from gevent import monkey
monkey.patch_all()

def successful_task():
    return "成功完成任务"

def failing_task():
    raise Exception("任务执行失败")

def handle_exceptions():
    jobs = [
        gevent.spawn(successful_task),
        gevent.spawn(failing_task),
        gevent.spawn(successful_task)
    ]
    
    gevent.joinall(jobs)
    
    for job in jobs:
        if job.successful():
            print(f"任务结果: {job.value}")
        else:
            print(f"任务失败: {job.exception}")

print("=== 异常处理测试 ===")
handle_exceptions()

9. 常见问题解答

Q: 协程能利用多核CPU吗？
A: 单个协程不能，因为它在单线程中运行。但可以通过多进程+协程的方式利用多核，例如每个进程运行一个事件循环。

Q: 协程会取代线程吗？
A: 不会完全取代。协程适合I/O密集型场景，线程适合需要利用多核或与C扩展交互的场景。最佳实践是根据需求选择合适的并发模型。

Q: Gevent的monkey patch安全吗？
A: 在大多数情况下是安全的，但应注意：

尽早调用monkey.patch_all()
避免与其他修改标准库的库同时使用
生产环境中先充分测试

Q: 如何调试协程程序？
A: 调试协程程序可以使用：

打印日志
gevent.getcurrent()获取当前协程
使用支持协程的调试器如PyCharm专业版

10. 总结

协程是Python中强大的并发编程工具，特别适合I/O密集型应用。通过本文的完整介绍和代码示例，我们了解了：

协程的基本概念和原理
Python中实现协程的三种方式：yield、greenlet、gevent
完整的效率对比测试代码和结果分析
协程在实际项目中的应用场景
协程与线程、进程的详细对比
协程编程的最佳实践和常见问题

掌握协程技术可以让你的Python程序在处理高并发时更加高效和优雅。希望本文能帮助你全面理解Python协程，并在实际项目中灵活应用。

一个简单测试Deepseek吞吐量的脚本,国内环境可跑谢平康深度学习 pytorch 人工智能
一个简单测试Deepseek吞吐量的脚本,这里用DeepSeek-R1-Distill-Qwen-32B,支持单卡409024G可跑,具体看你的硬件情况做调整,理论支持所有的模型,看你需要,可以修改模型名称,重点是pip使用国内的源,模型下载用阿里的ModelScope,无障碍下载,使用.最后可以生成一个txt与html报表.前提是你安装了python与python-venv,你可以不用venv来
OpenCV图像添加水印
一、前言在数字图像处理中，为图片添加水印是一项常见且重要的技术。无论是版权保护、品牌宣传还是防止未经授权的使用，水印都能发挥重要作用。OpenCV作为一款强大的计算机视觉库，提供了丰富的功能来实现各种水印效果。本教程将详细介绍如何使用OpenCV为图像添加文字水印和图片水印。二、环境准备在开始之前，请确保已安装以下环境：Python3.xOpenCV库（可通过pipinstallopencv-py
Ast解析Python代码示例 X1A0RAN python 开发语言
#-*-coding:utf-8-*-#@Desc:Ast代码解析示例importastclassCodeParse():def__init__(self):self.visited_nodes=set()#解析装饰器defparse_decorator(self,decorator):returnast.dump(decorator)#解析函数defparse_func(self,node,st
Python编程实战：爬虫与数据可视化的全过程草莓味儿柠檬
本文还有配套的精品资源，点击获取简介：本项目通过Python编程实现网络数据爬取和数据可视化，适合初学者深入了解Python。我们将涵盖基础语法、网络爬虫技术、数据处理、可视化技术、文件操作和错误处理等关键知识点，最终完成从爬取各省降水量数据到可视化展示的全过程。1.Python基础语法使用Python作为一门流行的编程语言，因其简洁和易读性被广泛应用于网络爬虫、数据处理和可视化等领域。本章将帮助
GESP认证C++编程真题解析 | GESP202409 三级单选题和判断题热爱编程的通信人历年GESP CSP-J CSP-S真题解析 c++开发语言
欢迎大家订阅我的专栏：算法题解：C++与Python实现！本专栏旨在帮助大家从基础到进阶，逐步提升编程能力，助力信息学竞赛备战！专栏特色1.经典算法练习：根据信息学竞赛大纲，精心挑选经典算法题目，提供清晰的代码实现与详细指导，帮助您夯实算法基础。2.系统化学习路径：按照算法类别和难度分级，从基础到进阶，循序渐进，帮助您全面提升编程能力与算法思维。适合人群：准备参加蓝桥杯、GESP、CSP-J、CS
LeetCode 学习day3 不喜勿喷小小小新人12123 leetcode 学习算法 python
题目：给定一个数组prices，它的第i个元素prices[i]表示一支给定股票第i天的价格。你只能选择某一天买入这只股票，并选择在未来的某一个不同的日子卖出该股票。设计一个算法来计算你所能获取的最大利润。返回你可以从这笔交易中获取的最大利润。如果你不能获取任何利润，返回0。（LeetCode121.买卖股票的最佳时机）问题分析：简而言之为求最大差Python代码：importnumpyasnpc
基于python的公众号文章爬取思路（总结版）大数据小学僧 python 开发语言爬虫微信公众平台
目录一、技术方案分类1.接口直连模式（推荐）2.网页解析模式3.第三方API模式二、核心技术栈三、爬虫实现步骤1.接口直连模式（微信公众平台API）2.网页解析模式（搜狗微信搜索）3.第三方API模式（如清博大数据）四、可视化界面实现五、数据存储方案六、高级技巧七、注意事项八、推荐工具链一、技术方案分类1.接口直连模式（推荐）2.网页解析模式3.第三方API模式二、核心技术栈三、爬虫实现步骤1.接
python-拆解sklearn中决策树 weixin_41177022 scikit-learn 决策树 python 机器学习编程
获取树结构实体对scikit-learn中DecisionTreeClassifier/Regressor的实例调用.tree_属性可以得到树结构。参考sklearn的决策树的官方说明sklearn.tree.DecisionTreeClassifier（不过里面说的help(sklearn.tree._tree.Tree)似乎不管用）获取决策树基本信息node总数可以用model.tree_.n
从决策树到随机森林：Python机器学习里的“树形家族“深度实战与原理拆解小张在编程机器学习决策树随机森林
引言在机器学习的算法森林中，有一对"树形兄弟"始终占据着C位——决策树像个逻辑清晰的"老教授"，用可视化的树状结构把复杂决策过程拆解成"是/否"的简单判断；而它的进阶版随机森林更像一支"精英军团"，通过多棵决策树的"投票表决"，在准确性与抗过拟合能力上实现了质的飞跃。无论是医疗诊断中的疾病预测，还是金融风控里的违约判别，这对组合都用强大的适应性证明着自己的"算法常青树"地位。今天，我们就从原理到实
python abc模块_Python -- abc module weixin_39727743 python abc模块
1.ABC模块作用Python本身不提供抽象类和接口机制，想要实现抽象类，可以借助abc模块。ABC是AbstractBaseClass的缩写，是用来定义抽象类的，具体的介绍请参考PEP3119。2.模块中的类和函数介绍abc.ABCMeta，用来生成抽象基础类的元类。由它生成的类可以被直接继承。register首先注册一个abc的虚拟子类fromabcimportABCMetaclassMyAB
git的author和commiter的修改 weixin_34161032 git 开发工具 python
2019独角兽企业重金招聘Python工程师标准>>>git的author和commiter的修改.git的文件夹，进去，就会看到有一个config文件,编辑,加上===========================================[user]#设置用户名name=xxx#设置用户的邮箱[email protected],=========================
python abc模块
面向对象的设计中，抽象类，接口这些必不可少的东西，在python中是如何提现的呢？python作为一个动态语言，没有强类型的检查，而是以鸭子类型的方式提现，在执行的时候python不严格要求你必须是继承指定的父类而来，只要在调用的时候你有相应的方法和属性就可以了，长的像鸭子你就是鸭子。也正是基于python这样的特性，python中没有interface的概念，有说interface并不是普遍存在
Python collections.abc模块介绍 qq_27390023 python 开发语言
collections.abc是Python标准库中的一个模块，提供了一系列抽象基类（AbstractBaseClasses,ABCs），用于定义和检查容器类型（如序列、映射、集合等）的接口。这些抽象基类为常见的数据结构提供了统一的接口和行为规范，使得开发者可以更方便地实现和使用这些数据结构。1.collections.abc的作用collections.abc模块的主要作用是提供一组抽象基类，用
python abc 模块小公鸡卡哇伊呀~ python
abc：abstractbaseclass抽象基类，用法例子：fromabcimportABCMeta,abstractmethodclassAnimal(metaclass=ABCMeta):defwalk(self):print("Walking...")@abstractmethoddefnum_legs(self):passclassDog(Animal):def__init__(self
【Python】abc 模块：定义抽象基类（Abstract Base Classes）的工具彬彬侠 Python基础 python abc ABCMeta abstractmethod
Python的abc模块（AbstractBaseClasses，抽象基类）是标准库中用于定义抽象基类的工具，旨在为面向对象编程提供一种标准化的方式来定义接口、强制子类实现特定方法，并支持类型检查。abc模块特别适合需要明确接口定义的场景，例如框架开发、插件系统或大型项目。本文详细介绍abc模块的定义、核心组件、使用方法、实际应用场景、注意事项以及与元类的关系。1.什么是abc模块？abc模块是P
PYTHON从入门到实践9-类和实例
#【1】面向对象编程classStudent(object):#可以帮属性值绑定到对象上，self相当于JAVA的thisdef__init__(self,name,age):self.name=nameself.age=agedefspeak(self):print(self.name,'说：老师好')if__name__=='__main__':new_student1=Student('球球
Python | 期末复习具体知识点(hbut 邵光普）我推是大富翁 python python
Python复习具体知识点1、表达式not3or6的值:在Python中，not3or6这个表达式的含义可以分解为以下步骤来理解：not3：not是一个逻辑运算符，用于对一个布尔值进行取反。但在这里，它作用于一个整数值3。在Python中，任何非零数值都被视为True，因此not3会被转换为False。Falseor6：接下来，or运算符会检查其左侧的值。如果左侧为False（或任何被视为Fals
从Python到数据结构：为什么这是每个自学者必经的进阶之路流水煮香茗 python 数据结构 mooc
当你熟练掌握Python语法后，下一步应该学什么？答案是数据结构。本文将深入分析为什么数据结构是编程进阶的关键，以及如何选择合适的学习资源。一、Python学会了，然后呢？如果你正在读这篇文章，很可能你已经：用Python写过小工具，能解决工作和生活中的一些小需求做过数据分析，会用pandas处理Excel表格但是，当你想要进一步提升时，却发现了一些困惑：困惑1：代码能跑，但总觉得"不够优雅"你的
python ks值计算_风控模型中的K-S理解以及python实现 weixin_39747293 python ks值计算
笔者在工作中计算单变量的ks值时，发现几个分布不同的变量好y计算的ks值相同，凭借统计直觉，发现一定存在问题，笔者从数据和计算ks代码两个方向进行排除。最后定位到计算使用stats.ks_2samp()函数计算ks值时，如果变量存在缺失值，计算得到ks值有误，下面笔者就来好好梳理一下ks值的前世今生。ks检验介绍笔者刚入门机器学习开始做的例子就是金融场景下风控模型。那时评价模型的好坏就用传统的机器
庙算兵棋推演AI开发初探（支线-AI平台注意及tips）超自然祈祷智能决策人工智能
总是停留在stage阶段一的问题输出回放数据，在显示中发现一动不动，发现stage字段一直是1部署阶段……解决方法：代码层面需要有type=333的行为告诉引擎部署完毕。pip卸载重装兵棋引擎这个我每次关机后都得重新来一遍，很讨厌（经过试验，此举会重新复制一个.engine_config到python包的目录）删除某文件确定发出了部署命令还没效果，看看你的用户根目录(root或者用户名)下有没有.
Python 中 `while` 循环在游戏开发中的具体应用：实战案例解析黄豆匿zlib python pygame 开发语言
在游戏开发中，while循环是一种非常强大的工具，尤其适用于控制游戏的主循环、处理用户输入、模拟角色状态变化等场景。通过具体的例子，我们可以更清楚地理解while循环在游戏开发中的具体应用。今天，就让我们通过一些实战案例来深入探讨while循环的使用。一、游戏主循环游戏主循环是游戏开发中最常见的while循环应用场景。主循环负责处理游戏的每一帧，包括事件处理、状态更新和画面渲染。示例：简单的Pyg
Python爬虫实战：研究Bleach库相关技术 ylfhpy 爬虫项目实战 python 爬虫 php 开发语言 Bleach
1.引言在大数据时代，网络内容采集已成为信息获取的重要手段。Python凭借其丰富的爬虫库（如Requests、Scrapy）和灵活的数据处理能力，成为网页爬虫开发的首选语言。然而，从互联网获取的内容往往包含恶意脚本、不安全标签等安全隐患，直接使用可能导致XSS(跨站脚本攻击)、数据泄露等风险。Bleach作为专业的HTML净化库，通过白名单机制提供了可靠的内容安全过滤方案。本文将结合实际案例，详
Python爬虫实战：研究untangle库相关技术 ylfhpy 爬虫项目实战 python 爬虫 php 开发语言 untangle
1.引言在大数据时代，网络数据已成为重要的信息资源。XML和HTML作为互联网上最常用的数据表示格式，广泛应用于API接口、网站结构和数据交换等场景。Python凭借其丰富的爬虫库（如Requests、Scrapy）和灵活的数据处理能力，成为网络数据采集的首选语言。然而，从复杂的XML/HTML文档中提取结构化数据仍然面临诸多挑战，如文档结构多样性、动态内容渲染和数据格式转换等问题。Untangl
Python LDAP库在Windows 64位环境中的应用规则哥讲规则
本文还有配套的精品资源，点击获取简介：PythonLDAP库是一个开源模块，它让Python开发者能够与LDAP服务器进行交互，执行操作如连接、查询、修改目录信息等。该库针对Python3.6和3.7版本优化，并适用于Windows64位架构。解压缩后，可以通过pip安装至项目中，实现集中式身份验证和数据管理功能。1.LDAP技术与Python交互概述LDAP（轻量级目录访问协议）是一种应用广泛的
【PyTorch】2024保姆级安装教程-Python-（CPU+GPU详细完整版）金枝玉叶9 程序员知识储备1 程序员知识储备2 程序员知识储备3 python pytorch 人工智能
【PyTorch】2024保姆级安装教程（CPU+GPU详细完整版）PyTorch是当前最受欢迎的深度学习框架之一。本文将详细讲解在Python环境中安装PyTorch，包括CPU和GPU版本的全方位指南。一、前置环境首先确保已安装Python环境，推荐使用Python3.8或以上版本。验证Python安装：python--versionpip--version推荐使用虚拟环境（如conda或ve
掌握Python与LDAP在域认证中的应用 seiji morisako
本文还有配套的精品资源，点击获取简介：信息技术领域中的域认证机制利用LDAP协议实现用户身份验证。Python脚本语言通过python-ldap库与LDAP服务器交互，执行用户认证。本文将详细介绍Python如何使用python-ldap库进行LDAP连接、搜索、绑定操作，以及如何处理Web开发中的Cookie。学习这些技能有助于构建安全的用户登录系统和提升Web应用的用户体验。1.LDAP协议基
AMR解析器:CAMR的使用您的通讯录好友人工智能 AMR CLEVE 自然语言处理
1.下载gitclonehttps://github.com/Juicechuan/AMRParsing.gitcondacreate-ncamrpython=2.7-ycondaactivatecamr./scripts/config.sh然后下载本章顶部的LDC2014T12模型并解压。tar-xvzfamr-anno-1.0.train.m.tar.gz这里需要下载一个预处理模型。https
C++11 lambda 顾小玙 c++开发语言
前言在Cpp11以前，为了把函数当作对象调用，可以使用C中的函数指针类型，也可以使用Cpp98的仿函数。但二者都不是很好用，函数指针return_type(*name)(parameters)的长相就令人望而却步，仿函数将一个函数重载为一个类的operator()的方式又沉重麻烦。C++11中做出了(抄Python的)更灵活、轻便的lambda表达式。lambda表达式lambda表达式是一个匿名
机器学习中的数学：数学建模常用知识点-1 数字化与智能化机器学习中的数学机器学习凸函数泰勒公式 Jensen 不等式
一、凸函数1、凸函数讲解设函数f(x)是定义在区间X上的函数，若对于区间上任意两点x1、x2和任意实数��∈(0,1)，总有如下表达式成立：则称为f(x)是X上的凸函数；反之，如果下式成立：则称为f(x)在X上的凹函数。如图所示：Python实现凸函数：importnumpyasnpimportmatplotlib.pyplotasplt#定义凸函数defconvex_function(x):re
2025年AI编程工具推荐小猴崽 AI编程 AI编程 ai编程
以下基于2025年权威技术报告、开发者社区评测及厂商白皮书，对当前主流AI编程工具进行客观综述与推荐。数据来源包括IDC《2025中国生态告》、信通院《AI辅助编程技术成熟度评》、StackOverflow开发者调查及头部企业实测案例。一、国际主流AI编程工具GitHubCopilotX核心能力：基于GPT-4模型升级，支持37种编程语言（Python/Java/JS等），可解析数万行代码库的全局
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite