书山压力大EEE

12.asyncio并发编程

1. 事件循环

asyncio是python3.4以后引进的用于解决异步io编程的一整套解决方案

tornado、gevent、twisted(scrapy、django channels)都使用了asyncio

讲解asyncio的简单使用:

import asyncio
import time


async def get_html(url):
    print('start get url')
    await asyncio.sleep(2)     # 必须加await实现协程   这里asyncio.sleep(2)是一个子协程，time.sleep不能可await搭配. 
    print('end get url')


if __name__ == '__main__':
    start_time = time.time()
    loop = asyncio.get_event_loop()         # 开始事件循环
    loop.run_until_complete(get_html('http://baidu.com'))   # 阻塞式的， 类似多线程的join
    print(time.time() - start_time)

运行结果：

start get url
end get url
2.0011332035064697

如果将上面代码中await asyncio.sleep(2)改为time.sleep(2) 代码运行不会报错，而且结果一样。但在协程中不要运行同步代码，只要有同步代码，协程并发效果立马作废。
我们以同时多个任务为例：
asyncio.sleep(2)

import asyncio
import time


async def get_html(url):
    print('start get url')
    await asyncio.sleep(2)     # 必须加await实现协程   这里asyncio.sleep(2)是一个子协程，time.sleep不能可await搭配.
    print('end get url')


if __name__ == '__main__':
    start_time = time.time()
    loop = asyncio.get_event_loop()         # 开始时间循环
    tasks = [get_html('http://baidu.com') for i in range(10)]
    loop.run_until_complete(asyncio.wait(tasks))   # 多任务使用asyncio.await
    print(time.time() - start_time)

运行结果依然是2s:

start get url
start get url
start get url
start get url
start get url
start get url
start get url
start get url
start get url
start get url
end get url
end get url
end get url
end get url
end get url
end get url
end get url
end get url
end get url
end get url
2.004601001739502

只将await asyncio.sleep(2) 改为time.sleep(2)运行结果如下:

start get url
end get url
start get url
end get url
start get url
end get url
start get url
end get url
start get url
end get url
start get url
end get url
start get url
end get url
start get url
end get url
start get url
end get url
start get url
end get url
20.024510860443115

明显的使用time.sleep导致并发效果作废。
所以类似的，在使用asyncio的时候，有很多库的使用必须找到并发的asyncio版本，不要使用同步版的。

如何获取返回值

asyncio.ensure_future或者loop.create_task获取future，再通过future获取返回值。类似多线程
我更改上一段代码为例讲解获取返回值以及使用回调函数：

import asyncio
import time
from functools import partial  
# 偏函数  专门用来解决 当以函数名作为传入参数，但无法再传入传入函数的参数的问题。比如下面的add_done_callback


async def get_html(url):
    print('start get url')
    await asyncio.sleep(2)     # 必须加await实现协程   这里asyncio.sleep(2)是一个子协程，time.sleep不能可await搭配.
    # time.sleep(2)  # 不会报错， 但在协程里不要使用同步的io操作
    print('end get url')
    return 'cannon'


# 回调函数必须有个future传入参数，否则会报错。 这与add_done_callback函数有关
def callback(url, future):  # 回调函数， 如果有传入参数， 必须放在future前面。这点比较特殊
    print(url)


if __name__ == '__main__':
    start_time = time.time()
    loop = asyncio.get_event_loop()         # 开始时间循环
    get_future = asyncio.ensure_future(get_html('http://baidu.com')) # 类似多线程得到的future
    # 或者get_future = loop.create_task(get_html('http://baidu.com'))

    # get_future.add_done_callback(callback)   # 执行完以后执行callback
    get_future.add_done_callback(partial(callback, 'www.baidu.com'))   # callback如果要传入参数， 使用partial实现
    loop.run_until_complete(get_future)
    print(get_future.result())    # future的result方法得到返回值， 类似多线程ThreadPoolExecutor

运行结果:

start get url
end get url
www.baidu.com     # 回调callback
cannon            # 获取的返回值

多任务wait和gather方法

在区分time.sleep与await asyncio.sleep 在协程中的区别时，讲解使用了wait方法的多任务:

loop.run_until_complete(asyncio.wait(tasks))

而gather的基本用法只需要这么改:

loop.run_until_complete(asyncio.gather(*tasks))
或

task = asyncio.gather(*tasks)
loop.run_until_complete(asyncio.gather(task))

那么gather与wait的区别是什么呢？如何对它两进行选择呢？

gather更加high-level高层， gather除了多任务外，还可以对任务进行分组。优先使用gather
代码举例：

import asyncio
import time
from functools import partial


async def get_html(url):
    print('start get url', url)
    # 必须加await实现协程   这里asyncio.sleep(2)是一个子协程，time.sleep不能可await搭配.
    await asyncio.sleep(2)
    # time.sleep(2)  # 不会报错， 但在协程里不要使用同步的io操作
    print('end get url')
    return 'cannon'


def callback(url, future):
    print(url)


if __name__ == '__main__':
    start_time = time.time()
    loop = asyncio.get_event_loop()         # 开始时间循环

    tasks1 = [get_html('http://baidu.com') for i in range(3)]
    tasks2 = [get_html('http://google.com') for i in range(3)]
    group1 = asyncio.gather(*tasks1)    # gather可以进行分组
    group2 = asyncio.gather(*tasks2)
    loop.run_until_complete(asyncio.gather(group1, group2))
    print(time.time() - start_time)

运行结果：

start get url http://baidu.com
start get url http://baidu.com
start get url http://baidu.com
start get url http://google.com
start get url http://google.com
start get url http://google.com
end get url
end get url
end get url
end get url
end get url
end get url
2.002768039703369

2. task取消和子协程调用原理

取消task

代码讲解:

import asyncio


async def get_html(sleep_times):
    print('waiting')
    await asyncio.sleep(sleep_times)
    print('done after {}s'.format(sleep_times))


if __name__ == '__main__':
    task1 = get_html(1)
    task2 = get_html(2)
    task3 = get_html(3)
    tasks = [task1, task2, task3]

    loop = asyncio.get_event_loop()

    try:
        loop.run_until_complete(asyncio.wait(tasks))
    except KeyboardInterrupt as e:     # ctl + c  终止时，会进入
        all_tasks = asyncio.Task.all_tasks()   # 得到所有task
        for task in all_tasks:
            print('cancel task')
            print(task.cancel())  # stop成功会返回True
        loop.stop()            # 源码中只是_stop置为True
        loop.run_forever()   # stop之后必须调用run_forever,否则会报错
    finally:
        loop.close()        # 会做很多终止工作， 详情可看源码

运行过程中按ctl+c，得到结果:

waiting
waiting
waiting
done after 1s
done after 2s
^Ccancel task  # ctl + c 进入
True
cancel task
False     # task1已经执行完，所以无法取消
cancel task
False       # task2已经执行完，所以无法取消
cancel task
True        # task3取消完成

子协程调用原理

来看一段官网的代码：

在理解该代码后，我们再看协程的调用时序图：

3. call_soon,call_at,call_later,call_soon_threadsafe的使用

call_soon 立即执行函数

import asyncio

def callback(sleep_times):
    print('sleep {} sucess'.format(sleep_times))

def stoploop(loop):  # 停止loop
    loop.stop()


if __name__ == '__main__':
    loop = asyncio.get_event_loop()
    loop.call_soon(callback, 2)
    loop.call_soon(stoploop, loop)   # 停止forever
    loop.run_forever()

运行结果

sleep 2 sucess

call_later 按等待时间执行函数

import asyncio


def callback(sleep_times):
    print('sleep {} sucess'.format(sleep_times))


def stoploop(loop):   # 停止loop
    loop.stop()


if __name__ == '__main__':
    loop = asyncio.get_event_loop()
    loop.call_later(1, callback, 2)     # 过1秒执行
    loop.call_later(2, callback, 1)     # 过2秒执行
    loop.call_later(3, callback, 3)     # 过3秒执行
    loop.call_later(4, stoploop, loop)  # 过4秒执行, 并停止loop
    loop.call_soon(callback, 4)    # 最早执行， call_soon先于call_later
    loop.run_forever()

运行结果：

sleep 4 sucess
sleep 2 sucess
sleep 1 sucess
sleep 3 sucess

call_at 在指定时间执行

import asyncio


def callback(loop):
    print('loop time: {} '.format(loop.time()))


def stoploop(loop):
    loop.stop()


if __name__ == '__main__':
    loop = asyncio.get_event_loop()
    now = loop.time()  # loop的当前时间(内部时钟时间)， 不可以用time.time
    loop.call_at(now+2, callback, loop)   # 效果和call_later一样， call_later内部其实调用了call_later
    loop.call_at(now+1, callback, loop)
    loop.call_at(now+3, callback, loop)
    loop.call_later(4, stoploop, loop)  # stop loop
    loop.run_forever()

运行结果:

loop time: 51020.220300657
loop time: 51021.219093865
loop time: 51022.220433824

call_soon_threadsafe 线程安全的call_soon

call_soon_threadsafe用法和call_soon一致。但在涉及多线程时，会使用它.

call_soon,call_later,call_at,call_soon_threadsafe都是比较底层的，在正常使用时很少用到。

4. ThreadPollExecutor 和 asycio完成阻塞io请求

什么时候使用多线程：在协程中集成阻塞io

ThreadPollExecutor 和 asycio结合的使用方法:

import asyncio
from concurrent.futures import ThreadPoolExecutor

import socket
from urllib.parse import urlparse
import time


def get_url(url):
    # 通过socket请求html
    url = urlparse(url)
    host = url.netloc
    path = url.path
    if path == "":
        path = '/'

    # 建立socket连接
    client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    client.connect((host, 80))

    client.send(
        "GET {} HTTP/1.1\r\nHost:{}\r\nConnection:close\r\n\r\n".format(path, host).encode('utf8'))
    data = b""
    while True:
        d = client.recv(1024)
        if d:
            data += d
        else:
            break

    data = data.decode('utf8')
    html_data = data.split('\r\n\r\n')[1]  # 把请求头信息去掉， 只要网页内容
    print(html_data)
    client.close()


if __name__ == '__main__':
    start_time = time.time()
    loop = asyncio.get_event_loop()
    executor = ThreadPoolExecutor(3)    # 线程池 放3个线程
    tasks = []
    for url in range(20):
        url = 'http://shop.projectsedu.com/goods/{}/'.format(url)
        task = loop.run_in_executor(executor, get_url, url)   # 阻塞的代码放到线程池
        tasks.append(task)
    loop.run_until_complete(asyncio.wait(tasks))
    print('last time:{}'.format(time.time()-start_time))

在协程中不要放阻塞的代码，但如果非要使用阻塞的代码，就可以放到线程池中运行。

5. asyncio模拟http请求 (协程完成http请求)

import asyncio
from urllib.parse import urlparse
import time


async def get_url(url):
    # 通过socket请求html
    url = urlparse(url)
    host = url.netloc
    path = url.path
    if path == "":
        path = '/'

    # 建立socket连接
    reader, writer = await asyncio.open_connection(host, 80)   # 协程 与服务端建立连接
    writer.write(
        "GET {} HTTP/1.1\r\nHost:{}\r\nConnection:close\r\n\r\n".format(path, host).encode('utf8'))
    all_lines = []
    async for raw_line in reader:   # __aiter__ __anext__魔法方法
        line = raw_line.decode('utf8')
        all_lines.append(line)
    html = '\n'.join(all_lines)
    return html

    # client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    # client.connect((host, 80))
    # client.send(
    #     "GET {} HTTP/1.1\r\nHost:{}\r\nConnection:close\r\n\r\n".format(path, host).encode('utf8'))
    # data = b""
    # while True:
    #     d = client.recv(1024)
    #     if d:
    #         data += d
    #     else:
    #         break

    # data = data.decode('utf8')
    # html_data = data.split('\r\n\r\n')[1]  # 把请求头信息去掉， 只要网页内容
    # print(html_data)
    # client.close()


async def main():
    tasks = []
    for url in range(20):
        url = 'http://shop.projectsedu.com/goods/{}/'.format(url)
        tasks.append(asyncio.ensure_future(get_url(url)))     # tasks中放入的是future
    for task in asyncio.as_completed(tasks):    # 完成一个 print一个
        result = await task
        print(result)

if __name__ == '__main__':
    start_time = time.time()
    loop = asyncio.get_event_loop()
    loop.run_until_complete(main())
    print('last time:{}'.format(time.time()-start_time))

所以asyncio协程和之前讲解的select事件循环原理是一样的

6. asyncio同步和通信

以前讲解多线程锁的机制的代码，我们现在改用协程来实现就不需要锁了：

import asyncio

total = 0


async def add():
    global total
    for _ in range(1000000):
        total += 1


async def desc():
    global total, lock
    for _ in range(1000000):
        total -= 1


if __name__ == '__main__':
    tasks = [add(), desc()]
    loop = asyncio.get_event_loop()
    loop.run_until_complete(asyncio.wait(tasks))
    print(total)

运行结果为： 0

这里不用锁，但在有些情况我们还是需要类似锁的机制。我们代码举例：

parse_stuff和use_stuff有共同调用的代码get_stuff
parse_stuff去请求的时候 如果get_stuff也去请求， 会触发网站的反爬虫机制.
这就需要我们像上诉代码那样加lock

代码如下：

import asyncio
import aiohttp
from asyncio import Lock
cache = {'baidu': 'www.baidu.com'}
lock = Lock()


async def get_stuff(url):
    async with lock:   # 等价于 with await lock:   还有async for 。。。类似的用法
        # 这里可以使用async with 是因为 Lock中有__await__ 和 __aenter__两个魔法方法
        # 和线程一样， 这里也可以用 await lock.acquire() 并在结束时 lock.release
        if url in cache:
            return cache[url]
        stuff = await aiohttp.request('GET', url)
        cache[url] = stuff
        return stuff


async def parse_stuff(url):
    stuff = await get_stuff(url)
    # do some parse


async def use_stuff(url):
    stuff = await get_stuff(url)
    # use stuff to do something interesting


if __name__ == '__main__':
    tasks = [parse_stuff('baidu'), use_stuff('baidu')]
    loop = asyncio.get_event_loop()
    loop.run_until_complete(asyncio.wait(tasks))

补充点：queue

协程是单线程的，所以协程中完全可以使用全局变量实现queue来相互通信，但是如果想要在queue中定义存放有限的最大数目。我们需要使用 :

from asyncio import Queue
queue = Queue(maxsize=3)   # queue的put和get需要用await

7. aiohttp实现高并发爬虫

# asyncio爬虫， 去重， 入库

import asyncio
import re
import aiohttp
import aiomysql
from pyquery import PyQuery

stopping = False


start_url = 'http://www.jobbole.com'
waitting_urls = []
seen_urls = set()   # 实际使用爬虫去重时，数量过多，需要使用布隆过滤器


async def fetch(url, session):
    async with aiohttp.ClientSession() as session:
        try:
            async with session.get(url) as resp:
                print('url status: {}'.format(resp.status))
                if resp.status in [200, 201]:
                    data = await resp.text()
                    return data
        except Exception as e:
            print(e)


def extract_urls(html):   # html中提取所有url
    urls = []
    pq = PyQuery(html)
    for link in pq.items('a'):
        url = link.attr('href')
        if url and url.startwith('http') and url not in seen_urls:
            urls.append(url)
            waitting_urls.append(urls)
    return urls


async def init_urls(url, session):
    html = await fetch(url, session)
    seen_urls.add(url)
    extract_urls(html)


async def article_handler(url, session, pool):   # 获取文章详情并解析入库
    html = await fetch(url, session)
    extract_urls(html)
    pq = PyQuery(html)
    title = pq('title').text()  # 为了简单， 只获取title的内容
    async with pool.acquire() as conn:
        async with conn.cursor() as cur:
            await cur.execute('SELECT 42;')
            insert_sql = "insert into article_test(title) values('{}')".format(
                title)
            await cur.execute(insert_sql)      # 插入数据库
            # print(cur.description)
            # (r,) = await cur.fetchone()
            # assert r == 42


async def consumer(pool):
    async with aiohttp.ClientSession() as session:
        while not stopping:
            if len(waitting_urls) == 0:    # 如果使用asyncio.Queue的话， 不需要我们来处理这些逻辑。
                await asyncio.sleep(0.5)
                continue
            url = waitting_urls.pop()
            print('start get url:{}'.format(url))
            if re.match('http://.*?jobbole.com/\d+/', url):
                if url not in seen_urls:   # 是没有处理过的url，则处理
                    asyncio.ensure_future(article_handler(url, sssion, pool))
            else:
                if url not in seen_urls:
                    asyncio.ensure_future(init_urls(url))


async def main(loop):
    # 等待mysql连接建立好
    pool = await aiomysql.creat_pool(host='127.0.0.1', port=3306, user='root',
                                     password='', db='aiomysql_test', loop=loop, charset='utf8', autocommit=True)
    # charset  autocommit必须设置， 这是坑， 不写数据库写入不了中文数据
    async with aiohttp.ClientSession() as session:
        html = await fetch(start_url, session)
        seen_urls.add(start_url)
        extract_urls(html)
    asyncio.ensure_future(consumer(pool))


if __name__ == '__main__':
    loop = asyncio.get_event_loop()
    asyncio.ensure_future(main(loop))
    loop.run_forever()

第19篇：python高级编程进阶：使用Flask进行Web开发猿享天开 python从入门到精通 python 开发语言
第19篇：python高级编程进阶：使用Flask进行Web开发内容简介在第18篇文章中，我们介绍了Web开发的基础知识，并使用Flask框架构建了一个简单的Web应用。本篇文章将深入探讨Flask的高级功能，涵盖模板引擎（Jinja2）、表单处理、数据库集成以及用户认证等主题。通过系统的讲解和实战案例，您将掌握构建功能更为丰富和复杂的Web应用所需的技能。目录Flask的深入使用Flask扩展蓝
第18篇：python高级编程进阶：Web开发基础详解猿享天开 python从入门到精通 python 开发语言
第18篇：Web开发基础内容简介本篇文章将为您介绍Web开发基础的核心概念和实用技能。您将了解Web开发的基本概念和流程，掌握HTTP协议的基础知识，学习如何使用Flask框架构建简单的Web应用，并深入理解路由与视图函数的工作原理。通过丰富的代码示例和实战案例，您将能够快速入门Web开发，搭建自己的第一个Web应用。目录Web开发概述什么是Web开发前端与后端开发Web开发的技术栈HTTP协议基
Python高级编程之协同程序 Y2701310012 python python 协程
1.协同程序协同程序可以挂起、恢复，并且有多个接入点的函数。有些语言本省就提供了这种特性，如Io语言和Lua语言，它们可以实现协同的多任务和管道机制。例如，每个协同程序将消费或生成数据，然后暂停，直到其他数据被传递。在Python中，协同程序的替代者是线程，它可以实现代码块之间的交互。但是因为它们表现出一种抢先式的风格，所以必须注意资源锁，而协同程序不需要。这样的代码可能变得相当复杂，难以创建和调
Python生成器函数的定义，使用，方法，实例，（yield、yield from） Rui-Yang python 开发语言
本位目标人群是拥有Python基础的开发者，主要目的是用通俗的语言讲Python生成器函数的特性，方法，和使用。文章目录前言一、生成器是什么？二、生成器的各种方法和关键字1.yield,yieldfrom,next2.send,close,throw三、使用生成器及实例总结前言生成器是Python高级编程中重要的知识点，我们平常调用的库其中有不少生成器的使用，但我们自己很少制作他，今天我们来自己写
Python从入门到精通学习的十个阶段 python零基础入门小白 python 学习开发语言计算机网络数据分析
文章目录前言一、Python开发基础二、Python高级编程和数据库开发三、前端开发四、WEB框架开发五、爬虫开发六、全栈项目实战七、数据分析八、人工智能九、自动化运维&开发十、高并发语言GO开发关于Python技术储备一、Python所有方向的学习路线二、Python基础学习视频三、精品Python学习书籍四、Python工具包+项目源码合集①Python工具包②Python实战案例③Pytho
Python高级编程和异步IO并发编程---学习笔记---第四章（深入类和对象）欣海朝龙学习笔记 python
目录4-1鸭子类型和多态4-2与4-3：抽象基类(abc模块)（1）我们去检查某个类是否有某种方法（2）我们在某些情况之下希望判定某个对象的类型（3）我们需要强制某个子类必须实现某些方法4-4isinstance和type的区别4-5类变量和实例变量4-6类和实例属性的查找顺序—mro查找（Methodresolutionorder）4-7类方法、静态方法和实例方法一，实例方法：二，静态方法，初始
Python高级编程之旅8：高级项目实战（初级版） jiet_h Python 高级 python 开发语言
欢迎来到《Python高级编程之旅》系列的第八篇博客！在前几篇中，我们介绍了面向对象编程、高级函数、高级语法、并发和多线程、文件处理、网络服务以及Socket编程的概念和应用。今天，我们将进行一个初级版的高级项目实战，让我们一起来学习吧！项目背景我们的项目是一个简单的待办事项管理器。它将帮助用户记录和管理他们的待办事项，包括事项的名称、描述、截止日期和状态等信息。项目要求在这个初级版的项目中，我们
Python高级编程之旅10：高级项目实战（进阶版） jiet_h Python 高级 python 开发语言
欢迎来到《Python高级编程之旅》系列的第十篇博客！在前几篇中，我们介绍了面向对象编程、高级函数、高级语法、并发和多线程、文件处理、网络服务、Socket编程、待办事项管理器以及在线教育平台的概念和应用。今天，我们将进行一个进阶版的高级项目实战，让我们一起来挑战更复杂的项目吧！项目背景我们的项目是将Excel表格中的数据转换为Java代码的工具。它将帮助开发人员自动将Excel中的表格数据转换为
Python高级编程之旅7：Socket编程 jiet_h Python 高级 python
欢迎来到《Python高级编程之旅》系列的第七篇博客！在前几篇中，我们介绍了面向对象编程、高级函数、高级语法、并发和多线程、文件处理以及网络服务的概念和应用。今天，我们将继续探索Python中的高级编程技术，重点是Socket编程。Socket编程是网络通信的基础，让我们一起来学习吧！创建TCP服务器在Python中，我们可以使用socket模块来创建TCP服务器。让我们看一个示例：imports
Python高级编程之旅9：高级项目实战（中级版） jiet_h Python 高级 python 开发语言
欢迎来到《Python高级编程之旅》系列的第九篇博客！在前几篇中，我们介绍了面向对象编程、高级函数、高级语法、并发和多线程、文件处理、网络服务、Socket编程以及待办事项管理器的概念和应用。今天，我们将进行一个中级版的高级项目实战，让我们一起来学习吧！项目背景我们的项目是一个简单的电子商务平台。它将帮助商家管理商品信息、订单处理和用户管理等。项目要求在这个中级版的项目中，我们需要实现以下功能：添
Python程序员鲜为人知但你应该知道的16个问题 Java丶python攻城狮
这篇文章主要介绍了Python程序员代码编写时应该避免的16个“坑”，也可以说成Python程序员代码编写时应该避免的16个问题，需要的朋友可以参考。1.不要使用可变对象作为函数默认值代码如下:这2个例子说明了什么?字典,集合,列表等等对象是不适合作为函数默认值的.因为这个默认值实在函数建立的时候就生成了,每次调用都是用了这个对象的”缓存”.我在上段时间的分享python高级编程也说到了这个问题,
python高级编程总结漫漫行程路 python python 开发语言后端
Python中一切皆对象一切皆对象得含义就是每一个都有自己得属性，每一个都有自己得继承关系，你看到没有继承得，其实它隐式继承了object或者type。关于type可以看看元类。是对象意味着它可以随时随地得使用，比如赋值给一个变量，添加到列表中，作为参数出传递，做返回值Python语言特性Python是动态强类型语言动态还是静态指的是编译期还是运行期确定类型比如定义了一个变量a=11这个时候你并没
1.2 Python高级编程-装饰器 ahstudy Python高级编程教程 python 开发语言
装饰器是一种Python内置的函数，它可以让我们在不修改原有函数代码的情况下，对函数进行额外的处理。装饰器可以用于实现各种功能，如日志记录、性能测量、用户身份验证等。什么是装饰器装饰器是一种特殊类型的函数，它接受一个函数作为参数，并返回一个新的函数。这个新的函数通常对原始函数进行了修改，以实现额外的功能。装饰器的语法装饰器的语法非常简单。我们可以使用@符号来表示装饰器，并将其附加到函数上。以下是一
1.3 Python高级编程-生成器 ahstudy Python高级编程教程 python
摘要：在Python编程中，生成器是一种特殊类型的迭代器，它允许你在需要时动态生成值。生成器使用关键字yield来返回一个值，这使得它们非常适合处理大量数据或执行计算密集型任务。在本教程中，我们将介绍生成器的基础知识，包括如何创建和使用生成器，以及它们在实际编程中的应用。生成器的基本概念生成器是一种特殊的函数，它使用关键字yield来返回一个值。当生成器函数被调用时，它返回一个生成器对象，而不是直
1.5 Python高级编程-上下文管理器 ahstudy Python高级编程教程 python 开发语言
在Python编程中，上下文管理器是一种用于自动化资源管理的高级工具。它们通常用于处理临时性或需要清理的资源，如文件、网络连接、数据库连接等。本文将详细介绍Python上下文管理器的基本概念和如何使用它们。上下文管理器的基本概念上下文管理器是一种处理资源的生命周期的设计模式。它们通常由两个方法组成：__enter__()和__exit__()。__enter__()方法在上下文管理器被调用时返回资
1.4 Python高级编程-迭代器和收集器 ahstudy Python高级编程教程 python 算法开发语言
在Python中，当我们需要处理大量数据时，通常需要使用迭代器和收集器来提高代码的效率和可读性。本文将详细介绍Python中的迭代器和收集器，以及如何使用它们来处理数据。迭代器迭代器是一个可以迭代的对象，它允许我们在处理数据时逐个访问元素。迭代器实现了迭代器协议，包括__iter__()和__next__()方法。__iter__()方法返回迭代器本身，__next__()方法返回下一个元素。当没
[python高级编程]：02-类 Chandni. python高级编程类 python 装饰器
此系列主要用于记录Python学习过程中查阅的优秀文章，均为索引方式。其中内容只针对本作者一人，作者熟悉了解的内容不再重复记录。目录01-装饰器@overload--方法重载02-多态多态和鸭子类型03-设计模式抽象基类和接口01-装饰器@overload--方法重载【Python】Python中的@overload装饰器-知乎(zhihu.com)1.@overload装饰器其实只是一种注解/提
[python高级编程]：01-数据结构 Chandni. python高级编程 Python高级编程数据结构
此系列主要用于记录Python学习过程中查阅的优秀文章，均为索引方式。其中内容只针对本作者一人，作者熟悉了解的内容不再重复记录。目录01-列表推导式列表推导同filter和map的比较02-元组元组拆包具名元组01-列表推导式列表推导同filter和map的比较Python专题——五分钟带你了解map、reduce和filter-知乎(zhihu.com)02-元组元组拆包Python---元组拆
百万年薪大佬熬夜写作，Python高级编程之反爬虫及应对方案 Java进阶营菌 Python 职场 C++网络 python java 人工智能大数据
写在前面爬虫是Python的一个常见应用场景，很多练习项目就是让大家去爬某某网站爬取网页的时候，你大概率会碰到一些反爬措施这种情况下，你该如何应对呢？本文梳理了常见的反爬措施和应对方案接着往下看吧私信小编01即可获取大量python学习资源通过User-Agent来控制访问无论是浏览器还是爬虫程序，在向服务器发起网络请求的时候，都会发过去一个头文件：headers以本网页为例,点击鼠标右键,接着点
Python高级编程（11）：上下文管理器和切片 xw5643516 python 开发语言
一、with上下文管理器1.文件操作中使用with的原因使用open函数，打开文件对文件进行读写之后，一定要使用close关闭文件，否则会造成系统资源的浪费然而，我们在打开文件，或者是在操作文件的过程中，程序出现了异常，那么此时，我们就无法关闭文件所以，使用withas语句操作上下文管理器，无论期间是否抛出异常，都能保证withas语句执行完毕后自动关闭已经打开的文件withopen("xxx.t
Python语言的特点及学习流程，自身经验分享，小白入门篇只存在于虚拟的King python 学习经验分享深度学习面试开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Python的优特点1.简单易学2.语法优美3.Python语言的类库非常的全面4.开发效率高5.应用领域广泛二、Python学习流程1.Python基础2.Python高级编程3.数据库原理和sql优化4.前端Web开发5.PythonWeb后端开发6.爬虫7.数据分析总结关于Python技术储备一、Python所有
零基础入门Python,主要该学些什么？一文详解。 python零基础入门小白 python 开发语言学习科技生活深度学习经验分享
文章目录前言一、Python开发基础二、Python高级编程和数据库开发三、前端开发四、WEB框架开发五、爬虫开发六、全栈项目实战七、数据分析八、人工智能九、自动化运维&开发十、高并发语言GO开发关于Python技术储备一、Python所有方向的学习路线二、Python基础学习视频三、精品Python学习书籍四、Python工具包+项目源码合集①Python工具包②Python实战案例③Pytho
python高级编程实例（中篇）逆鳞_Kevin python python 开发语言
二、高级语法实践——类级别以下1.迭代器1.1迭代器简介迭代器是一个实现了迭代器协议的容器对象。是访问可迭代对象的一种强大的方式，可以记住遍历位置的对象，不会像列表那样一次性全部生成所有元素，而是可以等到用的时候才生成所需元素，因此节省了大量的内存资源。迭代器从可迭代对象的第一个元素开始访问，直到所有的元素被访问完。它基于以下两个方法：__next__:返回容器的下一个元素；__iter__:返回
《Python高级编程》 ——速查笔记第一、二章三头六臂的小白 python开发 python rpc
Python高级编程——速查笔记第一、二章Python高级编程(速查笔记第一、二章)第一章1.编译器2.安装python第二章**语法的最佳实践**——*低于类级*1.列表推导式（Listcomprehensions）2.迭代器（Iterators）和生成器（generators）3.装饰器（Decorators)4.上下文管理器（contextlib和with)这本《Python高级编程》是为数
python适合做后端开发吗-Python后端开发是什么职位？ weixin_37988176
阶段一：Python开发基础Python全栈开发与人工智能之Python开发基础知识学习内容包括：Python基础语法、数据类型、字符编码、文件操作、函数、装饰器、迭代器、内置方法、常用模块等。阶段二：Python高级编程和数据库开发Python全栈开发与人工智能之Python高级编程和数据库开发知识学习内容包括：面向对象开发、Socket网络编程、线程、进程、队列、IO多路模型、Mysql数据库
【编程实践】Python 语言程序设计指南手册 (基础语法、代码示例、注释说明) 禅与计算机程序设计艺术 Python 编程实践 python 数学建模开发语言
【编程实践】Python语言程序设计指南手册(基础语法、代码示例、注释说明)文章目录【编程实践】Python语言程序设计指南手册(基础语法、代码示例、注释说明)一、Python基础编程基础语法变量和数据类型条件语句和循环语句函数和模块输入和输出代码示例计算圆的面积和周长求解一元二次方程猜数字游戏注释说明二、Python高级编程Python网络编程1.Socket编程2.网络通信协议Python并发
python高级编程之解析XML文件模块圣人便无名
XML是啥？可扩展标记语言（extensiblemakeuplanguage），以.xml为后缀的文件。XML文件最大的作用在于存储和传输数据。很多Python的项目就是把产品相关配置参数存储在xml文件中，利用python的模块进行对数据的增删改查。XML文件遵循一定的语法格式，比较简单易懂。基本遵循着“元素有始有终的原则。譬如:qiaofengbeatingdragon18palms凡是同样的
想学Python高级编程？必须了解这个小技巧：match-case！ Python自动化办公社区 Python读者圈 python 数据库 mysql
大家好，这里是程序员晚枫，小破站/知乎/小红书/抖音都叫这个名字。上次给大家分享了Python高级编程第一讲：从使用类型提示开始；今天分享Python高级编程第二讲：深入解析Python中switchcase的使用方法。写在前面分享之前，先说几点注意事项：Python对switchcase的支持，来自PEP634，如下图所示。Python对switchcase的支持，是通过matchcase实现的
想学Python高级编程？这个技巧你不能错过！ Python自动化办公社区 python 开发语言高级编程
前言熟悉Python的朋友都知道，Python有一个让人又爱又恨的特点：数据类型的定义和使用非常的灵活。在编写一个简易脚本的时候，这个特点让编程难度显著下降；但如果你需要编写一个大型程序，而且还需要多人协作时，没有类型定义的数据类型，真的让人崩溃！也许Python的维护者也发现了这个问题，从Python3.5开始加入了类型提示的功能，不仅能对基础数据类型提示，也可以对自定义的类进行提示。今天我们就
Python经典书籍有哪些?这份书单送给你_黑马程序员 brave_heart_lxl Python python 机器学习人工智能
文章目录一、Python基础01-《Python编程：从入门到实践（第2版）》02-《Python编程快速上手（第2版）》03-《Python编程初学者指南》04-《“笨方法”学Python3》二、Python进阶01-《流畅的Python》02-《PythonCookbook中文版（第3版）》03-《Python高级编程（第二版）》04-《Python核心编程（第3版）》三、Python爬虫01
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。

12.asyncio并发编程

1. 事件循环

讲解asyncio的简单使用:

如何获取返回值

多任务wait和gather方法

在区分time.sleep与await asyncio.sleep 在协程中的区别时， 讲解使用了wait方法的多任务:

而gather的基本用法只需要这么改:

那么gather与wait的区别是什么呢？如何对它两进行选择呢？

2. task取消和子协程调用原理

取消task

子协程调用原理

3. call_soon,call_at,call_later,call_soon_threadsafe的使用

call_soon 立即执行函数

call_later 按等待时间执行函数

call_at 在指定时间执行

call_soon_threadsafe 线程安全的call_soon

call_soon,call_later,call_at,call_soon_threadsafe都是比较底层的，在正常使用时很少用到。

4. ThreadPollExecutor 和 asycio完成阻塞io请求

什么时候使用多线程：在协程中集成阻塞io

5. asyncio模拟http请求 (协程完成http请求)

6. asyncio同步和通信

这里不用锁，但在有些情况 我们还是需要类似锁的机制。我们代码举例：

补充点：queue

7. aiohttp实现高并发爬虫

你可能感兴趣的:(python高级编程)

在区分time.sleep与await asyncio.sleep 在协程中的区别时，讲解使用了wait方法的多任务:

这里不用锁，但在有些情况我们还是需要类似锁的机制。我们代码举例：