Shaw_Road

python并发编程手册

文章目录

并发编程介绍
- python中的并发编程
- CPU密集型计算和IO密集型计算
- 多线程，多进程，多协程的对比
- 怎样根据任务选择对应技术
- 全局解释器锁GIL
多线程
- 简单流程
- 简单的一个多线程爬虫
- 生产者消费者模式进行多线程爬虫
- 线程安全概念
- 线程锁使用实例
- 线程池概念介绍
- 线程池的使用方法
- - 使用线程池实现多线程爬虫
  - 使用线程池在flask-web服务中加速
多进程
- 多进程multiprocessing知识梳理
- 多线程的实现
- 使用多进程在flask-web服务中加速
协程
- 协程内容的介绍
- python异步IO库介绍: asyncio
- 协程爬虫实现
- 信号量
- 使用信号量控制协程数进行爬虫

并发编程介绍

python中的并发编程

第一列为单线程串行，即CPU和IO是串起来执行的。IO的速度会严重制约CPU的运算速度
第二列为多线程并发，即当前线程遇到IO,释放CPU,可以提高CPU的运行效率
第三列为多进程并行，即使用的是多个CPU,然后进行计算
第四列为多机器并行，即使的的是多个机器同时计算同一个任务。

并行支持一下几种:

多线程：threading，利用CPU和IO可以同时执行的原理，让CPU不会干巴巴等待IO完成
多进程：multiprocessing，利用多核CPU的能力，真正的并行执行任务
异步IO：asyncio，在单线程利用CPU和IO同时执行的原理，实现函数异步执行

线程通信主要有:

使用Lock对资源加锁，防止冲突访问
使用Queue实现不同线程/进程之间的数据通信，实现生产者-消费者模式
使用线程池Pool/进程池Pool，简化线程/进程的任务提交、等待结束、获取结果
使用subprocess启动外部程序的进程，并进行输入输出交互

CPU密集型计算和IO密集型计算

CPU密集型（CPU-bound）: CPU密集型也叫计算密集型，是指I/O在很短的时间就可以完成，CPU需要大量的计算和处理，特点是CPU占用率相当高。例如：压缩解压缩、加密解密、正则表达式搜索

IO密集型（I/O-bound）:
IO密集型指的是系统运作大部分的状况是CPU在等I/O (硬盘/内存) 的读/写操作，CPU占用率仍然较低。例如：文件处理程序、网络爬虫程序、读写数据库程序

多线程，多进程，多协程的对比

python并发编程有三种方式：多线程Thread、多进程Process、多协程Coroutine。

怎样根据任务选择对应技术

如果是CPU密集型计算，使用多进程multiprocessing
如果是IO密集型计算，则考虑多线程或者多线程。如果任务量大，有现成协程库支持，协程实现的复杂度可接受则首选协程，否则选线程。

全局解释器锁GIL

全局解释器锁（英语：Global Interpreter Lock，缩写GIL）是计算机程序设计语言解释器用于同步线程的一种机制，它使得任何时刻仅有一个线程在执行。即便在多核心处理器上，使用 GIL 的解释器也只允许同一时间执行一个线程。

虽然上图启动了三个线程，但是同一时刻，只有一个线程在执行，首先线程1拿到GIL然后执行，当前需要I/O时，则释放GIL,然后线程2拿到GIL, 执行，就这样，谁拿到GIL,谁就执行，否则，就阻塞。

为什么要有GIL？

为了解决多线程之间数据完整性和状态同步问题。
举例子：Python中对象的管理，是使用引用计数器进行的，引用数为0则释放对象。开始：线程A和线程B都引用了对象obj，obj.ref_num = 2，线程A和B都想撤销对obj的引用

上图中线程A和线程B都引用了对象obj, 首先，线程A准备销毁obj引用，将计数器减1，刚减完，切换到了线程B, 线程B也要销毁obj引用，将计数器减1，然后判断引用等于0，则将其释放掉。当切换到线程A继续执行的时候，发现obj的引用已经无法获取计数器的值了。所以，就报错了。

怎样规避GIL带来的限制?

1、多线程 threading 机制依然是有用的，用于IO密集型计算。因为在 I/O (read,write,send,recv,etc.)期间，线程会释放GIL，实现CPU和IO的并行。因此多线程用于IO密集型计算依然可以大幅提升速度。但是多线程用于CPU密集型计算时，只会更加拖慢速度

2、使用multiprocessing的多进程机制实现并行计算、利用多核CPU优势。为了应对GIL的问题，Python提供了multiprocessing

多线程

简单流程

准备一个函数
```
def my_func(a, b):
   do_craw(a,b)
```

创建一个线程

import threading
t = threading.Thread(target=my_func, args=(100, 200)

启动线程和等待结束

t.start()  # 启动线程
t.join()   # 等待结束

简单的一个多线程爬虫

"""
@file   : 001-多线程.py
@author : xiaolu
@email  : luxiaonlp@163.com
@time   : 2021-02-01
"""
import threading
import time
import requests


def craw(url):
    # 这是个爬虫
    r = requests.get(url)
    print(url, r.status_code)


def single_thread():
    # 单线程爬虫
    print('single_thread start')
    for url in urls:
        craw(url)
    print('single_thread end')


def multi_thread():
    # 多线程爬虫
    print("multi_thread begin")
    threads = []
    for url in urls:
        threads.append(
            threading.Thread(target=craw, args=(url,))   # url, 之所以加逗号 是因为这里必须为元组
        )

    # 启动多线程
    for thread in threads:
        thread.start()

    # 等待结束
    for thread in threads:
        thread.join()
    print("multi_thread end")


if __name__ == '__main__':
    # 爬50页的内容
    urls = ['https://www.cnblogs.com/sitehome/p/{}'.format(page) for page in range(1, 50 + 1)]

    # 单线程走起
    start = time.time()
    single_thread()
    end = time.time()
    print("single thread cost:", end - start, "seconds")

    # 多线程走起
    start = time.time()
    multi_thread()
    end = time.time()
    print("multi thread cost:", end - start, "seconds")

生产者消费者模式进行多线程爬虫

在实现生产者消费者模式之前，了解一下多线程数据通信queue。queue.Queue可以用于多线程之间的，线程安全的数据通信。

# 1. 带入类库
import queue

# 2. 创建Queue
q = queue.Queue()

# 3. 添加元素
q.put(item)

# 4. 获取元素
item = q.get()

# 5. 查询状态
q.qsize()   # 查看当前元素的个数
q.empty()   # 判断是否为空
q.full()    # 判断是否已满

生产者消费者模式爬虫

"""
@file   : 002-生产者消费者实现多线程爬虫.py
@author : xiaolu
@email  : luxiaonlp@163.com
@time   : 2021-02-01
"""
import queue
import time
import random
import threading
import requests
from bs4 import BeautifulSoup


def craw(url):
    # 爬取网页内容
    r = requests.get(url)
    return r.text


def parse(html):
    # 解析其中的内容
    soup = BeautifulSoup(html, "html.parser")
    links = soup.find_all("a", class_="post-item-title")
    return [(link["href"], link.get_text()) for link in links]   # 那链接和标题拿出来


def do_craw(url_queue: queue.Queue, html_queue: queue.Queue):
    '''
    生产者
    :param url_queue: url的队列  生产者从中拿出链接  去爬虫
    :param html_queue:  生产者将爬取的内容放到这里
    :return:
    '''
    while True:
        url = url_queue.get()
        html = craw(url)
        html_queue.put(html)
        print('线程名: ', threading.current_thread().name,
              "url_queue.size=", url_queue.qsize())   # 获取url队列中还有多少待爬取的
        time.sleep(random.randint(1, 2))


def do_parse(html_queue: queue.Queue, fout):
    '''
    消费者
    :param html_queue: 生产者生产出的内容
    :param fout: 消费者将内容解析出来  存到fout中
    :return:
    '''
    while True:
        html = html_queue.get()
        results = parse(html)
        for result in results:
            fout.write(str(result) + "\n")
        print('线程名: ', threading.current_thread().name,
              "html_queue.size=", html_queue.qsize())
        time.sleep(random.randint(1, 2))


if __name__ == '__main__':
    # 待爬取的网页链接
    urls = [
        "https://www.cnblogs.com/sitehome/p/{}".format(page) for page in range(1, 50 + 1)
    ]

    url_queue = queue.Queue()
    html_queue = queue.Queue()

    # 将url放进队列中
    for url in urls:
        url_queue.put(url)

    # 启动三个线程去做生产者
    for idx in range(3):
        t = threading.Thread(target=do_craw, args=(url_queue, html_queue),
                             name="craw{}".format(idx))
        t.start()

    fout = open("data.txt", "w")
    # 启动两个线程去做消费者
    for idx in range(2):
        t = threading.Thread(target=do_parse, args=(html_queue, fout),
                             name="parse{}".format(idx))
        t.start()

线程安全概念

线程安全指某个函数、函数库在多线程环境中被调用时，能够正确地处理多个线程之间的共享变量，使程序功能正确完成。由于线程的执行随时会发生切换，就造成了不可预料的结果，出现线程不安全。

上图展示的是一个取钱的过程，每次取钱，先进行if判断，然后再减去金额。线程1执行到if判断完，就被切换到线程2了。此时，线程2也进入到了if中又被切换到线程1，线程1继续执行下去，减去金额，取到了钱。切换到线程2，也减去金额，取到了钱，显然就有问题了。银行亏了600块。

Lock用于解决线程安全问题：

用法一: try-finally模式

import threading

lock = threading.Lock()

lock.acquire()   # 获取锁  其他线程就进不到下面的try中了
try:
    # do something
finally:
    lock.release()   # 释放锁，其他线程就可以通过前面的acquire获取到锁了。

用法二: with模式(更常用)

import threading

lock = threading.Lock()

with lock:
    # do something

线程锁使用实例

"""
@file   : 003-多线程锁机制.py
@author : xiaolu
@email  : luxiaonlp@163.com
@time   : 2021-02-01
"""
import threading
import time


class Account:
    def __init__(self, balance):
        self.balance = balance


def draw(account, amount):
    with lock:
        if account.balance >= amount:
            # time.sleep(0.1)   # 如果不加锁，这里休息0.1秒，每次都会出问题，因为这里会引起线程阻塞，一定会切换
            print(threading.current_thread().name, "取钱成功")
            account.balance -= amount
            print(threading.current_thread().name, "余额", account.balance)
        else:
            print(threading.current_thread().name,
                  "取钱失败，余额不足")


if __name__ == "__main__":
    account = Account(1000)    # 金额
    
    lock = threading.Lock()   # 实例化线程锁
    
    # 启动两个线程  分别去800块
    ta = threading.Thread(name="ta", target=draw, args=(account, 800))
    tb = threading.Thread(name="tb", target=draw, args=(account, 800))

    ta.start()
    tb.start()

线程池概念介绍

上图左侧是展示的是一个线程的生命周期，首先，新建线程，然后准备就绪，等cpu调用，如果被调用，则开始运行，如果被切换，则又返回就绪状态，如果是因为io或者sleep，则进入阻塞状态，阻塞结束则又回到就绪状态，反反复复，直到执行完。之所以要采用线程池，右上角以说明原因。

线程池的好处:

提升性能：因为减去了大量新建、终止线程的开销，重用了线程资源；
适用场景：适合处理突发性大量请求或需要大量线程完成任务、但实际任务处理时间较短
防御功能：能有效避免系统因为创建线程过多，而导致系统负荷过大相应变慢等问题
代码优势：使用线程池的语法比自己新建线程执行线程更加简洁

线程池的使用方法

用法一: map函数，很简单。注意map的结果和入参是顺序对应的。

from concurrent.futures import ThreadPoolExecutor

with ThreadPoolExecutor() as pool:
    results = pool.map(craw, urls)
    for result in results:
        print(result)

用法二: futures模式，更强大。注意如果用as_completed顺序是不定的。

from concurrent.futures import ThreadPoolExecutor, as_completed

with ThreadPoolExecutor() as pool:
    futures = [ pool.submit(craw, url) for url in urls ]

    for future in futures:
        print(future.result())
    for future in as_completed(futures):
        print(future.result())

使用线程池实现多线程爬虫

"""
@file   : 004-线程池的使用.py
@author : xiaolu
@email  : luxiaonlp@163.com
@time   : 2021-02-01
"""
import concurrent.futures
import requests
from bs4 import BeautifulSoup


def craw(url):
    # 爬取网页内容
    r = requests.get(url)
    return r.text


def parse(html):
    # 解析其中的内容
    soup = BeautifulSoup(html, "html.parser")
    links = soup.find_all("a", class_="post-item-title")
    return [(link["href"], link.get_text()) for link in links]   # 那链接和标题拿出来


if __name__ == '__main__':
    # 待爬取的网页链接
    urls = [
        "https://www.cnblogs.com/sitehome/p/{}".format(page) for page in range(1, 50 + 1)
    ]
        
    # craw
    with concurrent.futures.ThreadPoolExecutor() as pool:
        htmls = pool.map(craw, urls)
        htmls = list(zip(urls, htmls))
        for url, html in htmls:
            print(url, len(html))
    print("craw over")
    
    # parse
    with concurrent.futures.ThreadPoolExecutor() as pool:
        futures = {
     }
        for url, html in htmls:
            future = pool.submit(parse, html)
            futures[future] = url
    
        # for future, url in futures.items():
        #     print(url, future.result())
    
        for future in concurrent.futures.as_completed(futures):
            url = futures[future]
            print(url, future.result())

使用线程池在flask-web服务中加速

import flask
import json
import time
from concurrent.futures import ThreadPoolExecutor

app = flask.Flask(__name__)
pool = ThreadPoolExecutor()


def read_file():
    time.sleep(0.1)
    return "file result"


def read_db():
    time.sleep(0.2)
    return "db result"


def read_api():
    time.sleep(0.3)
    return "api result"


@app.route("/")
def index():
    result_file = pool.submit(read_file)
    result_db = pool.submit(read_db)
    result_api = pool.submit(read_api)

    return json.dumps({
     
        "result_file": result_file.result(),
        "result_db": result_db.result(),
        "result_api": result_api.result(),
    })


if __name__ == "__main__":
    app.run()

多进程

多进程multiprocessing知识梳理

上图的上面展示的是一个多线程执行的过程，主要通过并行IO和CPU来提高执行速度，但是对于CPU密集型运算，即上图的下面部分，一直都需CPU计算，则线程的切换耽误时间，导致多线程反而没有多线程速度快。

对比多线程和多进程的实现

多线程的实现

这里判断100个大数是否为素数？分别对比了单线程，多线程，多进程的效率。

"""
@file   : 005-多进程的使用.py
@author : xiaolu
@email  : luxiaonlp@163.com
@time   : 2021-02-01
"""
import math
from concurrent.futures import ThreadPoolExecutor, ProcessPoolExecutor
import time


def is_prime(n):
    if n < 2:
        return False
    if n == 2:
        return True
    if n % 2 == 0:
        return False
    sqrt_n = int(math.floor(math.sqrt(n)))
    for i in range(3, sqrt_n + 1, 2):
        if n % i == 0:
            return False
    return True


def single_thread():
    for number in PRIMES:
        is_prime(number)


def multi_thread():
    with ThreadPoolExecutor() as pool:
        pool.map(is_prime, PRIMES)


def multi_process():
    with ProcessPoolExecutor() as pool:
        pool.map(is_prime, PRIMES)


if __name__ == "__main__":
    PRIMES = [112272535095293] * 100

    start = time.time()
    single_thread()
    end = time.time()
    print("single_thread, cost:", end - start, "seconds")

    start = time.time()
    multi_thread()
    end = time.time()
    print("multi_thread, cost:", end - start, "seconds")

    start = time.time()
    multi_process()
    end = time.time()
    print("multi_process, cost:", end - start, "seconds")
    # single_thread, cost: 48.5049991607666 seconds
    # multi_thread, cost: 50.53124475479126 seconds
    # multi_process, cost: 16.009512901306152 seconds

使用多进程在flask-web服务中加速

import flask
from concurrent.futures import ProcessPoolExecutor
import math
import json


app = flask.Flask(__name__)


def is_prime(n):
    if n < 2:
        return False
    if n == 2:
        return True
    if n % 2 == 0:
        return False
    sqrt_n = int(math.floor(math.sqrt(n)))
    for i in range(3, sqrt_n + 1, 2):
        if n % i == 0:
            return False
    return True


@app.route("/is_prime/")
def api_is_prime(numbers):
    number_list = [int(x) for x in numbers.split(",")]
    results = process_pool.map(is_prime, number_list)
    return json.dumps(dict(zip(number_list, results)))


if __name__ == "__main__":
    process_pool = ProcessPoolExecutor()
    app.run()

协程

协程内容的介绍

上图的上面是单线程爬虫 cpu的执行情况，可以发现，经常因为等待IO而影响CPU的执行效率。
上图的下面是协程，协程主要是在单线程内实现的，以爬虫为例，协程先是让cpu爬取第一个url的内容，等待IO的时候，它又让CPU爬取第二个url的内容，当第二个任务等待IO的时候，它又让CPU爬取第三个url的内容，然后第三个任务等待IO, 它又循环回来，执行第一个任务，就这样返回循环。所以，协程就是大循环。

python异步IO库介绍: asyncio

import asyncio

# 获取事件循环
loop = asyncio.get_event_loop()

# 定义协程
async def myfunc(url):
    await get_url(url)

# 创建task列表
tasks = [loop.create_task(myfunc(url)) for url in urls]

# 执行爬虫事件列表
loop.run_until_complete(asyncio.wait(tasks))

注意：

要用在异步IO编程中, 依赖的库必须支持异步IO特性
爬虫引用中：requests 不支持异步, 需要用 aiohttp

协程爬虫实现

"""
@file   : 008-协程爬虫.py
@author : xiaolu
@email  : luxiaonlp@163.com
@time   : 2021-02-01
"""
import asyncio
import aiohttp
import time


async def async_craw(url):
    print("craw url: ", url)
    async with aiohttp.ClientSession() as session:
        async with session.get(url) as resp:
            result = await resp.text()
            print(f"craw url: {url}, {len(result)}")


if __name__ == '__main__':
    urls = [
        "https://www.cnblogs.com/sitehome/p/{}".format(page) for page in range(1, 50 + 1)
    ]
    
    loop = asyncio.get_event_loop()   # 获取超级循环
    tasks = [loop.create_task(async_craw(url)) for url in urls]  # 建立任务
    start = time.time()
    loop.run_until_complete(asyncio.wait(tasks))   # 开始执行
    end = time.time()
    print("use time seconds: ", end - start)

信号量

信号量（英语：Semaphore）又称为信号量、旗语是一个同步对象，用于保持在0至指定最大值之间的一个计数值。

当线程完成一次对该semaphore对象的等待（wait）时，该计数值减一；
当线程完成一次对semaphore对象的释放（release）时，计数值加一。
当计数值为0，则线程等待该semaphore对象不再能成功直至该semaphore对象变成signaled状态
semaphore对象的计数值大于0，为signaled状态；计数值等于0，为nonsignaled状态.

信号量是用来控制并发度的。

主要有两种实现方式:
方式一:

sem = asyncio.Semaphore(10)

# ... later
async with sem:
    # work with shared resource

方式二:

sem = asyncio.Semaphore(10)

# ... later
await sem.acquire()
try:
    # work with shared resource
finally:
    sem.release()

使用信号量控制协程数进行爬虫

"""
@file   : 009-使用信号量控制协程数进行爬虫.py
@author : xiaolu
@email  : luxiaonlp@163.com
@time   : 2021-02-01
"""
import asyncio
import aiohttp
import time


async def async_craw(url):
    async with semaphore:   # 加了这个
        print("craw url: ", url)
        async with aiohttp.ClientSession() as session:
            async with session.get(url) as resp:
                result = await resp.text()
                await asyncio.sleep(5)
                print(f"craw url: {url}, {len(result)}")


if __name__ == '__main__':
    urls = [
        "https://www.cnblogs.com/sitehome/p/{}".format(page) for page in range(1, 50 + 1)
    ]
    semaphore = asyncio.Semaphore(10)   # 控制并发量

    loop = asyncio.get_event_loop()   # 获取超级循环
    tasks = [loop.create_task(async_craw(url)) for url in urls]  # 建立任务
    start = time.time()
    loop.run_until_complete(asyncio.wait(tasks))   # 开始执行
    end = time.time()
    print("use time seconds: ", end - start)

《Docker 核心概念揭秘：如何让软件开发像烹饪一样简单》 TechStack 创行者 #服务器容器 Linux docker 容器运维
Docker核心概念通俗解读1.‌镜像（Image）——软件的“预制菜”‌‌是什么‌：镜像是打包好的软件环境，包含代码、工具、配置等所有依赖，就像餐厅提前备好的半成品菜，拆开包装就能烹饪‌。‌核心特点‌‌不可修改‌：一旦制作完成，镜像内容就固定不变，确保不同环境运行效果一致‌。‌分层结构‌：像叠积木一样分层构建，基础层（如操作系统）和功能层（如Python环境）可复用，节省存储空间‌。2.‌容器（
Python 编程第一课：快速上手 Python 后端
Python环境搭建为了开始Python编程之旅，首先需要搭建Python环境。以下是简洁的环境搭建步骤：安装Python访问Python官方网站下载最新版本的Python安装包。按照安装向导完成安装，确保勾选“AddPythontoPATH”选项。安装集成开发环境(IDE)PyCharm：功能强大，适合大型项目开发，有社区版和专业版。VSCode：轻量级但功能丰富，可通过插件扩展功能，适合各种规
域名备案不得不说的那些事运维网站建设备案
在互联网时代，拥有一个自己的网站是很多开发者、创业者的刚需，但域名备案这道坎儿却让不少人头疼不已。许多人以为备案就是填个表格走个流程，结果反复提交十几次都被驳回，甚至因为备案问题导致项目延期数月。其实，备案失败往往是因为忽略了一些看似不起眼、实则致命的细节。域名备案的第一个大坑藏在域名实名认证环节。很多人觉得“张老三”和“张三”差不多，或者营业执照上的公司名和域名注册信息稍有出入也没关系，结果直接
mac OS matplotlib missing from font(s) DejaVu Sans 风轻扬777 matplotlib
如果能搜索到这篇文章，我猜你遇到了和我一样的问题：matplotlib绘图中文乱码。如下：出现这个问题的原因是：matplotlib使用的字体列表中默认没有中文字体。这里说一种解决方案：我们可以在文件中手动指定matplotlib使用的字体在python文件中指定matplotlib使用的字体，如下：plt.rcParams['font.sans-serif']=['STFangsong']#用来
Python第十四课：数据可视化 | 信息炼金术程之编 Python学习笔记 python 信息可视化开发语言
本节目标掌握Matplotlib基础图表绘制理解Seaborn高级统计可视化学会使用Pyecharts制作交互式图表开发实战项目：疫情数据动态仪表盘掌握可视化设计原则与优化技巧1️⃣可视化工具全景图生活化比喻:Matplotlib→手工雕刻刀（精细但需技巧）Seaborn→智能雕刻机（快速成型）Pyecharts→全息投影仪（动态交互）2️⃣Matplotlib基础：从折线到热力图折线图与柱状图i
【每日一练】python文件读.写.追加基本用法程之编 Python学习笔记 python
"""本节课程内容：1.打开一个文件，模式为写入2.用传参方式写入文件内容3.如何追加文件内容4.如何读取新写入的文件5.牢记操作完一定要关闭程序使用close()函数Ps：如果写完文件后就读取文件，需要使用seek(0)把指针复位到开头。否则，下面读取文件为空，因为写完后指针会停留在尾部。"""#打开文件flit=open('测试.txt','w',encoding='utf-8')#写入文件的
RuntimeWarning: Glyph 35745 missing from current font jst100 python 开发语言
出现该问题的在于在使用plt绘图时找不到合适字体来表示中文。解决方式对于Windows系统可以直接在原始文件中添加如下代码plt.rcParams['font.sans-serif']=['SimHei']对于MAC系统可以在python文件中添加如下代码plt.rcParams["font.family"]='ArialUnicodeMS'对于Linux系统则首先通过命令fc-list:la
idea+python+selenium自动化测试环境搭建-mac版本 guosasa 自动化测试工具
1、安装idea官网下载安装：https://www.jetbrains.com/idea/download/#section=mac2、安装python3官网下载python最新版本-mac版uname-a可以查看对应mac系统版本https://www.python.org/downloads/macos/
python爬虫之解决Matplotlib出现中文乱码、交互框架警告问题（UserWarning: Glyph XXXX missing from current font.）南沐成辰^ python 爬虫 matplotlib
文章目录前言一、pandas是什么？二、问题描述1.中文字体乱码2.Matplotlib后端警告三、问题原因分析1.中文字体问题：2.后端交互框架问题：四、解决方案1.解决中文字体乱码方法1：在代码中指定SimHei（黑体）字体方法2：在系统中安装中文字体2.解决Matplotlib交互后端警告五、总结前言使用Python的Matplotlib库进行数据可视化时，很多用户会遇到中文字符显示乱码或M
关于采用源始经为底层框架开发中文编程系统的可能性太翌修仙笔录 deepseek 超算法认知架构第三代人工智能算法人工智能
用中文写代码和Python哪个有前景在编程语言选择方面，**Python的发展前景明显优于中文编程语言**。以下是具体分析：---###一、核心结论**优先选择Python**，因为：1.**全球通用性**：Python是国际主流编程语言，适用于跨国协作和开源项目2.**就业市场需求**：Python在人工智能/大数据/Web开发等领域的岗位需求持续增长3.**技术生态优势**：拥有超过30万个第
Python核心技术，Django学习基础入门教程（附环境安装包）小白教程 python python django 学习 Django项目 Django项目实战 Django教程 Django入门教程
文章目录前言1.环境准备1.1Python安装1.2选择Python开发环境1.3创建虚拟环境1.4安装Django2.创建Django项目3.Django项目结构介绍4.启动开发服务器5.创建Django应用6.应用结构介绍7.编写视图函数8.配置URL映射9.运行项目并访问视图10.数据库配置与模型创建10.1数据库配置10.2创建模型11.使用Django管理界面11.1创建超级用户11.2
Mac环境python + selenium 环境搭建临安春雨霁 macos python selenium 软件测试自动化测试功能测试测试工程师
文章主要讲解Mac环境下如何搭建selenium环境。作者也是测试初学者，对selenium目前是一无所知的状态，希望从搭建环境开始对它逐步了解。环境准备本文采用的环境：•Python3.7.3PS：Mac环境会默认自带Python环境，但是Python2的版本，所以如果要使用Python3环境需要自行安装。因为本人没有进行环境配置，所以在终端中如果需要使用Python3的环境，需要输入pytho
建筑兔零基础自学python记录36|编程练习2 阿克兔 python 兔兔学习 python 开发语言
(1)//整除举例：17884161.28等于多少万？print(17884161.28//10000)得到1788.0不需要小数则用：print(int(17884161.28//10000))结果：1788（2）%取余（modulus）print(int(17884161.28%10000))结果：416117884161.28÷10000=1788.416128综合练习题目1：人民币与越南盾
CSnakes vs Python.NET：跨语言集成的巅峰对决与架构解密领码科技 AI应用技能篇实战篇跨语言集成 .NET Python 性能优化双向互操作
摘要本文深入剖析了.NET生态中两大Python集成方案——CSnakes与Python.NET的技术差异。从底层架构、类型系统、执行性能到应用场景，我们进行了全方位对比。CSnakes凭借源生成器与PythonC-API直连，实现了微秒级调用延迟；而Python.NET则通过动态类型系统构建了双向互操作桥梁。通过实测数据与典型场景推演，本文为开发者提供了精准的技术选型指南。关键词：跨语言集成、.
整合Python3.10 和 JDK1.8 docker镜像合成；java 调用python 敏君宝爸 python java docker
准备-rw-r--r--1rootroot5732月2213:20Dockerfile-rw-r--r--1rootroot26382752月2213:18eva-1.0-SNAPSHOT.jar-rw-r--r--1rootroot23812月2213:18pascal2labelme.py-rw-r--r--1rootroot602月2213:22requirements.txt-rw-r-
python的交互与脚本 0白露 Python python
##交互模式与脚本模式python有两种开发模式:交互模式-->默认进入python环境/idle里面就是进入的交互模式.类似于人类说话一样,一问一答.代码是一行行运行的.表现形式为>>>优点:用起来比较方便.即问即答.适合测试一些小的代码缺点:不能保存/修改脚本模式/文件模式-->新建一个文件来写代码.写好之后可以保存起来反复使用.修改起来也很方便优点:可以修改/保存缺点：需要大print等输出
爬虫技术结合淘宝商品快递费用API接口（item_fee）：电商物流数据的高效获取与应用 JelenaAPI小小爬虫淘宝API Python 爬虫 java 大数据
在电商运营中，快递费用的透明化和精准计算对于提升用户体验、优化物流成本以及增强市场竞争力至关重要。淘宝提供的item_fee接口能够帮助开发者快速获取商品的快递费用信息。本文将详细介绍如何利用Python爬虫技术结合item_fee接口，实现高效的数据获取与分析，助力电商企业优化运营。一、item_fee接口简介item_fee是淘宝开放平台提供的一个API接口，用于查询指定商品的快递费用信息。通
python写的烟花代码参考乔丹搞IT Python python 阿里云
#!/bin/python#coding:utf-8importturtleimportrandom#设置屏幕screen=turtle.Screen()screen.bgcolor("black")#创建烟花的绘制者firework=turtle.Turtle()firework.hideturtle()firework.speed(0)firework.color("white")#烟花爆炸效
Python 第二章：夯实基础，掌握核心码有余悸 python 开发语言
给大家及时更新了！！！欢迎大家积极学习前言：在第一章中，我们初步认识了Python，并搭建了开发环境，编写了第一个Python程序。本章我们将深入Python的基础知识，学习变量、数据类型、运算符、控制流程、函数等核心概念，为后续更复杂的编程任务打下坚实的基础。一、变量和数据类型变量：变量是用于存储数据的容器，每个变量都有一个唯一的名称。变量命名规则：变量名只能包含字母、数字和下划线，且不能以数字
04单细胞分析2025-Ubuntu22.04安装jupyter notebook 和 scanpy环境 lsxybe jupyter python scanpy ubuntu linux
创建新的环境scanpy312condacreate-nscanpy312python=3.12查看有几个环境condainfo-econdaactivatescanpy312安装jupyternotebookcondainstall-canacondanotebookjupyternotebook--no-browser安装scanpy$condainstall-cconda-forgescan
飞书多维表格+DeepSeek R1：打工人必备的AI神器，效率暴涨1000%！[特殊字符] sherlock__cc 人工智能飞书
导语当飞书多维表格遇上国产最强推理大模型DeepSeekR1，会擦出怎样的火花？本文手把手教你用「零代码」实现批量文案改写、论文精读、视频脚本生成。一、颠覆认知的三大核心优势1.批量处理的工业级效率单次处理1000+条数据，告别传统API逐条调用支持跨表格数据联动（如从CRM系统自动抓取客户需求）实时监控处理进度，失败任务自动重试2.零代码的极简交互无需Python环境配置直接输入自然语言指令（如
如何用python创建文件_python 如何新建一个新的File? weixin_39825105 如何用python创建文件
展开全部#pythonf=open('f.txt','w')#r只读，w可写，a追加2113foriinrange(0,10):f.write(str(i)+'\n')例子：#!/usr/bin/python#coding=utf-8importosimporttimeimportsysf=open('a.txt','a')f.write(os.popen('netstat-nltp|grep22
如何用python创建文件_,python 如何新建一个新的File? weixin_39551103 如何用python创建文件
cocos2d-x2.1.4为什么要用python脚本创建工程？有啥好处？1.跨平台方便，一个脚本生成所有平台的项目文件。2.脚本只提供最简单的默认路径下的初始模板，远远不够完善。移动到其他目录后，自己修改路径。VS2016中如何新建Python项目1。在数取方面强烈推荐使用TuShare2。在我们A荐成熟的pyalgotrade3。测试策略如Ricequant4。恒生的python-恒生量化5。
Linux音视频学习--音视频编解码相关基本概念介绍文艺小少年 IPC项目实践之音视频相关整理音视频 linux dsp isp
一、引言二、ISP、DSP------>1、ISP------------>内置isp------>2、DSP三、编解码------>1、视频编码------------>各个格式(H264/H265)的编码------------>码率调节------>2、音频编码------>3、码流、采样率、比特率、采样点数概念介绍------>4、采样点数一、引言入职的事终于告一段落，现在要慢慢开始熟悉新
Python连接SQL SEVER数据库全流程 web13508588635 数据库 python sql
背景介绍在数据分析领域，经常需要从数据库中获取数据进行分析和处理。而SQLServer是一种常用的关系型数据库管理系统，因此学习如何使用Python连接SQLServer数据库并获取数据是非常有用的。以下是Python使用pymssql连接SQLServer数据库的全流程：安装pymssql库本地账号设置脚本连接数据导入函数实现一、安装pymssqlpymssql是Python连接SQLServe
python 连接sql数据库荼靡~ #python基础 #sql数据库数据库 sql python
python连接sql数据库1.数据库操作1.1数据库连接1.2查看数据库1.3创建数据库1.4删除数据库1.5进入数据库2.表操作2.1创建表2.2查看表2.3删除表3.表数据操作3.1新增数据3.2删除数据3.3修改数据3.4查询数据4.事务回滚1.数据库操作1.1数据库连接importpymysqlconn=pymysql.connect(host='127.0.0.1',port=3306
chatglm3如何进行微调 learner_ctr 人工智能 chatglm3 llm
一、需要的环境内存：因为在loadmodel时，是先放在内存里面，所以内存不能小，最好在30GB左右显存：如果用half()精度来loadmodel的话(int4是不支持微调的)，显存在16GB就可以，比如可以用kaggle的t4gpu，这款性能相当于2070系列，但是显存翻倍python：3.10即可需要安装的包和版本：!pipinstallmodelscope-ihttps://pypi.tu
【Python编程】Python交互式应用框架巅峰对决 —— Streamlit vs Gradio 木亦汐丫 Python编程 Streamlit Gradio Jupyter Hugging Face Pandas PyTorch TensorFlow
Streamlit和Gradio都是非常受欢迎的Python交互式应用框架,但在构建Python交互式Web应用时该如何选择？它们各有独特的设计理念和适用场景，以下是基于功能特性、开发效率和应用场景的对比分析：一、核心定位与功能对比特性GradioStreamlit核心目标快速部署机器学习模型交互界面构建数据科学和复杂交互应用输入/输出支持支持文本、图像、音频、视频等基础组件支持更丰富的交互组件（
《会展管理：如何在竞争中脱颖而出？》
会展管理：从“小白”到“大咖”的进阶之路嘿，各位朋友！今天咱来唠唠会展管理那点事儿。在这个竞争激烈的时代，会展可是企业展示自我、拓展市场的重要舞台。但要把会展办好，可真不是件容易的事儿。别担心，今天我就带大家从零开始，一步步探索会展管理的奥秘，让你也能成为会展界的“大咖”！[]()一、明确目标，找准方向（一）市场调研：摸清“敌情”在筹备会展之前，先得搞清楚市场情况。就像打仗一样，要先侦察敌情。了解
python中怎么新建一个文件 2401_85978352 python
亲爱的朋友们，今天我们要探索，python如何新建一个文件夹如何用python新建一个文件，一起走进艺术家的内心世界，感受创作的魅力！目录一、新建工作空间二、新建项目三、新建包四、新建目录五、新建文件一、新建工作空间二、新建项目在PyCharm中新建python项目：File->NewProject->选择解释器和项目名称->点击Create即可三、新建包新建包：在项目根目录右键->New->Py
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文