LensonYuan

python项目在对外提供api服务时，利用多核的多进程开发避坑指南

项目落地：Python多进程开发与服务发布避坑

一、场景

当前有个Python项目，需要实现某个核心算法并提供api接口给其他部门调用；经过相关经验和测试分析，首选了sanic作为发布服务的框架（和flask差不多，不过sanic调用uvloop底层C性能更好）。另外，我们的核心算法需要小时级别的cpu密集型耗时计算，需要考虑api响应设计和多进程多核编程，提高核心算法的并发能力。

二、延时接口设计

对于无法立即响应的api接口，首先请求方是无法一直在请求等待，http一定会是超时的。所以，为了避免这个问题，一般采用两种方案：

设计一个接口，每次请求立即响应，通过设计状态码msg通知请求当前任务执行状态，当轮询这个接口时，遇到任务状态执行完毕，则从data区拉取结果。

@blue.route('/', methods=['POST'])
async def playground(request):
    """
    资源竞争调用测试与示例, 共享消息队列名为“request_queue”； 结果查询id为 sr = "{0}#{1}#{2}".format(guid, tb_name, func_name)
    Request:
{
    ‘guid’：此次任务的唯一id。
    'label_name': '[]' ,    （列表，是用户要分析的目标字段，包含字段名称、别名名称、字段类型）
    'feature_name': '[]' , （列表,是用户选择的除目标字段外的其它字段，包含字段名称、别名名称、字段类型）
    'table_name': '[]',     （列表,是用户分析数据表名称、表别名）
    'meta_data': '{}',       （字典,包含数据连接的信息：IP、端口、数据库名、用户名、密码等）
   ‘select_func’: ‘’    选择要运行的功能。单一任务

}
    :return:
    """
    # 请求参数解析
    req = sanic_request_para(request)
    guid = req.get('guid')
    tb_name = req.get('table_name')
    func_name = req.get('func_name')  # 功能代号，请求方法名
    label_name = req['label_name']
    feature_name = req['feature_name']
    # 测试代码, 自助创建唯一id
    guid = str(guid) + label_name[0]
    # 初始化返回值
    data = []
    resp = {'code': 400, 'msg': '异常', 'data': data}  # 初始化
    # 请求任务处理
    dispatcher_id = "{0}#{1}#{2}".format(guid, tb_name[0], func_name)
    # 查看结果列
    if base_redis.exists(dispatcher_id):  # 存在这个任务
        status = base_redis.hget(name=dispatcher_id, key='status')
        logs.info('任务「{0}」存在,当前状态为「{1}」'.format(dispatcher_id, status))
        if status is not None and status == 'running':
            resp = {'code': 201, 'msg': '当前已存在处理进程且在处理中', 'data': data}
        elif status is not None and status == 'complete':
            dt = base_redis.hget(name=dispatcher_id, key='data')
            data.append(dt)
            resp = {'code': 200, 'msg': '结果已返回到data区', 'data': data}
        elif status is not None and status == 'error':
            dt = base_redis.hget(name=dispatcher_id, key='data')
            data.append(dt)
            resp = {'code': 402, 'msg': '任务执行ERROR，在data区中查看错误信息', 'data': data}
        else:
            resp = {'code': 400, 'msg': '未知问题，请检查', 'data': data}
    else:
        # 没人在做，则生产任务消息
        r = {'guid': guid, 'table_name': tb_name, 'label_name': label_name, 'feature_name': feature_name, 'func_name': func_name}
        json_r = json.dumps(r)
        request_queue = request.app.config.get('request_queue')
        request_queue.put('abc')
        # base_redis.lpush('request_queue', json_r)
        resp = {'code': 202, 'msg': '已添加到任务队列', 'data': data}
    response_json = sanic_json(resp)
    return response_json

2. 设计两个接口，一个接口用来接收外部来的请求并生成任务计算，同时收到并返回一个回调地址，当任务完成时，通过回调地址主动上报通知执行状态和结果。另一个接口用于查询任务状态。

from flask import Flask, jsonify, request
import requests

app = Flask(__name__)

def long_running_task():
    # 执行长时间运行的计算任务
    result = {'result': '计算完成'}
    return result

@app.route('/api/calculate', methods=['POST'])
def calculate():
    # 启动异步任务
    task = long_running_task()
    # 生成回调地址
    callback_url = request.args.get('callback_url')
    # 发送HTTP请求，通知任务已完成
    requests.post(callback_url, json=task)
    # 返回任务ID和回调地址
    return jsonify({'task_id': 1, 'callback_url': callback_url})

@app.route('/api/task_status', methods=['GET'])
def task_status():
    # 查询任务ID
    task_id = request.args.get('task_id')
    # 根据任务ID从数据库或缓存中获取任务状态
    status = '运行中'
    if status == '完成':
        # 任务完成，获取结果并返回
        result = {'result': '计算完成'}
        return jsonify(result)
    else:
        # 任务未完成，返回状态
        return jsonify({'status': status})

三、sanic启动服务的坑

实现跨域服务需要添加中间件。一般调用api的发起者，不仅有后端也可能是前端页，所以要解决跨域。

@app.middleware("request")
def cors_middle_req(request: Request):
    """路由需要启用OPTIONS方法"""
    if request.method.lower() == 'options':
        allow_headers = [
            'Authorization',
            'content-type'
        ]
        headers = {
            'Access-Control-Allow-Methods':
                ', '.join(request.app.router.get_supported_methods(request.path)),
            'Access-Control-Max-Age': '86400',
            'Access-Control-Allow-Headers': ', '.join(allow_headers),
        }
        return HTTPResponse('', headers=headers)


@app.middleware("response")
def cors_middle_res(request: Request, response: HTTPResponse):
    """跨域处理"""
    allow_origin = '*'
    response.headers.update(
        {
            'Access-Control-Allow-Origin': allow_origin,
        }
    )

sanic启动进程的问题（sanic服务本身是多进程启动）
<1> app.run(host=‘0.0.0.0’, port=9905, workers=1, single_process=True, debug=False) 这个运行时，通过worker=1是无法控制为单进程的，worker为1时，依然会根据内核数和路由数来生成Python进程（可以看进程监控或看单例日志会启动几个）。所以真正要实现单进程启动api服务，必须要设置single_process=True才是真正的单进程。

<2> 为什么要单进程？ 参考tomcat启动服务也是单进程，另外我们是计算密集型的api，请求响应的并发量并不大。如果请求量大的话，应该把请求发布与计算功能分开在剥离一层。单进程发布服务，当你的多进程计算有相互依赖，比如输入的数据源或输出的结果等，这时会用到多进程管道或多进程消息队列。而这个 计算拆分出的并发多进程，和sanic启动的全局多进程是孤立的，无法提供一个多进程对象同时在这两块多进程之上协作。 除非你用redis或第三方数据库作为最高层的多进程存储交互，但即使这样，因为库和时延的问题，没有进程锁，一样很多资源竞争的问题。

四、Python多进程开发避坑

1. IO密集型任务使用多线程或协程

1> 多线程使用threading模块，如 t1 = threading.Thread(target=worker)；t1.start()等方式，当然也可以用线程池。
2> 使用轻量级的线程（协程），通过asyncio模块实现，并配合await关键字。
两者场景大致如下：

多线程适合处理需要等待时间较长的I/O任务，例如网络请求、文件读写等。在I/O任务等待期间，线程可以被阻塞，释放CPU资源，提高系统并发性。
协程适合处理需要频繁交互的在线游戏、聊天室等场景。通过异步处理消息收发，协程可以避免线程阻塞，保持长时间运行状态，提高系统响应速度。

2. CPU密集型任务（计算密集型）用多进程

1> 使用multiprocess模块或concurrent.futures。Python执行的 main 主函数一般不是守护进程（daemon=True），而在守护进程中创建子进程是会报错的。

守护进程会在主进程代码执行结束后就终止。
守护进程内无法再启动子进程，否则抛出异常：AssertionError: daemonic processes are not allowed to have children。
Python中的非守护进程（daemonic process）在主程序关闭后并不会自动结束。它们将继续运行，直到完成执行为止。

2> Python3.8以前的版本中，多进程池不支持设置进程为非守护进程。因此生成进程池对象的代码需要放到main主进程再引用传递到其他进程，或者是在非守护子进程中生成进程池对象。

main.py示例一

# main.py示例一
if __name__ == '__main__':
    multiprocessing.set_start_method('spawn')  # 选择从父进程复制资源而非继承。

    process = multiprocessing.Process(target=sanic_app, daemon=False)
    process.start()

    manager = multiprocessing.Manager()
    shared_mem = manager.dict()
    share_lock = manager.Lock()
    task_pool = multiprocessing.Pool(processes=3)
    
    Dispatcher.worker(task_pool, shared_mem, share_lock)
    
    process.close()
    logs.info('主程序退出！')

main.py示例二

# main.py 示例代码二
task_pool = multiprocessing.Pool(processes=3)
msg_queue = multiprocessing.Queue()
# 共享内存
manager = multiprocessing.Manager()
shared_primary = manager.dict()  # parquet读入的缓存数据
shared_result = manager.dict()  # 返回的处理结果
# sanic注册消息
app.config['task_result'] = shared_result
app.config['request_queue'] = msg_queue

loop_process = multiprocessing.Process(target=Dispatcher.worker, args=((task_pool, msg_queue, shared_primary, shared_result),))
loop_process.start()
# 注册蓝图
app.blueprint(blue)

if __name__ == '__main__':

    logs.info('run sanic workers num: %d', 1)
    # 多进程启动服务，因为需要大数据量的读写，会导致进程之间的资源无法共享读写，也没有统一的读写锁。而tomcat也是单进程，靠代码实现多进程。
    app.run(host='0.0.0.0', port=9905, workers=1, single_process=True, debug=False)  # 生产模式
    loop_process.close()
    logs.info('主程序退出！')

3> 示例代码一中，使用了multiprocessing.set_start_method(‘spawn’)，一般来说都是设置成spawn，防止不同系统带来的区别。

multiprocessing 模块有两种启动方法：spawn 和 forkserver。
在 Windows 平台上，spawn 是默认方法，其他情况下，默认使用 forkserver 方法。
spawn选择从父进程复制资源而非继承(forkserver)。
spawn 方法比 forkserver 方法更安全，因为它避免了与子进程共享地址空间和导入模块的问题，但在其他操作系统上，它需要显式地设置。

4> 一般来说，我们写的api需要发布成服务，比如用flask、sanic等web框架发布成restful接口。这里以sanic举例，因为sanic会利用多核进行多进程发布，当我们的算法func1和func2采用了多进程，而func1\func2之间还有竞争和依赖，比如多个不同请求其实输出同一份结果，那需要共享结果对象，防止重复计算。这个时候，sanic的多进程发布将会导致每个进程存在多个重复的结果对象。

worker设置其实不是单进程，因为worker=1时，监控系统会发现生成多个Python进程，如果使用了单例模式日志，也可以发现会多次初始化。因此单进程要采用此方法：app.run(host=‘0.0.0.0’, port=9905, workers=1, single_process=True, debug=False)
Sanic 的 worker 进程与标准操作系统的进程不完全一致，它是一个基于 Python 的 green thread 进程，可以在一个进程中启动多个 green thread 来实现并发处理请求。因此，Sanic 的 worker_processes 参数控制的是 green thread 的数量，而不是真正的操作系统进程数量。
Sanic 在处理请求时之所以会多次复制对象，是因为其使用了异步协程来处理请求，而每个协程都是一个独立的线程，拥有自己的内存空间和状态。

5> 一般来说，多进程之间的协作和通信，我们可以使用多进程管道、消息队列等方式实现数据传递。

管道（Pipe）：管道是一种实现进程间通信的基本方式。在 Python 中，可以使用 multiprocessing.Pipe 创建管道。
队列（Queue）：队列是一种线程安全的数据结构，可以用于多进程间通信。在 Python 中，可以使用 multiprocessing.Queue 创建队列。
共享内存（Shared Memory）：共享内存是一种在多个进程间共享数据的方式。在 Python 中，可以使用 multiprocessing.Value 和 multiprocessing.Array 实现共享内存。multiprocessing.Manager()也可以生成字典或list。
信号量（Semaphore）：信号量是一种用于控制多个进程对共享资源访问的同步机制。在 Python 中，可以使用 multiprocessing.Semaphore 实现信号量机制。
其他方式：还有一些其他的进程间通信方式，如redis、数据库等方式。
在使用多进程通信时，需要注意进程间数据同步和互斥访问的问题。可以使用锁（Lock）、信号量（Semaphore）等同步机制来保证数据的正确性和一致性。同时，还需要注意进程间通信的效率和安全性。

6>因为我们写的api需要发布成服务，所以要在更高一层抽象出公共对象，才能保证程序中的多进程和sanic中的服务进行通信。例如把sanic服务发布放到另一个进程中启动，用消息队列保证信息的收发。在用另一个进程中启动进程池，保证cpu密集型计算功能在进程池中根据消息队列进行消费。

3. sanic蓝图的坑及如何传递进程对象到路由中调用

在工程中，启动sanic服务的文件中，基本不会放路由代码，而是通过蓝图在其他py文件中写路由。我们经常会使用app.config[‘abc’]来传递对象，但发现传递进去的多进程对象一直为None。原来是因为蓝图注册动作app.blueprint(blue)，必须放在app.config之后，包括要传递的多进程对象。

main.py文件：

import multiprocessing
from multiprocessing import Process, Queue, Pool
from queue import Empty
from sanic import Sanic
from example.multi_process.fun import bp

app = Sanic(__name__)

def consumer(msg_queue):
    # 持续处理消息的代码
    while True:
        try:
            msg = msg_queue.get(timeout=1)
            # 处理消息的代码
            print(f'processing msg: {msg}')
        except Empty:
            pass


msg_queue = Queue()
p1 = Process(target=consumer, args=(msg_queue,))
p1.start()
p = Pool(processes=3)
print(p)

app.config['task_pool'] = p
app.config['msg_queue'] = msg_queue

app.blueprint(bp)

if __name__ == '__main__':

    app.run(host='0.0.0.0', port=8000, workers=1)

route.py文件：

from sanic import Blueprint
from sanic.response import text

bp = Blueprint('my_blueprint')

def fc(msg):
    print('功能1')
    print(msg)

@bp.route('/add_msg')
async def add_msg(request):
    msg = request.args.get('msg')
    if msg:
        msg_queue = request.app.config.get('msg_queue')
        msg_queue.put(msg)
        task_pool = request.app.config.get('task_pool')
        print(task_pool)
        task_pool.apply_async(fc, args=(msg,))
        return text('msg added to queue')
    else:
        return text('no msg provided')

3. Python多进程多核计算并发常用框架

Dask： Python类似于spark的分布式计算框架，适合gpu等，anconda自带，英伟达支持。
Pandarallel： 一个能让你的Pandas计算火力拉满的工具，https://blog.csdn.net/lemonbit/article/details/121528708
Celery： 一个分布式任务调度框架，可以将任务分发到多个进程或者多台机器上执行。
joblib： 一个用于科学计算的多进程框架，可以将函数并行化执行，提高代码的执行效率。

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
前端 NPM 包的依赖可视化分析工具推荐前端视界前端艺匠馆前端 npm arcgis ai
前端NPM包的依赖可视化分析工具推荐关键词：NPM、依赖管理、可视化分析、前端工程、包管理、依赖冲突、性能优化摘要：本文将深入探讨前端开发中NPM包依赖可视化分析的重要性，介绍5款主流工具的使用方法和特点，并通过实际案例展示如何利用这些工具优化项目依赖结构、解决版本冲突问题以及提升构建性能。文章将帮助开发者更好地理解和掌控项目依赖关系，提高开发效率和项目可维护性。背景介绍目的和范围本文旨在为前端开
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
零信任落地难题：安全性与用户体验如何两全？粤海科技君安全零信任终端安全网络安全 iOA
在零信任架构的实施过程中，平衡安全性与用户体验是企业数字化转型的核心命题。这一挑战的本质在于：既要通过「永不信任，持续验证」的安全机制抵御新型攻击，又要避免过度验证导致的效率损耗。一、矛盾根源：安全与体验的天然张力零信任的“永不信任”原则，本质上要求对每一次访问都进行动态评估，但这与用户对“便捷、流畅”的诉求存在天然冲突。例如：频繁的身份验证（如每次登录都需短信验证码）会打断工作节奏，某制造企业统
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
seaborn又一个扩展heatmapz qq_21478261 #Python可视化 matplotlib
推荐阅读：Pythonmatplotlib保姆级教程嫌Matplotlib繁琐？试试Seaborn！
NGS测序基础梳理01-文库构建（Library Preparation） qq_21478261 #生物信息生物学
本文介绍Illumina测序平台文库构建（LibraryPreparation）步骤，文库结构。写作时间：2020.05。推荐阅读：10W字《Python可视化教程1.0》来了！一份由公众号「pythonic生物人」精心制作的PythonMatplotlib可视化系统教程，105页PDFhttps://mp.weixin.qq.com/s/QaSmucuVsS_DR-klfpE3-Q10W字《Rg
C#中的设计模式：构建更加优雅的代码 Envyᥫᩣᩚ c#开发语言
C#在面向对象编程（OOP）方面的强大支持，我们可以探讨“C#中的设计模式”。这不仅有助于理解如何更好地组织代码，还能提高代码的可维护性和可扩展性。引言设计模式是软件工程中经过实践验证的解决方案模板，它们提供了一种标准化的方法来解决常见的开发问题。对于使用C#进行开发的程序员来说，理解和应用这些模式可以帮助创建结构良好、易于维护和扩展的应用程序。本文将介绍几种常用的设计模式，并展示如何用C#实现它
自动化运维工程师面试题解析【真题】
ZabbixAgent默认监听的端口是A.10050。以下是关键分析：选项排除：C.80是HTTP默认端口，与ZabbixAgent无关。D.5432是PostgreSQL数据库的默认端口，不涉及ZabbixAgent。B.10051是ZabbixServer的默认监听端口，用于接收Agent发送的数据，而非Agent自身的监听端口。ZabbixAgent的配置：根据官方文档，ZabbixAgen
Python 常用内置函数详解（七）：dir()函数——获取当前本地作用域中的名称列表或对象的有效属性列表
目录一、功能二、语法和示例一、功能dir()函数获取当前本地作用域中的名称列表或对象的有效属性列表。二、语法和示例dir()函数有两种形式，如果没有实参，则返回当前本地作用域中的名称列表。如果有实参，它会尝试返回该对象的有效属性列表。如果对象有一个名为__dir__()的方法，那么该方法将被调用，并且必须返回一个属性列表。dir()函数的语法格式如下：C:\Users\amoxiang>ipyth
pythonjson中list操作_Python json.dumps 特殊数据类型的自定义序列化操作
场景描述：Python标准库中的json模块，集成了将数据序列化处理的功能；在使用json.dumps()方法序列化数据时候，如果目标数据中存在datetime数据类型，执行操作时，会抛出异常：TypeError:datetime.datetime(2016,12,10,11,04,21)isnotJSONserializable那么遇到json.dumps序列化不支持的数据类型，该怎么办！首先，
Python 日期格式转json.dumps的解决方法 douyaoxin python json 开发语言
classDateEncoder(json.JSONEncoder):defdefault(self,obj):ifisinstance(obj,datetime.datetime):returnobj.strftime('%Y-%m-%d%H:%M:%S')elifisinstance(obj,datetime.date):returnobj.strftime("%Y-%m-%d")json.d
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class