IT策士

Python 多进程日志管理：最佳实践与实战指南

1. 引言

在现代软件开发中，多进程编程已经成为提高应用程序性能和效率的重要手段。然而，随之而来的是日志管理的复杂性增加。多个进程同时运行时，如何确保日志记录的准确性、一致性和可读性就成为了一个关键问题。本文将深入探讨 Python 多进程环境下的日志管理技术，提供全面的解决方案和最佳实践。

2. 多进程日志管理的挑战

在深入具体的解决方案之前，让我们先了解多进程环境下日志管理面临的主要挑战：

并发写入冲突：多个进程同时写入同一个日志文件可能导致数据混乱或丢失。
日志顺序：确保来自不同进程的日志按照正确的时间顺序记录。
进程识别：在日志中区分不同进程的输出。
性能影响：频繁的日志写入可能会影响多进程应用的整体性能。
日志聚合：如何有效地收集和整合来自多个进程的日志。

3. Python 日志模块简介

在开始多进程日志管理之前，我们需要先了解 Python 的内置日志模块 logging。这个模块提供了灵活且强大的日志功能。

3.1 基本用法

import logging

# 配置基本的日志格式
logging.basicConfig(level=logging.INFO, 
                    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s')

# 创建一个日志记录器
logger = logging.getLogger(__name__)

# 使用日志记录器
logger.info("这是一条信息日志")
logger.warning("这是一条警告日志")
logger.error("这是一条错误日志")

输出结果：

2024-11-11 19:15:23,456 - __main__ - INFO - 这是一条信息日志
2024-11-11 19:15:23,457 - __main__ - WARNING - 这是一条警告日志
2024-11-11 19:15:23,458 - __main__ - ERROR - 这是一条错误日志

3.2 日志级别

Python 的 logging 模块定义了几个标准的日志级别，按严重程度递增排序：

DEBUG
INFO
WARNING
ERROR
CRITICAL

通过设置日志级别，我们可以控制哪些消息会被记录。

3.3 日志处理器

日志处理器决定了日志消息的去向。常用的处理器包括：

StreamHandler：将日志输出到控制台
FileHandler：将日志写入文件
RotatingFileHandler：写入文件，并在文件达到特定大小时轮转
TimedRotatingFileHandler：基于时间间隔进行日志轮转

4. 多进程日志管理策略

现在，让我们探讨几种在多进程环境中管理日志的策略。

4.1 使用 Queue 和单独的日志进程

这种方法涉及创建一个专门的日志进程，其他工作进程通过队列发送日志消息给它。

import logging
import multiprocessing
import random
import time

def worker_process(queue):
    logger = logging.getLogger(f"Worker-{multiprocessing.current_process().name}")
    for _ in range(5):
        time.sleep(random.random())
        logger.info(f"Worker {multiprocessing.current_process().name} is working")
        queue.put(logger.name + ": " + f"Worker {multiprocessing.current_process().name} is working")

def logger_process(queue):
    logger = logging.getLogger("LoggerProcess")
    logger.setLevel(logging.INFO)
    handler = logging.FileHandler("multiprocess.log")
    formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
    handler.setFormatter(formatter)
    logger.addHandler(handler)

    while True:
        try:
            record = queue.get()
            if record == "STOP":
                break
            logger.info(record)
        except Exception:
            import sys, traceback
            print('Whoops! Problem:', file=sys.stderr)
            traceback.print_exc(file=sys.stderr)

if __name__ == "__main__":
    queue = multiprocessing.Queue(-1)
    logger_p = multiprocessing.Process(target=logger_process, args=(queue,))
    logger_p.start()

    workers = []
    for i in range(5):
        worker = multiprocessing.Process(target=worker_process, args=(queue,))
        workers.append(worker)
        worker.start()

    for worker in workers:
        worker.join()

    queue.put("STOP")
    logger_p.join()

这个示例创建了一个专门的日志进程和多个工作进程。工作进程通过队列发送日志消息，日志进程从队列接收消息并写入文件。

输出结果（multiprocess.log）：

2024-11-11 19:20:12,345 - LoggerProcess - INFO - Worker-Process-2: Worker Process-2 is working
2024-11-11 19:20:12,678 - LoggerProcess - INFO - Worker-Process-3: Worker Process-3 is working
2024-11-11 19:20:13,123 - LoggerProcess - INFO - Worker-Process-1: Worker Process-1 is working
2024-11-11 19:20:13,456 - LoggerProcess - INFO - Worker-Process-4: Worker Process-4 is working
2024-11-11 19:20:13,789 - LoggerProcess - INFO - Worker-Process-5: Worker Process-5 is working
...

4.2 使用进程安全的 RotatingFileHandler

我们可以创建一个自定义的 RotatingFileHandler，使其在多进程环境中安全工作。

import multiprocessing
import logging
from logging.handlers import RotatingFileHandler
import time
import random
import os

class MultiProcessSafeHandler(RotatingFileHandler):
    def __init__(self, filename, mode='a', maxBytes=0, backupCount=0, encoding=None, delay=False):
        super().__init__(filename, mode, maxBytes, backupCount, encoding, delay)
        self.mode = mode
        self.encoding = encoding
        self.delay = delay
        self.maxBytes = maxBytes
        self.backupCount = backupCount

    def emit(self, record):
        try:
            if self.shouldRollover(record):
                self.doRollover()
            logging.FileHandler.emit(self, record)
        except Exception:
            self.handleError(record)

    def doRollover(self):
        if self.stream:
            self.stream.close()
            self.stream = None
        if self.backupCount > 0:
            for i in range(self.backupCount - 1, 0, -1):
                sfn = self.rotation_filename("%s.%d" % (self.baseFilename, i))
                dfn = self.rotation_filename("%s.%d" % (self.baseFilename, i + 1))
                if os.path.exists(sfn):
                    if os.path.exists(dfn):
                        os.remove(dfn)
                    os.rename(sfn, dfn)
            dfn = self.rotation_filename(self.baseFilename + ".1")
            if os.path.exists(dfn):
                os.remove(dfn)
            self.rotate(self.baseFilename, dfn)
        if not self.delay:
            self.stream = self._open()

    def shouldRollover(self, record):
        if self.stream is None:
            self.stream = self._open()
        if self.maxBytes > 0:
            msg = "%s\n" % self.format(record)
            self.stream.seek(0, 2)
            if self.stream.tell() + len(msg) >= self.maxBytes:
                return 1
        return 0

def worker_process(name):
    logger = logging.getLogger(name)
    for _ in range(5):
        time.sleep(random.random())
        logger.info(f"Worker {name} is working")

if __name__ == "__main__":
    log_file = "multiprocess_safe.log"
    handler = MultiProcessSafeHandler(log_file, maxBytes=1024, backupCount=5)
    formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
    handler.setFormatter(formatter)

    root_logger = logging.getLogger()
    root_logger.setLevel(logging.INFO)
    root_logger.addHandler(handler)

    processes = []
    for i in range(5):
        p = multiprocessing.Process(target=worker_process, args=(f"Worker-{i}",))
        processes.append(p)
        p.start()

    for p in processes:
        p.join()

这个示例创建了一个进程安全的 RotatingFileHandler，可以在多个进程间安全地共享。

输出结果（multiprocess_safe.log）：

2024-11-11 19:25:34,567 - Worker-0 - INFO - Worker Worker-0 is working
2024-11-11 19:25:34,789 - Worker-1 - INFO - Worker Worker-1 is working
2024-11-11 19:25:35,123 - Worker-2 - INFO - Worker Worker-2 is working
2024-11-11 19:25:35,456 - Worker-3 - INFO - Worker Worker-3 is working
2024-11-11 19:25:35,789 - Worker-4 - INFO - Worker Worker-4 is working
...

4.3 使用 multiprocessing.log_to_stderr()

对于简单的场景，我们可以使用 multiprocessing 模块提供的 log_to_stderr() 函数将日志输出到标准错误流。

import multiprocessing
import logging
import time
import random

def worker_process(name):
    logger = multiprocessing.get_logger()
    for _ in range(5):
        time.sleep(random.random())
        logger.info(f"Worker {name} is working")

if __name__ == "__main__":
    multiprocessing.log_to_stderr(logging.INFO)

    processes = []
    for i in range(5):
        p = multiprocessing.Process(target=worker_process, args=(f"Worker-{i}",))
        processes.append(p)
        p.start()

    for p in processes:
        p.join()

这个方法简单直接，但可能不适合需要将日志保存到文件的场景。

输出结果（标准错误流）：

[INFO/Worker-0] Worker Worker-0 is working
[INFO/Worker-1] Worker Worker-1 is working
[INFO/Worker-2] Worker Worker-2 is working
[INFO/Worker-3] Worker Worker-3 is working
[INFO/Worker-4] Worker Worker-4 is working
...

5. 高级日志管理技巧

5.1 使用上下文管理器

我们可以使用上下文管理器来确保日志资源的正确释放。

import logging
import multiprocessing
from contextlib import contextmanager

@contextmanager
def log_manager(name):
    logger = logging.getLogger(name)
    handler = logging.FileHandler(f"{name}.log")
    formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
    handler.setFormatter(formatter)
    logger.addHandler(handler)
    logger.setLevel(logging.INFO)
    
    try:
        yield logger
    finally:
        handler.close()
        logger.removeHandler(handler)

def worker_process(name):
    with log_manager(name) as logger:
        for i in range(5):
            logger.info(f"Worker {name} is working - step {i}")

if __name__ == "__main__":
    processes = []
    for i in range(5):
        p = multiprocessing.Process(target=worker_process, args=(f"Worker-{i}",))
        processes.append(p)
        p.start()

    for p in processes:
        p.join()

这个示例为每个工作进程创建一个单独的日志文件，并使用上下文管理器确保资源的正确管理。

输出结果（Worker-0.log）：

2024-11-11 19:30:12,345 - Worker-0 - INFO - Worker Worker-0 is working - step 0
2024-11-11 19:30:12,456 - Worker-0 - INFO - Worker Worker-0 is working - step 1
2024-11-11 19:30:12,567 - Worker-0 - INFO - Worker Worker-0 is working - step 2
2024-11-11 19:30:12,678 - Worker-0 - INFO - Worker Worker-0 is working - step 3
2024-11-11 19:30:12,789 - Worker-0 - INFO - Worker Worker-0 is working - step 4

5.2 使用 logging.config 进行配置

对于更复杂的日志配置，我们可以使用 logging.config 模块。

# logging.yaml 配置文件内容
"""
version: 1
formatters:
  standard:
    format: '%(asctime)s - %(name)s - %(levelname)s - %(message)s'
handlers:
  console:
    class: logging.StreamHandler
    level: DEBUG
    formatter: standard
    stream: ext://sys.stdout
  file:
    class: logging.handlers.RotatingFileHandler
    level: INFO
    formatter: standard
    filename: multiprocess_app.log
    maxBytes: 10485760
    backupCount: 5
    encoding: utf8
loggers:
  worker:
    level: INFO
    handlers: [console, file]
    propagate: no
root:
  level: INFO
  handlers: [console]
"""

```python
import logging.config
import multiprocessing
import yaml
import os

def setup_logging(config_path='logging.yaml', default_level=logging.INFO):
    if os.path.exists(config_path):
        with open(config_path, 'rt') as f:
            try:
                config = yaml.safe_load(f.read())
                logging.config.dictConfig(config)
            except Exception as e:
                print(f'Error in Logging Configuration: {e}')
                logging.basicConfig(level=default_level)
    else:
        logging.basicConfig(level=default_level)
        print('Failed to load configuration file. Using default configs')

def worker_process(name):
    logger = logging.getLogger(f"worker.{name}")
    for i in range(5):
        logger.info(f"Worker {name} processing task {i}")
        time.sleep(random.random())

if __name__ == "__main__":
    setup_logging()
    
    processes = []
    for i in range(5):
        p = multiprocessing.Process(target=worker_process, args=(f"Worker-{i}",))
        processes.append(p)
        p.start()

    for p in processes:
        p.join()

5.3 实现自定义日志过滤器

有时我们需要对日志进行更精细的控制，可以通过实现自定义过滤器来实现。

import logging
import multiprocessing
import time
import random

class ProcessFilter(logging.Filter):
    """自定义进程过滤器，用于过滤特定进程的日志"""
    
    def __init__(self, process_name=None):
        super().__init__()
        self.process_name = process_name

    def filter(self, record):
        if self.process_name is None:
            return True
        return record.processName == self.process_name

def setup_logger(name, log_file, level=logging.INFO, process_name=None):
    formatter = logging.Formatter(
        '%(asctime)s - %(processName)s - %(name)s - %(levelname)s - %(message)s'
    )
    
    handler = logging.FileHandler(log_file)
    handler.setFormatter(formatter)
    
    logger = logging.getLogger(name)
    logger.setLevel(level)
    
    if process_name:
        process_filter = ProcessFilter(process_name)
        handler.addFilter(process_filter)
    
    logger.addHandler(handler)
    return logger

def worker_task(name):
    logger = setup_logger(
        name=f"worker.{name}",
        log_file="filtered_processes.log",
        process_name=multiprocessing.current_process().name
    )
    
    for i in range(5):
        logger.info(f"Processing task {i}")
        time.sleep(random.random())

if __name__ == "__main__":
    processes = []
    for i in range(3):
        p = multiprocessing.Process(
            target=worker_task,
            name=f"Worker-{i}",
            args=(f"Worker-{i}",)
        )
        processes.append(p)
        p.start()

    for p in processes:
        p.join()

输出结果（filtered_processes.log）：

2024-11-11 19:35:23,456 - Worker-0 - worker.Worker-0 - INFO - Processing task 0
2024-11-11 19:35:23,789 - Worker-1 - worker.Worker-1 - INFO - Processing task 0
2024-11-11 19:35:24,123 - Worker-2 - worker.Worker-2 - INFO - Processing task 0
2024-11-11 19:35:24,456 - Worker-0 - worker.Worker-0 - INFO - Processing task 1
...

5.4 实现日志聚合器

在分布式系统中，我们可能需要将多个进程的日志聚合到一个中心位置。

import logging
import multiprocessing
import queue
import threading
import time
import random
from datetime import datetime

class LogAggregator:
    def __init__(self, output_file):
        self.output_file = output_file
        self.log_queue = multiprocessing.Queue()
        self.should_stop = multiprocessing.Event()
        self.aggregator_process = None

    def start(self):
        self.aggregator_process = multiprocessing.Process(
            target=self._aggregate_logs
        )
        self.aggregator_process.start()

    def stop(self):
        self.should_stop.set()
        self.log_queue.put(None)  # 发送停止信号
        if self.aggregator_process:
            self.aggregator_process.join()

    def _aggregate_logs(self):
        with open(self.output_file, 'a') as f:
            while not self.should_stop.is_set():
                try:
                    log_entry = self.log_queue.get(timeout=1)
                    if log_entry is None:
                        break
                    f.write(f"{log_entry}\n")
                    f.flush()
                except queue.Empty:
                    continue

    def log(self, message, level="INFO", process_name=None):
        timestamp = datetime.now().strftime('%Y-%m-%d %H:%M:%S.%f')[:-3]
        process_name = process_name or multiprocessing.current_process().name
        log_entry = f"{timestamp} - {process_name} - {level} - {message}"
        self.log_queue.put(log_entry)

def worker_process(aggregator, worker_id):
    for i in range(5):
        message = f"Worker {worker_id} processing task {i}"
        aggregator.log(message)
        time.sleep(random.random())

if __name__ == "__main__":
    # 创建日志聚合器
    aggregator = LogAggregator("aggregated_logs.log")
    aggregator.start()

    # 创建多个工作进程
    processes = []
    for i in range(3):
        p = multiprocessing.Process(
            target=worker_process,
            args=(aggregator, i)
        )
        processes.append(p)
        p.start()

    # 等待所有进程完成
    for p in processes:
        p.join()

    # 停止日志聚合器
    aggregator.stop()

输出结果（aggregated_logs.log）：

2024-11-11 19:40:12.345 - Worker-0 - INFO - Worker 0 processing task 0
2024-11-11 19:40:12.456 - Worker-1 - INFO - Worker 1 processing task 0
2024-11-11 19:40:12.567 - Worker-2 - INFO - Worker 2 processing task 0
2024-11-11 19:40:12.789 - Worker-0 - INFO - Worker 0 processing task 1
...

5.5 实现分级日志存储

对于大型应用，我们可能需要根据日志级别将日志分别存储。

import logging
import multiprocessing
import os
from datetime import datetime
import time
import random

class MultiLevelLogger:
    def __init__(self, base_dir="logs"):
        self.base_dir = base_dir
        self.levels = {
            'DEBUG': logging.DEBUG,
            'INFO': logging.INFO,
            'WARNING': logging.WARNING,
            'ERROR': logging.ERROR,
            'CRITICAL': logging.CRITICAL
        }
        self._setup_directories()
        self._setup_loggers()

    def _setup_directories(self):
        for level in self.levels.keys():
            dir_path = os.path.join(self.base_dir, level.lower())
            os.makedirs(dir_path, exist_ok=True)

    def _setup_loggers(self):
        self.loggers = {}
        for level_name, level_value in self.levels.items():
            logger = logging.getLogger(f"multi_level.{level_name}")
            logger.setLevel(level_value)

            # 创建文件处理器
            log_file = os.path.join(
                self.base_dir,
                level_name.lower(),
                f"{level_name.lower()}_{datetime.now().strftime('%Y%m%d')}.log"
            )
            handler = logging.FileHandler(log_file)
            
            # 设置格式化器
            formatter = logging.Formatter(
                '%(asctime)s - %(processName)s - %(name)s - %(levelname)s - %(message)s'
            )
            handler.setFormatter(formatter)
            
            logger.addHandler(handler)
            self.loggers[level_name] = logger

    def log(self, level, message):
        if level in self.loggers:
            self.loggers[level].log(self.levels[level], message)

def worker_process(logger, worker_id):
    levels = ['DEBUG', 'INFO', 'WARNING', 'ERROR', 'CRITICAL']
    for i in range(5):
        level = random.choice(levels)
        message = f"Worker {worker_id} generated {level} message for task {i}"
        logger.log(level, message)
        time.sleep(random.random())

if __name__ == "__main__":
    # 创建多级日志记录器
    multi_logger = MultiLevelLogger()

    # 创建多个工作进程
    processes = []
    for i in range(3):
        p = multiprocessing.Process(
            target=worker_process,
            args=(multi_logger, i)
        )
        processes.append(p)
        p.start()

    # 等待所有进程完成
    for p in processes:
        p.join()

这个示例会在不同的目录中创建不同级别的日志文件：

logs/
├── debug/
│   └── debug_20241111.log
├── info/
│   └── info_20241111.log
├── warning/
│   └── warning_20241111.log
├── error/
│   └── error_20241111.log
└── critical/
    └── critical_20241111.log

6. 最佳实践建议

使用进程安全的处理器：在多进程环境中，始终使用线程安全和进程安全的日志处理器。
适当的日志级别：根据实际需求设置合适的日志级别，避免记录过多不必要的信息。
日志轮转：实现日志轮转机制，防止日志文件过大。
错误处理：确保日志记录操作不会影响主要业务逻辑的执行。
性能考虑：
- 使用异步日志记录
- 批量写入日志
- 合理设置缓冲区大小
日志格式统一：确保所有进程使用统一的日志格式，便于后续分析。
监控和维护：定期检查日志文件大小和存储空间。

7. 总结

Python 多进程日志管理是一个复杂但重要的主题。通过本文介绍的各种技术和最佳实践，我们可以构建一个健壮的日志管理系统，满足多进程应用程序的需求。关键是要根据具体应用场景选择合适的方案，并注意性能和可维护性的平衡。

CodeBuild构建文件复制到特定目录处理亚林瓜子 linux 运维服务器
version:0.2phases:install:runtime-versions:java:corretto17pre_build:commands:-mvn--versionbuild:commands:-mvnclean&&mvnpackage-Dmaven.test.skip=truepost_build:commands:-mkdir-ppackaged-artifact/.ebext
牛客 - 倒置字符串(java)
题目解题思路解题代码题链接题目解题思路解题代码importjava.util.*;publicclassMain{//定义翻转字符数组的方法publicstaticvoidreverse(char[]arr,intstart,intend){while(start
Gson、Fastjson 和 Jackson 对比解析小张0.0 JavaWeb json
目录1.Gson(Google)基本介绍：核心功能：特点：使用场景：2.Fastjson(Alibaba)基本介绍：核心功能：特点：使用场景：3.Jackson基本介绍：核心功能：特点：使用场景：4.对比总结5.选择建议Gson、Fastjson和Jackson这三种都是Java生态中广泛使用的JSON处理库，用于实现Java对象与JSON数据之间的相互转换。在项目中使用不同的方法即可调用不同的J
牛客-倒置字符串小张0.0 OJ算法题题目心得算法 leetcode 动态规划
1.题目描述2.题目链接倒置字符串_牛客题霸_牛客网3.代码解答importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannerscanner=newScanner(System.in);Strings=scanner.nextLine();//按空格分割单词（处理多个连续空格的情况，split("
使用Meteor构建实时仪表板的完整指南杏花朵朵 Meteor 实时仪表板 Vue组件路由设置集合集成
背景简介随着现代Web应用对实时性和响应性的要求不断提高，开发人员需要使用强大的框架来构建能够满足这些需求的应用程序。Meteor作为一个全栈JavaScript框架，提供了一种快速开发实时Web应用的方法。本文将通过构建一个实时仪表板项目，详细探讨Meteor的特点和使用方法。Meteor简介Meteor是一个全栈JavaScript框架，用于构建Web应用程序。它的主要元素包括Web客户端、基
Git小白的正确使用姿势与最佳实践 -睡到自然醒~ git elasticsearch 大数据 golang 开发语言后端 python
Git是由Linux之父LinusTorvalds在2005年创造的，目的是为了管理Linux内核的开发。Git的设计目标是实现高效的分支和合并，以及对大型项目的快速处理。1.安装Git要开始使用Git，你需要先安装Git的客户端软件。你可以从官方网站下载适合你的操作系统的安装包，或者使用你的包管理器来安装。例如，在Windows系统上，你可以下载并运行GitforWindows的安装程序。安装完
完善Meteor应用的NPM集成——meteorhacks/npm项目推荐尤峻淳Whitney
完善Meteor应用的NPM集成——meteorhacks/npm项目推荐1.项目基础介绍及编程语言meteorhacks/npm是一个开源项目，旨在为Meteor应用提供完整的NPM模块集成。该项目通过允许在Meteor应用内部使用NPM模块，极大地扩展了Meteor应用的功能性和灵活性。该项目的主要编程语言是JavaScript。2.项目核心功能项目的核心功能是提供一个桥接器，让开发者可以在M
火爆全网的条形竞赛图，Python轻松实现统计学家
image这个动图叫条形竞赛图，非常适合制作随时间变动的数据。我已经用streamlit+bar_chart_race实现了，然后白嫖了heroku的服务器，大家通过下面的网址上传csv格式的表格就可以轻松制作条形竞赛图，生成的视频可以保存本地。https://bar-chart-race-app.herokuapp.com/本文我将实现过程介绍一下，白嫖服务器+部署留在下期再讲。纯matplot
node.js详解思静鱼 node.js node.js
文章目录一、什么是Node.js？二、Node.js的核心组成三、Node.js的运行机制（事件循环）四、常见内置模块（无需安装）五、应用场景六、npm包生态七、Node.js适合哪些人？八、优缺点总结一、什么是Node.js？Node.js是一个基于ChromeV8引擎的JavaScript运行时，用于构建高性能网络应用。由RyanDahl于2009年发布。允许你在服务器端使用JavaScrip
【无标题】Python---day9 模块化编程概念（模块、包、导入）及常见系统模块总结和第三方模块管理 AnAn__kang python java 服务器
系列文章目录前言跟着博主学Python，今天我们来到了第九天的学习，模块化编程的概念。Python作为一门编程语言，本身就是用于对模块以及各种包的使用来达到我们自己想到创作的目的。所以今天博主就给大家盘点一下有关于各种常见的包以及如何进行导入的。一.模块Module，模块1.1基本概念定义：模块是一个Python文件，每个.py.py.py文件就是一个模块。作用：用于组织代码，避免代码重复，提高复
Python --- day 10 Opencv模块的使用 AnAn__kang python opencv 开发语言
系列文章目录前言今天博主带大家进入Opencv的学习，这是一个专门针对处理图像和视频的一个模块，大家以理解为主，增强自己的编程思维，再后续我们训练模型时会大批量的处理图片时会经常用到这个模块。1OpenCV介绍OpenCV（开放源代码计算机视觉库）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成，用于图像处理、计算机视觉领域的算法实现。1.1OpenCV优势**开源免费：**完全
【无标题】Python --- Day5 函数的位置传参、关键词传参及其可变性和解包操作 AnAn__kang python 前端人工智能
系列文章目录前言今天小伙伴们跟我进入第五天的Python课程学习，主要是关于函数的位置传参，关键传参和可变性和解包传参这其中的具体定义以及它们的使用场景`一、调用传参函数调用时传递参数的方式有多种，包括位置传参、关键词传参、多个参数解包、参数默认值等。1.1位置传参最常见的传参方式，参数按定义的顺序依次传入函数。示例：defgreet(name,age):print(f"Hello,{name}.
时序数据库在数据库领域的行业应用数据库管理艺术数据库时序数据库 ai
时序数据库在数据库领域的行业应用关键词：时序数据库、数据库领域、行业应用、时间序列数据、实时分析摘要：本文深入探讨了时序数据库在数据库领域的行业应用。首先介绍了时序数据库的背景知识，包括其目的、适用读者、文档结构和相关术语。接着阐述了时序数据库的核心概念、架构和工作原理，通过Python代码详细讲解了核心算法。还介绍了相关的数学模型和公式，并举例说明。在项目实战部分，给出了开发环境搭建、源代码实现
Python --- Day3 推导式及常见语句和内置函数的学习！！！
系列文章目录前言相信各位伙伴们在前俩次的文章和Python的基础学习中大有收获，这次我们将进入推导式，常见语句和内置函数的学习！跟着博主一起成为一名Ai的算法工程师！一、推导式用更简洁的方式创建列表、字典和集合。是Python特有的一种表达式形式。1.1列表推导式a=[1,2,3,4]result=[x*2forxina]#创建一个新列表，元素是原列表每个元素的两倍1.2字典推导式a=['a','
cuda编程python接口_使用Python写CUDA程序的方法 weixin_39822184 cuda编程python接口
使用Python写CUDA程序有两种方式：*Numba*PyCUDAnumbapro现在已经不推荐使用了，功能被拆分并分别被集成到accelerate和Numba了。例子numbaNumba通过及时编译机制(JIT)优化Python代码，Numba可以针对本机的硬件环境进行优化，同时支持CPU和GPU的优化，并且可以和Numpy集成，使Python代码可以在GPU上运行，只需在函数上方加上相关的指
基于 Python 的网站信息探测工具设计与实现计算机毕业设计指导 python 网络服务器
基于Python的网站信息探测工具设计与实现摘要在渗透测试与网络安全评估中，信息探测是最基础且关键的一步。通过对目标网站的操作系统、服务器、CMS、端口、目录结构等信息进行自动化探测，可为后续攻击路径识别提供基础数据支撑。传统工具如WhatWeb、FOFA等虽功能强大，但在定制化与扩展性方面受限。本文设计并实现了一款基于Python的轻量级网站信息探测工具，支持URL/IP扫描、开放端口探测、CM
使用CrewAI创建一个研究团队 AI量化投资 php 开发语言多智能体智能体人工智能
本指导文档将带你一步步完成使用CrewAI框架创建你的第一个AI代理团队的过程。通过这个简单的示例，你将学习如何构建一个研究团队，用于研究和分析指定主题，并生成一份综合报告。本教程基于CrewAI官方文档，适合初学者快速上手。前提条件在开始之前，请确保你已完成以下准备工作：安装Python：确保你的系统安装了Python版本在3.10到3.13之间。你可以通过以下命令检查Python版本：pyth
Python成第四个支持CUDA的编程语言
Python成第四个支持CUDA的编程语言3月19日NVIDIA的GTC2013图形技术大会将开幕，在此之前会有很多宣传造势内容，其中最重大也是最主要的就是NVIDIA老总黄仁勋的开幕词了，其他合作伙伴也会发布各自的演讲。ContinuumAnalytics联合NVIDIA宣布将会引入新的PythonCUDA编译器——NumbaPro，Python也成为继C、C++以及Fortan之后的第四个支持
48Days-Day03 | 删除公共字符，两个链表的第一个公共结点，mari和shiny TinaAmber 笔试训练48Days 链表 java 算法
删除公共字符删除公共字符_牛客题霸_牛客网算法思路直接哈希，把第二个字符塞集合里面，遍历第一个，只要在集合里面有的就跳过代码importjava.util.HashSet;importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannerscan=newScanner(System.in);Strin
面试实战，问题一，讲一下Springboot的作用
SpringBoot框架的主要作用和功能SpringBoot是由Pivotal团队开发的一个开源Java框架，旨在显著简化基于Spring框架的应用程序开发过程。它通过提供一系列自动化工具和约定，帮助开发者快速构建独立、生产就绪的应用程序。下面我将逐步介绍其主要作用和核心功能，确保回答清晰易懂。主要作用简化Spring应用程序开发：SpringBoot的核心目标是降低Spring框架的入门门槛和配
Python FastMCP：让你的AI工具链飞起来
PythonFastMCP：让你的AI工具链飞起来FastMCPFastMCP是什么？1.工具(Tools)：赋予LLM执行能力2.Resources（资源）：安全数据通道3.Prompts（提示模板）：标准化LLM交互4.组件协同：构建项目AI工具链5.部署架构与性能优化博主热门文章推荐：官方文档：FastMCP官方文档：https://gofastmcp.com/MCP协议规范：https:/
Python 解析 PDF 文件的基础方法电脑维修员xy python pdf 前端
```htmlPython解析PDF文件的基础方法Python解析PDF文件的基础方法在现代数据处理和信息提取任务中，PDF文件是一种常见的文档格式。然而，PDF文件的结构复杂且难以直接解析，尤其是当需要从中提取文本或数据时。幸运的是，Python提供了多种强大的库来帮助我们轻松地解析PDF文件。1.PyPDF2库PyPDF2是一个功能强大的Python库，用于处理PDF文件。它可以读取、分割、合
面试挂在阿里，庆幸拿到网易offer，一位三年Java岗面试总，细节如下小迁不秃头
前言15年毕业到现在有三年多了，最近去面试了阿里集团（菜鸟网络，蚂蚁金服），网易，滴滴，点我达，最终收到点我达，网易offer，蚂蚁金服二面挂掉，菜鸟网络一个月了还在流程中...最终有幸去了网易。但是要特别感谢点我达的领导及HR，真的非常非常好，很感谢他们一直的关照和指导。面试整体事项1.简历要准备好，联系方式一定要正确清晰醒目，项目经历按照时间倒序阐述，注意描述自己在项目中承担的职责，简历的模板
socket网络通信TCP与UDP原理及代码实现（c++、python）
目录Socket原理通信协议原理TCPUDP代码实现TCPC++pythonUDPC++pythonSocket原理Socket（套接字）是计算机网络中用于实现进程间通信的一种机制，特别是在不同主机之间通过网络进行数据传输时。它是网络编程的核心概念之一，为应用程序提供了统一的接口，使得开发者可以通过网络发送和接收数据。可以将Socket类比为电话系统中的“电话机”。两台设备通过Socket建立连接
【Qt Designer使用快捷键】
QtDesigner简介QtDesigner是Qt框架提供的可视化界面设计工具，用于快速创建GUI（图形用户界面）。用户可通过拖拽控件（如按钮、文本框等）设计界面，无需手动编写布局代码。生成的界面文件（.ui）可通过pyuic或uic工具转换为代码（如Python或C++），与业务逻辑集成。常用快捷键及用途通用操作Ctrl+N：新建界面文件。Ctrl+O：打开现有.ui文件。Ctrl+S：保存当前
“重复”定义函数的睿智(Python/与ai助手“智普清言”深度交流) 梦幻精灵_cq 笔记学习
镜像双胞谬重复，定制便捷巧活工。笔记模板由python脚本于2025-07-1612:16:30创建，本篇笔记适合至少通晓一门语言，熟悉基本编程范式的coder翻阅。学习的细节是欢悦的历程博客的核心价值：在于输出思考与经验，而不仅仅是知识的简单复述。Python官网：这里，才python前沿。英文原版，原汁原味，才是寻根溯源的正统。地址：https://www.python.org/F
偶拾《退让》，一阙仿七律带出的文化思考(中文诗创作) 梦幻精灵_cq 笔记学习
礼貌温言沐春风，谦让理解通彼此。笔记模板由python脚本于2025-07-0111:29:03创建，本篇笔记适合喜欢中文仿古七言诗的coder翻阅。学习的细节是欢悦的历程博客的核心价值：在于输出思考与经验，而不仅仅是知识的简单复述。Python官网：这里，才python前沿。英文原版，原汁原味，才是寻根溯源的正统。地址：https://www.python.org/Free：大咖
008、Python+fastapi，第一个后台管理项目走向第8步：ubutun 20.04下配置远程桌面、安装vscode+python环境配置浪淘沙jkp 学习 fastapi
一、说明白飘了3个月无影云电脑，开始选了个windowsserver非常不好用，后台改为ubuntu想升级到22，没成功，那就20.04吧。今天先安装下开发环境，后续2个月就想把他当做开发服务器，不知道行不行，公网ip是否可以外部链接。本来想装个宝塔面板直接管理，不过那玩意用了一次，决定说方便也不方便，还是放弃，要用也搞个掏钱的，你懂的，免费的不放心啊那我们就一个一个安装好了，大概要安装mysql
没有 Mac，如何上架 iOS App？跨平台团队的全流程实践指南程序员不说人话 ios 小程序 uni-app iphone android webview https
在许多以Flutter、ReactNative等技术栈开发的项目中，经常面临一个现实问题：团队缺少足够的Mac设备，可iOS上架流程却被Mac严重绑架。今天我们就来聊聊“没有Mac，如何顺利上架iOSApp？”，结合我们在多个项目中积累的实战经验，分享一整套可复用的跨平台上架方案，让Windows、Linux开发者也能协作完成iOS上架，并保持高效、稳定、安全。为什么“没有Mac”是个上架难题？i
python爬大学生就业信息报告_Python语言爬虫——Python 岗位分析报告 weixin_39578457
本文主要向大家介绍了Python语言爬虫——Python岗位分析报告，通过具体的内容向大家展示，希望对大家学习Python语言有所帮助。前两篇我们分别爬取了糗事百科和妹子图网站，学习了Requests,BeautifulSoup的基本使用。不过前两篇都是从静态HTML页面中来筛选出我们需要的信息。这一篇我们来学习下如何来获取Ajax请求返回的结果。本篇以拉勾网为例来说明一下如何获取Ajax请求内容
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

Python 多进程日志管理：最佳实践与实战指南