engchina

Python代码性能优化的综合指南

Python代码性能优化的综合指南

- 计算Python脚本的执行时间
- I. I/O密集型操作
- - I/O密集型操作的优化方法
- II. 使用生成器生成列表和字典
- - 1. 传统方法
  - 2. 使用生成器优化代码
- III. 避免字符串拼接，使用`join()`
- IV. 使用`map()`替换循环
- - 传统循环方法
  - 使用`map()`函数实现相同功能
- V. 选择合适的数据结构
- - 少量数据测试
  - `collections.deque`的使用方法
- VI. 避免不必要的函数调用
- VII. 避免不必要的`import`
- VIII. 避免使用全局变量
- IX. 避免模块和函数的属性访问
- X. 减少内部`for`循环中的计算

Python作为一种动态类型的解释型语言，与C等静态类型的编译型语言相比，执行速度可能会较慢。然而，通过特定的技术和策略，我们可以显著提升Python代码的性能。

本文将探讨如何优化Python代码，使其运行得更快、更高效。我们将使用Python的timeit模块来精确测量代码的执行时间。

注意：默认情况下，timeit模块会将代码执行100万次，以确保测量结果的准确性和稳定性。

def print_hi(name):
    print(f'Hi, {name}')

if __name__ == '__main__':
    # 执行print_hi('leapcell')方法
    t = timeit.Timer(setup='from __main__ import print_hi', stmt='print_hi("leapcell")')
    t.timeit()

计算Python脚本的执行时间

time模块中的time.perf_counter()提供了高精度的计时器，适合测量短时间间隔。例如：

import time

# 记录程序开始时间
start_time = time.perf_counter()

# 你的代码逻辑
# ...

# 记录程序结束时间
end_time = time.perf_counter()

# 计算程序执行时间
run_time = end_time - start_time

print(f"程序执行时间: {run_time} 秒")

I. I/O密集型操作

I/O密集型操作（Input/Output Intensive Operation）指的是执行时间大部分花费在等待输入输出操作完成的程序或任务。I/O操作包括从磁盘读取数据、向磁盘写入数据、网络通信等。这些操作通常涉及硬件设备，因此其执行速度受硬件性能和I/O带宽的限制。

它们的特征如下：

等待时间：程序在执行I/O操作时，通常需要等待数据从外部设备传输到内存或从内存传输到外部设备，这可能导致程序执行被阻塞。
CPU利用率：由于I/O操作的等待时间，CPU在此期间可能处于空闲状态，导致CPU利用率较低。
性能瓶颈：I/O操作的速度常常成为程序性能的瓶颈，尤其是在数据量大或传输速度慢的情况下。

例如，使用I/O密集型操作print，并执行100万次：

import time
import timeit

def print_hi(name):
    print(f'Hi, {name}')
    return

if __name__ == '__main__':
    start_time = time.perf_counter()
    # 执行print_hi('leapcell')方法
    t = timeit.Timer(setup='from __main__ import print_hi', stmt='print_hi("leapcell")')
    t.timeit()
    end_time = time.perf_counter()
    run_time = end_time - start_time
    print(f"程序执行时间: {run_time} 秒")

执行结果为3秒。

另一方面，如果不使用I/O操作，即不调用print()，而是调用一个空的print_hi('xxxx')方法，程序会显著加快：

def print_hi(name):
    # print(f'Hi, {name}')
    return

I/O密集型操作的优化方法

在代码中需要I/O操作时，例如文件读写，可以使用以下方法提高效率：

异步I/O：使用asyncio等异步编程模型，使程序在等待I/O操作完成时可以继续执行其他任务，提高CPU利用率。
缓冲：使用缓冲区临时存储数据，减少I/O操作频率。
并行处理：并行执行多个I/O操作，提高整体数据处理速度。
数据结构优化：选择合适的数据结构，减少数据读写次数。

II. 使用生成器生成列表和字典

自Python 2.7版本以来，列表、字典和集合的生成器得到了改进，使得数据结构的构建过程更加简洁高效。

1. 传统方法

def fun1():
    list=[]
    for i in range(100):
        list.append(i)

if __name__ == '__main__':
    start_time = time.perf_counter()
    t = timeit.Timer(setup='from __main__ import fun1', stmt='fun1()')
    t.timeit()
    end_time = time.perf_counter()
    run_time = end_time - start_time
    print(f"程序执行时间: {run_time} 秒") 
    # 输出结果: 程序执行时间: 3.363 秒

2. 使用生成器优化代码

注意：为了方便起见，以下内容省略了主函数main的代码部分。

def fun1():
    list=[ i for i in range(100)] 
    # 程序执行时间: 2.094 秒

从上述推导式程序可以看出，这种方法不仅更简洁易懂，而且速度更快。因此，这种方法已成为生成列表和循环时的首选方法。

III. 避免字符串拼接，使用`join()`

join()是Python的字符串方法，用于将序列中的元素连接（或合并）为字符串，通常使用特定的分隔符。其优点通常包括：

高效性：join()是字符串连接中的高效方法，尤其适用于大量字符串。通常比使用+运算符或%格式化更快。在连接大量字符串时，join()方法比逐个连接节省内存。
简洁性：join()使代码更简洁，避免了重复的字符串连接操作。
灵活性：可以指定任意字符串作为分隔符，提供了字符串连接的灵活性。
广泛适用性：不仅适用于字符串，还适用于列表、元组等序列类型。但元素必须能够转换为字符串。

例如：

def fun1():
    obj=['hello','this','is','leapcell','!']
    s=""
    for i in obj:
        s+=i       
    # 程序执行时间: 0.35186 秒

使用join()连接字符串时：

def fun1():
    obj=['hello','this','is','leapcell','!']
    "".join(obj) 
    # 程序执行时间: 0.1822 秒

使用join()后，函数的执行时间从0.35秒缩短到0.18秒。

IV. 使用`map()`替换循环

在大多数场景中，传统的for循环可以用更高效的map()函数替换。map()是Python内置的高阶函数，可以将指定的函数应用于列表、元组或字符串等可迭代数据结构。使用map()的主要优点是提供了更简洁、高效的数据处理方式，避免了显式的循环代码。

传统循环方法

def fun1():
    arr=["hello", "this", "is", "leapcell", "!"]
    new = []
    for i in arr:
        new.append(i) 
    # 程序执行时间: 0.3067 秒

使用`map()`函数实现相同功能

def fun2(x):
    return x

def fun1():
    arr=["hello", "this", "is", "leapcell", "!"]
    map(fun2,arr) 
    # 程序执行时间: 0.1875 秒

通过比较可以看出，使用map()可以节省近一半的时间，执行效率显著提高。

V. 选择合适的数据结构

选择合适的数据结构对于提高Python代码的执行效率至关重要。不同的数据结构针对特定操作进行了优化。合理的选择可以加快数据的查找、添加和删除速度，提升程序的整体操作效率。

例如，在判断容器中的元素时，字典的查找效率高于列表，但这适用于大量数据的情况。对于少量数据，情况则相反。

少量数据测试

def fun1():
    arr=["hello", "this", "is", "leapcell", "!"]
    'hello' in arr
    'my' in arr      
    # 程序执行时间: 0.1127 秒

def fun1():
    arr={"hello", "this", "is", "leapcell", "!"}
    'hello' in arr
    'my' in arr    
    # 程序执行时间: 0.1702 秒

使用numpy生成100个随机整数：

import numpy as np

def fun1():
    nums = {i for i in np.random.randint(100, size=100)}
    1 in nums    
    # 程序执行时间: 14.28 秒

def fun1():
    nums = {i for i in np.random.randint(100, size=100)}
    1 in nums    
    # 程序执行时间: 13.53 秒

可以看出，对于少量数据，list的执行效率高于dict，但对于大量数据，dict的效率高于list。

如果存在频繁的添加和删除操作，且添加和删除的元素数量较多，list的效率并不高。此时，可以考虑使用collections.deque。collections.deque是双端队列，具有栈和队列的特性，可以在两端进行插入和删除操作，时间复杂度为O(1)。

`collections.deque`的使用方法

from collections import deque  

def fun1():
    arr=deque()# 创建一个空的deque
    for i in range(1000000):
        arr.append(i)
    # 程序执行时间: 0.0558 秒

def fun1():
    arr=[]
    for i in range(1000000):
        arr.append(i)
    # 程序执行时间: 0.06077 秒

list的查找操作也非常耗时。如果需要频繁查找list中的特定元素，或需要按顺序访问这些元素，可以使用bisect来维护list对象的顺序，并在其中进行二分查找，从而提高查找效率。

VI. 避免不必要的函数调用

在Python编程中，优化函数调用次数对提高代码效率至关重要。过多的函数调用不仅会增加开销，还可能导致额外的内存消耗，从而降低程序的执行速度。为了提高性能，应尽量减少不必要的函数调用，尝试将多个操作合并为一个。这样可以减少执行时间和资源消耗。这种优化策略有助于编写更高效、更快速的代码。

VII. 避免不必要的`import`

Python的import语句相对较快，但每次import都涉及模块查找、模块代码执行（如果尚未执行）以及将模块对象放入当前命名空间的操作。这些操作需要一定的时间和内存。不必要的模块导入会增加这些开销。

VIII. 避免使用全局变量

import math

size=10000
def fun1():
    for i in range(size):
        for j in range(size):
            z = math.sqrt(i) + math.sqrt(j) 
    # 程序执行时间: 15.6336 秒

许多程序员最初会用Python编写一些简单的脚本。编写脚本时，通常会像上面的代码一样直接写成全局变量。然而，由于全局变量和局部变量的实现方式不同，在全局作用域中定义的代码比在函数中定义的代码执行速度要慢得多。将脚本语句放入函数中，通常可以实现15% - 30%的速度提升。

import math

def fun1():
    size = 10000
    for i in range(size):
        for j in range(size):
            z = math.sqrt(i) + math.sqrt(j)  
    # 程序执行时间: 14.9319 秒

IX. 避免模块和函数的属性访问

import math # 不推荐

def fun2(size: int):
    result = []
    for i in range(size):
        result.append(math.sqrt(i))
    return result

def fun1():
    size = 10000
    for _ in range(size):
        result = fun2(size) 
    # 程序执行时间: 10.1597 秒

每次使用.（属性访问运算符）时，都会触发__getattribute__()或__getattr__()等特定方法。这些方法执行字典操作，因此会带来额外的时间开销。通过使用from import语句，可以消除属性访问。

from math import sqrt # 推荐：仅导入所需模块

def fun2(size: int):
    result = []
    for i in range(size):
        result.append(sqrt(i))
    return result

def fun1():
    size = 10000
    for _ in range(size):
        result = fun2(size)
    # 程序执行时间: 8.9682 秒

X. 减少内部`for`循环中的计算

import math

def fun1():
    size = 10000
    sqrt = math.sqrt
    for x in range(size):
        for y in range(size):
            z = sqrt(x) + sqrt(y) 
    # 程序执行时间: 14.2634 秒

在上述代码中，sqrt(x)位于内部for循环中，每次循环都会重新计算，增加了不必要的时间开销。

import math

def fun1():
    size = 10000
    sqrt = math.sqrt
    for x in range(size):
        sqrt_x=sqrt(x) 
        for y in range(size):
            z = sqrt_x + sqrt(y) 
    # 程序执行时间: 8.4077 秒

通过将sqrt(x)移出内部循环，执行时间从14.26秒减少到8.40秒。

通过以上优化策略，我们可以显著提升Python代码的执行效率。

你可能感兴趣的:(LINUX,python,性能优化,开发语言)

编程入门难？Python 十大核心知识点，手把手教你！编程咕咕gu- Python基础 python 开发语言 Python教程网络爬虫
如果你对编程感兴趣，但又不知道从哪里开始，那么Python会是你的好选择。它简单易学，是初学者学习编程的好帮手。这篇文章会用轻松的方式，带你了解Python的十个重要概念，一步步帮助你从零开始！1.Python文件与扩展名学习Python的第一步是创建一个Python文件。Python文件的名字后面都会加上.py作为扩展名。例如，你可以创建一个名为main.py的文件，这就是一个Python脚本。
Windows和Linux下，通过C++实现获取蓝牙版本号 xingyun86 C++windows linux c++
在C++中获取蓝牙版本号，不同的操作系统有不同的实现方式，下面分别介绍在Windows和Linux系统下的实现方法。Windows系统在Windows系统中，可以使用WindowsAPI来与蓝牙设备交互，获取蓝牙版本号。以下是一个示例代码：收起cpp#include#include#include#include#include#pragmacomment(lib,"Bthprops.lib")/
C# dotnet core开发跨平台桌面应用程序(基于GTK+3.0) xingyun86 C++C#.netcore
1.Windows下开发环境VisualStudio20192.新建C#跨平台应用3.工程解决方案右键Nuget安装Gtk3依赖4.编写代码：5.编译运行（编译ok，会提示下载gtk-3.24.zip）自行下载gtk-3.24.zip:下载完成后解压在C:\Users\登陆用户\AppData\Local\Gtk\3.24\目录下6.运行截图7.发布到Linux下右键工程->publish(发布)
使用 nodejs 和 ElasticSearch 快速搭建全文检索 dbLenis 数据库 java 编程语言大数据 linux
点击蓝色“有关SQL”关注我哟加个“星标”，天天与10000人一起快乐成长上次群友问我，Python怎么学，我说四个小时足够了，你们不信。这次，我用2个小时，仅仅用Google，快速搭建了一个nodejs+Elasticsearch的小Demo.足可见，在有搜索的年代，快速上手一门技术，已经不是什么难事。1安装1.1下载地址https://nodejs.org/en/download提供windo
Linux下网络运维命令总结 C嘎嘎嵌入式开发 Linux 运维 linux 网络
一、网络连通性测试ping作用：检测目标主机是否可达，并测量网络延迟。示例：pingwww.example.com持续发送ICMP报文，按Ctrl+C停止。ping-c4www.example.com发送4个ICMP报文后停止。traceroute作用：显示数据包到达目标主机所经过的路由路径。示例：traceroutewww.example.com使用默认端口进行追踪。traceroute-Iww
MATLAB基础应用精讲-【数模应用】主成分(pca)分析（附python代码实现）林聪木 matlab 人工智能大数据
目录前言知识储备降维概述算法原理什么是PCAPCA降维过程PCA算法数学步骤选择主成分个数（即k的值）sklearn中参数的解释数学模型协方差协方差矩阵编辑编辑原理推导编辑编辑编辑编辑实际操作主成分分析的计算方法方法1.协方差+特征值分解方法2：奇异值分解对比不同方法计算效率物理意义算法步骤SPSSAU主成分(pca)分析说明1、信息浓缩2、权重计算3、综合得分【综合竞争力】疑难解惑成分得分后用于
Linux15 数据链路层辣椒味番茄 Linux linux
数据链路层什么是以太网以太网帧格式MAC地址MTU-以太网最大传输单元网络层IP数据包分包（分片）MTU对UDP协议的影响MTU对于TCP协议的影响ARP协议ARP协议的作用ARP协议的工作流程ARP数据报格式什么是以太网“以太网”不是一种具体的网络,而是一种技术标准;既包含了数据链路层的内容,也包含了一些物理层的内容.例如:规定了网络拓扑结构,访问控制方式,传输速率等例如以太网中的网线必须使用双
基于Python的网络漏洞扫描系统的设计与实现毕设工作室_wlzytw python论文项目 python 网络开发语言 django tornado dash pygame
摘要随着互联网不断发展、贴近生活，电子化的生活安全依赖着网络安全。在漏洞泛滥的今天，网络安全状态不容乐观，许多机构都因没有及时处理漏洞导致被恶意入侵，若网络安全保护不当，将会影响现实安全。中小型网络运维人员常因为外部因素影响难以开展网络安全行动。为了应对这一问题，本文研究尝试用Python语言尝试做一个集成漏洞扫描系统的设计与实现。运用以Python为基础的DjangoWeb框架实现快速的业务开发
基于 Python 的漏洞扫描工具的设计与实现计算机毕业设计指导 python 开发语言信息安全
引言随着信息技术的快速发展，网络安全问题成为了各类组织和个人面临的重要挑战之一。漏洞是网络安全中的一个重要问题，黑客和恶意攻击者往往通过利用这些漏洞来侵入系统，窃取敏感信息或进行其他恶意行为。因此，及时发现和修复漏洞是确保网络安全的重要手段。本项目旨在设计和实现一个基于Python的漏洞扫描工具，帮助用户快速发现系统中的潜在漏洞，并提供修复建议。该工具将包括对Web应用程序、操作系统、服务等的漏洞
Linux 程序员必修课：命令、脚本、程序、进程与线程的全貌内核程序员kevin Linux程序员 linux 进程脚本线程
Linux程序员必修课：命令、脚本、程序、进程与线程的全貌1.Linux命令、脚本、程序、进程与线程的关系对比表概念定义存储形式执行方式是否需要进程是否支持并发示例命令用户输入给shell的指令，可以是内置命令或外部命令直接输入在shell中（无固定存储）由shell解析并执行仅外部命令需要取决于命令，如&可后台运行ls、cd、echo脚本一组命令的集合，存储在文件中，通常是shell脚本文本文件
python代码实现支持神经网络对鸢尾花分类邀_灼灼其华机器学习及概率统计 python 神经网络分类 sklearn
1、导入支持向量机模型，划分数据集fromsklearnimportdatasetsfromsklearnimportsvmiris=datasets.load_iris()iris_x=iris.datairis_y=iris.targetindices=np.random.permutation(len(iris_x))iris_x_train=iris_x[indices[:-10]]iri
RabbitMQ复习 SJLoveIT rabbitmq 分布式
消息中间件的作用：（1）异步处理（2）应用解耦（3）流量削峰消息中间件的缺点：引入了新的东西，也就增加了新的故障点。比如消息中间件挂了，影响系统的可用性。两种框架：JMS和AMQP最大的区别是JMS是是javaapi,对跨平台的支持较差，但在纯java技术栈内首选。AMQP是跨平台的，序列化方式选json，不管你是java，php，C/C++,python,都能处理RabbitMQ实现的事AMQP
完整的 Python 数据分析案例：在线游戏玩家付费预测萧十一郎@ python 机器学习人工智能
目录1.案例背景代码实现2.主要的代码难点解析2.1数据清洗-缺失值处理2.2特征工程-新特征计算与独热编码2.3特征选择2.4模型训练与评估2.5数据可视化3.可能改进的代码3.1数据清洗与特征工程改进3.2模型改进3.3可视化改进1.案例背景在在线游戏行业中，准确预测玩家是否会付费以及付费金额，对于游戏运营商制定营销策略、优化游戏设计和提高盈利能力至关重要。本案例将基于玩家的游戏行为数据（如游
利用Python实现企业微信发送文件消息林_胖 python 企业微信自动化文件 OA
最近领导希望做一个小的招标信息爬取系统，每日以邮件以及企业微信的方式进行推送。所以记录一下如何使用Python实现企业微信发送文件。第一步：登录企业微信后台，需要用有管理员权限的微信进行扫码登录。第二步：获取AgentId和Secret，获取路径：应用管理-创建应用，创建应用后即可看到。第三步：确认需要接收信息的userid，获取路径：通讯录-选择需要发送的人员-账号。第四步：获取公司ID，获取路
技术学习周刊第 3 期：Linux& 容器网络扫盲艾希逐月技术学习周刊学习 linux 网络
#IntroductiontoLinuxinterfacesforvirtualnetworking介绍了Linux中常用的网络概念，比如bridge网桥、veth对、VLAN&VXLAN、MACVLAN等，可以帮助自己对这些概念做一个快速的了解。#AnintroductiontoLinuxvirtualinterfaces:Tunnels算是上一篇文章的姊妹篇，主要介绍了Linux网络隧道相关的
C C++最全Linux下TCP IP编程--TCP实战_linux tcp，2024最新网易C C++面试题目 2401_84973304 程序员 c语言 c++学习
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！printf("====waitingforcl
PyCharm极速安装指南：3分钟掌握Python开发环境三流搬砖艺术家 python python pycharm ide
目录为什么选择PyCharm？️准备工具步骤一：下载安装包⚙️步骤二：安装配置步骤三：首次启动配置步骤四：创建第一个项目效率优化技巧❗常见问题排雷社区版vs专业版为什么选择PyCharm？✅智能代码补全：媲美IDE的语法高亮与提示✅跨平台支持：Windows/macOS/Linux全兼容✅插件生态丰富：支持Web开发、数据分析等场景✅社区版免费：无功能限制，个人开发者首选️准备工具操作系统：Win
DeepSeek 提示词：常见指令类型伏羲栈人工智能 deepseek提示词人工智能
博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分
在Ubuntu中,某个文件的右下角有一把锁的标志是什么意思？昊虹AI笔记 Linux系统 ubuntu
在Ubuntu中，某个文件的右下角有一把锁的标志是什么意思？在Ubuntu（或其他基于GNOME文件管理器的Linux发行版）中，文件或文件夹的右下角出现一把“锁”标志，通常表示你当前的用户没有该文件/文件夹的写入或访问权限。这通常是由于以下原因导致的：可能的原因文件/文件夹归属于root用户例如，如果你使用sudo创建或修改了某个文件，而当前用户不是root，那么你可能无法直接编辑或删除它。权限
Linux 安装 mysql-5.7.31-linux-glibc2.12-x86_64.tar.gz weixin_54252682 linux mysql
一、删除原来安装的mysql1.查询并删除[root@localhost/]#find/-namemysqlfind:‘/run/user/1000/gvfs’:Permissiondenied/etc/selinux/targeted/active/modules/100/mysql/var/lib/mysql/usr/lib64/mysql/usr/share/mysql/usr/local/
教程 | 在 Linux 环境中安装 Docker（含2025最新镜像站加速，实测可用） The god of big data 大Big数据Data 容器那点事儿教程 linux docker 运维
在Linux环境中安装Docker的完整教程Docker是一种流行的容器化平台，可帮助用户快速构建、部署和运行应用程序。本教程将指导您如何在常见的Linux发行版（Ubuntu/Debian、CentOS/Fedora）上安装Docker。准备工作系统要求64位Linux系统（内核3.10或更高版本）。确保已安装curl或wget工具。以root用户或具有sudo权限的用户执行以下操作。卸载旧版本
mysql安装glibc包_mysql-8.0.22-linux-glibc2.12-x86_64.tar.xz安装区块链小王子 mysql安装glibc包
一、检查系统是否安装mysql或者mariadb，有的话先卸载查看系统是否安装了mysql:rpm-qa|grep-imysql1.1删除mysqlyum-yremovemysql*1.2删除mysql配置rm-rf/etc/my.cnf1.3删除文件rm-rf/var/lib/mysql查看系统是否安装了mariadbrpm-qa|grep-imariadb2.1.删除mariadbyum-yr
linux mysql glibc 安装_Linux下安装mysql-8.0.21-linux-glibc2.12-x86_64.tar安装步骤十三周 linux mysql glibc 安装
1、解压mysqlmysql-8.0.21-linux-glibc2.12-x86_64.tar解压tar-xvfmysql-8.0.21-linux-glibc2.12-x86_64.tartar-xvJfmysql-8.0.21-linux-glibc2.12-x86_64.tarr.xz2、cp-rmysql-8.0.21-linux-glibc2.12-x86_64mysql8.21/3、
OpenCV Python 版使用教程（三）摄像头读取延迟解决方法 tianchengwang opencv opencv python 人工智能
文章目录一、上篇回顾二、产生原因三、解决方法1.cap.grab()方法2.多线程法总结一、上篇回顾在上一篇中，简单介绍了如何使用OpenCV操作摄像头，本期来讲在摄像头读取时，可能会出现画面延迟的解决方法。二、产生原因OpenCV在读取的时候，会将视频流放在缓冲区中，然后每次调用的时候，会从缓冲区内读取视频帧。虽然说大多数情况难以出现写入缓冲区远大于读取缓冲区的速度，但是当设备出现性能瓶颈，尤其
【Python爬虫(95)】Python爬虫进阶：构建大型垂直领域爬虫系统奔跑吧邓邓子 Python爬虫 python 爬虫开发语言垂直领域系统
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、项目需求分析1.1确定垂直领域1.2业务需求分析1.3用户需求
Python 文本处理神器：textwrap 模块深度解析 tekin Python 编程秘籍库 python Python 文本处理神器 textwrap 模块深度解析
Python文本处理神器：textwrap模块深度解析在Python编程中，处理文本是一项常见任务，比如自动换行、填充文本、缩短文本等。textwrap模块就像是一个贴心助手，专门用来解决这些问题。本文将带你深入了解textwrap模块的各种功能，通过丰富的示例代码和清晰的讲解，让你轻松掌握它的使用技巧，提升文本处理能力。文章目录Python文本处理神器：textwrap模块深度解析一、`text
Python NumPy 深度解析：科学计算的得力助手 tekin Python 高阶工坊 python numpy 科学计算
PythonNumPy深度解析：科学计算的得力助手在Python数据科学和科学计算领域，NumPy是一个核心且基础的库。它提供了强大的多维数组对象以及用于处理这些数组的各种工具，包括高效的数学运算、线性代数操作、随机数生成等功能。本文将全方位详细介绍NumPy，从数组的创建、操作到高级应用，深入探讨索引和切片操作、广播机制等重要特性，还会对NumPy与其他可选计算方式进行比较，帮助读者深入理解并掌
【Python爬虫(86)】元宇宙浪潮下，Python爬虫能否乘风破浪？奔跑吧邓邓子 Python爬虫 python 爬虫开发语言元宇宙
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、元宇宙：概念与架构的深度剖析1.1元宇宙概念溯源1.2元宇宙架
【Python爬虫(94)】爬虫生存指南：风险识别与应对策略奔跑吧邓邓子 Python爬虫 python 爬虫开发语言
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、爬虫项目中的风险识别1.1反爬虫导致的爬虫失效1.2数据泄露风
LeetCode - #219 存在重复元素 II 网罗开发 Swift vue.js leetcode 算法
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他