企研数据

Python教学 | 盘点 Python 数据处理常用标准库

点击查看原文：https://mp.weixin.qq.com/s/HPAfAviyu8a1LGhUMMJ4tg

引言

一、glob —— os 库的平替，主打一行代码解决问题

二、time —— 时间处理库

（1）time.time() —— 获取当前时间戳

（2）time.sleep(x) —— 程序休眠函数

（3）time.gmtime(t) —— 获取时间戳 t 对应的 struct_time 对象。

（4）time.ctime() —— 获取当地时间。

（5）使用 mktime()，strftime() 和 strptime() 进行时间格式化

三、copy —— 试错神器（数据处理后悔药）

四、json —— 字典存储库

五、tqdm —— 循环进度条，免除等待焦虑

六、shutil —— 文件复制/粘贴/剪切/重命名

七、pprint —— 层次化输出库

总结

其他内容

Python教学

文本识别类

数据可视化

引言

在上期文章中，我们介绍了 Python 中进行文件/目录操作、路径处理的操作系统库 os，了解了 os 库在数据处理中的实用性。在 Python 中，操作系统库 os 和正则表达式库 re 是标准库中的重难点，除了这两个标准库，在数据处理中，还有不少小众但好用的标准库，这些标准库也能在数据处理中发挥大作用，下面我们为大家一一介绍。

一、glob —— os 库的平替，主打一行代码解决问题

在上一期介绍 Python 标准库 os 的文章中>>>最常用的标准库之一 —— os，我们向大家介绍了使用 os 库一次性获取指定类型文件路径的方法（使用os.walk()）。该方法虽然在数据处理中十分常用，但是相应代码的书写难度并不算低，可读性也不高。单纯就批量获取文件路径这件事来说，Python 标准库 glob的易学易用性绝对要领先 os 库。事实上，使用glob模块在多数情况下只需要编写一行代码就可以一次性获取我们需要的文件路径。下面我们来简单介绍glob模块的使用方法。

glob 库中最重要且常用的一个函数是glob()，其作用是返回一个包含所有符合规则的文件路径的列表。例如我们想要获取当前工作目录中名为“已分享的资源”文件夹下所有的 pdf 文件的路径（不含子文件夹下的文件），可以使用下面的代码。

import glob     # 这一行不算 :)
glob.glob('./已分享的资源/*.pdf')

所得结果如下图所示。

在上面的代码中，我们将路径表达式'./已分享的资源/*.pdf'传入glob.glob()函数就得到了想要的结果。其中各部分的含义如下：

./：Python 当前工作路径，那么./已分享的资源/表示的就是当前工作路径下“已分享的资源”这一文件夹。
*.pdf：用于匹配所有任意名称，但文件扩展名为 .pdf 的文件（pdf 文件的扩展名就是 .pdf）的路径。星号*是glob.glob()函数中的一种通配符，可以匹配零到多个任意字符。那么*.pdf则表示任意名称的 pdf 文件。

理解了上面这句代码之后，下面我们就可以探索glob.glob()函数更新奇的玩法了。比如我想获取“已分享的资源”文件夹下文件名中包含“报告”两个字的 pdf 文件，可以使用下面的代码。

glob.glob('./已分享的资源/*报告*.pdf')

如果需要匹配所有文件名称中包含“报告”二字的任意类型的文件，可以使用下面的代码。

glob.glob('./已分享的资源/*报告*.*')    # 使用通配符 * 匹配文件扩展名

以上几种方式虽然能够一次性获取所有指定的文件路径，但都局限于一级文件夹下的文件（不包含子文件夹下的文件）。如果想要获取某个文件夹及其所有子文件夹下符合规则的文件路径，同样可以使用glob.glob()函数，但是需要借助一个参数来实现。例如获取“已分享的资源”文件夹及其所有子文件夹下所有扩展名为 .zip 的文件时，可以使用以下代码。

glob.glob('./已分享的资源/**/*.zip', recursive=True)

相较于只获取一级目录下文件路径的代码，上述代码有两点变化：一是使用通配符**匹配零到多级子文件夹的名称；二是通过设置参数recursive为 True，来让glob()函数递归地获取更深层级子文件夹下的文件。

除了*和**之外，glob()函数还支持其他通配符。常用的通配符及其含义如下表所示。

通配符	含义
*	匹配 0 个或多个任意字符
**	匹配任意名称的目录或子目录
?	匹配 1 个任意字符
[]	匹配指定范围内的字符，如 [0-9] 匹配数字，[a-z] 匹配小写字母

最后，标题中所说的 os 库平替的说法其实是十分激进的，因为 os 的作用不仅仅是获取文件路径，而glob库才是只能获取文件路径的标准库。而且glob库是由os库二次开发而来的。

二、time —— 时间处理库

time库是 Python 提供的精确的时间标准库，可以用于分析程序性能，也可以让程序暂停一段时间。time 库采用的是“格林威治时间”，即从 1970 年 01 月 01 日 00 时 00 分 00 秒起到现在的总秒数，time 库的主要功能体现在 3 个方面：时间处理，时间格式和计时。下面将介绍几个 time 库中常用的方法。

（1）time.time() —— 获取当前时间戳

import time    # 导入 time 库
time.time()    # 获取当前时间戳，即从 1970 年 01 月 01 日 00 时 00 分 00 秒起到现在的总秒数
# 1680775605.486971

我们可以在程序开始和结束分别获取时间戳，程序结束后计算两者的差即可知道程序的运行时间。

（2）time.sleep(x) —— 程序休眠函数

time.sleep()函数接受一个数字参数，传入的数字表示程序休眠的秒数。例如程序执行到time.sleep(5)时就会休眠 5 秒钟，期间什么都不做。time.sleep()函数看似鸡肋，实际上这个函数具有重要意义。比如在数据采集中，不停地使用网络可能会让计算机或者服务器崩溃，使用time.sleep()函数就可以控制程序执行频率；又如，当使用多进程向数据库写入数据时，多个进程同时执行建表操作，可能引发数据库报错，所以在第一个进程启动后让程序休眠几秒钟，等待第一个进程建表完成后，再启动其他进程。以上这些例子都表示time.sleep()这个函数具有十分重要的意义。

网络上曾流传一个关于sleep()函数的笑话/梗，乙方公司某程序员故意在开发的软件中加入了sleep()语句，交付给甲方后，甲方发现软件运行效率非常低，于是花钱请乙方优化软件，提升运行效率。乙方将源代码中 sleep() 函数的数字调小，在几周后重新交给甲方，并声称花费了巨大精力，甲方测试后发现软件果然变快了，大喜之余仍觉得还不够快，于是又找乙方优化……几番下来乙方已经赚的合不拢嘴！

（3）time.gmtime(t) —— 获取时间戳 t 对应的 struct_time 对象。

time.gmtime()
# 得到：
# time.struct_time(tm_year=2023, tm_mon=4, tm_mday=6, 
# tm_hour=10, tm_min=31, tm_sec=35, tm_wday=3, tm_yday=96, tm_isdst=0)

struct_time 对象的元素构成如下表所示。

元素	含义及范围
tm_year	年份，整数
tm_mon	月份 [1,12]
tm_mday	日期 [1,31]
tm_hour	时 [0,23]
tm_min	分 [0,59]
tm_sec	秒 [0,59]
tm_wday	星期 [0,6]，0 表示周一
tm_yday	该年的第几天
tm_isdst	是否夏令时，0 表示否，1 表示是，-1表示为止

（4）time.ctime() —— 获取当地时间。

time.ctime()
# 得到： 'Thu Apr  6 18:36:23 2023'

（5）使用 mktime()，strftime() 和 strptime() 进行时间格式化

time 库使用 mktime() 和 strftime() 函数进行时间格式化。使用 mktime(t) 将 struct_time 对象解析为格林威治时间戳。

使用time.mktime()函数将当前时间的 struct_time 对象转为格林威治时间戳的代码如下。

time.mktime(time.gmtime())
# 得到：1680748762.0

使用time.strftime()函数将 struct_time 转为中文时间对象的代码如下。

t = time.gmtime()
time.strftime('%Y-%m-%d %H:%M:%S', t)
# 得到： '2023-04-06 10:49:19'

strftime() 函数常用的的格式化控制符如下表所示。

格式化控制符	描述
%Y	四位数年份
%y	两位数年份
%m	月份
%W	一年中的星期数(00 ~ 53)，以星期天为一个星期的开始
%U	一年中的星期数(00 ~ 53)，以星期一为一个星期的开始
%w	星期数(0 ~ 6)，0表示星期天
%j	一年中的第几天
%d	日期
%p	上/下午，AM/PM
%H	24 小时制的小时(00 ~ 24)
%I	12 小时制的小时(00 ~ 12)
%M	分钟
%S	秒
%X	本地相应时间表示
%x	本地相应日期表示
%Z	当前时区名称
%%	% 本身

三、copy —— 试错神器（数据处理后悔药）

在数据处理过程中，当我们不确定一个操作带来的结果是否符合预期时，可以先对数据进行尝试性的操作。一般来说，合适的做法是复制一个待处理文件的副本，让这个副本文件去“赴汤蹈火”，若程序运行结果没有达到期望或中途报错，那么原始的数据依然完好，不需要再去尝试挽救或者重新生成数据。

这种思维是没有问题的，不过不少初学者由于不了解 Python 的内存机制，在这方面吃了亏。比如某同学在处理数据中花费了一个小时得到半成品，变量名为data，再进行最后一步处理就可以得到结果了，但由于最后一步会直接修改变量 data 的内容。于是这位同学想通过以下语句来复制出一个副本，然后使用副本去试错。

data_test = data

如果真的使用了上述方式去复制变量，那么就跳入了内存机制的坑。因为这种“复制”方式基本与复制无关，这仅仅是给变量data起了个别名而已，如果data_test发生变化，data也会跟着改变。

如果需要生成一个完全独立于对象data，但与data一模一样的对象data_test，我们可以使用 Python 标准库copy。介绍它之前，我们需要先了解 Python 中的两种复制方式——浅复制与深复制（也称浅拷贝、深拷贝）。

浅复制（Shallow Copy）是指创建一个新的对象，这个新对象与被复制的对象共享内存空间中的一部分数据（主要是不可变类型数据），也就是说这两个对象的部分属性/元素会一致地更新。

深复制（Deep Copy）是指创建一个新的对象，这个新对象中完全不共享内存空间中的数据，也就是说这个新对象与被复制的对象完全独立。

什么意思呢？通俗来说，使用浅复制可以大大节省内存，但是浅复制得到的副本仍与原始数据藕断丝连，同穿一条裤子，修改其中之一，另一个可能也会发生变化。为什么是可能变化，而不是必然呢？这与你修改的对象的类型有关。而深复制则不会出现以上问题，深复制得到的对象完全独立于原始对象，不过使用的内存空间也大了不少（具体大多少视数据情况而定）。所以在上面的场景中，一定要使用深复制来创建数据副本。

使用copy库对变量 data 进行浅复制和深复制的代码如下。

import copy       # 导入模块
data_test = copy.copy(data)      # 浅复制
data_test = copy.deepcopy(data)  # 深复制

四、json —— 字典存储库

JSON (JavaScript Object Notation, JS 对象简谱) 是一种轻量级的数据交换格式。是一种文本格式，具有良好的可读性和易于扩展的特点。事实上，JSON 对象与 Python 中的字典非常相似，他们能够存储具有映射关系的数据类型。JSON 对象长什么样子呢？我们通过一个例子来了解一下。在使用高德地图地理编码 API 获取某地址的相关信息时，API 的返回值就是一个 JSON 对象，如下图所示。

标准库json就是一个处理 JSON 对象的库。那么这个库能给我们带来什么帮助呢？除了能够处理一般的 JSON 文件和 JSON 字符串，我们还可以使用 json 库将 Python 字典写入 JSON 文件，极大程度上方便传输和使用，再次使用时直接读取即可使用，不需要花费精力再去生成。

json 库提供了四个函数，我们使用较多的是json.dump()和json.load()这两个函数，前者用于将 Python 字典对象写入 json 文件；后者用于将 json 文件读取为 Python 字典。例如我们通过处理全国行政区划数据得到了省份名称与下辖县级名称的对照字典，如下图所示。

为了方便下次使用，我们需要将这个字典写入文件中，使用的代码如下。

with open('Province_county.json', 'w', encoding='utf-8') as f:
    json.dump(DICT, f)     # DICT 就是清理得到的字典

写入文件后，我们以文本方式打开它，所得结果如下图所示。

根据上图可知，中文无法在 json 文件中正常显示，一眼望去，全是 Unicode 编码。这是因为json.dump()函数默认会对非ASCII字符进行转义，如果我们希望 json 格式中的中文可以正常显示时，可以设置函数的参数ensure_ascii=False，且在写入文件时指定open()函数的编码参数encoding='utf-8'或encoding='utf-8-sig'来让中文正常显示。同时还可以设置参数indent=4来让 json 文件的层级更加明显。

改进后的写入代码如下。

with open('Province_county.json', 'w', encoding='utf-8') as f:
    json.dump(DICT, f, ensure_ascii=False, indent=4)     # DICT 就是清理得到的字典

下次再想使用该字典时，可以使用以下代码来将 json 文件读取为 Python 字典。

with open('Province_county.json', 'r', encoding='utf-8') as f:
    DICT = json.load(f)

五、tqdm —— 循环进度条，免除等待焦虑

在数据处理过程中我们时常面临一个情况，就是我们不清楚编写的循环代码的效率，也无法得到程序当前运行的进度，这使得我们只能盲目地等待程序运行结束，而无法预估其需要运行的时间，这种情况就可以使用tqdm()函数来帮助我们掌握程序的运行情况。Python 标准库中的 tqdm 库也称为进度条库，它可以为 for 循环提供一个进度条以显示数据处理的进度信息，尤其在批量处理数据的场景中，tqdm 库帮助我们更好地了解程序的运行状态。

现在我们想要使用 for 循环遍历并处理一张表格中的所有数据行，该表格的数据量有三十余万条，我们需要通过tqdm()函数查看程序当前的处理进度，同时得到预估的程序运行总时长。示例如下。

上图呈现了使用tqdm()函数的进度条效果，随着程序的运行，进度条的长度和百分比不断更新以显示当前处理进度，当已知循环体的长度时，进度条右边的文本显示的是已经处理的数据量/需要处理的数据总量，括号中的xxxit/s表示处理速度，左边的时间表示程序已经运行的时间，右边的时间表示预估的剩余用时。由于我们 for 循环每次得到一行数据，所以上图表示的是每秒执行的循环次数。当循环体长度未知时，进度显示的是已循环的次数以及每秒钟执行的循环次数，如下图所示。

六、shutil —— 文件复制/粘贴/剪切/重命名

在数据处理过程中对文件和目录的操作是必不可少的，Python 为了更方便开发者使用程序操作文件或目录，也提供了一些好用的标准库，除了上期文章介绍的 os 库，我们还要介绍一个操作文件/目录的库——shutil，这个库可以作为 os 库的补充，用于对文件或目录进行复制、移动、删除、重命名等操作，我们将shutil库中常用于数据处理的函数按照功能分为两类：复制类、删除/移动类，具体如下表所示。

函数	功能描述
`shutil.copy(src, dst)`	复制文件，参数 src 表示源文件，参数 dst 表示目标文件夹
`shutil.copytree(src, dst)`	复制文件夹，参数 src 表示原文件夹，参数 dst 表示目标文件夹
`shutil.move(src, dst)`	移动文件或文件夹，参数 src 表示源文件/文件夹，参数 dst 表示目标文件夹
`shutil.rmtree(src)`	删除文件夹，参数 src 表示源文件夹

在数据处理工作中常常会遇到一个场景——当我们对一个文件夹中的文件进行处理后，需要将该文件夹中符合我们要求的所有文件移动到指定目录中，比如我们想要找到中国环境统计年鉴（1999-2017）文件夹中，文件名含有关键字“2011”的所有文件，并将这些文件移动到2011年中国环境统计年鉴文件夹中，该文件夹当前不存在。

dir_path = r'./中国环境统计年鉴/中国环境统计年鉴（1999－2017）/'
# 需要存放文件的目录，使用so.mkdir()创建该文件夹
dst_path = r'./中国环境统计年鉴/2011年中国环境统计年鉴'
os.mkdir(dst_path)
# 得到指定文件夹所有文件路径的列表
all_files = os.listdir(dir_path)
# 遍历文件夹中每一个文件
for file in all_files:
    # 拼接一个文件的路径，得到该文件的绝对路径
    file_path = os.path.join(dir, file)
    # 使用os.path.basename()函数获取文件名，判断这个文件的文件名是否含有关键字“2011”
    if '2011' in os.path.basename(file_path): 
        # 将含有关键字“2011”的文件转移到指定目录中
        shutil.move(file_path, dst_path)

可以看到，名称中含有关键字“2011”的文件均已移动到指定文件夹中，源文件已不在原始文件夹中。在使用shutil.move(src, dst)函数时需要注意一点，参数 dst 表示的目标目录必须是存在的，我们在上面的程序中使用os.mkdir()函数先创建了该目录。

实际中还有另一种常见情况是需要将文件移动到新文件夹下，并且源文件仍然保留在原始文件夹中用来备份，这就可以使用shutil.copy(src, dst)函数来实现，也就是将上面程序中的shutil.move(file_path, dst_path)改为如下语句。

# 将file_path表示的源文件转移至指定目录dst_path中
shutil.copy(file_path, dst_path)

最后介绍一下shutil.rmtree(src)函数，该函数的功能区别于 os 库中的remove()和rmdir()函数，其可以递归地彻底删除参数 src 表示的文件夹，无论其是否非空，所以在使用的时候要谨慎一点！

七、pprint —— 层次化输出库

最后我们介绍一个非常简单又很有用的库——pprint库，从库名就可以看出pprint库一定和print()函数有关系，没错，这个库是用于将数据打印输出到控制台中的，但是该库提供的函数和print()函数的打印方式不同，print()函数尽可能地将打印结果都输出在一行，对于结构较为复杂的数据，这种输出方式不便于阅读，而pprint库中的pprint()函数采用分行打印，在输出过程中会自动添加缩进并且自动断行，使得打印的数据结构更加清晰明了。下面我们用两种方式打印输出一个字典形式的数据，直观感受一下两者的区别。

这就是两种打印方式的不同，对于比较复杂的数据结构，直接使用print库可能会让结果像一堆字母炸弹，这时pprint库就像一个魔法师一样，让打印输出的结果变得简洁美观！

总结

本文向大家介绍了 Python 数据处理中七个实用的标准库，比如当我们在程序中需要处理文件/目录时，glob库和shutil库就是非常好用的工具，再加上上期文章介绍的os库，让 Python 数据处理中关于文件/目录的操作基本不在话下；或者是当不知道循环程序多久才能运行结束，苦苦等待的时候，想到tqdm库。本期文章的目的就是希望这些工具可以帮助大家优化程序。下期文章我们将为大家介绍正则表达式，下期再见！

其他内容

Python教学

学习 Python 第一步——环境安装与配置
Python 基本数据类型
Python 字符串操作（上）
Python 字符串操作（下）
Python 变量与基本运算
组合数据类型-列表
组合数据类型-集合（内含实例）
组合数据类型 - 字典&元组
Python 中的分支结构（判断语句）
Python 中的循环结构（上）
Python 中的循环结构（下）
Python教学 | Python函数的定义与调用
Python教学 | Python 内置函数
Python教学 | 最常用的标准库之一 —— os
持续更新中…

文本识别类

省下一个亿！一文读懂如何用python读取并处理PDF中的表格
你的“老”文献、手写笔记有多少可以识别和复制？快用python批量转化吧！
还在人工识别表格呢？Python 调用百度 OCR API 又快又准

数据可视化

讲究！用 Python 制作词云图学问多着呢
太酷了！用 Python 绘制3D地理分布图
地址数据可视化—教你如何绘制地理散点图和热力图
Python绘制多维柱状图：一图展示西部各省人口变迁

你可能感兴趣的:(Python教学,linux,爬虫,信息可视化)

RSA加密算法不会搬砖的淡水鱼网络服务器安全
RSA加密算法：数学魔术背后的安全守护者RSA加密算法（Rivest-Shamir-Adleman）是一种广泛使用的公钥加密算法，它在信息安全领域具有重要作用。RSA是由罗纳德·李维斯特（RonRivest）、阿迪·萨莫尔（AdiShamir）和伦纳德·阿德曼（LeonardAdleman）在1977年一起提出的。当时他们三人都在麻省理工学院工作。RSA就是他们三人姓氏开头字母拼在一起组成的。RS
python练习3：输入某年某月某日，判断这一天是这一年的第几天？柯.姐姐 python
#输入某年某月某日，判断这一天是这一年的第几天？list=[0,31,59,90,120,151,181,212,243,273,304,334]year=int(input('请输入年份：'))month=int(input('请输入月份：'))day=int(input('请输入天：'))ifmonth>0andmonth2:result=result+1print("这是第%d天"%resu
RuoYi框架连接SQL Server时解决“SSL协议不支持”和“加密协议错误” 专注代码十年 ssl 网络协议网络
RuoYi框架连接SQLServer时解决“SSL协议不支持”和“加密协议错误”在使用RuoYi框架进行开发时，与SQLServer数据库建立连接可能会遇到SSL协议相关的问题。以下是两个常见的错误信息及其解决方案。错误信息1com.zaxxer.hikari.pool.HikariPool$PoolInitializationException:Failedtoinitializepool;'e
初学python100例-案例4 计算一年第几天多种不同解法少儿编程案例讲解小兔子编程初学python100例 python学习 python100例 python计算天数 python算法 python案例
题目输入某年某月某日，判断这一天是这一年的第几天？解法1程序分析1、以5月2日为例，应该先把前四个月的加起来，2、然后再加上2天即本年的第几天，3、特殊情况，闰年且输入月份大于2时需考虑多加一天：4、闰年1、年份能被4整除；2、年份若是100的整数倍的话需被400整除，否则是平年。程序源代码：year=int(input('year:\n'))month=int(input('month:\n')
SAP-ABAP：SAP工厂(Plant)与公司代码(Company Code)关联查询指南爱喝水的鱼丶 SAP ABAP ERP 开发运维运维
SAP工厂(Plant)与公司代码(CompanyCode)关联查询指南一、核心查询方法对比方法类型事务码/表名响应速度适用场景权限要求配置界面查询OX18快单工厂详细信息查看S_TCODE(OX18)数据表直查T001W/T001K极快批量导出或多系统对接S_TABU_DIS(T001W/T001K)组织结构浏览PPOME中企业架构全景分析S_TCODE(PPOME)二、详细操作指南方法1：配置
Python 的类中，self 是一个特殊的参数可可乐不加冰知识学习专栏 python 开发语言
在Python的类中，self是一个特殊的参数，它代表类的实例本身。self是方法的第一个参数，用于访问实例的属性和方法。下面我将从多个角度解释self的含义、作用以及如何使用它。1.self表示类的实例本身在Python中，当你创建一个类的实例时，实际上是在内存中创建了一个对象。self参数代表的就是这个对象本身。通过self，你可以在类的方法中访问和修改实例的属性。2.为什么需要self？se
Trae AI 上新 SSHremote：服务器 Python 接口日志排查实战指南芯作者 DD：日记人工智能深度学习机器学习
在当今的软件开发中，服务器端的稳定性和可靠性至关重要。然而，生产环境中的问题往往难以预测，尤其是接口返回502错误却无日志记录的情况，更是让开发者头疼不已。幸运的是，字节跳动推出的AI原生IDE——Trae，近期上线的SSHremote功能，为远程服务器日志排查提供了全新的解决方案。本文将结合实战案例，深入探讨如何利用TraeAI的SSHremote功能高效排查Python接口日志问题，并分享创新
Python入门程序练习004：输入某年某月某日，判断这一天是这一年的第几天？若北辰 Python实战练习
【程序4】题目：输入某年某月某日，判断这一天是这一年的第几天？1.程序分析：其实这一题的难度不在于编程，而在于对闰年有没有一些基本的认识，相信很多人都知道闰年，但是又不太清楚具体怎么判断闰年。在下面两个条件中只要满足一个即是闰年：1、能被4整除但是不能被一百整除2、能被四百整除。为了方便记忆，总结为：四年一闰,百年不闰,四百年再闰那么判断出闰年和平年（除了闰年其他都是平年）之后呢，其实只要记住：闰
保姆级 STM32 HAL 库外部中断教学 CircuitWizard 单片机 stm32 单片机嵌入式硬件
1.外部中断概述为什么用外部中断？当按键按下时，CPU无需轮询检测引脚状态，而是通过中断机制立即响应，提高效率，适用于实时性要求高的场景。关键概念EXTI(ExternalInterrupt/EventController)：STM32的外设，负责管理外部中断/事件。NVIC(NestedVectoredInterruptController)：管理中断优先级和使能。GPIO与EXTI的映射：每个
Python后端学习系列（10）：分布式系统与数据一致性（使用分布式锁、分布式事务等） DoYangTan python 学习分布式
Python后端学习系列（10）：分布式系统与数据一致性（使用分布式锁、分布式事务等）前言随着业务规模的不断扩大以及对系统性能、可扩展性的更高要求，后端应用往往会朝着分布式系统的方向发展。然而，分布式系统带来诸多优势的同时，也面临着如数据一致性等复杂的挑战。本期我们就聚焦于分布式系统中的关键问题——数据一致性，深入探讨分布式锁、分布式事务等相关知识以及保障数据一致性的策略与实践，让我们一起深入学习
python进阶，类的继承，封装，多态，super 胡萝卜糊了 python 开发语言
#单继承#子类只继承一个父类classPerson:defsay(self,value):print('say:',value)defwalk(self,value):print('walk:',value,'km')#Student类继承PersonclassStudent(Person):defstudy(self,value):print('study:',value)#Teacher类继承
python进阶，迭代器和生成器，函数式编程，闭包，装饰器胡萝卜糊了 python 开发语言
l=[1,2,3,4]it=iter(l)print(next(it))print(next(it))print(next(it))print(next(it))#while循环l=[1,2,3,4]len=len(l)i=0it=iter(l)whilei=self.end:raiseStopIterationself.current+=1returnself.current-1it=MyIte
Day6：python面向对象编程——构建可扩展的订单管理系统 weixin_44650422 python 开发语言
目标：掌握类与对象的核心概念，实现模块化的订单业务逻辑一、类与对象：订单管理系统核心1.基础订单类classOrder:"""订单基类"""def__init__(self,order_id,customer):self.order_id=order_id#订单号self.customer=customer#客户名self.items=[]#商品列表self.total=0.0#总金额defadd
ASSERT函数 weixin_34194359 php
assert宏的原型定义在中，其作用是假设它的条件返回错误，则终止程序运行，原型定义：#includevoidassert(intexpression);assert的作用是现计算表达式expression，假设其值为假（即为0），那么它先向stderr打印一条出错信息，然后通过调用abort来终止程序执行。http://www.chongtang.me/index.php/1419提高程序健壮性
大模型时代的知识焦虑机载软件与适航机器学习-建模算法-代理模型人工智能大数据
引言：浪潮之巅，焦虑暗涌大模型时代已经浩荡而来，如同奔腾的浪潮，以令人惊叹的速度重塑着世界的面貌。从智能客服的温声细语，到AI绘画的妙笔生花，再到自动驾驶的日趋成熟，大型语言模型、图像模型等人工智能技术以前所未有的姿态，渗透进我们生活的方方面面。信息获取前所未有的便捷，知识创造空前高效，人机交互焕然一新，一个充满无限可能的智能化未来似乎触手可及。然而，在这令人眼花缭乱的技术盛景之下，一股无形的焦虑
python assert()函数欢天喜地小姐姐 python编程学习 python
1.断言函数作用断言函数是对表达式布尔值的判断，要求表达式计算值必须为真。可用于自动调试。如果表达式为假，触发异常；如果表达式为真，不会报错。2.使用assert判断数组是否相等np.array.any()和numpy.array.all()np.array.any()是或操作，任意一个元素为True，输出为True。np.array.all()是与操作，所有元素为True，输出为True。当我们
【LeetCode 热题100】 23. 合并 K 个升序链表的算法思路及python代码 pljnb LeetCode热题100 算法 leetcode 链表
23.合并K个升序链表给你一个链表数组，每个链表都已经按升序排列。请你将所有链表合并到一个升序链表中，返回合并后的链表。示例1：输入：lists=[[1,4,5],[1,3,4],[2,6]]输出：[1,1,2,3,4,4,5,6]解释：链表数组如下：[1->4->5,1->3->4,2->6]将它们合并到一个有序链表中得到。1->1->2->3->4->4->5->6示例2：输入：lists=[
【计算机系统概论】计算机框架是什么？冯诺依曼架构为什么重要？我们要记住冯·诺依曼架构的什么？爱吃羊的老虎计算机系统架构系统架构计算机网络
什么是计算机的框架？计算机的框架（架构）就是计算机工作的基本规则，规定了它如何存储数据、如何执行指令、如何传输信息。可以理解成是计算机的大脑结构，它决定了一台计算机的工作方式。如果把计算机比作一个工厂，那么架构就像是生产流程，比如：存储区（仓库）：存放数据和指令。控制中心（调度室）：决定接下来做什么。加工车间（计算单元）：执行计算和逻辑处理。运输系统（总线）：负责不同部件之间的信息传输。冯·诺依曼
本地源代码运行bun install时报错星火燎猿 C#疑难杂症处理方案 Bun Bun.js
最近使用Ubuntu系统运行Bun的时候报，Failedtospawnscriptinstallduetoerroros.linux.errno.generic.E.PERMPERM的错误，查看官方文档也没有这个错误描述，最终找到解决方案进行分享。报错问题如下：errorloadingcurrentdirectoryInstalling[2637/2230]error:failedtospawnl
人生重开模拟器 -deepseek版 Cccc吃吃吃 python 开发语言
人生重开模拟器是一个有趣的文字类游戏，玩家可以通过选择不同的选项来体验不同的人生轨迹。下面是一个简单的Python实现，模拟了人生重开的过程。玩家可以通过输入数字来选择不同的选项，游戏会根据选择生成不同的人生结局。```pythonimportrandomdefprint_intro():print("欢迎来到人生重开模拟器！")print("你将重新开始你的人生，通过不同的选择体验不同的人生轨迹
PTA天梯赛Python7-52 古风排版胡同Alley python
中国的古人写文字，是从右向左竖向排版的。本题就请你编写程序，把一段文字按古风排版。输入格式：输入在第一行给出一个正整数N（<100），是每一列的字符数。第二行给出一个长度不超过1000的非空字符串，以回车结束。输出格式：按古风格式排版给定的字符串，每列N个字符（除了最后一列可能不足N个）。输入样例：4Thisisatestcase输出样例：asaTstihetsices代码长度限制16KB时间限制
详细介绍 Jupyter nbconvert 工具及其用法：如何将 Notebook 转换为 Python 脚本源代码杀手 python使用技巧 python jupyter ide
nbconvert是Jupyter提供的一个非常强大的工具，允许用户将JupyterNotebook文件（.ipynb）转换成多种格式，包括Python脚本（.py）、HTML、PDF、LaTeX等。你可以通过命令行来运行nbconvert，也可以在JupyterNotebook中通过一些自定义的设置来实现转换。安装nbconvert通常情况下，nbconvert会随Jupyter一起安装，因此不
python -- assert函数我不是程序员‍ python知识 python
一、assert函数在Python中，assert语句用于调试和测试代码。它用于检查某个条件是否为真。如果条件为假，assert语句会抛出一个AssertionError异常，并可以选择性地附加一条错误消息。assert语句的基本语法是：assertcondition,optional_messagecondition:一个布尔表达式。如果结果为True，程序继续执行。如果为False，会触发As
Beekeeper Studio：高颜值且免费的SQL开发工具开源项目精选 sql 数据库
BeekeeperStudio是一款免费开源的SQL开发和数据库管理工具，具有美观高效、简单易用的特点。BeekeeperStudio基于Vue.js开发，遵循MIT开源协议，支持Windows、Linux以及macOS平台。Stars数17842Forks数1170主要特点安全连接：除了正常的连接，也可以使用SSL加密连接或通过SSH隧道连接；SQL自动补全：代码编辑器支持语法高亮和表名自动补全
CTF杂项挑战：使用已知字典破解ZIP文件密码 0dayNu1L Web安全 CTF web安全网络安全
在CTF比赛中，杂项挑战通常包含一些非传统的题目，其中破解ZIP文件密码是一个常见的任务。本文将介绍两种在已知密码字典文件的情况下，破解ZIP文件密码的方法：一种是使用Python脚本进行暴力破解，另一种是通过zip2john和john命令结合进行破解。0dayNu1L-CSDN博客请一键三连吧！！！❤❤❤目录方法一：使用Python脚本进行暴力破解步骤方法二：使用zip2john和john命令结
文本转语音的Python库（pyttsx3）数产第一混子 python库 python
一、pyttsx3的概述pyttsx3isatext-to-speechconversionlibraryinPython.pyttsx3是Python中的文本到语音转换库。二、pyttsx3的安装pipinstallpyttsx3三、小试牛刀importpyttsx3engine=pyttsx3.init()engine.say("Iwillspeakthistextrightnow")engi
区块链赋能：用Python开发去中心化投票系统 Echo_Wish Python！实战！区块链 python 去中心化
区块链赋能：用Python开发去中心化投票系统在这个互联网迅猛发展的时代，投票系统不仅仅停留在政务领域，它已成为社区治理、企业决策甚至区块链DAO（去中心化自治组织）中重要的机制。然而，传统投票系统往往集中化，存在信任和数据安全问题。区块链技术以其不可篡改性和透明性为去中心化投票提供了理想的解决方案。在这篇文章中，我将通过Python语言，结合区块链智能合约，教你如何从零开发一个去中心化的投票系统
Python助力区块链互通——跨链桥接的实现与实践 Echo_Wish Python！实战！区块链 python 开发语言
Python助力区块链互通——跨链桥接的实现与实践区块链技术的繁荣发展带来了巨大的生态创新，但也因各链之间的割裂局面限制了它们的潜力。例如，你或许想在以太坊上使用来自比特币的资产，却因两条链不互通而不得不求助于中心化交易所。要打破“链间壁垒”，跨链桥接（Cross-chainBridge）应运而生。今天，我以Echo_Wish的视角，通过Python代码实践，带你深入了解跨链桥接的工作原理，技术实
Parrot OS 6.3 发布！全面提升安全性，新增先进工具，带来更高性能 wljslmz Linux技术 linux Parrot OS
2025年2月，全球知名的安全和隐私为核心的Linux发行版——ParrotOS迎来了其最新版本——ParrotOS6.3。作为一款基于Debian的多功能操作系统，ParrotOS旨在为安全专家、开发人员以及关注隐私的用户提供强大的功能支持。ParrotOS6.3版本在性能、工具更新、硬件支持等方面进行了一系列优化，凭借其更加稳定的安全性，最新的工具包，以及对硬件兼容性的大幅提升，ParrotO
python pyttsx3文本转语音_python 利用pyttsx3文字转语音木大木大本太 python pyttsx3文本转语音
#-*-coding:utf-8-*-importpyttsx3f=open("all.txt",'r')line=f.readline()engine=pyttsx3.init()whileline:line=f.readline()print(line,end='')engine.say(line)engine.runAndWait()f.close()importwin32com.clien
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str