Python高级正则表达式

介绍

在我们教程的正则表达式介绍中，我们已经介绍了正则表达式的基本原理。我们已经展示了最简单的正则表达式的样子。我们还学习了如何通过使用 re 模块的 search() 和 match() 方法在 Python 中使用正则表达式。制定和使用字符类的概念，以及预定义的字符类，如 \d、\D、\s、\S 等，现在应该是众所周知的。您一定已经学会了如何使用正则表达式匹配字符串的开头和结尾。您必须知道问号的特殊含义才能使项目可选。我们还引入了量词来任意或在特定范围内重复字符和组。

您还必须熟悉分组的使用以及反向引用的语法和用法。

此外，我们已经解释了 re 模块的匹配对象及其包含的信息，以及如何使用 span()、start()、end() 和 group() 方法检索这些信息。

介绍以一个全面的 Python 示例结束。

在本章中，我们将继续解释正则表达式的语法。我们还将解释 Python 模块 re 的更多方法。例如，如何查找正则表达式的所有匹配子字符串。一项需要使用其他编程语言（如 Perl 或 Java）编程的任务，但可以通过调用 Python 的 re 模块的一个方法来处理。到目前为止，我们只知道如何使用字符类定义字符选择。我们将在教程的本章中演示如何制定子串的交替，

查找所有匹配的子串

Python 模块 re 提供了另一种很棒的方法，这是 Perl 和 Java 等其他语言不提供的。如果要查找字符串中与正则表达式匹配的所有子字符串，则必须在 Perl 和其他语言中使用循环，如下面的 Perl 片段所示：

而 ($string =~ m/regex/g) {
  打印“找到 '$&'。下一次尝试字符”。pos($string)+1 。"\n";
}

在 Python 中要容易得多。无需循环。我们可以使用 re 模块的 findall 方法：

 re.findall（模式，字符串[，标志]）

findall 返回字符串中模式的所有非重叠匹配项，作为字符串列表。从左到右扫描字符串，并按照找到的顺序返回匹配项。

t = "肥猫不吃燕麦，但老鼠吃蝙蝠。" 
莫 = 重新。findall ( "[force]at" ,  t )
打印( mo )

输出：

['脂肪', '猫', '吃', '燕麦', '老鼠', '吃']

如果模式中存在一个或多个组， findall 将返回一个组列表。如果模式有多个组，这将是一个元组列表。我们将在下一个示例中演示这一点。我们有一个很长的字符串，其中包含各种 Python 培训课程及其日期。第一次调用 findall 时，我们不使用任何分组并因此接收完整的字符串。在下一次调用中，我们使用分组并 findall 返回一个 2 元组列表，每个元组将课程名称作为第一个组成部分，将日期作为第二个组成部分：

进口 重新
课程 =  “Python的训练课程初学者：15/8/2011 - 19/8/2011; Python的培训课程中间体：12 / DEC / 2011 - 16 / DEC / 2011; Python的文本处理场：31月/ 10月/ 2011 - 4/Nov/2011" 
items  =  re 。findall ( "[^:]*:[^;]*;?" , 课程)
项目

输出：

['Python 初学者培训课程：15/Aug/2011 - 19/Aug/2011;',
 'Python 培训课程中级：12/Dec/2011 - 16/Dec/2011;',
 'Python 文本处理课程：31/Oct/2011 - 4/Nov/2011']

项目 = 重新。findall ( "([^:]*):([^;]*;?)" , 课程)
项目

输出：

[('Python 初学者培训课程', '15/Aug/2011 - 19/Aug/2011;'),
 （“Python 培训课程中级”，“2011 年 12 月 12 日 - 2011 年 12 月 16 日；”），
 （“Python 文本处理课程”，“2011 年 10 月 31 日 - 2011 年 11 月 4 日”）]

交替

在我们对正则表达式的介绍中，我们介绍了字符类。字符类提供一组字符中的一个选择。有时我们需要在几个正则表达式之间进行选择。这是一个逻辑“或”，这就是为什么这个结构的符号是“|” 象征。在以下示例中，我们检查伦敦、巴黎、苏黎世、康斯坦茨伯尔尼或斯特拉斯堡中的一个城市是否出现在以“location”一词开头的字符串中：

import  re 
str  =  "课程地点是伦敦或巴黎！" 
莫 = 重新。search ( r "location.*(London|Paris|Zurich|Strasbourg)" , str ) 
if  mo :  print ( mo . group ())

输出：

地点是伦敦或巴黎

如果您认为前面的示例过于人为，那么这里是另一个示例。假设您想过滤电子邮件。您想找到您与 Python 的创建者和设计者 Guido van Rossum 之间的所有通信（对话）。以下正则表达式有助于此目的：

 r"(^To:|^From:) (Guido|van Rossum)"

此表达式匹配以“To:”或“From:”开头、后跟一个空格、然后是名字“Guido”或姓氏“van Rossum”的所有行。

编译正则表达式

如果您想在脚本中多次使用相同的正则表达式，使用正则表达式对象可能是个好主意，即编译正则表达式。

一般语法：

 重新编译（模式[，标志]）

compile 返回一个 regex 对象，可以稍后用于搜索和替换。可以通过指定标志值来修改表达式行为。

缩写	全名	描述
回复	re.ignorecase	使正则表达式不区分大小写
再L	重新定位	某些特殊序列如 \w、\W、\b、\s、\S 的行为将取决于当前的语言环境，即用户的语言、国家等。
再M	重新多线	^ 和 $ 将在每行的开头和结尾匹配，而不仅仅是在字符串的开头和结尾
re.S	重新打点	点“.” 将匹配每个字符加上换行符
再U	重新.UNICODE	使 \w、\W、\b、\B、\d、\D、\s、\S 依赖于 Unicode 字符属性
雷.X	re.VERBOSE	允许“详细的正则表达式”，即忽略空格。这意味着空格、制表符和回车符不匹配。如果要匹配详细正则表达式中的空格，则需要通过在其前面使用反斜杠对其进行转义或将其包含在字符类中来对其进行转义。 # 也被忽略，除非在字符类中或前面有一个非转义的反斜杠。“#”之后的所有内容都将被忽略，直到行尾，因此该字符可用于开始注释。

编译后的常规对象通常不会节省太多时间，因为每当您将它们与 re.search() 或 re.match() 一起使用时，Python 都会在内部编译和缓存正则表达式。未编译的正则表达式唯一需要的额外时间是它需要检查缓存的时间，这是字典的键查找。

使用它们的一个很好的理由是将正则表达式的定义与其使用分开。

例子

我们已经在介绍性章节中引入了匹配英国邮政编码超集的正则表达式：

 r"[Az]{1,2}[0-9R][0-9A-Z]? [0-9][ABD-HJLNP-UW-Z]{2}"

我们将使用此正则表达式演示如何在以下交互式会话中使用模块 re 的编译功能。正则表达式“regex”用re.compile(regex)编译，编译后的对象保存在对象compiled_re中。现在我们调用对象compiled_re的search()方法：

import  re 
regex  =  r "[Az]{1,2}[0-9R][0-9A-Z]? [0-9][ABD-HJLNP-UW-Z] {2} " 
address  =  "BBC News中心，伦敦，W12 7RJ” 
compiled_re  =  re 。编译（正则表达式）
res  =  compiled_re 。搜索（地址）
打印（res ）

输出：

使用或不使用正则表达式拆分字符串

有一个字符串方法split，可用于将字符串拆分为子字符串列表。

 str.split([sep[, maxsplit]])

如您所见，split 方法有两个可选参数。如果没有给出（或者是 None），一个字符串将被分成使用空格作为分隔符的子字符串，即每个纯由空格组成的子字符串都用作分隔符。

我们用亚伯拉罕·林肯的一句名言来证明这种行为：

law_courses  =  "让每一个美国母亲对趴在她腿上
喋喋不休的婴儿表达对法律的崇敬。让它在学校、神学院和大学里教授。让它写在入门书、拼写书和历书。让它在讲坛上宣讲，在立法大厅里宣扬，并在法庭上执行。总之，让它成为国家的政治宗教。” 法律课程。分裂()

输出：

['让'，
 '尊敬'，
 '为了'，
 '这'，
 '法律'，
 '是'，
 '呼吸'，
 '经过'，
 '每一个'，
 '美国人'，
 '母亲'，
 '到'，
 '这'，
 '口齿不清'，
 '宝贝',
 '那'，
 '闲聊'，
 '在'，
 '她'，
 '圈。',
 '让'，
 '它'，
 '是'，
 '教'，
 '在'，
 '学校',
 '在'，
 '神学院，'，
 '和'，
 '在'，
 '大学。',
 '让'，
 '它'，
 '是'，
 '书面'，
 '在'，
 '引物'，
 '拼写',
 '图书，'，
 '和'，
 '在'，
 '年鉴。',
 '让'，
 '它'，
 '是'，
 '传教'，
 '从'，
 '这'，
 '讲坛'，
 '宣布',
 '在'，
 '立法'，
 '大厅，'，
 '和'，
 '强制'，
 '在'，
 '这'，
 “法院”，
 '的'，
 '正义。'，
 '和，'，
 '在'，
 '短的，'，
 '让'，
 '它'，
 '变得'，
 '这'，
 '政治的'，
 '宗教'，
 '的'，
 '这'，
 '国家。']

现在我们来看一个字符串，它可能来自 Excel 或 OpenOffice calc 文件。我们在前面的例子中已经看到 split 将空格作为默认分隔符。我们想在下面的小例子中使用分号作为分隔符来分割字符串。我们唯一要做的就是使用“;” 作为 split() 的参数：

line  =  "James;Miller;teacher;Perl" 
line 。拆分（“；” ）

输出：

['詹姆斯'，'米勒'，'老师'，'Perl']

split() 方法有另一个可选参数：maxsplit。如果给出了 maxsplit，则最多完成 maxsplit 次分割。这意味着结果列表最多将包含“maxsplit + 1”个元素。我们将在下一个示例中说明 maxsplit 的操作方式：

mammon  =  "世界主要宗教之神。主庙在圣城纽约。" 
金门。拆分( " " , 3 )

输出：

['这'，
 '上帝'，
 '的'，
 “世界领先的宗教。主要寺庙在圣城纽约。”]

我们在前面的例子中使用了一个空白作为分隔符字符串，这可能是一个问题：如果连接多个空格或空格，split() 会在每个空格后拆分字符串，这样我们就会得到空字符串和只有我们的结果列表中 ('\t') 内的一个选项卡：

财神 =  “神  \ t世界领先的宗教，行政寺庙是在纽约的圣城。” 
金门。拆分( " " , 5 )

输出：

['这'，
 '上帝'，
 '',
 '\t',
 '的'，
 “世界领先的宗教。主要寺庙在圣城纽约。”]

我们可以通过使用 None 作为第一个参数来防止空字符串的分离。现在 split 将使用默认行为，即每个由连接的空白字符组成的子字符串将被视为一个分隔符：

金门。拆分（无，5 ）

输出：

['这'，
 '上帝'，
 '的'，
 '这'，
 "世界的",
 '主导宗教。主庙位于圣城纽约。']

正则表达式拆分

在许多情况下，字符串方法 split() 是正确的工具，但是，如果您想获取文本的裸词，即没有任何特殊字符和空格，该怎么办。如果我们想要这个，我们必须使用 re 模块中的 split 函数。我们用 Ovid 的 Metamorphoses 开头的一段简短文字来说明这种方法：

import  re 
metamorphoses  =  "OF 的身体变成了各种形式，我唱道：Ye Gods，这些奇迹从他们身上涌现，用天体的热度激励我的人数；" 
再。分裂( "\W+" ,变形)

输出：

['的'，
 '身体'，
 '张',
 'd',
 '到'，
 '各种各样的'，
 '形式'，
 '一世'，
 '唱歌'，
 '耶',
 '神'，
 '从'，
 '谁'，
 '这些'，
 “奇迹”，
 '做过'，
 '春天'，
 '启发'，
 '我的'，
 '数字',
 '和'，
 '天体'，
 '热'，
 '']

下面的例子是一个很好的例子，正则表达式确实优于字符串拆分。假设我们有包含姓氏、名字和姓名职业的数据行。我们要清除多余和多余的文本描述的数据行，即“姓氏：”、“姓名：”等，以便我们只有第一列中的姓氏，第二列中的名字和第三栏职业：

import  re 
lines  =  [ “姓氏：奥巴马，前称：巴拉克，职业：总统” ， “姓氏：默克尔，前称：安吉拉，职业：总理” ] 
for  line  in  lines : 
    print ( re . split ( ",* *\w *: " , 行))

输出：

['', '奥巴马', '巴拉克', '总统']
['', '默克尔', '安吉拉', '总理']

我们可以使用切片运算符轻松改进脚本，这样我们就不会将空字符串作为结果列表的第一个元素：

import  re 
lines  =  [ “姓氏：奥巴马，前称：巴拉克，职业：总统” ， “姓氏：默克尔，前称：安吉拉，职业：总理” ] 
for  line  in  lines : 
    print ( re . split ( ",* *\w *: " , 行)[ 1 :])

输出：

[‘奥巴马’、‘巴拉克’、‘总统’]
[‘默克尔’、‘安吉拉’、‘总理’]

现在来看看完全不同的东西：巴拉克奥巴马和 Python 或更好的蒙蒂 Python 之间存在联系。巨蟒的成员之一约翰·克里斯在 2008 年 4 月告诉西方日报：“我将作为一名演讲撰稿人为他提供服务，因为我认为他是一个聪明人。”

搜索并替换为子

re.sub（正则表达式，替换，主题）

字符串主题中正则表达式 regex 的每个匹配项都将被替换为字符串替换。例子：

” import  re 
str  =  “是的我说是的我会是的。” 
资源 = 重新。sub ( "[yY]es" , "no" ,  str )
打印( res )

输出：

不，我说不，我不会。

练习

练习 1

给出了一个名为“order_journal.txt”的文件，格式如下：

%% WriteFile的order_journal.txt
顾客-编号 1289 
T83456
顾客-编号 1289
的客户-编号 1205 
T10032 
B77301
顾客-编号 1205
的客户-编号 1410 
K34001 
T98987
顾客-编号 1410
的客户-编号 1205 
T10786 
C77502
顾客-编号 1205
的客户-编号 1289 
Z22334
客户-编号 1289

输出：

覆盖 order_journal.txt

编写一个新文件'order_journal_regrouped.txt'，其中的数据按照如下方式重新分组：

1289,T83456
1289,Z22334
1205,T10032
1205,B77301
1205,T10786
1205,C77502
1410,K34001
1410,T98987

解决方案

练习 1 的解决方案

进口 重新

txt  = 打开（“order_journal.txt” ）。读()

数据 =  {}     ＃将包含chustomer-id作为键和oders作为值串
为 X 在 再。finditer ( r "customer-id ([\d\n] {4} )(.*?)customer-id \1" ,  txt ,  re . DOTALL ): 
    key ,  values  =  x 。组()

    如果 密钥 中 的数据：
        数据[键]  + = 值
    否则：
        数据[键]  = 值
与 打开（“order_journal_regrouped.txt” ， “W” ） 作为 FH ：
    用于 密钥 在 数据：
        用于 art_no 在 数据[键] 。拆分(): 
            fh 。写( f " {键} ,{ art_no } \n " )

我们可以检查新创建的文件的内容：

content  =  open ( "order_journal_regrouped.txt" ) 。读（）
打印（内容）

输出：

1289,T83456
1289,Z22334
1205,T10032
1205,B77301
1205,T10786
1205,C77502
1410,K34001
1410,T98987

【Python】一文详细介绍 py格式文件高斯小哥 Python基础【高质量合集】python 新手入门学习
【Python】一文详细介绍py格式文件个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文章目录一、py格式文件简介二、如何创建和编辑py格式文件三、如何运行py
python抓包与解包_Python—网络抓包与解包（pcap、dpkt） weixin_39691055 python抓包与解包
pcap安装[root@localhost~]#pipinstallpypcap抓包与解包#-*-coding:utf-8-*-importpcap,dpktimportre,threading,requests__black_ip=['103.224.249.123','203.66.1.212']#抓包：param1eth_name网卡名，如：eth0,eth3。param2p_type日志捕
华为OD机试 - 单向链表中间节点（Java & JS & Python & C & C++）华为OD题库华为od 链表 java
须知哈喽，本题库完全免费，收费是为了防止被爬，大家订阅专栏后可以私信联系退款。感谢支持文章目录须知题目描述输出描述解析代码题目描述给定一个单链表L，请编写程序输出L中间结点保存的数据。如果有两个中间结点，则输出第二个中间结点保存的数据。例如：给定L为1→7→5，则输出应该为7；给定L为1→2→3→4，则输出应该为3；输入描述每个输入包含1个测试用例。每个测试用例：第一行给出链表首结点的地址、结点总
python 推导式(派生、衍生) sanduo112 人工智能 python windows 开发语言
python推导式一、推导式(派生、衍生)1.Python推导式是一种独特的数据处理方式，可以从一个数据序列构建另一个新的数据序列的结构体。2.列表(list)推导式3.字典(dict)推导式4.集合(set)推导式5.元组(tuple)推导式二、代码概述一、推导式(派生、衍生)1.Python推导式是一种独特的数据处理方式，可以从一个数据序列构建另一个新的数据序列的结构体。Python支持各种数
数据挖掘|数据预处理|基于Python的数据标准化方法皖山文武数据挖掘数据建模与分析 python 数据挖掘开发语言
基于Python的数据标准化方法1.z-score方法2.极差标准化方法3.最大绝对值标准化方法在数据分析之前，通常需要先将数据标准化（Standardization），利用标准化后的数据进行数据分析，以避免属性之间不同度量和取值范围差异造成数据对分析结果的影响。1.z-score方法Z-score方法是基于原始数据的均值和标准差来进行数据标准化的，处理后的数据均值为0，方差为1，符合标准正态分布
CSV指南：Python程序获取大型CSV文件行数孤独打铁匠Julian 笔记经验分享 python
本指南提供了几种使用Python来获取大型CSV文件行数的方法，并解释了每种方法的适用场景。方法1:使用csv.reader处理复杂CSV文件当你的CSV文件中包含多行字段（即某些字段的值中包含换行符）时，使用csv.reader是一个可靠的选择，因为它能够正确处理这些复杂情况。这个方法适用于大多数大小的CSV文件，但是对于非常大的文件，读取整个文件可能会占用较多的时间和内存。对于极大的文件，考虑
谷歌浏览器驱动Chromedriver（114-120版本）文件以及驱动下载教程 pigerr杨 Python python chrome drivers
ChromeDriver官方网站GitHub||GoogleChromeLabs/chrome-for-testingChromeDriver113-125_JSONChromeforTestingavailability123-125zip白月黑羽Python基础|进阶|Qt图形界面|Django|自动化测试|性能测试|JS语言|JS前端|原理与安装
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
python转码 Desamond python 开发语言
转码在许多场景中都有应用，以下是一些常见的场景：网页开发：当用户在网页上输入文本时，可能需要将特殊字符（如空格、引号、特殊符号等）进行转码，以防止这些字符对URL或HTML代码产生干扰。文件名处理：在处理文件名时，可能需要将特殊字符进行转码，以避免文件名被错误地解析或显示。数据传输：在数据传输过程中，为了确保数据的完整性和正确性，可能需要将数据中的特殊字符进行转码。数据存储：在数据库或数据存储中，
排序算法太多？常用排序都在这了，一篇文章总结和实现所有面试会考的排序算法（基于Python实现）宇宙之一粟不归路之Python #IT面试题收集与总结数据结构与算法算法数据结构排序算法 python java
文章目录排序算法1.常见的排序算法1.1选择排序1.1.1思想1.1.2实现**1.1.3选择排序分析**1.2冒泡排序**1.2.1思想****1.2.2实现****1.2.3冒泡排序分析**1.3插入排序**1.3.1思想****1.3.2实现****1.3.3插入排序分析**1.4归并排序☆☆★**1.4.1思想****1.4.2实现****1.4.3归并排序分析**1.5快速排序☆★★**
27.Python从入门到精通—Python异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为以山河作礼。 #Python基础入门—详解版 python java 服务器
27.从入门到精通：Python异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为异常处理在Python中，异常处理是一种处理程序在执行期间可能遇到的错误的方法。当Python解释器遇到错误时，它会引发异常。异常是一种Python对象，它包含有关错误的信息，例如错误类型和错误位置。为了处理异常，您可以使用try-except语句。在
python清华大学出版社答案_Python机器学习及实践 weixin_39805119 python清华大学出版社答案
第1章机器学习的基础知识1.1何谓机器学习1.1.1传感器和海量数据1.1.2机器学习的重要性1.1.3机器学习的表现1.1.4机器学习的主要任务1.1.5选择合适的算法1.1.6机器学习程序的步骤1.2综合分类1.3推荐系统和深度学习1.3.1推荐系统1.3.2深度学习1.4何为Python1.4.1使用Python软件的由来1.4.2为什么使用Python1.4.3Python设计定位1.4.
Python | Redis工具类 -拟墨画扇- Python redis 数据库缓存 python
一、需求自动连接Redis数据库，通过连接池处理数据对输出结果进行Log打印并保存到文件二、代码Utils.redisUtils.py#!/usr/bin/envpython#-*-coding:utf-8-*-importredisfromUtils.loggerimportlog"""Redis数据格式(1)字符串|存储形式:key-value:str-存储二进制数据:可以存储任意类型的数据，
Python dict字符串转json对象，小数精度丢失问题朝如青丝暮成雪 json python
一前言JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式，dict是Python的一种数据格式。本篇介绍一个float数据转换时精度丢失的案例。二问题描述importjsontest_str1='{"π":3.1415926535897932384626433832795028841971}'test_str2='{"value":10.00000}'print
Python+Requests模拟发送GET请求爱学习的执念自动化测试软件测试技术分享 python 开发语言
模拟发送GET请求前置条件：导入requests库一、发送不带参数的get请求代码如下：以百度首页为例importrequests#发送get请求response=requests.get(url="http://www.baidu.com")print(response.content.decode("utf-8"))#以utf-8的编码输出内容二、发送带参数的get请求发送带参数的get请求有
Python极速入门：五分钟开启实战之旅！知白守黑V Python 编程语言系统运维 python 编程语言 python开发 python学习 python入门 python数据分析
1.Python基础语法和结构：了解Python的基本语法，包括变量、数据类型、运算符、注释等。控制流：掌握条件语句（if-elif-else）、循环（for和while）及其控制（break和continue）。函数：学习如何定义和使用函数，包括参数传递、返回值、作用域和闭包。模块和包：理解如何导入和使用模块，以及如何创建和使用自己的包。2.数据处理列表、元组和集合：学习这些序列类型的操作和方法
Python Flask 使用数据库安果移不动 python flask 开发语言
pipinstallflask_sqlalchemy官方文档：Flask-SQLAlchemy—Flask-SQLAlchemyDocumentation(3.1.x)为了不报错也需要导入另外两个库#pipinstallflask_sqlalchemy#pipinstallmysqlclient完整代码importosfromflaskimportFlaskfromflask_sqlalchemy
PaperWeekly sapienst Papers PaperwithCode General ML
1.Python软件包解决DL在未见过的数据分布下性能差的问题：（1）神经网络和损失分离的模块化设计（2）强大便捷的基准测试能力（3）易于使用但难以修改（4）github:https://github.com/marrlab/domainlabTrainer和Models之间是什么关系Trainer和Models是DomainLab中的两个核心概念。Trainer是一个用于指导数据流向模型并计算S
使用Python读取Excel文件并计算平均分嘻嘻爱编码 Python从入门到放弃 python excel 开发语言
在这篇博客中，我们将探讨如何使用Python的pandas库来读取Excel文件，并计算其中数据的平均分。pandas是一个强大的数据分析工具，它允许我们以简单直观的方式处理表格数据。安装必要的库在开始之前，确保你的环境中安装了pandas和openpyxl库。可以使用以下命令进行安装：pipinstallpandasopenpyxl读取Excel文件首先，我们需要读取Excel文件。假设我们有一
python项目练习——7.网站访问日志分析器 F—— python项目练习 python 信息可视化数据分析数据挖掘开发语言学习
项目功能分析：这个项目可以读取网站的访问日志文件，统计访问量、独立访客数、访问来源等信息，并以图表或表格的形式展示出来。这个项目涉及到文件操作、数据处理、数据可视化等方面的技术。示例代码：importrefromcollectionsimportCounterimportmatplotlib.pyplotaspltdefparse_log_file(log_file):#读取日志文件内容witho
python的while双重循环九九乘法表 Jinm_R python 开发语言
a=1whilea<=9:b=1#乘数每次需要从1开始whileb<=a:print(f"{a}*{b}={a*b}\t",end='')#\t为制表符使乘法表整齐end=''代表用空格代替换行b+=1a+=1print()#乘数每加一换行
【Python】成功解决ModuleNotFoundError: No module named ‘torchinfo‘ 高斯小哥 BUG解决方案合集 python pytorch 新手入门学习 debug
【Python】成功解决ModuleNotFoundError:Nomodulenamed‘torchinfo’个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文
Python自动化测试web常见框架汇总自动化测试薰儿软件测试技术分享 python 前端开发语言
1、前言目前，有非常多的Python框架，用来帮助你更轻松的创建web应用。这些框架把相应的模块组织起来，使得构建应用的时候可以更快捷，也不用去关注一些细节（例如socket和协议），所以需要的都在框架里了。接下来我们会介绍不同的选项。经过初期的不起眼，Python已经成为互联网最流行的服务端编程语言之一。根据W3Techs的统计，它被用于很多的大流量的站点很多的大流量的站点很多的大流量的站点，超
python安装jupter在线ide 晚风拂柳颜生活小经验 python3 ide jupter
我在虚拟3.6.8的环境里面安装的，具体用了以下命令；pipinstallipython-ihttps://mirrors.aliyun.com/pypi/simple/pipinstalljupyter-ihttps://mirrors.aliyun.com/pypi/simple/jupyternotebook当然，jupter可以直接通过python环境里script目录下的jupyter-
opencv 十八 python下实现0缓存掉线重连的rtsp直播流播放器摸鱼的机器猫 opencv实战 opencv python 缓存
使用opencv打开rtsp视频流时，会因为网络问题导致VideoCapture掉线；也会因为图像的后处理阶段耗时过长导致opencv缓冲区数据堆积，从而使程序无法及时处理最新的数据。为此对cv2.VideoCapture进行封装，实现0缓存掉线重连的rtsp直播流播放器，让程序能一直处理最新的数据。代码实现fromcollectionsimportdequeimportthreadingimpo
Windows如何安装poppler库，python的PDF转PPTX项目跨不过 pdf
资源库在这里下载https://github.com/oschwartz10612/poppler-windows/releases/tag/v21.03.0其他的参考这篇博客，里面提到的资源链接失效了https://blog.csdn.net/wy01415/article/details/110257130
用Python批量更改图片大小马达马达达 AI python
#提取目录下所有图片,更改尺寸后保存到另一目录fromPILimportImageimportos.pathimportglobdefconvertjpg(jpgfile,outdir,width=128,height=128):img=Image.open(jpgfile)try:new_img=img.resize((width,height),Image.BILINEAR)new_img.s
3.Python数据分析—数据分析入门知识图谱&索引(知识体系中篇) 以山河作礼。 Python数据分析项目数据分析知识图谱数据挖掘 python 开发语言
3.Python数据分析—数据分析入门知识图谱&索引-知识体系中篇一·个人简介二·数据获取和处理2.1数据来源：2.2数据清洗：2.2.1缺失值处理：2.2.2异常值处理：2.3数据转换：2.3.1数据类型转换：2.3.2数据编码：2.4数据合并与重塑：2.4.1数据合并：2.4.2数据拼接：2.4.3数据重塑：三·数据探索与分析3.1描述性统计分析3.2数据可视化原则和技巧3.3探索性数据分析（
SWIFT环境配置及大模型微调实践 weixin_43870390 swift 开发语言 ios
SWIFT环境配置及大模型微调实践SWIFT环境配置基础配置增量配置SWIFTQwen_audio_chat大模型微调实践问题1:问题2:问题定位解决方法手动安装pytorchSWIFT介绍参考：这里SWIFT环境配置基础配置condacreate-nswiftpython=3.8pipinstallms-swift[all]-U#下载项目gitclonehttps://github.com/mo
【Python】 Python脚本实现某平台视频流下载音乐学家方大刚 Python 爬虫 python chrome 开发语言
亲爱的玛丽我会想念着你我是多么的讨厌分离加油站旁的海鸥机场路上的松柏挥挥手眼泪就落下来我多想和那些光阴永远住下来我不能我不能赵雷《玛丽》在视频内容的分发上，m3u8格式的视频流越来越常见。它将视频切分成多个小片段（TS文件），然后通过索引文件（m3u8文件）来组织播放顺序，有效地支持了视频的流式传输。这篇博客将引导您使用Python脚本来下载m3u8格式的视频流，并将其合并成一个单一的视频文件。准
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin