weixin_48668114

Python-正则表达式

正则表达式的含义
使用正则表达式步骤
- 寻找规律
- 表示规律
- - 普通字符匹配
  - 元字符匹配
  - - []
    - ()
    - {}
  - 数量词
  - 指代字符
  - 边界相关
  - 在[]中的元字符
正则表达式分组
- 分组中用到的特殊字符
- - 捕获组
- 分组举例
正则表达式常用方法
- re.match函数
- - match参数
  - flags参数
  - re.match匹配对象方法
  - groupdict应用
- re.search方法
- - re.match与re.search的区别
  - re.match和re.search带不带圆括号的区别
- re.findall
- - re.findall带不带圆括号的区别
- re.finditer
- - re.findall，re.finditer与re.match，re.search的区别
- re.sub
- re.subn
- re.split
贪婪非贪婪
正则表达式应用举例
正则表达式参考网站

正则表达式的含义

正则表达式是对字符串操作的一种逻辑公式，是用事先定义好的一些特殊字符及其组合，组成一个规则字符串，这个规则字符串用来表达对字符串的一种过滤逻辑。
正则表达式是用来匹配与查找，替换字符串的。

举个例子：
从字符串"1234jfvpsjgmbk780a15801879957**82mmn1234lciclshalcojfbg…"里找出手机号码，这个字符串可能有上万个字符，不可能人眼一个个找，使用正则表达式，告诉它，凡是158,138，182等开头，并且连续11个都是数字的，就是手机号码。那么凡是158,138，182等开头，并且连续11个都是数字的，就是手机号码，这段描述就是正则表达式的文字描述，接下来，我们要把它转化为专业的python描述。

使用正则表达式步骤

寻找规律
使用正则符号表示规律
提取信息，如果每一个字符都能匹配，则匹配成功；一旦有匹配不成功的字符则匹配失败

寻找规律

规律要进行发现和提炼，抓住主要特征
比如上述的电话号码的描述就是规律

表示规律

要用代码来表示规律，需要使用re模块，相关的正则中的模式字符串的一些要求如下：

普通字符匹配

大多数字符和字母都会和自身匹配。

import re
# "alexsel"是模式字符串，即正则表达式，"gtuanalesxalexselericapp"则为待匹配的字符串
result = re.findall("alexsel","gtuanalesxalexselericapp")
print(result)

result:
['alexsel']

元字符匹配

[]

[]中的字符是任选择一个字符。
如果所选字符是ASCll码中连续的一组的一个,那么可以使用"-"字符连接。
- 例如[0-9]表示0-9的其中一个数字,[A-Z]表示A-Z的其中一个大写字符,[0-9A-Z]表示0-9的其中一个数字或者A-Z的其中一个大写字符。
- [ABC]表示A，B，C中任意一个字符。
- []方括号内可以使用指代字符表中的任意一个。

import re
result = re.findall("[od]", "Hello,World.")
print(result)

result:
['o', 'o', 'd']

()

() :把括号内字符作为一个整体去处理

re.findall("(ab)+","aabz1144cabcd")

result:
['ab', 'ab']

{}

{} :控制它前面一个字符的匹配个数，可以有区间（闭区间），有区间的情况下按照多的匹配。
精确匹配 n 个前面表达式, 例如o{2} 不能匹配 “job” 中的 “o”，但是能匹配 “food” 中的两个 o

re.findall("alexsel{3}","aaaalexselllll")

result:
['alexselll']

数量词

正则表达式的重复限定符，用于指定一个模式的重复次数

数量词	含义	举例	结果
符号 *	匹配前一个字符0次或无限次	re.findall(“lo*”, “Hello,World.”)	[‘l’, ‘lo’, ‘l’]
符号 +	匹配前一个字符1次或无限次	re.findall(“lo+”, “Hello,World.”)	[‘lo’]
符号？	匹配前一个字符0次或1次	re.findall(“lo?”, “Hello,World.”)	re.findall(“lo?”, “Hello,World.”)
{m}	匹配前一个字符m次	re.findall(“lo{1}”, “loooxooloox”)	[‘lo’, ‘lo’]
{m,}	前一个字符至少出现m次	re.findall(“lo{2,}”, “loooxooloolox”)	[‘looo’, ‘loo’]，贪婪方式
{m，n}	匹配前一个字符m~n次	re.findall(“lo{2,3}”, “loooxooloolox”)	[‘looo’, ‘loo’], 贪婪方式

指代字符

正则表达式的预定义字符类，用于匹配常见字符集合
用指代字符可以指代某一类的字符，\小写和\大写一般相反
因为.在正则表达式中有特殊含义(匹配任意一个字符,除了换行符)，如果要匹配正常的.，使用r"."或者 “\.”

字符	含义	举例	结果
\d	匹配任何十进制数字；相当于类 [0-9]	re.findall(r"a\d{3,}", “bca12345a78a985”)	[‘a12345’, ‘a985’]
\D	与 \d 相反，匹配任何非十进制数字的字符；相当于类 [^0-9]	re.findall(r"a\D{2}", “bca12345a78a985amdax”)	[‘amd’]
\w	匹配字母数字及下划线，相当于[a-zA-Z0-9_]	re.findall(r"\w\d{2}", “hello95aa2d78”)	[‘o95’, ‘d78’]
\W	与 \w 相反
\s 匹配任何空白字符	（包含空格、换行符、制表符等）；相当于类 [ \t\n\r\f\v]	re.findall(r"\s\w", “hello world hello \nChina”)	[’ w’, ’ h’, ‘\nC’]
\S	与 \s 相反，匹配任何非空白字符；相当于类 [^ \t\n\r\f\v]
.	匹配一个除了换行符任意一个字符
\\	原意的\
[^]	相当于非运算符，除了后面的，其它的都行

边界相关

\b注意本身在字符串中会转义，如果要匹配\b，在正则表达式中，要么用r"\b"，要么用"\\b"

字符	含义	举例	结果
\b	匹配单词的开始或结束，即单词的边界，boundary	re.findall(r"\babc\b",“abc sds abc abcd”)	[‘abc’, ‘abc’]
\B	与 \b 相反	re.findall(r"\Babc\B",“abc sds abc cabcd”)	[‘abc’]
\A	从字符串的开始处匹配，A是字母里的第一个，用于指示开始处	re.findall(r"\Aabc",“abc sds abc abcd”)	[‘abc’]
\Z	从字符串的结束处匹配，如果存在换行，只匹配到换行前的结束字符串，Z是字母里的末尾，用于指示结束处	re.findall(“oo\w\Z”,“ood123foozaoob”)	[‘oob’]
^	匹配开头，只有后面跟的字符串在开头，才能匹配上	re.findall(“^alexsel”,“alexselgtaassiqialexsel124”)	[‘alexsel’]
$	匹配末尾，只有它前面的字符串在检测的字符串的最后，才能匹配上	re.findall(“alexsel$”,“alexselgtaassiqialexsel”)	[‘alexsel’]

在[]中的元字符

大部分元字符在[]中就表示普通字符，无特殊意义。
但是- ^ \具有特殊意义。

re.findall("a[.]d","aaaacd")

result:
[]

字符	含义	举例	结果
[-]	说明匹配字符范围，如[a-z]表示a到z的字符中的任意一个	re.findall(“[a-d]\d”, “aaaacd34”)	[‘d3’]
[^]	匹配[]除了后面所跟范围的字符，(^在这里有非的意思)	re.findall(“[^1-4]\w”,“aaazz1111344444c446”)	[‘aa’, ‘az’, ‘z1’, ‘c4’]，

正则表达式分组

分组可以让我们从文本内容中提取指定模式的部分内容，用（）来表示要提取的分组。
分组是在整个正则表达式筛选完之后的进一步筛选。
分组中可以只用|字符。
分组中可以使用\num进行引用。
分组中可以使用\名称方式进行引用。

分组中用到的特殊字符

字符	功能
(abc)	将括号中字符作为一个分组
(\|)	匹配左右任意一个表达式
(\num)	引用分组num
(?P)	分组取别名
(?P=name)	引用别名为name的分组

捕获组

可以给正则表达式的子组起一个名字，表达该子组的意义。这种有名称的子组即为捕获组。

取名字格式：(?P<name>pattern)
引用格式：(?P=name)-，不必再详细描述pattern
如果要取得该捕获组的内容，可以.group("name")

分组举例

# 需要找到text/javascript和//icws.jb51.net/good2021/arc2019.js的内容
import re
html = """"""
result = re.search(r"<(\w+) type=(.+) src=(.+)>", html)
r2 = result.group(2)
r3 = result.group(3)
print(result)
print(r2, r3)

result:
<re.Match object; span=(0, 82), match='<script type="text/javascript" src=\'//icws.jb51.>
"text/javascript" '//icws.jb51.net/good2021/arc2019.js'

# 捕获组应用，(?P\w+)给正则表达式的子组取名字，后面(?P=name1)直接使用，而不用再详细描述。
import re
html = "Shanghai
"
result = re.search("<(?P\w+)><(?P\w+)>(.+)", html)
r3 = result.group(3)
print(result)
print(r3)

result:
<re.Match object; span=(0, 30), match='Shanghai
'>
Shanghai

正则表达式常用方法

re.match函数

re.match 尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match() 就返回 none。
这个方法并不是完全匹配。它仅仅决定在字符串开始的位置是否匹配。所以当pattern结束时若还有剩余字符，仍然视为成功。
想要完全匹配，可以在表达式末尾加上边界匹配符$

re.match(pattern, string, flags=0)

match参数

参数	描述
pattern	匹配的正则表达式
string	要匹配的字符串
flags	标志位，用于控制正则表达式的匹配方式。如：是否区分大小写，多行匹配等等。

flags参数

参数	描述
re.I	忽略大小写
re.L	表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境
re.M	多行模式
re.S	即为 . 并且包括换行符在内的任意字符（. 不包括换行符）
re.U	表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库
re.X	为了增加可读性，忽略空格和 # 后面的注释

re.match匹配对象方法

匹配对象方法	描述
group(num=0)	分组捕获，匹配的整个表达式的字符串，group() 可以一次输入多个组号，在这种情况下它将返回一个包含那些组所对应值的元组
groups()	返回一个包含所有小组字符串的元组，从1到所含的小组号
span()	返回匹配到内容的下标范围，元组形式
start()	返回匹配到内容的开始位置
end()	返回匹配到内容的结束位置
groupdict()	将命名后的子组以字典形式返回

import re
result =re.match("oo\w{10}","ood123foozaoob")
print(result)
print(result.group())

result:
<re.Match object; span=(0, 12), match='ood123foozao'>
ood123foozao

groupdict应用

返回一个字典，包含所有经命名的匹配子群，键值是子群名。

code:

import re
line = "Cats are smarter than dogs"
match_obj = re.match(r"(?P.*) are (?P.*?) (?P.{2})", line, re.M | re.I)
if match_obj:
    print("match_obj.group() : ", match_obj.group())
    print("match_obj.group(1) : ", match_obj.group(1))
    print("match_obj.group(2) : ", match_obj.group(2))
    print("match_obj.group(3) : ", match_obj.group(3))
    print(match_obj.groupdict())
    print(match_obj.groups())
else:
    print("No match!!")
    
result:

match_obj.group() :  Cats are smarter th
match_obj.group(1) :  Cats
match_obj.group(2) :  smarter
match_obj.group(3) :  th
{'first': 'Cats', 'second': 'smarter', 'third': 'th'}
('Cats', 'smarter', 'th')

re.search方法

re.search 扫描整个字符串并返回第一个成功的匹配
参数说明同re.match

re.search(pattern, string, flags=0)

code:

import re
line = "Cats123are45smarter78than<>dogs"
search_obj = re.search(r"(?P\d{2})are(?P.+)(?P.{2})", line, re.M | re.I)
if search_obj:
    print("search_obj.group() : ", search_obj.group())
    print("search_obj.group(1) : ", search_obj.group(1))
    print("search_obj.group(2) : ", search_obj.group(2))
    print("search_obj.group(3) : ", search_obj.group(3))
    print(search_obj.groupdict())
else:
    print("No match!!")

result:

search_obj.group() :  23are45smarter78than<>dogs
search_obj.group(1) :  23
search_obj.group(2) :  45smarter78than<>do
search_obj.group(3) :  gs
{'first': '23', 'second': '45smarter78than<>do', 'third': 'gs'}

re.match与re.search的区别

re.match只匹配字符串的开始，如果字符串开始不符合正则表达式，则匹配失败，函数返回None
re.search匹配整个字符串，直到找到一个匹配

re.match和re.search带不带圆括号的区别

找到的内容是否分组
不带圆括号，返回值通过group方法取出是整个表达式所匹配到的内容
带有圆括号，返回值通过group方法带序号的形式可以取出各个圆括号分组中的内容

re.findall

在字符串中找到正则表达式所匹配的所有子串，并返回一个列表，如果有多个匹配模式，则返回元组列表，如果没有找到匹配的，则返回空列表。
参数说明同re.match。

re.findall(pattern, string, flags=0)

import re
text = "https://mp.csdn.net/postedit/828posd65219"
result = re.findall(r"pos[a-z]+", text)
print(result)

result:
['postedit', 'posd']

import re
result = re.findall(r'(\w+)=(\d+)', 'set width=20 and height=10')
print(result)

result:
返回元组列表，元组里是分组的各项内容
[('width', '20'), ('height', '10')]

re.findall带不带圆括号的区别

不带圆括号，其输出的内容就是整个表达式所匹配到的内容。
带有1个圆括号，其输出的内容就是括号匹配到的内容，而不是整个表达式所匹配到的结果。
带有2个圆括号，输出是一个list中包含2个tuple，2个tuple中的内容分别为2个圆括号匹配到的内容。更多括号类似，只是tuple的元素增加。

import re
string = "abcdefg  acbdgef  fedcfe  cadbgfe"
result0 = re.findall("\w+\s+\w+",string)
result1 = re.findall("(\w+)\s+\w+",string)
result2 = re.findall("(\w+)\s+(\w+)",string)
print(result0)
print(result1)
print(result2)

result:
['abcdefg  acbdgef', 'fedcfe  cadbgfe']
['abcdefg', 'fedcfe']			#带有一个圆括号，输出括号内匹配的内容
[('abcdefg', 'acbdgef'), ('fedcfe', 'cadbgfe')]			#带有2个圆括号，输出是list，list中的元素是元组，元组的内容是圆括号匹配的内容

re.finditer

和findall 类似，在字符串中找到正则表达式所匹配的所有子串，返回一个match对象的迭代器。
获取匹配结果需要调用match对象的group()、groups或group(index)方法
参数说明同re.match。

re.finditer(pattern, string, flags=0)

import re
result = re.finditer(r"\d+\w?", "12a32bc43jf3")
print(result)
print(result.__next__())
print(result.__next__())
for i_result in result:
    print(i_result.group())
   
result：
<callable_iterator object at 0x000002EE5A2D6E48>
<re.Match object; span=(0, 3), match='12a'>
<re.Match object; span=(3, 6), match='32b'>
43j
3

re.findall，re.finditer与re.match，re.search的区别

re.match，re.search匹配上一个就返回，而re.findall，re.finditer搜索到最后，把整个字符串都遍历一遍。
re.match，re.search返回的是对象，通过group方法可以返回匹配到的内容或分组内容。
re.findall返回的是列表，匹配到的分组内容是以列表元素（元组）给出的。
re.finditer返回一个match对象的迭代器。

re.sub

re.sub用于替换字符串中的匹配项，返回替换后的字符串。
flags的描述见re.match。

re.sub(pattern, repl, string, count=0, flags=0)

参数	描述
pattern	正则中的模式字符串
repl	替换的字符串，也可为一个函数，如果是函数的时候，将match对象传给它，返回一个字符串
string	要被查找替换的原始字符串
count	模式匹配后替换的最大次数，默认 0 表示替换所有的匹配
flags	标志位，用于控制正则表达式的匹配方式。如：是否区分大小写，多行匹配等

import re
phone = "2004-959-559 # 这是一个国外电话号码"
# 删除字符串中的 Python注释和-
num1 = re.sub(r'-|#|\s.*$', "", phone, 2)
print("电话号码是: ", num1)
num2 = re.sub(r'-|#|\s.*$', "", phone)
print("电话号码是: ", num2)

result:
电话号码是:  2004959559 # 这是一个国外电话号码
电话号码是:  2004959559

# 为匹配到的数字做加20操作
import re
def func(obj_match):
    result = int(obj_match.group()) + 20
    return str(result)

score = "Math:90, English:30"
num1 = re.sub(r"\d+", func, score)
print("作弊成绩是: ", num1)
result:
作弊成绩是:  Math:110, English:50

re.subn

subn和sub类似，不同之处在于subn()还返回一个表示替换的总数。
替换后的字符串和表示替换总数的数字一起作为一个拥有两个元素的元组返回。

import re

phone = "2004-959-559 # 这是一个国外电话号码"
# 删除字符串中的 Python注释和-
num1 = re.subn(r'-|#|\s.*$', "", phone, 2)
print("电话号码是: ", num1)
num2 = re.subn(r'-|#|\s.*$', "", phone)
print("电话号码是: ", num2)

result:
电话号码是:  ('2004959559 # 这是一个国外电话号码', 2)
电话号码是:  ('2004959559 ', 3)

re.split

re.split方法按照能够匹配的子串将字符串分割后返回列表。
maxsplit 分隔次数，maxsplit=1 分隔一次，默认为 0，不限制次数。
当pattern中带有圆括号时，将圆括号中的内容也添加在列表中返回。

re.split(pattern, string[, maxsplit=0, flags=0])

import re

phone = "2004-959-559 # 这是一个国外电话号码"
# 以字符串中的-和#为分割标志，将字符串分割为几部分，形成列表。
result1 = re.split(r'-|#', phone)
print(result1)
result2 = re.split(r'-|#', phone, 2)	#最多分割2次
print(result2)
result3 = re.split(r'\d(-|#)', phone)
print(result3)

result:
['2004', '959', '559 ', ' 这是一个国外电话号码']
['2004', '959', '559 # 这是一个国外电话号码']
['200', '-', '95', '-', '559 # 这是一个国外电话号码']

贪婪非贪婪

Python里数量词默认是贪婪的（在少数语言里默认非贪婪），总是尝试匹配尽可能多的字符。
非贪婪则相反，总是尝试尽可能少的字符。
在数量词*, ?, +,{m,n}系列后面加上？，则贪婪变成非贪婪。

# 匹配出hello以及后面的数字。
code：

import re
msg = "hello123456hello"
result1 = re.search("hello\d+", msg)
result2 = re.search("hello\d+?", msg)		# + 匹配1个或无穷，因为加了？则只匹配1个数字
result3 = re.search("hello\d*?", msg)		# + 匹配0个或无穷，因为加了？则只匹配0个数字
print(result1.group())
print(result2.group())
print(result3.group())

result:

hello123456
hello1
hello

正则表达式应用举例

判断电话号码

import re

phone = "15800458778"
# 以字符串中的-和#为分割标志，将字符串分割为几部分，形成列表。
result1 = re.match("[1]\d{9}[^47]$",phone)		# [^47]非4非7
#result1 = re.match("[1]\d{9}[0-35-689]$",phone)
print(result1)

result：
<re.Match object; span=(0, 11), match='15800458778'>

从网上爬一个照片下来
- 在网上先搜好图片，选中图片，右击鼠标选择检查。
- 将该图片的相关源码拷贝下来。
- 找到src中的内容，通过requests模块读取写入本地。

# 从网上爬一个图片下来
import re
import requests
html = """"""
result = re.search(r'.*src="(.+?)"', html)
image_path = result.group(1)
req = requests.get(image_path)

with open("chenxiao.jpg", "wb") as fs:
    fs.write(req.content)

正则表达式参考网站

此网站可以直观的显示正则表达式匹配的结果。
https://deerchao.cn

Python的GUI库选择指南（深度拓展）
前文我们分析了python的GUI库，有很多，面向应用场景也不尽相同，如何在使用过程中，选择合适的GUI库呢？可以查看：python有哪些常用的GUI（图形用户界面）库及选择指南-CSDN博客初学者推荐：Tkinter或PySimpleGUI，简单易学，文档丰富。复杂应用：PyQt5或WxPython，提供完整的功能集和高级组件。移动应用：Kivy或BeeWare（Toga），支持跨平台部署到iO
Python小游戏（井字棋）毛大猫（蓉火科技） python 开发语言数据库
Python的井字棋小游戏：方法一：初始化一个3x3的空棋盘（用数字1-9表示位置）board=[“1”,“2”,“3”,“4”,“5”,“6”,“7”,“8”,“9”]defprint_board():“”“打印当前棋盘”“”print(“\n”)print(f"{board[0]}|{board[1]}|{board[2]}“)print(”—|—|—“)print(f”{board[3]}|
使用matplotlib绘制散点图、柱状图和饼状图-学习篇 Zorione Python matplotlib 学习 python
一、散点图Python代码如下：num_points=100x=np.random.rand(num_points)#x点位随机y=np.random.rand(num_points)#y点位随机colors=np.random.rand(num_points)#颜色随机sizes=1000*np.random.rand(num_points)#大小随机alphas=np.random.rand(
【自然语言处理-NLP】文本预处理技术云博士的AI课堂哈佛博后带你玩转机器学习深度学习自然语言处理人工智能 NLP 深度学习数据预处理 NLP数据预处理机器学习
以下内容将从基本概念到实用代码分步骤、分场景地详细介绍NLP常见文本预处理方法及其背后的思想。如果无法从外部导入数据，我们会模拟一份简易文本数据（如字符串列表），并在此基础上演示预处理代码及详细解释，确保在常规Python环境下可以运行。一、文本预处理的常见需求和作用在自然语言处理（NLP）任务（如机器学习、深度学习、大模型开发）中，原始文本数据通常会包含各种噪声，例如：多余的空格、换行符、特殊符
AccuFace 在 iClone/Character Creator 导出 ARKit 52 子燕若水 iclone 3D daz3d 服务器 linux 运维
方案概览AccuFace在iClone/CharacterCreator里写入的是Reallusion60标准BlendShape曲线。要把它们导出为ARKit52并写入文本文件，可采用「iClone→FBX(ARKit52命名)→Blender→Python脚本→JSON/CSV」这一条相对稳妥的管线。关键步骤下面分拆说明，并给出可直接运行的脚本示例。步骤1：把Reallusion60映射到AR
Python 3 中tkinter 里的滚动文本框（ScrolledText）彭啊彭
最近在写一个模拟做题系统，里面有一个输出错题的功能，设置的文本框只有输出一道错题的大小，但是不能就一道题吧，就想到了平时页面里的滚动文本框，上网搜了搜，查到了ScrolledText，但是没找到实现我所需要功能的具体方法，没办法，我就自己研究了研究，好在最后实现了，现在就附上我的实现代码：defcuotiwin():globalscore#分数globallist2#存放错题var1=String
【机器学习第四期（Python）】LightGBM 方法原理详解 WW、forever 机器学习原理及代码实现机器学习 python 人工智能
LightGBM概述一、LightGBM简介二、LightGBM原理详解⚙️核心原理LightGBM的主要特点三、LightGBM实现步骤（Python）可调参数推荐完整案例代码（回归任务+可视化）参考LightGBM是由微软开源的基于梯度提升框架（GBDT）的机器学习算法，专为高性能、高效率设计，适用于大规模数据处理任务。它在准确率、训练速度和资源使用上都优于传统GBDT实现（如XGBoost）
Django 4.x Models App settings 模型应用设置 Mr数据杨 Python Web开发 python django 模型 model 配置
在Django框架中，模型（Model）是用于定义和操作数据库表结构的核心组件。模型通过使用Python类的形式，帮助简化数据库操作，自动生成SQL语句，使得开发者能够专注于业务逻辑的实现，而无需直接编写复杂的SQL代码。Django的ORM（对象关系映射）提供了一种便捷的方式，将Python对象与数据库记录进行映射操作，从而有效地管理数据交互。对于那些想要在项目中使用Django构建数据库应用的
OpenGauss数据库-L.应用开发(Python)-选做 lovane_630 数据库 python oracle
第1关：简单查询#加载数据库模块importpsycopg2#连接数据库,创建连接并返回连接对象defconnect():conn=psycopg2.connect(database="finance",user="gaussdb",password="Passwd123@123",host="localhost")returnconn#建立与数据库连接mydb=connect()#获取游标#执行
Python 数据分析与机器学习入门 (一)：环境搭建与核心库概览程序员阿超的博客 Python python 数据分析机器学习入门教程环境搭建 Anaconda JupyterNotebook
Python数据分析与机器学习入门(一)：环境搭建与核心库概览本文摘要本文是Python数据分析与机器学习入门系列的第一篇，专为初学者设计。文章首先阐明了Python在数据科学领域的优势，然后手把手指导读者如何使用Anaconda搭建一个无痛、专业的开发环境，并介绍了强大的交互式工具JupyterNotebook的基本操作。最后，简要概览了NumPy、Pandas、Scikit-learn等核心库
Python 数据分析与机器学习入门 (三)：Pandas 数据导入与核心操作程序员阿超的博客 Python python 数据分析机器学习 Pandas DataFrame Series 数据清洗
引言：Pandas是什么，为何如此重要？如果说NumPy是处理原始数值数组的利器，那么Pandas则是驾驭结构化数据的瑞士军刀。在真实世界的数据分析项目中，数据很少是单纯的数字矩阵。它们通常以表格形式存在，包含行和列，每列可能有不同的数据类型（如文本、数字、日期），并且带有描述性的列名和行索引。Pandas正是为高效处理这类数据而生。Pandas构建于NumPy之上，它不仅继承了NumPy的高性能
GitHub 趋势日报 (2025年06月25日) qianmoQ GitHub 项目趋势日报 (2025年)github
由TrendForge系统生成|https://trendforge.devlive.org/本日报中的项目描述已自动翻译为中文今日获星趋势图今日获星趋势图880awesome788build-your-own-x691free-for-dev427best-of-ml-python404Self-Hosting-Guide403Best-websites-a-programmer-should-
python读mongodb很慢_Python3.5+Mongodb+Flask Web实战坑点小结【Dog Plus】 weixin_39604685
我不是程序员，也不是设计师，我只是碰巧有一些想法和一台电脑。Iamnotadesignernoracoder.I'mjustaguywithapoint-of-viewandacomputer.写在前言前：第一个WEB部署完毕，觉得有必要做一个小结：开发平台及工具：Win10+Pycharm+Py3.5+Flask+Mongodb回头看看，一旦选择这样的套装就注定要有很多坑来填。建议后来者能用Li
深入探索Python内存回收机制：原理与实践南风以南 Python进阶 python 开发语言性能优化后端
一、引言1.1Python内存管理的重要性Python内存管理是Python程序性能优化和稳定运行的重要组成部分。合理的内存管理能够确保程序在运行过程中有效地利用系统资源，防止不必要的内存消耗，避免内存泄露，并确保不再使用的对象能被及时释放，从而腾出内存供其他对象使用。Python通过其独特的引用计数、循环引用检测以及垃圾回收机制，在自动化内存管理方面表现出色，使得开发者无需显式地进行内存申请与释
Selenium 二次封装通用页面基类 BasePage —— Python 实践 xiaoming0818 selenium pyhton selenium python
一、项目背景在自动化测试中，页面对象模型（PageObjectModel）是一种非常重要的设计模式，它将页面元素和操作封装成类，提升代码复用性、可维护性和可读性。本文将以一个完整的BasePage页面基类实现为例，详细讲解如何构建一个结构清晰、功能强大的Selenium页面基类，并结合日志记录、截图、等待等常用功能进行二次封装，为后续编写测试用例打下坚实基础。二、项目结构概览Auto_seleni
[Python] -基础篇3-掌握Python中的条件语句与循环踏雪无痕老爷子 Python python 开发语言
在Python编程中，条件语句和循环是极为基本而重要的概念。它们决定了程序的执行进程和逻辑分支，是极其基础的程序控制结构。一、条件语句if/elif/elsePython中的条件语句使用if、elif和else来表达分支逻辑：x=10y=20ifx>y:print("x比y大")elifxyelsey</
利用Python驾驭Stable Diffusion：原理解析、扩展开发与高级应用
个人网站:【摸鱼游戏】【神级代码资源网站】【星海网址导航】摸鱼、技术交流群点此查看详情引言随着生成式AI的迅猛发展，StableDiffusion已成为图像生成领域最受欢迎的开源模型之一。其以开放性、高质量输出和广泛社区支持赢得了无数开发者的青睐。本文将从原理出发，结合Python工具链，深入剖析如何掌握StableDiffusion的本质，并基于其能力进行扩展开发与高级应用。一、StableDi
python中leap是什么意思_leap)是什么意思 weixin_39639514
1.一羊跳过沟，众羊跟着跳。2.澜沧江在德钦奔流的150公里，是最险峻、最瑰丽、最汹涌的150公里、山形直入江中，江在几近垂直的两山间如困兽一般，吼声如沸，漩澜连续不绝，浪跃巨石，飞溅四裂。3.leap)的近义词3.除此之外，国民也期待更多的本土企业能够找到困境中的一丝缝隙逆流跃进，林立于世界众强的行列之中。4.很高兴您的宝宝男童或女童与绣腾飞的婴儿床寝具。5.因此，1600，1984年和2000
python：AI 生成卡通短视频 belldeep python AI python 人工智能短视频卡通
在AI生成卡通短视频领域，Python技术栈已形成成熟工具链，以下从核心技术、工具推荐、全流程实现到爆款案例提供完整解决方案：一、卡通生成三大核心技术1.风格化模型ToonCrafter（字节跳动）：基于扩散模型的卡通生成器，支持迪士尼/Pixar等20+风格fromdiffusersimportToonCrafterPipelinepipeline=ToonCrafterPipeline.fro
groovy：SimpleDateFormat 打印当前时间 belldeep Groovy java java groovy Date
today.groovyimportjava.util.Date;importjava.text.SimpleDateFormat;//日期格式化SimpleDateFormatsdf=newSimpleDateFormat("yyyy-MM-ddHH:mm:ss");Datedate=newDate();Stringnow=sdf.format(date);printlnnow;python打印
Python训练营-Day25-异常处理 Mallow Flowers Python训练营 python 开发语言机器学习人工智能
Python的异常处理机制为程序提供了强大的容错能力(faulttolerance)。当程序在运行时遇到意外情况（即异常），它不会直接崩溃，而是可以被设计成优雅地处理这些错误，并可能继续执行后续逻辑（如果设计允许）或以可控的方式结束。当异常发生时，Python会创建一个异常对象(exceptionobject)（通常是Exception类的子类实例）。如果这段可能出错的代码位于try语句块中，程序
Python基础——类和对象十二测试录 Python基础 java 开发语言 python 经验分享程序人生
目录1.定义类2.创建对象3.类和对象的示例4.类的方法4.1实例方法4.2类方法4.3静态方法5.类的继承6.封装与多态在Python中，类（Class）和对象（Object）是面向对象编程的核心概念。通过类和对象，可以组织和管理代码，使得代码更加模块化、可重用和易于维护。下面详细介绍类和对象的概念、定义方法和使用方法。1.定义类类是创建对象的模板或蓝图。类定义了对象的属性（成员变量）和行为（方
Python训练营-Day26 Gxsugar Python打卡记录 python 开发语言
DAY26函数专题1：函数定义与参数知识点回顾：函数的定义变量作用域：局部变量和全局变量函数的参数类型：位置参数、默认参数、不定参数传递参数的手段：关键词参数传递参数的顺序：同时出现三种参数类型时作业：题目1：计算圆的面积任务：编写一个名为calculate_circle_area的函数，该函数接收圆的半径radius作为参数，并返回圆的面积。圆的面积=π*radius²(可以使用math.pi作
Python训练营---Day26 2501_91182850 Python训练营 python 开发语言
知识点回顾：函数的定义变量作用域：局部变量和全局变量函数的参数类型：位置参数、默认参数、不定参数传递参数的手段：关键词参数传递参数的顺序：同时出现三种参数类型时题目1：计算圆的面积任务：编写一个名为calculate_circle_area的函数，该函数接收圆的半径radius作为参数，并返回圆的面积。圆的面积=π*radius²(可以使用math.pi作为π的值)要求：函数接收一个位置参数rad
批量下载网易云音乐歌单的Python脚本木觞清 7天熟练Python python 开发语言
在日常的音乐收藏和整理中，有时候我们希望能够快速地备份或下载网易云音乐中的歌曲，以便在没有网络连接的情况下也能随时听到自己喜欢的音乐。这时候，Python可以提供一种便捷的解决方案，让我们能够轻松地实现这一目标。技术背景本文介绍的Python脚本利用了Requests库和BeautifulSoup库，能够模拟浏览器行为，访问网易云音乐的歌单页面，并将歌曲信息提取出来。通过简单的配置，可以实现歌曲的
Python批量下载网易云音乐飙升榜所有音乐文件 Python_小屋 graphviz netty gpu ai webgl
Python小屋刷题神器最近升级的新功能介绍推荐教材：《Python程序设计基础与应用》（ISBN：9787111606178），董付国，机械工业出版社，2018.8出版，2021.3第11次印刷作者荣誉：机械工业出版社计算机分社成立20周年本科教材”金牌作者“，机械工业出版社高等教育教材专家咨询委员会委员，机械工业出版社”面向新工科高等院校大数据专业系列教材“编审委员会委员，全国高等院校计算机基
Python 的内置函数 object IMPYLH python 笔记
Python内建函数列表>Python的内置函数objectPython的内置函数object是Python中最基础的类，它是所有类的基类。在Python中，所有的类都直接或间接地继承自object类。object类提供了一些默认的方法和属性，这些方法和属性可以被所有Python对象使用。基本特性继承关系：所有Python类默认都继承自object。例如，定义一个空类时，实际上它已经隐式地继承了o
Python 的内置函数 open IMPYLH python 笔记
Python内建函数列表>Python的内置函数openPython的内置函数open()是用于打开文件的重要函数，它提供了与文件系统交互的基本接口。该函数返回一个文件对象（fileobject），可用于读取、写入或追加文件内容。函数签名open(file,mode='r',buffering=-1,encoding=None,errors=None,newline=None,closefd=Tr
paddlepaddle测试安装_python3.7中安装paddleocr及paddlepaddle包的多种方法瓦啦
升级pippip版本必须升级到20.0.4版本才能应用；方法一、在pycharm中对pip进行升级；方法二、通过命令进行升级python3.7-mpipinstall--upgradepip下载paddleOCR下载链接：https://github.com/PaddlePaddle/PaddleOCR打开paddleOCR文件夹中requirements.txt文件，更改文件中opencv-py
python web django 小项目简书_Django3.0起步，第一个小项目 weixin_39712455 python web django 小项目简书
#Django_start第一个django起步小项目，新建django项目，配置mysql，sql语句操作，MVT基本操作。###1.起步```pip3--default-timeout=1000000installdjango```cd到项目目录，创建项目```django-adminstartproject项目名称```如果找不到django路径，尝试```python3/Users/zha
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring

Python-正则表达式

Python-正则表达式

正则表达式的含义

使用正则表达式步骤

寻找规律

表示规律

普通字符匹配

元字符匹配

[]

()

{}

数量词

指代字符

边界相关

在[]中的元字符

正则表达式分组

分组中用到的特殊字符

捕获组

分组举例

Shanghai

Shanghai

正则表达式常用方法

re.match函数

match参数

flags参数

re.match匹配对象方法

groupdict应用

re.search方法

re.match与re.search的区别

re.match和re.search带不带圆括号的区别

re.findall

re.findall带不带圆括号的区别

re.finditer

re.findall，re.finditer与re.match，re.search的区别

re.sub

re.subn

re.split

贪婪非贪婪

正则表达式应用举例

正则表达式参考网站

你可能感兴趣的:(python,正则表达式,python,开发语言)