程序员王炸

python中如何使用正则表达式提取数据

这篇文章主要介绍了python中如何使用正则表达式提取数据问题。具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教。

正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。

re 模块使 Python 语言拥有全部的正则表达式功能。

compile 函数可创建一个模式字符串和可选的标志参数组成的一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。

re 模块也提供了与这些方法功能完全一致的函数，这些函数使用一个模式字符串做为它们的第一个参数。

模式	描述
^	匹配字符串的开头
$	匹配字符串的末尾。
.	匹配任意字符，除了换行符，当re.DOTALL标记被指定时，则可以匹配包括换行符的任意字符。
[...]	用来表示一组字符,单独列出：[amk] 匹配 'a'，'m'或'k'
[^...]	不在[]中的字符：[^abc] 匹配除了a,b,c之外的字符。
re*	*匹配0次或多次。贪婪方式，re代表正则表达式
re+	+匹配1次或多次。
re?	?匹配0次或1次，非贪婪方式，匹配0次指表达式后面为空的也匹配
re{ n}	连续匹配 n 个前面表达式。例如， o{2}，连续匹配两次o, 不能匹配 "Bob" 中的 "o"，但是能匹配 "food" 中的两个 o。
re{ n,}	匹配 n 个前面表达式。例如， o{2,} 不能匹配"Bob"中的"o"，但能匹配 "foooood"中的所有 o。"o{1,}" 等价于 "o+"。"o{0,}" 则等价于 "o*"。
re{ n, m}	表示匹配连续的前面的表达式至少n次，至多 m 次。表达式油{3,4} 就表示匹配连续的油字至少3次，至多 4 次
a\| b	匹配a或b
(re)	对正则表达式分组并记住匹配的文本

常用正则表达式实例

字符匹配

实例	描述
python	匹配 "python".

字符类

实例	描述
[Pp]ython	匹配 "Python" 或 "python"
rub[ye]	匹配 "ruby" 或 "rube"
[aeiou]	匹配中括号内的任意一个字母
[0-9]	匹配任何数字。类似于 [0123456789]
[a-z]	匹配任何小写字母
[A-Z]	匹配任何大写字母
[a-zA-Z0-9]	匹配任何字母及数字
[^aeiou]	除了aeiou字母以外的所有字符
[^0-9]	匹配除了数字外的字符

特殊字符类

实例	描述
.	匹配除 "\n" 之外的任何单个字符。要匹配包括 '\n' 在内的任何字符，请使用象 '[.\n]' 的模式。
\d	匹配一个数字字符。等价于 [0-9]。
\D	匹配一个非数字字符。等价于 [^0-9]。
\s	匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。
\S	匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。
\w	匹配包括下划线的任何单词字符。等价于'[A-Za-z0-9_]'。
\W	匹配任何非单词字符。等价于 '[^A-Za-z0-9_]'。

re.match只匹配字符串的开始，如果字符串开始不符合正则表达式，则匹配失败，函数返回None；而re.search匹配整个字符串，直到找到第一个匹配。

# re.match()函数只能从起始的位置匹配，否则返回None

import re

matchObj = re.match('www', 'www.runoob.com')

print(re.match('www', 'www.runoob.com').span()) # 在起始位置匹配

print(re.match('com', 'www.runoob.com')) # 不在起始位置匹配

# (0, 3)

# None

# 使用group(num) 或 groups() 函数来获取用来匹配的正在表达式提取的值。

if matchObj:

print("matchObj.group() : ", matchObj.group())

# 执行结果是matchObj.group() : www

# matchObj.group() 等同于 matchObj.group(0)，表示匹配到的完整文本字符

# print ("matchObj.group(1) : ", matchObj.group(1))

# print ("matchObj.group(2) : ", matchObj.group(2))

# re.search 扫描整个字符串并返回第一个成功的匹配。

import re

line = "Cats are smarter than dogs";

searchObj = re.search(r'(.*) are (.*?) ', line, re.M | re.I)

if searchObj:

print("searchObj.group() : ", searchObj.group())

print("searchObj.group(1) : ", searchObj.group(1))

print("searchObj.group(2) : ", searchObj.group(2))

# 执行结果

# searchObj.group() : Cats are smarter

# searchObj.group(1) : Cats

# searchObj.group(2) : smarter

# re.sub()用于替换字符串中的匹配项

import re

phone = "2004-959-559 # 这是一个国外电话号码"

# 删除字符串中的 Python注释,$匹配字符串的末尾。

# 把匹配到的字符串替换为空字符串

num = re.sub(r'#.*$', "", phone)

print("电话号码是: ", num)

# 电话号码是: 2004-959-559

# 删除非数字(-)的字符串,\D 匹配任意非数字

num = re.sub(r'\D', "", phone)

print("电话号码是 : ", num)

# 电话号码是 : 2004959559

"""

findall在字符串中找到正则表达式所匹配的所有子串，并返回一个列表，如果没有找到匹配的，则返回空列表。

注意： match 和 search 是匹配一次 findall 匹配所有。

"""

import re

pattern = re.compile(r'\d+') # 创建个正着表达式对象，查找数字

result1 = pattern.findall('runoob 123 google 456')

result2 = pattern.findall('run88oob123google456', 0, 10)

result3 = pattern.search('runoob 123 google 456')

# 123 只匹配了一次，匹配首个符合要求的字符串

print(result1)

print(result2)

print(result3.group())

# 执行结果：

# ['123', '456']

# ['88', '12']

# 123

re.compile 函数

compile 函数用于编译正则表达式，生成一个正则表达式（ Pattern ）对象，供 match() 和 search() 这两个函数使用。

语法格式为：

import re

pattern = re.compile(r'\d+') # 用于匹配至少一个数字

m = pattern.match('one12twothree34four') # 查找头部，没有匹配

print(m)

# None

m = pattern.match('one12twothree34four', 2, 10) # 从'e'的位置开始匹配，没有匹配

print(m)

# None

m = pattern.match('one12twothree34four', 3, 10) # 从'1'的位置开始匹配，正好匹配

print(m) # 返回一个 Match 对象

#

print(m.group(0)) # 可省略 0,获得整个匹配的子串时，可直接使用 group() 或 group(0)；

# '12'

print(m.start(0)) # 可省略 0,获取分组匹配的子串在整个字符串中的起始位置（子串第一个字符的索引），参数默认值为 0；

# 3

print(m.end(0)) # 可省略 0,获取分组匹配的子串在整个字符串中的结束位置（子串最后一个字符的索引+1），参数默认值为 0；

5

print(m.span(0)) # 可省略 0,返回 (start(group), end(group))。

# (3, 5)

执行结果：

None
None

12
3
5
(3, 5)

括号()-分组

括号称之为正则表达式的组选择。

组就是把正则表达式匹配的内容里面其中的某些部分标记为某个组。

我们可以在正则表达式中标记多个组

为什么要有组的概念呢？因为我们往往需要提取已经匹配的内容里面的某些部分的信息。

前面，我们有个例子，从下面的文本中，选择每行逗号前面的字符串，也包括逗号本身。

苹果，苹果是绿色的
橙子，橙子是橙色的
香蕉，香蕉是黄色的

就可以这样写正则表达式 ^.*， 。

但是，如果我们要求 不要包括逗号 呢？

当然不能直接这样写 ^.*

因为最后的逗号是特征所在，如果去掉它，就没法找逗号前面的了。

但是把逗号放在正则表达式中，又会包含逗号。

解决问题的方法就是使用组选择符：括号。

我们这样写 ^(.*)， ，结果如下

大家可以发现，我们把要从整个表达式中提取的部分放在括号中，这样水果的名字就被单独的放在组 group 中了。

对应的Python代码如下

content = '''苹果，苹果是绿色的

橙子，橙子是橙色的

香蕉，香蕉是黄色的'''

import re

p = re.compile(r'^(.*)，', re.MULTILINE)

for one in p.findall(content):

print(one)

多个分组时，怎么取每个分组的值。

比如，我们要从下面的文本中，提取出每个人的名字和对应的手机号

张三，手机号码15945678901
李四，手机号码13945677701
王二，手机号码13845666901

可以使用这样的正则表达式 ^(.+)，.+(\d{11})

可以写出如下的代码

content = '''张三，手机号码15945678901

李四，手机号码13945677701

王二，手机号码13845666901'''

import re

p = re.compile(r'^(.+)，.+(\d{11})', re.MULTILINE)

print(p.findall(content))

#findall()方法返回的是列表

m = p.search(content)

#列表不能调用group，因此需使用search()方法，但search方法只能匹配第一个符合的

print(m.group(1))

print(m.group(2))

for one in p.findall(content):

print(one)

print(type(one))

#执行结果

# [('张三', '15945678901'), ('李四', '13945677701'), ('王二', '13845666901')]

# 张三

# 15945678901

# ('张三', '15945678901')

#

# ('李四', '13945677701')

#

# ('王二', '13845666901')

#

当有多个分组的时候，我们可以使用 (?P<分组名>...) 这样的格式，给每个分组命名。

这样做的好处是，更方便后续的代码提取每个分组里面的内容

比如

import re

p = re.compile(r'^(?P.+)，.+(?P\d{11})', re.MULTILINE)

print(p.finditer(content))

# 返回string中所有与pattern相匹配的全部字串，返回形式为迭代器。

for match in p.finditer(content):

print(match.group('name'))

print(match.group('phone'))

# 执行结果

#

# 张三

# 15945678901

# 李四

# 13945677701

# 王二

# 13845666901

总结：正则若匹配成功，match()/search()返回的是Match对象，finditer()返回的是Match对象的迭代器，获取匹配结果需要调用Match对象的group()、groups或group(index)方法。

group()：母串中与模式pattern匹配的子串；
group(0)：结果与group()一样；
groups()：所有group组成的一个元组，group(1)是字符串中第一个匹配成功的子串分组，group(2)是第二个，依次类推，如果index超了边界，抛出IndexError；
findall()：返回的就是所有匹配的子串数组，就是子串元组组成的列表，例如上面的例子，母串中的第一行组成一个元组，第二行组成一个元组，这些元组共同构成一个list，就是findall()的返回结果。

方括号-匹配几个字符之一

方括号表示要匹配指定的几个字符之一。

比如

[abc] 可以匹配 a, b, 或者 c 里面的任意一个字符。等价于 [a-c] 。

[a-c] 中间的 - 表示一个范围从a 到 c。

如果你想匹配所有的小写字母，可以使用 [a-z]

一些元字符在方括号内失去了魔法，变得和普通字符一样了。

比如

[akm.] 匹配 a k m . 里面任意一个字符

这里 . 在括号里面不在表示匹配任意字符了，而就是表示匹配 . 这个字符

如果在方括号中使用 ^ ，表示 非 方括号里面的字符集合。

比如

content = 'a1b2c3d4e5'

import re

p = re.compile(r'[^\d]' )

for one in p.findall(content):

print(one)

[^\d] 表示，选择非数字的字符

输出结果为：

a
b
c
d
e

切割字符串

字符串对象的 split 方法只适用于简单的字符串分割。有时，你需要更加灵活的字符串切割。

比如，我们需要从下面字符串中提取武将的名字。

1	`names` `=` `'关羽; 张飞, 赵云,马超, 黄忠李逵'`

我们发现这些名字之间，有的是分号隔开，有的是逗号隔开，有的是空格隔开，而且分割符号周围还有不定数量的空格

这时，可以使用正则表达式里面的 split 方法：

import re

names = '关羽; 张飞, 赵云, 马超, 黄忠李逵'

namelist = re.split(r'[;,\s]\s*', names)

print(namelist)

正则表达式 [;,\s]\s* 指定了，分割符为分号、逗号、空格里面的任意一种均可，并且该符号周围可以有不定数量的空格。

字符串替换

匹配模式替换

字符串对象的 replace 方法只适应于简单的替换。有时，你需要更加灵活的字符串替换。

比如，我们需要在下面这段文本中所有的链接中找到所以 /avxxxxxx/ 这种以 /av 开头，后面接一串数字，这种模式的字符串。

然后，这些字符串全部替换为 /cn345677/ 。

names = '''

下面是这学期要学习的课程：

点击这里，边看视频讲解，边学习以下内容

这节讲的是牛顿第2运动定律

点击这里，边看视频讲解，边学习以下内容

这节讲的是毕达哥拉斯公式

点击这里，边看视频讲解，边学习以下内容

这节讲的是切割磁力线

'''

被替换的内容不是固定的，所以没法用字符串的replace方法。

这时，可以使用正则表达式里面的 sub 方法：

import re

names = '''

下面是这学期要学习的课程：

点击这里，边看视频讲解，边学习以下内容

这节讲的是牛顿第2运动定律

点击这里，边看视频讲解，边学习以下内容

这节讲的是毕达哥拉斯公式

点击这里，边看视频讲解，边学习以下内容

这节讲的是切割磁力线

'''

newStr = re.sub(r'/av\d+?/', '/cn345677/' , names)

print(newStr)

sub 方法就是也是替换字符串，但是被替换的内容用正则表达式来表示符合特征的所有字符串。

比如，这里就是第一个参数 /av\d+?/ 这个正则表达式，表示以 /av 开头，后面是一串数字，再以 / 结尾的这种特征的字符串，是需要被替换的。

第二个参数，这里是 '/cn345677/' 这个字符串，表示用什么来替换。

第三个参数是源字符串。

指定替换函数

刚才的例子中，我们用来替换的是一个固定的字符串 /cn345677/。

如果，我们要求，替换后的内容的是原来的数字+6，比如 /av66771949/ 替换为 /av66771955/ 。

怎么办？

这种更加复杂的替换，我们可以把 sub的第2个参数 指定为一个函数 ，该函数的返回值，就是用来替换的字符串。

如下

import re

names = '''

下面是这学期要学习的课程：

点击这里，边看视频讲解，边学习以下内容

这节讲的是牛顿第2运动定律

点击这里，边看视频讲解，边学习以下内容

这节讲的是毕达哥拉斯公式

点击这里，边看视频讲解，边学习以下内容

这节讲的是切割磁力线

'''

# 替换函数，参数是 Match对象

def subFunc(match):

# Match对象的 group(0) 返回的是整个匹配上的字符串

src = match.group(0)

# Match对象的 group(1) 返回的是第一个group分组的内容

number = int(match.group(1)) + 6

dest = f'/av{number}/'

print(f'{src} 替换为 {dest}')

# 返回值就是最终替换的字符串

return dest

newStr = re.sub(r'/av(\d+?)/', subFunc , names)

print(newStr)

# 正则表达式提取

import re

content = '''

Python3 高级开发工程师上海互教教育科技有限公司上海-浦东新区2万/月02-18满员

测试开发工程师（C++/python）上海墨鹍数码科技有限公司上海-浦东新区2.5万/每月02-18未满员

Python3 开发工程师上海德拓信息技术股份有限公司上海-徐汇区1.3万/每月02-18剩余11人

测试开发工程师（Python）赫里普（上海）信息科技有限公司上海-浦东新区1.1万/每月02-18剩余5人

Python高级开发工程师上海行动教育科技股份有限公司上海-闵行区2.8万/月02-18剩余255人

python开发工程师上海优似腾软件开发有限公司上海-浦东新区2.5万/每月02-18满员

'''

for one in re.findall(r'([\d.]+)万/每{0,1}月', content):

print(one)

#非正则表达式提取

content = '''

Python3 高级开发工程师上海互教教育科技有限公司上海-浦东新区2万/月02-18满员

测试开发工程师（C++/python）上海墨鹍数码科技有限公司上海-浦东新区2.5万/每月02-18未满员

Python3 开发工程师上海德拓信息技术股份有限公司上海-徐汇区1.3万/每月02-18剩余11人

测试开发工程师（Python）赫里普（上海）信息科技有限公司上海-浦东新区1.1万/每月02-18剩余5人

Python高级开发工程师上海行动教育科技股份有限公司上海-闵行区2.8万/月02-18剩余255人

python开发工程师上海优似腾软件开发有限公司上海-浦东新区2.5万/每月02-18满员

'''

# 将文本内容按行分割，放入列表，按\r\n,\r（回车）,\n（换行）分割

lines = content.splitlines()

# print(lines)

for line in lines:

# 查找'万/月' 在字符串中什么地方

# find() 方法检测字符串中是否包含子字符串 str ,如果包含的话，返回子字符串开始的索引，

# 不包含的话返回-1

pos2 = line.find('万/月')

# print(pos2)

if pos2 < 0:

# 查找'万/每月' 在字符串中什么地方

pos2 = line.find('万/每月')

# 都找不到，满足条件，触发continue，不执行后面的代码，跳到循环开头进入下一轮循环

if pos2 < 0:

continue

# 执行到这里，说明可以找到薪资关键字

# 接下来分析薪资数字的起始位置

# 方法是找到 pos2 前面薪资数字开始的位置

idx = pos2 - 1

# 只要是数字或者小数点，就继续往前面找

# isdigit()方法检测字符串是否只由数字组成，如果字符串只包含数字则返回 True 否则返回 False

while line[idx].isdigit() or line[idx] == '.':

idx -= 1

# 现在 idx 指向薪资数字前面的那个字，

# 所以薪资开始的索引就是 idx+1

pos1 = idx + 1

print(line[pos1:pos2])

总结

以上为个人经验，希望能给大家一个参考。

点击拿去
50G+学习视频教程
100+Python初阶、中阶、高阶电子书籍

你可能感兴趣的:(python,python,正则表达式,mysql)

Python爬虫：高效获取1688商品详情的实战指南数据小爬虫@ python 爬虫开发语言
在电商行业，数据是商家制定策略、优化运营的核心资源。1688作为国内领先的B2B电商平台，拥有海量的商品信息。通过Python爬虫技术，我们可以高效地获取这些商品详情数据，为商业决策提供有力支持。一、为什么选择Python爬虫？Python以其简洁易读的语法和强大的库支持，成为爬虫开发的首选语言之一。利用Python爬虫，可以快速实现从1688平台获取商品详情的功能，包括商品标题、价格、图片、描述
python模块triton安装教程 2401_85863780 1024程序员节 triton whl
Triton是一个用于高性能计算的开源库，特别适用于深度学习和科学计算。通过预编译的whl文件安装Triton可以简化安装过程，尤其是在编译时可能会遇到依赖问题的情况下。以下是详细的安装步骤：安装前准备：Python环境：确保已经安装了Python，并且Python版本与whl文件兼容。pip：确保已经安装了pip，这是Python的包管理器，用来安装外部库。下载whl文件：从可靠的来源下载适用于
python模块mediapipe安装教程 2401_85863780 python 开发语言 mediapipe
安装MediaPipe通过.whl文件的方法与安装其他Python库相似。下面是详细的步骤，指导你如何通过.whl文件安装MediaPipe。1.确认Python和pip已经安装首先，确保你的系统上已经安装了Python和pip。你可以通过打开命令行（对于Windows用户，这可以是CMD或PowerShell；对于macOS和Linux用户，这可以是终端）并运行以下命令来检查：python--v
【whl文件】python各版本whl下载地址汇总 2401_85863780 python linux 开发语言
whl文件，全称为wheel文件，是Python分发包的一种标准格式。它是预编译的二进制包，包含了Python模块的压缩形式（如.py文件和编译后的.pyd文件）以及这些模块的元数据，通常通过Zip压缩算法进行压缩。whl文件的出现，使得Python包的安装过程变得更为简单和高效，因为它允许用户快速安装Python包及其依赖项，而无需从源代码开始编译。此外，whl文件还具有良好的跨平台兼容性，可以
MyBatis常见知识点 2301_80148369 mybatis
#{}和${}的区别是什么？答：${}是Properties文件中的变量占位符，它可以用于标签属性值和sql内部，属于原样文本替换，可以替换任意内容，比如${driver}会被原样替换为com.mysql.jdbc.Driver。一个示例：根据参数按任意字段排序：select*fromusersorderby${orderCols}orderCols可以是name、namedesc、name,se
MySQL的主从复制和读写分离吾妻雪乃 linux mysql 数据库
MySQL的主从复制和读写分离MySQL的主从复制和读写分离什么是MySQL的主从复制MySQL的主从复制的主要场景MySQL主从复制原理mysq支持的复制类型MySQL主从复制延迟MySQL读写分离原理目前较为常见的MySQL读写分离分为MySQL主从复制和读写分离实验部署案例拓扑图环境配置一、搭建MySQL主从复制1、Mysql主从服务器时间同步2、主服务器的mysql配置3、从服务器的mys
MySQL 运维篇 -- 主从集群搭建 L小Ray想有腮 MySQL mysql 运维数据库
文章目录主从复制主从复制原理主从故障处理延时从库主从GTID复制主从GR复制*****搭建组复制观察组复制主从复制主从同步过程（1）主丛复制基于binlog来实现的（2）主库发生新的操作，都会记录binlog（3）从库取得主库的binlog进行回放（4）主从复制是异步的准备主从的初始MySQL环境（YUM安装）[root@master~]#hostnamemaster[root@master~]#
Ubuntu下 Python 版本切换 Tobey袁 Ubuntu shell ubuntu linux
在Ubuntu的开发环境下，由于Python2和Python3很多不兼容，经常会需要我们手动切换Python版本。sudoupdate-alternatives--install/usr/bin/pythonpython/usr/bin/python2100sudoupdate-alternatives--install/usr/bin/pythonpython/usr/bin/python315
31.5 切换链式复制到主从复制 weixin_41275260 MySQL技术大全：开发优化与运维实战
31.5切换链式复制到主从复制如果MySQL当前的复制模式为链式复制模式，可以将其转化为MySQL的主从复制模式。本节就简单介绍一下如何将MySQL的链式复制模式转化为主从复制模式。1．服务器规划首先需要进行服务器规划，本节中的服务器规划与31.3.1节中的服务器规划相同，不再赘述。2．切换复制模式（1）在binghe152服务器上，停止从库的运行，并查看主库的状态。mysql>STOPSLAVE
python中set的用法_Python中set的用法 weixin_39876645 python中set的用法
python的集合类型和其他语言类似,是一个无序不重复元素集,我在之前学过的其他的语言好像没有见过这个类型，基本功能包括关系测试和消除重复元素.集合对象还支持union(联合),intersection(交),difference(差)和sysmmetricdifference(对称差集)等数学运算,和我们初中数学学的集合的非常的相似。1先看下python集合类型的不重复性，这方面做一些去重处理非
python set用法小结 Super_Meredith pandas set
1.创建集合set()>>>set('python'){'o','p','h','n','t','y'}>>>set(['python']){'python'}#去重>>>list1=[11,11,12,13,14,14,15]>>>set(list1){11,12,13,14,15}2.添加add()，update()#add():把传入的元素做为一个整体添加到集合中>>>set1=set('p
mysql链式_例：MYSQL链式复制：A=>B=>C 程归子 mysql链式
A:192.168.2.155主B:192.168.2.156从/主C:192.168.2.160从A主机：vi/etc/my.cnflog-bin=mysql-binserver-id=1binlog_do_db=tongbu(注：如不指定此参数，binlog记录所有库的操作，添加用户binlog也会改变，也会复制到从服务器)servicemysqldrestartmysql-uroot-p12
使用jQuery、Ajax、ASP和MySQL实现动态加载更多内容来自日本的亮仔
本文还有配套的精品资源，点击获取简介：“加载更多”功能改善网页用户体验，适用于大量数据场景。本文将探讨如何通过结合jQuery监听滚动事件、使用Ajax技术与服务器交互、ASP后端处理请求、以及MySQL数据库查询，实现无需刷新页面即可动态加载内容的完整步骤。1.页面滚动事件监听与处理在当今的网络应用中，页面滚动事件是一种常见的用户交互方式，它直接影响到用户体验。监听和处理滚动事件，能够帮助开发者
例：MYSQL链式复制：A=>B=>C weixin_34268579 数据库
A:192.168.2.155主B:192.168.2.156从/主C:192.168.2.160从A主机：vi/etc/my.cnflog-bin=mysql-binserver-id=1binlog_do_db=tongbu（注：如不指定此参数，binlog记录所有库的操作，添加用户binlog也会改变，也会复制到从服务器）servicemysqldrestartmysql-uroot-p12
python 集合概念set用法 shuwenting python 基础
Python中set的用法python的集合类型和其他语言类似,是一个无序不重复元素集,我在之前学过的其他的语言好像没有见过这个类型，基本功能包括关系测试和消除重复元素.集合对象还支持union(联合),intersection(交),difference(差)和sysmmetricdifference(对称差集)等数学运算,和我们初中数学学的集合的非常的相似。1先看下python集合类型的不重复
python set operation screaming Python Set
Setcanbeconvertedtolistbylist(set)add(elem)¶Addelementelemtotheset.remove(elem)Removeelementelemfromtheset.RaisesKeyErrorifelemisnotcontainedintheset.discard(elem)Removeelementelemfromthesetifitispres
Python Web开发记录 Day12：Django part6 用户登录 Code_流苏 #---Python Web开发---#Django 项目探索实验室 python 前端 django
名人说：东边日出西边雨，道是无晴却有晴。——刘禹锡《竹枝词》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder）目录1、登录界面2、用户名密码校验3、cookie与session配置①cookie与session②配置4、登录验证5、注销登录6、图片验证码①Pillow库②图片验证码的实现7、补充：图片验证码的作用和扩展①作用②其他类型的验证码8、验证码校验在上一篇博客中我们实现
Ubuntu中如何使用pip切换不同的python版本建立虚拟环境挪威的深林【Linux】操作命令 linux问题 python教程 pip virtualenv python
一.前言最近遇到非常头疼的问题,在ubuntu中运行不同的项目或者downloadgithub的项目时,总是需要不同版本的python,不同版本的pkgs.因此,为不同的项目建立各自的虚拟环境是一个比较方便的事情.对于建立虚拟环境,目前本人所掌握的主要是conda,以及pip,如果使用conda去建立虚拟环境,则需要安装anaconda,或则minianaconda.在安装anaconda后才能够
mysql8.0 设置远程连接乐观主义现代人 mysql linux 服务器
1.修改配置（这一步很多教程上没有写，这是最重要的一步）cd/etc/mysql/mysql.conf.dvimmysqld.cnf#找到#bind-address=127.0.0.1，注释掉，替换成下面的配置bind-address=0.0.0.02.重启mysql服务servicemysqlrestart创建用户，授权，刷新配置生效createuser'demo'@'%'identifiedb
代码随想录day3 mvufi python 开发语言
203.移除链表元素虚拟头结点：增加删除都很容易python不用new，直接=ListNode(...)#Definitionforsingly-linkedlist.#classListNode:#def__init__(self,val=0,next=None):#self.val=val#self.next=nextclassSolution:defremoveElements(self,h
[LeetCode-Python版]Hot100（2/100）——128. 最长连续序列古希腊掌管学习的神 LeetCode-Python leetcode python 算法
题目给定一个未排序的整数数组nums，找出数字连续的最长序列（不要求序列元素在原数组中连续）的长度。请你设计并实现时间复杂度为O(n)的算法解决此问题。示例1：输入：nums=[100,4,200,1,3,2]输出：4解释：最长数字连续序列是[1,2,3,4]。它的长度为4。示例2：输入：nums=[0,3,7,2,5,8,4,6,0,1]输出：9题目链接思路因为题目要求O（n）的时间复杂度，所以
[LeetCode-Python版]Hot100（1/100）——49. 字母异位词分组古希腊掌管学习的神 LeetCode-Python leetcode python 算法
题目给你一个字符串数组，请你将字母异位词组合在一起。可以按任意顺序返回结果列表。字母异位词是由重新排列源单词的所有字母得到的一个新单词。示例1:输入:strs=[“eat”,“tea”,“tan”,“ate”,“nat”,“bat”]输出:[[“bat”],[“nat”,“tan”],[“ate”,“eat”,“tea”]]示例2:输入:strs=[“”]输出:[[“”]]示例3:输入:strs=
ubuntu系统切换python版本的方法 lkasi Ubuntu ubuntu linux 运维
1.查看所有的python版本终端输入ls/usr/bin/python*结果2.切换版本终端输入sudoupdate-alternatives--configpython结果输入对应的选择编号即可切换python版本
python版本升级 HiSiri~ python python 开发语言
python版本升级背景在对centos机器升级Python版本从3.6到3.10后，pip安装出现了一些问题[解决pipisconfiguredwithlocationsthatrequireTLS/SSL问题]操作下载在官方主站找到合适的版本，并下载https://www.python.org/ftp/python/wgethttps://www.python.org/ftp/python/3
Python集合之set()使用方法详解 lmseo5hy python培训 python集合
set是一个无序且不重复的元素集合，它有可变集合(set())和不可变集合(frozenset)两种，可以对set()集合进行创建、添加、删除、交集、并集和差集的操作，非常实用，以下是具体用法：一、创建集合setpythonset类是在python的sets模块中，新的python版本可以直接创建集合，不需要导入sets模块。具体用法：1.set('old')2.set(‘o’,’l’,’d’)二
本地生活服务平台（源码+文档+部署+讲解）亥时科技生活源代码管理数据库 java 开源
引言随着城市化进程的加速，本地生活服务的需求日益多样化和个性化。本地生活服务平台通过数字化手段，为社区居民提供了一个全面、便捷的服务体验，从而提升社区服务体验和生活质量。系统概述本地生活服务平台采用前后端分离的架构设计，服务端基于MySQL5.7+、JDK1.8+和Redis，前端则采用VUE2.6.14和element-ui2.15.6，并在NODE14.21.3(>=8.9)环境下运行，NPM
[LeetCode-Python版]动态规划——0-1背包和完全背包问题总结古希腊掌管学习的神 LeetCode-Python leetcode python 动态规划
0-1背包有n个物品，第i个物品的体积为wiw_iwi，价值为viv_ivi，每个物品至多选一个，求体积和不超过capacity时的最大价值和状态转移：dfs(i,c)=max(dfs(i−1,c),dfs(i−1,c−w[i])+v[i]dfs(i,c)=max(dfs(i-1,c),dfs(i-1,c-w[i])+v[i]dfs(i,c)=max(dfs(i−1,c),dfs(i−1,c−w[
ipykernel-4.10.0-py2-none-any.whl文件解析与安装指南嗹国学长
本文还有配套的精品资源，点击获取简介：PyPI是Python的软件包仓库，本篇将解析一个特定Python包——ipykernel的4.10.0版本。ipykernel是Jupyter项目的核心组件，用于创建和运行交互式Python内核。本指南将介绍其功能、特点和安装过程，并强调其在跨语言支持、异步I/O处理、调试和交互式通信等方面的重要性。用户可通过pip安装该版本，以支持Python2环境中的J
[解决ERROR]VScode中运行ipynb文件报错缺少ipykernel 又困又爱睡 vscode jupyter
[解决ERROR]VScode中运行ipynb文件报错缺少ipykernel1.在VScode中添加jupyter插件2.建议大家安装python版本目前不要大于3.93.在环境中安装jupyter的包，同时会帮我们下载好ipykernel的包4.如果你不幸发现自己的pyzmq包已经下载且版本是23.3.1或以上版本导致FailedtostarttheKernel5.结语前言：最近帮大家配置ana
python字典的嵌套计算机小白的爬坑之路 python基础 python
字典嵌套及打印题目：城市创建一个名为cities的字典，其中将三个城市名用作键；对于每座城市，都创建一个字典，并在其中包含该城市所属的国家、人口约数以及一个有关该城市的事实。在表示每座城市的字典中，应包含country、population和fact等键。将每座城市的名字以及有关它们的信息都打印出来。代码如下所示：cities={'北京':{'country':'China','populatio
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟