shlyyy

Python11-正则表达式

- 1.正则表达式简介
- 2.正则表达式常见用法和符号
- 3.正则查找
- 4.re.Match对象与group
- 5.re.compile
- 6.正则表达式修饰符
- 7.正则匹配规则
- 8.正则表达式匹配练习
- 9.正则替换
- 10.贪婪模式和非贪婪模式

1.正则表达式简介

正则表达式（Regular Expression）是一种用于匹配、查找和操作文本的工具。它是由一系列字符和特殊字符组成的模式，用于描述字符串的特征。

在Python中，可以使用内置的re模块来使用正则表达式。re模块提供了一系列函数来进行正则表达式的匹配、查找和替换等操作。

Q：将下面的word中的数字取出

word = 'a1b23c456def789'

number = ''
numbers = []
for i, w in enumerate(word):
    if '0' <= w <= '9':
        number += w
        if i == len(word) - 1:
            numbers.append(number)
    else:
        if number != '':
            numbers.append(number)
        number = ''
print(numbers)

使用正则表达式写法：

import re

word = 'a1b23c456def789'

print(re.findall(r'\d+', word))  # ['1', '23', '456', '789']
print(re.sub(r'\d', 'x', word))  # axbxxcxxxdefxxx
print(re.sub(r'\d+', 'x', word))  # axbxcxdefx

通过上面的例子我们体会到了使用正则表达式对字符串处理的便捷。下面我们将介绍python中正则表达式的使用

2.正则表达式常见用法和符号

匹配字符：
- 普通字符：可以直接匹配文本中的普通字符，例如 a 匹配字符 “a”。
- 字符类：用方括号 [] 表示，可以匹配方括号内的任意一个字符。例如 [aeiou] 可以匹配任何一个元音字母。
- 范围类：在字符类中使用连字符 - 表示一个范围。例如 [0-9] 可以匹配任意一个数字。
- 预定义字符类：有一些预定义的字符类，例如 \d 匹配任意一个数字，\w 匹配任意一个字母、数字或下划线，\s 匹配任意一个空白字符。
- 否定字符类：在字符类的开头使用 ^ 表示否定，例如 [^0-9] 匹配任意一个非数字字符。
匹配重复：
- *：匹配前面的元素零次或多次。
- +：匹配前面的元素一次或多次。
- ?：匹配前面的元素零次或一次。
- {n}：匹配前面的元素恰好 n 次。
- {n,}：匹配前面的元素至少 n 次。
- {n,m}：匹配前面的元素至少 n 次且不超过 m 次。
匹配位置：
- ^：匹配输入字符串的开始位置。
- $：匹配输入字符串的结束位置。
- \b：匹配单词的边界。
特殊字符：
- \：转义字符，用于转义特殊字符。
- .：匹配除换行符外的任意字符。
- |：匹配两个或多个表达式之一。

对上面常见的符号有个印象，下面会使用到。

3.正则查找

python里的正则查找有以下几个方法：search、match、fullmatch、findall、finditer

search使用：用于在字符串中搜索匹配某个模式的子串。

re.search(pattern, string, flags=0)
'''
pattern：要匹配的正则表达式模式。
string：要搜索的字符串。
flags（可选）：用于控制正则表达式的匹配方式的标志。
'''

\d：表示任意一个数字
+：匹配前面的元素一次或多次，\d+就是前面的数字出现一次或多次
？：匹配前面的元素零次或一次

import re

word = 'afd1456b23c32567def346'

# 3开头的数字
result = re.search(r'3\d+', word)
print(result)  # 

result = re.search(r'3\d', word)
print(result)  # 

result = re.search(r'3\d?', word)
print(result)  #

需要注意的是，re.search()只会返回第一个匹配的子串。如果需要找到所有匹配的子串，可以使用re.findall()函数。

match使用：用于从字符串的开头开始匹配某个模式。

re.match(pattern, string, flags=0)
'''
pattern：要匹配的正则表达式模式。
string：要匹配的字符串。
flags（可选）：用于控制正则表达式的匹配方式的标志。
'''

import re

word = 'afd1456b23c32567def346'

# match：从字符串的开头匹配
result = re.match(r'3\d+', word)
print(result)  # None

# a后面没有数字
result = re.match(r'a\d+', word)
print(result)  # None

# afd后面有数字，+表示一个或多个
result = re.match(r'afd\d+', word)
print(result)  #

需要注意的是，re.match()只会从字符串的开头进行匹配。如果需要在整个字符串中查找匹配的子串，可以使用re.search()函数或re.findall()函数。

fullmatch使用：用于检查整个字符串是否与给定的模式完全匹配

re.fullmatch(pattern, string, flags=0)
'''
pattern：要匹配的正则表达式模式。
string：要匹配的字符串。
flags（可选）：用于控制正则表达式的匹配方式的标志。
'''

它要求模式与字符串完全一致，即从字符串的开头到结尾都需要匹配。

import re

word = 'afd1456b23c32567def346'

# 不匹配：afd开头，后面是整个数字
result = re.fullmatch(r'afd\d+', word)
print(result)  # None

word1 = 'afd2333'
result = re.fullmatch(r'afd\d+', word1)
print(result)  #

search、match、fullmatch匹配到的结果都是一个 re.Match 类型的对象。

finditer使用：用于在字符串中查找所有匹配某个模式的子串，并返回一个迭代器（Iterator），每个迭代项都是一个匹配对象。

re.finditer(pattern, string, flags=0)
'''
pattern：要匹配的正则表达式模式。
string：要搜索的字符串。
flags（可选）：用于控制正则表达式的匹配方式的标志。
'''

re.finditer()函数可以方便地获取所有匹配的子串，适用于需要遍历并处理多个匹配结果的情况。

import re

word = 'afd1456b23c32567def346'

# 将字符串里所有匹配到的结果查询到，得到的结果是一个迭代器
# 得到的迭代器里的每个元素，又是一个 re.Match 类型的对象
result = re.finditer(r'3\d+', word)
print(result)  # 

for i in result:
    print(i)

findall使用：用于在字符串中查找所有匹配某个模式的子串，并返回一个包含所有匹配结果的列表。

re.findall(pattern, string, flags=0)
'''
pattern：要匹配的正则表达式模式。
string：要搜索的字符串。
flags（可选）：用于控制正则表达式的匹配方式的标志。
'''

import re

word = 'afd1456b23c32567def346'

# 匹配到的结果字符串放在列表中返回
result = re.findall(r'3\d+', word)
print(result)  # ['32567', '346']

需要注意的是，re.findall()函数只返回匹配结果的内容，而不包含其他关于匹配位置等的信息。如果需要更详细的匹配信息，可以使用re.finditer()函数。

4.re.Match对象与group

当使用re模块的函数进行匹配操作时，如果匹配成功，就会返回一个re.Match对象，该对象包含关于匹配结果的信息。search、match、fullmatch、finditer匹配到的结果都有 re.Match 类型的对象。

查看re.Match对象的成员与方法：

import re

word = 'afd1456b23c32567def346'

result = re.search(r'3\d+', word)
print(dir(result))

输出如下：

['__class__', '__copy__', '__deepcopy__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'end', 'endpos', 'expand', 'group', 'groupdict', 'groups', 'lastgroup', 'lastindex', 'pos', 're', 'regs', 'span', 'start', 'string']

span()、string、group()

import re

word = 'afd1456b23c32567def346'

# 匹配到的结果字符串放在列表中返回
result = re.search(r'3\d+', word)
print(result)  # 

# print(dir(result))

# 得到匹配到的字符串的开始和结束，左闭右开
print(result.span(), word[result.span()[0]:result.span()[1]])  # (11, 16) 32567

# 查找的完整的字符串
print(result.string)  # afd1456b23c32567def346

# 使用group获取匹配到的结果字符串
print(result.group())  # 32567

re.Match对象的group()：方法用于返回匹配的子串内容。

group()方法可以接受一个可选的参数group_num，用于指定要返回的分组号。如果未提供group_num参数，则默认返回整个匹配的子串。

import re

word = 'a10b2453c5896d717e123'

result = re.search(r'b\d+c\d+d\d+', word)
print(result)  # 
print(result.group())  # b2453c5896d717

使用小括号进行分组

import re

word = 'a10b2453c5896d717e123'

# r'(b\d+)(c\d+)(d\d+)' 有4个分组
# 第0组是整体，其余3个括号是另外三个分组
result = re.search(r'(b\d+)(c\d+)(d\d+)', word)
print(result)  # 
print(result.group())  # b2453c5896d717

# 第0组是整体
print(result.group(0))  # b2453c5896d717
print(result.group(1))  # b2453
print(result.group(2))  # c5896
print(result.group(3))  # d717

groups()方法：返回所有分组匹配的子串内容，一个包含所有分组匹配结果的元组。

import re

word = 'a10b2453c5896d717e123'

print(result.groups())  # ('b2453', 'c5896', 'd717')

# groupdict以字典形式保存有组名的分组数据
# (?P) 用来设置组名
result = re.search(r'(?Pb\d+)(c\d+)(d\d+)', word)
print(result.groupdict())  # {'group_name': 'b2453'}

groupdict()方法：返回具名分组匹配的子串内容。

如果正则表达式模式中使用了具名分组，即通过(?Ppattern)语法指定了分组的名称，groupdict()方法将返回一个字典，其中键是分组的名称，值是匹配的子串内容。

import re

word = 'a10b2453c5896d717e123'

# groupdict以字典形式保存有组名的分组数据
# (?P) 用来设置组名
result = re.search(r'(?Pb\d+)(c\d+)(d\d+)', word)
print(result.groupdict())  # {'group_name': 'b2453'}

5.re.compile

re.compile() 方法用于将正则表达式模式编译为一个可重复使用的正则表达式对象。

re.compile(pattern, flags=0)

pattern：要编译的正则表达式模式。
flags（可选）：用于控制正则表达式的匹配方式的标志。

re.compile()方法的优点在于，当需要多次使用同一个正则表达式模式时，可以先编译为正则表达式对象，然后重复使用该对象进行匹配，避免了每次使用都要重新编译模式的性能开销。

import re

word = 'ab322wm234dasdd'

pattern = re.compile(r'm\d+')
print(pattern.search(word))  #

6.正则表达式修饰符

正则修饰符是对正则规则进行修饰，让正则含有不同含义。使用修饰符（也称为标志或选项）来控制正则表达式的匹配方式。修饰符在re模块的函数中作为可选参数传递。

下面是常用的修饰符：

re.I（或re.IGNORECASE）：忽略大小写匹配。
re.M（或re.MULTILINE）：多行模式，使^和$匹配每行的开头和结尾。
re.S（或re.DOTALL）：点（.）匹配包括换行符在内的所有字符。
re.X（或re.VERBOSE）：详细模式，忽略空白和注释，可以使用多行模式。

这些修饰符可以单独使用，也可以使用位运算符|进行组合。

import re

word = 'ab322wm234Qasdd'

print(re.search(r'q', word))  # None

# re.I 忽略大小写
print(re.search(r'q', word, re.IGNORECASE))  #

.表示除了\n以外的任意字符

import re

word = 'a\n1_*/({+'
# .表示除了\n以外的任意字符
print(re.findall(r'.', word))  # ['a', '1', '_', '*', '/', '(', '{', '+']
# re.S匹配包括换行在内的所有字符
print(re.findall(r'.', word, re.S))  # ['a', '\n', '1', '_', '*', '/', '(', '{', '+']

7.正则匹配规则

总的原则：

1.数字和字母表示它本身，没有特殊含义

2.\反斜杠有特殊含义，用来做转义。大多数字母前面加\反斜杠以后会有不同含义。

3.标点符号只有被转义时才匹配自身，否则它们表示特殊的含义。

4.反斜杠本身需要使用反斜杠转义。由于正则表达式通常都包含反斜杠，所以最好使用原始字符串来表示它们。模式元素(如 r’\t’，等价于\\t )匹配相应的特殊字符。

非打印字符也可以是正则表达式的组成部分。下表列出了表示非打印字符的转义序列：

字符	描述
`\cx`	匹配由x指明的控制字符。例如， `\cM` 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则，将 c 视为一个原义的 ‘c’ 字符。
`\f`	匹配一个换页符。等价于 `\x0c` 和 `\cL`。
`\n`	匹配一个换行符。等价于 `\x0a` 和 `\cJ`。
`\r`	匹配一个回车符。等价于 `\x0d` 和 `\cM`。
`\s`	匹配任何空白字符，包括空格、制表符、换页符等等。等价于 `[ \f\n\r\t\v]`。注意 Unicode 正则表达式会匹配全角空格符。
`\S`(大写S)	匹配任何非空白字符。等价于 `[^\f\n\r\t\v]`。
`\t`	匹配一个制表符。等价于 `\x09` 和 `\cI`。
`\v`	匹配一个垂直制表符。等价于 `\x0b` 和 `\cK`。

需要记住：\r \n \t， \s \S

特殊字符是一些有特殊含义的字符。若要匹配这些特殊字符，必须首先使字符"转义"，即，将反斜杠字符\ 放在它们前面。下表列出了正则表达式中的特殊字符：

特殊字符	描述
`( )`	标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。要匹配这些字符，请使用 `\`( 和 `\`)。
`.`	匹配除换行符 `\`n 之外的任何单字符。要匹配 . ，请使用 `\.` 。
`[`	标记一个中括号表达式的开始。要匹配 [，请使用 `\[`。
`\`	将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。例如， ‘n’ 匹配字符 ‘n’。‘\n’ 匹配换行符， `\\` 匹配 `\`，而 `\(` 则匹配 ( 。
`{`	标记限定符表达式的开始。要匹配 {，请使用 `\{`。
`	`
`\d`	匹配一个数字字符。等价于 [0-9]。
`[0-9]`	匹配任何数字。等价于 `\d`
`\D`	匹配一个非数字字符。等价于 `[^0-9]`。
`[a-z]`	匹配任何小写字母
`[A-Z]`	匹配任何大写字母
`[a-zA-Z0-9]`	匹配任何字母及数字。等价于`\w`
`\w`	匹配包括下划线的任何单词字符。等价于`[A-Za-z0-9_]`。
`\W`(大写W)	匹配任何非单词字符。等价于 `[^A-Za-z0-9_]`。
`[\u4e00-\u9fa5]`	匹配纯中文

需要记住：\d， \D， \w， \W

定位符能够将正则表达式固定到行首或行尾。它们还能够创建这样的正则表达式，这些正则表达式出现在一个单词内、在一个单词的开头或者一个单词的结尾。

定位符用来描述字符串或单词的边界，^ 和 $ 分别指字符串的开始与结束，\b 描述单词的前或后边界，\B 表示非单词边界。

正则表达式的定位符有：

特殊字符	描述
`^`	匹配输入字符串的开始位置，例如：`^h`匹配以h开头；在方括号表达式中时，它表示不接受该字符集合，例如`[^0-9]`匹配除了数字以外的数据。要匹配 ^ 字符本身，请使用 `\^`。
`$`	匹配输入字符串的结尾位置。要匹配 `$` 字符本身，请使用 `\$`。
`\b`	匹配一个单词边界，即字与空格间的位置。
`\B`	非单词边界匹配。

限定符用来指定正则表达式的一个给定组件必须要出现多少次才能满足匹配。有 ***** 或 + 或 ? 或 {n} 或 {n,} 或 {n,m} 共6种。

正则表达式的限定符有：

字符	描述
`*`	匹配前面的子表达式零次或多次。例如，`zo*` 能匹配 `z` 以及 `zoo`。等价于`{0,}`。
`+`	匹配前面的子表达式一次或多次。例如，`zo+` 能匹配 `zo` 以及 `zoo`，但不能匹配 `z`。+ 等价于 {1,}。
`?`	匹配前面的子表达式零次或一次。例如，`do(es)?` 可以匹配 `do` 、 `does` 中的 `does` 、 `doxy` 中的 `do` 。`?` 等价于 `{0,1}`。
`{n}`	n 是一个非负整数。匹配确定的 n 次。例如，`o{2}` 不能匹配 `Bob` 中的 `o`，但是能匹配 `food` 中的两个 `o`。
`{n,}`	n 是一个非负整数。至少匹配n 次。例如，`o{2,}` 不能匹配 `Bob` 中的 `o`，但能匹配 `foooood` 中的所有 `o`。`o{1,}` 等价于 `o+`。`o{0,}` 则等价于 `o*`。
`{n,m}`	m 和 n 均为非负整数，其中n <= m。最少匹配 n 次且最多匹配 m 次。请注意在逗号和两个数之间不能有空格。

示例：

import re

re.search(r'\s', '大家好 我是 代码')  # 匹配所有的空字符
re.search(r'\S', '大家')  # 匹配所有的非空字符
re.search(r'\n', '大家好\n我是代码')  # 匹配换行
re.search(r'n$', 'hello python')  # 匹配以 n 结尾
re.search(r'^h.+n$', 'hello python')  # 匹配以 h 开头，中间出现一次或多次任意字符，并且以n结尾
re.search(r'^ha*', 'h')  # 匹配以 h 开头，a出现0次或者一次

8.正则表达式匹配练习

Q1：用户名匹配:由数字、大小写字母、下划线_和中横线-组成，长度为4到14位，并且不能以数字开头。

import re


def check_username(username):
    pattern = r'^[a-zA-Z_][a-zA-Z0-9_-]{3,13}$'
    match = re.match(pattern, username)

    if match:
        return True
    else:
        return False


# 测试用户名
usernames = ["user_123", "User-Name", "123abc", "_username", "user-name", "user_name_longer_than_14"]
for username in usernames:
    if check_username(username):
        print(f"{username}: 匹配")
    else:
        print(f"{username}: 不匹配")

正则表达式模式解释：

^：匹配字符串的开头
[a-zA-Z_]：匹配一个字母、下划线或中横线（不能以数字开头）
[a-zA-Z0-9_-]{3,13}：匹配3到13个数字、大小写字母、下划线或中横线
$：匹配字符串的结尾

Q2：匹配邮箱

import re


def check_email(email):
    pattern = r'^[\w\.-]+@[\w\.-]+\.\w+$'
    match = re.match(pattern, email)

    if match:
        return True
    else:
        return False


# 测试邮箱地址
emails = ["john.doe@example.com", "jane_123@gmail.com", "invalid_email", "user@example", "admin@domain"]
for email in emails:
    if check_email(email):
        print(f"{email}: 匹配")
    else:
        print(f"{email}: 不匹配")

正则表达式模式解释：

^：匹配字符串的开头
[\w\.-]+：匹配一个或多个字母、数字、下划线、点号或中横线（邮箱用户名部分）
@：匹配邮箱地址中的@
[\w\.-]+：匹配一个或多个字母、数字、下划线、点号或中横线（邮箱域名部分）
\.：匹配邮箱地址中的点号
\w+：匹配一个或多个字母、数字或下划线（邮箱域名后缀）
$：匹配字符串的结尾

Q3：匹配手机号

import re


def check_phone_number(phone_number):
    pattern = r'^1[3-9]\d{9}$'
    match = re.match(pattern, phone_number)

    if match:
        return True
    else:
        return False


# 测试手机号码
phone_numbers = ["13812345678", "15567891234", "12345678901", "189abcd1234", "01234567890"]
for phone_number in phone_numbers:
    if check_phone_number(phone_number):
        print(f"{phone_number}: 匹配")
    else:
        print(f"{phone_number}: 不匹配")

正则表达式模式解释：

^：匹配字符串的开头
1：匹配手机号码的开头必须是1
[3456789]：匹配3、4、5、6、7、8、9中的一个数字
\d{9}：匹配9个数字（手机号码的剩余部分）
$：匹配字符串的结尾

Q4：匹配身份证号。

import re


def check_id_card(id_card):
    pattern = r'^[1-9]\d{16}(\d|X|x)$'
    match = re.match(pattern, id_card)

    if match:
        return True
    else:
        return False


# 测试身份证号码
id_cards = ["110101199003077934", "310110198706152518", "12345678901234567X", "123456789012345678", "A1234567890123456"]
for id_card in id_cards:
    if check_id_card(id_card):
        print(f"{id_card}: 匹配")
    else:
        print(f"{id_card}: 不匹配")

正则表达式模式解释：

^：匹配字符串的开头
[1-9]：匹配1到9中的一个数字（身份证号码的开头不能为0）
\d{16}：匹配16个数字（身份证号码的剩余部分）
(\d|X|x)：匹配一个数字或字母X（身份证号码的最后一位校验位）
$：匹配字符串的结尾

Q5：匹配URL地址

import re


def check_url(url):
    pattern = r'^(http|https)://[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}/?(\S+)?$'
    match = re.match(pattern, url)

    if match:
        return True
    else:
        return False


# 测试URL地址
urls = ["http://www.example.com", "https://www.example.com/path", "ftp://www.example.com", "www.example.com",
        "http://example", "https://123.456.789"]
for url in urls:
    if check_url(url):
        print(f"{url}: 匹配")
    else:
        print(f"{url}: 不匹配")

正则表达式模式解释：

^：匹配字符串的开头
(http|https)：匹配http或https
://：匹配://
[a-zA-Z0-9.-]+：匹配一个或多个字母、数字、点号或中横线（域名部分）
\.[a-zA-Z]{2,}：匹配一个点号后面跟着两个或更多字母（域名后缀部分）
/?(\S+)?：匹配可选的斜杠后面跟着一个或多个非空字符（路径部分）
$：匹配字符串的结尾

9.正则替换

re.sub() 是 Python 中用于替换字符串中的匹配项的函数。它使用正则表达式来查找匹配项，并使用提供的替换字符串来替换它们。re.sub() 函数的语法如下：

re.sub(pattern, repl, string, count=0, flags=0)

参数说明：

pattern：要匹配的正则表达式模式。
repl：用于替换匹配项的字符串或替换函数。
string：要进行替换的原始字符串。
count：可选参数，指定替换的最大次数。默认为 0，表示替换所有匹配项。
flags：可选参数，用于控制正则表达式的匹配方式，如 re.IGNORECASE（忽略大小写匹配）等。

re.sub() 函数的工作流程如下：

在原始字符串 string 中查找与正则表达式模式 pattern 匹配的部分。
对于每一个匹配项，将其替换为 repl 字符串或替换函数的结果。
返回替换后的字符串。

替换字符串中的匹配项

import re

text = "Hello, World!"
new_text = re.sub(r"Hello", "Hi", text)

print(new_text)  # Output: Hi, World!

换字符串中的多个匹配项

import re

text = "Hello, Hello, Hello!"
new_text = re.sub(r"Hello", "Hi", text)

print(new_text)  # Output: Hi, Hi, Hi!

使用替换函数

import re


def to_uppercase(match):
    return match.group().upper()


text = "hello, world!"
new_text = re.sub(r"\b\w+\b", to_uppercase, text)

print(new_text)  # Output: HELLO, WORLD!

10.贪婪模式和非贪婪模式

贪婪模式和非贪婪模式是用于匹配字符串时的两种不同行为。它们涉及到量词（quantifier）的使用，量词用于指定匹配模式中重复出现的次数。

贪婪模式（Greedy Mode）：
贪婪模式是正则表达式的默认行为，它会尽可能多地匹配字符串。当使用贪婪模式时，量词会匹配尽可能多的字符。例如，正则表达式 a.*b 匹配的是从第一个 a 到最后一个 b 之间的所有字符，尽管可能有多个 a 和多个 b 存在。

非贪婪模式（Non-Greedy Mode）：
非贪婪模式使用 ? 后缀来指示量词变为非贪婪模式。它会尽可能少地匹配字符串。当使用非贪婪模式时，量词会匹配尽可能少的字符。例如，正则表达式 a.*?b 匹配的是从第一个 a 到最近的 b 之间的字符，只取最短的匹配结果。

下面通过示例来说明贪婪模式和非贪婪模式的区别：

import re

pattern = r'<.*>'
text = '  '

result = re.match(pattern, text)
print(result.group())  #

输出结果为 。在这个例子中，正则表达式<.*>使用了贪婪模式，它尝试匹配从第一个<到最后一个>之间的所有字符，包括多个标签。

在Python正则表达式中，可以使用?符号来表示非贪婪模式。
import re pattern = r'<.*?>' text = '' result = re.match(pattern, text) print(result.group()) #

这个正则表达式<.*?>使用了非贪婪模式，?表示在*后面加上?表示非贪婪匹配。非贪婪模式尽量匹配最短的可能字符串，所以它只匹配到了第一个>之前的字符。

Python网络爬虫：从原理到实践的全面解析九月 linux python 网络爬虫爬虫
1.什么是Python爬虫？Python网络爬虫是一种通过Python编写的自动化程序，用于从互联网上的网页、数据库或服务器中提取结构化数据。其核心功能是模拟人类浏览网页的行为，按照预设规则遍历目标网站，抓取文本、图片、链接等信息。爬虫也被称为“网页蜘蛛”或“网络机器人”，广泛应用于搜索引擎索引构建、数据挖掘等领域。2.Python爬虫的运作机制爬虫的工作流程可分为以下步骤：发送请求：通过HTTP
Python网络爬虫：从原理到实践的全面解析九月 python 爬虫开发语言网络爬虫
在信息爆炸的时代，Python网络爬虫已成为获取和分析网络数据的核心技术。它不仅能够自动化采集海量网页信息，还能通过数据挖掘创造商业价值。本文将系统讲解Python爬虫的核心概念、技术实现、应用场景及法律边界，为读者构建完整的知识框架。一、什么是Python网络爬虫？Python网络爬虫是一种自动化脚本程序，通过模拟浏览器行为访问网页，按照预设规则抓取目标数据。其核心原理是：发送HTTP请求：向目
JSONDecodeError报错九月 Python python django
json.decoder.JSONDecodeError:Expectingvalue:line1column26(char25)原因：json格式转换错误，不是标准的json格式注意：（1）加大括号的表示对象，对象必须由属性组成，属性由键值对组成（2）json中属性值要使用双引号（3）json中属性值如果为逻辑值、空值，必须小写，false、true、null①json中true，python中
面向云原生的SRE —— 云原生架构概览、Kubernates AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介1.1什么是云原生计算基建？云原生计算基建（CloudNativeComputingFoundation）是一个由Linux基金会管理的开源项目，致力于构建和维护一个厂商中立、应用程序友好的平台，提供跨公共或私有云环境的应用程序部署、管理和运行服务，通过自动化手段使企业节省更多时间、降低运营成本并提升客户满意度。该项目的目的是通过定义云原生应用（Cloudnat
macOS Sequoia 15.3 M3 Pro芯片 iOS 开发环境配置记录（最新） MissYasiky 开发环境配置 macos
进行如下工作之前首先确保终端已，在ClashX选择“复制终端代理命令”，在终端进行粘附并执行。安装homebrewHomebrew是Mac平台的一个包管理工具，提供了许多Mac下没有的Linux工具等。/bin/bash-c"$(curl-fsSLhttps://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"设置环境变量ec
使用openweather获取天气（python） qq_46603846 python
可恶，琢磨了好久，今天终于给他干出来了！博客代码官方示例这个是获取地理信息的……http://api.openweathermap.org/geo/1.0/direct?q={cityname},{statecode},{countrycode}&limit={limit}&appid={APIkey}q必填城市名称、州代码（仅适用于美国）和国家/地区代码，用逗号分隔。请使用ISO3166个国家/
【前端】系统南瓜啊前端
App.vuemain.js//import'./assets/main.css'import{createApp}from'vue'import{createPinia}from'pinia'importAppfrom'./App.vue'importrouterfrom'./router'importdirectivesfrom"@/directives";constapp=createApp
责任链模式详解和在Spring Boot 项目中的使用场景冰糖心书房设计模式 Java 开发责任链模式 spring boot java
责任链模式详解1.定义：责任链模式(ChainofResponsibilityPattern)是一种行为型设计模式。它将请求的发送者和接收者解耦，允许你将请求沿着处理者链进行传递，直到有一个处理者处理它为止。每个处理者都包含对下一个处理者的引用，形成一条链。2.结构：Handler(抽象处理者):定义一个处理请求的接口，并维护一个指向下一个处理者的引用。ConcreteHandler(具体处理者)
ApplicationContext 的启动流程是怎样的？冰糖心书房 2025 Java面试系列 Spring Framework spring
ApplicationContext是SpringIoC容器的核心接口，它提供了配置、访问和管理Bean的功能。ApplicationContext的启动流程可以细分为以下几个关键步骤，这些步骤主要在AbstractApplicationContext类的refresh()方法中实现：1.prepareRefresh()-准备刷新:设置启动时间戳。设置容器的激活状态。初始化属性源(property
基础篇——从零开始掌握SQL基础语法：构建数据操作的基石暴怒的代码后端数据库 sql
一、SQL语言概述SQL（StructuredQueryLanguage）作为关系型数据库的核心交互语言，自1974年由IBM研究员提出以来，已成为数据领域最通用的标准语言。根据DB-Engines的最新统计，SQL在数据库查询语言中的使用占比超过83%，其重要性不言而喻。本文将系统讲解SQL的基础语法体系，帮助读者构建坚实的数据操作基础。二、CRUD操作：数据操作四象限2.1数据检索（SELEC
Notepad++ 配置.Net 运行环境 Zbhy0rk .Net开发 .net notepad++
Notepad++配置.Net运行环境点击运行，输入以下代码，保存设置快捷键即可：cmd/kC:\Windows\Microsoft.Net\Framework\v4.0.30319\csc.exe/out:"$(CURRENT_DIRECTORY)\$(NAME_PART).exe""$(FULL_CURRENT_PATH)"&echo正在运行:$
TCP如何保证服务的可靠性 TABE_ 计算机网络 tcp/ip 网络网络协议可靠性
这里写目录标题确认应答超时重传流量控制滑动窗口机制概述发送窗口和接收窗口的工作原理几种滑动窗口协议1比特滑动窗口协议（停等协议）后退n协议选择重传协议采用滑动窗口的问题（死锁可能，糊涂窗口综合征）死锁如何解决死锁问题糊涂窗口综合症如何解决糊涂窗口综合征？拥塞控制为什么需要拥塞控制拥塞窗口拥塞控制算法慢启动与拥塞避免（TCPTahoe版本）快速重传和快速恢复（TCPReno版本）拥塞控制和流量控制的
【PTA】1019 数字黑洞 Liu_Meihao 算法
题目1019数字黑洞思路注意字符串和整数的转换，先将字符串转为整数再相减，减完再转为字符串作为下一次的输入，以便于排序。stoi（）表示把字符串转为整数，头文件为#include。s.insert(0,4-s.size(),‘0’)表示在字符串前面不够四位的补0。代码#include#include#includeusingnamespacestd;boolcmp(chara,charb){ret
iOS UIGestureRecgonizer自动化点击埋点刘小哈哈哈 ios 自动化 cocoa
项目中很多情况下视图的点击点是通过UITapGestureRecognizer来实现的，这个时候我们就也是可以支持自动化埋点的思路如下：通过运行时hookUITapgestureRecognizer的addTarget:action:方法和initWithTarget:action:方法，在交换的方法中添加埋点的响应方法，并保留原始的响应方法，在埋点响应方法中执行埋点方法，然后调用原来的响应直接上
C# 循环 A1AA9 算法开发语言 c#
for循环for循环适用于已知循环次数的情况，它由初始化、条件判断和迭代三部分组成。for(初始化表达式;条件表达式;迭代表达式){//循环体}for循环代码：usingSystem;classProgram{staticvoidMain(){for(inti=0;ifruits=newList{"苹果","香蕉","橙子"};foreach(stringfruitinfruits){Consol
计算机毕业设计：基于python房产数据分析可视化大屏可视化 Django框架安居客二手房数据商品房✅ 源码之家 bysjbysj biyesheji0005 biyesheji0001 python 课程设计数据分析 django 商品房毕业设计可视化
博主介绍：✌全网粉丝10W+,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业项目实战6年之久，选择我们就是选择放心、选择安心毕业✌>想要获取完整文章或者源码，或者代做，拉到文章底部即可与我联系了。点击查看作者主页，了解更多项目！感兴趣的可以先收藏起来，点赞、关注不迷路，大家在毕设选题，项目以及论文编写等相关问题都可以给我留言咨询，希望帮助同学们顺利毕业。1、毕业设计：2025年
Spring Cloud LoadBalancer详解 10年JAVA大数据技术研究者微服务 spring cloud java spring LoadBalancer 源码解析
一、介绍SpringCloudLoadBalancer是SpringCloud官方自己提供的客户端负载均衡器,抽象和实现，用来替代Ribbon（已经停更），二、Ribbon和Loadbalance对比组件组件提供的负载策略支持负载的客户端Ribbon随机RandomRule轮询RoundRobinRule重试RetryRule最低并发BestAvailableRule可用过滤Availabilit
基于Flask实现的多语言Hello World 老大白菜 python flask python 后端
简介在这篇文章中，我们将探讨如何使用Flask框架创建一个智能的多语言HelloWorld服务器。这个服务器能够自动检测访问者的浏览器语言设置，并返回相应语言版本的"HelloWorld"问候语，支持超过20种世界主要语言。技术栈Python3.xFlask框架HTTP请求头处理Unicode字符串处理核心功能自动语言检测多语言支持（支持20种主要语言）优雅的降级处理（默认使用英语）支持区域特定的
嵌入式学习笔记-卡尔曼滤波,PID,MicroPython tt555555555555 面经嵌入式学习笔记学习笔记嵌入式
文章目录卡尔曼滤波卡尔曼滤波的核心思想卡尔曼滤波的数学模型1.状态转移模型（预测系统状态）2.观测模型（预测测量值）卡尔曼滤波的五个关键步骤1.预测状态2.预测误差协方差3.计算卡尔曼增益4.更新状态5.更新误差协方差卡尔曼滤波算法步骤总结代码实现（Python示例）PID调节总结MicroPython示例代码：控制LED灯并连接WiFi1.硬件准备2.连接方式3.示例代码代码说明开发环境搭建今天
【期刊】【Engineering Applications of Artificial Intelligence】【人工智能的工程应用】资源存储库期刊人工智能
https://www.sciencedirect.com/search?qs=train%20energy&pub=Engineering%20Applications%20of%20Artificial%20Intelligence&cid=2710951Aimsandscope目标和范围TheInternationalJournalofIntelligentReal-TimeAutomati
ERR_FAILED 200 解决方案执于代码 #【01.Bugs异常解决方法】前端 chrome javascript
项目场景：提示：这里简述项目相关背景：ERR_FAILED200解决方案问题描述提示：这里描述项目中遇到的问题：在chrome的网络调试器中，我可以读到文件大小估计为10.0MB(而文件实际大小为14MB)。这就是为什么我认为这是由于一些Chrome或AngularHTTPClient的限制。原因分析：提示：这里填写问题的分析：我的NodeRESTAPI正确返回了状态为200的文件。失败来自Chr
机器学习——KNN算法实战—手写数字识别巷955 机器学习算法人工智能
原理简述：KNN算法是机器学习中的一种基础的分类回归算法，选择距离自己最近的几条数据，依据最邻近的数据性质来估测自身的性质。下面我们开始实战，制作手写数字识别模型：一、cv2创建模型1、导入相关的库，这里我们用numpy和cv2两个库importnumpyasnpimportcv22、导入数据，并转化灰度图像img=cv2.imread('digits.png')gray=cv2.cvtColor
Github 仓库 git clone 速度过慢解决方案事业运财运爆棚 github
很多时候想从GitHub上clone一个仓库，都会遇到速度慢的问题，而且经常连接失败，这里给出有效解决方案。一、背景应该是很多小伙伴碰到过的问题：想从GitHub上面clone项目，很多情况下会慢的离谱，等待好久后报错：代码语言：javascript代码运行次数：0复制CloudStudio代码运行fatal:earlyEOFfatal:theremoteendhungupunexpectedly
2.Exercise 王RuaRua Exercise 算法数据结构排序算法
Exercise菱形自幂数水瓶数字调序杨辉三角菱形输入行数:3输出以下图形*************intmain(){intline=0;scanf("%d",&line);inti=0;for(i=0;iintmain(){inti=0;for(i=0;i=2){total+=empty/2;empty=empty/2+empty%2;}printf("total==%d",total);re
Java必知必会系列：RESTful API与Web服务 AI天才研究院 AI实战 DeepSeek R1 &大数据AI人工智能大模型 Python实战大数据人工智能语言模型 Java Python 架构设计
文章目录1.背景介绍RESTfulAPI与Web服务什么是RESTful？为什么要用RESTfulAPI？Web服务架构1.客户端–服务器体系结构2.无状态3.明确的角色4.使用合适的HTTP方法5.支持缓存6.使用链接关系代替非自描述信息7.异步处理RESTfulAPI框架SpringMVCRubyonRailsDjangoRestFramework如何利用框架开发RESTfulAPI创建项目创
SupportV4 包与 androidx 有重复问题解决方法 tangweiguo03051987 android
SupportV4包与androidx有重复问题解决方法android.support.v4.app.INotificationSideChannel和android.support.v4.os.ResultReceiver同时存在support和androidx；解决方法是：在gradle.properties文件中添加这两行:android.useAndroidX=trueandroid.en
Kotlin常用同步方法 tangweiguo03051987 kotlin 开发语言 android
Kotlin常用同步实现方法：1.使用synchronized关键字2.使用ReentrantLock3.使用原子操作4.使用线程安全集合5.使用信号量Semaphore6.使用读写锁ReentrantReadWriteLock7.使用条件变量:Condition一般与ReentrantLock一起使用//使用synchronized关键字classNumber1{privatevarnumber
Java反射 qq_65860758 java 开发语言
Java反射：深入探索与实战应用在Java编程的世界里，反射（Reflection）是一种强大的机制，它允许程序在运行时检查、修改和操作自身的结构和行为。通过反射，你可以动态地获取类的属性、方法、构造函数等信息，甚至可以调用私有方法和访问私有字段。这种能力在框架开发、依赖注入、测试工具等场景中尤为重要。本文将带你深入了解Java反射的工作原理、基本用法以及实战应用。一、反射的基本概念反射的核心在于
网络安全从入门到精通（特别篇V）：应急响应之webshell处置流程 HACKNOE 网络安全应急响应科研室 web安全系统安全网络安全应急响应
应急响应应急响应之webshell处置流程1.1Webshell简介1.2Webshell的分类1.3Webshell的用途1.4Webshell的检测方法1.5Webshell的防御方法1.6常规处置方法1.6.1入侵时间确定1.6.2WEB日志分析1.6.3漏洞分析1.6.4漏洞复现1.6.5漏洞修复1.7常用工具1.7.1D盾1.7.2河马1.7.3wireshark应急响应之webshel
Java实现向MySQL数据库批量更新数据的常见方法来杯@Java 数据库 java mysql
文章目录一、IN二、For+Update三、insertinto...onduplicatekeyupdate四、replaceinto五、set...case...when...where六、创建临时表案例一、IN第一种方式是借助IN语句，这种方式局限性较大，更新结果必须一致，比如下面就是将满足条件的行的状态（status）都置为1。如果是一部分置为1，一部分置为2等，则无法实现，要么就是写多条
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&

Python11-正则表达式

Python11-正则表达式

1.正则表达式简介

2.正则表达式常见用法和符号

3.正则查找

4.re.Match对象与group

5.re.compile

6.正则表达式修饰符

7.正则匹配规则

8.正则表达式匹配练习

9.正则替换

10.贪婪模式和非贪婪模式

你可能感兴趣的:(Python,1024程序员节,python,正则表达式,re)