Blue92120

Python高级系列教程：Python高级语法与正则表达式

学习目标

1、能够掌握with语句的使用

2、能够知道生成器的两种创建方式

3、能够知道深拷贝和浅拷贝的区别

4、能够掌握Python中的正则表达式编写

一、Python高级语法

1、with语句和上下文管理器

☆ with语句

Python提供了 with 语句的写法，既简单又安全。文件操作的时候使用with语句可以自动调用关闭文件操作，即使出现异常也会自动关闭文件操作。举个栗子：

使用with方法实现文件操作，如下所示：

# 1、以写的方式打开文件
withopen('1.txt','w')as f:
# 2、读取文件内容
f.write('hello world')

2、生成器的创建方式

Python生成器是一种特殊的迭代器，它可以按需生成值，而不是一次性生成所有值。生成器可以节省内存空间，并且可以以惰性方式生成数据，只有在需要时才会生成数据。

创建生成器的方式

① 生成器推导式

② yield 关键字

☆ 生成器推导式

生成器表达式是一种类似于列表推导式的语法，它可以用于创建生成器对象。与列表推导式不同的是，生成器表达式使用圆括号而不是方括号，并且返回的是一个生成器对象而不是一个列表。

以下是一个生成器表达式的示例：

# 创建生成器
my_generator =(i *2for i inrange(5))
print(my_generator)

# next获取生成器下一个值
# value = next(my_generator)
# print(value)

# 遍历生成器
for value in my_generator:
print(value)

当使用next获取生成器的下一个值时，即：

# 创建生成器
my_generator = (i * 2 for i in range(5))
print(my_generator)

# next获取生成器下一个值
value = next(my_generator)
print(value)

这段代码使用生成器表达式创建了一个生成器对象my_generator，它会生成从0到4的整数，每个整数乘以2。

接下来，使用next函数获取生成器对象的下一个值，并将其赋值给变量value。由于生成器是按需生成值的，因此在第一次调用next函数时，生成器会生成第一个值，并返回该值。在下一次调用next函数时，生成器会生成下一个值，并返回该值。依次类推，直到生成器中没有更多的值可以生成，再次调用next函数会抛出StopIteration异常，表示生成器已经没有更多的值可以生成。

在这个例子中，第一次调用next函数时，生成器会生成第一个值0，并返回该值。因此，变量value的值为0，然后打印出来。

# 创建生成器
my_generator = (i * 2 for i in range(5))
print(my_generator)

# 遍历生成器
for value in my_generator:
print(value)

这段代码使用生成器表达式创建了一个生成器对象my_generator，它会生成从0到4的整数，每个整数乘以2。

接下来，使用for循环遍历生成器对象，依次获取生成器返回的每个值，并将其打印出来。由于生成器是按需生成值的，因此在每次迭代时才会生成下一个值，所以遍历生成器时不会一次性生成所有值，而是在需要时才生成。在这个例子中，循环过程中，生成器会依次生成0、2、4、6、8这五个值，并将这些值赋值给变量value，然后打印出来。当生成器中没有更多的值可以生成时，循环结束。由于生成器是按需生成值的，因此可以节省内存空间，并且可以以惰性方式生成数据，只有在需要时才会生成数据。

生成器相关函数：

next 函数获取生成器中的下一个值
for 循环遍历生成器中的每一个值

☆ yield生成器

yield 关键字生成器的特征：在def函数中具有yield关键字

defgenerator(n):
for i inrange(n):
print('开始生成...')
yield i
print('完成一次...')

g = generator(5)
print(next(g))
print(next(g))
print(next(g))
print(next(g))
print(next(g))-----> 正常
print(next(g))-----> 报错
Traceback (most recent call last):
File "/Users/cndws/PycharmProjects/pythonProject/demo.py", line 14,in
print(next(g))
StopIteration

这段代码定义了一个名为generator的生成器函数，它的参数n表示生成的数据个数。在函数内部，使用for循环来生成n个数，每生成一个数，就使用yield语句将该数作为生成器的值返回，并在生成器内部打印出开始生成...和完成一次...，以便区分生成器的输出结果是在哪个阶段生成的。yield语句会暂停函数的执行，并将返回值作为生成器的值返回，下次再调用next()方法时，从yield语句处继续执行。

在程序中，先调用generator(5)创建一个生成器g，然后连续调用5次next(g)方法获取生成器的下一个值，每次调用next()方法时，生成器会生成下一个值，并返回该值。因为该生成器中一共有5个数需要生成，所以可以正常地获取5个值并打印输出。当程序第6次调用next()方法时，由于生成器中已经没有数可以生成了，所以会抛出StopIteration异常，表示生成器已经没有更多的值可以生成。这是生成器的一种默认行为，当没有更多的值能够生成时，StopIteration异常就会被抛出，可以在程序中捕捉该异常并进行相应处理。

defgenerator(n):
for i inrange(n):
print('开始生成...')
yield i
print('完成一次...')

g = generator(5)
for i in g:
print(i)

这段代码与上一段代码类似，也是定义了一个生成器函数generator，用来生成n个数。不同之处在于，这里使用for循环遍历生成器对象g，而不是连续调用next()方法来获取生成器的下一个值。在for循环中，每次迭代会自动调用next()方法来获取生成器的下一个值，并将该值赋值给循环变量i，然后执行循环体内的代码块。在这个例子中，循环体内只有一行代码，即打印出循环变量i的值。

运行结果：

开始生成...
0
完成一次...
开始生成...
1
完成一次...
开始生成...
2
完成一次...
开始生成...
3
完成一次...
开始生成...
4
完成一次...

进程已结束,退出代码0

因为generator(5)返回的是一个生成器对象，所以可以直接将其用于for循环中，从而遍历生成器对象中的所有值。在每次循环中，生成器会生成下一个值，并将该值赋值给循环变量i，然后打印出来。由于生成器是按需生成值的，所以在循环过程中，每生成一个值，就会打印出一行开始生成...和完成一次...，以便区分生成器的输出结果是在哪个阶段生成的。最终，循环结束后，生成器中就没有更多的值可以生成了，程序也就结束了。

defgenerator(n):
for i inrange(n):
print('开始生成...')
yield i
print('完成一次...')

g = generator(5)
whileTrue:
try:
print(next(g))
except StopIteration:
break

这段代码与前两段代码类似，也是定义了一个生成器函数generator，用来生成n个数。不同之处在于，这里使用while循环和try...except语句来获取生成器的下一个值。在while循环中，每次循环会调用next()方法来获取生成器的下一个值，并将该值打印出来。由于生成器是按需生成值的，所以在循环过程中，每生成一个值，就会打印出一行开始生成...和完成一次...，以便区分生成器的输出结果是在哪个阶段生成的。在try...except语句中，如果生成器已经没有更多的值可以生成了，就会抛出StopIteration异常，然后使用break语句退出循环。

因为生成器是按需生成值的，所以使用while循环和try...except语句来获取生成器的下一个值，可以在生成器中没有更多的值可以生成时，及时捕捉异常并退出循环，避免程序出现异常情况。这种方式比较灵活，可以根据需要自由地控制生成器的输出结果，同时也可以在生成器中有异常情况时及时处理。

注意点：

① 代码执行到 yield 会暂停，然后把结果返回出去，下次启动生成器会在暂停的位置继续往下执行

② 生成器如果把数据生成完成，再次获取生成器中的下一个数据会抛出一个StopIteration 异常，表示停止迭代异常

③ while 循环内部没有处理异常操作，需要手动添加处理异常操作

④ for 循环内部自动处理了停止迭代异常，使用起来更加方便，推荐大家使用。

☆ yield关键字和return关键字

如果不太好理解yield，可以先把yield当作return的同胞兄弟来看，他们都在函数中使用，并履行着返回某种结果的职责。

这两者的区别是：

有return的函数直接返回所有结果，程序终止不再运行，并销毁局部变量；

defexample():
x =1
return x

example = example()
print(example)

而有yield的函数则返回一个可迭代的 generator（生成器）对象，你可以使用for循环或者调用next()方法遍历生成器对象来提取结果。

defexample():
x =1
y =10
while x < y:
yield x
x +=1

example = example()
print(example)

☆ 为什么要使用yield生成器

import memory_profiler as mem

# nums = [1, 2, 3, 4, 5]
# print([i*i for i in nums])

nums =list(range(10000000))
print('运算前内存：', mem.memory_usage())
# 列表
# square_nums = [n * n for n in nums]
# 生成器
square_nums =(n * n for n in nums)
print('运算后内存：', mem.memory_usage())

这段代码使用了memory_profiler模块来测试程序的内存使用情况。

首先导入了memory_profiler模块，然后定义了一个列表nums，包含10000000个数字。然后输出了运算前的内存使用情况。接下来使用一个生成器表达式n * n for n in nums来生成一个新的序列square_nums，该序列包含了nums中每个元素的平方。生成器表达式是一种语法类似于列表推导式的生成器。不同之处在于，它使用圆括号而不是方括号来生成一个生成器对象，而不是一个列表。生成器表达式是按需计算元素的，只有在需要时才会计算，而不是一次性计算所有元素并存储在内存中。

最后，程序再输出了运算后的内存使用情况。

运行代码后，可以看到程序在运行生成器表达式后，内存使用情况没有明显变化。这是因为生成器表达式是按需生成元素的，并不会事先计算并存储所有元素。与使用列表推导式不同，使用生成器表达式可以在保证程序功能的同时，减小程序的内存占用。

☆ yield与斐波那契数列

数学中有个著名的斐波拉契数列（Fibonacci）

要求：数列中第一个数为0，第二个数为1，其后的每一个数都可由前两个数相加得到：

例子：1, 1, 2, 3, 5, 8, 13, 21, 34, ...

现在我们使用生成器来实现这个斐波那契数列，每次取值都通过算法来生成下一个数据, 生成器每次调用只生成一个数据，可以节省大量的内存。

deffib(max):
n, a, b =0,0,1
while n yield b # 使用 yield
# print b
a, b = b, a + b
n = n +1

for n in fib(5):
print n

这段代码使用生成器函数来生成斐波那契数列，并使用for循环来输出数列中的前5个数。

首先来看生成器函数fib的定义。这个函数接受一个参数max，表示要生成的数列中最大的数。函数内部定义了三个变量n、a和b，分别表示当前生成的数的序号、数列中前一个数和当前数。初始值分别为0、0和1。然后进入一个循环，每次循环都使用yield语句返回当前数列中的数b，然后更新变量a和b的值以便计算下一个数，并将n的值加1。这个循环会一直执行，直到n的值达到max为止。

接下来是使用for循环来输出数列中的前5个数的代码。首先使用fib(5)调用生成器函数fib，得到一个生成器对象。然后将这个生成器对象传递给for循环，循环会使用next函数来逐一获取生成器中的下一个数，直到循环5次为止。在每次循环中，使用print函数输出当前数列中的数n。由于生成器函数中使用了yield语句，所以这个循环会逐一输出数列中的前5个数，即1、1、2、3和5。

需要注意的是，这个生成器函数是可以无限生成数列的，所以在使用for循环输出数列时，需要指定循环的次数或者手动终止循环。另外，由于这个生成器函数使用了yield语句，所以每次循环只会生成一个数，而不会一次性生成数列中的所有数，从而节省了内存。

3、深浅拷贝

☆ 几个概念

变量：是一个系统表的元素，拥有指向对象的连接空间
对象：被分配的一块内存，存储其所代表的值
引用：是自动形成的从变量到对象的指针
类型：属于对象，而非变量
不可变对象：一旦创建就不可修改的对象，包括数值类型、字符串、布尔类型、元组

（该对象所指向的内存中的值不能被改变。当改变某个变量时候，由于其所指的值不能被改变，相当于把原来的值复制一份后再改变，这会开辟一个新的地址，变量再指向这个新的地址。）

可变对象：可以修改的对象，包括列表、字典、集合

（该对象所指向的内存中的值可以被改变。变量（准确的说是引用）改变后，实际上是其所指的值直接发生改变，并没有发生复制行为，也没有开辟新的地址，通俗点说就是原地改变。）当我们写：

a ="python"

Python解释器干的事情：

① 创建变量a

② 创建一个对象(分配一块内存)，来存储值 'python'

③ 将变量与对象，通过指针连接起来，从变量到对象的连接称之为引用(变量引用对象)

image-20210121111247319.png

☆ 赋值

赋值: 只是复制了新对象的引用，不会开辟新的内存空间。

并不会产生一个独立的对象单独存在，只是将原有的数据块打上一个新标签，所以当其中一个标签被改变的时候，数据块就会发生变化，另一个标签也会随之改变。

☆ 浅拷贝

浅拷贝: 创建新对象，其内容是原对象的引用。

浅拷贝之所以称为浅拷贝，是它仅仅只拷贝了一层，拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。

案例1：赋值

案例2：可变类型浅拷贝

案例3：不可变类型浅拷贝

注：不可变类型进行浅拷贝不会给拷贝的对象开辟新的内存空间，而只是拷贝了这个对象的引用

浅拷贝有三种形式：切片操作，工厂函数（list()），copy模块中的copy函数。

如：lst = [1,2,[3,4]]

切片操作：lst1 = lst[:] 或者 lst1 = [each for each in lst]

注：[:]它与[0:]相似，意思是从0索引拆分到末尾。它返回一个新列表。

工厂函数：lst1 = list(lst)

copy函数：lst1 = copy.copy(lst)

但是在lst中有一个嵌套的list[3,4]，如果我们修改了它，情况就不一样了。

浅复制要分两种情况进行讨论：

1）当浅复制的值是不可变对象（字符串、元组、数值类型）时和“赋值”的情况一样，对象的id值_（id()函数用于获取对象的内存地址）与浅复制原来的值相同。

2）当浅复制的值是可变对象（列表、字典、集合）时会产生一个“不是那么独立的对象”存在。有两种情况：

第一种情况：复制的对象中无复杂子对象，原来值的改变并不会影响浅复制的值，同时浅复制的值改变也并不会影响原来的值。原来值的id值与浅复制原来的值不同。

第二种情况：复制的对象中有复杂子对象（例如列表中的一个子元素是一个列表），如果不改变其中复杂子对象，浅复制的值改变并不会影响原来的值。但是改变原来的值中的复杂子对象的值会影响浅复制的值。

☆ 深拷贝

深拷贝：和浅拷贝对应，深拷贝拷贝了对象的所有元素，包括多层嵌套的元素。深拷贝出来的对象是一个全新的对象，不再与原来的对象有任何关联。

所以改变原有被复制对象不会对已经复制出来的新对象产生影响。只有一种形式，copy模块中的deepcopy函数。

可变类型深拷贝：

不可变类型深拷贝：不可变类型进行深拷贝不会给拷贝的对象开辟新的内存空间，而只是拷贝了这个对象的引用

☆ 案例演示

案例1：对于可变对象深浅拷贝

import copy
a=[1,2,3]

print("=====赋值=====")
b=a
print(a)
print(b)
print(id(a))
print(id(b))

print("=====浅拷贝=====")
b=copy.copy(a)
print(a)
print(b)
print(id(a))
print(id(b))

print("=====深拷贝=====")
b=copy.deepcopy(a)
print(a)
print(b)
print(id(a))
print(id(b))

结果：

=====赋值=====
[1,2,3]
[1,2,3]
37235144
37235144
=====浅拷贝=====
[1,2,3]
[1,2,3]
37235144
37191432
=====深拷贝=====
[1,2,3]
[1,2,3]
37235144
37210184

小结：

赋值：值相等，地址相等

copy浅拷贝：值相等，地址不相等

deepcopy深拷贝：值相等，地址不相等

案例2：对于可变对象深浅拷贝（外层改变元素）

import copy
l=[1,2,3,[4,5]]

l1=l #赋值
l2=copy.copy(l)#浅拷贝
l3=copy.deepcopy(l)#深拷贝
l.append(6)

print(l)
print(l1)
print(l2)
print(l3)

结果：

[1,2,3,[4,5],6]#l添加一个元素6
[1,2,3,[4,5],6]#l1跟着添加一个元素6
[1,2,3,[4,5]]#l2保持不变
[1,2,3,[4,5]]#l3保持不变

案例3：对于可变对象深浅拷贝（内层改变元素）

import copy
l=[1,2,3,[4,5]]

l1=l #赋值
l2=copy.copy(l)#浅拷贝
l3=copy.deepcopy(l)#深拷贝
l[3].append(6)

print(l)
print(l1)
print(l2)
print(l3)

结果：

[1,2,3,[4,5,6]]#l[3]添加一个元素6
[1,2,3,[4,5,6]]#l1跟着添加一个元素6
[1,2,3,[4,5,6]]#l2跟着添加一个元素6
[1,2,3,[4,5]]#l3保持不变

小结：

① 外层添加元素时，浅拷贝不会随原列表变化而变化；内层添加元素时，浅拷贝才会变化。

② 无论原列表如何变化，深拷贝都保持不变。

③ 赋值对象随着原列表一起变化。

二、正则表达式概述

1、为什么要学习正则表达式

在实际开发过程中经常会有查找符合某些复杂规则的字符串的需要比如：邮箱、图片地址、手机号码等这时候想匹配或者查找符合某些规则的字符串就可以使用正则表达式了

image-20210118135358176.png

在实际应用的过程中，它可以在文本处理、数据分析、网络爬虫、数据清洗等领域发挥重要作用。以下是学习正则表达式的几个原因：

文本处理：在文本处理中，我们需要对文本进行搜索、替换、分割等操作，而正则表达式可以帮助我们快速、准确地完成这些任务。例如，我们可以使用正则表达式来搜索包含特定单词或短语的文本，或者将一段文本中的某些字符替换为其他字符。
数据分析：在数据分析中，我们需要对数据进行清洗、提取、转换等操作，而正则表达式可以帮助我们快速、高效地完成这些任务。例如，我们可以使用正则表达式来提取一段文本中的数字、日期、电话号码等信息，或者将一些数据格式进行转换。
网络爬虫：在网络爬虫中，我们需要对网页进行解析、提取、筛选等操作，而正则表达式可以帮助我们快速、准确地完成这些任务。例如，我们可以使用正则表达式来提取网页中的链接、图片、视频等信息，或者筛选出符合特定条件的网页。
编程语言：在编程语言中，正则表达式也是一种常用的工具，它可以帮助我们进行字符串匹配、替换、分割等操作。例如，在Python中，我们可以使用re模块来使用正则表达式进行字符串操作。

综上所述，学习正则表达式可以帮助我们在文本处理、数据分析、网络爬虫、编程等领域提高工作效率，同时也是程序员必备的技能之一。

2、什么是正则表达式

正则表达式(regular expression)描述了一种字符串匹配的模式，可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。

模式：一种特定的字符串模式，这个模式是通过一些特殊的符号组成的。

某种：也可以理解为是一种模糊匹配。

精准匹配：select * from blog where title='python';

模糊匹配：select * from blog where title like ‘%python%’;

正则表达式并不是Python所特有的，在Java、PHP、Go以及JavaScript等语言中都是支持正则表达式的。

3、正则表达式的功能

① 数据验证（表单验证、如手机、邮箱、IP地址）

② 数据检索（数据检索、数据抓取）

③ 数据隐藏（1356235 王先生）

④ 数据过滤（论坛敏感关键词过滤） …

三、re模块的介绍

1、什么是re模块

在Python中需要通过正则表达式对字符串进行匹配的时候，可以使用一个re模块

2、re模块使用三步走

# 第一步：导入re模块
import re
# 第二步：使用match方法进行匹配操作
result = re.match(pattern正则表达式, string要匹配的字符串, flags=0)
# 第三步：如果数据匹配成功，使用group方法来提取数据
result.group()

match函数参数说明：

参数	描述
pattern	匹配的正则表达式
string	要匹配的字符串。
flags	标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。参见：正则表达式修饰符 - 可选标志

匹配成功re.match方法返回一个匹配的对象，否则返回None。

我们可以使用group(num) 或 groups() 匹配对象函数来获取匹配数据。

正则表达式可以包含一些可选标志修饰符来控制匹配的模式。修饰符被指定为一个可选的标志。多个标志可以通过按位 OR(|) 它们来指定。如 re.I | re.M 被设置成 I 和 M 标志：

修饰符	描述
re.I	使匹配对大小写不敏感
re.L	做本地化识别（locale-aware）匹配，这个功能是为了支持多语言版本的字符集使用环境的，比如在转义符\w，在英文环境下，它代表[a-zA-Z0-9_]，即所以英文字符和数字。如果在一个法语环境下使用，缺省设置下，不能匹配"é" 或 "ç"。加上这L选项和就可以匹配了。不过这个对于中文环境似乎没有什么用，它仍然不能匹配中文字符。
re.M	多行匹配，影响 ^ 和 $
re.S	使 . 匹配包括换行在内的所有字符
re.U	根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.X	VERBOSE，冗余模式，此模式忽略正则表达式中的空白和#号的注释，例如写一个匹配邮箱的正则表达式。该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。

3、re模块的相关方法

☆ re.match(pattern, string, flags=0)

从字符串的起始位置匹配，如果匹配成功则返回匹配内容，否则返回None

参数说明：

pattern：需要匹配的正则表达式。
string：需要匹配的字符串。
flags：可选参数，用于控制正则表达式的匹配方式。

re.match()函数会从字符串的开头开始匹配正则表达式，如果匹配成功，则返回一个Match对象，否则返回None。Match对象包含了匹配结果的信息，可以通过调用Match对象的方法来获取这些信息。

需要注意的是，re.match()只会匹配字符串的开头，如果需要在整个字符串中匹配正则表达式，可以使用re.search()函数。

例如，下面的代码演示了如何使用re.match()函数从字符串的开头匹配一个正则表达式：

import re

string ="hello, world"
pattern =r"hello"

match_obj = re.match(pattern, string)
if match_obj:
print("匹配成功")
else:
print("匹配失败")

输出结果为：

匹配成功

在上面的代码中，我们使用re.match()函数从字符串的开头匹配了一个正则表达式，由于字符串的开头是"hello"，因此匹配成功。

☆ re.findall(pattern, string, flags=0)

参数说明：

pattern：需要匹配的正则表达式。
string：需要匹配的字符串。
flags：可选参数，用于控制正则表达式的匹配方式。

re.findall()函数会在字符串中搜索正则表达式，返回所有匹配的结果。返回结果是一个列表，列表中的每个元素都是一个匹配结果。

例如，下面的代码演示了如何使用re.findall()函数在字符串中搜索数字：

import re

string ="I have 2 apples and 3 oranges"
pattern =r"\d+"

result = re.findall(pattern, string)
print(result)

输出结果为：

['2','3']

在上面的代码中，我们使用re.findall()函数在字符串中搜索数字，由于字符串中包含了2和3这两个数字，因此返回了一个包含这两个数字的列表。

☆ re.finditer(pattern, string, flags)

功能与上面findall一样，不过返回的是迭代器

参数说明：

pattern : 模式字符串。
repl : 替换的字符串，也可为一个函数。
string : 要被查找替换的原始字符串。
count : 模式匹配后替换的最大次数，默认 0 表示替换所有的匹配。
flags: 匹配方式:
re.I 使匹配对大小写不敏感，I代表Ignore忽略大小写
re.S 使 . 匹配包括换行在内的所有字符
re.M 多行模式,会影响^,$

re.finditer()函数会在字符串中搜索正则表达式，返回所有匹配的结果。返回结果是一个迭代器，可以通过迭代器来逐个获取匹配结果。

例如，下面的代码演示了如何使用re.finditer()函数在字符串中搜索数字：

import re

string ="I have 2 apples and 3 oranges"
pattern =r"\d+"

iter_obj = re.finditer(pattern, string)
for match_obj in iter_obj:
print(match_obj.group())

输出结果为：

2
3

在上面的代码中，我们使用re.finditer()函数在字符串中搜索数字，由于字符串中包含了2和3这两个数字，因此返回了一个包含这两个数字的迭代器。我们通过for循环遍历迭代器，逐个获取匹配结果，并打印出来。

4、正则表达式快速入门

案例1：查找一个字符串中是否具有数字“8”

import re

result = re.findall('8','13566128753')
# print(result)
if result:
print(result)
else:
print('未匹配到任何数据')

案例2：查找一个字符串中是否具有数字

import re

result = re.findall('\d','a1b2c3d4f5')
# print(result)
if result:
print(result)
else:
print('未匹配到任何数据')

案例3：查找一个字符串中是否具有非数字

import re

result = re.findall('\D','a1b2c3d4f5')
# print(result)
if result:
print(result)
else:
print('未匹配到任何数据')

四、正则表达式详解

正则编写三步走：查什么、查多少、从哪查

正则表达式通常是由两部分数据组成的：普通字符与元字符普通字符：0123456789abcd@... 元字符：正则表达式所特有的符号 => [0-9]，^，*，+，？

1、查什么

代码	功能
.（英文点号）	匹配任意某1个字符（除了\n）
[ ]	匹配[ ]中列举的某1个字符，专业名词 => 字符簇
[^指定字符]	匹配除了指定字符以外的其他某个字符，^专业名词 => 托字节
\d	匹配数字，即0-9
\D	匹配非数字，即不是数字
\s	匹配空白，即空格，tab键
\S	匹配非空白
\w	匹配非特殊字符，即a-z、A-Z、0-9、_
\W	匹配特殊字符，即非字母、非数字、非下划线

字符簇常见写法：

① [abcdefg] 代表匹配abcdefg字符中的任意某个字符（1个）

② [aeiou] 代表匹配a、e、i、o、u五个字符中的任意某个字符

③ [a-z] 代表匹配a-z之间26个字符中的任意某个

④ [A-Z] 代表匹配A-Z之间26个字符中的任意某个

⑤ [0-9] 代表匹配0-9之间10个字符中的任意某个

⑥ [0-9a-zA-Z] 代表匹配0-9之间、a-z之间、A-Z之间的任意某个字符

字符簇 + 托字节结合代表取反的含义：

① [^aeiou] 代表匹配除了a、e、i、o、u以外的任意某个字符

② [^a-z] 代表匹配除了a-z以外的任意某个字符

\d 等价于 [0-9]，代表匹配0-9之间的任意数字

\D 等价于 [^0-9]，代表匹配非数字字符，只能匹配1个

2、查多少

代码	功能
*	匹配前一个字符出现0次或者无限次，即可有可无（0到多）
+	匹配前一个字符出现1次或者无限次，即至少有1次（1到多）
?	匹配前一个字符出现1次或者0次，即要么有1次，要么没有（0或1）
{m}	匹配前一个字符出现m次，匹配手机号码\d{11}
{m,}	匹配前一个字符至少出现m次，\w{3,}，代表前面这个字符最少要出现3次，最多可以是无限次
{m,n}	匹配前一个字符出现从m到n次，\w{6,10}，代表前面这个字符出现6到10次

基本语法：正则匹配字符.或\w或\S + 跟查多少如\w{6, 10} 如.*，匹配前面的字符出现0次或多次

3、从哪查

代码	功能
^	匹配以某个字符串开头
$	匹配以某个字符串结尾

扩展：正则工具箱

https://c.runoob.com/front-end/854/

https://c.runoob.com/front-end/7625/#!flags=&re=1[3-9]\d{9}

爬虫 => xpath，专门做爬虫

爬虫+正则

爬虫+xpath

重点把SQL重点学习一下

五、几个重要概念

1、子表达式（又称之为分组）

在正则表达式中，通过一对圆括号括起来的内容，我们就称之为 "子表达式"。

re.search(r'\d(\d)(\d)','abcdef123ghijklmn')

注意：Python正则表达式前的 r 表示原生字符串（rawstring），该字符串声明了引号中的内容表示该内容的原始含义，避免了多次转义造成的反斜杠困扰。

正则表达式中\d\d\d中，(\d)(\d)就是子表达式，一共有两个()圆括号，则代表两个子表达式

说明：findall方法，如果pattern中有分组则返回与分组匹配的列表，所以分组操作中不适合使用findall方法，建议使用search(匹配一个)或finditer(匹配多个)方法。

2、捕获

当正则表达式在字符串中匹配到相应的内容后，计算机系统会自动把子表达式所匹配的到内容放入到系统的对应缓存区中（缓存区从$1开始）

案例演示：

import re

# 匹配字符串中连续出现的两个相同的单词
str1 ='abcdef123ghijklmn'
result = re.search(r'\d(\d)(\d)', str1)
print(result.group())
print(result.group(1))
print(result.group(2))

3、反向引用（后向引用）

在正则表达式中，我们可以通过\n（n代表第n个缓存区的编号）来引用缓存区中的内容，我们把这个过程就称之为"反向引用"。

① 连续4个数字 re.search(r'\d\d\d\d, str1)

1234、5678、6789

② 连续的4个数字，但是数字的格式为1111、2222、3333、4444、5555效果？

re.search(r'(\d)\1\1\1, str1)

4、几个练习题

① 查找连续的四个数字，如：3569

答：\d\d\d\d或\d{4}

② 查找连续的相同的四个数字，如：1111

答：(\d)\1\1\1

③ 查找数字，如：1221,3443

答：(\d)(\d)\2\1 第一个()放入1号缓冲区，如果想引用\1 第二个()放入2号缓冲区，如果想引用\2

④ 查找字符，如：AABB,TTMM（提示：A-Z，正则：[A-Z]）

答：([A-Z])\1([A-Z])\2

⑤ 查找连续相同的四个数字或四个字符（提示：\w）

答：(\w)\1\1\1 1111 aaaa bbbb

六、正则表达式其他方法

1、选择匹配符

|可以匹配多个规则案例：匹配字符串hellojava或hellopython

import re

str='hellojava, hellopython'
result = re.finditer(r'hello(java|python)',str)
if result:
for i in result:
print(i.group())
else:
print('未匹配到任何数据')

2、分组别名

代码	功能
(?P)	分组起别名
(?P=name)	引用别名为name分组匹配到的字符串

案例：匹配

# 导入模块
import re

str1 =''
result = re.search(r'<(?P\w+)>', str1)

print(result.group())

3、综合案例

①需求：在列表中["apple", "banana", "orange", "pear"]，匹配apple和pear

import re

list1 =["apple","banana","orange","pear"]
str1 =str(list1)
result = re.finditer('(apple|pear)', str1)
if result:
for i in result:
print(i.group())
else:
print('未匹配到任何数据')

② 需求：匹配出163、126、qq等邮箱

import re

email ='[email protected], [email protected], [email protected]'
result = re.finditer('\w+@(qq|126|163).com', email)
if result:
for i in result:
print(i.group())
else:
print('未匹配到任何数据')

③需求 : 匹配qq:10567这样的数据，提取出来qq文字和qq号码

import re

str1 ='qq:10567'
result = re.split(r':', str1)
if result:
print(f'{result[0]}号：{result[1]}')
else:
print('未匹配到任何数据')

你可能感兴趣的:(python,开发语言)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
seaborn又一个扩展heatmapz qq_21478261 #Python可视化 matplotlib
推荐阅读：Pythonmatplotlib保姆级教程嫌Matplotlib繁琐？试试Seaborn！
NGS测序基础梳理01-文库构建（Library Preparation） qq_21478261 #生物信息生物学
本文介绍Illumina测序平台文库构建（LibraryPreparation）步骤，文库结构。写作时间：2020.05。推荐阅读：10W字《Python可视化教程1.0》来了！一份由公众号「pythonic生物人」精心制作的PythonMatplotlib可视化系统教程，105页PDFhttps://mp.weixin.qq.com/s/QaSmucuVsS_DR-klfpE3-Q10W字《Rg
Python 常用内置函数详解（七）：dir()函数——获取当前本地作用域中的名称列表或对象的有效属性列表
目录一、功能二、语法和示例一、功能dir()函数获取当前本地作用域中的名称列表或对象的有效属性列表。二、语法和示例dir()函数有两种形式，如果没有实参，则返回当前本地作用域中的名称列表。如果有实参，它会尝试返回该对象的有效属性列表。如果对象有一个名为__dir__()的方法，那么该方法将被调用，并且必须返回一个属性列表。dir()函数的语法格式如下：C:\Users\amoxiang>ipyth
pythonjson中list操作_Python json.dumps 特殊数据类型的自定义序列化操作
场景描述：Python标准库中的json模块，集成了将数据序列化处理的功能；在使用json.dumps()方法序列化数据时候，如果目标数据中存在datetime数据类型，执行操作时，会抛出异常：TypeError:datetime.datetime(2016,12,10,11,04,21)isnotJSONserializable那么遇到json.dumps序列化不支持的数据类型，该怎么办！首先，
Python 日期格式转json.dumps的解决方法 douyaoxin python json 开发语言
classDateEncoder(json.JSONEncoder):defdefault(self,obj):ifisinstance(obj,datetime.datetime):returnobj.strftime('%Y-%m-%d%H:%M:%S')elifisinstance(obj,datetime.date):returnobj.strftime("%Y-%m-%d")json.d
Python 爬虫实战：视频平台播放量实时监控（含反爬对抗与数据趋势预测）西攻城狮北 python 爬虫音视频
一、引言在数字内容蓬勃发展的当下，视频平台的播放量数据已成为内容创作者、营销人员以及行业分析师手中极为关键的情报资源。它不仅能够实时反映内容的受欢迎程度，更能在竞争分析、营销策略制定以及内容优化等方面发挥不可估量的作用。然而，视频平台为了保护自身数据和用户隐私，往往会设置一系列反爬虫机制，对数据爬取行为进行限制。这就向我们发起了挑战：如何巧妙地突破这些限制，同时精准地捕捉并预测播放量的动态变化趋势
Python技能手册 - 模块module 金色牛神 Python python windows 开发语言
系列Python常用技能手册-基础语法Python常用技能手册-模块modulePython常用技能手册-包package目录module模块指什么typing数据类型int整数float浮点数str字符串bool布尔值TypeVar类型变量functools高阶函数工具functools.partial()函数偏置functools.lru_cache()函数缓存sorted排序列表排序元组排序
Ubuntu基础（Python虚拟环境和Vue） aaiier ubuntu python linux
Python虚拟环境sudoaptinstallpython3python3-venv进入项目目录cdXXX创建虚拟环境python3-mvenvvenv激活虚拟环境sourcevenv/bin/activate退出虚拟环境deactivateVue安装Node.js和npm#安装Node.js和npm（Ubuntu默认仓库可能版本较旧，适合入门）sudoaptinstallnodejsnpm#验
苦练Python第9天：if-else分支九剑 python后端前端人工智能
苦练Python第9天：if-else分支九剑前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。欢迎点赞、收藏、关注，一键三连！！！欢迎来到100天Python挑战第9天！今天我们不练循环，改磨“分支剑法”——ifelse三式：单分支、双分支、多分支，以及嵌套和三元运算符，全部实战演练，让
苦练Python第8天：while 循环之妙用 python后端前端人工智能
苦练Python第8天：while循环之妙用原文链接：https://dev.to/therahul_gupta/day-9100-while-loops-with-real-world-examples-528f作者：RahulGupta译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众
苦练Python第5天：字符串从入门到格式化 python后端人工智能前端
苦练Python第5天：字符串从入门到格式化原文链接：https://dev.to/therahul_gupta/day-5100-working-with-strings-basics-to-formatting-2kkn作者：RahulGupta译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include