Mercy92

[Python]第十章开箱即用

文章目录

10.1模块

10.1.1模块就是程序
10.1.2模块是用来下定义的

1.在模块中定义函数
2.在模块代码中添加测试代码

10.1.3让模块可用

1.将模块放入正确的位置
2.告诉解释器去哪里找

10.1.4包

10.2探索模块

10.2.1模块包含什么

1.使用函数dir
2.变量__all__

10.2.2使用help获取帮助
10.2.3文档
10.2.4使用源代码

10.3标准库：一些深受欢迎的模块

10.3.1 sys
10.3.2 os
10.3.3 fileinput
10.3.4集合、堆和双端队列

1.集合
2.堆 heapq
3.双端队列 collections

10.3.5time
10.3.6random
10.3.7shelve和json

1.一个潜在的陷阱
2.一个简单的数据示例

10.3.8 re

1.正则表达式是什么
2.模块re的内容
3.匹配对象和编组
4.替换中的组号和函数
5.找出发件人
6.模板系统演示

标准安装包包含一组称为标准库的模块

10.1模块

>>> import math#导入模块
>>> math.sin(0)#调用模块中的方法
0.0

10.1.1模块就是程序

在C:/Users/XXXX/Downloads/python目录下有一个文件hello.py，这个文件中写了一串可执行的代码，那么这个文件就可以作为模块导入程序

# hello.py 
print("Hello, world!")

首先需要将该目录设置为系统路径，这一步告诉解释器，除了通常查找的位置，还可以在该目录下查找,注意该种方式是只是一次性的

>>>import sys
>>>sys.path.append('C:/Users/XXXX/Downloads/python')

然后导入该模块

>>>import hello
Hello, world!

运行成功后，该目录下回生成一个名为__pycache__的子目录，可以删除，必要时会重新建
再次导入时将没有任何动作，即使内容发生修改，因为模块不是用来执行操作的，而是用于定义变量、函数、类等，这些动作只需要做一次

>>> import hello
>>>

如果hello模块在运行时发生了修改，的确需要重新加载，可以使用importlib模块里面的reload函数

>>> import importlib
>>> hello = importlib.reload(hello)
Hello, new world!

如果已经用之前模块中的类实例化了对象，重新加载模块后，该对象仍然是旧版模块类的对象

10.1.2模块是用来下定义的

让模块值得被创建的原因在于他们像类一样，有自己的作用域，这意味着在模块中定义的类和函数对其进行赋值的变量都将成为模块的属性

1.在模块中定义函数

新建一个py文件，写一个函数

# hello2.py
def hello():
	print("Hello, world!")

导入模块

>>> import hello2

如下访问该函数：

>>> hello2.hello()
Hello, world!

这样使用模块的意义是增加代码的重用性，将代码保存为模块，在需要用的时候访问它，而不需要重新编写。

2.在模块代码中添加测试代码

新建一个py文件，写一个函数

# hello3.py
def hello():
	print("Hello, China!")
# 一个测试：
hello()

这块代码直接作为普通程序可以运行，当做模块导入另外一个程序中，hello()函数也能被运行

>>> import hello3
Hello, China!
>>> hello3.hello()
Hello, China!

使用变量__name__检查模块作为程序运行还是被导入另外一个程序

>>> __name__
'__main__'#当前运行的是主程序
>>> hello3.__name__
'hello3'#此时该变量__name__被赋值成该模块的名称

将测试代码放入if语句

#hello4.py 
def hello(): 
 print("Hello, china") 
def test(): 
 hello() 
if __name__ == '__main__': test() #如果作为一个普通程序自己运行的时候会调用test(),当被当作模块导入的时候不调用
>>> import hello4#不会自动运行测试代码
>>> hello4.hello()#直接访问该函数
Hello,china
>>> hello4.test()#通过测试方法访问该函数
Hello,china

10.1.3让模块可用

之前需要import sys，sys.path.append(‘目录’)才能让解释器找到模块的位置，如果一开始就让sys.path包含正确的目录，有两种方式：

1.将模块放入正确的位置

只需找出原本解释器去哪找

>>> import sys,pprint
>>> pprint.pprint(sys.path)
['',
 'G:\\Anaconda3\\python36.zip',
 'G:\\Anaconda3\\DLLs',
 'G:\\Anaconda3\\lib',
 'G:\\Anaconda3',
 'G:\\Anaconda3\\lib\\site-packages',
 'G:\\Anaconda3\\lib\\site-packages\\win32',
 'G:\\Anaconda3\\lib\\site-packages\\win32\\lib',
 'G:\\Anaconda3\\lib\\site-packages\\Pythonwin']

Notice：pprint是个卓越的打印函数，能够更妥善地打印输出。相比较print，可以只能换行，展现的格式跟布局更合理
打印出来列表里面的每个元素都是解释器去查找的目录，将模块放置在其中任意一个目录下即可。但目录site-packages是最佳的选择，因为它就是用来放置模块的。

2.告诉解释器去哪里找

对于以下情况，模块不便直接放在上述目录下：
 不希望Python解释器的目录中充斥着你编写的模块。
 没有必要的权限，无法将文件保存到Python解释器的目录中。
 想将模块放在其他地方。
那么就需要告诉解释器去实际存放模块的地方找
一种方法是之前介绍的sys,path.append()修改路径，标准做法是将存放模块的目录添加到环境变量PYTHONPATH中（计算机-属性）,命令export PYTHONPATH=$PYTHONPATH:~/python （base shell）
另外还可以使用路径配置文件.pth

10.1.4包

为组织模块，编组为包，包就是另一种模块，但他们可包含其他模块。模块是.py文件，而包是一个目录。要被Python视为包，目录必须包含文件__init__.py
例如，如果有一个名为constants的包，而文件constants/init.py包含语句PI = 3.14，就可以像下面这样做：

>>>import constants 
>>>print(constants.PI)

要将模块加入包，只需将模块文件放在包目录中即可，也可以在包中嵌套其他包
以下语法都是合法的：

import 包
import 包.模块
from 包  import 模块

10.2探索模块

10.2.1模块包含什么

探索标准模块copy

1.使用函数dir

>>>import copy
>>>dir(copy)

如果只打印那些不含下划线，可供外部使用的所有属性,可使用一下列表推导筛出

>>> [n for n in dir(copy) if not n.startswith('_')] 
['Error', 'PyStringMap', 'copy', 'deepcopy', 'dispatch_table', 'error', 'name', 't', 'weakref']

2.变量all

在dir(copy)打印的完整列表中包含__all__,这个变量包含一个列表。

>>> copy.__all__
['Error', 'copy', 'deepcopy']

它是在模块copy中像下面这样设置的（这些代码是直接从copy.py复制而来的）：
__all__ = [“Error”, “copy”, “deepcopy”]
旨在定义模块共有的接口，它告诉解释器从这个模块导入的所有的名称意味着什么
因此，使用 from copy import *只能得到上述列出的3个函数
于是要导入其他属性，例如pystringMap，需要显示导入：import copy并使用copy.PyStringMap；或者使用from copy import pystringMap
编写模块时，像这样设置__all__也很有用。因为模块可能包含大量其他程序不需要的变量、
函数和类，比较周全的做法是将它们过滤掉。如果不设置__all__，则会在以import *方式导入时，导入所有不以下划线打头的全局名称。

10.2.2使用help获取帮助

>>> help(copy.copy) #获取有关函数copy
Help on function copy in module copy: 
copy(x) 
  	Shallow copy operation on arbitrary Python objec 
See the module's __doc__ string for more info.

实际上，前面的帮助信息是从函数copy的文档字符串中提取的：

>>> print(copy.copy.__doc__) 
Shallow copy operation on arbitrary Python objects. 
 	See the module's __doc__ string for more info.

10.2.3文档

当然可以直接访问这个模块的doc文档

>>> print(copy.__doc__)
Generic (shallow and deep) copying operations.
Interface summary:
        import copy
        x = copy.copy(y)        # make a shallow
。。。。。。

Python库参考手册”（https://docs.python.org/library）

10.2.4使用源代码

查找源代码，一种办法是像解释器那样通过sys.path来查找，但更快捷的方式是查看模块的特性__file__

>>> print(copy.__file__)
G:\Anaconda3\lib\copy.py

从该路径找到后，用编辑器打开，注意不要保存修改的内容

10.3标准库：一些深受欢迎的模块

10.3.1 sys

访问与python解释器紧密相关的变量和函数

函数/变量	描述
argv	命令行参数，包括脚本名https://blog.csdn.net/sunny_580/article/details/78188716
exit([arg])	退出当前程序，可通过可选参数指定返回值或错误消息（finally子句依然会执行）
modules	一个字典，将模块名映射到加载的模块
path	一个列表，包含要在其中查找模块的目录的名称
Platform	一个平台标识符，如sunos5或win32
stdin	标准输入流——一个类似于文件的对象
stdout	标准输出流——一个类似于文件的对象
stderr	标准错误流——一个类似于文件的对象

简单地说，Python从sys.stdin获取输入（例如，用于input中），并将输出打印到sys.stdout。
CASE:反转打印命令行参数

# reverseargs.py 
import sys 
args = sys.argv[1:] #this is a test
args.reverse() 
print(' '.join(args))
或者
print(' '.join(reversed(sys.argv[1:]))) 
>>> python reverseargs.py this is a test
test a is this

这里在shell或者其他解释器输入的python reverseargs.py后面的‘this is a test’就是sys.argv[1:] ，程序实现了将输入的内容传给reverseargs文件

10.3.2 os

访问多个操作系统服务

函数/变量	描述
environ	包含环境变量的映射
system(command)	在子shell中执行操作系统命令
sep	路径中使用的分隔符
pathsep	分隔不同路径的分隔符
linesep	行分隔符（’\n’、’\r’或’\r\n’）
urandom(n)	返回n个字节的强加密随机数据

CASE:打开浏览器

import os
#命令system可用于执行任何外部程序
#打开记事本程序
os.system('notepad')
os.system(r'C:\"Program Files (x86)"\Google\Chrome\Application\chrome.exe')#有错误
os.startfile(r'C:\Program Files (x86)\Google\Chrome\Application\chrome.exe')

更佳的方案

import webbrowser
webbrowser.open('http://www.taobao.com')

Extend: 1.getcwd() #获取当前路径 ,chdir() #改变当前路径

>>>import os
>>>localpath=os.getcwd()
>>>print(localpath)
-----------------------
C:\Users\xxxx\python_test

>>>os.chdir(r'C:\Users\xxxx\Downloads\python')
>>>print(os.getcwd())
--------------
C:\Users\xxxx\Downloads\python

Extend: 2.os.path.join(path, *paths) # Join two (or more) paths.

>>>newpath=os.path.join(localpath,'temp')
>>>print(newpath)
C:\Users\xxxx\python_test\temp

Extend: 3.sys.exit()和os.exit(),exit()/quit()

sys.exit(n) 退出程序引发SystemExit异常, 可以捕获异常执行些清理工作. n默认值为0, 表示正常退出. 其他都是非正常退出. 还可以sys.exit(“sorry, goodbye!”); 一般主程序中使用此退出.
os._exit(n), 直接退出, 不抛异常, 不执行相关清理工作. 常用在子进程的退出.
exit()/quit(), 跑出SystemExit异常. 一般在交互式shell中退出时使用.
https://blog.csdn.net/index20001/article/details/74294945

10.3.3 fileinput

读写文件

函数	描述
input([files[, inplace[, backup]]])	帮助迭代多个输入流中的行
filename()	返回当前文件的名称
lineno()	返回（累计的）当前行号
filelineno()	返回在当前文件中的行号
isfirstline()	检查当前行是否是文件中的第一行
isstdin()	检查最后一行是否来自sys.stdin
nextfile()	关闭当前文件并移到下一个文件
close()	关闭序列

CASE在Python脚本中添加行号

# numberlines.py 
import fileinput 
for line in fileinput.input(inplace=True): #inplace:是否将标准输出(print方法)的结果写回文件；如果不为TRUE，则文档内容不会改变，执行的结果将在控制台打印出来
	line = line.rstrip() 
	num = fileinput.lineno() 
	print('{:<50} # {:2d}'.format(line, num)) #{:<50} 左对齐，宽度50， {:2d }表示两个宽度的10进制数显示。

如果像下面这样运行这个程序，并将其作为参数传入：

>>> python numberlines.py text.txt

text.txt会作为参数传入fileinput.input(inplace=True)，实际上后面跟着多个文件，如python numberlines.py text.txt temp.txt，会将后面所有文件的行一一处理。
如果只输入python numberlines.py或者python numberlines.py-，那么就会默认sys.stdin等待输入，对输入的内容进行处理。

10.3.4集合、堆和双端队列

Python中有用的数据结构除了字典（散列表）和列表（动态数组），还有一些又是也能排上用场

1.集合

由内置类Set实现

>>>set([0,1,2,3,4])
>>>set(range(5))
{0, 1, 2, 3, 4}

Notice：{}是一个空字典而非空集合，a=set()创建一个空集合
必须在不提供任何参数的情况下调用set。
集合主要用于成员资格检查，因此将忽略重复的元素：

>>> {0, 1, 2, 3, 0, 1, 2, 3, 4, 5} 
{0, 1, 2, 3, 4, 5}

与字典一样，集合中元素的排列顺序是不确定的，因此不能依赖于这一点。

>>> {'fee', 'fie', 'foe'} 
{'foe', 'fee', 'fie'}

对集合进行计算
求并集 .union |

>>> a = {1, 2, 3}
>>> b = {2, 3, 4}
>>> a.union(b)
{1, 2, 3, 4}
>>> a | b
{1, 2, 3, 4}

取交集 .intersection &

>>> a.intersection(b)
{2, 3}
>>> a & b
{2, 3}
>>> c = a & b

a是否包含c .issubset <=

>>> c.issubset(a)
True
>>> c <= a
True

C是否包含a .issuperset >=

>>> c.issuperset(a)
False
>>> c >= a
False

从a中返回在b中不存在的元素 .difference -

>>> a.difference(b)
{1}
>>> a - b
{1}

从ab中返回在交集中不存在的元素 .symmetric_difference ^

>>> a.symmetric_difference(b)
{1, 4}
>>> a^b
{1, 4}

复制 .copy()

>>> a.copy()
{1, 2, 3}
>>> a.copy() is a
False

计算两个集合的并集的函数时,set中方法union的未关联版本

>>>my_sets = [{3,88,99}] 
>>>my_sets.append(set(range(0, 5)))
>>>my_sets
[{3, 88, 99}, {0, 1, 2, 3, 4}]
>>>import functools
>>>functools.reduce(set.union, my_sets) 
{0, 1, 2, 3, 4, 88, 99}

集合是可变的，因此不能用作字典中的键。集合只能包含不可变（可散列）的值，因此不能包含其他集合。但是有frozenset类型，它表示不可变（可散列）的集合。

>>>a={1,2,3,4}
>>>b={2,3,4,5}
>>> a.add(b)
Traceback (most recent call last):
File "", line 1, in ?
TypeError: set objects are unhashable#集合不能包含其他集合
>>> a.add(frozenset(b)) 
>>>a
{1, 2, 3, 4, frozenset({2, 3, 4, 5})}

构造函数frozenset创建给定集合的副本。在需要将集合作为另一个集合的成员或字典中的键时，frozenset很有用。

2.堆 heapq

另一种著名的数据结构是堆（heap），它是一种优先队列。优先队列让你能够以任意顺序添加对象，并随时（可能是在两次添加对象之间）找出（并删除）最小的元素
这个模块名为heapq（其中的q表示队列），它包含6个函数（如表10-5所示），其中前4个与堆操作直接相关。必须使用列表来表示堆对象本身。

函数	描述
heappush(heap, x)	将x压入堆中
heappop(heap)	从堆中弹出最小的元素
heapify(heap)	让列表具备堆特征
heapreplace(heap, x)	弹出最小的元素，并将x压入堆中
nlargest(n, iter)	返回iter中n个最大的元素
nsmallest(n, iter)	返回iter中n个最小的元素

heappush(heap, x)不能将它用于普通列表，而只能用于使用各种堆函数创建的列表。

from heapq import *
from random import shuffle
data=[8,5,6,7,1,3,4,2,0]
shuffle(data)#就地打乱序列seq
#data 直接输出的序列将是无序的
heap=[]
for n in data:
    heappush(heap,n)
heap
[0, 1, 2, 4, 3, 8, 7, 6, 5]

它们虽然不是严格排序的，但必须保证一点：位置i处的元素总是大于位置i // 2处的元素（反过来说就是小于位置2 * i和2 * i + 1处的元素）。
这是底层堆算法的基础，称为堆特征（heap property）
函数heappop弹出最小的元素（总是位于索引0处），并确保剩余元素中最小的那个位于索引0处（保持堆特征）。

>>> heappop(heap) 
0 
>>> heappop(heap) 
1
>>> heappop(heap) 
2
>>> heap 
[3, 4, 6, 7, 5, 8]

函数heapify通过执行尽可能少的移位操作将列表变成合法的堆（即具备堆特征）。如果你的堆并不是使用heappush创建的，应在使用heappush和heappop之前使用这个函数。

>>> heap = [5, 8, 0, 3, 6, 7, 9, 1, 4, 2] 
>>> heapify(heap) 
>>> heap 
[0, 1, 5, 3, 2, 7, 9, 8, 4, 6]

函数heapreplace从堆中弹出最小的元素，再压入一个新元素。
相比于依次执行函数heappop和heappush，这个函数的效率更高

>>> heapreplace(heap, 0.5) 
0 #返回原最小值
>>> heap 
[0.5, 1, 5, 3, 2, 7, 9, 8, 4, 6] 
>>> heapreplace(heap, 10) 
0.5 
>>> heap 
[1, 2, 5, 3, 6, 7, 9, 8, 4, 10]

3.双端队列 collections

需要按添加元素的顺序进行删除时，双端队列很有用。 collections中，包含类型deque以及其他几个集合（collection）类型。

>>> from collections import deque 
>>> q = deque(range(5)) 
>>> q.append(5) 
>>> q.appendleft(6) #左添加
>>> q 
deque([6, 0, 1, 2, 3, 4, 5]) 
>>> q.pop() 
5 
>>> q.popleft() #左删除
6 
>>> q.rotate(3) #轮转函数，集体向右移动3格
>>> q 
deque([2, 3, 4, 0, 1]) 
>>> q.rotate(-1) 
>>> q 
deque([3, 4, 0, 1, 2])

10.3.5time

模块time包含用于获取当前时间、操作时间和日期、从字符串中读取日期、将日期格式化为字符串的函数。
日期可表示为实数（从新纪元1月1日0时记时），也可表示为包含9个整数的元组.
(2008, 1, 21, 12, 2, 56, 0, 21, 0)表示:
2008年1月21日12时2分56秒。这一天是星期一，2008年的第21天（不考虑夏令时）

索引	字段	值
0	年	如2000、2001等
1	月	范围1~12
2	日	范围1~31
3	时	范围0~23
4	分	范围0~59
5	秒	范围0~61
6	星期	范围0~6，其中0表示星期一
7	儒略日	范围1~366
8	夏令时	0、1或-1

秒的取值范围为0~61，这考虑到了闰一秒和闰两秒的情况。
夏令时数字是一个布尔值（True或False），但如果你使用-1，那么mktime［将时间元组转换为时间戳（从新纪元开始后的秒数）的函数］可能得到正确的值。

函数	描述
asctime([tuple])	将时间元组转换为字符串
localtime([secs])	将秒数转换为表示当地时间的日期元组
mktime(tuple)	将时间元组转换为当地时间
sleep(secs)	休眠（什么都不做）secs秒
strptime(string[, format])	将字符串转换为时间元组
time()	当前时间（从新纪元开始后的秒数以UTC为准）

>>>import time
#时间元组--字符串
>>>time.asctime(time.localtime())
>>>time.asctime()#将当前时间元组转换为字符串
'Fri Sep 28 07:44:58 2018'

#秒---时间元组
>>>time.localtime()#本地时间
time.struct_time(tm_year=2018, tm_mon=9, tm_mday=28, tm_hour=7, tm_min=45, tm_sec=22, tm_wday=4, tm_yday=271, tm_isdst=0)
>>>type(time.gmtime())#国际时间
time.struct_time

#时间元组---秒
>>>time.mktime((2018,9,28,7,48,25,4,271,0))#将日期元组转换为从新纪元后的秒数
1538092105.0
>>>time.mktime(time.localtime())#将日期元组转换为从新纪元后的秒数，与localtime的功能相反
1543893840.0

>>>print('wait 3 seconds')
>>>time.sleep(3)#让解释器等待指定的秒数
>>>print('down!')
wait 3 seconds
down!

#字符串--时间元组
>>>time.strptime(time.asctime())
>>>time.strptime("30 Nov 00", "%d %b %y")#将一个字符串（其格式与asctime所返回字符串的格式相同）转换为日期元组
time.struct_time(tm_year=2000, tm_mon=11, tm_mday=30, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=3, tm_yday=335, tm_isdst=-1)

#时间--字符串
>>>time.strftime('%Y%m%d')
'20200708'
>>>time.strftime('%W')
'27'

>>>time.time()#返回当前的国际标准时间
1543894099.0952008

10.3.6random

模块random包含生成伪随机数的函数，有助于编写模拟程序或生成随机输出的程序。(真正的随机，用于加密或实现与安全相关的功能，使用模块os中的函数urandom)

函数	描述
random()	返回一个0~1（含）的随机实数
getrandbits(n)	以长整数方式返回n个随机的二进制位
uniform(a, b)	返回一个a~b（含）的随机实数
randrange([start], stop, [step])	从range(start, stop, step)中随机地选择一个数
choice(seq)	从序列seq中随机地选择一个元素
shuffle(seq[, random])	就地打乱序列seq
sample(seq, n)	从序列seq中随机地选择n个值不同的元素

>>>import random
>>>random.random()#返回一个0~1（含）的伪随机数
0.22018834179900648
>>>random.getrandbits(6)#以一个整数的方式返回指定数量的二进制位
33
>>>random.uniform(4,55)#返回一个a~b（含）的随机（均匀分布的）实数。
29.405905331706407
>>>random.randrange(4,20,2)#生成随机整数,20不含
14
>>>random.choice([0,1,2,3,4,5])#从给定序列中随机（均匀）地选择一个元素
4
>>>q=[0,1,2,3,4,5]
>>>random.shuffle(q)#shuffle随机地打乱一个可变序列中的元素，并确保每种可能的排列顺序出现的概率相同。
>>>q
[5, 3, 2, 0, 1, 4]
>>>random.sample(q,2)#从给定序列中随机（均匀）地选择指定数量的元素，并确保所选择元素
的值各不相同。
[2, 0]

CASE1:生成一个指定区间内的随机时间

>>>from random import *
>>>from time import *
>>>date1 = (2016, 1, 1, 0, 0, 0, -1, -1, -1) 
>>>time1=mktime(date1)#日期元组转化成秒
>>>date2 = (2017, 1, 1, 0, 0, 0, -1, -1, -1) 
>>>time2=mktime(date2)
>>>random_time=uniform(time1,time2)
>>>print(asctime(localtime(random_time)))
Tue Mar  1 05:46:19 2016

CASE2:掷骰子

>>>from random import *
>>>num=int(input('how many dices:'))#要掷多少个骰子
>>>sides=int(input('how many sides:'))#每个骰子有多少面
>>>sum=0
>>>for i in range(num):
	    point=randrange(sides)+1#生成一个1~面数的随机整数
	    print('NO.',(i+1),'dice:',point)
	    sum+=point#每个骰子点数累加
    
>>>print('total points:',sum)
how many dices:2
how many sides:6
NO. 1 dice: 2
NO. 2 dice: 3
total points: 5

CASE3 随机发牌

#创建一副牌
>>>values=list(range(1,11))+'jack queen king'.split()#生成13张牌的集合
>>>suits='dimonds clubs hearts spades'.split()#生成4种花色的集合
>>>deck=['{} of {}'.format(v,s) for v in values for s in suits]#数组相乘的方式生成一副牌
>>>deck
['1 of dimonds',
 '1 of clubs',
 '1 of hearts',
 '1 of spades',
 '2 of dimond',
... ...
 'king of clubs',
 'king of hearts',
 'king of spades']
>>>from random import shuffle
>>>shuffle(deck)#洗牌
>>>deck
['jack of spades',
 '8 of clubs',
 '10 of hearts',
 'jack of dimonds',
......
 'king of dimonds',
 '4 of hearts',
 '6 of spades',
 '7 of clubs']
>>>while deck:input(deck.pop())#将上述列表的元素从后往前取出,按回车发牌
7 of clubs4
6 of spades
4 of hearts
king of dimonds
.......
jack of dimonds
10 of hearts
8 of clubs
jack of spades

10.3.7shelve和json

Shelve的open函数，将一个文件名作为参数，并返回一个shelf对象，以供存储数据。
可像操作普通字典那样操作它（只是键必须为字符串），操作完毕（并将所做的修改存盘）时，可调用其方法close。

1.一个潜在的陷阱

>>>import shelve
>>>s=shelve.open('test.dat')#自动创建test.dat.dat和test.dat.dir文件
>>>s['x']=[1,2,3]
>>>s['x'].append(4)#使用它创建一个新列表，再将'4'附加到这个新列表末尾，但这个修改后的版本未被存储
>>>s['x']
[1, 2, 3]

创建了新列表却没有保存

>>>import shelve
>>>s=shelve.open('test.dat')
>>>s['x']=[1,2,3]
>>>temp=s['x']#临时变量
>>>temp.append(4)
>>>s['x']=temp#再次储存
>>>s['x']
[1, 2, 3, 4]

使用临时变量，修改临时变量后再次储存

>>>import shelve
>>>s=shelve.open('test.dat',writeback=True)#修改open的writeback参数
>>>s['x']=[1,2,3]
>>>s['x'].append(4)
>>>s['x']
[1, 2, 3, 4]

writeback设置为True,从shelf对象读取或赋给它的所有数据结构都将保存到内存（缓存）中,等到关闭shelf对象时才将它们写入磁盘中。

2.一个简单的数据示例

#code1
import sys,shelve
#获取数据
def store_person(db):
    pid=input('输入识别号：')
    person={}
    person['name']=input('输入姓名：')
    person['age']=input('输入年龄：')
    person['phone']=input('输入号码：')
    db[pid]=person#pid是一个字符串，db得是一个字典（该案例应该是一个shelf对象）
    #print(db)

测试一下，传入空字典

>>>#store_person({})
输入识别号：01
输入姓名：kk
输入年龄：1
输入号码：1234
{'01': {'name': 'kk', 'age': '1', 'phone': '1234'}}

可以输入数据，再测试出非空字典

>>>#store_person({'01': {'name': 'kk', 'age': '1', 'phone': '1234'}})
输入识别号：02
输入姓名：kk
输入年龄：21
输入号码：5423
{'01': {'name': 'kk', 'age': '1', 'phone': '1234'}, '02': {'name': 'kk', 'age': '21', 'phone': '5423'}}

#code2
#查询数据
def lookup_person(db):
    pid_v=input('输入要查询的识别号：')
    field=input('输入要查询的信息（name,age,phone）：').strip().lower()
    print(field+':',db[pid_v][field])

测试查询

>>>#lookup_person({'01': {'name': 'kk', 'age': '1', 'phone': '1234'}, '02': {'name': 'kk', 'age': '21', 'phone': '5423'}})
输入要查询的识别号：02
输入要查询的信息（name,age,phone）： AGE
age: 21

新建一个shelf对象来存储数据

#code3
database=shelve.open('C:\\database.dat')#在相应目录下会生成该文件

存储第一条数据

>>>store_person(database)
输入识别号：001
输入姓名：jack
输入年龄：21
输入号码：2589
<shelve.DbfilenameShelf object at 0x0000000004BBAFD0>

存储第二条数据

>>>store_person(database)
输入识别号：002
输入姓名：hellen
输入年龄：25
输入号码：2590
<shelve.DbfilenameShelf object at 0x0000000004BBAFD0>

查询数据

>>>lookup_person(database)
输入要查询的识别号：001
输入要查询的信息（name,age,phone）：phone
phone: 2589

关闭文件

database.close()

整合和优化：
1调用储存和查询函数是手动的，可以通过输入自定义指令条件判断执行对应函数
2主程序位于函数main中，这个函数仅在__name__== 'main’时才会被调用。这意味着可在另一个程序中将这个程序作为模块导入，再调用函数main。
3为确保数据库得以妥善的关闭，使用了try和finally。

#code4
def main():
    try:
        while True:
            cmd =input('输入命令：').strip().lower()#去除空格并且小写
            if cmd == 'store':
                store_person(database)
            elif cmd == 'lookup':
                lookup_person(database)
            elif cmd == 'quit':
                return#原本是while true:break结构,这里除了可以用break,也可以用return,break可以跳出循环，return用于返回函数值，这里的循环在main()函数内部，函数main（）可以被返回值
    finally:
        database.close()          
if __name__=='__main__':main()

该案例整合的完整版可以参考附录
由于数据已经被存在对应目录下的dat文件里面，因此退出程序后，数据得到保留，下次查询，之前的数据还在

10.3.8 re

模式	描述
\w	匹配字母数字及下划线
\W	匹配非字母数字下划线
\s	匹配任意空白字符，等价于 [\t\n\r\f].
\S	匹配任意非空字符
\d	匹配任意数字，等价于 [0-9]
\D	匹配任意非数字
\A	匹配字符串开始
\Z	匹配字符串结束，如果是存在换行，只匹配到换行前的结束字符串
\z	匹配字符串结束
\G	匹配最后匹配完成的位置
\n	匹配一个换行符
\t	匹配一个制表符
^	匹配字符串的开头
$	匹配字符串的末尾。
.	匹配任意字符，除了换行符，当re.DOTALL标记被指定时，则可以匹配包括换行符的任意字符。
[…]	用来表示一组字符,单独列出：[amk] 匹配 ‘a’，‘m’或’k’
[^…]	不在[]中的字符：[^abc] 匹配除了a,b,c之外的字符。
*	匹配0个或多个的表达式。
+	匹配1个或多个的表达式。
?	匹配0个或1个由前面的正则表达式定义的片段，非贪婪方式
{n}	精确匹配n个前面表达式。
{n, m}	匹配 n 到 m 次由前面的正则表达式定义的片段，贪婪方式
a\|b	匹配a或b
( )	匹配括号内的表达式，也表示一个组

模块re提供对正则表达式的支持

1.正则表达式是什么

是可匹配文本片段模式

通配符
正则表达式可与多个字符匹配，可以使用特殊字符来创建这种正则表达式
例如： . 可以匹配除换行符以外的其他单个字符，如：‘.ython’可匹配到‘python’、’+ython’等
这里像 . 的特殊符号就是通配符
对特殊字符进行转义
像 . 是通配符，是一个特殊的符号，可以匹配除了换行符以外的任何单个字符，但是如果让该符号指向代表它原本的意义，不希望再有通配的能力时，需要用反斜杠转义
‘.ython.org’ 可与‘pythonworg’通配
‘.ython\\.org’或者r’.ython\.org’ 与’python.org’通配不与‘pythonworg’通配
字符集
不需要匹配任意字符，只需要匹配指定字符
‘[pj]ython’只可与‘python’和’jython‘匹配
‘[a-z]’可以和a~z的任何字母匹配
‘[a-zA-Z0-9]’可以与大写小写字母和数字匹配
‘[^abc]’与排除abc三个字符以外的其他任何字符匹配（^脱字符）
二选一和子模式
'p(ython|erl)‘只匹配字符串’python’和’perl’
单个字符也可称为子模式
可选模式和重复模式
将？加载子模式后面，代表该子模式是可选的。
I like (apple、)?(pear、)?banana可匹配
I like Banana
I like apple、Banana
I like apple、pear、banana
每个可选的子模式都可以出现，也可以不出现。
重复多次
(apple)* 重复0|1|多次
(apple)+ 重复1|多次
(apple){n} 重复n次
(apple){m,n} 重复m~n多次
字符串的开头和末尾
要指定字符串开头，可使用脱字符（^），注意其在字符集中使用差别。
例如，’^ht+p’与’http://python.org’和’htttttp://python.org’匹配，但与’www.http.org’不匹配。
要指定字符串末尾，可使用美元符号（$）

2.模块re的内容

函数	描述
compile(pattern[, flags])	根据包含正则表达式的字符串创建模式对象
search(pattern, string[, flags])	在字符串中查找模式
match(pattern, string[, flags])	在字符串开头匹配模式
split(pattern, string[, maxsplit=0])	根据模式来分割字符串
findall(pattern, string)	返回一个列表，其中包含字符串中所有与模式匹配的子串
sub(pat, repl, string[, count=0])	将字符串中与模式pat匹配的子串都替换为repl
escape(string)	对字符串中所有的正则表达式特殊字符都进行转义

re.compile() 将用字符串表示的正则表达式转换为模式对象(pat)，以提高匹配效率。
转换之后才可以供search、match函数使用。不转换也能用，只是效率低。

pat=compile(正则表达式)
re.search(pat.string)等价于pat.search(string)

re.search() 在指定字符串中找到第一个与正则表达式相匹配的子串时，就返回Matchobject，否则就返回none(没有找到，没有返回)

>>>from re import *
>>>pat=compile('.ython')
>>>search(pat,'i love python not jython')
<_sre.SRE_Match object; span=(7, 13), match='python'>#span=(7, 13)被匹配的字符在字符串中的位置

re.match() 在指定字符串开头开始查找与正则表达式相匹配的子串时，就返回Matchobject，否则就返回none

>>>match(pat,'i love python not jython')
没有找到，没有返回
>>>match(pat,'python is my favorite language')
<_sre.SRE_Match object; span=(0, 6), match='python'>

如果要求字符串尾部匹配,可以在match函数基础上添加结尾通配符$

>>>pat2=compile('.ython$')
>>>match(pat2,'python')
<_sre.SRE_Match object; span=(0, 6), match='python'>

re.splite() 用来以正则表达式分隔字符串

>>>text='my,name,,is！lucy'
>>>split('[,！]',text)
['my', 'name', '', 'is', 'lucy']
>>>text='my,name,,is,！lucy'
>>>split('[,！]+',text)#+代表[]内字符重复多次的也匹配
['my', 'name', 'is', 'lucy']

如果模式是圆括号，则除了方括号的分列外，还把本身保留在原位置

>>>text2='ppytthon'
>>>split('[y|h]',text2)#[y|h]和[yh]效果是一样的
['pp', 'tt', 'on']#这里把text2分列开来的y和h并未被保留
>>>split('(y|h)',text2)
['pp', 'y', 'tt', 'h', 'on']

还可以指定分隔次数

>>>text3='ppytthonyssshppp'
>>>split('[y|h]',text3)#默认全部分隔结束
['pp', 'tt', 'on', 'sss', 'ppp']
>>>split('[y|h]',text3,2)#只分隔两次
['pp', 'tt', 'onyssshppp']

re.findall() 返回一个列表，包含所有了匹配的子串

>>>pat=compile('.ython')
>>>findall(pat,'i love python not jython')
['python', 'jython']
>>>text4='hello!what is your name?jack,nice to see you.'
>>>findall('[a-zA-Z]+',text4)
['hello', 'what', 'is', 'your', 'name', 'jack', 'nice', 'to', 'see', 'you']
>>>findall('[,.!]+',text4)
['!', ',', '.']

当正则表达式中有（），会将（）匹配到的内容形成嵌套序列

>>>pat=re.compile('(.ython(\d+))')
>>>re.findall(pat,'i love hhhhhhhhhpython33 not hhhhhhhhjython22 jjjjjjjj')
[('python33', '33'), ('jython22', '22')]

re.sub() 从左往右匹配子串替换为指定内容

>>>sub('name','lily','dear,name')
>>>#sub('{name}','lily','dear,{name}')
'dear,lily'
>>> pat = '{name}'
>>> text = 'Dear {name}...'
>>> re.sub(pat, 'Mr. Gumby', text)
'Dear Mr. Gumby...'

re.escape() 是一个工具函数，用于对字符串中所有可能被视为正则表达式运算符的字符进行转义。

>>>escape('www.baidu.com')
'www\\.baidu\\.com'

3.匹配对象和编组

方法	描述
group([group1, …])	获取与给定子模式（编组）匹配的子串.编号为1~99。指定一个或没有编组号（无编组号默认为0，即整个字符串），返回单个字符串，多个编组号返回元组
start([group])	返回与给定编组匹配的子串的起始位置,（默认为0，即整个模式）
end([group])	返回与给定编组匹配的子串的终止位置（与切片一样，不包含终止位置,返回终止索引加1）
span([group])	返回与给定编组匹配的子串的起始和终止位置

#  a(banana)(c)(dD(Ee))
#   1        2  3  4
>>>m=match('a(.*)(c|C)(d.(.e))','abananacdDEe')
>>>m.group(0)
'abananacdDEe'
>>>m.group(1)
'banana'
>>>m.group(3)
'dDEe'
>>>m.group(0,1,2,3,4)
('abananacdDEe', 'banana', 'c', 'dDEe', 'Ee')
>>> m.start(1)
1
>>> m.end(1)
7
>>> m.span(1)
(1, 7)

注意：有多个符合某个编组的，编组只会定位在最后一个

>>>m=match('.*(c|C).*','aaaacCaaaaaa')
>>>m.group(1)
'C'

4.替换中的组号和函数

>>> emphasis_pattern = re.compile(r''' 
... \*          # 起始突出标志——一个星号
... (           # 与要突出的内容匹配的编组的起始位置
... [^\*]+      # 与除星号外的其他字符都匹配（在集合里的脱字符是排除）
... )           # 编组到此结束
... \*          # 结束突出标志
... ''', re.VERBOSE) #写成多行使得表达式更容易理解
#>>>emphasis_pattern = r'\*([^\*]+)\*'
>>> re.sub(emphasis_pattern, r'\1', 'Hello, *world*!')#\1是编组号代替world,r'\1'相当于r'world'
'Hello, world!'

>>>emphasis_pattern=r'\*([^\*]+)\*([^\*]+)\-'
>>>sub(emphasis_pattern,r'\1\2','hello,*world*python-!')
#\1表示括号编号为1的分组
'hello,worldpython!'

贪婪模式

>>>emphasis_pattern=r'\*(.+)\*' >>>sub(emphasis_pattern,r'\1','hello,*wor*ld*!') 'hello,wor*ld!'

匹配了从第一个星号到最后一个星号的全部内容，其中包含另外一个星号！这就是贪婪的意思：能匹配多少就匹配多少。
避免过度贪婪，输了使用之前的脱字符集，还可以使用重复运算符的非贪婪版。对于所有的重复运算符，都可在后面加上问号来将其指定为非贪婪的。

>>>em_pa=r'\*(.+?)\*' >>>sub(em_pa,r'\1','hello,*wor*ld*kk*!')#*wor*和*kk*都满足，都能匹配，因此wor和kk各自成为匹配字段的group（1） 'hello,worldkk!'

然而，字符传中需要符合em_pa模式的子串需要完整地出现（这里是一对*，可以使2对*，3颗*的剩余一颗匹配不出来）

em_pa=r'\*(.+?)\*' sub(em_pa,r'\1','hello,*wor*ld*!') 'hello,world*!'#第3个*没法匹配

补充：匹配模式
参考：https://www.cnblogs.com/feifeifeisir/p/10627474.html

修饰符描述

re.I 使匹配对大小写不敏感

re.L 做本地化识别（locale-aware）匹配

re.M 多行匹配，影响 ^ 和 $

re.S 使 . 匹配包括换行在内的所有字符

re.U 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.

re.X 该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。

5.找出发件人

CASE1 发件人Foo Fie
以文本格式存储的邮件，要从中找到发件人Foo Fie，找到关键句
From: Foo Fie
正则表达式
From: (.*) <.*?>$#？非贪婪模式
要输出的是括号里面的，即print(group(1))
代码如下

# find_sender.py import fileinput,re#用fileinput查找每一行 pat=e.complie(‘from: (.*?) <.*?>$’)#compile编译正则表达式提高效率 For line in fileinput.input(): m = pat.match(line) If m:#match从头匹配 Print(m.group(1))

运行命令

>>>python find_sender.py message.eml Foo Fie

CASE2 找到所有邮箱
邮箱的基本格式：
[email protected]
正则表达式：
r'[a-z\-\.]+@[a-z\-\.]+'
代码：

import fileinput,re pat = re.compile(r'[a-z\-\.]+@[a-z\-\.]+', re.IGNORECASE) for line in fileinput.input(): for address in pat.findall(line): print(address,fileinput.lineno()) #fileinput.lineno()识别行号

这样就逐行把文档中的邮箱提取出来了，有重复项并且无序，因此,可以利用集合的特点，将符合条件的元素放入有个新的集合中，打印这个集合

import fileinput, re pat = re.compile(r'[a-z\-\.]+@[a-z\-\.]+', re.IGNORECASE) addresses = set() for line in fileinput.input(): for address in pat.findall(line): addresses.add(address) for address in sorted(addresses): print address

这样打印出来的元素是没有重复且有序的（大写排在小写前面）
Notice:这里使用集合set不用列表，集合对于一样的元素值存在一个，相当于自动去重

6.模板系统演示

模板（template）是一种文件，可在其中插入具体的值来得到最终的文本。
*可使用正则表达式来匹配字段并提取其内容。
*可使用eval来计算表达式字符串，并提供包含作用域的字典。可在try/except语句中执行这种操作。如果出现SyntaxError异常，就说明你处理的可能是语句（如赋值语句）而不是表达式，应使用exec来执行它。
*可使用exec来执行语句字符串（和其他语句），并将模板的作用域存储到字典中。
*可使用re.sub将被处理的字符串替换为计算得到的结果。

import fileinput, re # 与使用方括号括起的字段匹配 field_pat = re.compile(r'\[(.+?)\]') # 我们将把变量收集到这里： scope = {} # 用于调用re.sub： def replacement(match): #match是一个一个MatchObject对象 # 返回模式中与给定子模式(组)匹配的子字符串 code = match.group(1) try: # 如果字段为表达式，就返回其结果： return str(eval(code, scope)) #计算表达式，如time.asctime()，得到一个结果 except SyntaxError: # 否则在当前作用域内执行该赋值语句 exec(code,scope)#执行语句，如 import time # 并返回一个空字符串 return '' # 获取所有文本并合并成一个字符串： lines = [] for line in fileinput.input(): lines.append(line) text = ''.join(lines) #text 将读取到所有传入文件的内容 # 替换所有与字段模式匹配的内容： print(field_pat.sub(replacement, text)) #replacement函数返回经过自定义处理的text中与模式匹配的字符串 #print(re.sub(field_pat,replacement, text))

一个定义文件 magnus.txt

[name = 'Magnus Lie Hetland' ] [email = '[email protected]' ] [language = 'python' ]

一个模板文件template.txt

[import time] Dear [name], I would like to learn how to program. I hear you use the [language] language a lot -- is it something I should consider? And, by the way, is [email] your correct email address? Fooville, [time.asctime()] Oscar Frozzbozz

运行

>>>python templates.py magnus.txt template.txt

输出

Dear Magnus Lie Hetland, I would like to learn how to program. I hear you use the python language a lot -- is it something I should consider? And, by the way, is [email protected] your correct email address? Fooville Mon Jul 18 15:24:10 2016 Oscar Frozzbozz

解析：
1、text内容:
[name = ‘Magnus Lie Hetland’ ]
[email = ‘[email protected]’ ]
[language = ‘python’ ] [import time]
Dear [name],
I would like to learn how to program. I hear you use the [language] language a lot – is it something I should consider?
And, by the way, is [email] your correct email address?
Fooville, [time.asctime()]
Oscar Frozzbozz
其中前3行的4个[]都被return ‘’,因为这4个[]都被exec(code,scope)执行，它们是语句，于是输出结果中会有3行空行
2、field_pat.sub(replacement, text)
text中一共有8个[]，replacement函数其实也执行了8次
match: [name = ‘Magnus Lie Hetland’ ]
code: name = ‘Magnus Lie Hetland
match: [email = ‘[email protected]’ ]
code: email = ‘[email protected]’
match: [language = ‘python’ ]
code: language = ‘python’
match: [import time]
code: code:import time
match: [name]
code: name
match: [language]
code: language
match: [email]
code: email
match: [time.asctime()]
code: time.asctime()
sub方法使它每执行一次，替换掉一个[]，循环不重复
3、field_pat
field_pat = re.compile(r’[(.+?)]’)
其实不需要（）也可以完成最后一句

>>>field_pat=re.compile(r'\[.+?\]') >>>re.sub(field_pat,'7:00', 'Fooville, [time.asctime()]' ) 'Fooville, 7:00'

但是，field_pat还会被应用在replacement函数里面，r’[(.+?)]'里面的（）使得可以提取到[]的字符串用于计算或者执行，然而在replacement函数里面并没有提到field_pat，但match就已经是MatchObject对象了

-----------------------------------------附录----------------------------------------：

# database.py import sys, shelve def store_person(db): """ 让用户输入数据并将其存储到shelf对象中 """ pid = input('Enter unique ID number: ') person = {} person['name'] = input('Enter name: ') person['age'] = input('Enter age: ') person['phone'] = input('Enter phone number: ') db[pid] = person def lookup_person(db): """ 让用户输入ID和所需的字段，并从shelf对象中获取相应的数据 """ pid = input('Enter ID number: ') field = input('What would you like to know? (name, age, phone) ') field = field.strip().lower() print(field.capitalize() + ':', db[pid][field]) def print_help(): print('The available commands are:') print('store : Stores information about a person') print('lookup : Looks up a person from ID number') print('quit : Save changes and exit') print('? : Prints this message') def enter_command(): cmd = input('Enter command (? for help): ') cmd = cmd.strip().lower() return cmd def main(): database = shelve.open('C:\\database.dat') # 你可能想修改这个名称 try: while True: cmd = enter_command() if cmd == 'store': store_person(database) elif cmd == 'lookup': lookup_person(database) elif cmd == '?': print_help() elif cmd == 'quit': return finally: database.close() if name == '__main__': main()

修饰符	描述
re.I	使匹配对大小写不敏感
re.L	做本地化识别（locale-aware）匹配
re.M	多行匹配，影响 ^ 和 $
re.S	使 . 匹配包括换行在内的所有字符
re.U	根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.X	该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。

Python从0到100（四）：Python中的运算符介绍(补充) 是Dream呀 python java 数据库
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Python从0到100（三十五）：beautifulsoup的学习是Dream呀 Dream的茶话会 python beautifulsoup 学习
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Python基础知识9 ylfhpy Python基础 python 开发语言爬虫
1.列表推导式核心概念列表推导式（ListComprehension）是Python中基于现有可迭代对象快速生成新列表的语法结构，具有以下特点：简洁性：用单行代码替代多行循环，极大地简化了代码的编写。例如，要生成一个包含1到10的平方数的列表，使用普通循环需要多行代码，而列表推导式只需一行[x**2forxinrange(1,11)]，代码量大幅减少，编程效率显著提高。高效性：执行速度通常快于普通
Java程序员面临抉择：激烈竞争下，转行大模型或是新出路，非常详细收藏我这一篇就够了！大模型教程大模型学习学习大模型语言模型人工智能程序员转行
Java程序员转行大模型领域，可以依据以下详细路线进行学习和职业转换：第1阶段：基础知识巩固数学基础：线性代数：矩阵运算、向量空间等。概率论与统计：概率分布、统计推断等。微积分：导数、积分、多变量函数等。Python编程：Python基础：数据类型、控制结构、函数等。Python进阶：面向对象编程、装饰器、生成器等。数据处理：NumPy、Pandas、Matplotlib。第2阶段：机器学习与深度
【学习笔记】Python基础-字典Dict和Set和List与Str扩展法迪 Python基础 python hashmap Dict set list
Dict使用大括号围起来，这里提供一种键值对的list表示方法1.Dict{}2.List[]3.turple()实例代码#!/usr/bin/envpython3#-*-coding:utf-8-*-#字典dict类似Java的HashMap#Dict{}#List[]#turple()mDict={"Lava":90,"Huawei":100,"Sony":60}print(mDict['La
Python基础---Dict（字典） grace666 Python
1.字典以键值对组成，包含在{}中，字典的键必须为hashable，即不可变（字符串、元组、数字），并且唯一；值可以是任何类型#dict1={[1]:1}#报错：TypeError:unhashabletype:'list'#dict1={{1}:1}#报错：TypeError:unhashabletype:'set'dict1={(1,):1}print(dict1)#{(1,):1}dict1
为一位经验丰富的程序员量身定制Python学习路线人工智能首选语言：python Python新技术小黄人软件 chatGPT python 学习人工智能
人工智能首选语言：python必学。解释型语言(无编译这个环节)，直接执行代码，面向对象，脚本语言没基础在这里学为一位经验丰富的程序员量身定制Python学习路线，主要应关注于深化已有的编程知识和技能，并探索Python特有的高级特性。以下是推荐的学习路线：基础复习：如果对Python基础不熟悉，先从Python的基础语法、数据类型、控制流程等开始复习。高级语言特性：深入理解装饰器、上下文管理器、
【Python基础】Python闭包：如何让你的代码拥有‘读心术’？陈序不懂程序 python 服务器 apache 网络开发语言数据库学习
第1章闭包概念与背景1.1闭包定义与理论基础闭包，这一术语源自数学逻辑，如今在计算机科学中占据着核心地位，尤其在面向对象和函数式编程领域中发挥着无可替代的作用。它是一种特殊的函数对象，不仅包含自身的代码逻辑，还携带着其定义时所处环境的部分状态，即对外部自由变量的引用。这种独特的“携带状态”特性赋予了闭包强大的功能和灵活性，使其成为实现抽象、封装、数据隐藏以及控制程序执行的关键工具。1.1.1闭包的
【Python爬虫(15)】从0到1：Python爬虫实战攻克电商网站动态数据堡垒奔跑吧邓邓子 Python爬虫 python 爬虫开发语言电商网站动态数据
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、引言二、准备工作2.1环境搭建2.2目标电商网站分析三、攻克登
python程序设计案例教程胡国胜第二章答案_Python程序设计案例教程长发在船头舞蹈
章Python基础知识1.1Python简介1.1.1Python语言特点1.1.2Python版本1.1.3Python语言的实现1.1.4安装Python1.2Python开发环境1.2.1启动IDLE1.2.2Python代码编辑器1.2.3个小程序习题1第2章数据类型2.1数值2.1.1数值类型2.1.2变量章Python基础知识1.1Python简介1.1.1Python语言特点1.1.
python基础语法22-IMAP接收邮件春风抚微霞 python ssl IMAP 邮件接收 python
一、简介IMAP是一种电子邮件检索协议，它不会下载电子邮件。它只是读取它们并显示它们。这在低带宽条件下非常有用。Python的客户端库称为imaplib用于通过imap协议访问电子邮件。IMAP代表InternetMailAccessProtocol.它于1986年首次提出。1、IMAP支持的功能：(1)多个邮件文件夹，不仅仅是用户的收件箱(2)在IMAP服务器上带有存储的标记(已读、已回复、已看
【python基础】—pip与conda的区别 sodaloveer python基础 #python安装命令 python pip conda
文章目录一、pip与conda1、支持语言2、Repo源3、包的内容4、环境隔离5、依赖关系6、总结二、pipinstall与condainstall1、库的存储位置2、总结三、pipuninstall与condauninstall一、pip与conda1、支持语言pip是官方推荐的python包管理器，但是只能安装python包。conda是一个跨平台（支持linux,mac,win）的通用包和
python基础知识介绍 tqs_12345 python 开发语言
Python基础知识主要包括以下几个方面：语法基础：Python采用简洁易懂的语法，使用缩进来表示代码块。它支持多种数据类型，如整数、浮点数、字符串、列表、元组、字典和集合等。变量和数据类型：在Python中，变量不需要事先声明类型，可以根据赋值自动推断类型。Python支持多种内置数据类型，并允许用户自定义数据类型。控制流语句：Python提供了条件语句（如if-elif-else）、循环语句（
【Python爬虫(3)】解锁Python爬虫技能树：深入理解模块与包奔跑吧邓邓子 Python爬虫 python 爬虫开发语言模块包
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录引言一、模块的导入与使用1.1模块的基本概念1.2导入模块的多种方
【PyCharm的详细安装教程】局外人_Jia pycharm ide python windows linux mac
PyCharm的详细安装教程，涵盖Windows、macOS和Linux三大平台：1.下载PyCharm访问PyCharm官网。选择适合的版本：Community版：免费，适合Python基础开发。Professional版：付费，支持Web开发、数据库工具等高级功能。点击“Download”按钮下载安装包。2.Windows安装教程步骤1：运行安装程序双击下载的.exe文件。选择安装路径（默认路
【Python爬虫①】专栏开篇：夯实Python基础奔跑吧邓邓子 Python爬虫 python 爬虫开发语言基础知识
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、引言二、Python语法基础2.1变量2.2数据类型2.3运算
2月第五讲：深度剖析 Python 编程中的数据处理与机器学习应用 2501_90442144 python 机器学习开发语言
一、引言在当今数字化时代，编程已经成为推动各个领域发展的关键力量。Python作为一种高级编程语言，以其简洁、易读、功能强大等特点，在数据处理、机器学习、人工智能等众多领域得到了广泛的应用。本文将深入探讨Python在数据处理和机器学习方面的应用，通过实际案例展示其强大的功能和灵活性，帮助读者更好地理解和掌握Python编程在这些领域的应用技巧。二、Python基础概述2.1Python的特点与优
Python Flask 入门开发胖蔡 Python 编程之道 python flask 开发语言
Python基础学习：Pyhton语法基础Python变量Python控制流Python函数与类PythonException处理Python文件操作Python日期与时间PythonSocket的使用Python模块Python魔法方法与属性Flask基础学习：Python中如何选择Web开发框架？PythonFlask入门开发如何使用virtualenv实现python环境的隔离？Python
Python基础（上）索然无味io Python安全开发 python 开发语言网络 windows web安全安全网络安全
1.基础语法1.1环境安装Python版本:推荐使用Python3.6.6及以上开发工具:PyCharm1.2基本语法输出:print("HelloWorld")注释:单行注释:#注释内容（快捷键Ctrl+/）多行注释:使用三引号'''注释内容'''注意：不推荐作为正式注释。1.3变量命名规范规则:由字母、数字、下划线组成，不能以数字开头不能使用Python关键字（如if,for）区分大小写命名风
python票务系统_python基础学习：模拟火车订票系统一愫 python票务系统
2020-12-20str1=["车次","出发站-到达站","出发时间","到达时间","历时"]train_numbers=["T40","T298","Z158"]train_place=["长春-北京","哈尔滨-北京","青岛-北京"]train_outTime=["00:12","00:06","12:48"]train_arriveTime=["12:20","10:50","21:
办公自动化—VBA将csv某列数字进行以0填充为文本再接着转Excel 一晌小贪欢 Python自动化办公 excel vba 办公自动化自动化办公 csv转Excel
目录专栏导读背景效果预览步骤完整代码总结专栏导读欢迎来到Python办公自动化专栏—Python处理办公问题，解放您的双手️‍博客主页：请点击——>一晌小贪欢的博客主页求关注该系列文章专栏：请点击——>Python办公自动化专栏求订阅此外还有爬虫专栏：请点击——>Python爬虫基础专栏求订阅此外还有python基础专栏：请点击——>
Python基础入门----Python的编码规范：PEP 8介绍及基本遵循原则 redrose2100 Python从入门到进阶 python 开发语言
文章目录PEP8简介基本遵循原则1.缩进2.行宽3.空行4.导入5.空格6.命名约定7.表达式和语句中的空格8.注释9.编码声明10.文档字符串PEP8简介PEP8，或PythonEnhancementProposal8，是一个官方文档，发布于2001年。它由GuidovanRossum，Python语言的创始人，以及BarryWarsaw和NickCoghlan等社区成员共同编写。该文档提供了编
python基础入门：附录：常用第三方库推荐（NumPy、Django等）赵鑫亿 python基础入门 python numpy django
Python常用第三方库全景指南：从基础到前沿工具集一、数据科学核心套件数值计算三剑客#NumPy数组操作示例importnumpyasnparr=np.arange(1,10).reshape(3,3)print([email protected])#矩阵乘法#Pandas数据分析示例importpandasaspddf=pd.DataFrame({'A':np.random.randn(100),'B':np
python基础入门：8.1项目1：爬虫与数据分析赵鑫亿 python基础入门 python 爬虫数据分析
Python爬虫与数据分析全流程实战：从数据采集到可视化呈现#综合案例：电商价格监控分析系统importrequestsfrombs4importBeautifulSoupimportpandasaspdimportmatplotlib.pyplotasplt#配置参数HEADERS={'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)''Appl
Python——批量图片转PDF（GUI版本）一晌小贪欢 Python自动化办公 python pdf 开发语言 Python办公图片转PDF python-pdf
目录专栏导读1、背景介绍2、库的安装3、核心代码4、完整代码总结专栏导读欢迎来到Python办公自动化专栏—Python处理办公问题，解放您的双手️‍博客主页：请点击——>一晌小贪欢的博客主页求关注该系列文章专栏：请点击——>Python办公自动化专栏求订阅此外还有爬虫专栏：请点击——>Python爬虫基础专栏求订阅此外还有python基础专栏：请点击——>
【Python基础语法】defaultdict 大神神奇奇奇 python windows 开发语言
Python的defaultdict是collections模块中提供的一种特殊的字典类型，它与普通的字典（dict）有着相似的功能，但有一个关键的不同点：当访问一个不存在的键时，defaultdict不会抛出KeyError异常，而是会自动为该键创建一个默认值。这种特性使得在处理需要初始化新键的情况时更加方便。创建defaultdict要使用defaultdict，首先需要从collection
python基础实例沐阳zz pthon学习 python
1、在Python语言中，对象是通过引用传递的。在赋值时，不管这个对象是新创建的，还是一个已经存在的，都是将该对象的引用（并不是值）赋值给变量。如：x=11这个整形对象被创建，然后将这个对象的引用赋值给x这个变量2、多元赋值，其实就是元组赋值x,y,z=1,2,'string'等价于(x,y,z)=(1,2,'string')利用多元赋值实现的两个变量的值交换>>>x,y=1,2>>>x1>>>y
Python基础知识10 ylfhpy Python基础 python 开发语言爬虫
在Python编程领域，内存模型紧密围绕对象展开，一切数据，无论是数字、字符串，还是列表等复杂结构，均以对象的形式存在于内存之中。透彻理解Python对象的内存管理机制，对于编写高效、稳定且安全的代码而言，具有举足轻重的意义。接下来，让我们深入探讨Python对象内存模型的核心要点、具体示例以及拓展方向。1.对象的基本属性Python对象具备三个至关重要的核心属性：标识（Identity）：这是用
谈谈你了解的python_GitHub - hutianli/python_interview_question: 关于python的面试题 weixin_39639686 谈谈你了解的python
Python基础1、文件操作1.1、有一个jsonline格式的文件file.txt大小约为10K1.2、补充缺失的代码？2、模块与包2.1输入日期，判断这一天是这一年的第几天？2.2打乱一个排好序的list对象alist？3、数据类型3.1、现有字典d={‘a’:24，‘g’:52，‘i’:12，‘k’:33}请按value值进行3.2、字典推导式？3.3、请反转字符串“aStr”?3.4、将字
python基础语法--1 石迹耿千秋 python_learning python 开发语言
目录python基础语法1.python保留字2.python多行语句2.1反斜杠\2.2括号[]3.数字类型4.字符串5.等待用户输入&空行6.print输出7.import&from······import8.介绍sys模块8.1`sys`模块的一些常用功能：8.2示例代码：python基础语法1.python保留字>>>importkeyword>>>keyword.kwlist['Fals
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一

[Python]第十章 开箱即用