python常用模块

1 日期和时间模块

Python的日期和时间计算都是从1970年1月1日午夜（历元）经过了多长时间来表示，时间间隔是以秒为单位的浮点小数。

1.1 time模块

time模块

从返回浮点数的时间戳方式向时间元组转换，只要将浮点数传递给如localtime之类的函数。

import time


print(time.time())
print(time.localtime())
print(time.asctime())
print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()))

1583294824.994
time.struct_time(tm_year=2020, tm_mon=3, tm_mday=4, tm_hour=12, tm_min=7, tm_sec=4, tm_wday=2, tm_yday=64, tm_isdst=0)
Wed Mar 4 12:07:04 2020
2020-03-04 12:07:04

time.time()：时间戳单位：s （最适合做日期运算）
time.localitme()：获取当前时间
time.asctime()：获取格式化时间(西方习惯，其中日期和星期都是英文)
time.strftime(format[, t])：按照指定格式显示日期
格式字符串:
%y：两位数的年份表示（00-99）
%Y：四位数的年份表示（000-9999）
%m：月份（01-12）
%d：月内中的一天（0-31）
%H：24小时制小时数（0-23）
%I：12小时制小时数（01-12）
%M：分钟数（00=59）
%S：秒（00-59）
%f：微秒(0-999999)
%a：本地简化星期名称
%A：本地完整星期名称
%b：本地简化的月份名称
%B：本地完整的月份名称
%c：本地相应的日期表示和时间表示
%j：年内的一天（001-366）
%p：本地A.M.或P.M.的等价符
%U：一年中的星期数（00-53）星期天为星期的开始
%w：星期（0-6），星期天为星期的开始
%W 一年中的星期数（00-53）星期一为星期的开始
%x：本地相应的日期表示
%X：本地相应的时间表示
%Z：当前时区的名称
%%：%号本身

1.2 datetime模块

datetime模块

1.2.1 date类

date对象由year年份，month月份，day日期三部分构成

from datetime import date
d = date(2019,10,25)
print(d)

2019-10-25

date对象重写了__str__()方法，可以直接打印。
date还可以进行日期的比较

方法	作用	语法
__eq__	等于(x == y)	x.__eq__(y)
__ge__	大于等于(x >= y)	x.__ge__(y)
__gt__	大于(x > y)	x.__gt__(y)
__le__	小于等于(x <= y)	x.__le__(y)
__lt__	小于(x < y)	x.__lt__(y)
__ne__	不等于(x != y)	x.__ne__(y)

from datetime import date
d = date(2019,10,25)
print(d)

d1 = date(2020,3,6)
print(d1)

print(d.__lt__(d1))
print(d.__ge__(d1))

2019-10-25
2020-03-06
True
False

__sub__()：获取两个日期之间相差多少天

from datetime import date
d = date(2019,10,25)
print(d)

d1 = date(2020,3,6)
print(d1)

print(d1.__sub__(d))

2019-10-25
2020-03-06
133 days, 0:00:00

__format__ ()：返回指定格式的日期字符串

from datetime import date
d = date(2019,10,25)
print(d)

d1 = date(2020,3,6)
print(d1)

print(d1.__format__("%Y %m %d"))

2019-10-25
2020-03-06
2020 03 06

__str__()：简单格式字符串

from datetime import date
d = date(2019,10,25)
print(d)

d1 = date(2020,3,6)
print(d1)

print(d1.__str__())

2019-10-25
2020-03-06
2020-03-06

date类中改写了__str__()方法，可以直接打印。

1.2.2 time类

time类由hour小时、minute分钟、second秒、microsecond微秒和tzinfo五部分组成。

from datetime import time

t = time(12,30,21,9998)

print(t.hour)
print(t.minute)
print(t.second)
print(t.microsecond)
print(t.tzinfo)

print(t.__format__("%H:%M:%S"))

print(t)

12
30
21
9998
None
12:30:21
12:30:21.009998

其中tzinfo是关于时区信息的类。

1.2.3 datetime类

datetime类其实是可以看做是date类和time类的合体，其大部分的方法和属性都继承于这二个类。

from datetime import datetime

dt = datetime(2017, 3, 22, 16, 9, 33, 494248)
print(dt)

print(datetime.now())
print(dt.timestamp())
print(dt.strftime("%Y-%m-%d  %H:%M:%S:%f"))
print(datetime.strptime("2017-11-12 13:21:22:012345","%Y-%m-%d %H:%M:%S:%f"))

2017-03-22 16:09:33.494248
2020-03-07 12:24:58.591000
1490170173.494248
2017-03-22 16:09:33:494248
2017-11-12 13:21:22.012345

now()：返回系统当前时间
timestamp()：转换成时间戳
strftime()：返回指定格式字符串,实例方法
strptime()：将字符串转成datetime，类方法

1.2.4 timedelta类

能够非常方便的对时间做加减。

from datetime import datetime,timedelta

dt = datetime(2017, 3, 22, 16, 9,23,123456)
print(dt + timedelta(microseconds=30))
print(dt)

2017-03-22 16:09:23.123486
2017-03-22 16:09:23.123456

2 目录操作模块

2.1 os模块

python的os模块提供了一个统一的操作系统接口函数, 这些接口函数通常是平台指定的，os 模块能在不同操作系统平台（如 nt或 posix）中的特定函数间自动切换,从而能实现跨平台操作。

# os 模块
import os
print(os.path.dirname("E:/Read_File/read_yaml.py"))#获取指定文件的目录
print(os.path.abspath(".."))#获取指定文件的绝对路径
print(os.getcwd())#获取当前工作目录，即当前Python脚本工作的目录路径
os.chdir("C:/Users/laijie/python基础_补")#改变当前脚本工作目录
print(os.getcwd())
print(os.pardir)#返回当前目录的父目录（'..'）
print(os.name)#获取当前使用的操作系统类型简称
print(os.path.join("C:","Users","test.py"))#路径拼接,因为不同操作系统分隔符不同，不要直接拼接字符串路径
print(os.path.split("C:\\Users\\laiajie\\test2.py"))#路径拆分
print(os.path.splitext("C:\\Users\\test3.doc"))#直接获取文件扩展名
#os.rename("test.txt","test.doc")#文件重命名
os.remove("test.doc")
# 显示指定文件夹下的所有文件
print(os.listdir("./"))
#遍历文件夹下的文件
for filename in os.listdir('./'):
    print(filename)
#判断文件是否存在
print(os.path.isfile('test.doc'))
# 判断目录是否存在
print(os.path.exists("C:\\Users"))
# 判断目录是否存在
print(os.path.isdir("C:\\Users"))

E:/Read_File
C:\Users\laijie
C:\Users\laijie\AI_neuedu
C:\Users\laijie\python基础_补
..
nt
C:Users\test.py
('C:\Users\laiajie', 'test2.py')
('C:\Users\test3', '.doc')
['.ipynb_checkpoints', 'afternoon_1.ipynb', 'evening_2.ipynb']
.ipynb_checkpoints
afternoon_1.ipynb
evening_2.ipynb
True
True
True

os模块提供了很多对文件的操作，有的地方需要注意一下：

os.chdir()：换的是工作目录，文件还在原处
os.name()：nt代表的是windows，posix代表linux
os.pardir():返回的是当前目录的父目录，..代表当前目录的上一级目录，.代表当前目录。
os.path.join()：默认盘符不加\直接连接，其余每一级路径处都会加\
windows下的目录分隔符是\，写成字符串的时候要写成\\，否则会和后一个字符构成转义字符而造成的错误，但是linux下的目录分隔符是/，不用改变。
os.listdir()：返回的是一个列表。

2.2 glob模块和shutil模块

glob模块和shutil模块也是对文件操作的模块，可以和os模块一起使用，作为os模块的辅助模块。

import glob,shutil

#遍历且过滤文件
for fi in glob.glob("*.doc"):
    print(fi)
#复制文件
shutil.copyfile("test.doc","test.py")

test.doc

'test.py'

3 random模块

import random
print(random.randint(1,5))#返回a和b之间的随机整数(不包括b)
print(random.random())#返回０到１之间随机数（不包括1）
print(random.choice([1,2,3,4,8,44,67,213,56]))#在不为空的序列中随机选择一个元素
print(random.sample([1,4,2,6,8,4,6,9,3], 9))#在一个序列或者集合中选择k个随机元素，返回由K个元素组成新的列表；（k的值小于等于序列或者集合的长度）
print(random.uniform(123,123))#产生一个指定范围内的随机浮点数（包括b）
print(random.randrange(23,28,5))#以step为步长随机选择一个数（不包括b）
#将列表顺序打断，不生成新的数组而是在原有的数组上操作
ls = [1,2,3,4,5,6]
random.shuffle(ls)
print(ls)

print(random.shuffle([1,2,3,4,5,6,7,8,9]))

5
0.11554898887646914
44
[3, 6, 2, 4, 4, 9, 1, 8, 6]
123.0
23
[3, 6, 5, 2, 1, 4]
None

4 collections模块

4.1 defaultdict类

dict子类调用工厂函数来提供缺失值，当查询的值不存在时不会报错，而是显示之前设置的默认值。

from collections import defaultdict

person = {"name":"hahaha","age":20,"addr":"qinhuangdao"}
#print(person["sex"])

def print_default():
    print("Key Not Found")

person1 = defaultdict(lambda : "Key Not Found")
person1["name"] = "lihua"
print(person1['zhangsan'])

Key Not Found

defaultdict()中的参数比较建议用lambda定义，这样比较方便。首先应该建立一个空的defaultdict，再将需要的元素添加进去，此时查询不存在的元素就会返回默认值。其实最根本的原因在于当创建defaultdict时，首先传递的参数是所有key的默认value值，之后添加键值对进去的时候才会有所改变，当最终查询时，如果key存在，那就输出对应的value值，如果不存在，就会输出事先规定好的值。

d = defaultdict(list)
d['person'].append("xiaoming")
d['city'].append("paris")
d['person'].append("student")
print(d)

defaultdict(, {'person': ['xiaoming', 'student'], 'city': ['paris']})

默认所有key对应的是一个list，自然就可以在赋值时使用list的append()方法了。

4.2 Counter类

Counter用于计算可哈希对象的dict子类。Counter是无序集合，其中元素及其各自的计数存储为字典，key就是出现的元素，value就是该元素出现的次数。Counter一般不会用于dict和set的计数，因为dict的key是唯一的，而set本身就不能有重复元素。

from collections import Counter
count_list = Counter(['a','a','b','d','c','e','e','e',"k",'l','o'])
print(count_list)

Counter({'e': 3, 'a': 2, 'b': 1, 'd': 1, 'c': 1, 'k': 1, 'l': 1, 'o': 1})

4.3 deque类

deque可以对容器的两端进行快读的添加和移除，是类似于列表的容器，但效率更快。操作和list方法相同，支持切片。

from collections import deque
d = deque()
print(d)
d.append(1)
d.append(2)
d.extend([4,2,5,8,6,9])
print(d)
print(d.popleft())#从最左端删除元素
print(d.pop())#从最右端删除元素
print(d)
d.append(100)#从最右端添加元素
d.appendleft(200)#从最左端添加元素
print(d)

deque([])
deque([1, 2, 4, 2, 5, 8, 6, 9])
1
9
deque([2, 4, 2, 5, 8, 6])
deque([200, 2, 4, 2, 5, 8, 6, 100])

4.4 namedtuple类

用于创建具有命名字段的tuple子类的工厂函数

from collections import namedtuple
Person = namedtuple('Person','name age city')
xiaobai = Person(name="xiaobai",age=18,city="paris")
print(xiaobai)

Person(name='xiaobai', age=18, city='paris')

命名元组的第一个参数是元组名，第二个参数是元组中域的名字。注意：定义命名元素的时，属性值不能缺失；不能修改属性的信息。且为了表意明确，最好将实例化的元组名和参数中的元组名设置为一样。

4.5 OrderedDict类

OrderedDict可以记录插入dict的key和value的顺序。

from collections import OrderedDict
d = OrderedDict()
d['a'] = 1
d['b'] = 2
d['c'] = 3
d['d'] = 4
print(d)

OrderedDict([('a', 1), ('b', 2), ('c', 3), ('d', 4)])

可以看到，OrderedDict是将
各个元素存为列表，列表中的每个元素就是一个元组。

5 pickle模块

序列化和反序列化：在程序运行的过程中，所有的变量都是在内存中。可以随时修改变量，但是一旦程序结束，变量所占用的内存就被操作系统全部回收。如果没有把修改后的值存储到磁盘上，下次重新运行程序，变量还是原来的值。我们把变量从内存中变成可存储或传输的过程称之为序列化，在Python中叫pickling，在其他语言中也被称之为serialization，marshalling，flattening等等，都是一个意思。序列化之后，就可以把序列化后的内容写入磁盘，或者通过网络传输到别的机器上。反过来，把变量内容从序列化的对象重新读到内存里称之为反序列化，即unpickling。
pickle模块的特点：

只能在python中使用，只支持python的基本数据类型。
可以处理复杂的序列化语法。（例如自定义的类的方法，游戏的存档等）

5.1 内存中操作

dumps方法将对象转成字节（序列化） loads方法将字节还原为对象（反序列化）

import pickle 
li = [11,22,33]
r = pickle.dumps(li)
print(r)

result = pickle.loads(r)
print(result)

b'\x80\x03]q\x00(K\x0bK\x16K!e.'
[11, 22, 33]

5.2 文件中操作

import pickle 
li = [11,22,33]
pickle.dump(li,open("test.doc","wb"))

result = pickle.load(open("test.doc","rb"))
print(result)

[11, 22, 33]

可以在序列化的代码外面加上try-except语句，因为序列化的过程中很容易出错。注意：文件操作中的函数是dump()和load()，和内存操作中的不同。

day9