python常用模块
1 日期和时间模块
Python的日期和时间计算都是从1970年1月1日午夜(历元)经过了多长时间来表示,时间间隔是以秒为单位的浮点小数。
1.1 time模块
从返回浮点数的时间戳方式向时间元组转换,只要将浮点数传递给如localtime之类的函数。
import time
print(time.time())
print(time.localtime())
print(time.asctime())
print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()))
1583294824.994
time.struct_time(tm_year=2020, tm_mon=3, tm_mday=4, tm_hour=12, tm_min=7, tm_sec=4, tm_wday=2, tm_yday=64, tm_isdst=0)
Wed Mar 4 12:07:04 2020
2020-03-04 12:07:04
- time.time():时间戳单位:s (最适合做日期运算)
- time.localitme():获取当前时间
- time.asctime():获取格式化时间(西方习惯,其中日期和星期都是英文)
- time.strftime(format[, t]):按照指定格式显示日期
格式字符串: - %y:两位数的年份表示(00-99)
- %Y:四位数的年份表示(000-9999)
- %m:月份(01-12)
- %d:月内中的一天(0-31)
- %H:24小时制小时数(0-23)
- %I:12小时制小时数(01-12)
- %M:分钟数(00=59)
- %S:秒(00-59)
- %f:微秒(0-999999)
- %a:本地简化星期名称
- %A:本地完整星期名称
- %b:本地简化的月份名称
- %B:本地完整的月份名称
- %c:本地相应的日期表示和时间表示
- %j:年内的一天(001-366)
- %p:本地A.M.或P.M.的等价符
- %U:一年中的星期数(00-53)星期天为星期的开始
- %w:星期(0-6),星期天为星期的开始
- %W 一年中的星期数(00-53)星期一为星期的开始
- %x:本地相应的日期表示
- %X:本地相应的时间表示
- %Z:当前时区的名称
- %%:%号本身
1.2 datetime模块
1.2.1 date类
date对象由year年份,month月份,day日期三部分构成
from datetime import date
d = date(2019,10,25)
print(d)
2019-10-25
date对象重写了__str__()方法,可以直接打印。
date还可以进行日期的比较
方法 | 作用 | 语法 |
---|---|---|
__eq__ | 等于(x == y) | x.__eq__(y) |
__ge__ | 大于等于(x >= y) | x.__ge__(y) |
__gt__ | 大于(x > y) | x.__gt__(y) |
__le__ | 小于等于(x <= y) | x.__le__(y) |
__lt__ | 小于(x < y) | x.__lt__(y) |
__ne__ | 不等于(x != y) | x.__ne__(y) |
from datetime import date
d = date(2019,10,25)
print(d)
d1 = date(2020,3,6)
print(d1)
print(d.__lt__(d1))
print(d.__ge__(d1))
2019-10-25
2020-03-06
True
False
- __sub__():获取两个日期之间相差多少天
from datetime import date
d = date(2019,10,25)
print(d)
d1 = date(2020,3,6)
print(d1)
print(d1.__sub__(d))
2019-10-25
2020-03-06
133 days, 0:00:00
- __format__ ():返回指定格式的日期字符串
from datetime import date
d = date(2019,10,25)
print(d)
d1 = date(2020,3,6)
print(d1)
print(d1.__format__("%Y %m %d"))
2019-10-25
2020-03-06
2020 03 06
- __str__():简单格式字符串
from datetime import date
d = date(2019,10,25)
print(d)
d1 = date(2020,3,6)
print(d1)
print(d1.__str__())
2019-10-25
2020-03-06
2020-03-06
date类中改写了__str__()方法,可以直接打印。
1.2.2 time类
time类由hour小时、minute分钟、second秒、microsecond微秒和tzinfo五部分组成。
from datetime import time
t = time(12,30,21,9998)
print(t.hour)
print(t.minute)
print(t.second)
print(t.microsecond)
print(t.tzinfo)
print(t.__format__("%H:%M:%S"))
print(t)
12
30
21
9998
None
12:30:21
12:30:21.009998
其中tzinfo是关于时区信息的类。
1.2.3 datetime类
datetime类其实是可以看做是date类和time类的合体,其大部分的方法和属性都继承于这二个类。
from datetime import datetime
dt = datetime(2017, 3, 22, 16, 9, 33, 494248)
print(dt)
print(datetime.now())
print(dt.timestamp())
print(dt.strftime("%Y-%m-%d %H:%M:%S:%f"))
print(datetime.strptime("2017-11-12 13:21:22:012345","%Y-%m-%d %H:%M:%S:%f"))
2017-03-22 16:09:33.494248
2020-03-07 12:24:58.591000
1490170173.494248
2017-03-22 16:09:33:494248
2017-11-12 13:21:22.012345
- now():返回系统当前时间
- timestamp():转换成时间戳
- strftime():返回指定格式字符串,实例方法
- strptime():将字符串转成datetime,类方法
1.2.4 timedelta类
能够非常方便的对时间做加减。
from datetime import datetime,timedelta
dt = datetime(2017, 3, 22, 16, 9,23,123456)
print(dt + timedelta(microseconds=30))
print(dt)
2017-03-22 16:09:23.123486
2017-03-22 16:09:23.123456
2 目录操作模块
2.1 os模块
python的os模块提供了一个统一的操作系统接口函数, 这些接口函数通常是平台指定的,os 模块能在不同操作系统平台(如 nt或 posix)中的特定函数间自动切换,从而能实现跨平台操作。
# os 模块
import os
print(os.path.dirname("E:/Read_File/read_yaml.py"))#获取指定文件的目录
print(os.path.abspath(".."))#获取指定文件的绝对路径
print(os.getcwd())#获取当前工作目录,即当前Python脚本工作的目录路径
os.chdir("C:/Users/laijie/python基础_补")#改变当前脚本工作目录
print(os.getcwd())
print(os.pardir)#返回当前目录的父目录('..')
print(os.name)#获取当前使用的操作系统类型简称
print(os.path.join("C:","Users","test.py"))#路径拼接,因为不同操作系统分隔符不同,不要直接拼接字符串路径
print(os.path.split("C:\\Users\\laiajie\\test2.py"))#路径拆分
print(os.path.splitext("C:\\Users\\test3.doc"))#直接获取文件扩展名
#os.rename("test.txt","test.doc")#文件重命名
os.remove("test.doc")
# 显示指定文件夹下的所有文件
print(os.listdir("./"))
#遍历文件夹下的文件
for filename in os.listdir('./'):
print(filename)
#判断文件是否存在
print(os.path.isfile('test.doc'))
# 判断目录是否存在
print(os.path.exists("C:\\Users"))
# 判断目录是否存在
print(os.path.isdir("C:\\Users"))
E:/Read_File
C:\Users\laijie
C:\Users\laijie\AI_neuedu
C:\Users\laijie\python基础_补
..
nt
C:Users\test.py
('C:\Users\laiajie', 'test2.py')
('C:\Users\test3', '.doc')
['.ipynb_checkpoints', 'afternoon_1.ipynb', 'evening_2.ipynb']
.ipynb_checkpoints
afternoon_1.ipynb
evening_2.ipynb
True
True
True
os模块提供了很多对文件的操作,有的地方需要注意一下:
- os.chdir():换的是工作目录,文件还在原处
- os.name():nt代表的是windows,posix代表linux
- os.pardir():返回的是当前目录的父目录,
..
代表当前目录的上一级目录,.
代表当前目录。 - os.path.join():默认盘符不加
\
直接连接,其余每一级路径处都会加\
- windows下的目录分隔符是
\
,写成字符串的时候要写成\\
,否则会和后一个字符构成转义字符而造成的错误,但是linux下的目录分隔符是/
,不用改变。 - os.listdir():返回的是一个列表。
2.2 glob模块和shutil模块
glob模块和shutil模块也是对文件操作的模块,可以和os模块一起使用,作为os模块的辅助模块。
import glob,shutil
#遍历且过滤文件
for fi in glob.glob("*.doc"):
print(fi)
#复制文件
shutil.copyfile("test.doc","test.py")
test.doc
'test.py'
3 random模块
import random
print(random.randint(1,5))#返回a和b之间的随机整数(不包括b)
print(random.random())#返回0到1之间随机数(不包括1)
print(random.choice([1,2,3,4,8,44,67,213,56]))#在不为空的序列中随机选择一个元素
print(random.sample([1,4,2,6,8,4,6,9,3], 9))#在一个序列或者集合中选择k个随机元素,返回由K个元素组成新的列表;(k的值小于等于序列或者集合的长度)
print(random.uniform(123,123))#产生一个指定范围内的随机浮点数(包括b)
print(random.randrange(23,28,5))#以step为步长随机选择一个数(不包括b)
#将列表顺序打断,不生成新的数组而是在原有的数组上操作
ls = [1,2,3,4,5,6]
random.shuffle(ls)
print(ls)
print(random.shuffle([1,2,3,4,5,6,7,8,9]))
5
0.11554898887646914
44
[3, 6, 2, 4, 4, 9, 1, 8, 6]
123.0
23
[3, 6, 5, 2, 1, 4]
None
4 collections模块
4.1 defaultdict类
dict子类调用工厂函数来提供缺失值,当查询的值不存在时不会报错,而是显示之前设置的默认值。
from collections import defaultdict
person = {"name":"hahaha","age":20,"addr":"qinhuangdao"}
#print(person["sex"])
def print_default():
print("Key Not Found")
person1 = defaultdict(lambda : "Key Not Found")
person1["name"] = "lihua"
print(person1['zhangsan'])
Key Not Found
defaultdict()中的参数比较建议用lambda定义,这样比较方便。首先应该建立一个空的defaultdict,再将需要的元素添加进去,此时查询不存在的元素就会返回默认值。其实最根本的原因在于当创建defaultdict时,首先传递的参数是所有key的默认value值,之后添加键值对进去的时候才会有所改变,当最终查询时,如果key存在,那就输出对应的value值,如果不存在,就会输出事先规定好的值。
d = defaultdict(list)
d['person'].append("xiaoming")
d['city'].append("paris")
d['person'].append("student")
print(d)
defaultdict(
, {'person': ['xiaoming', 'student'], 'city': ['paris']})
默认所有key对应的是一个list,自然就可以在赋值时使用list的append()方法了。
4.2 Counter类
Counter用于计算可哈希对象的dict子类。Counter是无序集合,其中元素及其各自的计数存储为字典,key就是出现的元素,value就是该元素出现的次数。Counter一般不会用于dict和set的计数,因为dict的key是唯一的,而set本身就不能有重复元素。
from collections import Counter
count_list = Counter(['a','a','b','d','c','e','e','e',"k",'l','o'])
print(count_list)
Counter({'e': 3, 'a': 2, 'b': 1, 'd': 1, 'c': 1, 'k': 1, 'l': 1, 'o': 1})
4.3 deque类
deque可以对容器的两端进行快读的添加和移除,是类似于列表的容器,但效率更快。操作和list方法相同,支持切片。
from collections import deque
d = deque()
print(d)
d.append(1)
d.append(2)
d.extend([4,2,5,8,6,9])
print(d)
print(d.popleft())#从最左端删除元素
print(d.pop())#从最右端删除元素
print(d)
d.append(100)#从最右端添加元素
d.appendleft(200)#从最左端添加元素
print(d)
deque([])
deque([1, 2, 4, 2, 5, 8, 6, 9])
1
9
deque([2, 4, 2, 5, 8, 6])
deque([200, 2, 4, 2, 5, 8, 6, 100])
4.4 namedtuple类
用于创建具有命名字段的tuple子类的工厂函数
from collections import namedtuple
Person = namedtuple('Person','name age city')
xiaobai = Person(name="xiaobai",age=18,city="paris")
print(xiaobai)
Person(name='xiaobai', age=18, city='paris')
命名元组的第一个参数是元组名,第二个参数是元组中域的名字。注意:定义命名元素的时,属性值不能缺失;不能修改属性的信息。且为了表意明确,最好将实例化的元组名和参数中的元组名设置为一样。
4.5 OrderedDict类
OrderedDict可以记录插入dict的key和value的顺序。
from collections import OrderedDict
d = OrderedDict()
d['a'] = 1
d['b'] = 2
d['c'] = 3
d['d'] = 4
print(d)
OrderedDict([('a', 1), ('b', 2), ('c', 3), ('d', 4)])
可以看到,OrderedDict是将
各个元素存为列表,列表中的每个元素就是一个元组。
5 pickle模块
序列化和反序列化:在程序运行的过程中,所有的变量都是在内存中。可以随时修改变量,但是一旦程序结束,变量所占用的内存就被操作系统全部回收。如果没有把修改后的值存储到磁盘上,下次重新运行程序,变量还是原来的值。我们把变量从内存中变成可存储或传输的过程称之为序列化,在Python中叫pickling,在其他语言中也被称之为serialization,marshalling,flattening等等,都是一个意思。序列化之后,就可以把序列化后的内容写入磁盘,或者通过网络传输到别的机器上。反过来,把变量内容从序列化的对象重新读到内存里称之为反序列化,即unpickling。
pickle模块的特点:
- 只能在python中使用,只支持python的基本数据类型。
- 可以处理复杂的序列化语法。(例如自定义的类的方法,游戏的存档等)
5.1 内存中操作
dumps方法将对象转成字节(序列化) loads方法将字节还原为对象(反序列化)
import pickle
li = [11,22,33]
r = pickle.dumps(li)
print(r)
result = pickle.loads(r)
print(result)
b'\x80\x03]q\x00(K\x0bK\x16K!e.'
[11, 22, 33]
5.2 文件中操作
import pickle
li = [11,22,33]
pickle.dump(li,open("test.doc","wb"))
result = pickle.load(open("test.doc","rb"))
print(result)
[11, 22, 33]
可以在序列化的代码外面加上try-except语句,因为序列化的过程中很容易出错。注意:文件操作中的函数是dump()和load(),和内存操作中的不同。