day9

python常用模块

1 日期和时间模块

   Python的日期和时间计算都是从1970年1月1日午夜(历元)经过了多长时间来表示,时间间隔是以秒为单位的浮点小数。

1.1 time模块

time模块

   从返回浮点数的时间戳方式向时间元组转换,只要将浮点数传递给如localtime之类的函数。

import time


print(time.time())
print(time.localtime())
print(time.asctime())
print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()))

1583294824.994
time.struct_time(tm_year=2020, tm_mon=3, tm_mday=4, tm_hour=12, tm_min=7, tm_sec=4, tm_wday=2, tm_yday=64, tm_isdst=0)
Wed Mar 4 12:07:04 2020
2020-03-04 12:07:04

  • time.time():时间戳单位:s (最适合做日期运算)
  • time.localitme():获取当前时间
  • time.asctime():获取格式化时间(西方习惯,其中日期和星期都是英文)
  • time.strftime(format[, t]):按照指定格式显示日期
    格式字符串:
  • %y:两位数的年份表示(00-99)
  • %Y:四位数的年份表示(000-9999)
  • %m:月份(01-12)
  • %d:月内中的一天(0-31)
  • %H:24小时制小时数(0-23)
  • %I:12小时制小时数(01-12)
  • %M:分钟数(00=59)
  • %S:秒(00-59)
  • %f:微秒(0-999999)
  • %a:本地简化星期名称
  • %A:本地完整星期名称
  • %b:本地简化的月份名称
  • %B:本地完整的月份名称
  • %c:本地相应的日期表示和时间表示
  • %j:年内的一天(001-366)
  • %p:本地A.M.或P.M.的等价符
  • %U:一年中的星期数(00-53)星期天为星期的开始
  • %w:星期(0-6),星期天为星期的开始
  • %W 一年中的星期数(00-53)星期一为星期的开始
  • %x:本地相应的日期表示
  • %X:本地相应的时间表示
  • %Z:当前时区的名称
  • %%:%号本身

1.2 datetime模块

datetime模块

1.2.1 date类

   date对象由year年份,month月份,day日期三部分构成

from datetime import date
d = date(2019,10,25)
print(d)

2019-10-25

  1. date对象重写了__str__()方法,可以直接打印。

  2. date还可以进行日期的比较

方法 作用 语法
__eq__ 等于(x == y) x.__eq__(y)
__ge__ 大于等于(x >= y) x.__ge__(y)
__gt__ 大于(x > y) x.__gt__(y)
__le__ 小于等于(x <= y) x.__le__(y)
__lt__ 小于(x < y) x.__lt__(y)
__ne__ 不等于(x != y) x.__ne__(y)
from datetime import date
d = date(2019,10,25)
print(d)

d1 = date(2020,3,6)
print(d1)

print(d.__lt__(d1))
print(d.__ge__(d1))

2019-10-25
2020-03-06
True
False

  1. __sub__():获取两个日期之间相差多少天
from datetime import date
d = date(2019,10,25)
print(d)

d1 = date(2020,3,6)
print(d1)

print(d1.__sub__(d))

2019-10-25
2020-03-06
133 days, 0:00:00

  1. __format__ ():返回指定格式的日期字符串
from datetime import date
d = date(2019,10,25)
print(d)

d1 = date(2020,3,6)
print(d1)

print(d1.__format__("%Y %m %d"))

2019-10-25
2020-03-06
2020 03 06

  1. __str__():简单格式字符串
from datetime import date
d = date(2019,10,25)
print(d)

d1 = date(2020,3,6)
print(d1)

print(d1.__str__())

2019-10-25
2020-03-06
2020-03-06

   date类中改写了__str__()方法,可以直接打印。

1.2.2 time类

   time类由hour小时、minute分钟、second秒、microsecond微秒和tzinfo五部分组成。

from datetime import time

t = time(12,30,21,9998)

print(t.hour)
print(t.minute)
print(t.second)
print(t.microsecond)
print(t.tzinfo)

print(t.__format__("%H:%M:%S"))

print(t)

12
30
21
9998
None
12:30:21
12:30:21.009998

   其中tzinfo是关于时区信息的类。

1.2.3 datetime类

   datetime类其实是可以看做是date类和time类的合体,其大部分的方法和属性都继承于这二个类。

from datetime import datetime

dt = datetime(2017, 3, 22, 16, 9, 33, 494248)
print(dt)

print(datetime.now())
print(dt.timestamp())
print(dt.strftime("%Y-%m-%d  %H:%M:%S:%f"))
print(datetime.strptime("2017-11-12 13:21:22:012345","%Y-%m-%d %H:%M:%S:%f"))

2017-03-22 16:09:33.494248
2020-03-07 12:24:58.591000
1490170173.494248
2017-03-22 16:09:33:494248
2017-11-12 13:21:22.012345

  • now():返回系统当前时间
  • timestamp():转换成时间戳
  • strftime():返回指定格式字符串,实例方法
  • strptime():将字符串转成datetime,类方法

1.2.4 timedelta类

   能够非常方便的对时间做加减。

from datetime import datetime,timedelta

dt = datetime(2017, 3, 22, 16, 9,23,123456)
print(dt + timedelta(microseconds=30))
print(dt)

2017-03-22 16:09:23.123486
2017-03-22 16:09:23.123456

2 目录操作模块

2.1 os模块

   python的os模块提供了一个统一的操作系统接口函数, 这些接口函数通常是平台指定的,os 模块能在不同操作系统平台(如 nt或 posix)中的特定函数间自动切换,从而能实现跨平台操作。

# os 模块
import os
print(os.path.dirname("E:/Read_File/read_yaml.py"))#获取指定文件的目录
print(os.path.abspath(".."))#获取指定文件的绝对路径
print(os.getcwd())#获取当前工作目录,即当前Python脚本工作的目录路径
os.chdir("C:/Users/laijie/python基础_补")#改变当前脚本工作目录
print(os.getcwd())
print(os.pardir)#返回当前目录的父目录('..')
print(os.name)#获取当前使用的操作系统类型简称
print(os.path.join("C:","Users","test.py"))#路径拼接,因为不同操作系统分隔符不同,不要直接拼接字符串路径
print(os.path.split("C:\\Users\\laiajie\\test2.py"))#路径拆分
print(os.path.splitext("C:\\Users\\test3.doc"))#直接获取文件扩展名
#os.rename("test.txt","test.doc")#文件重命名
os.remove("test.doc")
# 显示指定文件夹下的所有文件
print(os.listdir("./"))
#遍历文件夹下的文件
for filename in os.listdir('./'):
    print(filename)
#判断文件是否存在
print(os.path.isfile('test.doc'))
# 判断目录是否存在
print(os.path.exists("C:\\Users"))
# 判断目录是否存在
print(os.path.isdir("C:\\Users"))

E:/Read_File
C:\Users\laijie
C:\Users\laijie\AI_neuedu
C:\Users\laijie\python基础_补
..
nt
C:Users\test.py
('C:\Users\laiajie', 'test2.py')
('C:\Users\test3', '.doc')
['.ipynb_checkpoints', 'afternoon_1.ipynb', 'evening_2.ipynb']
.ipynb_checkpoints
afternoon_1.ipynb
evening_2.ipynb
True
True
True

   os模块提供了很多对文件的操作,有的地方需要注意一下:

  • os.chdir():换的是工作目录,文件还在原处
  • os.name():nt代表的是windows,posix代表linux
  • os.pardir():返回的是当前目录的父目录,..代表当前目录的上一级目录,.代表当前目录。
  • os.path.join():默认盘符不加\直接连接,其余每一级路径处都会加\
  • windows下的目录分隔符是\,写成字符串的时候要写成\\,否则会和后一个字符构成转义字符而造成的错误,但是linux下的目录分隔符是/,不用改变。
  • os.listdir():返回的是一个列表。

2.2 glob模块和shutil模块

   glob模块和shutil模块也是对文件操作的模块,可以和os模块一起使用,作为os模块的辅助模块。

import glob,shutil

#遍历且过滤文件
for fi in glob.glob("*.doc"):
    print(fi)
#复制文件
shutil.copyfile("test.doc","test.py")

test.doc

'test.py'

3 random模块

import random
print(random.randint(1,5))#返回a和b之间的随机整数(不包括b)
print(random.random())#返回0到1之间随机数(不包括1)
print(random.choice([1,2,3,4,8,44,67,213,56]))#在不为空的序列中随机选择一个元素
print(random.sample([1,4,2,6,8,4,6,9,3], 9))#在一个序列或者集合中选择k个随机元素,返回由K个元素组成新的列表;(k的值小于等于序列或者集合的长度)
print(random.uniform(123,123))#产生一个指定范围内的随机浮点数(包括b)
print(random.randrange(23,28,5))#以step为步长随机选择一个数(不包括b)
#将列表顺序打断,不生成新的数组而是在原有的数组上操作
ls = [1,2,3,4,5,6]
random.shuffle(ls)
print(ls)

print(random.shuffle([1,2,3,4,5,6,7,8,9]))

5
0.11554898887646914
44
[3, 6, 2, 4, 4, 9, 1, 8, 6]
123.0
23
[3, 6, 5, 2, 1, 4]
None

4 collections模块

4.1 defaultdict类

   dict子类调用工厂函数来提供缺失值,当查询的值不存在时不会报错,而是显示之前设置的默认值。

from collections import defaultdict

person = {"name":"hahaha","age":20,"addr":"qinhuangdao"}
#print(person["sex"])

def print_default():
    print("Key Not Found")

person1 = defaultdict(lambda : "Key Not Found")
person1["name"] = "lihua"
print(person1['zhangsan'])

Key Not Found

   defaultdict()中的参数比较建议用lambda定义,这样比较方便。首先应该建立一个空的defaultdict,再将需要的元素添加进去,此时查询不存在的元素就会返回默认值。其实最根本的原因在于当创建defaultdict时,首先传递的参数是所有key的默认value值,之后添加键值对进去的时候才会有所改变,当最终查询时,如果key存在,那就输出对应的value值,如果不存在,就会输出事先规定好的值。

d = defaultdict(list)
d['person'].append("xiaoming")
d['city'].append("paris")
d['person'].append("student")
print(d)

defaultdict(, {'person': ['xiaoming', 'student'], 'city': ['paris']})

   默认所有key对应的是一个list,自然就可以在赋值时使用list的append()方法了。

4.2 Counter类

   Counter用于计算可哈希对象的dict子类。Counter是无序集合,其中元素及其各自的计数存储为字典,key就是出现的元素,value就是该元素出现的次数。Counter一般不会用于dict和set的计数,因为dict的key是唯一的,而set本身就不能有重复元素。

from collections import Counter
count_list = Counter(['a','a','b','d','c','e','e','e',"k",'l','o'])
print(count_list)

Counter({'e': 3, 'a': 2, 'b': 1, 'd': 1, 'c': 1, 'k': 1, 'l': 1, 'o': 1})

4.3 deque类

   deque可以对容器的两端进行快读的添加和移除,是类似于列表的容器,但效率更快。操作和list方法相同,支持切片。

from collections import deque
d = deque()
print(d)
d.append(1)
d.append(2)
d.extend([4,2,5,8,6,9])
print(d)
print(d.popleft())#从最左端删除元素
print(d.pop())#从最右端删除元素
print(d)
d.append(100)#从最右端添加元素
d.appendleft(200)#从最左端添加元素
print(d)

deque([])
deque([1, 2, 4, 2, 5, 8, 6, 9])
1
9
deque([2, 4, 2, 5, 8, 6])
deque([200, 2, 4, 2, 5, 8, 6, 100])

4.4 namedtuple类

   用于创建具有命名字段的tuple子类的工厂函数

from collections import namedtuple
Person = namedtuple('Person','name age city')
xiaobai = Person(name="xiaobai",age=18,city="paris")
print(xiaobai)

Person(name='xiaobai', age=18, city='paris')

   命名元组的第一个参数是元组名,第二个参数是元组中域的名字。注意:定义命名元素的时,属性值不能缺失;不能修改属性的信息。且为了表意明确,最好将实例化的元组名和参数中的元组名设置为一样。

4.5 OrderedDict类

   OrderedDict可以记录插入dict的key和value的顺序。

from collections import OrderedDict
d = OrderedDict()
d['a'] = 1
d['b'] = 2
d['c'] = 3
d['d'] = 4
print(d)

OrderedDict([('a', 1), ('b', 2), ('c', 3), ('d', 4)])

   可以看到,OrderedDict是将
各个元素存为列表,列表中的每个元素就是一个元组。

5 pickle模块

序列化和反序列化:在程序运行的过程中,所有的变量都是在内存中。可以随时修改变量,但是一旦程序结束,变量所占用的内存就被操作系统全部回收。如果没有把修改后的值存储到磁盘上,下次重新运行程序,变量还是原来的值。我们把变量从内存中变成可存储或传输的过程称之为序列化,在Python中叫pickling,在其他语言中也被称之为serialization,marshalling,flattening等等,都是一个意思。序列化之后,就可以把序列化后的内容写入磁盘,或者通过网络传输到别的机器上。反过来,把变量内容从序列化的对象重新读到内存里称之为反序列化,即unpickling。
pickle模块的特点:

  • 只能在python中使用,只支持python的基本数据类型。
  • 可以处理复杂的序列化语法。(例如自定义的类的方法,游戏的存档等)

5.1 内存中操作

   dumps方法将对象转成字节(序列化) loads方法将字节还原为对象(反序列化)

import pickle 
li = [11,22,33]
r = pickle.dumps(li)
print(r)

result = pickle.loads(r)
print(result)

b'\x80\x03]q\x00(K\x0bK\x16K!e.'
[11, 22, 33]

5.2 文件中操作

import pickle 
li = [11,22,33]
pickle.dump(li,open("test.doc","wb"))

result = pickle.load(open("test.doc","rb"))
print(result)

[11, 22, 33]

   可以在序列化的代码外面加上try-except语句,因为序列化的过程中很容易出错。注意:文件操作中的函数是dump()和load(),和内存操作中的不同。

你可能感兴趣的:(day9)