python进阶常用模块 +OS/SYS模块+ time/datetime模块+random随机模块

目录

一、OS 模块

1、创建目录

2、删除文件或者目录

3、拷贝文件

4、拷贝目录

5、修改文件名、目录名

6、对文件路径名的操作

7、判断文件、目录是否存在

8、文件的大小和修改日期

9、当前工作的目录

10、递归的遍历目录下面所有的文件

二、SYS 模块

1、sys.argv     

2、sys.exit(n)   

3、sys.version

4、sys.platform

三、time/datetime模块

1、引入

(1)time模块

(2)datatime模块

四、random模块


一、OS 模块

1、创建目录

os.makedirs 可以递归的创建目录结构,比如

import os
os.makedirs('tmp/python/fileop',exist_ok=True)

 

会在当前工作目录下面创建 tmp目录,在tmp目录下面再创建 python目录,在Python目录下面再创建fileop目录

exist_ok=True 指定了,如果某个要创建的目录已经存在,也不报错

2、删除文件或者目录

os.remove 可以删除一个文件,比如

os.remove('sdf.py')

 shutil.rmtree() 可以递归的删除某个目录所有的子目录和子文件 比如

import shutil
shutil.rmtree('tmp', ignore_errors=True)

参数 ignore_errors=True 保证如果目录不为空,不会抛出异常。

3、拷贝文件

shutil 模块里面有很多 目录文件操作的函数

拷贝文件,可以使用shutil模块的copyfile函数。

比如

from shutil import copyfile

# 拷贝 d:/tools/first.py 到 e:/first.py
copyfile('d:/tools/first.py', 'e:/first.py')

注意,如果拷贝前,e:/first.py 已经存在,则会被拷贝覆盖,所以使用该函数一定要小心。

4、拷贝目录

如果我们要拷贝一个目录里面所有的内容(包括子目录和文件、子目录里面的子目录和文件,等等)到另外一个目录中,可以使用 shutil的copytree函数。

如下所示

from shutil import copytree

# 拷贝 d:/tools/aaa 目录中所有的内容 到 e:/bbb 中
copytree('d:/tools/aaa', 'e:/new/bbb')

注意拷贝前, 目标目录必须 不存在 ,否则会报错。

上面的代码执行前面,如果 e:/new/bbb 已经存在,执行到copytree时,就会报错

上面的代码执行前面,如果 e:/new 这个目录都不存在,执行到copytree时,就会 创建 e:/new 目录,再创建 e:/new/bbb 目录,再拷贝 d:/tools/aaa 目录中所有的内容 到 e:/new/bbb 中。

上面的代码执行前面,如果 e:/new 这个目录存在,但是 e:/new/bbb 不存在,执行到copytree时,就只会 创建 e:/new/bbb ,再拷贝 d:/tools/aaa 目录中所有的内容 到 e:/new/bbb 中。

5、修改文件名、目录名

要修改文件名、目录名,可以使用os模块的rename函数。

比如

import os

# 修改目录名 d:/tools/aaa 为 d:/tools/bbb
os.rename('d:/tools/aaa','d:/tools/bbb')

# 修改文件名 d:/tools/first.py 为 d:/tools/second.py
os.rename('d:/tools/first.py','d:/tools/second.py')

注意,Linux 系统上,如果重命名之前 d:/tools/second.py 已经存在,则会被覆盖,所以使用该函数一定要小心。

6、对文件路径名的操作

对于文件名的操作,比如 获取文件名称,文件所在目录,文件路径的拼接等,都可以使用 os.path 模块。

通常我们喜欢使用格式化字符串的方法来做文件路径的拼接,但是如果你的程序需要在Linux、Windows等多个平台运行,它们的路径的分隔符是不同的,Windows上是 \ , 而 Linux上是 /

这时,我们应该使用 os.path 模块。 它能够自动处理类似 Data/data.csv 和 Data\data.csv 这样的文件路径差异。

>>> import os
>>> path = '/Users/beazley/Data/data.csv'

>>> # 获取路径中的文件名部分
>>> os.path.basename(path)
'data.csv'

>>> # 获取路径中的目录部分
>>> os.path.dirname(path)
'/Users/beazley/Data'

>>> # 文件路径的拼接
>>> os.path.join('tmp', 'data', os.path.basename(path))
'tmp/data/data.csv'

7、判断文件、目录是否存在

如果我们需要判断一个指定路径的文件或者目录是否存在,可以使用下面的方法

exists方法返回值为True表示 存在,否则表示不存在。

import os
os.path.exists('d:/systems/cmd.exe')
os.path.exists('d:/systems')

如果你要判断指定路径是否是文件,可以这样

import os

# 返回值为True 表示是文件
os.path.isfile('d:/systems/cmd.exe')

如果你要判断指定路径是否是目录,可以这样

import os

# 返回值为True 表示是目录
os.path.isdir('d:/systems')

8、文件的大小和修改日期

# 返回文件大小
>>> os.path.getsize('file1') 
3669

# 返回文件的最后修改日期,是秒时间
# 参考下一章 日期和时间 里面的内容
>>> os.path.getmtime('file1') 
1272478234.0

# 可以把秒时间 转化为日期时间
>>> import time
>>> time.ctime(os.path.getmtime('/etc/passwd'))
'Wed Apr 28 13:10:34 2010'
>>>

9、当前工作的目录

我们的程序运行时,是有 当前工作目录 的。

程序代码中所有的对文件的访问,如果使用相对路径,都是基于这个当前工作目录。

有时候我们需要得到程序的当前工作目录的路径,可以使用

cwd = os.getcwd()

如果需要改变当前工作目录到另外的路径,可以使用

os.chdir(path)

参数就是 新的当前工作目录 路径地址。

10、递归的遍历目录下面所有的文件

假如我们要获取某个目录中所有的 文件, 包括子目录里面的文件。 可以使用 os库中的walk方法

比如我们要得到某个目录下面所有的子目录 和所有的文件,存放在两个列表中

可以这样写代码

import os

# 目标目录
targetDir = r'd:\tmp\util\dist\check'
files = []
dirs  = []

# 下面的三个变量 dirpath, dirnames, filenames
# dirpath 代表当前遍历到的目录名
# dirnames 是列表对象,存放当前dirpath中的所有子目录名
# filenames 是列表对象,存放当前dirpath中的所有文件名

for (dirpath, dirnames, filenames) in os.walk(targetDir):
    files += filenames
    dirs += dirnames

print(files)
print(dirs)

如果要得到某个目录下所有文件的全路径可以这样

import os

# 目标目录
targetDir = r'd:\tmp\util\dist\check'

for (dirpath, dirnames, filenames) in os.walk(targetDir):
    for fn in filenames:
        # 把 dirpath 和 每个文件名拼接起来 就是全路径
        fpath = os.path.join(dirpath, fn)

二、SYS 模块

1、sys.argv     

命令行参数,第一个元素是程序本身

2、sys.exit(n)   

退出程序,n可以写语句

3、sys.version

获取python解释器的版本信息

4、sys.platform

获取操作系统平台名称

三、time/datetime模块

1、引入

一般来说对程序中时间的处理有以下三种

时间的显示:在屏幕显示,记录日志等

时间的转换:比如把字符串格式的日期转成python中的日期类型

时间的运算:计算两个日期间的差值

(1)time模块

"""
time 模块
"""

import time

# 打印出系统时间到1970年1月1日相差的秒数
print(time.time())

# 将一个时间戳转换为当前时区的 struct_time,默认是当前系统时间戳
print(time.localtime())
print(time.localtime(1999909999))

# 打印格林尼治时间(0时区)
print(time.gmtime())

# 将一个struct_time 转换为时间戳
t1 = time.localtime()
print(time.mktime(t1))

# 睡眠
time.sleep(2)
print('---')

# 格式化打印时间(时间转为字符串)
print(time.strftime('%Y-%m-%d %H:%M  %p', time.localtime()))

# 字符串转换为时间格式
print(time.strptime('2022-05-16', '%Y-%m-%d'))

(2)datatime模块

"""
datetime 模块
"""

import datetime

# 打印 到天粒度  2022-02-01
print(datetime.date.today())

# 转换为元组形式
print(datetime.date.timetuple(datetime.date.today()))

# 传入一个时间戳,转换时间
print(datetime.date.fromtimestamp(12222222222))

# 打印当前时间
print(datetime.datetime.now())

# 时间加减
print(datetime.datetime.now() + datetime.timedelta(days=4))


# 替换时间
t1 = datetime.datetime.now()
print(t1.replace(year=9999))

四、random模块

"""
random 模块
"""
import random
import string

# 返回1-10之间的一个随机数,包括10
print(random.randint(1, 10))

# 返回1-10之间的一个随机数,不包括10
print(random.randrange(1, 10))

# 可以跳着选  1,3,5  。。。。 这种
print(random.randrange(1, 10, 2))

# 返回一个浮点数(0-1)
print(random.random())

# 返回一个给定集合中的随机一个字符
print(random.choice('abcdefg'))

# 返回一个给定集合中的随机多个字符
print(random.sample('abcdefg', 3))

# 引入string模块
# 打印所有大小写字母
print(string.ascii_letters)

# 一个随机验证码
print(''.join(random.sample(string.ascii_letters, 4)))

# 洗牌
a = [1, 2, 3, 4, 5, 6]
random.shuffle(a)
print(a)

你可能感兴趣的:(大数据扩展知识,python,开发语言,Python常用模块)