Python基础-常用内置模块
1.urllib 爬虫
form urllib import request
url = "http://www.baidu.com"
data = request.urlopen(url).read()
print(data.decode())
2.os 控制操作系统的模块
import os
os.system("c:\Window\system32\mspaint.exe") #打开画图软件
os.rename(r"c:\file\aaa.txt",r"c:\file\bbb.txt") #修改制定路径下文件的命名 r转义
os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径
os.chdir("dirname") 改变当前脚本工作目录;相当于shell下cd
os.curdir 返回当前目录: ('.')
os.pardir 获取当前目录的父目录字符串名:('..')
os.makedirs('dirname1/dirname2') 可生成多层递归目录
os.removedirs('dirname1') 若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
os.mkdir('dirname') 生成单级目录;相当于shell中mkdir dirname
os.rmdir('dirname') 删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
os.listdir('dirname') 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
os.remove() 删除一个文件
os.rename("oldname","newname") 重命名文件/目录
os.stat('path/filename') 获取文件/目录信息
os.sep 输出操作系统特定的路径分隔符,win下为"\\",Linux下为"/"
os.linesep 输出当前平台使用的行终止符,win下为"\t\n",Linux下为"\n"
os.pathsep 输出用于分割文件路径的字符串
os.name 输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
os.system("bash command") 运行shell命令,直接显示
os.environ 获取系统环境变量
os.path.abspath(path) 返回path规范化的绝对路径
os.path.split(path) 将path分割成目录和文件名二元组返回
os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素
os.path.basename(path) 返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素
os.path.exists(path) 如果path存在,返回True;如果path不存在,返回False
os.path.isabs(path) 如果path是绝对路径,返回True
os.path.isfile(path) 如果path是一个存在的文件,返回True。否则返回False
os.path.isdir(path) 如果path是一个存在的目录,则返回True。否则返回False
3.webbrowser 控制浏览器
webbrowser.open("http://www.baidu.com")
4.time 时间
import time
time.time() #返回当前时间的时间戳timestamp(定义为从格林威治时间1970年01月01日00时00分00秒起至现在的总秒数)的方法,无参数 输出:1491066573.257682
time.asctime() #把struct_time对象格式转换为字符串格式为'Sun Apr 2 00:39:32 2019'
time.struct_time(tm_year=2017, tm_mon=4, tm_mday=2, tm_hour=0, tm_min=45, tm_sec=26, tm_wday=6, tm_yday=92, tm_isdst=0)
time.ctime(1491064723.808669) #把时间戳转换为字符串格式'Sun Apr 2 00:42:29 2019',默认为当前时间戳
time.altzone # 返回与utc时间的时间差,以秒计算
time.localtime() # 把时间戳转换为struct_time对象格式,默认返回当前时间戳
time.gmtime() # 将utc时间戳转换成struct_time对象格式,默认返回当前时间的
time.strftime('%Y-%m-%d %H:%M:%S', time.localtime()) # 将本地时间的struct_time格式转成自定义字符串格式 2019-04-01 23:15:47
time.strftime('%Y-%m-%d %H:%M:%S', time.gmtime()) # 将utc时间的struct_time格式转成自定义字符串格式 2019-04-01 23:15:47
time.strptime('2019-04-02 00:47:49', '%Y-%m-%d %H:%M:%S') # 将 日期字符串 转成 struct_time时间对象格式,注意转换后的tm_isdst=-1()夏令时状态
time.mktime(time.localtime())
# 将struct_tiame时间对象转成时间戳 结果返回1491061855.0 ,忽略小于秒的时间(忽略小数点后面)
time.mktime(time.localtime(1491061855.0011407))
# 结果返回1491061855.0 ,忽略小于秒的时间(忽略小数点后面)
time.mktime(time.gmtime(1491061855.0011407))
# 结果返回1491033055.0 ,忽略小于秒的时间(忽略小数点后面)
%a 星期的简写。如 星期三为Web
%A 星期的全写。如 星期三为Wednesday
%b 月份的简写。如4月份为Apr
%B月份的全写。如4月份为April
%c: 日期时间的字符串表示。(如: 04/07/10 10:43:39)
%d: 日在这个月中的天数(是这个月的第几天)
%f: 微秒(范围[0,999999])
%H: 小时(24小时制,[0, 23])
%I: 小时(12小时制,[0, 11])
%j: 日在年中的天数 [001,366](是当年的第几天)
%m: 月份([01,12])
%M: 分钟([00,59])
%p: AM或者PM
%S: 秒(范围为[00,61],为什么不是[00, 59],参考python手册_)
%U: 周在当年的周数当年的第几周),星期天作为周的第一天
%w: 今天在这周的天数,范围为[0, 6],6表示星期天
%W: 周在当年的周数(是当年的第几周),星期一作为周的第一天
%x: 日期字符串(如:04/07/10)
%X: 时间字符串(如:10:43:39)
%y: 2个数字表示的年份
%Y: 4个数字表示的年份
%z: 与utc时间的间隔 (如果是本地时间,返回空字符串)
%Z: 时区名称(如果是本地时间,返回空字符串)
- datetime 时间计算
import datetime
datetime.datetime.now()
datetime.datetime(2019, 4, 7, 16, 52, 3, 199458)
# 返回一组数据(年,月,日,小时,分钟,秒,微秒)
datetime.datetime.now()+datetime.timedelta(days=3)
datetime.datetime(2019, 4, 10, 16, 53, 51, 180847)
# 时间加(减),可以是日,秒,微秒,毫秒,分,小时,周
datetime.datetime.now().replace(minute=3,hour=2) #day=1,month=1
datetime.datetime(2019, 4, 7, 2, 3, 11, 163663)
# 时间替换 直接替换相应位置数据
- random 随机数
import random
print(random.random()) #0-1 随机取 0.5364503211492734
print(random.randint(1,10)) # 整数1-10(包括10),随机取一个值
print(random.randrange(1, 10)) # 整数1-10(不包括10),随机取一个值
- sys 用于提供对解释器相关的操作
import sys
sys.argv #命令行参数List,第一个元素是程序本身路径
sys.exit(n) #退出程序,正常退出时exit(0)
sys.version #获取Python解释程序的版本信息
sys.maxint #最大的Int值
sys.path # 返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
sys.platform #返回操作系统平台名称
sys.stdout.write('please:')
val = sys.stdin.readline()[:-1]