time库:是Python中处理时间的库(标准库)
时间获取:time() ctime() gmtime()
时间格式化:strftime() strptime()
程序计时:sleep(), perf_counter()
时间获取
time():获取当前时间戳,即计算机内部时间值,浮点数
ctime():获取当前时间并以易读方式表示,返回字符串
gmtime():获取当前时间,表示为计算机可处理的时间格式
时间格式化:将时间以合理的方式展示出来
strftime(tpl, ts):tpl是格式化模板字符串,用来定义输出效果
ts是计算机内部时间类型变量
t = time.gmtime()
time.strftime("%Y-%m-%d %H:%M:%S",t)
格式化控制符
%Y 年份 、%m 月份 、 %B 月份名称 、 %b 月份名称缩写
%d 日期、 %A 星期 、%a 星期缩写 、 %H 小时(24h制)
%h 小时(12h制)、 %p 上/下午 AM, PM 、%M 分钟 、 %S 秒
strptime(str, tpl):str是字符串形式的时间值
tpl是格式化模板字符串,用来定义输入效果
timeStr = ‘2018-01-26 12:55:20’
time.strptime(timeStr, “%Y-%m-%d %H:%M:%S”)
程序计时
perf_counter():返回一个CPU级别的精确时间计数值,单位为秒 由于这个计数值起点不确定,连续调用差值才有意义
sleep(s):s拟休眠的时间,单位是秒,可以是浮点数
random库:使用随机数的库(标准库)
伪随机数: 采用梅森旋转算法生成的(伪)随机序列中元素
random库主要用于生成随机数
使用random库: import random
基本随机数函数: seed(), random()
扩展随机数函数: randint(), getrandbits(), uniform(), randrange(), choice(), shuffle()
seed(a=None):初始化给定的随机数种子,默认为当前系统时间
random():生成一个[0.0, 1.0)之间的随机小数
randint(a, b):生成一个[a, b]之间的整数
randrange(m, n[, k]):生成一个[m, n)之间以k为步长的随机整数
getrandbits(k):生成一个k比特长的随机整数
uniform(a, b):生成一个[a, b]之间的随机小数
choice(seq):从序列seq中随机选择一个元素
shuffle(seq):将序列seq中元素随机排列,返回打乱后的序列
PyInstaller库:将.py源代码转换成无需源代码的可执行文件 (第三方库)
(cmd命令行) pyinstaller -F <文件名.py>
-h 查看帮助
-clean 清理打包过程中的临时文件
-D, --onedir 默认值,生成dist文件夹
-F, --onefile 在dist文件夹中只生成独立的打包文件
-i <图标文件名.ico> 指定打包程序使用的图标(icon)文件
使用举例
pyinstaller –i curve.ico –F SevenDigitsDrawV2.py
jieba库:优秀的中文分词库(第三方库)
Jieba分词依靠中文词库
利用一个中文词库,确定汉字之间的关联概率
汉字间概率大的组成词组,形成分词结果
除了分词,用户还可以添加自定义的词组
jieba分词的三种模式:精确模式、全模式、搜索引擎模式
精确模式:把文本精确的切分开,不存在冗余单词
全模式:把文本中所有可能的词语都扫描出来,有冗余
搜索引擎模式:在精确模式基础上,对长词再次切分
jieba.lcut(s):精确模式,返回一个列表类型的分词结果
jieba.lcut(s, cut_all=True):全模式,返回一个列表类型的分词结果,存在冗余
jieba.lcut_for_sear ch(s):搜索引擎模式,返回一个列表类型的分词结果,冗余
jieba.add_word(w):向分词词典增加新词w
wordcloud库:优秀的词云展示库(第三方库)
wordcloud库把词云当作一个WordCloud对象
wordcloud.WordCloud()代表一个文本对应的词云
可以根据文本中词语出现的频率等参数绘制词云
绘制词云的形状、尺寸和颜色都可以设定
wordcloud库常规方法
w=wordcloud.WordCloud()
以WordCloud对象为基础
配置参数、加载文本、输出文件
wordcloud库常规方法
w.generate(txt):向WordCloud对象w中加载文本txt
w.to_file(filename):将词云输出为图像文件,.png或.jpg格式
配置对象参数
width:指定词云对象生成图片的宽度,默认400像素
height:指定词云对象生成图片的高度,默认200像素
min_font_size:指定词云中字体的最小字号,默认4号
max_font_size:指定词云中字体的最大字号,根据高度自动调节
font_step:指定词云中字体字号的步进间隔,默认为1
font_path:指定字体文件的路径,默认None
max_words:指定词云显示的最大单词数量,默认200
stop_words:指定词云的排除词列表,即不显示的单词列表
mask:指定词云形状,默认为长方形,需要引用imread()函数
from scipy.misc import imread
mk=imread(“pig.png”)
w=wordcloud.WordCloud(mask=mk)
background_color:指定词云图片的背景颜色,默认为黑色
应用实例
import wordcloud
txt = "life is short, you need python"
w = wordcloud.WordCloud(background_color = "white")
w.generate(txt)
w.to_file("pywcloud.png")
os库:提供通用的、基本的操作系统交互功能(标准库)
路径操作:os.path子库,处理文件路径及信息
进程管理:启动系统中其他程序
环境参数:获得系统软硬件信息等环境参数
路径操作
os.path子库以path为入口,用于操作和处理文件路径
import os.path 或import os.path as op
os.path.abspath(path):返回path在当前系统中的绝对路径
os.path.normpath(path):归一化path的表示形式,统一用\分隔路径
os.path.relpath(path):返回当前程序与文件之间的相对路径 (relative path)
os.path.dirname(path):返回path中的目录名称
os.path.basename(path):返回path中最后的文件名称
os.path.join(path, *paths):组合path与paths,返回一个路径字符串
os.path.join(“D:/”, “PYE/file.txt”)
os.path.exists(path):判断path对应文件或目录是否存在,返回True或False
os.path.isfile(path):判断path所对应是否为已存在的文件,返回True或False
os.path.isdir(path):判断path所对应是否为已存在的目录,返回True或False
os.path.getatime(path):返回path对应文件或目录上一次的访问时间
os.path.getmtime(path):返回path对应文件或目录最近一次的修改时间
os.path.getctime(path):返回path对应文件或目录的创建时间
os.path.getsize(path):返回path对应文件的大小,以字节为单位
进程管理
import os
os.system(command)
执行程序或命令command
在Windows系统中,返回值为cmd的调用返回信息
环境参数
os.chdir(path):修改当前程序操作的路径
os.getcwd():返回程序的当前路径
os.getlogin():获得当前系统登录用户名称
os.cpu_count():获得当前系统的CPU数量
os.urandom(n):获得n个字节长度的随机字符串,通常用于加解密运算